이산확률분포의 일종으로, 발생 가능성이 희박한 사건이 임의의 구간 안에서 평균적으로 λ번 발생할 때, 이 사건이 일어날 횟수의 분포 * 주어진 시간/길이/넓이/부피 내에 어떤 사건이 일어나는 횟수 * 단위시간/영역에서 정수 값 0, 1, 2, ...을 갖는 사건에 적용 희소하게 일어나는 우연 현상에 적용되는 확률분포 특정 사건이 발생할 가능성이 매우 드문 경우의 확률분포 표기: X~Pois(np) $X\sim\mathrm{P}(\lambda)$ X가 푸아송 확률변수이고, [[모수,parameter]]가 λ인 [[확률질량함수,probability_mass_function,PMF]] f(x)는 $f(x)=\frac{\lambda^x e^{-\lambda}}{x!}=\frac{e^{-\lambda}\lambda^x}{x!}$ ''pmf 식이 자꾸 헷갈리는데, x가 두번, λ도 두번 등장'' 푸아송 확률변수의 [[기대값,expected_value]]과 [[분산,variance]]: $E(X)=\mu$ $V(X)=\mu$ [[TableOfContents]] = 설명 = // EoM 확률변수 $X$ 가 비음정수값 $k=0,1,\cdots$ 을 가질 확률에 대한 확률분포. 파라미터 $\lambda>0$ 이 있다. 식으로는 $\text{P}\{X=k\}=e^{-\lambda}\frac{\lambda^k}{k!}$ [[queueing_theory]] / [[queuing_theory]] 에 자주 등장. ---- // ㄷㄱㄱ week 7-2 0m '''Poisson Distribution''' $\bullet\; X\sim\text{Poi}(\alpha)$ - [[푸아송_확률변수,Poisson_random_variable]] $\bullet\; P(x)=\begin{cases}\frac{\alpha^x e^{-\alpha}}{x!}& x=0,1,2,\cdots\\0&\text{otherwise}\end{cases}$ $\bullet\; \text{E}[X]=\alpha$ $\bullet\; \text{Var}[X]=\alpha$ ''이 둘을 계산하는 것은 간단치 않으나, 결과는 간단함을 볼 수 있다.'' When 𝛼 events are observed on average, the probability to see 𝑥 events actually 한시간에 평균 손님 열 명이 온다. 9명이 올 확률? Pr[X=9] = 10^^9^^ e^^−10^^ / 9! ≈ 0.125 time slot을 사용해 설명한다... https://i.imgur.com/aYOsKAvl.png * 𝛼 events on average over 𝑛 time slots // $n$ time slots 동안 평균 $\alpha$ events가 발생. * Prob. of event occurrence in each slot ~𝛼/𝑛 // 각 slot에서 사건 발생 확률은 $\sim \alpha/n$ * 𝑋: the number of actually observed events // $X:$ 실제 관측된 사건 수 * $X\sim\text{B}(n,\alpha/n)$ * When $n\to\infty,\; \text{B}(n,\alpha/n)\to\text{Poi}(\alpha)$ 즉 ~~한 [[이항분포,binomial_distribution]]에서 $n$ 이 커지면 Poisson이 되는... - 엄밀히 rewrite https://i.imgur.com/J2S6xthl.png = 이항분포와의 관계 = [[이항분포,binomial_distribution]] X~B(n,p)에서, n(시행 횟수)이 크고 p(성공 확률)가 작을 때, λ=np인 '''푸아송 분포'''로 근사할 수 있다. [[https://terms.naver.com/entry.naver?docId=3338192&cid=47324&categoryId=47324 수학백과: 푸아송 극한 정리]] { 확률변수 $X$ 가 모수 $(n,p)$ 인 [[이항분포,binomial_distribution]]를 따를 때, $np=\lambda$ 이고 $n$ 이 충분히 크면 다음 식이 성립. $\operatorname{P}(X=k) \approx \frac{\lambda^k e^{-\lambda}}{k!}$ } = TOCLEANUP = == from 노경섭 == https://www.youtube.com/watch?v=S1ztukK-PkM 낙마 사고는 드물게 발생. 말을 타는 횟수 $(n)$ 중 말에서 떨어지는 사고가 발생할 횟수 $(x)$ $P(X=x)={}_n\text{C}_x \cdot p^x \cdot (1-p)^{(n-x)}$ (rel. [[이항정리,binomial_theorem]]) 푸아송분포의 확률함수를 도출하기 위해서, 평균 $(\mu)$ 과 분산 $(\sigma^2)$ 이 모두 $\lambda$ 와 같다는 가정이 필요. $n$ 개의 구간에서 발생할 확률은 $\lambda/n$ 이걸 저 식에 대입하면 $P(X=x)=\frac{\lambda^x e^{-\lambda}}{x!}$ 단위시간당 평균발생 건수는 $\lambda$ $X\sim\text{Poisson}(\lambda)$ 로 표현. == from 권태원 == https://www.youtube.com/watch?v=y8-USchbNrU 확률변수 $X$ 가 확률밀도함수 $f(x)=P(x;\lambda)=\frac{e^{-\lambda}\cdot\lambda^x}{x!}$ 를 가질 때, 이를 모수가 $\lambda$ 인 '''포아송 확률변수'''라 하고, $X\sim\text{Poi}(\lambda)$ 로 표기한다. $\lambda:$ 모수(여기선, 단위당 평균발생횟수) $x=0,1,2,\ldots$ ex. 매분마다 평균 2건 통화. 3분동안 5건 이상 통화가 이루어질 확률? $\lambda=E(X)=3\times 2=6$ 구하는것은 $P(X\ge 5)=1-P(X\le 4)=$ 그렇다면 4건 이하일 확률은 $P(X\le 4)=\sum_{x=0}^4 \frac{e^{-6} 6^x}{x!}$ 인데 이것을 계산하다 시간이 다 간다 그러므로 마치 정규분포표가 있듯이 (미리 만들어진) 포아송 누적분포표가 있다, 그것을 쓴다. $\lambda$ 가 6이면서 $X$ 가 4 이하일 확률은 $P(X\le 4)=\sum_{x=0}^4 P(x;6)=0.2851$ 그래서 $P(X\ge 5)=1-P(X\le 4)=1-0.2851=0.7149$ 이다. 참고로 X가 특정 값일 확률을 구하는 방법은 $P(X=4)=P(X\le 4)-P(X\le 3)=0.2851-0.1512$ 이런 식. == from 이상철 == // https://www.youtube.com/watch?v=gXNat2QEoP0 일정한 [[공간,space]](ex. 일정한 [[시간,time]] 단위, 일정한 공간 단위) 내에 발생하는 사건의 개수를 설명. 보통 단위시간당 도착(arrival)에 대한 모델에 많이 사용. (비교) [[지수분포,exponential_distribution]]는 도착에 따른 시간을 측정하는데 사용. https://i.imgur.com/sto8xTnl.png ||분포 ||primary example(?) || ||분류 || ||푸아송 분포 ||단위시간당 일어난 event의 수 ||event의 수는 이산적이니까 ||[[이산확률분포,discrete_probability_distribution|이산분포]] || ||지수 분포 ||event 사이의 시간 ||시간은 연속적이니까 ||[[연속확률분포,continuous_probability_distribution|연속분포]] || 수식 $X=$ 단위시간당 발생 건수 $\lambda=$ 단위시간당 평균 발생 건수 $\mathbb{P}(X=x)=\frac{\lambda^x e^{-\lambda}}{x!}$ $\mathbb{E}(X)=\mu=\lambda$ $\mathbb{V}(X)=\sigma=\sqrt{\lambda}$ R로는 //// 나중에 ref 찾아보고 확실히 ... d와 p의 뜻? {{{ # P(X=a) 확률 계산 dpois(X=..., lambda=...) # P(X <= 1) 이하로 받을 확률 etc ppois(q=1, lambda=..., lower.tail = (TRUE or FALSE)) }}} == from 김성범 == https://www.youtube.com/watch?v=HJZ5Ev_p8Uo == 포아송 확률 변수 Poisson random variable == 이하 from http://www.kocw.net/home/search/kemView.do?kemId=1279832 8. Conditional Probability, Independence of Events, Sequential Experiments 16:00~ Up: [[확률변수,random_variable]] - 저 페이지에 성대 강의 받아적은 거 있음. 정의. Let random variable $N$ : number of occurrences of an [[사건,event|event]] in a certain time period (or in a certain space.) (사건은 시간 내에서 랜덤으로 발생한다고 가정.) ⇔ $N:$ the '''Poisson random variable''' with [[확률질량함수,probability_mass_function,PMF|pmf]] $P(N=k)=P_N(k)=\frac{\alpha^k}{k!}e^{-\alpha},\quad\quad k=0,1,2,\cdots$ where $\alpha$ : the average number of event occurrences in a specified time interval (시간 내, 평균 발생 횟수) Note (1) $\sum_{k=0}^{\infty}P_N(k)=\sum_{k=0}^{\infty}\frac{\alpha^k}{k!}e^{-\alpha}=e^{-\alpha}\sum_{k=0}^{\infty}\frac{\alpha^k}{k!}=1.$ (2) For $N:$ Poisson RV, $E(N)=\alpha$ and $VAR(N)=\alpha.$ Pf. $E(N)=\sum_{k=0}^{\infty}k\cdot P_N(k)$ $=\sum_{k=1}^{\infty}k\cdot\frac{\alpha^k}{k!}e^{-\alpha}$ $=e^{-\alpha}\sum_{k=1}^{\infty}\frac{\alpha^k}{(k-1)!}$ $=\alpha e^{-\alpha} \sum_{k=1}^{\infty}\frac{\alpha^{k-1}}{(k-1)!}$ $=\alpha e^{-\alpha} \sum_{k=0}^{\infty}\frac{\alpha^t}{t!}$ $=\alpha e^{-\alpha} \cdot e^{\alpha}$ $=\alpha.$ 이리하여 분산이 평균과 같다는 특징이 있다. (3) For $\alpha<1,\;P(N=k)$ is maximum at $k=0.$ for $\alpha>1,\;P(N=k)$ is maximum at $k=\lfloor\alpha\rfloor,$ and if $\alpha$ is a positive integer, then $P(N=k)$ is maximum at $k=\alpha\textrm{ and }k=\alpha-1.$ ex. 콜센터에서 t초 내에 도착하는 query의 수가 N인데 푸아송확률변수 with $\alpha=\lambda t,$ $\lambda$ 는 평균 arrival rate(도착률) in queries/second. arrival rate가 4 queries/minute라고 한다. Find the probability of the following events: (a) more than 4 queries in 10 seconds (b) fewer than 5 queries in 2 minutes. sol. $\lambda=\frac{4}{60}=\frac1{15}(q/s)$ (a) $\alpha=\lambda t=\frac1{15}\times 10=\frac23$ $P(N>4)=1-P(N\le 4)=1-\sum_{k=0}^4\frac{(\frac23)^k}{k!}e^{-\frac23}\approx 0.000633 $ in 10(s) (b) 120초 안에 문의가 5개 이하 (less than: 작다, fewer than: 작거나 같다. 라고 강의함) $\alpha=\lambda t=\frac1{15}\times 120=8$ $P(N\le 5)=\sum_{k=0}^5\frac{8^k}{k!}e^{-8}\approx 0.1$ == 이항확률변수 X와 포아송확률변수 N의 관계 == 43:45분 For the binomial r.v. X with the prob. p of a success in n-Bernoulli's trials, when n is very large and p is very small, 이항확률변수 $X$ with 확률 $p,$ 베르누이 시행에서 $n$ 번의 성공....이고, n이 매우 크고 p가 매우 작으면, binomial RV X -> Poisson RV N. i.e. if $\alpha=np:$ fixed, then $P(X=k)={}_n{\rm C}_k p^k (1-p)^{n-k} \;\rightarrow\; P(N=k)=\frac{\alpha^k}{k!}e^{-\alpha}$ pf. Since $\alpha=np,p=\frac{\alpha}{n}.$ $P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}$ $=\frac{n(n-1)\cdots(n-k+1)}{k!}(\frac{\alpha}n)^k(1-\frac{\alpha}n)^{n-k}$ $=\frac{n(n-1)\cdots(n-k+1)}{n^k}\cdot \frac{\alpha^k}{k!} \cdot (1-\frac{\alpha}n)^n \cdot (1-\frac{\alpha}{n})^{-k}$ $\rightarrow 1\cdot\frac{\alpha^k}{k!}\cdot e^{-\alpha}\cdot 1$ $=\frac{\alpha^k}{k!}e^{-\alpha}$ $=P(N=k)\textrm{ as }n\to\infty.$ 52:39 ex. 10^^9^^ bits/s 의 통신시스템. 비트 에러 확률은 10^^-9^^. Q: 1초에 5개 이상의 오류 발생 확률을 구하라. Sol. 여기선 bit error날 확률을 success로 보아야 함에 주의. Since $n=10^9$ and $p=10^{-9}$ in 1(s), $\alpha=np=1$ in 1(s). $\to P(N\ge 5)=1-P(N\le 4)=1-\sum_{k=0}^4 \frac{1^k}{k!}e^{-1}$ $=1-e^{-1}\left(\frac1{0!}+\frac1{1!}+\cdots+\frac1{4!}\right)\approx0.00366$ On the other hand, $P(X\ge5)=1-P(X\le4)$ $=1-\{\binom{10^9}0(10^{-9})^0(1-10^{-9})^{10^9}$ $+{}_{10^9}{\rm C}_{1}(10^{-9})^1(1-10^{-9})^{10^9-1}$ $+\cdots$ $+{}_{10^9}{\rm C}_4(10^{-9})^4(1-10^{-9})^{10^9-4}\}$ .....계산하기가 복잡. (Poisson RV가 나온 이유.) ex. n커지고 p작아지면 poisson과 binomial사이의 차이/[[오류,error]]가 줄어든다는 예. 제품 불량(defective) 확률이 p,,1,,=0.1(p,,2,,=0.01). 제품 샘플 수가 n,,1,,=10(n,,2,,=100)일 때, 최대 한 개의 불량품일 확률을 찾으라. Find the probability that a sample of n,,1,,=..... items contain at most one defective item. Assume that the quality of successive items is independent. Sol. For n,,1,,=10 and p,,1,,=0.1, $P(X\le 1)={}_{10}{\rm C}_{0}(\frac9{10})^{10}+{}_{10}{\rm C}_1(\frac1{10})(\frac9{10})^9\approx 0.7361.$ Since $\alpha=n_1p_1=1,$ $P(N\le 1)=\sum_{k=0}^1\frac{1^k}{k!}e^{-1}=e^{-1}(1+1)\approx0.7358.$ i.e. $|0.7358-0.7361|=0.0003.$ For n,,2,,=100 and p,,2,,=0.01, $P(X\le 1)={}_{100}{\rm C}_0 (\frac{99}{100})^{100} + {}_{100}{\rm C}_1 (\frac1{100})(\frac{99}{100})^{99}\approx 0.7357.$ i.e. $|0.7358-0.7357|=0.0001.$ ...........여기까지가 경북대강의 노트 기타 내용은 [[RR:확률_및_랜덤_프로세스]] == tmp == from http://www.kocw.net/home/search/kemView.do?kemId=1162312 4장_확률변수와분포_포아송분포 { 확률변수 X의 [[확률질량함수,probability_mass_function,PMF]]: $P(X=x)=f(x;\mu)=\frac{e^{-\mu}\mu^x}{x!},\quad x=0,1,2,\cdots$ $f(x)$ : 포아송분포의 확률질량함수 $X$ : 포아송확률변수 $X\sim P(\mu)$, 주어진 단위시간(or 단위영역)에서 발생하는 사건의 횟수. 포아송확률분포의 기대값과 분산: $E(X)=\mu$ $V(X)=\mu$ 이항분포와 포아송분포 포아송분포는 발생확률 p가 아주 작아서, 발생평균회수 $\mu=np$ 가 작은 사건에 대한 언급. 희소하고 우연한 현상에 적용되는 확률분포임. n이 크고 확률 p가 작아짐에 따라, 이항분포는 포아송분포와 유사. i.e. $\binom{n}{x}p^x(1-p)^{n-x}\,\sim\,\frac{e^{-\mu}\mu^x}{x!}$ > n↑ p↓ 예제 1 어떤 항구에 매일 도착하는 유조선: 평균 7척 이 항구의 유조선 수용능력: 10척 / 일 어떤 날 유조선을 외항에 대기시킬 확률은? Sol. X: 매일 도착하는 유조선의 수 $P(X>10)=1-P(X\le 10)=1-\sum_{x=0}^{10}f(x;7)$ $=1-\sum_{x=0}^{10}\frac{e^{-7}7^x}{x!}=1-0.901=0.099$ 예제 2 스캐너 제품 출하시, 1000개당 평균 1개의 불량품 8000개의 제품을 출하할 때 불량품의 개수가 6개 미만일 확률은? Sol. 불량품의 개수가 X라 하면 $X\sim B(n,p)=B(8000,0.001)$ $P(X<6)=\sum_{x=0}^5\binom{8000}{x}(0.001)^x(1-0.001)^{8000-x}$ 이 식은 계산하기 어려우므로 포아송 분포를 사용하면, $P(X<6)\simeq\sum_{x=0}^{5}\frac{e^{-8}8^x}{x!}=0.191$ } = 푸아송 확률변수 Poisson random variable = [[푸아송_확률변수,Poisson_random_variable]] { Note in counting the number $N$ of occurrences of an event in a certain time period or in a certain region in space. * $N$ is called the Poisson r.v. * Sample space S,,X,,={0, 1, 2, …} pmf of r.v. N $P[N=k]=\frac{\alpha^k}{k!}e^{-\alpha}$ k=0,1,… $\alpha$ is the average number of event occurrences in a specified time interval or region in space. Let's check the sum of probabilities of all the events $\sum_{k=0}^{\infty}P[N=k]=\sum_{k=0}^{\infty}\frac{\alpha^k e^{-\alpha}}{k!}=e^{-\alpha}\sum_{k=0}^{\infty}\frac{\alpha^k}{k!}=e^{-\alpha}\cdot e^{\alpha}=1$ Note that Poisson pmf is the limiting form of the Binomial pmf when $n$ is very large and the probability of success is kept small; that is, * event A of interest is very rare but # of Bernoulli trials is very large By taking the limit $n\to\infty,$ while keeping $\alpha=np,$ we get the approximation $p_k=\binom{n}{k}p^k(1-p)^{n-k}\simeq \frac{\alpha^k}{k!}e^{-\alpha}$ k=0,1,… Proof: First, consider the probability that no events occur in $n$ trials $p_0=(1-p)^n=(1-\frac{\alpha}n)^n\to e^{-\alpha}$ as $n\to\infty$ Consider the ratio of successive binomial probabilities $\frac{p_{k+1}}{p_k}=\frac{{}_n{\rm C}_{k+1}p^{k+1}(1-p)^{n-k-1}}{{}_n{\rm C}_k p^k(1-p)^{n-k}}$ $=\frac{(n-k)p}{(k+1)(1-p)}=\frac{(1-k/n)\alpha}{(k+1)(1-\alpha/n)}$ $\to \alpha/(k+1)$ as $n\to\infty$ Thus the limiting probabilities satisfy $p_{k+1}=\frac{\alpha}{k+1}p_k=(\frac{\alpha}{k+1})(\frac{\alpha}{k})\cdots(\frac{\alpha}1)p_0=\frac{\alpha^{k+1}}{(k+1)!}e^{-\alpha}$ ## from 성대 안창욱 [[푸아송_분포,Poisson_distribution]] 페이지에도 Poisson RV 강의 받아적은 거 있음 } = links ko = http://blog.naver.com/mykepzzang/220840724901 https://angeloyeo.github.io/2021/04/26/Poisson_distribution.html ---- [[https://terms.naver.com/entry.naver?docId=4125499&cid=60207&categoryId=60207 수학백과: 푸아송 분포]] https://everything2.com/title/Poisson+distribution https://encyclopediaofmath.org/wiki/Poisson_distribution ... Google:Poisson+distribution AKA '''포아송 분포''' Up: [[확률분포,probability_distribution]] > [[이산확률분포,discrete_probability_distribution]]