푸아송_분포,Poisson_distribution

이산확률분포의 일종으로, 발생 가능성이 희박한 사건이 임의의 구간 안에서 평균적으로 λ번 발생할 때, 이 사건이 일어날 횟수의 분포
  • 주어진 시간/길이/넓이/부피 내에 어떤 사건이 일어나는 횟수
  • 단위시간/영역에서 정수 값 0, 1, 2, ...을 갖는 사건에 적용

희소하게 일어나는 우연 현상에 적용되는 확률분포
특정 사건이 발생할 가능성이 매우 드문 경우의 확률분포

표기:
X~Pois(np)
$X\sim\mathrm{P}(\lambda)$

X가 푸아송 확률변수이고, 모수,parameter가 λ인 확률질량함수,probability_mass_function,PMF f(x)는
$f(x)=\frac{\lambda^x e^{-\lambda}}{x!}=\frac{e^{-\lambda}\lambda^x}{x!}$

pmf 식이 자꾸 헷갈리는데, x가 두번, λ도 두번 등장

푸아송 확률변수의 기대값,expected_value분산,variance:
$E(X)=\mu$
$V(X)=\mu$



1. 설명

// EoM
확률변수 $X$ 가 비음정수값 $k=0,1,\cdots$ 을 가질 확률에 대한 확률분포. 파라미터 $\lambda>0$ 이 있다. 식으로는
$\text{P}\{X=k\}=e^{-\lambda}\frac{\lambda^k}{k!}$
queueing_theory / queuing_theory 에 자주 등장.


// ㄷㄱㄱ week 7-2 0m
Poisson Distribution


$\bullet\; P(x)=\begin{cases}\frac{\alpha^x e^{-\alpha}}{x!}& x=0,1,2,\cdots\\0&\text{otherwise}\end{cases}$

$\bullet\; \text{E}[X]=\alpha$

$\bullet\; \text{Var}[X]=\alpha$

이 둘을 계산하는 것은 간단치 않으나, 결과는 간단함을 볼 수 있다.

When 𝛼 events are observed on average, the probability to see 𝑥 events actually

한시간에 평균 손님 열 명이 온다. 9명이 올 확률?
Pr[X=9] = 109 e−10 / 9! ≈ 0.125

time slot을 사용해 설명한다...
https://i.imgur.com/aYOsKAvl.png

  • 𝛼 events on average over 𝑛 time slots // $n$ time slots 동안 평균 $\alpha$ events가 발생.
  • Prob. of event occurrence in each slot ~𝛼/𝑛 // 각 slot에서 사건 발생 확률은 $\sim \alpha/n$
  • 𝑋: the number of actually observed events // $X:$ 실제 관측된 사건 수
  • $X\sim\text{B}(n,\alpha/n)$
  • When $n\to\infty,\; \text{B}(n,\alpha/n)\to\text{Poi}(\alpha)$

즉 ~~한 이항분포,binomial_distribution에서 $n$ 이 커지면 Poisson이 되는... - 엄밀히 rewrite

https://i.imgur.com/J2S6xthl.png


2. 이항분포와의 관계

이항분포,binomial_distribution X~B(n,p)에서,
n(시행 횟수)이 크고 p(성공 확률)가 작을 때,
λ=np인 푸아송 분포로 근사할 수 있다.

[https]수학백과: 푸아송 극한 정리
{
확률변수 $X$ 가 모수 $(n,p)$이항분포,binomial_distribution를 따를 때, $np=\lambda$ 이고 $n$ 이 충분히 크면 다음 식이 성립.
$\operatorname{P}(X=k) \approx \frac{\lambda^k e^{-\lambda}}{k!}$
}

3. TOCLEANUP


3.1. from 노경섭


낙마 사고는 드물게 발생.
말을 타는 횟수 $(n)$ 중 말에서 떨어지는 사고가 발생할 횟수 $(x)$
$P(X=x)={}_n\text{C}_x \cdot p^x \cdot (1-p)^{(n-x)}$
(rel. 이항정리,binomial_theorem)

푸아송분포의 확률함수를 도출하기 위해서,
평균 $(\mu)$ 과 분산 $(\sigma^2)$ 이 모두 $\lambda$ 와 같다는 가정이 필요.
$n$ 개의 구간에서 발생할 확률은 $\lambda/n$
이걸 저 식에 대입하면
$P(X=x)=\frac{\lambda^x e^{-\lambda}}{x!}$

단위시간당 평균발생 건수는 $\lambda$
$X\sim\text{Poisson}(\lambda)$ 로 표현.

3.2. from 권태원


확률변수 $X$ 가 확률밀도함수
$f(x)=P(x;\lambda)=\frac{e^{-\lambda}\cdot\lambda^x}{x!}$
를 가질 때, 이를 모수가 $\lambda$포아송 확률변수라 하고,
$X\sim\text{Poi}(\lambda)$
로 표기한다.

$\lambda:$ 모수(여기선, 단위당 평균발생횟수)
$x=0,1,2,\ldots$

ex. 매분마다 평균 2건 통화. 3분동안 5건 이상 통화가 이루어질 확률?
$\lambda=E(X)=3\times 2=6$
구하는것은 $P(X\ge 5)=1-P(X\le 4)=$
그렇다면 4건 이하일 확률은
$P(X\le 4)=\sum_{x=0}^4 \frac{e^{-6} 6^x}{x!}$ 인데 이것을 계산하다 시간이 다 간다
그러므로 마치 정규분포표가 있듯이 (미리 만들어진) 포아송 누적분포표가 있다, 그것을 쓴다.
$\lambda$ 가 6이면서 $X$ 가 4 이하일 확률은
$P(X\le 4)=\sum_{x=0}^4 P(x;6)=0.2851$
그래서
$P(X\ge 5)=1-P(X\le 4)=1-0.2851=0.7149$
이다. 참고로 X가 특정 값일 확률을 구하는 방법은
$P(X=4)=P(X\le 4)-P(X\le 3)=0.2851-0.1512$ 이런 식.

3.3. from 이상철

// https://www.youtube.com/watch?v=gXNat2QEoP0
일정한 공간,space(ex. 일정한 시간,time 단위, 일정한 공간 단위) 내에 발생하는 사건의 개수를 설명.

보통 단위시간당 도착(arrival)에 대한 모델에 많이 사용.
(비교) 지수분포,exponential_distribution는 도착에 따른 시간을 측정하는데 사용.

https://i.imgur.com/sto8xTnl.png


분포 primary example(?) 분류
푸아송 분포 단위시간당 일어난 event의 수 event의 수는 이산적이니까 이산분포
지수 분포 event 사이의 시간 시간은 연속적이니까 연속분포

수식

$X=$ 단위시간당 발생 건수
$\lambda=$ 단위시간당 평균 발생 건수

$\mathbb{P}(X=x)=\frac{\lambda^x e^{-\lambda}}{x!}$
$\mathbb{E}(X)=\mu=\lambda$
$\mathbb{V}(X)=\sigma=\sqrt{\lambda}$

R로는 //// 나중에 ref 찾아보고 확실히 ... d와 p의 뜻?
# P(X=a) 확률 계산
dpois(X=..., lambda=...)

# P(X <= 1) 이하로 받을 확률 etc
ppois(q=1, lambda=..., lower.tail = (TRUE or FALSE))


3.5. 포아송 확률 변수 Poisson random variable

이하 from http://www.kocw.net/home/search/kemView.do?kemId=1279832 8. Conditional Probability, Independence of Events, Sequential Experiments 16:00~

Up: 확률변수,random_variable - 저 페이지에 성대 강의 받아적은 거 있음.

정의. Let random variable $N$ : number of occurrences of an event in a certain time period (or in a certain space.)
(사건은 시간 내에서 랜덤으로 발생한다고 가정.)
$N:$ the Poisson random variable with pmf
$P(N=k)=P_N(k)=\frac{\alpha^k}{k!}e^{-\alpha},\quad\quad k=0,1,2,\cdots$
where
$\alpha$ : the average number of event occurrences in a specified time interval (시간 내, 평균 발생 횟수)

Note
(1)
$\sum_{k=0}^{\infty}P_N(k)=\sum_{k=0}^{\infty}\frac{\alpha^k}{k!}e^{-\alpha}=e^{-\alpha}\sum_{k=0}^{\infty}\frac{\alpha^k}{k!}=1.$
(2)
For $N:$ Poisson RV,
$E(N)=\alpha$ and $VAR(N)=\alpha.$
Pf.
$E(N)=\sum_{k=0}^{\infty}k\cdot P_N(k)$
$=\sum_{k=1}^{\infty}k\cdot\frac{\alpha^k}{k!}e^{-\alpha}$
$=e^{-\alpha}\sum_{k=1}^{\infty}\frac{\alpha^k}{(k-1)!}$
$=\alpha e^{-\alpha} \sum_{k=1}^{\infty}\frac{\alpha^{k-1}}{(k-1)!}$
$=\alpha e^{-\alpha} \sum_{k=0}^{\infty}\frac{\alpha^t}{t!}$
$=\alpha e^{-\alpha} \cdot e^{\alpha}$
$=\alpha.$
이리하여 분산이 평균과 같다는 특징이 있다.
(3)
For $\alpha<1,\;P(N=k)$ is maximum at $k=0.$
for $\alpha>1,\;P(N=k)$ is maximum at $k=\lfloor\alpha\rfloor,$ and if $\alpha$ is a positive integer,
then $P(N=k)$ is maximum at $k=\alpha\textrm{ and }k=\alpha-1.$

ex.
콜센터에서 t초 내에 도착하는 query의 수가 N인데 푸아송확률변수 with $\alpha=\lambda t,$
$\lambda$ 는 평균 arrival rate(도착률) in queries/second.
arrival rate가 4 queries/minute라고 한다.
Find the probability of the following events:
(a) more than 4 queries in 10 seconds
(b) fewer than 5 queries in 2 minutes.

sol.
$\lambda=\frac{4}{60}=\frac1{15}(q/s)$
(a)
$\alpha=\lambda t=\frac1{15}\times 10=\frac23$
$P(N>4)=1-P(N\le 4)=1-\sum_{k=0}^4\frac{(\frac23)^k}{k!}e^{-\frac23}\approx 0.000633 $ in 10(s)

(b) 120초 안에 문의가 5개 이하 (less than: 작다, fewer than: 작거나 같다. 라고 강의함)
$\alpha=\lambda t=\frac1{15}\times 120=8$
$P(N\le 5)=\sum_{k=0}^5\frac{8^k}{k!}e^{-8}\approx 0.1$


3.6. 이항확률변수 X와 포아송확률변수 N의 관계

43:45분

For the binomial r.v. X with the prob. p of a success in n-Bernoulli's trials, when n is very large and p is very small,
이항확률변수 $X$ with 확률 $p,$ 베르누이 시행에서 $n$ 번의 성공....이고, n이 매우 크고 p가 매우 작으면,
binomial RV X -> Poisson RV N.
i.e. if $\alpha=np:$ fixed, then
$P(X=k)={}_n{\rm C}_k p^k (1-p)^{n-k} \;\rightarrow\; P(N=k)=\frac{\alpha^k}{k!}e^{-\alpha}$

pf. Since $\alpha=np,p=\frac{\alpha}{n}.$
$P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}$
$=\frac{n(n-1)\cdots(n-k+1)}{k!}(\frac{\alpha}n)^k(1-\frac{\alpha}n)^{n-k}$
$=\frac{n(n-1)\cdots(n-k+1)}{n^k}\cdot \frac{\alpha^k}{k!} \cdot (1-\frac{\alpha}n)^n \cdot (1-\frac{\alpha}{n})^{-k}$
$\rightarrow 1\cdot\frac{\alpha^k}{k!}\cdot e^{-\alpha}\cdot 1$
$=\frac{\alpha^k}{k!}e^{-\alpha}$
$=P(N=k)\textrm{ as }n\to\infty.$

52:39
ex.
109 bits/s 의 통신시스템. 비트 에러 확률은 10-9.
Q: 1초에 5개 이상의 오류 발생 확률을 구하라.

Sol.
여기선 bit error날 확률을 success로 보아야 함에 주의.
Since
$n=10^9$ and $p=10^{-9}$ in 1(s), $\alpha=np=1$ in 1(s).
$\to P(N\ge 5)=1-P(N\le 4)=1-\sum_{k=0}^4 \frac{1^k}{k!}e^{-1}$
$=1-e^{-1}\left(\frac1{0!}+\frac1{1!}+\cdots+\frac1{4!}\right)\approx0.00366$
On the other hand,
$P(X\ge5)=1-P(X\le4)$
$=1-\{\binom{10^9}0(10^{-9})^0(1-10^{-9})^{10^9}$
$+{}_{10^9}{\rm C}_{1}(10^{-9})^1(1-10^{-9})^{10^9-1}$
$+\cdots$
$+{}_{10^9}{\rm C}_4(10^{-9})^4(1-10^{-9})^{10^9-4}\}$ .....계산하기가 복잡. (Poisson RV가 나온 이유.)

ex. n커지고 p작아지면 poisson과 binomial사이의 차이/오류,error가 줄어든다는 예.
제품 불량(defective) 확률이 p1=0.1(p2=0.01).
제품 샘플 수가 n1=10(n2=100)일 때, 최대 한 개의 불량품일 확률을 찾으라.
Find the probability that a sample of n1=..... items contain at most one defective item.
Assume that the quality of successive items is independent.

Sol.

For n1=10 and p1=0.1,
$P(X\le 1)={}_{10}{\rm C}_{0}(\frac9{10})^{10}+{}_{10}{\rm C}_1(\frac1{10})(\frac9{10})^9\approx 0.7361.$
Since $\alpha=n_1p_1=1,$
$P(N\le 1)=\sum_{k=0}^1\frac{1^k}{k!}e^{-1}=e^{-1}(1+1)\approx0.7358.$
i.e. $|0.7358-0.7361|=0.0003.$

For n2=100 and p2=0.01,
$P(X\le 1)={}_{100}{\rm C}_0 (\frac{99}{100})^{100} + {}_{100}{\rm C}_1 (\frac1{100})(\frac{99}{100})^{99}\approx 0.7357.$
i.e. $|0.7358-0.7357|=0.0001.$




...........여기까지가 경북대강의 노트
기타 내용은 RR:확률_및_랜덤_프로세스

3.7. tmp

from http://www.kocw.net/home/search/kemView.do?kemId=1162312 4장_확률변수와분포_포아송분포
{
확률변수 X의 확률질량함수,probability_mass_function,PMF:
$P(X=x)=f(x;\mu)=\frac{e^{-\mu}\mu^x}{x!},\quad x=0,1,2,\cdots$
$f(x)$ : 포아송분포의 확률질량함수
$X$ : 포아송확률변수 $X\sim P(\mu)$,
주어진 단위시간(or 단위영역)에서 발생하는 사건의 횟수.

포아송확률분포의 기대값과 분산:
$E(X)=\mu$
$V(X)=\mu$

이항분포와 포아송분포
포아송분포는 발생확률 p가 아주 작아서, 발생평균회수 $\mu=np$ 가 작은 사건에 대한 언급.
희소하고 우연한 현상에 적용되는 확률분포임.
n이 크고 확률 p가 작아짐에 따라, 이항분포는 포아송분포와 유사.
i.e.
$\binom{n}{x}p^x(1-p)^{n-x}\,\sim\,\frac{e^{-\mu}\mu^x}{x!}$

n↑ p↓

예제 1
어떤 항구에 매일 도착하는 유조선: 평균 7척
이 항구의 유조선 수용능력: 10척 / 일
어떤 날 유조선을 외항에 대기시킬 확률은?
Sol.
X: 매일 도착하는 유조선의 수
$P(X>10)=1-P(X\le 10)=1-\sum_{x=0}^{10}f(x;7)$
$=1-\sum_{x=0}^{10}\frac{e^{-7}7^x}{x!}=1-0.901=0.099$

예제 2
스캐너 제품 출하시, 1000개당 평균 1개의 불량품
8000개의 제품을 출하할 때 불량품의 개수가 6개 미만일 확률은?
Sol.
불량품의 개수가 X라 하면 $X\sim B(n,p)=B(8000,0.001)$
$P(X<6)=\sum_{x=0}^5\binom{8000}{x}(0.001)^x(1-0.001)^{8000-x}$
이 식은 계산하기 어려우므로 포아송 분포를 사용하면,
$P(X<6)\simeq\sum_{x=0}^{5}\frac{e^{-8}8^x}{x!}=0.191$
}

4. 푸아송 확률변수 Poisson random variable

푸아송_확률변수,Poisson_random_variable
{
Note in counting the number $N$ of occurrences of an event in a certain time period or in a certain region in space.
  • $N$ is called the Poisson r.v.
  • Sample space SX={0, 1, 2, …}

pmf of r.v. N
$P[N=k]=\frac{\alpha^k}{k!}e^{-\alpha}$
k=0,1,…
$\alpha$ is the average number of event occurrences in a specified time interval or region in space.

Let's check the sum of probabilities of all the events
$\sum_{k=0}^{\infty}P[N=k]=\sum_{k=0}^{\infty}\frac{\alpha^k e^{-\alpha}}{k!}=e^{-\alpha}\sum_{k=0}^{\infty}\frac{\alpha^k}{k!}=e^{-\alpha}\cdot e^{\alpha}=1$

Note that Poisson pmf is the limiting form of the Binomial pmf when $n$ is very large and the probability of success is kept small; that is,
  • event A of interest is very rare but # of Bernoulli trials is very large

By taking the limit $n\to\infty,$ while keeping $\alpha=np,$ we get the approximation
$p_k=\binom{n}{k}p^k(1-p)^{n-k}\simeq \frac{\alpha^k}{k!}e^{-\alpha}$
k=0,1,…
Proof:
First, consider the probability that no events occur in $n$ trials
$p_0=(1-p)^n=(1-\frac{\alpha}n)^n\to e^{-\alpha}$ as $n\to\infty$
Consider the ratio of successive binomial probabilities
$\frac{p_{k+1}}{p_k}=\frac{{}_n{\rm C}_{k+1}p^{k+1}(1-p)^{n-k-1}}{{}_n{\rm C}_k p^k(1-p)^{n-k}}$
$=\frac{(n-k)p}{(k+1)(1-p)}=\frac{(1-k/n)\alpha}{(k+1)(1-\alpha/n)}$
$\to \alpha/(k+1)$ as $n\to\infty$
Thus the limiting probabilities satisfy
$p_{k+1}=\frac{\alpha}{k+1}p_k=(\frac{\alpha}{k+1})(\frac{\alpha}{k})\cdots(\frac{\alpha}1)p_0=\frac{\alpha^{k+1}}{(k+1)!}e^{-\alpha}$

푸아송_분포,Poisson_distribution 페이지에도 Poisson RV 강의 받아적은 거 있음
}