이산확률분포의 일종으로, 발생 가능성이 희박한 사건이 임의의 구간 안에서 평균적으로 λ번 발생할 때, 이 사건이 일어날 횟수의 분포
특정 사건이 발생할 가능성이 매우 드문 경우의 확률분포
- 주어진 시간/길이/넓이/부피 내에 어떤 사건이 일어나는 횟수
- 단위시간/영역에서 정수 값 0, 1, 2, ...을 갖는 사건에 적용
특정 사건이 발생할 가능성이 매우 드문 경우의 확률분포
표기:
pmf 식이 자꾸 헷갈리는데, x가 두번, λ도 두번 등장
X~Pois(np)
X가 푸아송 확률변수이고, 모수,parameter가 λ인 확률질량함수,probability_mass_function,PMF f(x)는1. 설명 ¶
// ㄷㄱㄱ week 7-2 0m
Poisson Distribution
Poisson Distribution
이 둘을 계산하는 것은 간단치 않으나, 결과는 간단함을 볼 수 있다.
When 𝛼 events are observed on average, the probability to see 𝑥 events actually
한시간에 평균 손님 열 명이 온다. 9명이 올 확률?
Pr[X=9] = 109 e−10 / 9! ≈ 0.125
Pr[X=9] = 109 e−10 / 9! ≈ 0.125
time slot을 사용해 설명한다...
- 𝛼 events on average over 𝑛 time slots // time slots 동안 평균 events가 발생.
- Prob. of event occurrence in each slot ~𝛼/𝑛 // 각 slot에서 사건 발생 확률은
- 𝑋: the number of actually observed events // 실제 관측된 사건 수
- When
3.1. from 노경섭 ¶
푸아송분포의 확률함수를 도출하기 위해서,
평균 과 분산 이 모두 와 같다는 가정이 필요.
개의 구간에서 발생할 확률은
이걸 저 식에 대입하면
단위시간당 평균발생 건수는
로 표현.
평균 과 분산 이 모두 와 같다는 가정이 필요.
개의 구간에서 발생할 확률은
이걸 저 식에 대입하면
로 표현.
3.2. from 권태원 ¶
확률변수 가 확률밀도함수
를 가질 때, 이를 모수가 인 포아송 확률변수라 하고,
로 표기한다.
모수(여기선, 단위당 평균발생횟수)
ex. 매분마다 평균 2건 통화. 3분동안 5건 이상 통화가 이루어질 확률?
구하는것은
그렇다면 4건 이하일 확률은
인데 이것을 계산하다 시간이 다 간다
그러므로 마치 정규분포표가 있듯이 (미리 만들어진) 포아송 누적분포표가 있다, 그것을 쓴다.
가 6이면서 가 4 이하일 확률은
그래서
이다. 참고로 X가 특정 값일 확률을 구하는 방법은
이런 식.
구하는것은
그렇다면 4건 이하일 확률은
인데 이것을 계산하다 시간이 다 간다
그러므로 마치 정규분포표가 있듯이 (미리 만들어진) 포아송 누적분포표가 있다, 그것을 쓴다.
가 6이면서 가 4 이하일 확률은
그래서
이다. 참고로 X가 특정 값일 확률을 구하는 방법은
이런 식.
3.3. from 이상철 ¶
// https://www.youtube.com/watch?v=gXNat2QEoP0
일정한 공간,space(ex. 일정한 시간,time 단위, 일정한 공간 단위) 내에 발생하는 사건의 개수를 설명.
일정한 공간,space(ex. 일정한 시간,time 단위, 일정한 공간 단위) 내에 발생하는 사건의 개수를 설명.
분포 | primary example(?) | 분류 | |
푸아송 분포 | 단위시간당 일어난 event의 수 | event의 수는 이산적이니까 | 이산분포 |
지수 분포 | event 사이의 시간 | 시간은 연속적이니까 | 연속분포 |
수식
단위시간당 발생 건수
단위시간당 평균 발생 건수
단위시간당 평균 발생 건수
R로는 //// 나중에 ref 찾아보고 확실히 ... d와 p의 뜻?
# P(X=a) 확률 계산 dpois(X=..., lambda=...) # P(X <= 1) 이하로 받을 확률 etc ppois(q=1, lambda=..., lower.tail = (TRUE or FALSE))
3.5. 포아송 확률 변수 Poisson random variable ¶
이하 from http://www.kocw.net/home/search/kemView.do?kemId=1279832 8. Conditional Probability, Independence of Events, Sequential Experiments 16:00~
Up: 확률변수,random_variable - 저 페이지에 성대 강의 받아적은 거 있음.
정의. Let random variable : number of occurrences of an event in a certain time period (or in a certain space.)
where
(1)
(2)
이리하여 분산이 평균과 같다는 특징이 있다.
(3)
콜센터에서 t초 내에 도착하는 query의 수가 N인데 푸아송확률변수 with
는 평균 arrival rate(도착률) in queries/second.
arrival rate가 4 queries/minute라고 한다.
Find the probability of the following events:
(a) more than 4 queries in 10 seconds
(b) fewer than 5 queries in 2 minutes.
(사건은 시간 내에서 랜덤으로 발생한다고 가정.)
⇔ the Poisson random variable with pmf : the average number of event occurrences in a specified time interval (시간 내, 평균 발생 횟수)
Note(1)
For Poisson RV,
and
Pf.and
이리하여 분산이 평균과 같다는 특징이 있다.
For is maximum at
for is maximum at and if is a positive integer,
ex.for is maximum at and if is a positive integer,
then is maximum at
콜센터에서 t초 내에 도착하는 query의 수가 N인데 푸아송확률변수 with
는 평균 arrival rate(도착률) in queries/second.
arrival rate가 4 queries/minute라고 한다.
Find the probability of the following events:
(a) more than 4 queries in 10 seconds
(b) fewer than 5 queries in 2 minutes.
sol.
(a)
in 10(s)
(a)
in 10(s)
(b) 120초 안에 문의가 5개 이하 (less than: 작다, fewer than: 작거나 같다. 라고 강의함)
3.6. 이항확률변수 X와 포아송확률변수 N의 관계 ¶
43:45분
For the binomial r.v. X with the prob. p of a success in n-Bernoulli's trials, when n is very large and p is very small,
이항확률변수 with 확률 베르누이 시행에서 번의 성공....이고, n이 매우 크고 p가 매우 작으면,
pf. Since
52:39
ex.
109 bits/s 의 통신시스템. 비트 에러 확률은 10-9.
Q: 1초에 5개 이상의 오류 발생 확률을 구하라.
이항확률변수 with 확률 베르누이 시행에서 번의 성공....이고, n이 매우 크고 p가 매우 작으면,
binomial RV X -> Poisson RV N.
i.e. if fixed, thenex.
109 bits/s 의 통신시스템. 비트 에러 확률은 10-9.
Q: 1초에 5개 이상의 오류 발생 확률을 구하라.
Sol.
여기선 bit error날 확률을 success로 보아야 함에 주의.
Since
On the other hand,
.....계산하기가 복잡. (Poisson RV가 나온 이유.)
ex. n커지고 p작아지면 poisson과 binomial사이의 차이/오류,error가 줄어든다는 예.
제품 불량(defective) 확률이 p1=0.1(p2=0.01).
제품 샘플 수가 n1=10(n2=100)일 때, 최대 한 개의 불량품일 확률을 찾으라.
Find the probability that a sample of n1=..... items contain at most one defective item.
Assume that the quality of successive items is independent.
여기선 bit error날 확률을 success로 보아야 함에 주의.
Since
and in 1(s), in 1(s).
On the other hand,
.....계산하기가 복잡. (Poisson RV가 나온 이유.)
제품 불량(defective) 확률이 p1=0.1(p2=0.01).
제품 샘플 수가 n1=10(n2=100)일 때, 최대 한 개의 불량품일 확률을 찾으라.
Find the probability that a sample of n1=..... items contain at most one defective item.
Assume that the quality of successive items is independent.
Sol.
For n1=10 and p1=0.1,
Since
i.e.
Since
i.e.
For n2=100 and p2=0.01,
i.e.
i.e.
3.7. tmp ¶
from http://www.kocw.net/home/search/kemView.do?kemId=1162312 4장_확률변수와분포_포아송분포
{
확률변수 X의 확률질량함수,probability_mass_function,PMF:
: 포아송분포의 확률질량함수
: 포아송확률변수 ,
포아송확률분포의 기대값과 분산:
이항분포와 포아송분포
{
확률변수 X의 확률질량함수,probability_mass_function,PMF:
: 포아송분포의 확률질량함수
: 포아송확률변수 ,
주어진 단위시간(or 단위영역)에서 발생하는 사건의 횟수.
포아송분포는 발생확률 p가 아주 작아서, 발생평균회수 가 작은 사건에 대한 언급.
i.e.
희소하고 우연한 현상에 적용되는 확률분포임.
n이 크고 확률 p가 작아짐에 따라, 이항분포는 포아송분포와 유사.i.e.
n↑ p↓
예제 1
어떤 항구에 매일 도착하는 유조선: 평균 7척
이 항구의 유조선 수용능력: 10척 / 일
어떤 날 유조선을 외항에 대기시킬 확률은?
Sol.이 항구의 유조선 수용능력: 10척 / 일
어떤 날 유조선을 외항에 대기시킬 확률은?
X: 매일 도착하는 유조선의 수
예제 2스캐너 제품 출하시, 1000개당 평균 1개의 불량품
8000개의 제품을 출하할 때 불량품의 개수가 6개 미만일 확률은?
Sol.8000개의 제품을 출하할 때 불량품의 개수가 6개 미만일 확률은?
불량품의 개수가 X라 하면
이 식은 계산하기 어려우므로 포아송 분포를 사용하면,
}이 식은 계산하기 어려우므로 포아송 분포를 사용하면,
4. 푸아송 확률변수 Poisson random variable ¶
푸아송_확률변수,Poisson_random_variable
{
Note in counting the number of occurrences of an event in a certain time period or in a certain region in space.
Let's check the sum of probabilities of all the events
Note that Poisson pmf is the limiting form of the Binomial pmf when is very large and the probability of success is kept small; that is,
Proof:
First, consider the probability that no events occur in trials
as
Thus the limiting probabilities satisfy
푸아송_분포,Poisson_distribution 페이지에도 Poisson RV 강의 받아적은 거 있음
}
{
Note in counting the number of occurrences of an event in a certain time period or in a certain region in space.
- is called the Poisson r.v.
- Sample space SX={0, 1, 2, …}
k=0,1,…
is the average number of event occurrences in a specified time interval or region in space.- event A of interest is very rare but # of Bernoulli trials is very large
k=0,1,…
First, consider the probability that no events occur in trials
as
Consider the ratio of successive binomial probabilitiesas
}