''이게 이름이 이런 이유는 분명.. [[기하수열,geometric_sequence]]의 공비 $r(<1)$ 인 그래프가 '''기하분포'''의 성공확률 $p(<1)$ 에 대한 pmf와 비슷해서 or 같아서..? - chk'' ---- 대충, 전체 $x$ 번 시행에서, 실패가 $x-1$ 번 반복되다가, 마지막에 성공 1번. 실패확률 $(1-p)$ 그리고 성공확률 $p.$ 따라서 $(1-p)^{x-1}p^1$ 이전의 실패 여부는 다음 시행에 영향을 주지 않는 상황을 가정. (식에 확률이 $p,\,1-p$ 두 가지만 나오는 것을 보면 알 수 있다) - rel. [[무기억성,memorylessness]] ... CHK ---- // ㄷㄱㄱ week 7-1 7m '''기하분포 Geometric Distribution''' $X\sim\text{Geo}(p)$ - [[기하확률변수,geometric_random_variable]] $\bullet\; \text{P}(x)=p(1-p)^{x-1} \; \text{for} \; x=1,2,3,\cdots$ $\bullet\; \text{E}[X]=\frac1p$ $\bullet\; \text{Var}[X]=\frac{1-p}{p^2}$ The number of [[베르누이_시행,Bernoulli_trial|Bernoulli trial]]s for the first success // ''베르누이 시행을 계속 할 때, 처음 '성공'하기 위한(i.e. 뭔가 처음 나오기 위한) 시행의 수 - i.e. 뭔가 나올 때 까지 계속해서 시행했을 때 시도의 수'' * Probability to have the first head at the third trial when flipping a coin with head probability of 1/3 // ''예를 들어, head 나올 확률이 1/3인 동전을 계속 던졌는데 첫번째 두번째는 tail이 나오고 세번째에 처음 head가 나오는 확률은'' * $X\sim\text{Geo}\left(\frac13\right),\;\text{Pr}[X=3]=\frac23\cdot\frac23\cdot\frac13$ ''success/fail이란 단어를 쓸 때, 보통 success 확률 p, fail 확률 (1-p) 로 잡는? chk'' 암튼 p가 한 번(^^1^^), (1-p)가 x-1번(^^x-1^^) - 그래서 P(x)의 식이 저 모양. P,,X,,(x)는 exponential_decay 모양이다. - 정확히. 모양만? 실제로? chk https://i.imgur.com/3XqBYkgl.png 0으로 접근하지만 0이 되지는 않는다. p가 작으면 느리게, p가 크면 빠르게 0으로 접근. ---- [[베르누이_시행,Bernoulli_trial]]이 처음 성공할 때까지의 시행횟수를 확률변수 X라고 했을 때, X의 분포. $X\sim{\rm Geo}(p)$ 1-p가 n-1만큼 반복되다가 마지막 n번째에 p의 확률을 가지면 되므로, PMF: $P(X=x)=f(x;p)=(1-p)^{x-1}p$ where $x\in[0,\infty),\;0\le p\le 1$ tmp from https://sumniya.tistory.com/27 ; CHK ---- http://blog.naver.com/mykepzzang/220839837110 { 성공할 때까지 계속 시도 } 성질 무기억성 memoryless = [[기하확률변수,geometric_random_variable]] = { Note the number $M$ of independent [[베르누이_시행,Bernoulli_trial|Bernoulli trials]] until the first occurrence of a success. * $M$ is called the geometric r.v. * Sample space $S_X=\lbrace 1,2,\cdots \rbrace$ PMF of r.v. $M$ $P[M=k]=p_M(k)=(1-p)^{k-1}p$ $k=1,2,\cdots$ $p=$ probability of success in each trial Check $\sum p_M(k)=1$ It is the only discrete variable that fulfills the memoryless property. * If a success has not occurred in the first $j$ trials, then the probability of at least $k$ more trials is the same as the probability of initially performing at least $k$ trials. * Each time a failure occurs, the system "forgets" its history. $P[M\ge k+j|M>j]=P[M\ge k]\;\forall j,k>1$ ⇒ $P[M\ge k+j|M>j]=\frac{P[M\ge k+j\cap M>j]}{P[M>j]}=\frac{P[M\ge k+j]}{P[M\ge j+1]}$ $=\frac{P[M\ge k+j]}{P[M\ge j+1]}=\frac{(1-p)^{k+j-1}}{(1-p)^j}=(1-p)^{k-1}=P[M\ge k]$ ## from 성대 안창욱 [[기하분포,geometric_distribution]] } Related: [[RR:기하확률변수,geometric_RV]] mklink, compare [[초기하분포,hypergeometric_distribution]] ---- Twins: [[https://terms.naver.com/entry.naver?docId=3405001&cid=47324&categoryId=47324 수학백과: 기하분포]] https://everything2.com/title/Geometric+distribution https://angeloyeo.github.io/2021/04/28/geometric_distribution.html Up: [[이산확률분포,discrete_probability_distribution]]