이항분포,binomial_distribution


1. 1

결과,outcome가 2가지. (3가지 이상일 때는 다항분포,multinomial_distribution 참조)

이고 확률 $p$시행,trial$n$ 번 했을 때, ...
평균,mean,average$np$
분산,variance$np(1-p)$ ...CHK

표기:
$X\sim\mathrm{B}(n,p)$ 혹은 $\mathrm{Bin}(n,p)$
여기서
$n$ : 시행 횟수, number of observation, 베르누이_시행,Bernoulli_trial의 반복 횟수, ... 양의 정수.
$p$ : 발생 확률(probability of occurrence), 각 시행의 성공 확률, ... $[0,1]$ 내의 실수.
$X$ : $n$ 번 시행 중 성공의 횟수

성공 확률이 $p$ 인 베르누이 시행을 $n$ 번 반복해서 성공횟수가 확률변수 $X$ 이면, X가 이항확률변수,binomial_random_variable이다.


각 베르누이 시행은 서로 독립이다. (독립시행)
1회 시행마다 사건이 일어날 확률 p,
일어나지 않을 확률 (또는 여사건이 일어날 확률) q(=1-p)라 하고,
n회의 독립시행 중 사건이 일어나는 횟수가 X이면,
X는 0, 1, 2, …, n중 한 값을 가지는 확률변수이며,
X=x가 되는 확률은,
i.e.
X의 확률질량함수,probability_mass_function,PMF
$P(X=x)=\binom{n}{x}p^{x}q^{n-x}$
(계수는 이항정리,binomial_theorem에 의해 계산할 수 있다.)

이런 분포를 이항분포라 하고, 기호로
${\rm B}(n,p)$
로 나타낸다.

이항분포에서 $1-p=q$ 라고 하면 $(p+q)^n$이항정리,binomial_theorem의 일반항과 같은 모양이 나온다.
이항계수,binomial_coefficient

Ex. 주사위를 7번 던진다면
${\rm B}(7, \frac16)$
주사위를 4회 던져서 6이 2회 나올 확률:
${}_4{\rm C}_{2}\left(\frac{5}{6}\right)^2\left(\frac{1}{6}\right)^2=\frac{25}{216}$

$n=1$ 인 경우는 베르누이_분포,Bernoulli_distribution.
$X\sim\operatorname{B}(1,p)$
베르누이 분포는 이항분포의 특수한 경우이다. (시행 횟수가 한번인 경우)

시행 횟수 $n$ 이 충분히 커지면 이항분포 $B(n,p)$표준정규분포,standard_normal_distribution $N(np,npq)$ 에 가깝게 된다.


// ㄷㄱㄱ week 7-1 14m

Binomial Distribution


$\bullet\; P_X(x)=\binom{n}{x}p^x(1-p)^{n-x} \;\text{ for }\; x=0,1,2,\cdots,n$

$\bullet\; \text{E}[X]=np$

$\bullet\; \text{Var}[X]=np(1-p)$

The number of successes among 𝑛 Bernoulli trails
• When transmission error probability is 0.1, probability to have 2 errors for 10 transmissions
𝑝 = 0.19

https://i.imgur.com/nF57GaOl.png

$n$ 이 커질수록 bell shape로 감을 볼 수 있다


베르누이_시행,Bernoulli_trial에서 한쪽 사건이 일어날 확률(성공확률이라고 하는 일이 많다)을 알고 있을 때 이 시행을 $n$ 번 반복했을 때 그 사건이 일어나는 횟수(성공 횟수)는 이항분포를 따른다.

$X$ $0$ $1$ $2$ $\cdots$ $n$
확률 ${}_n\text{C}_0 (1-p)^n$ ${}_n\text{C}_1 p (1-p)^{n-1}$ ${}_n\text{C}_2 p^2 (1-p)^{n-2}$ $\cdots$ ${}_n\text{C}_n p^n$
$(0<p<1)$

이 확률분포를 성공확률 $p$ 와 시행횟수 $n$이항분포라고 하고
$B(n,p)$
라는 기호로 나타낸다.

이항분포에서 $1-p=q$ 라 하면 $X=k$ 가 되는 확률
${}_n{\rm C}_k p^k q^{n-k}$
$(q+p)^n$이항정리,binomial_theorem
$(q+p)^n= {}_n{\rm C}_0 q^n + {}_n{\rm C}_1 pq^{n-1} + {}_n{\rm C}_2 p^2 q^{n-2} + \cdots + {}_n{\rm C}_k p^k q^{n-k} + \cdots + {}_n{\rm C}_n p^n$
의 일반항과 일치한다. 이것이 이항분포라는 이름의 유래.

확률변수 $X$ 가 이항분포 $B(n,p)$ 에 따를 때 $X$기대값,expected_value(평균,mean,average), 분산,variance, 표준편차,standard_deviation
$E(X)=np$
$V(X)=np(1-p)$
$s(X)=\sqrt{np(1-p)}$

(나가노 히로유키)

2. ?

확률이 p로 일정할 때만. CHK
실험 결과가 두 가지일 때만. 예:
  • 동전던지기: 앞/뒤
  • 생산된 제품: 양품/불량품
  • 어떤 실험: 성공/실패

3. 성질

확률변수 X가 이항분포 B(n,p)를 따를 때, X의 평균·분산·표준편차는 각각
$E(X)=np$
$V(X)=npq$
$\sigma(X)=\sqrt{npq}$

n이 충분히 커질때만? CHK

(이상 이항분포평균, 분산, 표준편차)

4. 이항확률변수,binomial_random_variable

{
성공 확률이 $p$베르누이_시행,Bernoulli_trial$n$ 번 반복되었을 때, 그리고 성공횟수를 확률변수 $X$ 라 할 때, $X$이항확률변수.

PMF:
$f(x)=\binom{n}{x}p^xq^{n-x}$
where
$x=0,1,2,\cdots,n$

$E(X)=np$
$V(X)=npq$


A random experiment is repeated $n$ independent times.
Let $X$ be the number of times a certain event $A$ occurs in $n$ trials.
  • $X=I_1+I_2+\ldots+I_n$ where $I_j$ is the indication function for the event $A$ in the $j$ th trial
  • Sample space $S_X=\lbrace 0,1,\cdots,n\rbrace$

PMF of r.v. $X$
(X be the binomial r.v. with parameter n and p)
$P[X=k]=\binom{n}{k} p^k (1-p)^{n-k}$
for $k=0,1,\cdots,n.$
성질:
$\sum p[X=k]=1$


[https]수학백과: 이항확률변수
이산확률변수,discrete_random_variable와 관계?

}