정규분포,normal_distribution

AKA 가우스 분포, 가우시안 분포, Gaussian distribution

평균,mean,average이 m, 분산,variance이 σ²인 정규분포,normal_distribution
${\rm N}(m,\sigma^2)$
으로 나타낸다.

확률밀도함수,probability_density_function,PDF
${\rm N}(m,\sigma^2)(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-m)^2}{2\sigma^2}}$

그 성질은
  • x=m에 대해 좌우 대칭
  • x=m일 때 최대
  • x축이 점근선
  • 곡선과 x축 사이의 넓이는 1

또는
$f(x)=\frac1{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$

그 그래프가 종형을 닮아서 bell curve라고 함. (다만 정규분포가 아닌 것 중에서도 bell shaped curve가 있음.)
{
-σ to σ : 68%
-2σ to 2σ : 95%
-3σ to 3σ : 99.7%

i.e.
$P(\mu-\sigma<x<\mu+\sigma)=0.6826$
$P(\mu-2\sigma<x<\mu+2\sigma)=0.9544$
$P(\mu-3\sigma<x<\mu+3\sigma)=0.9974$
}


표준화. 표준정규분포.

Sub: 정규분포 중에서 평균=0, 표준편차=1인 것을 표준정규분포,standard_normal_distribution이라고 한다.
확률변수 $X\sim N(\mu,\sigma^2)$ 에 대한 표준화 변수는 $Z=\frac{X-\mu}{\sigma}$

i.e.
확률변수 $X$정규분포를 따를 때,
$Z=\frac{X-\mu}{\sigma}$
로 변환하면 확률변수 $Z$ 는 표준정규분포 ${\rm N}(0,1)$ 을 따른다.


이항분포와의 관련성 서술.

이항분포,binomial_distribution에서 시행의 횟수가 많아지면 정규분포에 가까워진다는 것 서술. n이 커질 때 B(n,p)는 N(np, npq)로 간다는 .... CHK


중심극한정리,central_limit_theorem,CLT확률분포,probability_distribution를 알 수 없는 어떠한 변수(확률변수,random_variable?)라도 정해진 횟수 $n$ 만큼 독립적으로 추출하는 작업을 반복했을 때, 추출된 값들의 평균값은 $n$ 이 커짐에 따라 정규분포에 접근한다는 정리.[1]
{
표본평균,sample_mean확률분포,probability_distribution정규분포에 수렴한다. 모집단,population 확률변수의 분포가 정규분포가 아니어도, 표본의 크기가 대략 30개 이상이면 표본평균의 확률분포는 정규분포를 보인다. ...CHK

tmp from https://bookdown.org/mathemedicine/Stat_book/normal-distribution.html
$n$ 이 커지면, 특히 30 이상이 되면, 표본평균,sample_mean $\bar{X}$ 는 평균이 $\mu,$ 분산이 $\frac{\sigma^2}{n}$정규분포 $N\left(\mu,\frac{\sigma^2}{n}\right)$ 을 따를 것 같은데,
....중략....
평균이 $\mu,$ 분산이 $\sigma^2$모집단,population(정규분포일 필요 없음)에서, $n$ 개의 표본,sample을 뽑아서 계산한 표본평균,sample_mean $\bar{X}$$n$ 이 커질 때 $N(\mu,\frac{\sigma^2}{n})$ 을 따른다. 이것이 바로 CLT. CHK
}




저런 복잡한 수식이 나오는 이유는 WpEn:De_Moivre–Laplace_theorem https://mathworld.wolfram.com/deMoivre-LaplaceTheorem.html 참조.


드무아브르-라플라스 정리는 중심극한정리,central_limit_theorem,CLT의 특수한 경우이다. 이 정리는 정규분포가 특정 조건 아래서 이항분포,binomial_distribution에 대한 근사,approximation로 쓰일 수 있음을 보여준다.
푸아송_분포,Poisson_distribution는 큰 $n$ 값에 대해 이항분포에 대한 또 다른 방식의 근사이다. (wpen)

----
  • [1] 물리학백과: 정규분포 앞부분