표기:
σ, SD, STD, s, etc.
고딩레벨에선 항상
분산,variance의 제곱근인듯?
표준편차(STD)는 분산(VAR)의 양의 제곱근
모표준편차,population_standard_deviation σ
{
모평균,population_mean μ를 가지고 계산
모집단,population 표준편차,standard_deviation
}
표본표준편차,sample_standard_deviation s
{
표본평균,sample_mean X̅를 가지고 계산
표본,sample 표준편차,standard_deviation
}
모표준편차: 데이터 수
으로 나눔.
표본표준편차: 표본 자료 수보다 작은
로 나눔.
//tmp expr from
khan(https://ko.khanacademy.org/math/statistics-probability/summarizing-quantitative-data/variance-standard-deviation-sample/a/population-and-sample-standard-deviation-review)
성질 ¶
pf.
tmp ¶
분산,variance 뿐만 아니라
표준편차도 있는 이유는, 분산은 제곱하여 나온 것이기 때문에 실제 scale? 단위? 차원?... 와 동떨어질 수 있어서.
근데
표준편차 역시 문제점이 있는데
(여러 집합/집단 의 표준편차를 비교한다는 전제...)
표준편차는 퍼져있는 정도를 알아보자는 건데,
data 집합 크기(?? 확실히)에 따라
....(대충 scale이 제각각이라는 얘기)
그래서 이 문제를 해결하기 위해 '표준편차'보다 '평균을 고려한 표준편차'개념이 만들어졌고
이것을
변동계수,variation_coefficient라 한다.
표본분산 간이식(from kocw
숙대(http://www.kocw.net/home/search/kemView.do?kemId=1052562) 강의자료3 p106)
이름이
편차,deviation이므로 평균과의 차이를 나타내는 것이 맞는지 chk
그냥 편차는 특정 sample에 대한 것이고 표준편차는 전체 자료에 대한 것?
평균,mean,average의 주변에 측정값이 어느 정도나 흩어져 있는지를 나타내는 것?