사분위수,quartile

각각
제1사분위수, ..., 제4사분위수
Q1, Q2, Q3, Q4
누적 백분율: 25%, 50%, 75%, 100%
즉,
1사분위수 = 25백분위수,
2사분위수 = 50백분위수 = 중앙값,
3사분위수 = 75백분위수

제2 사분위수는 중앙값,median과 같다. { 자료를 크기 순서대로 배열했을 때, 중앙에 위치하게 되는 값. 제 2 사분위수,quartile와 같다. Up: 순서통계량,order_statistic }

25 백분위수 제1 사분위수 Q1 first quartile
50 백분위수 제2 사분위수 Q2 second quartile
75 백분위수 제3 사분위수 Q3 third quartile

데이터 개수가 짝수인 경우,
제1사분위수: 아래쪽 절반의 중앙값
제2사분위수: 전체의 중앙값
제3사분위수: 위쪽 절반의 중앙값
데이터 개수가 홀수인 경우,
제1사분위수: 중앙값을 제외한 아래쪽 절반의 중앙값
제2사분위수: 전체의 중앙값
제3사분위수: 중앙값을 제외한 위쪽 절반의 중앙값

위 아래(Q0, Q4)까지 포함해 5줄로 적으면, (저건 quartile에 포함시키지 않는 것 같은데 아무튼...)
Q0 0th quartile minimum? lower extreme? CHK
Q1 1st quartile = lower quartile
Q2 2nd quartile = median
Q3 3rd quartile = upper quartile
Q4 4th quartile maximum? upper extreme? CHK

IQR = (upper quartile) − (lower quartile) = Q3 − Q1


R의 함수:
quantile(data)는 사분위수를 모두 보여줌
quantile(data, 0.05)는 5백분위수를 돌려줌
NumPy:
np.percentile(x, 25) # Q1을 돌려줌


CHK:
최소값 - 제1사분위수 - 제2사분위수 - 제3사분위수 - 최대값
이 사이 각 구획에는 데이터의 약 25%씩이 포함
다섯 개 가운데 3개만 분위수, 양옆 최소값,minimum_value 최대값,maximum_value (최대최소,maximum_and_minimum?)는 분위수에 포함하지 않음
여기 이건 4분위수이므로 3개의 값이 있음,
k분위수이면 k-1개의 값이 있음


MKL
midhinge =,midhinge . WtEn:midhinge KmsE:midhinge Ndict:midhinge x 2023-08-29 Bing:midhinge Ggl:midhinge



Note:
quantile과 quartile을 혼동하지 말라.
Google:quantile quartile
quartile(사분위수)은 quantile(분위수)의 일종임.

관련:
Up: 통계,statistics 순서통계량,order_statistic?







//wpen
확률분포,probability_distributionWpEn:Range_(statistics)를 연속적인 구간으로 나눈.. 근데 그 기준은 같은 확률, 혹은 표본,sample 안의 WpEn:Observation_(statistics)을 같은 방식으로 나눈...

q개로 나누면(분할,partition하면) 값들이 q-quantile. 그 안에는 q-1개의 분할,partition이 있는. 각 분할의 번호는 0<k<q인 정수 k.

유일한 2-quantile = 중앙값,median
4 groups: 4-quantile = 사분위수,quartile
4 groups: octile
10 groups: decile
100 groups: 100-quantile = 백분위수,percentile


See also fractile =,fractile . { Ndict:fractile WtEn:fractile Ggl:fractile KmsE:fractile x 2023-08-29 }

no wk (2023-08-29)
WpEn:Quantile


}