각각
제1사분위수, ..., 제4사분위수
Q1, Q2, Q3, Q4
누적 백분율: 25%, 50%, 75%, 100%
즉,
1사분위수 = 25백분위수,
2사분위수 = 50백분위수 = 중앙값,
3사분위수 = 75백분위수
제2 사분위수는
중앙값,median과 같다. { 자료를 크기 순서대로 배열했을 때, 중앙에 위치하게 되는 값. 제 2
사분위수,quartile와 같다. Up:
순서통계량,order_statistic }
25 백분위수 | 제1 사분위수 | Q1 | first quartile |
50 백분위수 | 제2 사분위수 | Q2 | second quartile |
75 백분위수 | 제3 사분위수 | Q3 | third quartile |
데이터 개수가 짝수인 경우,
제1사분위수: 아래쪽 절반의 중앙값
제2사분위수: 전체의 중앙값
제3사분위수: 위쪽 절반의 중앙값
데이터 개수가 홀수인 경우,
제1사분위수: 중앙값을 제외한 아래쪽 절반의 중앙값
제2사분위수: 전체의 중앙값
제3사분위수: 중앙값을 제외한 위쪽 절반의 중앙값
위 아래(Q0, Q4)까지 포함해 5줄로 적으면, (저건 quartile에 포함시키지 않는 것 같은데 아무튼...) → (2024-04) 이걸
5가지_요약_수치 Five-number_summary이라 한다.
Q0 | 0th quartile | minimum? lower extreme? CHK → sample minimum (smallest observation) |
Q1 | 1st quartile | = lower quartile |
Q2 | 2nd quartile | = median |
Q3 | 3rd quartile | = upper quartile |
Q4 | 4th quartile | maximum? upper extreme? CHK → sample maximum (largest observation) |
(MKL 표본최대,sample_maximum 표본최소,sample_minimum) ('표본최대값' via sample maximum) (See Sample_maximum_and_minimum)
IQR = (upper quartile) − (lower quartile) = Q3 − Q1
R의 함수:
quantile(data)는 사분위수를 모두 보여줌
quantile(data, 0.05)는 5백분위수를 돌려줌
NumPy:
np.percentile(x, 25) # Q1을 돌려줌
}