사분범위,interquartile_range,IQR

사분범위,interquartile_range,IQR (rev. 1.5)

먼저 사분위수에 대해

사분위수,quartile
제1사분위수, ..., 제4사분위수
Q1, Q2, Q3, Q4
누적 백분율: 25%, 50%, 75%, 100%
즉, 1사분위수 = 25백분위수, 2사분위수 = 50백분위수 = 중앙값, 3사분위수 = 75백분위수
제2 사분위수는 중앙값,median과 같다. { 자료를 크기 순서대로 배열했을 때, 중앙에 위치하게 되는 값 }

25 백분위수 제1 사분위수
50 백분위수 제2 사분위수
75 백분위수 제3 사분위수

데이터 개수가 짝수인 경우,
제1사분위수: 아래쪽 절반의 중앙값
제2사분위수: 전체의 중앙값
제3사분위수: 위쪽 절반의 중앙값
데이터 개수가 홀수인 경우,
제1사분위수: 중앙값을 제외한 아래쪽 절반의 중앙값
제2사분위수: 전체의 중앙값
제3사분위수: 중앙값을 제외한 위쪽 절반의 중앙값

Compare: 백분위수,percentile

R의 함수:
quantile(data)는 사분위수를 모두 보여줌
quantile(data, 0.05)는 5백분위수를 돌려줌
NumPy:
np.percentile(x, 25) # Q1을 돌려줌

Note:
quantile과 quartile을 혼동하지 말라.
Google:quantile quartile

사분범위

사분범위,interquartile_range,IQR
Q3 - Q1
분포의 양끝 1/4을 제외한 범위
제3사분위수(75% 백분점수)에서 제1사분위수(25% 백분점수)를 뺀 것
장점: 극단적인 값들에 의한 영향을 덜 받음

상자그림,box_plot