사분범위,interquartile_range,IQR

Difference between r1.2 and the current

@@ -1,35 +1,25 @@
= 먼저 사분위수에 대해 =
[[사분수,quartile]]
1사분위수, ..., 제4사분위수
Q1, Q2, Q3, Q4
누적 백분율: 25%, 50%, 75%, 100%
즉, 1사분위수 = 25백분, 2사분위수 = 50백분= 중앙값, 3사분위수 = 75백분위수
제2 사분위수는 [[중앙값,median]]과 같다. { 자료를 크기 순서대로 배열했을 때, 중앙에 위치하게 되는 값 }
분포의 양끝 1/4을 제외한
3사분위수(75% 백분)에서 제1사분위수(25% 백분)를
Q3 - Q1

Compare: [[백분위수,percentile]]
장점: 극단적인 값들에 의한 영향을 덜 받음

R의 함수:
quantile(data) 사분위수를 모두 보여줌
quantile(data, 0.05)는 5백분위수를 돌려줌
NumPy:
np.percentile(x, 25) # Q1을 돌려줌
whisker length(WL) = '''interquartile range(IQR)''' * 1.5
whisker 밖에 있으면 outlier. CHK

Note:
quantile과 quartile혼동하지 말라.
Google:quantile+quartile
찾는 - CHK
[[중앙값,median]]찾는다.
중앙값 왼쪽 자료들에서 중앙값을 찾는다.
오른쪽 자료들에서도 중앙값을 찾는다.

= 사분범위 =
'''[[사분위,interquartile_range,IQR]]'''
Q3 - Q1
분포의 양끝 1/4을 제외한 범위
제3사분위수(75% 백분점수)에서 제1사분수(25% 백분점수)를 뺀 것
장점: 극단적인 값들에 의한 영향을 덜 받음
관련:
'''[[사분위,quartile]]'''
[[상자그림,box_plot]]
----
AKA '''사분위'''[* https://www.kms.or.kr/mathdict/list.html?key=ename&keyword=quartile]

[[상자_그림,box_plot]]
----
Up:
[[범위,range]]
[[통계,statistics]], [[기술통계,descriptive_statistics]]
대표값([[대표값,평균값,중앙값,최빈값]])



분포의 양끝 1/4을 제외한 범위
제3사분위수(75% 백분점수)에서 제1사분위수(25% 백분점수)를 뺀 것
Q3 - Q1

장점: 극단적인 값들에 의한 영향을 덜 받음

whisker length(WL) = interquartile range(IQR) * 1.5
whisker 밖에 있으면 outlier. CHK

찾는 법 - CHK
중앙값,median을 찾는다.
중앙값 왼쪽 자료들에서 중앙값을 찾는다.
오른쪽 자료들에서도 중앙값을 찾는다.


AKA 사분위범위[1]