각각
제2 사분위수는 중앙값,median과 같다.
제1사분위수, ..., 제4사분위수 =
Q1, Q2, Q3, Q4
누적 백분율: 25%, 50%, 75%, 100%
즉,Q1, Q2, Q3, Q4
누적 백분율: 25%, 50%, 75%, 100%
1사분위수 = 25백분위수,
2사분위수 = 50백분위수 = 중앙값,
3사분위수 = 75백분위수
표로 다시 쓰면,2사분위수 = 50백분위수 = 중앙값,
3사분위수 = 75백분위수
제1사분위수 | 제2사분위수 | 제3사분위수 | 제4사분위수 | |
Q1 | Q2 | Q3 | Q4 | |
누적 백분율: | 25% | 50% | 75% | 100% |
25백분위수 | 50백분위수 | 75백분위수 |
제2 사분위수는 중앙값,median과 같다.
25 백분위수 | 제1 사분위수 | Q1 | first quartile |
50 백분위수 | 제2 사분위수 | Q2 | second quartile |
75 백분위수 | 제3 사분위수 | Q3 | third quartile |
데이터 개수가 짝수인 경우,
제1사분위수: 아래쪽 절반의 중앙값
제2사분위수: 전체의 중앙값
제3사분위수: 위쪽 절반의 중앙값
데이터 개수가 홀수인 경우,제2사분위수: 전체의 중앙값
제3사분위수: 위쪽 절반의 중앙값
제1사분위수: 중앙값을 제외한 아래쪽 절반의 중앙값
제2사분위수: 전체의 중앙값
제3사분위수: 중앙값을 제외한 위쪽 절반의 중앙값
위 아래(Q0, Q4)까지 포함해 5줄로 적으면, (저건 quartile에 포함시키지 않는 것 같은데 아무튼...) → (2024-04) 이걸 5가지_요약_수치 Five-number_summary이라 한다.제2사분위수: 전체의 중앙값
제3사분위수: 중앙값을 제외한 위쪽 절반의 중앙값
Q0 | 0th quartile | minimum? lower extreme? CHK → sample minimum (smallest observation) |
Q1 | 1st quartile | = lower quartile |
Q2 | 2nd quartile | = median |
Q3 | 3rd quartile | = upper quartile |
Q4 | 4th quartile | maximum? upper extreme? CHK → sample maximum (largest observation) |
IQR = (upper quartile) − (lower quartile) = Q3 − Q1
R의 함수:
quantile(data)는 사분위수를 모두 보여줌
quantile(data, 0.05)는 5백분위수를 돌려줌
NumPy:quantile(data, 0.05)는 5백분위수를 돌려줌
np.percentile(x, 25) # Q1을 돌려줌
CHK:
최소값 - 제1사분위수 - 제2사분위수 - 제3사분위수 - 최대값
이 사이 각 구획에는 데이터의 약 25%씩이 포함
다섯 개 가운데 3개만 분위수, 양옆 최소값,minimum_value 최대값,maximum_value (최대최소,maximum_and_minimum?)는 분위수에 포함하지 않음
k분위수이면 k-1개의 값이 있음
최소값 - 제1사분위수 - 제2사분위수 - 제3사분위수 - 최대값
이 사이 각 구획에는 데이터의 약 25%씩이 포함
다섯 개 가운데 3개만 분위수, 양옆 최소값,minimum_value 최대값,maximum_value (최대최소,maximum_and_minimum?)는 분위수에 포함하지 않음
0사분위수, 4사분위수 같은 표현도 가능할텐데 ...
여기 이건 4분위수이므로 3개의 값이 있음,k분위수이면 k-1개의 값이 있음
Compare: 백분위수,percentile
//wpen
확률분포,probability_distribution의 Range_(statistics)를 연속적인 구간으로 나눈.. 근데 그 기준은 같은 확률, 혹은 표본,sample 안의 Observation_(statistics)을 같은 방식으로 나눈...
확률분포,probability_distribution의 Range_(statistics)를 연속적인 구간으로 나눈.. 근데 그 기준은 같은 확률, 혹은 표본,sample 안의 Observation_(statistics)을 같은 방식으로 나눈...
유일한 2-quantile = 중앙값,median
4 groups: 4-quantile = 사분위수,quartile
4 groups: octile
10 groups: decile
100 groups: 100-quantile = 백분위수,percentile
4 groups: 4-quantile = 사분위수,quartile
4 groups: octile
10 groups: decile
100 groups: 100-quantile = 백분위수,percentile
}