분산과는 달리 0 또는 음수일 수 있음.
기호: (CHK)
분산,variance V(X)
상관계수,correlation_coefficient Corr(X, Y)
한 개의 확률변수에 대한 분산,variance이 σ2 다시 말해 σX2 였으며,
두 개의 확률변수에 대한 공분산의 기호는 σX,Y
(참고) 상관계수,correlation_coefficient의 기호는 ρX,Y
관련:두 개의 확률변수에 대한 공분산의 기호는 σX,Y
(참고) 상관계수,correlation_coefficient의 기호는 ρX,Y
분산,variance V(X)
상관계수,correlation_coefficient Corr(X, Y)
공분산의 정의
x와 y의 공분산을 cxy라 하면
(통계가 빨라지는 수학력)
x와 y의 공분산을 cxy라 하면
(통계가 빨라지는 수학력)
식 모양을 분산과 비교해본다면,
x의 분산
y의 분산
x와 y의 공분산
x의 분산
y의 분산
x와 y의 공분산
// ㄷㄱㄱ Week 9-1 p7
Covariance:
- One simple value to represent the relation between two random variables
- Represent how two random variables vary together
Uncorrelated: When .... // uncorrelated = 상관,correlation이 없는? 암튼 공분산의 값이 영,zero
이것은 두 확률변수의 독립(see 확률변수,random_variable#s-2 and 독립성,independence#s-3)과 밀접. 공분산이 인데 두 확률변수가 독립 iff 이므로, 두 확률변수가 독립이면 그들의 공분산이 0이 되는 것.
이것은 두 확률변수의 독립(see 확률변수,random_variable#s-2 and 독립성,independence#s-3)과 밀접. 공분산이 인데 두 확률변수가 독립 iff 이므로, 두 확률변수가 독립이면 그들의 공분산이 0이 되는 것.
성질들:
이 다음에 다루는 것은 상관계수,correlation_coefficient.
저것은 공분산을 분산,variance으로 scale한 것. (Covariance scaled by variance)
저것의 값은 -1에서 1 사이. (Strictly between -1 and 1)
저것의 식은
이 다음에 다루는 것은 상관계수,correlation_coefficient.
저것은 공분산을 분산,variance으로 scale한 것. (Covariance scaled by variance)
저것의 값은 -1에서 1 사이. (Strictly between -1 and 1)
저것의 식은
확률변수 X, Y에 대해
와 가 존재하면
X와 Y의 공분산은두 확률변수의 관계를 보여주는 값.
확률변수 X, Y가 같이 변하는 정도를 나타내는 값.
확률변수 X, Y에 대해 X가 변할 때 Y가 변하는 정도를 나타내는 값.
의 평균,mean,average으로 정의.
여기서
즉 편차의 곱의 평균으로 정의.
확률변수 X, Y가 같이 변하는 정도를 나타내는 값.
확률변수 X, Y에 대해 X가 변할 때 Y가 변하는 정도를 나타내는 값.
의 평균,mean,average으로 정의.
즉 편차의 곱의 평균으로 정의.
이산확률변수,discrete_random_variable의 공분산:
연속확률변수,continuous_random_variable의 공분산:
기타 다음 식도 성립
X, Y가 서로 독립이면 E(XY)=E(X)E(Y)이다. 이 때,
Cov(X,Y)=E(XY)-E(X)E(Y)=E(X)E(Y)-E(X)E(Y)=0
공분산은 X가 변할 때 Y가 변하는 정도와 관련되는데, X와 Y가 독립이면 값이 0이 나옴을 볼 수 있다.
X, Y가 서로 독립이면 E(XY)=E(X)E(Y)이다. 이 때,
Cov(X,Y)=E(XY)-E(X)E(Y)=E(X)E(Y)-E(X)E(Y)=0
공분산은 X가 변할 때 Y가 변하는 정도와 관련되는데, X와 Y가 독립이면 값이 0이 나옴을 볼 수 있다.
Cov(aX, bY) = a b Cov(X, Y)
Cov(X+a, Y+b) = Cov(X, Y)
Cov(X, aX+b) = a Var(X)
Cov(aX+b, cX+d) = a c Var(X)
공분산의 단점은 '어느 정도' 연관되어 있는지 그 단위/스케일에 대한 것. 강도(strength)를 잘 보여주지 못함. 이것을 개선한 것이 상관계수,correlation_coefficient. (공분산을 표준편차의 곱으로 나눔)
3. 공분산(covariance)과 상관계수(correlation coefficient) ¶
전제:
가 존재할 때
전제:
Note:
from http://www.kocw.net/home/search/kemView.do?kemId=1162312 4장_확률변수와분포_분산
과
가 각각 존재할 때 X와 Y의 상관계수는4. 공분산의 성질 ¶
Var(X) = Cov(X, X)
Cov(X, Y) = Cov(Y, X)
Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y)
Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z)
Cov(X, Y) = Cov(Y, X)
Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y)
Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z)
6. 웹페이지 요약 DELME later.. ¶
from 두산백과
from 수학백과
확률변수 X, Y의 기대값,expected_value을 각각 라 하면 공분산은
공분산=0이면, 상관없다(uncorrelated)
두 확률변수가 독립이면, 공분산은 0이다. 그러나 역은 일반적으로 참이 아니다.
공분산을 각 변수의 표준편차로 나누면 상관계수(Corr(X, Y))
두 확률변수가 독립이면, 공분산은 0이다. 그러나 역은 일반적으로 참이 아니다.
공분산을 각 변수의 표준편차로 나누면 상관계수(Corr(X, Y))
7. 기타 ¶
PL에서 covariance (그리고 contravariance) 에 대해서는 여길 참조 - Covariance_and_contravariance_(computer_science)