자료는 scatterplot으로 표시할 수 있는데 이것을 회귀분석regression analysis을 통해 경향(trend)를 반영하는
곡선,curve 즉 회귀곡선regression curve을 찾는다. 보통 사용되는 방법은
least squares. (minimizing the sum of the squares of the vertical distances between the data points and the curve) (AKA
optimization problem)
1. 회귀분석 regression analysis ¶
Twins:
두산백과(https://terms.naver.com/entry.nhn?docId=3404410&cid=40942&categoryId=32211)
다중공선성
"독립변수들간에 정확한 선형관계가 존재하는 완전공선성의 경우와 독립변수들간에 높은 선형관계가 존재하는 다중공선성으로 구분하기도 한다."
Multicollinearity
}
해결법은 PLS회귀와 L1정규화(Lasso)등이 있다.
다항식 회귀의 경우 차수를 무조건 많이 올린다고 해서 좋은 게 아니다. 이미 주어진 데이터에는 잔차가 0으로 근접하는 결과가 나올 수 있지만 앞으로 수집할 데이터가 크게 벗어날 수 있다. 이것을
과적합,overfitting이라고 한다.
로지스틱 모델의 일반식
로짓 함수(logit)는
로 변환하는 함수로, 로지스틱 함수의 역함수
4. 가중 회귀분석 ¶
p.105
최소제곱법은 특잇값(singular value)에 취약하다는 약점이 있다.
regression with polynomial basis
7. 영단어 regression의 다른 뜻 (통계 밖) ¶
7.1. software development ¶
8. 참조한 서적 ¶
다다 사토시, 처음 배우는 인공지능, 한빛미디어