이진분류,binary_classification

(plot했을 때? 공간에서?) 두 class를 구분하는(즉 분류하는) 기준이 되는 선(곡선? 직선?) 은 결정경계,decision_boundary라고 한다.

qqq
직선으로 구분(seperation) 가능하면 linearly separable case - 이땐 비교적 간단
직선으로 불가능하고 곡선으로만 가능하면 non-lineary separable case ? - 이땐 고차원 공간으로 가야?
결정경계 찾는데 회귀,regression 사용??

tmp from WpKo:정밀도와_재현율

이진분류기법(eg. 패턴인식,pattern_recognition, 정보검색(information retrieval) 등 분야)엔 정밀도와 재현율 개념이 있다.
정밀도,precision 검색결과중 관련있는 것으로 분류된 것의 비율 retrieved중에서 relevant의 비율
재현율,recall 관련있는 것 중 실제로 검색된 것의 비율 relevant중에서 retrieved의 비율
// 그림(venn diagram?), 표 (false/true positive/negative) 필요함. { 표에 type 1 / type 2 error 포함되어 있음. ... curr see 오류,error } 이것은 따라서 그림 때문에 나중에......
재현율은 sensitivity라고도 한다.
정밀도는 positive predictive value(PPV)라고도 한다.
통계적 분류에서 사용되는 다른 기준으로, true negative rate(specificity)와 정확도,accuracy 등이 있다.


See also:
혼동행렬,confusion_matrix
ROC곡선,ROC_curve은 이진분류기의 성능을 표현해 줌.