AKA 유사성, 닮음, 닮음 정도, 비슷함, similarity measure, 유사성 측도
아무래도 같은 영단어 similarity similarity를
- 유사성 - 유사성 유사성,similarity - 성질,property
- 유사도 - 유사도 유사도,similarity - 측도,measure, 양,quantity, 거리,distance에 비유되는. i.e. 유사성 측도
- 혹은 한 페이지를 닮음으로 처리
단어/표현
dissimilarity 비유사도
resemblance 라는 표현도 보이는데 (단어 뜻은 비슷함, 뉘앙스차이?)
분류,classification(/그룹화grouping/군집화/클러스터링clustering)의 중요한 주제. 서로 (유사한/닮은) 것을 묶어야/뭉쳐야 하므로.
그래서 비지도학습,unsupervised_learning에 쓰임.
dissimilarity 비유사도
resemblance 라는 표현도 보이는데 (단어 뜻은 비슷함, 뉘앙스차이?)
분류,classification(/그룹화grouping/군집화/클러스터링clustering)의 중요한 주제. 서로 (유사한/닮은) 것을 묶어야/뭉쳐야 하므로.
그래서 비지도학습,unsupervised_learning에 쓰임.
종류 ¶
코사인유사도,cosine_similarity or 코사인닮음,cosine_similarity?
{
두 벡터,vector의 사이각,angle을 가지고 유사도,similarity를 측정하는 방법의 하나.
{
두 벡터,vector의 사이각,angle을 가지고 유사도,similarity를 측정하는 방법의 하나.
//tmp; chk; from wpko
{
//첫문단
내적,inner_product이 정의되는 내적공간,inner_product_space에서 정의되며, 두 벡터,vector 사이 각,angle의 코사인,cosine값을 사용.
* 완전히 같으면 1,
* 직교(rel. 직교성,orthogonality)하면 0,
* 완전히 반대이면, −1.
벡터의 크기(magnitude?)와 무관.
특히 결과가 로 떨어질 때 사용 //...왜 그런지 설명이 부족
}
{
//첫문단
내적,inner_product이 정의되는 내적공간,inner_product_space에서 정의되며, 두 벡터,vector 사이 각,angle의 코사인,cosine값을 사용.
* 완전히 같으면 1,
* 직교(rel. 직교성,orthogonality)하면 0,
* 완전히 반대이면, −1.
벡터의 크기(magnitude?)와 무관.
특히 결과가 로 떨어질 때 사용 //...왜 그런지 설명이 부족
}
영벡터가 아닌 두 벡터 가 이루는 각의 크기가 일 경우
AI에서 특성벡터( 특징벡터 feature_vector)는 일반적으로 음수값을 성분으로 설정하지 않으므로 코사인 유사도는 최대 1, 최소 0 값.
0이면 완전히 다르다.
0에 가까울수록 연관성이 떨어진다.
1에 가까울수록 비슷하다.
1이면 완전히 같다.
0이면 완전히 다르다.
0에 가까울수록 연관성이 떨어진다.
1에 가까울수록 비슷하다.
1이면 완전히 같다.
// tmp from 이상엽 https://youtu.be/DmOdYauHdK0?t=489
그리고 이어서 유클리디안 유사도
근데 euclidean similarity보면 영어로는 Euclidean similarity라기 보단 그냥 Euclidean distance라고 하는 듯. 그리고 Euclidean distance vs cosine similarity 둘이 비교되는 글 자주 보임
근데 euclidean similarity보면 영어로는 Euclidean similarity라기 보단 그냥 Euclidean distance라고 하는 듯. 그리고 Euclidean distance vs cosine similarity 둘이 비교되는 글 자주 보임
벡터 가 있을 때, 그 코사인 유사도는
말하고자 하는 바는 '방향,direction이 얼마나 비슷한가' 이며,
완전히 같다면 1,
완전히 반대라면 -1이다.
from https://wikidocs.net/74690 CHK (여기선 이렇게 단위벡터,unit_vector의 내적,inner_product를 씀)
완전히 같다면 1,
완전히 반대라면 -1이다.
from https://wikidocs.net/74690 CHK (여기선 이렇게 단위벡터,unit_vector의 내적,inner_product를 씀)
mklink
내적,inner_product
노름,norm
군집/클러스터/,cluster
상관,correlation
코사인거리,cosine_distance = 코사인유사도,cosine_similarity − 1
내적,inner_product
노름,norm
군집/클러스터/,cluster
상관,correlation
코사인거리,cosine_distance = 코사인유사도,cosine_similarity − 1
상관계수 (숫자 쌍의 유사도)
상관함수 (함수의 유사도)
Sørensen–Dice_coefficient
(아래는 거리,distance 항목 참조)
레벤슈타인 거리 - 레벤슈타인_거리,Levenshtein_distance
해밍 거리 - 해밍_거리,Hamming_distance
유클리드 거리 - Euclid_distance or Euclidean_distance ... 가장 흔한? 기본적? 거리이므로 see 거리,distance
마할라노비스 거리 - Mahalanobis_distance - writing
자카드 거리 - distance 대신 index 표현도 많이 쓰임 ... Jaccard_index ///저위쪽에 언급. Jaccard 검색.
Bhattacharyya_distance - writing
Hellinger_distance - writing
상관함수 (함수의 유사도)
교차상관함수 - chk; maybe related: 상호상관,cross-correlation
자기상관함수 - chk; maybe related: 자기상관,autocorrelation
Later 상관함수,correlation_function
상관,correlation 함수,function
자카드 계수 Jaccard coefficient = 자카드 유사도 Jaccard similarity = 자카드 지수 Jaccard index = Jaccard similarity coefficient자기상관함수 - chk; maybe related: 자기상관,autocorrelation
Later 상관함수,correlation_function
상관,correlation 함수,function
자카드_지수
Jaccard_index
자카드_유사도
관련: 자카드 거리 Jaccard distance
(,index or 지수,index or 인덱스,index) or 계수,coefficient
Sørensen–Dice_계수Jaccard_index
자카드_유사도
관련: 자카드 거리 Jaccard distance
(,index or 지수,index or 인덱스,index) or 계수,coefficient
Sørensen–Dice_coefficient
(아래는 거리,distance 항목 참조)
레벤슈타인 거리 - 레벤슈타인_거리,Levenshtein_distance
해밍 거리 - 해밍_거리,Hamming_distance
유클리드 거리 - Euclid_distance or Euclidean_distance ... 가장 흔한? 기본적? 거리이므로 see 거리,distance
마할라노비스 거리 - Mahalanobis_distance - writing
자카드 거리 - distance 대신 index 표현도 많이 쓰임 ... Jaccard_index ///저위쪽에 언급. Jaccard 검색.
Bhattacharyya_distance - writing
Hellinger_distance - writing
NLP에서 문서,document의 유사도 ... document_similarity ?
document similarity ? document similarity
문서 유사도 측정 · ratsgo's blog
https://ratsgo.github.io/from frequency to semantics/2017/04/20/docsim/
Up: 문서,document 유사도,similarity
document similarity ? document similarity
문서 유사도 측정 · ratsgo's blog
https://ratsgo.github.io/from frequency to semantics/2017/04/20/docsim/
Up: 문서,document 유사도,similarity
관련 ¶
거리,distance와 밀접.
상관,correlation
거리,distance 및
차이,difference 및
dissimilarity?
{
비유사도 ?
안닮음도 ? 안닮은정도 ?
상관,correlation
Q: 상당히 유사한 개념 같은데 뉘앙스 차이는 어떻게 되는지?
반대개념은거리,distance 및
차이,difference 및
dissimilarity?
{
비유사도 ?
안닮음도 ? 안닮은정도 ?
http://www.ktword.co.kr/test/view/view.php?m_temp1=4900 - dissimilarity 에 대해 '차이점/부동성(不同性)' 및 거리 언급
기타 - 다른 곳에서의 '유사', 'simil-', 닮음, 등등 ¶
기하학,geometry이나 선형대수에서 행렬,matrix의 닮음,similarity
닮음행렬,similar_matrix { Compare: similarity_matrix ... Twins: https://mathworld.wolfram.com/SimilarMatrices.html }
matrix_similarity
프랙탈,fractal에서... 자기유사성 self similarity ... pagename 자기유사성,self-similarity?matrix_similarity
{
matrix similarity
행렬의_닮음
Matrix_similarity
rel. Jordan_normal_form or Jordan_canonical_form (JCF) - Jordan_normal_form 조르당_표준형
} // matrix similarity ... matrix.similarity
matrix similarity
행렬의_닮음
Matrix_similarity
rel. Jordan_normal_form or Jordan_canonical_form (JCF) - Jordan_normal_form 조르당_표준형
} // matrix similarity ... matrix.similarity
similarity_matrix, group_similarity, cluster_similarity
{
via http://networksciencebook.com/chapter/9#hierarchical Section 9.3
{
via http://networksciencebook.com/chapter/9#hierarchical Section 9.3
같은 영단어 similarity의 한국어 단어 선택에 대해. #wikiadmin #pagename
뜻은 multiple objects 사이 관계,relation에 대한 것인데 사전을 보면
similarity
similarity
일단 번역은 둘 중 하나이면 OK: { 유사, 닮음 }, kms도 그렇고(similarity) (가끔 '상사'라는 표현 보임) 다만,
후자는 더 추상적인 닮음이라는 성질 자체에 대한 것. (성질,property, abstract concept, 관계,relation)
ex. cosine_similarity는 코사인 유사성보다는 코사인 유사도가 적합한 표현.
아무튼 유사성,similarity페이지 or 분류를 만드는 편이 좋겠으며, 기하학,geometry에서 말하는 similarity도 위 '유사성, 유사도'와 깊은 유사성은 있지만 구체적으로는 전혀 다른 서술이 필요한 개념이라 (크기,size는 다를 수 있고 shape는 완벽히 같은) (즉 기하의 similarity는 Compare: congruence) (도형 닮음 합동 얘기.) - 보니 이미 옛날에 geometry page line #5에 닮음,similarity 합동,congruence이 이미 링크되어 있었다.
뜻은 multiple objects 사이 관계,relation에 대한 것인데 사전을 보면
similarity
similarity
일단 번역은 둘 중 하나이면 OK: { 유사, 닮음 }, kms도 그렇고(similarity) (가끔 '상사'라는 표현 보임) 다만,
- 유사도,similarity: 그러한 정도, magnitude, 측도,measure. // 닮은정도 닮음정도 닮음도?
- 유사성,similarity: 그러한 속성, 특성, 성질. // 닮음성 ?
- ....그 외에 유사점/닮은 점/공유하는 성질(shared properties)라는 뜻도 있고 등등.. (위 wten의 경우 2. (philosophy)에서의 뜻)
후자는 더 추상적인 닮음이라는 성질 자체에 대한 것. (성질,property, abstract concept, 관계,relation)
ex. cosine_similarity는 코사인 유사성보다는 코사인 유사도가 적합한 표현.
아무튼 유사성,similarity페이지 or 분류를 만드는 편이 좋겠으며, 기하학,geometry에서 말하는 similarity도 위 '유사성, 유사도'와 깊은 유사성은 있지만 구체적으로는 전혀 다른 서술이 필요한 개념이라 (크기,size는 다를 수 있고 shape는 완벽히 같은) (즉 기하의 similarity는 Compare: congruence) (도형 닮음 합동 얘기.) - 보니 이미 옛날에 geometry page line #5에 닮음,similarity 합동,congruence이 이미 링크되어 있었다.
Twins:
Similarity_measure similarity measure or similarity function
Category:Similarity_measures
유사도
Similarity_measure similarity measure or similarity function
Category:Similarity_measures
유사도