ko	en	기호/링크
정보 엔트로피 =Shannon 엔트로피?	entropy	H
주변엔트로피	marginal entropy	H(X)
결합엔트로피	joint entropy	H(X,Y)
조건부엔트로피	conditional entropy	H(X\|Y)
교차엔트로피 크로스엔트로피	cross-entropy	H(X,Y) CHK
	transfer entropy
미분엔트로피	differential entropy
상대? 상대적?	relative entropy = KL-divergence = KLD	D_KL(XǁY)=H(X,Y)-H(X) CHK

Sub:

결합엔트로피,joint_entropy
조건부엔트로피,conditional_entropy
교차엔트로피,cross_entropy
상대엔트로피,relative_entropy
미분엔트로피,differential_entropy

미분,differential과?

binary_entropy_function

[edit]

1.1. 설명/정의 ¶

Measure of information in terms of uncertainty.

기호: $H$

정의

$H=\sum_{i=1}^{n} p_i \log_2\left(\frac{1}{p_i}\right)$
$=-\sum_{i=1}^{n} p_i \log_2(p_i)$

(Khan Academy)

The entropy of a random variable $X$ with a 확률질량함수,probability_mass_function,PMF $p(x)$ is defined by

$H(X)=-\sum_x p(x)\log_2 p(x)$

(밑을 2로 하면 단위는 bit)
The entropy is a measure of the average uncertainty in the random variable. It is the number of bits on average required to describe the random variable.
(Cover Thomas p5)

엔트로피는 확률변수,random_variable의 불확실성,uncertainty의 측도,measure이다.

$X$ : 이산확률변수,discrete_random_variable with 알파벳,alphabet $\mathcal{X}$ and 확률질량함수,probability_mass_function,PMF $p(x)=\mathrm{Pr}\lbrace X=x\rbrace,\,x\in\mathcal{X}.$
편의상 PMF는 $p_X(x),p_Y(y)$ 대신 각각 $p(x),p(y)$ 로 표기.

(정의) 이산확률변수 $X$ 의 엔트로피

$H(X)=-\sum_{x\in\mathcal{X}}p(x)\log p(x)$

$H(p)$ 라고도 쓴다.
$0\log 0=0$ 관례를 쓴다. $(x\to 0\Rightarrow x\log x\to 0)$
로그의 밑이 $b$ 이면, 엔트로피를 $H_b(X)$ 로 나타낸다.
Note: 엔트로피는 $X$ 의 분포(see 확률분포,probability_distribution)의 범함수,functional이다. It does not depend on the actual values taken by the random variable $X,$ but only on the probabilities.

기대값(expectation, see 기대값,expected_value)을 $E$ 로 나타낸다. $X\sim p(x)$ 이면, 확률변수 $g(X)$ 의 기대값은

$E_p g(X)=\sum_{x\in\mathcal{X}}g(x)p(x)$

또는 pmf를 문맥에서 예측할 수 있으면 그냥 $Eg(X)$ 로 쓴다.

(Remark) $X$ 의 엔트로피는 확률변수 $\log\frac1{p(X)}$ 의 기대값으로 해석할 수도 있다. ( where $X$ is drawn according to pmf $p(x)$ )

$H(X)=E_p\log\frac{1}{p(X)}$

(Lemma) $H(X)\ge 0$ 이다.
(Proof) $0\le p(x)\le 1$ 이므로 $\log\frac1{p(x)}\ge 0$

(Lemma) $H_b(X)=(\log_b a)H_a(X)$
(Proof) $\log_b p=\log_b a \log_a p$

(Cover Thomas p13 2.1 Entropy)

Shannon entropy

모든 사건 정보량의 기대값(?)
전체 사건,event의 확률분포,probability_distribution의 불확실성,uncertainty의 양을 수치화할 때 사용

수식:

$H(x)=-\sum_x p(x)\log_2 p(x)$

해석:

사건의 확률분포가 균일할수록, 불확실성의 정도가 커지므로, 정보량 즉 엔트로피가 높다.

(From

https://data.korea.ac.kr/?p=5453)

tmp from https://untitledtblog.tistory.com/119
{
전체 데이터의 길이가 $L$ 이고, 기호 $s_i$ 로 이루어졌고, 데이터에서 어떤 기호 $s_i$ 가 등장하는 횟수가 $m_i$ 일 때, 어떤 기호가 등장할 확률,probability은

$p_i=\frac{m_i}{L}$

어떤 기호의 정보량(goto 정보,information)은

$I(s_i)=\log_2\frac{1}{p_i}=-\log_2p_i$

엔트로피는

$H=\sum_i p_i I(s_i)=-\sum_i p_i \log_2 p_i$

}

https://hyeongminlee.github.io/post/prob001_information_theory/
엔트로피에 이어 부호화,coding 설명

tmp from https://seing.tistory.com/43
{
확률분포,probability_distribution $P$ 를 갖는
섀넌 엔트로피 $H(P)$ 는,
전체 사건,event의 확률분포의 불확실성,uncertainty의 양을 나타내며,
모든 사건 정보량의 기대값,expected_value을 뜻한다.

수식으로 나타내면,

$H(P)=H(x)=E_{X\sim P}[I(X)]=-E_{X\sim P}[\log P(x)]$
$H(X)=-\sum_{k=1}^{K} p(X=k)\log p(X=k)$

동전던지기 같은 binary 경우를 생각했을 때(베르누이_시행,Bernoulli_trial)
만약 $P(X=1)=p$ 이면 $P(X=0)=1-p$ 이고
$X$ 의 엔트로피는

$H(X)=-p\log_2 p-(1-p)\log_2(1-p)$

앞면이 나오는 경우 50%의 확률 $P(X=1)=0.5$
뒷면이 나오는 경우 50%의 확률 $P(X=0)=0.5$
따라서 동전던지기의 엔트로피는

$-[p(X=0)\log_2 p(X=0)+p(X=1)\log_2 p(X=1)]$
$=-[0.5\log_2 0.5 + 0.5 \log_2 0.5]$
$=-[(0.5\times -1)\times 2]$
$=1$

Binary entropy function:

// binary_entropy_function
}

(2021-07-15)

정보 엔트로피 = 섀넌 엔트로피 = 평균 정보량.
이산확률변수,discrete_random_variable $X$ 의 표본공간,sample_space이 $\lbrace x_1,\cdots,x_n\rbrace$ 일 때 정보 엔트로피는

$H(X)=E[I(X)]=-\sum_{i=1}^n P(x_i) \log_b(P(x_i))$

from https://angeloyeo.github.io/2020/10/26/information_entropy.html

정보량의 기대값.
사건을 표현하기 위해 요구되는 평균 자원.
i.e.
확률적으로 발생하는 사건,event에 대한 정보량(see 정보,information)의 (평균,mean,average 혹은 기대값,expected_value).

정보의 희소성에 대한 측정값.
불확실성,uncertainty과 같은 개념.

tmp from https://hoya012.github.io/blog/cross_entropy_vs_kl_divergence/
{
특정한 stochastic process에서 생성된 정보의 평균.
정보의 기대값.

$H(X)=E[I(X)]=E[-\log(P(X))]=-\sum_{i=1}^{n} P(x_i)\log P(x_i)$

}

tmp from https://blog.naver.com/towo222/222295696840
{
여러 사건이 각각 발생 확률이 같을 때, 가장 값이 커짐.
H(p)>0

확률질량함수,probability_mass_function,PMF $P[i]$ 와 확률밀도함수,probability_density_function,PDF $p(x)$ 에 대해
$H(P)=-\sum_i P[i] \log P[i]$
$H(p)=-\int_{-\infty}^{\infty} p(x) \log p(x)dx$
}

tmp from https://kyoko0825.tistory.com/entry/이론-Entropy
{
무작위 사건의 결과, 또는 확률변수에 대한 불확실성을 포함하는 정보의 양.
엔트로피 높음 : 불확실성 커짐
엔트로피 작음 : 불확실성 작음
}

정보, 엔트로피, KLD 설명
https://icim.nims.re.kr/post/easyMath/550

[edit]

1.2. 관련/관계? ¶

Related:
정보,information esp 정보량
자료,data
통신,communication
정보압축(data compression)

다음은 엔트로피와 비교/비유됨, 관계 정확히 서술 TBW

답을 알기까지 필요한 질문의 수
unpredictability 예측불가능성 ... 즉 예측가능하면, 너무 뻔하면 vs 드물면 or 예측이 불가능하면, ... // 예측,prediction
uncertainty 불확실성
disorder 무질서
= 비손실 정보 압축의 한계?

[edit]

1.3. 엔트로피의 고저, 상한/하한 ¶

엔트로피가 낮다	엔트로피가 높다
예측하기 쉬움	예측하기 어려움
확실한 정보	놀라운 정보

$0 \le H(m) \le \log_2 M$ (M,m이 뭔지 명확히)
엔트로피 하한값(최소) : $H(m)=0$

모든 심볼 중 하나의 발생확률이 1이고 나머지 발생확률이 0
불확실성이 없음

엔트로피 상한값(최대) : $H(m)=\log_2 M$

모든 심볼이 동일한 발생확률
불확실성이 최대

from

ktword 엔트로피(http://www.ktword.co.kr/abbr_view.php?nav=&m_temp1=649&id=781)

surprise	entropy
minimum surprise	0

[edit]

1.4. 여러 엔트로피 ¶

marginal entropy

$H(X),\,H(Y)$

conditional entropy

$H(X|Y),\,H(Y|X)$
조건부엔트로피,conditional_entropy

joint entropy

$H(X,Y)$
결합엔트로피,joint_entropy

cross entropy

$H(p,q)$
교차엔트로피,cross_entropy

differential entropy

Differential_entropy
미분엔트로피,differential_entropy

relative entropy = KL divergence = KL-divergence = KLD

$D_{\rm KL}(P\mid\mid Q)$
상대엔트로피,relative_entropy

[edit]

1.5. 결합엔트로피와 조건부엔트로피 (joint and conditional) ¶

https://datascienceschool.net/02 mathematics/10.02 조건부엔트로피.html
https://howardhowonyu.github.io/2020/03/10/TIL-mathematics-2020-03-10-entropy/
http://www.ktword.co.kr/abbr_view.php?m_temp1=1498
https://bskyvision.com/604

[edit]

1.6. 결합엔트로피 joint entropy ¶

H(X,Y)
결합엔트로피,joint_entropy

joint_entropy

[edit]

1.7. 조건부 엔트로피 conditional entropy ¶

H(X|Y)
조건부엔트로피,conditional_entropy

[edit]

1.8. (비교 : 교차엔트로피 and 상대엔트로피 / cross entropy and relative entropy) ¶

교차엔트로피,cross_entropy와 상대엔트로피,relative_entropy는 함께 설명되는 일이 잦음.

https://hoya012.github.io/blog/cross_entropy_vs_kl_divergence/
https://angeloyeo.github.io/2020/10/27/KL_divergence.html

[edit]

1.9. 교차엔트로피 크로스엔트로피 cross-entropy ¶

H(p,q)
교차엔트로피,cross_entropy - writing

[edit]

1.10. 상대엔트로피 relative entropy = Kullback-Leibler divergence = KL-divergence = KLD ¶

상대엔트로피,relative_entropy

두 확률분포,probability_distribution의 유사성(similarity)을 정의하기 위해 쓰이는 방법 중 하나.
Not commutative. (교환법칙,commutativity X)
항상 0 이상.

이산분포 P, Q일 때

$D_{KL}(P\mid\mid Q)=\sum_i P[i]\log\frac{P[i]}{Q[i]}$

연속분포 p, q일 때

$D_{KL}(P\mid\mid Q)=\int_{-\infty}^{\infty}p(x)\log\frac{p(x)}{q(x)}dx$

tmp bmks ko
KLD와 JSD(Jensen-Shannon_divergence)
https://hyeongminlee.github.io/post/prob002_kld_jsd/

// tmp from https://blog.naver.com/towo222/222295696840

https://mathworld.wolfram.com/RelativeEntropy.html

aka Kullback-Leibler distance

http://biohackers.net/wiki/RelativeEntropy

보면 rel. 여유도,redundancy

AI 용어사전: KL-divergence(https://terms.naver.com/entry.naver?docId=6640846&cid=69974&categoryId=69974)

Relative.Entropy

[edit]

1.11. 전송 엔트로피?? transfer entropy ¶

transfer.Entropy

[edit]

1.12. 미분엔트로피 differential entropy ¶

https://mathworld.wolfram.com/DifferentialEntropy.html
https://encyclopediaofmath.org/wiki/Differential_entropy

differential.Entropy

[edit]

1.13. Kolmogorov Entropy, metric entropy ¶

Kolmogorov entropy, Kolmogorov-Sinai entropy, or KS entropy

https://mathworld.wolfram.com/KolmogorovEntropy.html

metric.Entropy

[edit]

1.14. Topological Entropy ¶

https://mathworld.wolfram.com/TopologicalEntropy.html

topological.Entropy

[edit]

1.15. binary entropy function ¶

Binary_entropy_function
{
표기: $H(p)\textrm{ or }H_b(p)$
엔트로피함수의 특별한 경우.
$p$ 는 실수 확률이며 확률변수가 아님.

확률변수 X가 0, 1 둘 중 하나만 가질 수 있고
$P(X=1)=p,\;P(X=0)=1-p$ 이면
X의 엔트로피(in shannons)는

$H(X)=H_b(p)=-p\log_2 p-(1-p)\log_2(1-p)$

단 $0\log_2 0$ 은 0으로 간주.
}

entropy_function
엔트로피함수,entropy_function?
{
QQQ binary 말고 다른 entropy function이 있다면?

http://biohackers.net/wiki/EntropyFunction
}

[edit]

1.16. 엔트로피의 연쇄법칙 chain rules for entropy ¶

See 연쇄법칙,chain_rule#s-5.1

[edit]

1.17. maximum entropy (probability) distribution ¶

pagename tbd:
maximum_entropy_probability_distribution
or
maximum_entropy_distribution

Twin

Maximum_entropy_probability_distribution

...

maximum entropy distribution
...

최대 엔트로피 분포
...

최대 엔트로피 분포

최대,maximum
엔트로피,entropy
분포,distribution > 확률분포,probability_distribution

[edit]

1.18. (Wikipedia 읽기) ¶

from

Entropy_(information_theory)
{

I	information content
H	entropy

information content (aka surprisal) of an event $E$
는 확률,probability $p(E)$ 와 관계가

$I(E)=-\log_2(p(E))=\log_2(1/p(E))$

확률변수,random_variable $X$
가능한 값 $\lbrace x_1,\cdots,x_n\rbrace$
확률질량함수,probability_mass_function,PMF $P(X)$
일 때,
엔트로피,entropy $H$ 는 이렇게 정의된다.

$H(X)=E[I(X)]=E[-\log(P(X))]$

$E$ : 기대값,expected_value 연산자
$I$ : information content (정보,information)

$H(X)=-\sum_{i=1}^{n}P(x_i)\log_b P(x_i)$

두 사건,event $X,Y$ 이 각각 값 $x_i,y_i$ 를 가질 때, conditional entropy는

$H(X|Y)=-\sum_{i,j}p(x_i,y_j)\log\frac{p(x_i,y_j)}{p(y_j)}$

$p(x_i,y_j)$ 는 $X=x_i$ and $Y=y_j$ 일 확률.

}

............TODO MERGE.........

Entropy_(information_theory) 요약 at 2021-03-24
{
AKA Shannon entropy

확률변수,random_variable의 엔트로피는, the average level of '정보', '놀라움', or '불확실성' inherent in the variable's possible 결과,outcomes.

Given a 이산확률변수,discrete_random_variable $X,$
with possible 결과,outcomes $x_1,\cdots,x_n,$
which occur with 확률,probability $\textrm{P}(x_1),\cdots,\textrm{P}(x_n),$
the entropy of $X$ is formally defined as:

$\textrm{H}(X)=-\sum_{i=1}^{n} \textrm{P}(x_i) \log \textrm{P}(x_i)$

log의 base가

2 : bit, shannon
e : nat
10 : dit, ban, hartley

동등한 다른 정의:
An equivalent definition of entropy is the expected value of the self-information of a variable.

조합론,combinatorics과 관련 있음.
연속확률변수,continuous_random_variable에 대해선

Differential_entropy라는 게 있음.

사건,event $E$ 에 대해, information content (또는 surprisal)은 확률 $p(E)$ 가 증가할수록 감소한다. 수식으로는

$I(E)=-\log_2(p(E))=\log_2(1/p(E))$

주사위 던지기 결과가 동전 던지기 결과보다 엔트로피가 높다. 확률 1/6이 1/2보다 적으므로.

압축,compression된 메시지 has less 여유도,redundancy.
}

[edit]

1.19. Links ko ¶

정보량, 엔트로피(Entropy), 결합 엔트로피(Joint Entropy), 조건부 엔트로피(Conditional Entropy), 상호 정보량(Mutual Information), Transfer Entropy를 정리한 곳
https://mons1220.tistory.com/128

http://incredible.ai/machine-learning/2018/11/08/Entropy/

https://hyunw.kim/blog/2017/10/14/Entropy.html
https://hyunw.kim/blog/2017/10/26/Cross_Entropy.html

로지스틱회귀,logistic_regression의 비용함수,cost_function는 cross entropy 식과 같다. (Cross entropy는 log loss로 불리기도 하는데, 왜냐하면 cross entropy를 최소화하는 것은 log likelihood를 최대화하는 것과 같기 때문.)

https://hyunw.kim/blog/2017/10/27/KL_divergence.html

https://freshrimpsushi.github.io/posts/shannon-entropy/

[edit]

1.19.1. tmp videos ¶

http://t-robotics.blogspot.com/2017/08/26-entropy.html

서울대학교의 모두를 위한 AI 강연 > 정보 엔트로피 Information Entropy
https://tv.naver.com/v/31278524

[edit]

1.20. links en ¶

기초, 글자를 뽑는 것을 예로 들어 설명함
https://medium.com/udacity/shannon-entropy-information-gain-and-picking-balls-from-buckets-5810d35d54b4

[edit]

1.21. Twins (excl. Wikipedia) ¶

http://biohackers.net/wiki/Entropy
https://encyclopediaofmath.org/wiki/Entropy

[edit]

2. 열역학의 엔트로피 ¶

$\Delta S=\frac{Q}{T}$

$\frac1T=\frac{\partial S}{\partial E}$
$\frac1T=\frac{\Delta S}{\Delta Q}$
$\Delta S=\frac{\Delta Q}{T}$

$\Delta G=\Delta H-T\Delta S$

기호 S

영어의 spread(ness)에서 왔다는데...
다른 곳에선 Claude Shannon에서 왔다는데... CHK

The measure of chaos or disorder in a system.
무질서도. - 이건 너무 단순화된 설명이라고 어디서 본 듯 한데..
가역반응에서 교환된 열의 비율.
에너지의 질(quality).

엔트로피가 낮은 에너지는 양질의 에너지
엔트로피가 높으면 질이 낮은 에너지

계의 무질서한 정도를 나타내는 상태함수.

계의 에너지를 분배하는 방법의 수
입자의 운동 자유도,degree_of_freedom 및 입자를 배열하는 방법의 수와 밀접하게 연관된 열역학적 변수
계,system는 더 낮은 엔탈피,enthalpy와 더 높은 엔트로피를 가지려는 경향이 있음
// https://youtu.be/LzNawB4Pbu8 17m

상태(P, V)에 대한 함수이다. S(P, V)

$\Delta S=S(P_f,V_f)-S(P_i,V_i)=\int_{i}^{f}\frac{dQ}{T}$

$S=k\ln\Omega$

S = k_B ln Ω

엔트로피 = 볼츠만_상수,Boltzmann_constant × ln(계의 가능한 상태 수)

단위 J K^-1

2.1. 엔트로피의 변화, 그 세 종류 ¶

엔트로피의 변화가 중요

$\Delta S$

세가지?? CHK. sys=system=계, surr=surroundings=주위, univ=universe=우주.

ΔS_계	$\Delta S_{\rm sys}$
ΔS_주위	$\Delta S_{\rm surr}$
ΔS_우주	$\Delta S_{\rm univ}$

ΔS_계 + ΔS_주위 = ΔS_우주

[edit]

2.2. Links ¶

Entropy Explained, With Sheep
https://aatishb.com/entropy/

Twins

물리학백과: 엔트로피(https://terms.naver.com/entry.naver?docId=4389746&cid=60217&categoryId=60217)
{
이건 열역학적 상태함수,state_function의 일종.
앙상블,ensemble 언급됨.

에너지,energy와의 관계:
어떤 계,system가 가진 에너지는 (사용가능한에너지)와 (사용불가능한에너지)로 구분가능.
(사용가능한에너지)는 그 계가 외부에 일,work을 하는 데 사용될 수 있음.
(사용불가능한에너지)는 존재는 해도 그 계가 외부에 일을 하는 데 사용될 수 없음.
엔트로피는 (사용불가능한에너지)와 관계가 있지만, 에너지는 아님.
엔트로피의 단위는 에너지를 온도로 나눈 J/K. i.e. 에너지와 차원이 다름.

열역학제이법칙에 따르면 엔트로피는 줄어들지 않음.

엔트로피 정의 방법
크게 열역학적 방법과 통계역학적 방법 두 가지.

정의 방법	특성	한계1	한계2
열역학적	역사적으로 먼저	엔트로피의 절대값(절대적인 변화 값???) 정의 불가, 상대적 변화만 정의 가능	열역학적 평형 상태인 계에서만 정의 가능
통계역학적	엄밀하고 근본적	절댓값정의가능하단다.	모든 계에 정의 가능