什么是信息熵、條件熵和信息增益

信息增益描述了一個特征帶來的信息量的多少,往往用于特征選擇

信息增益 = 信息熵 - 條件熵

一個特征往往會使一個隨機變量Y的信息量減少,減少的部分就是信息增益

一個例子

如圖所示,目標(biāo)值是:playtennis,也就是是否打球

有四個特征:天氣、溫度、濕度、風(fēng)

信息熵

信息熵的公式:

H(X)=?∑i=1np(xi)logp(xi)

以上圖為例,設(shè)是否打球這一隨機變量為Y,則

p(y=yes)=514

p(y=no)=914

所以H(Y)=?514?log(514)?914?log(914)=0.6518

條件熵

條件熵表示在條件X下Y的信息熵。公式如下:

H(Y|X)=∑x∈Xp(x)H(Y|X=x)

在上圖的例子中,設(shè)humidity濕度為隨機變量X

則,p(x=high)=7/14=1/2=p1

p(x=normal)=7/14=1/2=p2

所以,H(Y|X)=p1*H(Y|X=high)+p2*H(Y|X=normal)

而接下來就是計算H(Y|X=high)和H(Y|X=normal)

根據(jù)信息熵的計算方法可以得出:

H(Y|X=high)=-4/7*log(4/7)-3/7*log(3/7) = 0.6829

H(Y|X=normal)=-1/7*log(1/7)-6/7*log(6/7) = 0.4101

因此,條件熵為:1/2*0.6829+1/2*0.4101=0.5465

信息增益

信息增益 = 信息熵 - 條件熵=0.6518-0.5465=0.1053

也就是說,引入了濕度humidity這個變量之后,就使得是否打球這個變量的信息量就從0.6518減小到了0.5465

信息量是描述變量的不確定性的,值越大,就表示這個事件越不確定

因此,濕度這個變量的引進,使得這種不確定性降低了,有利于做決定

信息增益常用于決策樹的構(gòu)建,和特征選擇

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 請聽題:什么是熵?什么是交叉熵?什么是聯(lián)合熵?什么是條件熵?什么是相對熵?它們的聯(lián)系與區(qū)別是什么? 如果你感到回答...
    工程師milter閱讀 12,416評論 5 57
  • 保留初心,砥礪前行 這一章節(jié)講解的是關(guān)于信息的某些度量。 我們常常說信息很多,或者信息較少,但卻很難說清楚信息到底...
    加勒比海鮮王閱讀 1,410評論 2 15
  • 熵通常被認為描述一個系統(tǒng)或者分布的不確定性,熵越大,系統(tǒng)越混亂,不確定性越大。機器學(xué)習(xí)與數(shù)據(jù)挖掘的算法中大量的應(yīng)用...
    sylvainwang閱讀 4,545評論 0 50
  • 喜歡浪漫和奔放的人群基礎(chǔ)一定是厚實的。根據(jù)現(xiàn)有定論,楚辭開浪漫之先風(fēng),所以不喜歡楚辭是有些武斷了。 或許有很多的人...
    昏塵居士閱讀 219評論 2 1
  • 一 秋來了,感覺離你也近了。 一色青,一色黃,歲月便在季節(jié)的更替里漸漸蒼老了起來。 你曾說,若你老了,就拿出那些沾...
    言禾雨閱讀 1,959評論 29 40

友情鏈接更多精彩內(nèi)容