開學(xué)還有多遠(yuǎn)?
今天有同學(xué)問我是否有開學(xué)的信息,我回答了不確定,需要等學(xué)校開會(huì)討論。同時(shí),我意識(shí)到這是一個(gè)數(shù)學(xué)問題。我想可以用熵描述開學(xué)的不確定性。假設(shè)開學(xué)的可能性有兩種,分別為開學(xué)和延遲,我們可以理解為這個(gè)事件發(fā)生的有2種結(jié)果,發(fā)生概率都為1/2,用p表示,對(duì)應(yīng)每一種可能攜帶的熵值為
所以學(xué)校開學(xué)的信息熵值就為開學(xué)和延遲兩種結(jié)果的熵值相加,即
此時(shí),在所有可能性的概率相等的時(shí)候,熵值為1,開學(xué)是非常不確定的。
為什么要這樣子計(jì)算呢?
我們整理一下開學(xué)事件的時(shí)間線。
2月16日,有同學(xué)問我如期開學(xué)的可能性,我說已經(jīng)通知延遲,因?yàn)榻Y(jié)果只有一種確定延遲,所以開學(xué)的不確定性為0。
3月1日,有同學(xué)問我3月6日開學(xué)的可能性,我說未收到通知,很可能是繼續(xù)延遲,這時(shí)候這個(gè)事件的形勢(shì)發(fā)生了變化,結(jié)果變成了2種,開學(xué)的可能性較小,我假設(shè)為0.1,而延遲的可能性較大,就為。
開學(xué)的概率 = 0.1
延遲的概率 = 1- 開學(xué)的概率 = 0.9
雖然延遲的可能性仍然很大,但相比于2月16日,開學(xué)事件的結(jié)果已經(jīng)產(chǎn)生了不確定性。
我們仔細(xì)考慮這兩種結(jié)果,開學(xué)的可能性為0.1,如果3月6日開學(xué),就使一個(gè)小概率的事件成真,與此同時(shí),就意味著其他的結(jié)果都為假了,這里就意味著事件的概率越低,所攜帶的信息量越大,我們使用倒數(shù)來描述這一現(xiàn)象,開學(xué)的可能性為0.1,也就意味著這個(gè)結(jié)果攜帶的信息為 ;同時(shí),延遲的可能性為0.9,意味著延遲攜帶的信息為
。
開學(xué)所攜帶的信息 = 1/0.1
延遲所攜帶的信息 = 1/0.9
數(shù)學(xué)家香農(nóng)Shannon認(rèn)為信息量應(yīng)該使用底數(shù)為2的log函數(shù)描述這一現(xiàn)象,所以開學(xué)和延遲攜帶的信息就分別為和
。
開學(xué)所攜帶的信息 = log2(1/0.1)
延遲所攜帶的信息 = log2(1/0.9)
此時(shí)我們將這些信息綜合,開學(xué)的概率和攜帶的信息量相乘構(gòu)成了開學(xué)這一結(jié)果的不確定性,同理計(jì)算出延遲的不確定性,相加得到即3月1日的開學(xué)事件的熵值為0.4690,相比與2月16日,開學(xué)的不確定性上升了,雖然延遲的可能性很大,但開學(xué)的可能性已經(jīng)出現(xiàn)。
開學(xué)的熵 = 1/10 * log2(1/(1/10))
延遲的熵 = 9/10 * log2(1/(9/10))
3月1日的開學(xué)事件的熵 = 開學(xué)的熵 + 延遲的熵 = 0.4690
3月1日后,每5天就有一位同學(xué)問我下一周開學(xué)的可能性,我根據(jù)每天匯總到的信息計(jì)算出每次詢問時(shí)候開學(xué)和延遲的可能性,如下表所示
| 日期 | 開學(xué)概率 | 延遲概率 | 熵 |
|---|---|---|---|
| 3月6日 | 0.3 | 0.7 | 0.8813 |
| 3月11日 | 0.5 | 0.5 | 1.0000 |
| 3月16日 | 0.8 | 0.2 | 0.7219 |
近期學(xué)校通知教師3月16日上班準(zhǔn)備開學(xué)事宜,雖然具體的開學(xué)日期沒有通知,但這一信號(hào)大大提高了開學(xué)的可能性,一種結(jié)果的可能性增加意味著總體的不確定性降低了,熵也相較于3月11時(shí)候低。
- 我們這里所使用的計(jì)算公式就來自于熵值的計(jì)算公式。
- 熵是用來描述無序性的,也可以用來描述不確定性。
- 隨著工作逐漸恢復(fù)正常,開學(xué)的日期也會(huì)明確,也就意味著這一事件的不確定性會(huì)降低,即熵值會(huì)下降。