如何使用R計算香農(nóng)熵?

前言

1.1948 年,香農(nóng)提出了“信息熵”(shāng);

2.信息量的度量就等于不確定性的多少。即:要搞懂一個非常非常不確定(gaoleng)的女孩(或是說我們一無所知的女神),就需要了解大量的信息(喜歡吃啥,衣品,喜歡的偶像)。相反,如果我們對某件事已經(jīng)有了較多的了解(女閨蜜/青梅竹馬的),我們不需要太多的信息就能把它搞清楚。(我盡力了~)

不多說了,自己查資料,直接上重點:


如何用“R”計算基因的香農(nóng)熵?

1.首先,你要有一個基因表達的表:

長這樣:第一列是基因名字,其余列名是樣本的名字,中間是數(shù)據(jù)

2.然后,“手動”把第一列刪去(方便下一步導入到R中)

刪去后的樣子

3. 打開R studio,導入數(shù)據(jù)(cd到數(shù)據(jù)所在的目錄就不說了哈~):

forentropy=read.table("ForEntropy1.txt",header=TRUE,sep="\t",check.names=F,quote="",stringsAsFactors = FALSE)

4.調(diào)動Entropy包,具體參數(shù)請看說明。

library(entropy)

不同熵,用的參數(shù)不一樣

5.發(fā)動“寫輪眼”(for循環(huán)):

因為我的數(shù)據(jù)集有683個基因,所以每一行計算香農(nóng)熵共683次

y=rep(0,683)

for (i in 1:683){ y[i]=entropy(forentropy[i,],method=c("CS"))}

這時候已經(jīng)變成是你想要的數(shù)據(jù)了~

6.輸出數(shù)據(jù):

write.table(y, file ="CS_Entropy.txt", sep =",", row.names =FALSE, col.names =FALSE)

7.整理數(shù)據(jù)笨辦法

就是Excel打開這個香農(nóng)熵值的表格,復制黏貼到原來的Excel表格中(高端操作就是用cbind到原來的數(shù)據(jù)集中)

8.全部代碼:

forentropy=read.table("ForEntropy1.txt",header=TRUE,sep="\t",check.names=F,quote="",stringsAsFactors = FALSE)

library(entropy)

for (i in 1:683){ y[i]=entropy(forentropy[i,],method=c("CS"))}

write.table(y, file ="CS_Entropy.txt", sep =",", row.names =FALSE, col.names =FALSE)

后記:

能夠解決問題的方法,就是好方法~

這個操作,其實基本上可以用于對任何“感興趣”函數(shù),對自己的數(shù)據(jù)集“操作”一下~

不打賞,不點贊,你們還想不想我寫了,嗚嗚嗚~~~

參考文獻:

1.百度百科香農(nóng)熵:https://baike.baidu.com/item/香農(nóng)熵;

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容