前言
1.1948 年,香農(nóng)提出了“信息熵”(shāng);
2.信息量的度量就等于不確定性的多少。即:要搞懂一個非常非常不確定(gaoleng)的女孩(或是說我們一無所知的女神),就需要了解大量的信息(喜歡吃啥,衣品,喜歡的偶像)。相反,如果我們對某件事已經(jīng)有了較多的了解(女閨蜜/青梅竹馬的),我們不需要太多的信息就能把它搞清楚。(我盡力了~)
不多說了,自己查資料,直接上重點:
如何用“R”計算基因的香農(nóng)熵?
1.首先,你要有一個基因表達的表:

2.然后,“手動”把第一列刪去(方便下一步導入到R中)

3. 打開R studio,導入數(shù)據(jù)(cd到數(shù)據(jù)所在的目錄就不說了哈~):
forentropy=read.table("ForEntropy1.txt",header=TRUE,sep="\t",check.names=F,quote="",stringsAsFactors = FALSE)
4.調(diào)動Entropy包,具體參數(shù)請看說明。
library(entropy)

5.發(fā)動“寫輪眼”(for循環(huán)):
因為我的數(shù)據(jù)集有683個基因,所以每一行計算香農(nóng)熵共683次
y=rep(0,683)
for (i in 1:683){ y[i]=entropy(forentropy[i,],method=c("CS"))}
這時候已經(jīng)變成是你想要的數(shù)據(jù)了~
6.輸出數(shù)據(jù):
write.table(y, file ="CS_Entropy.txt", sep =",", row.names =FALSE, col.names =FALSE)
7.整理數(shù)據(jù)笨辦法
就是Excel打開這個香農(nóng)熵值的表格,復制黏貼到原來的Excel表格中(高端操作就是用cbind到原來的數(shù)據(jù)集中)
8.全部代碼:
forentropy=read.table("ForEntropy1.txt",header=TRUE,sep="\t",check.names=F,quote="",stringsAsFactors = FALSE)
library(entropy)
for (i in 1:683){ y[i]=entropy(forentropy[i,],method=c("CS"))}
write.table(y, file ="CS_Entropy.txt", sep =",", row.names =FALSE, col.names =FALSE)
后記:
能夠解決問題的方法,就是好方法~
這個操作,其實基本上可以用于對任何“感興趣”函數(shù),對自己的數(shù)據(jù)集“操作”一下~
不打賞,不點贊,你們還想不想我寫了,嗚嗚嗚~~~
參考文獻:
1.百度百科香農(nóng)熵:https://baike.baidu.com/item/香農(nóng)熵;