數(shù)據(jù)挖掘0311

所有資料來源于生信技能樹

  • 圖表

image.png

#1. 熱圖

image.png

上調(diào)基因和下調(diào)基因是針對(duì)處理組而言。
下調(diào)基因-處理組比對(duì)照組表達(dá)量低的基因

2.散點(diǎn)圖和箱線圖

散點(diǎn)圖和箱線圖

散點(diǎn)圖——強(qiáng)調(diào)個(gè)體之間的關(guān)系
箱線圖——強(qiáng)化組與組之間的關(guān)系

image.png
理解箱線圖的離群值

箱線圖越短說明數(shù)據(jù)越集中
越長(zhǎng)說明數(shù)據(jù)越離散

箱線圖和點(diǎn)圖適用于差異基因少的情況下使用。

3.火山圖

image.png
FC和logFC

image.png

logFC是以2為底數(shù),


image.png

logFC一般取1,1.2,1.5,1.75

4.主成分分析

image.png

image.png

點(diǎn)點(diǎn)代表樣本,
點(diǎn)和點(diǎn)的距離代表兩個(gè)樣本的差異大小
大的點(diǎn)代表分組在坐標(biāo)系中的中心位置,不代表樣本
坐標(biāo)系中dim和括號(hào)中的數(shù)據(jù)沒有意義,不代表啥

典型PCA

左上圖:組間差別大于組內(nèi)差別。(為什么?)
左下圖:
右側(cè)圖:組間差別小于組內(nèi)差別
生信技能樹公眾號(hào)上“一文看懂主成分分析”

還是有點(diǎn)懵~~~~~~~

  • GEO背景知識(shí)+表達(dá)芯片分析思路

1.表達(dá)數(shù)據(jù)的實(shí)驗(yàn)設(shè)計(jì)

image.png

2.數(shù)據(jù)庫介紹

GEO

GEO組織層次
GSM/GSE/GPL
image.png
基因表達(dá)芯片

探針是一組短的核苷酸序列,能與目的基因的一段序列雜交。

3.表達(dá)矩陣

表達(dá)矩陣的行名就是探針I(yè)D
列名是樣本編號(hào)

image.png

要做的工作時(shí)把探針I(yè)D轉(zhuǎn)換為Gene Symbol
把GSM樣本分組
image.png

3.差異分析

image.png
image.png

探針注釋
自主注釋
差異分析的可視化

差異分析的可視化就是火山圖和熱圖

數(shù)據(jù)挖掘的本質(zhì)就是縮小基因的范圍~Jimmy
誰能從你邋遢的外表看到你美麗的內(nèi)心呢?~花花
有本書叫《JYXPXXX》,經(jīng)我堅(jiān)定沒啥用。
數(shù)量太少,你引用個(gè)毛線球?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容