所有資料來源于生信技能樹
-
圖表

image.png
#1. 熱圖

image.png
上調(diào)基因和下調(diào)基因是針對(duì)處理組而言。
下調(diào)基因-處理組比對(duì)照組表達(dá)量低的基因
2.散點(diǎn)圖和箱線圖

散點(diǎn)圖和箱線圖
散點(diǎn)圖——強(qiáng)調(diào)個(gè)體之間的關(guān)系
箱線圖——強(qiáng)化組與組之間的關(guān)系

image.png

理解箱線圖的離群值
箱線圖越短說明數(shù)據(jù)越集中
越長(zhǎng)說明數(shù)據(jù)越離散
箱線圖和點(diǎn)圖適用于差異基因少的情況下使用。
3.火山圖

image.png

FC和logFC

image.png
logFC是以2為底數(shù),

image.png
logFC一般取1,1.2,1.5,1.75
4.主成分分析

image.png

image.png
點(diǎn)點(diǎn)代表樣本,
點(diǎn)和點(diǎn)的距離代表兩個(gè)樣本的差異大小
大的點(diǎn)代表分組在坐標(biāo)系中的中心位置,不代表樣本
坐標(biāo)系中dim和括號(hào)中的數(shù)據(jù)沒有意義,不代表啥

典型PCA
左上圖:組間差別大于組內(nèi)差別。(為什么?)
左下圖:
右側(cè)圖:組間差別小于組內(nèi)差別
生信技能樹公眾號(hào)上“一文看懂主成分分析”
還是有點(diǎn)懵~~~~~~~
-
GEO背景知識(shí)+表達(dá)芯片分析思路
1.表達(dá)數(shù)據(jù)的實(shí)驗(yàn)設(shè)計(jì)

image.png
2.數(shù)據(jù)庫介紹

GEO

GEO組織層次

GSM/GSE/GPL

image.png

基因表達(dá)芯片
探針是一組短的核苷酸序列,能與目的基因的一段序列雜交。
3.表達(dá)矩陣
表達(dá)矩陣的行名就是探針I(yè)D
列名是樣本編號(hào)

image.png
要做的工作時(shí)把探針I(yè)D轉(zhuǎn)換為Gene Symbol
把GSM樣本分組

image.png
3.差異分析

image.png

image.png

探針注釋

自主注釋

差異分析的可視化
差異分析的可視化就是火山圖和熱圖
數(shù)據(jù)挖掘的本質(zhì)就是縮小基因的范圍~Jimmy
誰能從你邋遢的外表看到你美麗的內(nèi)心呢?~花花
有本書叫《JYXPXXX》,經(jīng)我堅(jiān)定沒啥用。
數(shù)量太少,你引用個(gè)毛線球?