很長一段時間里發(fā)現(xiàn)一個問題,在平常的實驗過程中,有一些童鞋還是會對生物學(xué)重復(fù)和技術(shù)重復(fù)有一些混淆,今天我們徹底再重溫一下。
1、怎么區(qū)分生物學(xué)重復(fù)與技術(shù)重復(fù)
生物學(xué)重復(fù):通俗講就是指樣本重復(fù),比如3只小鼠,同時做一種處理,就是三個生物學(xué)重復(fù)。
技術(shù)重復(fù):通俗講就是操作重復(fù),簡單理解一般就是三次實驗,比如對一塊組織,提了三次RNA,做三次real time。
2、為什么設(shè)置生物學(xué)重復(fù)
a、能夠消除組內(nèi)誤差
b、增強結(jié)果的可靠性
c、檢測離群樣本:異常樣本的存在,會嚴重影響實驗結(jié)果的準確性,通過計算樣本間的相關(guān)性可以發(fā)現(xiàn)異常樣本,將其排除
3、生物學(xué)重復(fù)設(shè)置幾個合適?
答案是至少3個,有條件越多越好,當(dāng)然這不是信口亂說的,有文獻支持的。
2016年英國鄧迪大學(xué)的Geoffrey J Barton教授在RNA發(fā)表一篇文章專門探討了這一問題。作者對野生型和snf2突變型酵母樣品分別測序了48個生物學(xué)重復(fù);質(zhì)控后,野生型樣品保留42個生物學(xué)重復(fù),突變型樣品剩余44個生物學(xué)重復(fù)。
在控制假陽性率為0.05的標準下,用所有可用生物重復(fù)計算出的差異基因定義為該差異基因鑒定工具的金標準差異基因集。
作者評估了11個常用的差異基因分析工具,性能最好的是edgeR, DESeq2和limma。
下面以edgeR為例展示了不同生物學(xué)重復(fù)數(shù)目對鑒定差異基因的影響。
在控制相同的假陽性率水平下,不同的生物學(xué)重復(fù)鑒定出的差異基因數(shù)目 (nr: number of biological replicates)。作者從所有生物重復(fù)中隨機抽取2組、3組、4組…生物學(xué)重復(fù),分別計算差異基因,發(fā)現(xiàn):
差異基因的數(shù)目整體與生物重復(fù)數(shù)量正相關(guān)。
差異基因數(shù)目的穩(wěn)定性與生物重復(fù)數(shù)量負相關(guān)。
生物重復(fù)較少時,不同的抽樣導(dǎo)致的差異基因數(shù)目波動較大。
生物重復(fù)較多時,檢測出的差異基因數(shù)目受抽樣影響較小,體現(xiàn)在柱狀圖數(shù)據(jù)分布更集中 。
