本文主要介紹了大數(shù)據(jù)時代下生物信息學與醫(yī)學之間的緊密聯(lián)系,如何通過大數(shù)據(jù)來獲取我們感興趣的基因,以及如何處理這些基因以得到我們想要的生物標志物。
生物信息學與醫(yī)學的緊密聯(lián)系
隨著生物信息學和醫(yī)學的不斷發(fā)展以及大數(shù)據(jù)時代的到來,人們已經(jīng)不只滿足于在組織細胞層面的研究了,開始向分子醫(yī)學層面的研究轉(zhuǎn)變。這極大程度地推動了生物信息學與醫(yī)學之間的相互發(fā)展。
疾病的發(fā)生、發(fā)展過程是一個多基因參與的、復(fù)雜的生物學過程,如果僅從傳統(tǒng)醫(yī)學中的依據(jù)病理類型、臨床分期和患者年齡、性別的等這些臨床特征治療的話,效果可能達不到預(yù)期效果。這時可以通過生物信息學技術(shù)從分子層面來研究治療機理。
生物信息學是一種以計算機為工具,對收集DNA、蛋白質(zhì)、生物信息等進行分析、收集、整理的學科,在一定程度上從分子層面揭示了疾病潛在的作用方式和發(fā)生機制。例如通過生物信息學分析可以尋找到與疾病相關(guān)的潛在基因、miRNA、lncRNA等。這為一些重大疾病,如心腦血管疾病、腫瘤、感染性疾病等的治療機理提供了基礎(chǔ)。
尋找與疾病相關(guān)的標志基因
要知道的是,一個疾病的發(fā)生可能與數(shù)以萬計的基因,蛋白質(zhì)的等有關(guān),我們不可能一個一個地判斷他們是否與該疾病有關(guān),是否是該疾病的致病基因。
從以上圖可以看出,一個與疾病相關(guān)的數(shù)據(jù)集中有三萬基因是很正常的。這個時候我們就要通過差異分析、富集分析、PPI網(wǎng)絡(luò)等來判斷一些差異基因與疾病的關(guān)系。
在大數(shù)據(jù)時代的影響下,很多病人的數(shù)據(jù)都會儲存在數(shù)據(jù)庫中,我們可以在前人的研究基礎(chǔ)上進行二次研究,發(fā)現(xiàn)更多與該疾病相關(guān)的潛在基因。
如何使用差異分析來減少工作量
我們可以在GEO數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/geo/)中下載我們感興趣的GSE數(shù)據(jù)集,數(shù)據(jù)集中一般會包含病人樣本和正常樣本,通過病人和正常人的對比我們可以很明確的發(fā)現(xiàn)在該疾病發(fā)病過程中參與的基因,使用R語言進行差異分析我們可以得到一些上調(diào)基因和下調(diào)基因(上調(diào)即在發(fā)病過程中表達顯著的基因,下調(diào)與前者相反),成功地將幾萬基因的研究變成了幾十幾百個基因的研究,大大增加了研究效率。
接下來還可以通過富集分析研究相關(guān)通路,通過PPI網(wǎng)絡(luò)發(fā)現(xiàn)差異基因之間的關(guān)系,使用miRNA,lncRNA預(yù)測工具等來預(yù)測與差異基因相關(guān)的miRNA和lncRNA。
舉個例子
我們以一篇發(fā)表在Front Cardiovasc Med(影響因子為6.052)的論文Predicting Diagnostic Gene Biomarkers Associated With Immune Infiltration in Patients With Acute Myocardial Infarction為例:
文中有兩個數(shù)據(jù)集,可以看到,數(shù)據(jù)都是超過兩百兆的,很大!
文中通過控制參數(shù)得到了25個上調(diào)基因和2個下調(diào)基因。
得到這些差異基因后,我們就可以對這些基因進行其他的分析來驗證關(guān)系啦~
在舉例的這篇文獻中用了很多分析,在這我就舉兩個我熟悉的吧,想要了解更多的小伙伴可以自己去看看這篇文獻哦。
后續(xù)分析中,作者使用了功能富集分析來發(fā)現(xiàn)在這些基因中起關(guān)鍵作用的生物通路,畢竟只研究單個基因是非常狹隘的。通過功能富集分析能夠講基因分類,以減少分析的復(fù)雜度。
作為與醫(yī)學密切相關(guān)的生物信息學,我們在研究時也會使用醫(yī)學的方法來驗證。例如,文中使用了循證醫(yī)學中的ROC曲線來驗證所確定的基因。
—END—
最后
作為一名科研人員,我們不僅要有生物學和醫(yī)學知識儲備,更要有大數(shù)據(jù)思維,將生物信息學與醫(yī)學緊密的聯(lián)系起來,達到更好的研究效果。畢竟,做研究的最終目的是造福人類呀(說的有點大,但話糙理不糙哈哈)!
[參考資料]
[1]????《生物信息學》
圖 | 網(wǎng)絡(luò)
文 | 小吳在線學生信