生信分析 | 大數(shù)據(jù)下的生物信息學與醫(yī)學

本文主要介紹了大數(shù)據(jù)時代下生物信息學與醫(yī)學之間的緊密聯(lián)系,如何通過大數(shù)據(jù)來獲取我們感興趣的基因,以及如何處理這些基因以得到我們想要的生物標志物。

生物信息學與醫(yī)學的緊密聯(lián)系

隨著生物信息學和醫(yī)學的不斷發(fā)展以及大數(shù)據(jù)時代的到來,人們已經(jīng)不只滿足于在組織細胞層面的研究了,開始向分子醫(yī)學層面的研究轉(zhuǎn)變。這極大程度地推動了生物信息學與醫(yī)學之間的相互發(fā)展。

疾病的發(fā)生、發(fā)展過程是一個多基因參與的、復(fù)雜的生物學過程,如果僅從傳統(tǒng)醫(yī)學中的依據(jù)病理類型、臨床分期和患者年齡、性別的等這些臨床特征治療的話,效果可能達不到預(yù)期效果。這時可以通過生物信息學技術(shù)從分子層面來研究治療機理。

生物信息學是一種以計算機為工具,對收集DNA、蛋白質(zhì)、生物信息等進行分析、收集、整理的學科,在一定程度上從分子層面揭示了疾病潛在的作用方式和發(fā)生機制。例如通過生物信息學分析可以尋找到與疾病相關(guān)的潛在基因、miRNA、lncRNA等。這為一些重大疾病,如心腦血管疾病、腫瘤、感染性疾病等的治療機理提供了基礎(chǔ)。

尋找與疾病相關(guān)的標志基因

要知道的是,一個疾病的發(fā)生可能與數(shù)以萬計的基因,蛋白質(zhì)的等有關(guān),我們不可能一個一個地判斷他們是否與該疾病有關(guān),是否是該疾病的致病基因。

從以上圖可以看出,一個與疾病相關(guān)的數(shù)據(jù)集中有三萬基因是很正常的。這個時候我們就要通過差異分析、富集分析、PPI網(wǎng)絡(luò)等來判斷一些差異基因與疾病的關(guān)系。

在大數(shù)據(jù)時代的影響下,很多病人的數(shù)據(jù)都會儲存在數(shù)據(jù)庫中,我們可以在前人的研究基礎(chǔ)上進行二次研究,發(fā)現(xiàn)更多與該疾病相關(guān)的潛在基因。

如何使用差異分析來減少工作量

我們可以在GEO數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/geo/)中下載我們感興趣的GSE數(shù)據(jù)集,數(shù)據(jù)集中一般會包含病人樣本和正常樣本,通過病人和正常人的對比我們可以很明確的發(fā)現(xiàn)在該疾病發(fā)病過程中參與的基因,使用R語言進行差異分析我們可以得到一些上調(diào)基因和下調(diào)基因(上調(diào)即在發(fā)病過程中表達顯著的基因,下調(diào)與前者相反),成功地將幾萬基因的研究變成了幾十幾百個基因的研究,大大增加了研究效率。

接下來還可以通過富集分析研究相關(guān)通路,通過PPI網(wǎng)絡(luò)發(fā)現(xiàn)差異基因之間的關(guān)系,使用miRNA,lncRNA預(yù)測工具等來預(yù)測與差異基因相關(guān)的miRNA和lncRNA。

舉個例子

我們以一篇發(fā)表在Front Cardiovasc Med(影響因子為6.052)的論文Predicting Diagnostic Gene Biomarkers Associated With Immune Infiltration in Patients With Acute Myocardial Infarction為例:

文中有兩個數(shù)據(jù)集,可以看到,數(shù)據(jù)都是超過兩百兆的,很大!

文中通過控制參數(shù)得到了25個上調(diào)基因和2個下調(diào)基因。

得到這些差異基因后,我們就可以對這些基因進行其他的分析來驗證關(guān)系啦~

在舉例的這篇文獻中用了很多分析,在這我就舉兩個我熟悉的吧,想要了解更多的小伙伴可以自己去看看這篇文獻哦。

后續(xù)分析中,作者使用了功能富集分析來發(fā)現(xiàn)在這些基因中起關(guān)鍵作用的生物通路,畢竟只研究單個基因是非常狹隘的。通過功能富集分析能夠講基因分類,以減少分析的復(fù)雜度。

作為與醫(yī)學密切相關(guān)的生物信息學,我們在研究時也會使用醫(yī)學的方法來驗證。例如,文中使用了循證醫(yī)學中的ROC曲線來驗證所確定的基因。

—END—

最后

作為一名科研人員,我們不僅要有生物學和醫(yī)學知識儲備,更要有大數(shù)據(jù)思維,將生物信息學與醫(yī)學緊密的聯(lián)系起來,達到更好的研究效果。畢竟,做研究的最終目的是造福人類呀(說的有點大,但話糙理不糙哈哈)!

[參考資料]

[1]????《生物信息學》

圖 | 網(wǎng)絡(luò)

文 | 小吳在線學生信

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容