文章,重在研究思路;有好的思路,才能有精彩的故事。很多時候,我們想找一個好點(diǎn)子,比如性狀,疾病相關(guān)的關(guān)鍵分子,需要設(shè)計(jì)實(shí)驗(yàn),做大量的分子篩選的工作。對于土豪實(shí)驗(yàn)室可以大把的花錢做芯片或者高通量測序做前期的篩選工作。但是畢竟土豪是少數(shù)的,假如您樣本不多,經(jīng)費(fèi)較少,而又想發(fā)SCI文章,該怎么辦呢?下面我給大家推薦一個最經(jīng)濟(jì)最快捷最有效的文章思路:利用別人已發(fā)表的數(shù)據(jù),篩選出一些有價值的分子(mRNA,miRNA,lncRNA,circRNA,lncRNA),之后在自己的小樣本中驗(yàn)證一下,發(fā)篇SCI文章還是輕輕松松的。下面我們一起來看看這類利用GEO、TCGA數(shù)據(jù)庫的文章是怎樣寫成的!
文章1:

文章今年(2018)發(fā)表在:Cancer Management and Research 上IF=3.851。該文章發(fā)表的雜志影響因子雖然不高,但是分析思路還是可以借鑒的:文章主要分析結(jié)論是:利用公共數(shù)據(jù)(GEO,TCGA數(shù)據(jù)),通過數(shù)據(jù)篩選分析后發(fā)現(xiàn)兩個miRNA(miR-182 and miR-20a)可以作為結(jié)直腸癌(colorectal cancer CRC)診斷的分子標(biāo)志物,然后在組織和血液中進(jìn)行驗(yàn)證,最終確定診斷參數(shù)。主要的分析思路分為三大步,如下圖所示圖所示:
第一步:利用公共數(shù)據(jù)進(jìn)行篩選biomarker(Discovery phase)

首先,作者利用GEO數(shù)據(jù)庫當(dāng)中關(guān)于CRC的4個miRNA表達(dá)芯片數(shù)據(jù),尋找患病樣品和正常樣品中差異表達(dá)的miRNA,通過取交集初步篩選到8個miRNA,再利用TCGA數(shù)據(jù)庫中的CRC樣本進(jìn)行篩選,和qRT-PCR驗(yàn)證,其驗(yàn)證不僅在組織樣中,同時還在血液中進(jìn)行篩選,方便后續(xù)通過血液檢測篩查CRC患者。最終確定了兩個miRNA在CRC患者的組織和血液中表達(dá)都有上調(diào),可作為CRC的分子診斷候選標(biāo)志物(miR-182 and miR-20a)。
第二步:做訓(xùn)練數(shù)據(jù)集,確定診斷參數(shù)(Training phase)

之后,作者在自己收集的CRC患者血液樣本中進(jìn)行驗(yàn)證,40個健康樣品,40個CRC患者樣本,發(fā)現(xiàn)這兩個miRNA在患者和對照中表達(dá)都存在差異,最終通過分析ROC線確定分類參數(shù)。
第三步:擴(kuò)大數(shù)據(jù)集,確定最佳診斷參數(shù)(Validation phase)

最后作者擴(kuò)大樣品到150個,分別為健康樣品50個,Adenoma(腺瘤)樣品50個和CRC患者(stage I)進(jìn)行驗(yàn)證并繪制ROC曲線,最終確定,診斷參數(shù):
miR-182,miR-20a, and 2-miRNA combination were 2.620, 1.355,and 2.147, respectively.

文章2:
期刊:Am J Cancer Res
分?jǐn)?shù):3.2
疾病:口腔鱗細(xì)胞癌(OSCC)
文章思路:
利用GSE13601,GSE30784, GSE37991三個mRNA芯片表達(dá)數(shù)據(jù)以及TCGA中OSCC表達(dá)數(shù)據(jù)分別做對照和患者差異基因分析,篩選到顯著差異表達(dá)的76個上調(diào)基因、106個下調(diào)基因;然后進(jìn)行GO和KEGG通路富集分析、PPI網(wǎng)絡(luò)分析,IPA通路分析,生存分析等聯(lián)合分析最終篩選到PLAU, CLDN8 and CDKN2A與OSCC預(yù)后相關(guān),并且在另一個GEO數(shù)據(jù)GSE41613中得到了驗(yàn)證。

總結(jié):
大家可以發(fā)現(xiàn),GEO數(shù)據(jù)挖掘,以及TCGA數(shù)據(jù)的挖掘就是這個套路(點(diǎn)擊觀看),先確定自己要分析的疾病,然后下載數(shù)據(jù),差異表達(dá)分析,篩選得到幾個關(guān)鍵的分子(可以是lncRNA,mRNA,miRNA,circRNA),然后進(jìn)行GO富集分析、Pathway富集分析、GSEA富集分析、PPI分析、IPA通路分析等,最后再做生存分析、ROC曲線分析等,就可以得到與疾病診斷相關(guān)的biomarker。如果要進(jìn)一步發(fā)高分的文章,可以再做一下小鼠模型,細(xì)胞模型,敲除,過表達(dá)等補(bǔ)充實(shí)驗(yàn),對分子機(jī)理進(jìn)行深入研究,干濕結(jié)合,文章就能再上一個檔次。另外,還有其他套路組合,例如做一下WGCNA或者聯(lián)合Oncomine數(shù)據(jù)挖掘等等。