之前與大家分享了使用 NCBI 依據(jù)影響因子檢索文獻的技巧,今天咱們就實戰(zhàn)一下。
今天的題目是搜索出 2017 年發(fā)表的 IF≥10 的基因組 de novo 組裝文章并挑選一篇進行解讀。
咱們一步一步來 :
1. 檢索文獻
打開 NCBI PubMed,輸入關(guān)鍵詞genome de novo assembly ,并選擇文獻起止時間:

按照之前設(shè)置好的 IF 篩選條件,查看 IF >= 10的文章。

我們發(fā)現(xiàn)該關(guān)鍵詞下共搜索到 345 篇文獻,其中發(fā)表在 IF > 30 分雜志上的有3 篇,30 >IF >=20 的有3篇,20>IF>=10有23篇,而我們的目標就在這些文獻中。
不過按照常理 大于 30 分是神人發(fā)的,大于20分是牛逼實驗室發(fā)的準則來講,我們主要還是看看 20 >IF>=10這個檔次的文章,這個檔次的文章貼近實際,而且基本把實驗與分析玩到了極致。
我們今天解讀一篇秈稻基因組的文章;
Sequencing and de novo assembly of a near complete indica rice genome
這是中國科學(xué)院遺傳所梁承志研究組 5月份在線發(fā)表在 Nature Communications 上的一篇文章,2016年 期刊 IF=12.123.
還是帶著三個疑問,我們開始文獻的解讀:
1. 是什么?
該研究構(gòu)建出一個目前最高質(zhì)量的水稻基因組參考序列。
2. 為什么?
水稻作為五大作物中與生活密切相關(guān)的糧食作物來說,其每一次研究的推進都是對人類生存的一份貢獻。作為糧食模式物種來說,其研究程度的高低,科研成果的分量不言而喻。
基因組參考序列的好壞一直是制約生命科學(xué)研究的一大困難所在。因此提高參考基因組的序列質(zhì)量意義重大。本研究中,作者通過最新的測序技術(shù),極大的改善了水稻參考基因組的質(zhì)量。
3. 怎么樣?
閑話少說,書歸正傳,接下來我們一起進入作者的水稻世界看看作者是怎樣將水稻基因組一步步完善的。
3.1 材料選擇
秈稻品種 Shuhui498
3.2 測序方法
研究采用了三代測序平臺進行全基因組測序。
3.3 研究成果
通過三代測序,共獲得了47G,約118×的數(shù)據(jù)。利用PBcR流程對三代測序數(shù)據(jù)進行組裝,采用較寬松和嚴格兩種參數(shù),分別獲得了contig N50為1.1M和443kb的指標。而用Falcon和CANU流程組裝則分別獲得了contig N50為516kb和900kb的指標。值得注意的是,該研究對564個fosmid池(插入片段~40kb)進行測序,獲得了6.3Gb的GBS tags,并將這些數(shù)據(jù)用于基因組組裝當(dāng)中,其方法是將tags比對到糾錯后的三代序列上,每個fosmid池獲得了800M的最佳比對序列,對每個池的選擇出的序列分別進行Falcon組裝,獲得fosmid contigs。接著,以WGS contigs為節(jié)點,fosmid contig為連線,選擇最佳路徑進行迭代,在遺傳圖譜上將WGS contigs連接或延伸成super-contigs。最終獲得的super contigs僅有17個,并且每個染色體末端都發(fā)現(xiàn)了端粒序列,說明每條染色體的末端都組裝出來,得到非常完整的基因組序列。

