里程碑:我們終于完成了對人類基因組的完整測序

二十年前,當 人類基因組計劃 和生物技術公司Celera Genomics宣布對人類基因組測序時,人類基因序列還并不真正完整。有大約15%的內容缺失:技術上的限制使研究人員無法弄清某些DNA片段是如何組合在一起的,特別是有許多重復字母(堿基對)的地方。隨著時間的推移,科學家們解決了部分難題,但當時的人類基因組(遺傳學家自2013年以來一直將其作為參考)仍然缺少8%的完整序列。

現在,端粒到端粒(T2T)聯盟的研究人員填補了這些空白,該聯盟是由大約30個機構組成的國際合作組織。在5月27日題為 "人類基因組的完整序列" 的預印本論文中,加州大學圣克魯茲分校的基因組學研究員Karen Miga和她的同事報告說,他們已經對剩余部分進行了測序,在這個過程中發(fā)現了大約115個編碼蛋白質的新基因,而本次測序總數為19969。

馬里蘭州貝塞斯達的美國國家生物技術信息中心的生物信息學家Kim Pruitt稱這個結果是一個 "重要的里程碑"。

新的測序技術

新測序的基因(標號為)T2T-CHM13——在2013年版本的人類基因組序列上添加了近2億個堿基對。

這一次,研究人員沒有從活人身上提取DNA,而是使用了從所謂的全性葡萄胎中提取的細胞系,這是當精子與沒有細胞核的卵子結合時形成的組織類型。由此產生的細胞只包含來自父親的染色體,因此研究人員不必區(qū)分來自不同人的兩套染色體。

Miga說,如果沒有加利福尼亞州門洛帕克的太平洋生物科學公司的新測序技術,這一壯舉幾乎是不可能的,該公司使用激光掃描從細胞中分離出來的長段DNA——每個都有多達2萬個堿基對。傳統(tǒng)的測序方法每次只讀取幾百個堿基對。那時研究人員要將片段像拼圖一樣重新組合起來。較大的碎片更容易拼湊,因為它們更有可能包含重疊的序列。

然而,T2T-CHM13并不是人類基因組學的終點。T2T團隊在幾個區(qū)域上遭遇了困難,并估計大約0.3%的基因組可能包含錯誤;但沒有未被測序的片段。事實證明,在那幾處區(qū)域進行質量控制檢查是很困難的。

Miga預計,遺傳學科學家將很快確認新測序區(qū)域是否與人類疾病相關。

她希望未來的人類基因組序列將涵蓋所有內容,而不僅僅是容易閱讀的部分?,F在對照基因組已經完成,一些技術上的障礙也已經解決,這應該更容易。她說:"我們需要在基因組學中達到一個新的標準,不是特殊的,而是常規(guī)的。”

doi: https://doi.org/10.1038/d41586-021-01506-w

https://www.nature.com/articles/d41586-021-01506-w

?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容