illumina測序原理

名詞解釋

flowcell (流動池)

flwocell是帶有流通槽的玻璃滑塊,是測序反應的載體,里面有8條lane。

lane(流通槽)

lane是測序反應的平行泳道,是試劑添加、洗脫等過程的發(fā)生位置。

tile

每一個lane里最小的單位叫做一個tile,每個tile會種下不同的cluster,每個tile在一次循環(huán)中會拍照4次(每個堿基一次)。

reads

測序的結果就叫做一個reads,對雙端測序來說,5'端reads叫reads1,3'端reads叫reads2。

flowcell

illumina測序的工作流程

https://www.bilibili.com/video/av13107081

一.sample prep(樣本準備)

樣品準備就是在DNA fragments(片段)的末端添加adaptors(接頭)。超聲波將DNA分子打斷成300-800bp長序列片段(人類基因組打成300-500bp),用酶補平為平末端,然后3‘端加一個A堿基(因為接頭的3‘端有一個突出的T),再在兩端加上互補配對的adapter,再通過PCR擴增達到一定濃度,構成單鏈DNA文庫。


adaptor修飾

二.cluster generation(簇形成)

每一個lane固定了兩種不同的oligos(寡聚核苷酸引物)(垂直于lane),測序時,兩種oligos中的一種和fragment上的adaptor互補結合,如下圖所示:


互補過程

再之后雙鏈分子變性,原始模板(左)被洗去,右邊鏈通過bridge PCR進行擴增。隨后不斷擴增,生成數(shù)百萬個cluster,如下圖:


cluster

之后所有的reverse strands(反向鏈)被切斷洗去,只留下forward strands(正向鏈)。正向鏈的3'端會封鎖,防止特異性結合。

三.sequencing(測序)

測序從第一個測序引物primer的延伸開始,生成第一個read(讀段)。每一個核苷酸都帶有熒光標記。四種核苷酸帶有四個不同的熒光標記,發(fā)射出特征性的熒光信號,這個專有過程叫sequencing-by-synthesis.循環(huán)結束后,生成的read product被沖掉,在生成下一個read。整個過程生成數(shù)百萬個reads,代表所有的fragment。
https://www.bilibili.com/video/av9273946
這個視頻的21分有講雙端測序的過程,自己寫的過程里沒提到第二條鏈怎么生成的。

四.data analysis(數(shù)據(jù)分析)

fastq格式

測序后生成的文件為fastq格式,每4行為一個read,read第1行:空格左邊(從紅色的1開始)為ID信息,DJG8....為測序儀信息,后邊數(shù)字代表是測序儀運行的第272次??崭裼疫厼閎arcode信息,用于區(qū)分樣品。第2行為測序結果序列信息。第4行為堿基質量值。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容