名詞解釋
flowcell (流動池)
flwocell是帶有流通槽的玻璃滑塊,是測序反應的載體,里面有8條lane。
lane(流通槽)
lane是測序反應的平行泳道,是試劑添加、洗脫等過程的發(fā)生位置。
tile
每一個lane里最小的單位叫做一個tile,每個tile會種下不同的cluster,每個tile在一次循環(huán)中會拍照4次(每個堿基一次)。
reads
測序的結果就叫做一個reads,對雙端測序來說,5'端reads叫reads1,3'端reads叫reads2。

illumina測序的工作流程
https://www.bilibili.com/video/av13107081
一.sample prep(樣本準備)
樣品準備就是在DNA fragments(片段)的末端添加adaptors(接頭)。超聲波將DNA分子打斷成300-800bp長序列片段(人類基因組打成300-500bp),用酶補平為平末端,然后3‘端加一個A堿基(因為接頭的3‘端有一個突出的T),再在兩端加上互補配對的adapter,再通過PCR擴增達到一定濃度,構成單鏈DNA文庫。

二.cluster generation(簇形成)
每一個lane固定了兩種不同的oligos(寡聚核苷酸引物)(垂直于lane),測序時,兩種oligos中的一種和fragment上的adaptor互補結合,如下圖所示:

再之后雙鏈分子變性,原始模板(左)被洗去,右邊鏈通過bridge PCR進行擴增。隨后不斷擴增,生成數(shù)百萬個cluster,如下圖:

之后所有的reverse strands(反向鏈)被切斷洗去,只留下forward strands(正向鏈)。正向鏈的3'端會封鎖,防止特異性結合。
三.sequencing(測序)
測序從第一個測序引物primer的延伸開始,生成第一個read(讀段)。每一個核苷酸都帶有熒光標記。四種核苷酸帶有四個不同的熒光標記,發(fā)射出特征性的熒光信號,這個專有過程叫sequencing-by-synthesis.循環(huán)結束后,生成的read product被沖掉,在生成下一個read。整個過程生成數(shù)百萬個reads,代表所有的fragment。
https://www.bilibili.com/video/av9273946
這個視頻的21分有講雙端測序的過程,自己寫的過程里沒提到第二條鏈怎么生成的。
四.data analysis(數(shù)據(jù)分析)

測序后生成的文件為fastq格式,每4行為一個read,read第1行:空格左邊(從紅色的1開始)為ID信息,DJG8....為測序儀信息,后邊數(shù)字代表是測序儀運行的第272次??崭裼疫厼閎arcode信息,用于區(qū)分樣品。第2行為測序結果序列信息。第4行為堿基質量值。