轉(zhuǎn)自http://www.zxzyl.com/archives/789
測序中加入Phix的作用
測序建庫的時(shí)候,會(huì)加入一定比例的Phix,那么Phix文庫有什么作用呢,我轉(zhuǎn)了兩篇文章,方便大家理解。Phix文庫最主要的目的1)是調(diào)節(jié)堿基平衡,改善測序儀的空間校正,便于后期提高base calling的準(zhǔn)確性,2)由于Phix序列已知基因組較小,在測序的過程中Illumina的測序儀就開始將測的read與phix基因組進(jìn)行比較,預(yù)估測序指標(biāo)。我也遇到過,Illumina工程師在維護(hù)測序儀時(shí),用Phix文庫測試。轉(zhuǎn)載內(nèi)容詳見下文
轉(zhuǎn)自Illumina公司
PhiX對(duì)照品v3是一款可靠、連接接頭的文庫,適合用作Illumina測序運(yùn)行的對(duì)照品。該文庫來源于已妥善分析特征的小型PhiX基因組,并具備多項(xiàng)測序和比對(duì)優(yōu)點(diǎn)。
通用型PhiX對(duì)照品v3不僅能用作即用型文庫,還可用于多種應(yīng)用,以增加工作流程價(jià)值及提高結(jié)果的可信度。
PhiX文庫提供適用于簇生成、測序和比對(duì)的質(zhì)量對(duì)照品,以及適用于串?dāng)_矩陣生成、定相和預(yù)定相的校正對(duì)照品。可快速對(duì)其進(jìn)行比對(duì)以預(yù)估相關(guān)邊合成邊測序(SBS)指標(biāo),比如定相和錯(cuò)誤率。
視乎應(yīng)用,PhiX對(duì)照品v3還可用作:
適用于堿基不均衡樣本(AT或GC內(nèi)容低于40%或高于60%的基因組)的高濃度外標(biāo)對(duì)照品
低濃度摻入,適用于比對(duì)和定量效率的計(jì)算
可在多樣性較低樣本旁的設(shè)置照品通道
適用于簇生成問題故障診斷,便于確定錯(cuò)誤是否與文庫制備有關(guān)
轉(zhuǎn)自Mars-Zhan老師
測定混合微生物群的16S的若干個(gè)片段,從其可變區(qū)的序列來進(jìn)行菌落組成分序,已是很常用的實(shí)驗(yàn)方法。
自從MiSeq測序平臺(tái)推出PE300的測序方式之后,用PE300來測16S的V1、V2、V3區(qū),已成了最常用的菌落分析手段。
但是每次我提醒用戶:在做16S文庫測序的上機(jī)時(shí),建議加入70%的PhiX文庫。用戶都會(huì)感到不解:為什么要浪費(fèi)這70%的測序通量?
這還要從Illumina公司的測序原理說起:
Illumina的測序根本原理是用4種顏色熒光基團(tuán)標(biāo)記4種dNTP。
在顯微掃描鏡下,通過對(duì)4種顏色的熒光進(jìn)行分別掃描,得到4張照片,每張照片對(duì)應(yīng)于一種顏色的熒光。
把4張照片進(jìn)行對(duì)比,把各張照片上的光點(diǎn)重合,計(jì)算每個(gè)光點(diǎn)的光的顏色強(qiáng)度,倒過來推算出這個(gè)點(diǎn)是哪種熒光基團(tuán),進(jìn)爾再推算出這個(gè)點(diǎn)是哪種堿基。
MiSeq測16S文庫時(shí),為什么要加PhiX?
但請(qǐng)注意,因?yàn)檫@4張照片都是納米級(jí)的分辨率,而測序過程中芯片是移動(dòng)的,所以每次拍照多少存在一定程度的空間偏差,如上圖所示。這就需要進(jìn)行空間校正。
文庫復(fù)雜度不夠高帶來的影響:
如果是文庫的復(fù)雜度足夠高,也就是在一個(gè)測序循環(huán)中,A/C/G/T四種堿基的比例較接近于各25%,那么4張照片上都會(huì)有足夠多的明亮的光點(diǎn),可供空間校正之用。
但是如果文庫的復(fù)雜度不夠高,典型的例子就是PCR擴(kuò)增產(chǎn)物,比如說第一個(gè)循環(huán),99%的 堿基都是A,那么C/G/T三種堿基加起來也只有1%。這就導(dǎo)致C/G/T這三張照片都很暗,上面沒有足夠多的光點(diǎn)可供測序儀來分辨,更難于做空間校正。 測序儀就會(huì)把大多數(shù)無法準(zhǔn)確分辨的點(diǎn)給舍棄。
最終的結(jié)果就是:測序得到的有效數(shù)據(jù)量(PF data,Pass Filter data)很少,而且數(shù)據(jù)的質(zhì)量(Q值)也偏低。
上述的原因,讓Illumina的MiSeq和HiSeq 2000/2500在測復(fù)雜度低的文庫(PCR擴(kuò)增文庫、Bisulfite處理的甲基化文庫、簡化基因組文庫等)時(shí),如果沒有加入彌補(bǔ)的方法,軟件就不 能很好識(shí)別的光點(diǎn),導(dǎo)致最后的有效數(shù)據(jù)量減少、測序數(shù)據(jù)質(zhì)量也偏低。
目前的解決方案是:
在測低復(fù)雜度的文庫時(shí),摻入一定量的高復(fù)雜度文庫。最常用的摻入文庫是Illumina出品的PhiX文庫,也有些實(shí)驗(yàn)室會(huì)用哺乳類動(dòng)物的基因組文庫來增加文庫的復(fù)雜度,效果是一樣的。
PhiX文庫有以下的特點(diǎn):
PhiX文庫中GC含量約為45%,是堿基比例較為平衡的樣本。
PhiX DNA就是ΦX174噬菌體的DNA,其基因組的長度是4kb略多,其序列已清楚地被測定。
PhiX DNA文庫沒有Index,所以在樣本Demultiplex的過程中,被挪到undetermined的文件中,不會(huì)與別的有Index的文庫相混。
PhiX的序列是已知的,所以,在測序過程中,儀器會(huì)對(duì)PhiX的序列進(jìn)行比對(duì),算出Phasing和Pre-Phasing(一個(gè)簇中,有多少比例的DNA是少合成了一個(gè)堿基(Phasing),又有多少比例的DNA是多合成了一個(gè)堿基(Pre-Phasing))
轉(zhuǎn)自陳云地老師
常見的堿基組成不平衡的樣本類型比如:甲基化、擴(kuò)增子、轉(zhuǎn)錄組、ChIP、重復(fù)序列測序(16S rDNA, HLA…)等等,其中重亞硫酸鹽處理后的甲基化樣本是堿基組成極度不平衡的,基本沒有C,只有A、T、G三種堿基,而T的含量又比正常樣本增加幾乎一倍。
堿基不平衡的樣本可以與堿基平衡的樣本混合以改善平衡程度,常見堿基平衡的樣本比如人全基因組、人外顯子組、Illumina標(biāo)準(zhǔn)品文庫PhiX等。
平衡與不平衡樣本的混合比例,根據(jù)樣本的不平衡的嚴(yán)重程度調(diào)整。樣本的堿基越不平衡,Phix文庫的比例越高。
其中PhiX可以同時(shí)起到兩個(gè)作用:改善堿基平衡度,作為陽性對(duì)照監(jiān)控測序操作是否成功。
http://blog.sina.com.cn/s/blog_751bd9440102vruh.html
http://garification.blog.163.com/blog/static/1741330252015726502943/
https://www.illumina.com.cn/products/by-type/sequencing-kits/cluster-gen-sequencing-reagents/phix-control-v3.html