四種堿基的判讀-Hiseq測(cè)序原理2

本文回答以下兩個(gè)問(wèn)題:
1. 根據(jù)掃描得到的光點(diǎn)圖,如何判斷一個(gè)位置上的堿基是什么
2. 評(píng)估1中判斷的可靠性

插圖全部來(lái)自【陳巍學(xué)基因】視頻2:HiSeq工作原理,本文是對(duì)該視頻的學(xué)習(xí)筆記

1. 四種堿基的判讀規(guī)則

  • C > 0.6 即 Ia/Ib > 1.5,該位置的堿基是“好堿基”
  • Ia :光點(diǎn)中占比最高的熒光素含量
  • Ib :光點(diǎn)中占比第二的熒光素含量
  • Pass Filter:前25個(gè)堿基中,壞堿基的個(gè)數(shù)小于等于1,則該read的Pass Filter=pass,否則不pass
  • 對(duì)data進(jìn)行Pass Filter的目的:去掉多克隆cluster
  • 多克隆cluster中光點(diǎn)上,占比最高的熒光素含量與占比第二的熒光素含量相近,判讀誤差大,無(wú)法確定到底是哪種堿基
  • PF rate = Pass Filter的reads數(shù)目/總的測(cè)到的reads數(shù)目
  • 上樣密度過(guò)高,PF rate 會(huì)下降(多克隆cluster會(huì)增多)

2. 評(píng)估堿基判讀

Quality Score
  • 評(píng)價(jià)一個(gè)位置上堿基判讀可靠性的指標(biāo),評(píng)價(jià)堿基誤判的可能性


  • Q30比例 = 達(dá)到或超過(guò)Q30的數(shù)據(jù) / 總的Pass Filter的數(shù)據(jù)



linux環(huán)境下FASTQ文件預(yù)覽
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容