Hi-C數(shù)據(jù)質(zhì)控原理

作者:ahworld
鏈接Hi-C數(shù)據(jù)質(zhì)控原理
來源:微信公眾號(hào)-seqyuan
著作權(quán)歸作者所有,任何形式的轉(zhuǎn)載都請(qǐng)聯(lián)系作者。

Hi-C數(shù)據(jù)質(zhì)控原理-視頻

Hi-C文庫的插入片段是經(jīng)過酶切連接的片段,其測(cè)序數(shù)據(jù)的比對(duì)和有效數(shù)據(jù)的篩選比較特殊。這個(gè)視頻重點(diǎn)介紹了以下3個(gè)方面:

  • Hi-C實(shí)驗(yàn)建庫原理
  • Hi-C數(shù)據(jù)的比對(duì)策略
  • Hi-C文庫的分子類型

Hi-C實(shí)驗(yàn)建庫原理

Hi-C實(shí)驗(yàn)建庫原理的部分重點(diǎn)介紹了什么樣的實(shí)驗(yàn)建庫原理導(dǎo)致了"PE測(cè)序的Reads1 Reads2分別來自不同的基因組酶切片段才符合Valid Pair Reads特征"

Hi-C數(shù)據(jù)常用的數(shù)據(jù)質(zhì)控軟件HiC-Pro的主要分為:Alignment和Map2Fragment兩個(gè)主要步驟。

Hi-C數(shù)據(jù)的比對(duì)策略

在這一部分重點(diǎn)介紹了以下4點(diǎn)內(nèi)容:

  1. Reads1 Reads2分別比對(duì)到基因組
  2. 挑選R1、R2分別比對(duì)到基因組唯一位置的PE Reads進(jìn)行后續(xù)分
  3. Hi-C文庫是junction類型,對(duì)于跨LS site的Reads有提高比對(duì)率的比對(duì)策略設(shè)計(jì)
  4. 建議在平衡unique map 和multiple map的情況下用比較短的Reads進(jìn)行比對(duì)(避免Reads跨過ligation site)

Hi-C文庫的分子類型

這一節(jié)主要講了,對(duì)來源于相同酶切片段的PE Reads進(jìn)行細(xì)分統(tǒng)計(jì),有利于我們改進(jìn)Hi-C實(shí)驗(yàn)條件,實(shí)現(xiàn)Valid reads比例的提升。Dangling 太高可能是由于連接步驟不好,導(dǎo)致后面步驟末端生物素沒有去除干凈等原因

對(duì)map到不同酶切片段的Pre Valid Pair Reads再進(jìn)行嚴(yán)格質(zhì)控是Dumped reads pair的主要來源。具體的嚴(yán)格質(zhì)控點(diǎn)包括:

  1. R1/R2 所在的Fragment1/Fragment2 大小不符合設(shè)定范圍
  2. Prediction insert size不在設(shè)定的參數(shù)范圍

“R1和R2比對(duì)到同一條染色體的情況,R1與R2比對(duì)位置之間的線形距離過小”的情況該不該被去除?,如果想去除選擇設(shè)置哪個(gè)參數(shù)?

Re-Ligation是什么?怎樣產(chǎn)生的?

Hi-C文庫的PCR Dup應(yīng)該怎么處理?為什么需要處理。

如果對(duì)這些問題感興趣,歡迎觀看視頻。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容