小鬼的m6A圖文復(fù)現(xiàn)03-數(shù)據(jù)比對(duì)之去除rRNA

在上一期中我們得到了cleandata,接下來(lái)是要比對(duì)到參考基因上進(jìn)行比對(duì)過(guò)程的分析。一般來(lái)說(shuō),在比對(duì)之前,我們可以選擇先去除rRNA序列然后再與參考基因組進(jìn)行比對(duì),文章中采用的策略也是如此:

image-20210713202505327.png

那么你或許會(huì)有以下幾個(gè)隨著而來(lái)的問(wèn)題:

  • 1.為什么測(cè)序數(shù)據(jù)中會(huì)出現(xiàn)rRNA?
  • 2.rRNA不去除與去除會(huì)對(duì)我后面的分析造成什么樣的影響?

rRNA背景知識(shí)

在進(jìn)行具體操作之前,我們可以來(lái)先了解一下rRNA這個(gè)東西。

首先,看rRNA在整個(gè)細(xì)胞中的組成比例:從mass指標(biāo)來(lái)看,一個(gè)哺乳動(dòng)物的細(xì)胞中rRNA占比最多,能達(dá)到80-90%

image-20210713203007244.png

比例:

image-20210713220458206.png

Note:Estimate of RNA levels in a typical mammalian cell。ref:Front Genet. 2015 Jan 26;6:2

rRNA在參考基因組上存在多個(gè)copy:比對(duì)時(shí)會(huì)造成數(shù)據(jù)比對(duì)結(jié)果中多比率偏高。rRNA的存在對(duì)后續(xù)的影響就主要看后面的分析使用的是唯一比對(duì)reads還是所有比對(duì)上的reads了。那么,數(shù)據(jù)中為什么會(huì)測(cè)到rRNA呢?這就跟前期建庫(kù)采用的策略有關(guān)系了,去除rRNA的試劑盒的效率等問(wèn)題。

此次,我們先去文中提到的網(wǎng)址下載rRNA序列,然后使用bowtie2進(jìn)行比對(duì)。

rRNA序列下載

打開(kāi)NCBI網(wǎng)址,選擇Taxonomy數(shù)據(jù)庫(kù),輸入10090,10090為小鼠的物種ID

image-20210720003031428.png

選擇右側(cè) Nucleotide

image-20210720003206305.png

保存

image-20210720003726949.png

下載下來(lái)的數(shù)據(jù):fasta格式

image-20210720003900895.png

確認(rèn)一下下載是否完整,為82條:

image-20210720004249139.png

rRNA比對(duì)保存沒(méi)有比對(duì)上的序列

首先,建索引:

bowtie2-build Mus_musculus.rRNA.fa Mus_musculus.rRNA

索引結(jié)果:

image-20210720010555682.png

比對(duì):

mkdir bowtie2

# 換成自己的路徑,注意index為索引前綴
index=/path/rRNA_index/Mus_musculus.rRNA 
od=/path/bowtie2

# 單端數(shù)據(jù)
ls *gz |while read id
do
  sam=${id%_*};
  nohup bowtie2 -x $index --un-gz ${od}/${sam}.derRNA.fq.gz -U $id -p 8 -S ${od}/${sam}.rRNA.mapped.sam 2>${od}/${sam}.log &
done

# 雙端數(shù)據(jù)
可以看文獻(xiàn)中的代碼,文獻(xiàn)中提供的為雙端數(shù)據(jù)

比對(duì)完之后的數(shù)據(jù):

image-20210714001313058.png

后續(xù)更新~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容