需求
??由于某些特定的環(huán)境,可能老師能夠得到完整的細(xì)胞核,得不到完整的細(xì)胞,但是又想研究其細(xì)胞的單細(xì)胞轉(zhuǎn)錄組,就只能用細(xì)胞核進(jìn)行10xGenomics單細(xì)胞轉(zhuǎn)錄組分析;或者有的老師就想研究細(xì)胞核內(nèi)的mRNA與胞質(zhì)mRNA(或者成熟mRNA)的差異或者調(diào)控的差異,也需要研究細(xì)胞核的mRNA。
方法策略
??不管是細(xì)胞核內(nèi)還是胞質(zhì)的mRNA,本質(zhì)都是mRNA,都是從基因組上轉(zhuǎn)錄下來的序列,序列有相同的也有不同的,我們現(xiàn)在研究細(xì)胞核的mRNA,就需要考慮他們之間的差異,我們?yōu)槭裁床荒苤苯佑冒|(zhì)mRNA的方法研究細(xì)胞核mRNA呢?主要是由于細(xì)胞核內(nèi)的mRNA不是成熟的mRNA,是前提mRNA,除了有外顯子序列以外,還有很多內(nèi)含子(mRNA加工過程簡(jiǎn)介),而10xGenomics單細(xì)胞轉(zhuǎn)錄組比對(duì)的時(shí)候是考慮的外顯子比對(duì),因此如果直接用胞質(zhì)mRNA比對(duì)方法進(jìn)行細(xì)胞核mRNA比對(duì),將會(huì)比對(duì)率低的情況。

??針對(duì)這個(gè)問題,10xGenomics官方提供了解決方案:Cell Ranger compatible "pre-mRNA" reference,既然是由于外顯子比對(duì)的問題,那么就解決比對(duì)情況即可。因此10xGenomics官方建議我們直接在修改參考基因組,直接提取gtf中第三列為transcript的行,然后將transcript改成外顯子,這樣這些聚類就是基因組上序列,包含了內(nèi)含子序列。
??建議命令:
awk 'BEGIN{FS="\t"; OFS="\t"} $3 == "transcript"{ $3="exon"; print}' \
refdata-cellranger-GRCh38-1.2.0/genes/genes.gtf > GRCh38-1.2.0.premrna.gtf
#完成對(duì)gtf文件進(jìn)行處理后,然后重新生成參考基因組,命令如下
cellranger mkref --genome=GRCh38-1.2.0_premrna \
--fasta=refdata-cellranger-GRCh38-1.2.0/fasta/genome.fa \
--genes=GRCh38-1.2.0.premrna.gtf
然后用新的參考基因組進(jìn)行比對(duì),做后續(xù)分析。
結(jié)果比較
??為了比較評(píng)估此方法的可行性,我們用新生成的參考基因組(mRNA)和之前普通的10xGenomics參考基因組(pre_mRNA)進(jìn)行分別進(jìn)行分析,然后看結(jié)果的差異。


??從上述兩個(gè)圖看出,二者之間的結(jié)果差異挺大,主要體現(xiàn)在基因中位數(shù),
mRNA:759
pre_mRNA:2123,
造成這個(gè)原因是比對(duì)到轉(zhuǎn)錄本的序列多少不同,其中比對(duì)到轉(zhuǎn)錄本的比對(duì)率(Reads Mapped Confidently to Transcriptome)分別為:
mRNA:17.6%
pre_mRNA:63.1%
??從上述結(jié)果來看,如果研究細(xì)胞核mRNA或者說研究前體mRNA,按照上述方法對(duì)參考基因組進(jìn)行處理是很有必要的。
參考文檔
Cell Ranger compatible "pre-mRNA" reference
2019年6月3日