前段時間,接了老師一個等位基因特異性表達(dá)的任務(wù),前后再加上其他的分析帶著做,再捋流程,拖拖拉拉也用了小一個月,終于從原始測序數(shù)據(jù),得到了最終的那張table,具體的內(nèi)容基本已經(jīng)都發(fā)出來了,這篇帖子系統(tǒng)整理一下流程,如何從RNA-seq的fastqc到最后的ASE table。
輸入數(shù)據(jù)
- 后代的RNA-seq測序數(shù)據(jù),fastqc.zip
- 親本的參考基因組 .fa
流程
1.測序數(shù)據(jù)質(zhì)控
測序質(zhì)量分析 —— FastQC - 簡書 (jianshu.com)
2.下載基因組數(shù)據(jù),及gff格式轉(zhuǎn)換
gff格式與gtf格式轉(zhuǎn)換——gffread - 簡書 (jianshu.com)
gff格式與gtf格式轉(zhuǎn)換——NBISweden / AGAT - 簡書 (jianshu.com)
3.序列比對
序列比對 —— Hisat2 - 簡書 (jianshu.com)
4.變異檢測
sam文件轉(zhuǎn)換為bam文件——SAMtools - 簡書 (jianshu.com)
SAMtools——bam文件排序 - 簡書 (jianshu.com)
SAMtools——bam文件去重 - 簡書 (jianshu.com)
picard——修改BAM文件的Read Group - 簡書 (jianshu.com)
GATK4 —— Variant Calling (SNP+indel) - 簡書 (jianshu.com)
5.提取SNP
GATK4——gVCF轉(zhuǎn)VCF - 簡書 (jianshu.com)
GATK4 SelectVariants ——vcf文件提取SNP和indel - 簡書 (jianshu.com)
VCF文件質(zhì)控 —— VariantFiltration - 簡書 (jianshu.com)
6.ASE計數(shù)
SAMtools——bam文件合并 - 簡書 (jianshu.com)
ASE (等位基因特異性表達(dá))—— ASEReadCounter - 簡書 (jianshu.com)
7.ASE檢驗
GeneiASE —— ASE檢驗 - 簡書 (jianshu.com)
引用轉(zhuǎn)載請注明出處,如有錯誤敬請指出。