步驟:
(0)perl 手動去除第一行index六個堿基
(1)去除低質(zhì)量的reads(質(zhì)量值Q≤19的堿基占總堿基的50%以上);
(2)默認(rèn)參數(shù)滑窗去掉質(zhì)量低的堿基,最終去除長度小于100的reads
(3)去除含N比例大于5%的Reads;
(4)去除與核糖體RNA(rRNA)匹配的Reads #sortmerna
(5)質(zhì)量評估:fastqc
#工具:選一種即可
conda install -c trimmomatic
conda install fastp
#參數(shù):
fastp --detect_adapter_for_pe -l 100 -q 19 -u 50 -i ~/CK18_1.fq.gz -o CK18c_1.fq.gz -I ~/CK18_2.fq.gz -O CK18c_2.fq.gz \
#或者:
trimmomatic PE -phred33 CK18_1.fq.gz CK18_2.fq.gz CK18_1paired.fq.gz CK18_1unpaired.fq.gz CK18_2paired.fq.gz CK18_2unpaired.fq.gz ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:19 MINLEN:50
#質(zhì)量評估:fastqc
fastqc -o ./ -t 4 ./ CK18c_11.fq.gz
附:
1.轉(zhuǎn)換注釋文件格式(gtf或gff3)使用Cufflinks里面的工具gffread:
#gff2gtf
gffread my.gff3 -T -o my.gtf
#gtf2gff
gffread merged.gtf -o- > merged.gff3