kallisto是一種高效、消耗內(nèi)存小的RNA-seq分析軟件,具體原理可見https://blog.csdn.net/qq_35610231/article/details/88556422
和以往分析流程不同的是,kallisto不需要匹配到基因組某個位置,而是通過pattern將reads直接匹配到轉(zhuǎn)錄組某個轉(zhuǎn)錄本上,不需要具體匹配位置?;诘姆治龉剑篟NA-seq分析時匹配到轉(zhuǎn)錄本的具體位置并不影響map到該轉(zhuǎn)錄本的reads數(shù)目。
#下載基因組數(shù)據(jù),注意kallisto只需要轉(zhuǎn)錄本的序列
cd ~/refs
URL=ftp://ftp.ensembl.org/pub/release-96/fasta/homo_sapiens/cdna/Homo_sapiens.GRCh38.cdna.all.fa.gz
wget -nc $URL
gunzip -k -f ${URL##*/}
#建立index
REF=~/refs/Homo_sapiens.GRCh38.cdna.all.fa
IDX=~/refs/Homo_sapiens.GRCh38.cdna.all.idx
kallisto index -i $IDX $REF
#雙端測序reads比較
SRR=SRR3191542
R1=reads/${SRR}_1.fastq
R2=reads/${SRR}_2.fastq
kallisto quant -i $IDX -o results/$SRR $R1 $R2
#單端測序reads需要提供更多參數(shù),-l,-s可以自己選擇,這里輸入默認參數(shù)
kallisto quant -i $IDX -o results/$SRR --single -l 187 -s 70 $R1