miRNA-seq數(shù)據(jù)分析——學(xué)習(xí)筆記

@(我的第一個(gè)筆記本)[馬克飛象, 幫助, Markdown]

bugu,2020.11.16
記錄miRNA-seq數(shù)據(jù)分析方法 ,參考jm生信技能樹的—— 構(gòu)建miRNA-seq數(shù)據(jù)分析環(huán)境

step1:使用TBtools小工具sRNAseqAdaperRemover去除測(cè)序原始數(shù)據(jù)接頭,參考——[小RNA數(shù)據(jù)分析-第一步(去除測(cè)序數(shù)據(jù)接頭)](file:///F:/%E4%B8%8B%E8%BD%BD/%E7%BD%91%E9%A1%B5/%E5%B0%8FRNA%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90-%E7%AC%AC%E4%B8%80%E6%AD%A5.html)

TBtools=java -cp /home/test/software/TBtools_JRE1.6.jar
ls *.gz\
while read i\
do "$TBtools" biocjava.sRNA.Tools.sRNAseqAdaperRemover\
        --inFxFile "$i"\
        --outFaFile "${i%%_*}".filter.fasta\
done

Step2:利用seqkit過濾掉小于18bp,大于40bp的片段

ls *fasta |\
while read i;\
do  seqkit seq -m 18 "$i" |\
    seqkit seq -M 40 > "${i%%.*}"_filter.fasta ;\
done

Step3:利用bowtie比對(duì)到B73參考基因組

dir=/home/test/workspace/05.miRNA
reference=/home/test/data/genome/zeamays/index_bowtie

ls *fasta |\
while read i ; \
do
bowtie -f -S -p 24 -M 1 --best --strata "$reference"/Zea_mays "$dir"/1_q_adapter_data/"$i" | samtools view -Sb -o ../2_align/"${i%%.*}".bam 2>log
done

Step4:使用featureCounts進(jìn)行定量

featureCounts -T 4 -F gff  -M -t miRNA_primary_transcript  -g Name  -a zma.gff3 -o all.counts.hairpin.txt *.bam 1>counts.log 2>&1 

Step5:使用DESeq2進(jìn)行差異分析

library(DESeq2)

data = read.table("de_analysis/read_count_MIR_extract.txt", header=T, row.names=1, com='')
col_ordering = c(1,2,3,4,5,6)
rnaseqMatrix = data[,col_ordering]
rnaseqMatrix = round(rnaseqMatrix)
rnaseqMatrix = rnaseqMatrix[rowSums(rnaseqMatrix)>=2,]
conditions = data.frame(conditions=factor(c(rep("Chang72", 3), rep("Fan", 3))))
rownames(conditions) = colnames(rnaseqMatrix)
ddsFullCountTable <- DESeqDataSetFromMatrix(
    countData = rnaseqMatrix,
    colData = conditions,
    design = ~ conditions)
dds = DESeq(ddsFullCountTable)
res = results(dds)
baseMeanA <- rowMeans(counts(dds, normalized=TRUE)[,colData(dds)$condition == "Chang72"])
baseMeanB <- rowMeans(counts(dds, normalized=TRUE)[,colData(dds)$condition == "Fan"])
res = cbind(baseMeanA, baseMeanB, as.data.frame(res))
res = cbind(id=rownames(res), as.data.frame(res))
res$padj[is.na(res$padj)]  <- 1
write.table(as.data.frame(res[order(res$pvalue),]), file='Chang72_vs_Fan.txt', sep='    ', quote=FALSE, row.names=F)
#source("/disks/workin/zwm/miniconda3/opt/trinity-2.1.1/Analysis/DifferentialExpression/R/rnaseq_plot_funcs.R")
#pdf("read_count_extrat.txt.COI_vs_Col_Na.DESeq2.DE_results.MA_n_Volcano.pdf")
#plot_MA_and_Volcano(log2(res$baseMean+1), res$log2FoldChange, res$padj)
#dev.off()
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容