記錄用過的一些生信軟件吧
FastX格式處理系列
- 截取數(shù)據(jù)量軟件seqtk sample
$ seqtk sample
Usage: seqtk sample [-2] [-s seed=11] <in.fa> <frac>|<number>
Options: -s INT RNG seed [11]
-2 2-pass mode: twice as slow but with much reduced memory
舉例:
seqtk sample -s100 test.fq.gz 5242880 | pigz -p 4 > test.clean.fq.gz
- seqtk trimfq
也是非??焖俚囊豢钐幚韋asta/q文件的工具,可以截取數(shù)據(jù)量,
$ seqtk trimfq
Usage: seqtk trimfq [options] <in.fq>
Options: -q FLOAT error rate threshold (disabled by -b/-e) [0.05]
-l INT maximally trim down to INT bp (disabled by -b/-e) [30]
-b INT trim INT bp from left (non-zero to disable -q/-l) [0]
-e INT trim INT bp from right (non-zero to disable -q/-l) [0]
-L INT retain at most INT bp from the 5'-end (non-zero to disable -q/-l) [0]
-Q force FASTQ output
例如:read長度為400bp,需要截取前150bp,可以設(shè)置-e是從后端開始截取250bp,剩下的就是前150bp。
seqtk trimfq -e 250 RP01G9E1L1_R1.fq.gz >trimed_RP01G9E1L1_R1.fq
例如: read長度為400bp,需要丟掉前30bp,保留后面370bp,則可以設(shè)置-b參數(shù)
seqtk trimfq -b 30 G19E1L1_1.fq.gz > >test.fq
將fastq轉(zhuǎn)換為fasta
seqkit fq2fa ../02.align/RP01G9E1L3_R1.fq.gz >RP01G9E1L3_R1.faannovar使用說明
http://www.itdecent.cn/p/9b5719304311call variant 軟件:GATK4 使用說明
做WGS,或小型變異檢測
WES somatic variation pipeline正在制作中。華大主流過濾測序數(shù)據(jù)軟件:SOAPnuke使用說明
soapnuke 報錯Segmentation fault,一般是fastq內(nèi)容有問,檢測fastq文件,可嘗試用gzip -f -d -c ./a_1.fastq.gz > a_1.fastq 看看是否能夠解壓。如果報錯 invalid compressed data--format violatedfastqc 原始數(shù)據(jù)質(zhì)量值網(wǎng)頁顯示報告
用法:fastqc *.fq.gz數(shù)據(jù)中的adapter處理:cutadapt
http://www.itdecent.cn/p/412e55040358
比對軟件系列:
任何項目都離不開的比對軟件:bwa使用說明:
http://www.itdecent.cn/p/67b203cc0779比對軟件之一 :STAR
http://www.itdecent.cn/p/294eadc1fc5a
bowtie/bowtie2
http://www.itdecent.cn/p/67b203cc0779tophat
幾乎每天都在用的samtools 使用說明:
http://www.itdecent.cn/p/67b203cc0779bam進行統(tǒng)計的軟件:bamdst使用說明:
不怎么好用bedtools
見筆記 bedtools 使用教程。blast
見筆記blast用法匯總http://www.itdecent.cn/p/13e0a0fdb419
- igblast
見筆記 http://www.itdecent.cn/p/1a12a332ca47
reference 相關(guān)
單細胞測序系列
indrop
zUMIS軟件的使用,
10x數(shù)據(jù) cellranger的使用
cellranger http://www.itdecent.cn/p/21816b67f2df
-
T細胞B細胞重構(gòu)CDR3的軟件: mixcr
mixcr非常簡單易用,它的主要功能是能重構(gòu)出CDR序列。 用法主要有三個步驟: 1,align 2,assemble 3,export
自己寫的一些工具:
將fasta模擬成fastq數(shù)據(jù)格式
http://www.itdecent.cn/p/4181ac1b0c4e按比例合并兩個fastq
http://www.itdecent.cn/p/a50092052552比較兩個文件中某兩列是否有交集
https://github.com/levinyi/scripts/blob/master/compare.py
http://www.itdecent.cn/p/e097c9e0789bfastq中提取百分比數(shù)據(jù):
http://www.itdecent.cn/p/ea4ae03a9eb2提取fastq或fasta格式的數(shù)據(jù):
http://www.itdecent.cn/p/22051fc6e0a3將fastq中的序列進行反向互補,并將quality反向,仍然輸出fastq格式。
complement_reverse_Fastq_2_Fastq.pyR 畫venn圖,兩個,三個,四個,五個都能畫。
http://www.itdecent.cn/p/05f4bae28443兩組數(shù)據(jù)計算相關(guān)性
http://www.itdecent.cn/p/66c0448f44f3
持續(xù)更新中。。。
上一次更新:2019-08-01