學(xué)習(xí)筆記-2-samtools的安裝和使用

1.安裝samtools環(huán)境
sudo apt install samtools
samtools
samtools view

(安裝完成)

2. SAM格式轉(zhuǎn)為BAM格式

為參考基因組建立索引,生成了prefix.fai文件

samtools faidx GCA_000012525.1_ASM1252v1_genomic.fna
less GCA_000012525.1_ASM1252v1_genomic.fna.fai
1.png
2.png
SAM2BAM
sam文件轉(zhuǎn)為bam文件

samtools view -bhS -t GCA_000012525.1_ASM1252v1_genomic.fna.fai -o PCC7942_bwa.bam PCC7942_bwa.sam #(最后這個sam文件用自己目錄的sam文件名)

3.png

(改為samtools view -bhS -t GCA_000012525.1_ASM1252v1_genomic.fna.fai -o PCC7942_bwa.bam test _bwa_P7942_bwa.sam
查看less PCC7942_bwa.bam

為bam文件排序,sort只能為bam文件排序,而不能為sam;不同版本samtools sort命令的-o參數(shù)不同

samtools sort PCC7942_bwa.bam -o PCC7942_bwa.bam.sorted
samtools index PCC7942_bwa.bam.sorted

統(tǒng)計比對結(jié)果
samtools depth PCC7942_bwa.bam.sorted>depth.txt
less depth.txt
samtools flagstat PCC7942_bwa.bam.sorted
26.png
3. 查看比對結(jié)果
(1)samtools tview

samtools tview PCC7942_bwa.bam.sorted GCA_000012525.1_ASM1252v1_genomic.fna

27.png

g, 輸入:CP000100.1:1000
28.png

(2) artemis

https://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/014/698/905/GCA_014698905.1_ASM1469890v1/GCA_014698905.1_ASM1469890v1_genomic.gff.gz
Open, GCA_000012525.1_ASM1252v1_genomic.fna文件

a1.png

Read an entry, GCA_000012525.1_ASM1252v1_genomic.gff


33.png

Read Bam/vcf, PCC7942_bwa.bam.sorted (必須是排序、索引后的bam)


35.png

37.png
38.png

4. BAM2BCF

samtools mpileup -f GCA_000012525.1_ASM1252v1_genomic.fna PCC7942_bwa.bam.sorted >bcf.txt
less bcf.txt

211.png

212.png

samtools mpileup -gf GCA_000012525.1_ASM1252v1_genomic.fna PCC7942_bwa.bam.sorted>PCC7942_bwa.bcf
less PCC7942_bwa.bcf

213.png

214.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 基因組重測序數(shù)據(jù)目的:需要檢測基因組中的變異,找到并定位這些突變位點 條件:參考基因組、重測序數(shù)據(jù)、 分析流程: ...
    古月福_閱讀 3,098評論 1 2
  • 本學(xué)期在學(xué)習(xí)談老師講的基因組重測序數(shù)據(jù)比對和變異檢測軟件這一章時,我們了解到了短序列比對軟件主要有以下幾種: 其...
    可堪醉臥_b370閱讀 4,895評論 2 5
  • 我通過查資料獲得已知達(dá)松維爾擬諾卡氏菌亞種(cardiopsis dassonvillei subsp. dass...
    lizg閱讀 11,842評論 2 37
  • Part1 數(shù)據(jù)下載 先去Korean Personal Genome Project下載了編號為KPGP-00...
    天秤座的機器狗閱讀 19,361評論 5 97
  • 16宿命:用概率思維提高你的勝算 以前的我是風(fēng)險厭惡者,不喜歡去冒險,但是人生放棄了冒險,也就放棄了無數(shù)的可能。 ...
    yichen大刀閱讀 7,787評論 0 4

友情鏈接更多精彩內(nèi)容