序列比對(duì)后計(jì)算變異位點(diǎn),有效位點(diǎn),核苷酸多樣性

  • variable sites
  • informative sites
  • nucleotide diversity

信息位點(diǎn)的定義:

在兩個(gè)及以上分類單元(的序列)中存在差異,且其中至少有兩種變異類型在該位點(diǎn)出現(xiàn)兩次及以上(雖然有了定義自己還是不太明白)
摘自 高老師的系統(tǒng)發(fā)育分析完整教程

三個(gè)名詞的概念自己還不太理解,先把如何計(jì)算的過程記錄下來,以論文 comparative analysis of six lagetstroemia complete chloroplast genome 中提到的六個(gè)紫薇屬葉綠體基因組序列為例,使用mafft進(jìn)行比對(duì),然后計(jì)算上面三個(gè)指標(biāo)(論文中的Table4)。
使用之前提到的python腳本下載六種紫薇屬植物的葉綠體基因組序列 簡(jiǎn)單的python腳本批量下載葉綠體基因組序列

species accession number
L.fauriei KT358807
L.indica KX263727
L.guilinensis KU885923
L.indica “LüzhaoHongdie” KF572028
L.subcostata KF572029
L.speciosa KX572149
第一種方法使用DNAsp軟件

1、點(diǎn)擊file——open data file讀入比對(duì)好的數(shù)據(jù)
2、點(diǎn)擊Data——format,依次選擇haploid,chloroplast,點(diǎn)擊OK

3、點(diǎn)擊 analysis——polymorphic sites,點(diǎn)擊OK即可輸出結(jié)果
30.PNG

輸出的結(jié)果包括位點(diǎn)總數(shù)(這里需要注意的是DnaSp這個(gè)軟件計(jì)算的總位點(diǎn)數(shù)是去掉gap以后的)非變異位點(diǎn);變異位點(diǎn);singleton variable sites(這個(gè)不知道是什么意思);有效位點(diǎn)數(shù)(parsimony informative sites);計(jì)算出來的結(jié)果和文章中的Table4有些出入,暫時(shí)還沒有想到原因
4、點(diǎn)擊analysis——DNA polymorphism 計(jì)算核苷酸多態(tài)性
32.PNG
第二種方法使用IQ-tree

IQ-tree是用來構(gòu)建最大似然樹(ML)的一款軟件,閱讀幫助文檔時(shí)發(fā)現(xiàn)IQ-tree也可以用來計(jì)算有效位點(diǎn)的數(shù)量,使用到的參數(shù)

iqtree -s example.phy -m JC -n 0 -alninfo

-s 指定輸入文件
-m 指定模型
-n 暫時(shí)不知道是什么作用 <#iterations> Fix number of iterations to stop (default: auto)
-alninfo 將統(tǒng)計(jì)結(jié)果輸出到 .alninfo 文件中 Print alignment site statistics to .alninfo file
31.PNG

結(jié)果和第一種方法也不太一樣

第三種方法使用在線程序https://indra.mullins.microbiol.washington.edu/DIVEIN/

這種方法和第二種輸出的結(jié)果是一致的

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容