- variable sites
- informative sites
- nucleotide diversity
信息位點(diǎn)的定義:
在兩個(gè)及以上分類單元(的序列)中存在差異,且其中至少有兩種變異類型在該位點(diǎn)出現(xiàn)兩次及以上(雖然有了定義自己還是不太明白)
摘自 高老師的系統(tǒng)發(fā)育分析完整教程
三個(gè)名詞的概念自己還不太理解,先把如何計(jì)算的過程記錄下來,以論文 comparative analysis of six lagetstroemia complete chloroplast genome 中提到的六個(gè)紫薇屬葉綠體基因組序列為例,使用mafft進(jìn)行比對(duì),然后計(jì)算上面三個(gè)指標(biāo)(論文中的Table4)。
使用之前提到的python腳本下載六種紫薇屬植物的葉綠體基因組序列 簡(jiǎn)單的python腳本批量下載葉綠體基因組序列
| species | accession number |
|---|---|
| L.fauriei | KT358807 |
| L.indica | KX263727 |
| L.guilinensis | KU885923 |
| L.indica “LüzhaoHongdie” | KF572028 |
| L.subcostata | KF572029 |
| L.speciosa | KX572149 |
第一種方法使用DNAsp軟件
1、點(diǎn)擊file——open data file讀入比對(duì)好的數(shù)據(jù)
2、點(diǎn)擊Data——format,依次選擇haploid,chloroplast,點(diǎn)擊OK
30.PNG
輸出的結(jié)果包括位點(diǎn)總數(shù)(這里需要注意的是DnaSp這個(gè)軟件計(jì)算的總位點(diǎn)數(shù)是去掉gap以后的)非變異位點(diǎn);變異位點(diǎn);singleton variable sites(這個(gè)不知道是什么意思);有效位點(diǎn)數(shù)(parsimony informative sites);計(jì)算出來的結(jié)果和文章中的Table4有些出入,暫時(shí)還沒有想到原因
4、點(diǎn)擊analysis——DNA polymorphism 計(jì)算核苷酸多態(tài)性
32.PNG
第二種方法使用IQ-tree
IQ-tree是用來構(gòu)建最大似然樹(ML)的一款軟件,閱讀幫助文檔時(shí)發(fā)現(xiàn)IQ-tree也可以用來計(jì)算有效位點(diǎn)的數(shù)量,使用到的參數(shù)
iqtree -s example.phy -m JC -n 0 -alninfo
-s 指定輸入文件
-m 指定模型
-n 暫時(shí)不知道是什么作用 <#iterations> Fix number of iterations to stop (default: auto)
-alninfo 將統(tǒng)計(jì)結(jié)果輸出到 .alninfo 文件中 Print alignment site statistics to .alninfo file
31.PNG
結(jié)果和第一種方法也不太一樣
第三種方法使用在線程序https://indra.mullins.microbiol.washington.edu/DIVEIN/
這種方法和第二種輸出的結(jié)果是一致的