基因家族分析八(計(jì)算串聯(lián)重復(fù)基因KAKS值)

1.準(zhǔn)備文件

即要是1,2是一對(duì)串聯(lián)重復(fù),就將其放在一個(gè)文件內(nèi)。
在上一步獲得的文件,一對(duì)重復(fù)基因是一行,所以我們就將兩列一行轉(zhuǎn)為一列兩行,并以兩行為準(zhǔn)分割文件,最后利用生成的文件將序列提取出來。

$for i in repeat_gene_id; do awk '{print $0}' $i |xargs -n1 >$i.bed; done
split -l2 $I.bed
$seqkit grep -f 分割出來的文件  cds_hits > 分割出來的文件.fa

2.計(jì)算Kaks值

計(jì)算kaks值之前需要將序列比對(duì)。kaks自帶了將aln文件改為axt文件。

## 轉(zhuǎn)換格式
$~biosoft/KAKS_Calculator/KaKs_Calculator2.0/src/AXTConvertor xaa.aln xaa.axt

報(bào)錯(cuò)

打開這個(gè)axt文件,文件末尾會(huì)發(fā)現(xiàn)gap和別的比對(duì)上了。把多余的A及gap刪掉。


修改之后



再次運(yùn)行



結(jié)果文件
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容