跨物種直系同源基因比對(duì)

這里還是以草魚(yú)和人類比較

1. Orthofinder

是看了一篇2021在NC上發(fā)表的11個(gè)非模式物種單細(xì)胞圖譜,其中涉及到跨物種的一個(gè)比對(duì)方法。

Orthofinder.png

Orthofinder使用參考:http://www.itdecent.cn/p/4d29d24883d2

①軟件安裝

#直接通過(guò)conda下載
conda install orthofinder

②數(shù)據(jù)準(zhǔn)備

人類蛋白組:Uniport上面雖然是7w(包括duplicated),但是實(shí)際下載下來(lái)是去冗余的結(jié)果。
https://www.uniprot.org/proteomes/UP000005640
草魚(yú)蛋白組
這兩個(gè)放到一個(gè)文件夾內(nèi)

③分析

orthofinder -f Dataset -S diamond

④處理

結(jié)果文件.png

結(jié)果文件是包括這些的,文章里面說(shuō)找到Single-copy orthologs,那其實(shí)剛好有一個(gè)文件,但是打開(kāi)之后只有前面的序列號(hào),沒(méi)有匹配好的草魚(yú)和人的基因名稱。所以還是要把總文件Orthogroups.csvSingleCopyOrthogroups.txt匹配一下。

grep -f SingleCopyOrthogroups.txt Orthogroups.csv > SingleOrthogroup.csv
匹配的結(jié)果.png

但是第三列還是不是干凈的人類的基因名稱,同時(shí)刪除第一列

less -S SingleOrthogroup.csv | cut -d '|' -f 3 |cut -d '_' -f 1 > name.txt
less -S SingleOrthogroup.csv | cut -f 2 >gene.txt
paste gene.txt name.txt > human_grasscarp_orthofinder.txt
最后得到的結(jié)果.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容