這里還是以草魚(yú)和人類比較
1. Orthofinder
是看了一篇2021在NC上發(fā)表的11個(gè)非模式物種單細(xì)胞圖譜,其中涉及到跨物種的一個(gè)比對(duì)方法。

Orthofinder.png
Orthofinder使用參考:http://www.itdecent.cn/p/4d29d24883d2
①軟件安裝
#直接通過(guò)conda下載
conda install orthofinder
②數(shù)據(jù)準(zhǔn)備
人類蛋白組:Uniport上面雖然是7w(包括duplicated),但是實(shí)際下載下來(lái)是去冗余的結(jié)果。
https://www.uniprot.org/proteomes/UP000005640
草魚(yú)蛋白組
這兩個(gè)放到一個(gè)文件夾內(nèi)
③分析
orthofinder -f Dataset -S diamond
④處理

結(jié)果文件.png
結(jié)果文件是包括這些的,文章里面說(shuō)找到Single-copy orthologs,那其實(shí)剛好有一個(gè)文件,但是打開(kāi)之后只有前面的序列號(hào),沒(méi)有匹配好的草魚(yú)和人的基因名稱。所以還是要把總文件Orthogroups.csv和SingleCopyOrthogroups.txt匹配一下。
grep -f SingleCopyOrthogroups.txt Orthogroups.csv > SingleOrthogroup.csv

匹配的結(jié)果.png
但是第三列還是不是干凈的人類的基因名稱,同時(shí)刪除第一列
less -S SingleOrthogroup.csv | cut -d '|' -f 3 |cut -d '_' -f 1 > name.txt
less -S SingleOrthogroup.csv | cut -f 2 >gene.txt
paste gene.txt name.txt > human_grasscarp_orthofinder.txt

最后得到的結(jié)果.png