1,人類所有基因蛋白序列下載
數(shù)據(jù)庫(kù)地址:https://www.uniprot.org/tool-dashboard
1)進(jìn)入網(wǎng)頁(yè),拉到最低端,點(diǎn)擊“Proteins (UniProtKB)”

image.png
選擇展示形式,個(gè)人喜歡table

image.png
2)選定物種和子庫(kù)(Swiss-Prot是校準(zhǔn)過的庫(kù))

image.png
3)選擇需要下載的信息

image.png

image.png
選擇好后點(diǎn)“save”
4)選擇下載格式

image.png

image.png
可以通過預(yù)覽看看格式和內(nèi)容是不是你要的:

image.png
確定后點(diǎn)擊“download”
至此人類所有蛋白序列下載完成。其實(shí)除了蛋白序列外能下載的注釋信息還挺多,根據(jù)需要進(jìn)行下載吧~
2,獲取gene name、uniprotID、ensmbleID間對(duì)應(yīng)關(guān)系
你關(guān)注的基因列表可能是gene name,可能是uniprotID,可能是ensmbleID。。。。那么接下來你可能需要獲取ID間的對(duì)應(yīng)關(guān)系或者進(jìn)行ID轉(zhuǎn)換。推薦一個(gè)在線轉(zhuǎn)換ID的工具gprofiler。
工具地址:https://biit.cs.ut.ee/gprofiler/convert
1)進(jìn)入網(wǎng)頁(yè)

image.png
鍵入基因列表,選擇物種和目標(biāo)數(shù)據(jù)庫(kù):

image.png
結(jié)果:

image.png
導(dǎo)出即可。