如何將核酸序列轉(zhuǎn)化為蛋白氨基酸序列(web tools篇)

在我們的工作中,常常會(huì)有將一段未知或已知核苷酸序列(DNA/RNA)翻譯成氨基酸序列的需求。如果編程基礎(chǔ)過(guò)硬的話,自己寫(xiě)個(gè)代碼翻譯三聯(lián)密碼子,正義鏈和反義鏈各三個(gè)移碼閱讀框。但是我們更多的時(shí)候,這種小的需求,根本不需要去寫(xiě)個(gè)腳本來(lái)解決,有很多在線的工具能夠幫我們做到這一點(diǎn)。在這里舉例說(shuō)明。

Tool 1: expasy翻譯組件

Expasy是一個(gè)包含很多工具的web tools集合,但我們這次用到的只是他的其中一個(gè)功能,即核酸序列翻譯功能。點(diǎn)開(kāi)網(wǎng)頁(yè)https://web.expasy.org/translate/, 界面如下:

expasy translate功能界面

右邊可以選擇輸出文件的格式,以及從哪個(gè)鏈上尋找翻譯框,在不知道蛋白編碼方向的情況下,最好是全部選上。以水稻條紋病毒(RSV)的某個(gè)分離物的CP的基因序列為例(NCBI accession number: AY286101.1)。

當(dāng)我們將序列粘貼到框里之后,點(diǎn)擊translate按鈕,就會(huì)得到如下輸出:
AY286101.1序列翻譯結(jié)果

會(huì)輸出6個(gè)移碼閱讀框,然后結(jié)果就是3'-5'翻譯的那一條結(jié)果。


expasy可視化信息相對(duì)直接,但是它有一個(gè)壞處,即不支持批量提交。如果我們有成百上千條序列,expasy的功能就顯得比較不夠用了。接下來(lái)我們介紹另外一個(gè)支持多條序列同時(shí)翻譯的工具。

Too2 1: emboss下的transeq

EMBOSS是由EBI開(kāi)發(fā)的一個(gè)工具,既有本地版,也有在線版。

點(diǎn)開(kāi)https://www.ebi.ac.uk/Tools/st/emboss_transeq/, 會(huì)看到如下界面:

EMBOSS transeq輸入界面

可以直接粘貼或者上傳符合EMBOSS transeq支持的文件格式,EMBOSS支持的格式可以參考emboss支持格式鏈接,常見(jiàn)的raw sequence或者fasta格式的文件肯定格式可以支持的。

可以選擇All six frame, 也可以選擇某一條鏈的某一起始位點(diǎn)的移碼框,也可以選擇codon table, 然后點(diǎn)擊submit。任務(wù)就會(huì)被提交到后臺(tái)上,親測(cè)速度還是非??斓?。

最后輸出結(jié)果如下:

EMBOSS輸出結(jié)果如下

最后對(duì)每個(gè)序列都是輸出6個(gè)fasta, 對(duì)應(yīng)6種編碼框,然后可以將結(jié)果下載下來(lái)之后,移除錯(cuò)誤的編碼序列。將保留下來(lái)的序列去做進(jìn)化分析或者其他后續(xù)處理。


后記:工具很多,選擇自己習(xí)慣的就好。
Done.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容