NCBI ORFfinder結(jié)果在線可視化

1,ORF簡(jiǎn)介

開放閱讀框(Open Reading Frame,ORF)從起始密碼子開始,到終止密碼子結(jié)束的連續(xù)堿基序列,具有蛋白質(zhì)編碼潛能。由于密碼子(codon)讀寫起始位點(diǎn)的不同,mRNA序列可能按照6種ORF閱讀和翻譯。如圖1所示,對(duì)于序列1,可以從A開始讀,也可以從T開始讀,也可以從G開始讀,因此一條序列上就有3種讀碼方式。同樣的,互補(bǔ)鏈上也有3種,共6種ORF閱讀方式。理論上,6種讀碼框都有“開放”的可能,但是現(xiàn)實(shí)世界中,生物體一般會(huì)使用不多于2個(gè)“開放讀碼框”。

圖1. 6種讀碼框示意圖

2,NCBI ORFfinder

ORF識(shí)別是確定哪種開放閱讀框?qū)?yīng)真正的多肽編碼序列的過(guò)程。NCBI ORFfinder為最常用的ORF預(yù)測(cè)在線工具,使用也非常簡(jiǎn)單。


2.1,打開NCBI ORFfinder網(wǎng)站

在瀏覽器中輸入網(wǎng)站:https://www.ncbi.nlm.nih.gov/orffinder/

圖2. NCBI ORFfinder

2.2,粘貼序列并選擇參數(shù)

Fasta格式文件是存儲(chǔ)核酸或者蛋白質(zhì)序列的一種標(biāo)準(zhǔn)格式。是以大于號(hào)“>”開頭,后邊接序列名字為第一行,其余行為序列的一種標(biāo)準(zhǔn)序列存儲(chǔ)文件格式。如圖所示:

圖3. Fasta格式序列

這個(gè)文件中包含兩條序列,一條是seq1,一條是seq2。

進(jìn)行ORFfinder預(yù)測(cè)時(shí),我們要將fasta格式的序列拷貝粘貼到輸入框中(一次一條)。

這里我們粘貼來(lái)自lncipedia(https://lncipedia.org/,lncRNA百科全書網(wǎng)站)的一條lncRNA序列PITPNM2-AS1:6進(jìn)行預(yù)測(cè)。然后選擇參數(shù)(一般默認(rèn))。最后點(diǎn)擊提交按鈕,等候幾秒鐘后會(huì)出現(xiàn)結(jié)果。


圖4. NCBI ORFfinder序列提交及參數(shù)選擇

2.3,結(jié)果查看

結(jié)果包括:

1,預(yù)測(cè)的ORFs

2,6種讀碼框(需要點(diǎn)擊Six-frame translation處按鈕才顯示)

3,每個(gè)預(yù)測(cè)的ORF所處的讀碼框、坐標(biāo)及長(zhǎng)度(核苷酸|氨基酸),可以下載查看具體核酸序列及氨基酸序列等

4,對(duì)應(yīng)的氨基酸序列,可以進(jìn)行blast等操作


圖5. NCBI ORFfinder結(jié)果

然而,相較于舊版ORFfinder(圖5),新版NCBI ORFfinder的結(jié)果不好在論文中展示??鄬o(wú)果后,我們參考文獻(xiàn)中舊版ORFfinder的樣式,開發(fā)了在線ORFfinder結(jié)果可視化功能。

圖6. 舊版NCBI ORFfinder結(jié)果

3,ORFfinder在線可視化(仿舊版)

3.1,打開繪圖頁(yè)面

微生信-在線NCBI ORFfinder結(jié)果可視化 (bioinformatics.com.cn)

圖7. ORFfinder可視化頁(yè)面

3.2,拷貝示例數(shù)據(jù)

下載示例數(shù)據(jù),該模塊的輸入為第一個(gè)sheet的內(nèi)容。

(可以將第2個(gè)sheet的序列提交到NCBI ORFfinder,默認(rèn)參數(shù),獲得sheet1的內(nèi)容)。

圖8. 輸入數(shù)據(jù)示例

第一列為ORF的名字(label),第二列為鏈(Strand),第三列為讀碼框編號(hào)(Frame),第4、5列為ORF的起始和終止坐標(biāo),第6列為長(zhǎng)度,包括核酸和蛋白的長(zhǎng)度。

3.3,粘貼示例數(shù)據(jù)

必需輸入包括兩個(gè):1,orffinder的結(jié)果,2,序列總長(zhǎng)度(可由NCBI ORFfinder結(jié)果中查到)

圖9. 必需輸入

3.4,修改參數(shù),并提交

圖10. 顏色等參數(shù)

開放了圖片尺寸,ORF顏色,最長(zhǎng)ORF顏色等參數(shù),以滿足不同的繪圖需求。

3.5,提交出圖

結(jié)交約3秒后,在頁(yè)面右側(cè)出現(xiàn)結(jié)果預(yù)覽圖,其中最長(zhǎng)ORF用紫紅色標(biāo)注。我們提供了4種圖片格式供下載使用,兩種矢量圖(pdf,svg)和兩種標(biāo)量圖(600 dpi tiff和300 dpi png)。

圖11. 仿ORFfinder舊版可視化結(jié)果

注意:舊版中坐標(biāo)小的在左側(cè),大的在右側(cè),跟新版略有不同。這里使用的左側(cè)小,右側(cè)大的排序方式。


沒(méi)有預(yù)覽就是沒(méi)有出圖,這時(shí)請(qǐng)參考示例數(shù)據(jù),檢查輸入數(shù)據(jù)格式!

遇到文字截?cái)?,需要修改字體、調(diào)整字體大小等,使用scape 軟件。




?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容