1,ORF簡(jiǎn)介
開放閱讀框(Open Reading Frame,ORF)從起始密碼子開始,到終止密碼子結(jié)束的連續(xù)堿基序列,具有蛋白質(zhì)編碼潛能。由于密碼子(codon)讀寫起始位點(diǎn)的不同,mRNA序列可能按照6種ORF閱讀和翻譯。如圖1所示,對(duì)于序列1,可以從A開始讀,也可以從T開始讀,也可以從G開始讀,因此一條序列上就有3種讀碼方式。同樣的,互補(bǔ)鏈上也有3種,共6種ORF閱讀方式。理論上,6種讀碼框都有“開放”的可能,但是現(xiàn)實(shí)世界中,生物體一般會(huì)使用不多于2個(gè)“開放讀碼框”。

圖1. 6種讀碼框示意圖
2,NCBI ORFfinder
ORF識(shí)別是確定哪種開放閱讀框?qū)?yīng)真正的多肽編碼序列的過(guò)程。NCBI ORFfinder為最常用的ORF預(yù)測(cè)在線工具,使用也非常簡(jiǎn)單。
2.1,打開NCBI ORFfinder網(wǎng)站
在瀏覽器中輸入網(wǎng)站:https://www.ncbi.nlm.nih.gov/orffinder/

圖2. NCBI ORFfinder
2.2,粘貼序列并選擇參數(shù)
Fasta格式文件是存儲(chǔ)核酸或者蛋白質(zhì)序列的一種標(biāo)準(zhǔn)格式。是以大于號(hào)“>”開頭,后邊接序列名字為第一行,其余行為序列的一種標(biāo)準(zhǔn)序列存儲(chǔ)文件格式。如圖所示:

圖3. Fasta格式序列
這個(gè)文件中包含兩條序列,一條是seq1,一條是seq2。
進(jìn)行ORFfinder預(yù)測(cè)時(shí),我們要將fasta格式的序列拷貝粘貼到輸入框中(一次一條)。
這里我們粘貼來(lái)自lncipedia(https://lncipedia.org/,lncRNA百科全書網(wǎng)站)的一條lncRNA序列PITPNM2-AS1:6進(jìn)行預(yù)測(cè)。然后選擇參數(shù)(一般默認(rèn))。最后點(diǎn)擊提交按鈕,等候幾秒鐘后會(huì)出現(xiàn)結(jié)果。

圖4. NCBI ORFfinder序列提交及參數(shù)選擇
2.3,結(jié)果查看
結(jié)果包括:
1,預(yù)測(cè)的ORFs
2,6種讀碼框(需要點(diǎn)擊Six-frame translation處按鈕才顯示)
3,每個(gè)預(yù)測(cè)的ORF所處的讀碼框、坐標(biāo)及長(zhǎng)度(核苷酸|氨基酸),可以下載查看具體核酸序列及氨基酸序列等
4,對(duì)應(yīng)的氨基酸序列,可以進(jìn)行blast等操作

圖5. NCBI ORFfinder結(jié)果
然而,相較于舊版ORFfinder(圖5),新版NCBI ORFfinder的結(jié)果不好在論文中展示??鄬o(wú)果后,我們參考文獻(xiàn)中舊版ORFfinder的樣式,開發(fā)了在線ORFfinder結(jié)果可視化功能。

圖6. 舊版NCBI ORFfinder結(jié)果
3,ORFfinder在線可視化(仿舊版)
3.1,打開繪圖頁(yè)面
微生信-在線NCBI ORFfinder結(jié)果可視化 (bioinformatics.com.cn)

圖7. ORFfinder可視化頁(yè)面
3.2,拷貝示例數(shù)據(jù)
下載示例數(shù)據(jù),該模塊的輸入為第一個(gè)sheet的內(nèi)容。
(可以將第2個(gè)sheet的序列提交到NCBI ORFfinder,默認(rèn)參數(shù),獲得sheet1的內(nèi)容)。

圖8. 輸入數(shù)據(jù)示例
第一列為ORF的名字(label),第二列為鏈(Strand),第三列為讀碼框編號(hào)(Frame),第4、5列為ORF的起始和終止坐標(biāo),第6列為長(zhǎng)度,包括核酸和蛋白的長(zhǎng)度。
3.3,粘貼示例數(shù)據(jù)
必需輸入包括兩個(gè):1,orffinder的結(jié)果,2,序列總長(zhǎng)度(可由NCBI ORFfinder結(jié)果中查到)

圖9. 必需輸入
3.4,修改參數(shù),并提交

圖10. 顏色等參數(shù)
開放了圖片尺寸,ORF顏色,最長(zhǎng)ORF顏色等參數(shù),以滿足不同的繪圖需求。
3.5,提交出圖
結(jié)交約3秒后,在頁(yè)面右側(cè)出現(xiàn)結(jié)果預(yù)覽圖,其中最長(zhǎng)ORF用紫紅色標(biāo)注。我們提供了4種圖片格式供下載使用,兩種矢量圖(pdf,svg)和兩種標(biāo)量圖(600 dpi tiff和300 dpi png)。

圖11. 仿ORFfinder舊版可視化結(jié)果
注意:舊版中坐標(biāo)小的在左側(cè),大的在右側(cè),跟新版略有不同。這里使用的左側(cè)小,右側(cè)大的排序方式。
沒(méi)有預(yù)覽就是沒(méi)有出圖,這時(shí)請(qǐng)參考示例數(shù)據(jù),檢查輸入數(shù)據(jù)格式!
遇到文字截?cái)?,需要修改字體、調(diào)整字體大小等,使用scape 軟件。