exon,intron,CDs,UTR學(xué)習(xí)

題外話:Python中可通過(guò)Lib目錄下的idlelib子目錄下的idle.pyw或者idle.py進(jìn)入Python的IDLE界面

DNA中的基因可以分為編碼區(qū)和非編碼區(qū),編碼區(qū)包含著外顯子和內(nèi)含子,經(jīng)研究目前發(fā)現(xiàn)一般非編碼區(qū)具有基因表達(dá)的調(diào)控功能,比如啟動(dòng)子在非編碼區(qū)。編碼區(qū)則轉(zhuǎn)錄為mRNA并可以最終翻譯為蛋白質(zhì)。

外顯子和內(nèi)含子都被轉(zhuǎn)錄到mRNA前體hnRNA中,當(dāng)hnRNA進(jìn)行剪切變?yōu)槌墒斓膍RNA時(shí),內(nèi)含子被切除,而外顯子被保留,實(shí)際上真正編碼蛋白質(zhì)的是外顯子,而內(nèi)含子則無(wú)編碼能力,

CDs全名Coding sequence, 是一段編碼蛋白產(chǎn)物的序列,Sequence coding for aminoacids in protein.與開(kāi)放式閱讀框有區(qū)別,開(kāi)放式閱讀框指的是從一個(gè)起始密碼子開(kāi)始到一個(gè)終止密碼子結(jié)束的一段序列,但是,不是所有的開(kāi)放式閱讀框都能被表達(dá)出蛋白產(chǎn)物,或者能表達(dá)出占有優(yōu)勢(shì)或者能產(chǎn)生生物學(xué)功能的蛋白。CDs是編碼一段蛋白產(chǎn)物的序列。CDs必定是一個(gè)ORF,也可能包括很多ORF,反之,每個(gè)ORF不一定都是CDs。

translation是理論上的,而transcription則顯然是事實(shí)存在的。

外顯子拼接形成成熟的mRNA,多數(shù)基因都有UTR(非翻譯區(qū)),它們也是外顯子拼接的產(chǎn)物,所以,你會(huì)發(fā)現(xiàn)mRNA的長(zhǎng)度要大于CDs,只有CDs才編碼蛋白,AUG以前的mRNA編碼前導(dǎo)序列。

外顯子并不一定編碼蛋白質(zhì),成熟mRNA的UTR也可以是外顯子,外顯子就是RNA剪接后留下的部分

外顯子與CDs區(qū)不是完全一致的,CDs區(qū)一定屬于外顯子,但是外顯子不一定是CDs區(qū),也就是說(shuō)外顯子不一定都能翻譯成蛋白的。mRNA包括UTR和CDS!

hnRNA(DNA直接轉(zhuǎn)錄成的RNA)hnRNA heterogeneous nuclear RNA系heterogeneous?nuclear之縮寫。核內(nèi)不均一RNA為存在于真核生物細(xì)胞核中的不穩(wěn)定、大小不均的一組高分子RNA(分子量約為105~2×107,沉降系數(shù)約為30—100S)之總稱。占細(xì)胞全部RNA之百分之幾,在核內(nèi)主要存在于核仁的外側(cè)。


hnRNA


DNA組成

對(duì)start_codon和stop_codon而言,只涉及3個(gè)堿基。

對(duì)于任意一個(gè)編碼蛋白轉(zhuǎn)錄本而言,可以沒(méi)有5'UTR,但是肯定有3’UTR,3'UTR最短也就和stop_codon完全相同,即3個(gè)堿基。

對(duì)于編碼蛋白轉(zhuǎn)錄本而言,第一個(gè)外顯子可以部分或者整體全是在5’UTR內(nèi)部。此外,前面多個(gè)外顯子也可以都在5’UTR中。

部分編碼蛋白轉(zhuǎn)錄本最后一個(gè)外顯子可以部分或者整體全是在3’UTR內(nèi)部。此外,后面多個(gè)外顯子也可以都在3’UTR中。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容