劉小澤寫于2020.2.8
大概回顧一下基礎知識
一:ORF與CDS
ORF:open reading frame(開放閱讀框)
它是理論上的蛋白編碼區(qū),一般是先在DNA序列中尋找起始密碼子(AUG)對應的序列ATG,然后按每3個堿基一組向后延伸,一直到出現(xiàn)終止密碼子(UAG、UGA、UAA)對應的序列
注意:起始密碼子和啟動子不是一回事!
CDS:coding sequences (編碼區(qū))
它就是與蛋白序列一一對應的DNA序列,并且序列中間不存在其他與蛋白無關的序列,和真實情況最接近
舉個例子:
例如這個序列:AACGCATGCAGC
如果用預測的方法得到ORF,它會先找到ATG;然后會以中間的字母T為核心,推測三種可能:
- 第一種:T就是在中心,即ATG,然后按每三個一組,得到:CGC、ATG、CAG
- 第二種:T在左側,即TGC,同樣得到AAC、GCA、TGC、AGC【這就是真實的CDS組合】
- 第三種::T在右側,即CAT,得到ACG、CAT、GCA
還因為DNA雙鏈,所以總共有32=6種不同密碼子組合方式*
補充
CDS 與 UTR:
A typical CDS starts with ATG and ends with a stop codon, it doesn't have any introns, 5'- and 3'-UTR
CDS與ORF:
CDS can be a subset of an open reading frame (ORF).

二:啟動子&起始密碼子;終止子&終止密碼子**
實際上二者之間沒有任何關聯(lián)
- 啟動子和終止子都是一段特殊的DNA序列,屬于基因的非編碼區(qū),分別位于編碼區(qū)的上游和下游,負責調控基因的轉錄
- 起始密碼子和終止密碼子都是mRNA上的三聯(lián)體堿基序列,分別決定翻譯的起始和終止。
啟動子 promoter
DNA分子上能與RNA聚合酶結合并形成轉錄起始復合體的區(qū)域
與RNA聚合酶結合并能起始mRNA合成的序列。做生信分析時,有的選擇上游1 kb,下游 500 nt,也有選上下游各1 kb的
強啟動子(strong promoter):對RNA聚合酶有很高親和力的啟動子,可以指導合成大量的mRNA
起始密碼子 start codon
指定信使RNA(mRNA)上開始合成蛋白質的密碼子,也是第一個被核糖體翻譯的mRNA上的密碼子,位于編碼區(qū)內,緊鄰5′非翻譯區(qū)。較為常見的起始密碼子是AUG
終止子 terminator
- 轉錄過程中能夠終止RNA聚合酶轉錄的DNA序列
- 終止子可分為兩類:一類不依賴于蛋白質輔因子就能實現(xiàn)終止作用。另一類則依賴蛋白輔因子才能實現(xiàn)終止作用
終止密碼子 stop codon
終止肽鏈合成的信使核糖核酸(mRNA)的三聯(lián)體堿基序列,UAA、UAG和UGA,它們不編碼氨基酸
三:轉錄因子 及結合位點
轉錄因子(transcription factor)
一群能與基因5`端上游特定序列專一性結合,從而保證目的基因以特定的強度在特定的時間與空間表達的蛋白質分子,這些蛋白質能調控其基因的轉錄。
調控方法是轉錄因子可以調控核糖核酸聚合酶(RNA聚合酶,或叫RNA合成酶)與DNA模板的結合
更詳細的轉錄因子介紹:https://cloud.tencent.com/developer/article/1376739
TF結合位點 transcription factor binding site,TFBS
轉錄因子調節(jié)基因表達時,與基因模板鏈結合的區(qū)域。一般應該分布在基因前端【但:人21和22號染色體上,只有22%的轉錄因子結合位點分布在蛋白編碼基因的5'端】
四:UTR (Untranslated Regions)
非翻譯區(qū),是信使RNA(mRNA)分子兩端的非編碼片段
- 5'-UTR從mRNA起點的甲基化鳥嘌呤核苷酸帽延伸至AUG起始密碼子
- 3'-UTR從編碼區(qū)末端的終止密碼子延伸至多聚A尾巴(Poly-A)的前端
最后補充幾張圖


關于表達調控
BIOL2060: Regulation of Gene Expression

歡迎關注我們的公眾號~_~
我們是兩個農(nóng)轉生信的小碩,打造生信星球,想讓它成為一個不拽術語、通俗易懂的生信知識平臺。需要幫助或提出意見請后臺留言或發(fā)送郵件到jieandze1314@gmail.com
