一個基因包括外顯子和內(nèi)含子部分,有時候我們需要了解基因包含的具體外顯子位置信息。確定的方法有很多種,比如NCBI、USUC和Blast等。這里我們用NCBI的方法找到一個基因的外顯子序列。
首先打開NCBI網(wǎng)站,https://www.ncbi.nlm.nih.gov/,

1.png
選擇“gene”數(shù)據(jù)框,搜索框內(nèi)敲入基因名字“EML4”。

2.png
在“search results”頁面會出現(xiàn)多個結(jié)果,我們選擇后面括號注明是Homo sapiens的選項。

3.png
打開界面,可以看到EML4基因的summary信息。包括基因的全名,曾用名,基因名會隨著版本的升級而變化,每個基因名對應(yīng)一個GeneID,這個ID是唯一的。

4.png
往下面看,在基因的regions,transcripts and products界面內(nèi),可以看到這個基因的mrna和編碼蛋白的編號.NM_開頭的序列都是Mrna序列。記住這個Mrna的編號。

5.png

6.png
接下來介紹一個線上的軟件,Splign,網(wǎng)址是https://www.ncbi.nlm.nih.gov/sutils/splign/splign.cgi?textpage=online&level=form

6.9.png
可以用Mrna或EST序列與所在的基因組序列比對,可以顯示基因的結(jié)構(gòu)。比對結(jié)果顯示EML4有22個外顯子,有對應(yīng)的基因組比對的序列,明確外顯子在Mrna序列上的區(qū)域。

7.png

8.png

9.png

10.png