人類基因組變異協(xié)會(HGVS:Human Genome Variation Society)規(guī)則是目前學(xué)術(shù)界所公認的突變命名規(guī)則。
置換(>):一個核苷酸被另一個核苷酸替代,使用“>”來表示;
例如g.1318G>T;
缺失(del):一個或多個核苷酸被移除,使用“del”進行描述;
例如g.3661_3706del;
倒置(inv):與原始序列反向互補的新的核苷酸序列(大于1個核苷酸)替換原始序列;
例如由CTCGA變?yōu)門CGAG,使用”inv“表示;
重復(fù)(dup):一個或多個核苷酸拷貝直接插入原始序列的下游,使用“dup”表示;
插入(ins):序列中插入一個或多個核苷酸,并且插入序列并非上游序列拷貝;
缺失-插入(delins/indel):一個或多個核苷酸被其他核苷酸替代,但并不是發(fā)生替代、倒置和轉(zhuǎn)置;
轉(zhuǎn)換(con):一種特殊類型的缺失-插入,其中替代原始序列的核苷酸序列是來自基因組中另一個位點的序列拷貝。
從不同的維度出發(fā),相同的基因突變可以有多種不同的表現(xiàn)形式,例如,參考序列的不同、表現(xiàn)層次的不同(DNA、RNA或蛋白質(zhì)水平)都會導(dǎo)致突變的表現(xiàn)方式產(chǎn)生差異。
目前,通用的參考序列主要包括:基因組參考序列(以前綴“g.”表示)、cDNA參考序列(以前綴“c.”表示)、非編碼DNA參考序列 (以前綴“n.”表示)、RNA參考序列(以前綴“r.”表示)、蛋白質(zhì)參考序列(以前綴“p.”表示)。
參考序列的選擇非常重要。在DNA水平描述突變時,內(nèi)含子與相鄰?fù)怙@子的關(guān)系對于臨床研究往往非常重要,為了能更好地闡明內(nèi)含子的變異,通常會選擇cDNA作為參考序列,這是因為以cDNA作為參考序列,能夠更好的描述內(nèi)含子中突變堿基與相鄰?fù)怙@子之間的關(guān)系。另外,基因突變也常以蛋白質(zhì)水平的變化進行描述。
舉例:
A. 以cDNA為參考序列的突變表達方式
- 替換:指與參考序列相比,一種堿基被另一種堿基所取代;以符號“>”進行表示;如:c.123A>T,表示與參考序列相比,第123位的A被T所取代;
- 缺失:指與參考序列相比,一個或多個堿基缺失的現(xiàn)象;以“del”進行表示;如:c.2052delA,表示與參考序列相比,第2052位發(fā)生A的缺失;
- 插入:指與參考序列相比,一個或多個堿基增添的現(xiàn)象;以“ins”進行表示;如:c.5756_5757insAGG,表示與參考序列相比,在第5756 與5757位點之間插入了三個堿基AGG;
- 缺失插入:指與參考序列相比,一個或多個堿基被其他堿基所取代的現(xiàn)象,并且這種變異不包括替換突變、倒置以及轉(zhuǎn)換突變;以“delins”進行表示;如:c.6775delinsGA,表示與參考序列相比,第6775位缺失了一個堿基,同時缺失的堿基被GA做取代;
- 重復(fù):指與參考序列相比,包含一個或多個堿基的拷貝以插入的形式直接摻入序列中的現(xiàn)象;以“dup”進行表示;如:c.6_8dupT,表示從第6位到第8位發(fā)生了T的重復(fù);
B. 為了更好地理解內(nèi)含子中堿基突變的表現(xiàn)形式,我們首先來了解一下DNA序列中各堿基所處的位置。從起始密碼開始到終止密碼為止,外顯子序列的編號是連續(xù)的,而5'非翻譯區(qū)、3'非翻譯區(qū)以及內(nèi)含子區(qū)的編碼都是與外顯子序列的編碼密切相關(guān)的。
因此,內(nèi)含子中堿基的替換、缺失、插入等突變的表現(xiàn)形式就可以分別表示為:
- c.36+1G>T(c.36前一段編碼區(qū)域或者說前面一個外顯子的最后一個堿基位于編碼區(qū)36位,+1代表這個外顯子挨著的后面的內(nèi)含子的第一個堿基);
- c.(4071+1_4072-1)_(5154+1_5155-1)del(表示兩個外顯子之間的序列發(fā)生缺失);
- c.37+1_37+2insATC(表示在“37+1”與“37+2”位點間插入堿基ATC);
- c.4183+795C>T(c.4183前一段編碼區(qū)域或前面一個外顯子的最后一個堿基位于編碼區(qū)4183位,+795代表這個外顯子挨著內(nèi)含子的第795個堿基) 。
C. 以蛋白質(zhì)為參考序列的突變表達方式
- 替換:如p.Trp26Cys,表示第26位的Trp被Cys取代(錯義突變);p.Trp26Ter (p.Trp26*),表示第26位的Trp變?yōu)榻K止密碼(無義突變);p.Cys123=,表示基因突變之后,氨基酸沒有發(fā)生改變(同義突變);
- 缺失:如p.Ala3_Ser5del,表示多肽序列中從第3位的Ala到第5位的Ser發(fā)生了缺失;
- 插入:如p.Lys2_Gly3insGlnSerLys,表示在第2位的Lys和第3位的Gly之間插入了GlnSerLys;
- 插入缺失:如p.Cys28delinsTrpVal,表示第28位的Cys缺失,同時被TrpVal取代;
5.重復(fù):如p.Ala2[10],表示第2位的Ala重復(fù)了10次;
- 移碼突變:在起始密碼子和終止密碼子之間的讀碼框發(fā)生了改變;以“fx”進行表示;如p.Arg97ProfsTer23,表示第97位的Arg是首個發(fā)生改變的氨基酸,且Arg變?yōu)镻ro,同時發(fā)生移碼突變后,終止密碼的位置變?yōu)榈?3位

<figcaption style="margin-top: calc(0.666667em); padding: 0px 1em; font-size: 0.9em; line-height: 1.5; text-align: center; color: rgb(153, 153, 153);">基因中的常用符號和縮寫</figcaption>
轉(zhuǎn)載自:輕楓柳曳1208和解螺旋·臨床醫(yī)生科研成長平臺
參考文獻:Guidelines for Human Gene Nomenclature (Doi:https://doi.org/10.1006/geno.2002.6748)