HGVS突變命名

基因突變的規(guī)范命名是基因變異解讀中不可或缺的一部分。1998年由人類基因組變異協(xié)會(HGVS)、人類變異項目組(HVP)和人類基因組組織(HUGO)聯(lián)合成立序列變異描述工作組(SVD-WG),旨在建立一個穩(wěn)定、有意義、且明確的命名系統(tǒng),并不斷更新和修正。HGVS的宗旨是明確定義,避免出現(xiàn)易混淆的概念或定義。在實際應用環(huán)境中有些學科將不能引起疾病的變異定義為多態(tài)性,有些則將人群發(fā)生頻率大于1%的變異統(tǒng)稱為多態(tài)性;同時,突變有時僅單純表示序列改變,也還被特指為能夠引起疾病的變異,并逐漸被認為具有負面含義。為此2016年更新版本中建議取消這兩個專業(yè)術(shù)語,使用“變異”作為替代詞。

變異類型

為了提高準確度、促進序列變異的計算機分析和描述,必須嚴格定義變異的基本類型。更新版將變異類型分為以下7類:

名稱 釋義
插入(ins) 序列中插入一個或多個核苷酸,并且插入序列并非上游序列拷貝
缺失(del) 一個或多個核苷酸被移除
置換(>) 一個核苷酸被另一個核苷酸替代
重復(dup) 一個或多個核苷酸拷貝直接插入原始序列的下游
倒置 (inv) 與原始序列反向互補的新的核苷酸序列(大于1個核苷酸)替換原始序列,例如由CTCGA變?yōu)門CGAG
轉(zhuǎn)換(con) 一種特殊類型的缺失-插入,其中替代原始序列的核苷酸序列是來自基因組中另一個位點的序列拷貝
缺失-插入(delins/indel) 一個或多個核苷酸被其他核苷酸替代,但并不是發(fā)生替代、倒置和轉(zhuǎn)換

參考序列類型

由于基因組序列信息更為完善,包含多個啟動子、可變剪接位點、不同的poly-A 信號,不同的翻譯起始位點及長度變化等,通常將基因組作為首選參考序列。變異描述需包含DNA、RNA和蛋白質(zhì)水平,并明確標注變異是通過實驗確定還是僅為理論推斷。為避免序列變異描述中出現(xiàn)混淆,通常使用一個字母表示參考序列的類型:

單字母 參考序列類型 單字母 參考序列類型
g. 基因組序列 c. cDNA序列
m. 線粒體序列 n. 非編碼DNA序列
r. RNA序列 p. 蛋白序列

變異位置

g代表基因組,m代表線粒體, p代表蛋白質(zhì),這三種參考序列在定位時,都是從1開始計數(shù),寫法為g.1, m.1, p.1。
c代表編碼蛋白的DNA序列,從起始密碼子的第一個堿基開始計數(shù),寫法為c.1, 只對exon區(qū)間進行計數(shù),終點為終止密碼子的最后一個堿基。對于起始密碼子上游的堿基,采用負號表示,比如c.-1;對于終止密碼子下游的堿基, 采用表示,比如c.1。在內(nèi)含子區(qū)的變異位點要根據(jù)距離來決定,靠近內(nèi)含子5’末端的變異位點,要根據(jù)上游最近的外顯子的最后一個堿基來定位;靠近內(nèi)含子3’末端的變異位點,要根據(jù)下游最近的外顯子的第一個堿基來定位。內(nèi)含子堿基個數(shù)為偶數(shù)時,中間堿基平分后按上下游外顯子堿基來定位命名;內(nèi)含子堿基個數(shù)為奇數(shù)時,中間堿基相對于上游外顯子最后一個堿基來定位命名。位于5’UTR和3’UTR區(qū)的變異位點,也當做內(nèi)含子區(qū)來處理,5’UTR區(qū)添加c.-前綴;3’UTR區(qū)添加c.*前綴。

變異位置.png

特殊字符

字符 釋義
fs 蛋白質(zhì)水平的移碼突變
gom 獲得甲基化
Iom 去甲基化
met 甲基化
ext 起始密碼子和終止密碼子變異導致的蛋白水平的改變,變異類型為延長
() 預測的結(jié)果
? 變異位置未知
/ 嵌合體
// 異源嵌合體
不是序列的直接改變,而是一種修飾或一種狀態(tài)的改變
:: 描述RNA融合轉(zhuǎn)錄本和斷點連接形成的環(huán)狀染色體
^
[] 等位基因,“;”用來分隔變異和等位基因

描述原則

一般原則

  1. 所有變異需先從DNA水平進行描述,還可從RNA水平和蛋白質(zhì)水平上進行描述;
  2. 用變異的描述是否加 () 來說明變異是由實驗確定的還是從理論上推導出來的;
  3. 所有的變異都應該根據(jù)公認的參考序列來描述;
  4. 在進行變異描述時,基因的描述要采用HGNC的官方基因名;
  5. 當變異可描述為幾種變異類型時,優(yōu)先級為:(1)替換,(2)刪除,(3)倒位,(4)重復,(5)轉(zhuǎn)換,(6)插入。

3’ 端法則

變異的描述需遵循最靠近3’ 端法則如“-ATGCCCCA-”變異成“-ATGC_CCA-”,根據(jù)3’ 端法則應描述為c.7delC,而不是c.5delC
例外:當缺失/重復發(fā)生在外顯子與外顯子銜接處,且銜接處堿基相同,不遵循3’ 端法則。
如“..GAT gta..//..cag TCA..”缺失后變?yōu)椤?.GA_ gta..//..cag TCA..”,應描述為NM_004006.2:c.3921del,而不是NM_004006.2:c.3922del;“..GAT gta..//..cag TCA..”重復后變?yōu)椤?.GATT gta..//..cag TCA..”,應描述為NM_004006.2:c.3921dup,而不是NM_004006.2:c.3922dup。

重復序列變異描述原則

對于編碼區(qū)DNA序列而言,重復序列的描述僅用于重復單元長度為3的倍數(shù)的重復序列,即不會影響閱讀框的重復單元長度;若重復序列長度不是3的倍數(shù),則不能用該形式描述。

delins原則

若兩個變異被一個或多個核苷酸分隔,優(yōu)先單獨描述兩個變異,而不采用delins合并描述;若被一個核苷酸分隔的兩個變異,共同影響一個氨基酸,則合并描述為delins;若兩個變異中的任何一個為已知的高頻變異位點,則需要單獨描述兩個變異。

起始密碼子變異描述

  1. 變異后不產(chǎn)生蛋白質(zhì)以基因名:p.0形式描述;
  2. 變異對蛋白產(chǎn)物的影響不清楚且無法預測以基因名:p.?形式描述;
  3. 變異后產(chǎn)生新的起始氨基酸:當原始密碼子上游5’ UTR區(qū)產(chǎn)生了新的起始氨基酸,可以基因名:p.Met1ext-堿基數(shù)形式或p.Met1extMet-堿基數(shù)形式描述,如p.Met1ext-8或p.Met1extMet-8;當原起始氨基酸丟失且下游產(chǎn)生新的起始氨基酸,導致蛋白前段部分氨基酸丟失,可以基因名:p.第二位氨基酸名2_Met新的起始密碼子位置del形式描述,如p.Leu2_Met124del。

終止密碼子變異描述

描述模式:基因名:p.*+原氨基酸數(shù)量+終止密碼子突變后的氨基酸名+ext+*+X。當?shù)鞍桩a(chǎn)物延長少于等于5個氨基酸時,X為延長部分的氨基酸名;當?shù)鞍桩a(chǎn)物延長多于5個氨基酸時,X為延長部分的氨基酸數(shù)量;當延長的長度未知時,X用“?”表示。例如:p.*315TyrextAsnLysGlyThr*;p.*110Glnext*17;p.*327Argext*?

———以上純屬個人理解與記錄

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • 基因突變基本知識 基因、染色體、蛋白質(zhì)、DNA,RNA 之間的關(guān)系是什么? 基因突變基本知識 image 賽?;?..
    wangchuang2017閱讀 8,573評論 3 36
  • 結(jié)果文件的解讀 輸出文件1:*.variant_function 第一個文件包含所有變異的注釋,方法是在每個輸入行...
    生信師姐閱讀 21,960評論 2 42
  • 寫在前面的話: 基因突變,指基因在結(jié)構(gòu)上發(fā)生堿基對組成或排列順序的改變。突變可以發(fā)生于編碼序列,也可發(fā)生在啟動子、...
    靜小沐閱讀 33,061評論 0 25
  • 夜鶯2517閱讀 128,145評論 1 9
  • 版本:ios 1.2.1 亮點: 1.app角標可以實時更新天氣溫度或選擇空氣質(zhì)量,建議處女座就不要選了,不然老想...
    我就是沉沉閱讀 7,444評論 1 6

友情鏈接更多精彩內(nèi)容