SNP通常聯(lián)合基因表達(dá)進(jìn)行分析
SNP主要是指在基因組水平上由單個(gè)核苷酸的變異所引起的DNA序列多態(tài)性。它是人類可遺傳的變異中最常見的一種。占所有已知多態(tài)性的90%以上。SNP在人類基因組中廣泛存在,平均每500~1000個(gè)堿基對(duì)中就有1個(gè),估計(jì)其總數(shù)可達(dá)300萬(wàn)個(gè)甚至更多
- 1 、下載SNP數(shù)據(jù)
- 2、尋找突變頻率最高的基因
- 3、接著根據(jù)突變進(jìn)行分類,分為野生型和突變型
- 4、看野生型和突變型的基因表達(dá)是否有差異
- 5、看野生型和突變型的生存是否有差異
SNP(single nucleotide polymorphism),單核苷酸多態(tài)性,在基因組上由單個(gè)核苷酸變異形成的遺傳標(biāo)記,一般指變異頻率大于1%的單核苷酸變異。
用英文的描述方法是這樣的“If more than 1% of a population does not carry the same nucleotide at a specific position in the DNA sequence, then this variation can be classified as a SNP.”,值得注意的一個(gè)詞是“population”同英文文章中對(duì)樣本表述的“array”,指的是在一大群個(gè)體中出現(xiàn)大于1%個(gè)體中基因組DNA上某個(gè)特定位點(diǎn)堿基較參考基因組發(fā)生變化,則認(rèn)為是一個(gè)SNP。
SNP發(fā)生的類型
SNP發(fā)生包括轉(zhuǎn)換、顛換、插入和缺失,理論上每個(gè)位點(diǎn)都可以有4種形式的變異,但是實(shí)際上發(fā)生的只有轉(zhuǎn)換和顛換兩種,據(jù)說(shuō)發(fā)生轉(zhuǎn)換和顛換頻率是2:1
A 腺嘌呤
G 鳥嘌呤
T 胸腺嘧啶
C 胞嘧啶
轉(zhuǎn)換
[一種能量形式變成另外一種能量形式],主要發(fā)生在CG序列,由于CG(可以聯(lián)想一下研究DNA甲基化常談到的CpG島)中的C堿基常發(fā)生甲基化(mC),可自發(fā)脫氨形成胸腺嘧啶(T),即常常發(fā)生的轉(zhuǎn)化是C to T。補(bǔ)充一點(diǎn)幫助大家記憶哈,脫氨基是不是伴隨能量的變化,跟轉(zhuǎn)換的基本概念完美銜接。
顛換
異型堿基的置換,一個(gè)嘌呤被另外一個(gè)嘧啶替換或一個(gè)嘧啶被另外一個(gè)嘌呤置換
SNP(singlenucleotide polymorphism),單核苷酸多態(tài)性,在基因組上由單個(gè)核苷酸變異形成的遺傳標(biāo)記,包括轉(zhuǎn)換、顛換、缺失和插入,形成的遺傳標(biāo)記,其數(shù)量很多,多態(tài)性豐富,一般指變異頻率大于1%的單核苷酸變異。在人類基因組中大概每1000 個(gè)堿基就有一個(gè)SNP ,人類基因組上的SNP 總量大概是3 ×10^6 個(gè)。因此,SNP成為第三代遺傳標(biāo)志,人體許多表型差異、對(duì)藥物或疾病的易感性等等都可能與SNP有關(guān)。
SNP發(fā)生的位置
一句話概括,SNP可以發(fā)生基因組的任何位置,基因編碼區(qū)/基因非編碼區(qū)/基因間區(qū)等,關(guān)系如下:

發(fā)生在編碼區(qū)
先補(bǔ)充一個(gè)概念:密碼子簡(jiǎn)并性(氨基酸對(duì)應(yīng)三聯(lián)密碼子),所以發(fā)生SNP不一定會(huì)引起編碼氨基酸的改變,
這就引入了Synonymous SNP(同義突變,不引起任何變化) 和Non-Synonymous SNP(非同義突變,大家關(guān)注的焦點(diǎn))概念。
錯(cuò)義突變:編碼的某種氨基酸的密碼子變成另一種氨基酸密碼子,從而多肽鏈的氨基酸種類和序列發(fā)生改變,錯(cuò)義突變通常會(huì)使多肽鏈喪失原有功能。
無(wú)義突變:編碼某一氨基酸的密碼子變成UAA、UGA或UAG(終止密碼子),導(dǎo)致多肽鏈翻譯的中止,從而形成一條不完整的多肽鏈。
發(fā)生在基因非編碼區(qū)或基因間區(qū)
可能會(huì)影響轉(zhuǎn)錄因子與DNA結(jié)合、影響非編碼RNA序列、影響基因的剪接、mRNA的降解等。
受到單核苷酸多態(tài)性(SNP)影響的基因表達(dá)被稱為單核苷酸多態(tài)性表達(dá)(ESNP)。
三個(gè)堿基組成一個(gè)密碼子,翻譯成一個(gè)氨基酸,堿基的變異可導(dǎo)致不同種類的氨基酸的變化,比如:
一個(gè)氨基酸變成另一份氨基酸:錯(cuò)義突變(missense)
一個(gè)氨基酸變成終止密碼子:無(wú)義突變(nonsense)
雖然堿基發(fā)生變化,但是編碼的氨基酸沒有變化:同義突變(silent)
注意這里的中英文對(duì)應(yīng)關(guān)系哦,尤其是nonsense和silent。
移碼突變(Frame shift)
移碼突變?yōu)橐环N特殊形式的del/ins,但是在描述的時(shí)候,不能列出缺失的那一部分的位置和氨基酸。
突變后的第一個(gè)氨基酸未必對(duì)應(yīng)DNA水平的突變堿基。