一、 基礎(chǔ)知識(shí)
1、 基因連鎖:
基因連鎖是指在有性生殖的減數(shù)分裂過程中,染色體上的DNA序列緊密結(jié)合在一起的傾向。
兩個(gè)標(biāo)記位點(diǎn)距離越近,在減數(shù)分裂過程中越不容易發(fā)生重組,越容易一起遺傳
基因連鎖單位為cM, 1cM表示兩個(gè)標(biāo)記在減數(shù)分裂過程中分在不同染色體上的概率為1/100。
2、連鎖分析:
a) 連鎖分析是基于家系研究的一種方法,是單基因遺傳病定位克隆方法的核心。利用遺傳標(biāo)記在家系中進(jìn)行分型(Genotyping),再利用數(shù)學(xué)手段計(jì)算遺傳標(biāo)記在家系中是否與疾病產(chǎn)生共分離
b) 連鎖分析是利用連鎖的原理研究致病基因與參考位點(diǎn)遺傳標(biāo)記的關(guān)系。根據(jù)孟德爾分離率,如果同一染色體上的位點(diǎn)不連鎖,那么遺傳標(biāo)記標(biāo)將獨(dú)立于致病基因而分離,與致病基因位于同一單倍體或不同單倍體的機(jī)會(huì)各占一半,否則表明連鎖的存在。
c) 原理:基因定位的連鎖分析是根據(jù)基因在染色體上呈直線排列,不同基因相互連鎖成連鎖群的原理,即應(yīng)用被定位的基因與同一染色體上另一基因或遺傳標(biāo)記相連鎖的特點(diǎn)進(jìn)行定位。生殖細(xì)胞在減數(shù)分裂時(shí)發(fā)生交換,一對(duì)同源染色體上存在著兩個(gè)相鄰的基因座位,距離較遠(yuǎn),發(fā)生交換的機(jī)會(huì)較多,則出現(xiàn)基因重組;若兩者較近,重組機(jī)會(huì)較少。重組DNA和分子克隆技術(shù)的出現(xiàn),發(fā)現(xiàn)了許多遺傳標(biāo)記--多態(tài)位點(diǎn),利用某個(gè)擬定位的基因是否與某個(gè)遺傳存在連鎖關(guān)系,以及連鎖的緊密程度就能將該基因定位到染色體的一定部位染色體上兩個(gè)位點(diǎn)從親代傳給子代時(shí),若相距1cM,就有1%的重組機(jī)會(huì)。整個(gè)人類基因組含3.2×10^9bp,相應(yīng)約有3300cM,每個(gè)染色體平均約有150cM,1cM約為1000kb。因此,一個(gè)致病基因和標(biāo)記位點(diǎn)緊密連鎖,二者不須在同一條染色體的同一區(qū)段,一條染色體可以產(chǎn)生大量的DNA多態(tài),只要提供足夠的家系,按孟德爾方式遺傳的疾病都可將其基因定位。
d) 局限性:
1)連鎖分析更適用于單基因疾病的遺傳研究,而在目前已知的疾病當(dāng)中,復(fù)雜疾病占了絕大多數(shù)。
2)連鎖分析對(duì)于致病性高、數(shù)量少的遺傳變異具有較好的適用性,但對(duì)于中效甚至弱效的突變則顯得力不從心。
3)通過連鎖分析在染色體上的定位通常是cM級(jí)別,也就是百萬個(gè)堿基對(duì),這其中包含的成百上千的基因。
二、 連鎖分析和全基因組關(guān)聯(lián)分析
a) 連鎖分析的定位依賴于家族中標(biāo)記基因型與表現(xiàn)型的共分離,通過鑒定經(jīng)多代傳遞仍完整的單倍型為基礎(chǔ)的,檢測(cè)在一個(gè)家系中等位基因與疾病的傳遞是否相關(guān)。
關(guān)聯(lián)分析的定位方法則是在種群水平上,通過鑒定經(jīng)許多代數(shù)傳遞后仍保留完好的相鄰近DNA變異之間的DNA片段,檢測(cè)在一個(gè)群體中疾病和等位基因的相關(guān)性的存在與否
1、連鎖采用家系樣本;關(guān)聯(lián)采用散發(fā)樣本
2、連鎖應(yīng)用LINKAGE核心IBD算法做計(jì)算;關(guān)聯(lián)用卡方檢驗(yàn)
3、連鎖一般找到的是某個(gè)區(qū)域;關(guān)聯(lián)找到的是某個(gè)點(diǎn)
4、連鎖結(jié)果相對(duì)準(zhǔn)確,假陽性小,但精細(xì)定位很困難,主要原因是家系問題
關(guān)聯(lián)相對(duì)粗糙,假陽性很高,但可以直接定到基因位點(diǎn)
三、 常見分析步驟
1、 疾病表型確定(包括定量表型及定性表型)
2、 測(cè)序:
1) 測(cè)序時(shí)需要選擇1-2個(gè)正常樣本作為對(duì)照
2) 對(duì)于顯性遺傳的病例,最好選擇親緣關(guān)系較遠(yuǎn)的樣本進(jìn)行測(cè)序
3) 對(duì)于隱性遺傳的病例,測(cè)量患病的子代比測(cè)量正常的親本價(jià)值更高
3、 SNP檢測(cè):數(shù)據(jù)庫中不存在的變異位點(diǎn)可以作為罕見變異,等位基因頻率可設(shè)置為0.0001變異位點(diǎn)過濾。(過濾指標(biāo)詳見下圖)
4、 QC:排除測(cè)序錯(cuò)誤以及樣本錯(cuò)誤
5、 計(jì)算LOD分值
6、 異質(zhì)性檢測(cè)
位點(diǎn)異質(zhì)性:不同的基因或在不同的染色體上的基因均為致病原因
等位基因異質(zhì)性:同一基因或位點(diǎn),不同等位基因在不同家系中均為致病原因
注:
變異位點(diǎn)的過濾:

四、 分析算法優(yōu)劣及相應(yīng)的軟件
Elston–Stewart algorithm:
優(yōu)劣:隨著家系樣本的增加,資源呈線性增加,但是隨著marker位點(diǎn)的增加,資源呈指數(shù)增加。適用于位點(diǎn)少,家系樣本多的數(shù)據(jù)。
軟件:LINKAGE、 FASTLINK Lander– Green algorithm:
優(yōu)劣:隨著marker位點(diǎn)的增加,資源呈線性增加,但是隨著家系樣本的增加,資源呈指數(shù)增加。適用于位點(diǎn)多,家系樣本少的數(shù)據(jù)。
軟件:GeneHunter、 MERLIN
同時(shí)兼顧位點(diǎn)及家系樣本數(shù)量的軟件:Loki、 SimWalk2