2021-10-30

Science|人類疾病蛋白質(zhì)-基因組融合關(guān)聯(lián)分析發(fā)現(xiàn)不同疾病內(nèi)在聯(lián)系

原創(chuàng)?huacishu?圖靈基因?今天

收錄于話題#前沿生物大數(shù)據(jù)分析

撰文:huacishu

IF=47.723

推薦度:?????

亮點:

1、研究基于不同人類疾病在人類基因組中的共同起源,發(fā)現(xiàn)了這些疾病之間的數(shù)百種聯(lián)系,從而挑戰(zhàn)了依照器官、癥狀或臨床特點進(jìn)行的疾病分類;

2、研究了人類血液中數(shù)千種蛋白的數(shù)據(jù),并將這些數(shù)據(jù)與遺傳數(shù)據(jù)相結(jié)合,構(gòu)建出顯示影響這些蛋白的遺傳差異如何將看似不同的疾病以及相關(guān)的疾病聯(lián)系起來的圖譜。


近日劍橋大學(xué)Claudia Langenberg教授團(tuán)隊在國際知名期刊Science在線發(fā)表題為“Mapping the proteo-genomic convergence of human diseases”的研究論文。蛋白質(zhì)遺傳調(diào)控的特征對于理解疾病的病因和發(fā)病機(jī)制至關(guān)重要。作者確定了3892個血漿蛋白的10674個基因關(guān)聯(lián),從而創(chuàng)建了基因-蛋白質(zhì)-疾病圖譜。該蛋白質(zhì)基因組圖譜提供了一個框架,1)連接病因相關(guān)疾病,2)提供新的或正在出現(xiàn)的疾病的生物學(xué)背景,3)整合不同的生物學(xué)領(lǐng)域以建立已知基因-疾病聯(lián)系的機(jī)制。該研究結(jié)果確定了疾病內(nèi)部和疾病之間的蛋白質(zhì)基因組聯(lián)系,并確定了順式蛋白變體在GWAS位點注釋可能的致病基因方面的價值,解決了將基礎(chǔ)科學(xué)轉(zhuǎn)化為臨床可操作見解的一個重要瓶頸。

通過測試10708名芬蘭研究參與者中針對4775種不同蛋白質(zhì)的1020萬個基因型或插補常染色體和X染色體遺傳變異,進(jìn)行了基因組-蛋白質(zhì)組關(guān)聯(lián)分析。確定了2584個基因組區(qū)域與3892個蛋白質(zhì)靶點中至少有一個相關(guān)。其中1097個區(qū)域包括迄今為止尚未報道與血漿蛋白相關(guān)的變異體,其中64%(1356個PQTL中的867個)可用。此外,61%(797人中的488人)的PQTL順式變異的復(fù)制比例(81.2%)高于反式(44.2%)。大多數(shù)區(qū)域(79.3%,n=2050)與單一蛋白質(zhì)靶點相關(guān),但觀察到多效性(≥2個蛋白質(zhì)靶標(biāo)),包括與多達(dá)五個(16.1%,n=418),(3.4%,n=88)或21-50(0.7%,n=19)相關(guān)蛋白質(zhì)靶標(biāo)的關(guān)聯(lián),以及與59-1539個蛋白質(zhì)靶標(biāo)相關(guān)的八個區(qū)域(CFH、ARF4-ARHGEF3、C4A-CFB、BCHE、VTN、CFD、ABO、GCKR)的大量多效性(圖1)。含有順式pQTL的194個多效性區(qū)域確定了血漿蛋白質(zhì)組的主要調(diào)節(jié)因子,包括糖基轉(zhuǎn)移酶,如組織血型ABO系統(tǒng)轉(zhuǎn)移酶(ABO),關(guān)鍵代謝酶,如葡萄糖激酶調(diào)節(jié)蛋白(GCKR),或脂質(zhì)介質(zhì),如載脂蛋白E,建立循環(huán)蛋白質(zhì)組的網(wǎng)絡(luò)狀結(jié)構(gòu)。在3892個蛋白質(zhì)靶點中,26.8%(n=1046)的PQTL同時存在于順式和反式中,13.4%(n=523)的PQTL僅存在于順式中,并且在總共8328個變異蛋白關(guān)聯(lián)中,反式為59.6%(n=2323)(圖1)。使用適應(yīng)性逐步條件分析在這些位點上鑒定了另外2346個次級PQTL,表明順式(68.8%)和反式(31.2%)中存在廣泛的等位基因異質(zhì)性。5442個不同變體中的大多數(shù)位于內(nèi)含子(~44%)中,具有錯義變體(~21%),在順式和反式PQTL中具有相似的分布。研究觀察到663個順式PQTL對蛋白質(zhì)靶標(biāo)結(jié)構(gòu)有直接影響,包括重要的亞結(jié)構(gòu),如二硫鍵(4.2%)、α-螺旋(3.1%)和β-鏈(2.6%)。據(jù)預(yù)測,這些變體會影響蛋白質(zhì)目標(biāo)的正確折疊,包括血液中的分泌減少或半衰期縮短,而不是蛋白質(zhì)編碼基因的表達(dá)。例如,觀察到活性分泌蛋白中PAV的富集,這可能表明常見的翻譯后修飾(如糖基化)的調(diào)節(jié)。

將數(shù)據(jù)驅(qū)動的蛋白質(zhì)網(wǎng)絡(luò)與本體映射(圖2A和B)相結(jié)合,以區(qū)分通路特異性PQTL與對多個不相關(guān)靶點產(chǎn)生影響的PQTL?;诰W(wǎng)絡(luò)和本體映射的融合證據(jù),成功地將5442個基因變體中的40.8%指定為蛋白質(zhì)特異性,5.9%(順式中n=236,反式中n=86)指定為路徑特異性,另外16.5%(順式中n=498,反式中n=402)根據(jù)任一來源可能指定為路徑特異性。總共,1802個蛋白質(zhì)靶點在順式(n=1385)或反式(n=417)中至少有一個(可能)特異性pQTL。通過數(shù)據(jù)驅(qū)動網(wǎng)絡(luò)方法,將648個本體映射可能遺漏的變體分類為蛋白質(zhì)特異性。一個例子是rs738408(PNPLA3),一種非酒精性脂肪肝變體,與來自同一蛋白質(zhì)群體的70個適體中的22個相關(guān)(圖2C)。PNPLA3編碼含蛋白3的類帕他汀磷脂酶結(jié)構(gòu)域(PNPLA3),rs738408標(biāo)記錯義變體rs738409(I148M),使PNPLA3抵抗泛素化介導(dǎo)的降解,并導(dǎo)致隨后積聚在肝脂滴上,導(dǎo)致脂肪肝疾病。相關(guān)蛋白靶點包括肝臟中高度表達(dá)的多種代謝和解毒酶,如酒精脫氫酶、精氨琥珀酸裂解酶、膽鹽硫轉(zhuǎn)移酶或氨基酰化酶-1。與目前臨床上用于鑒別脂肪肝疾病或肝損傷的組織非特異性蛋白質(zhì)相比,PNPLA3反式pQTL上的肝損傷特異性效應(yīng)使這些蛋白質(zhì)靶點成為潛在的生物標(biāo)記候選物。

使用統(tǒng)計共定位將血漿pQTL結(jié)果與GTEx中的基因表達(dá)和剪接QTL數(shù)據(jù)(分別為eQTL和sQTL)結(jié)合起來,對所有1584個至少有一個順式pQTL的蛋白質(zhì)靶點進(jìn)行分析。結(jié)果表明,其中一半(50.1%)在至少一個組織中具有與基因表達(dá)相同的信號,中位數(shù)為4.5(IQR:2-12;圖3A),極大地擴(kuò)展了先前關(guān)于基因表達(dá)在組織中作用的認(rèn)識。大多數(shù)順式PQTL(n=584,73.4%)在所有組織中顯示出相同方向的血漿蛋白和基因表達(dá)效應(yīng)(圖3A),但26.6%(n=212)顯示出至少一對具有相反效應(yīng)的順式PQTL,其中蛋白質(zhì)效應(yīng)與在所有組織中觀察到的基因表達(dá)方向相反,有證據(jù)表明存在共定位。例如,免疫球蛋白超家族成員8(IGSF8)的順式pQTL rs2295621的A等位基因與蛋白質(zhì)靶點的血漿豐度呈負(fù)相關(guān),但與33個組織中相應(yīng)mRNA的表達(dá)呈正相關(guān)。即使在同一細(xì)胞內(nèi),基因和蛋白質(zhì)表達(dá)的解偶聯(lián)也是一種經(jīng)常被描述的現(xiàn)象,可能的機(jī)制包括差異翻譯、蛋白質(zhì)降解或蛋白質(zhì)水平緩沖。對于145個蛋白質(zhì)靶點,研究確定了基于單個組織的組織特異性對血漿豐度的貢獻(xiàn)明顯超過所有其他組織的有力證據(jù)(圖3A)。這些包括已知的組織特異性例子,如肝組織中的維生素K依賴性蛋白C,但也有不太明顯的例子,如甲型肝炎病毒細(xì)胞受體1(或TIM-1)。為了發(fā)揮最大功效,研究整合了eQTLGen的基因表達(dá)數(shù)據(jù),該聯(lián)合會確認(rèn)了140個順式eQTL/pQTL對,并顯示了GTEx資源中未發(fā)現(xiàn)的另外38個順式eQTL/pQTL對,包括炎癥反應(yīng)的免疫細(xì)胞特異性介質(zhì),如白細(xì)胞免疫球蛋白樣受體亞家族成員3。為了獲得超越所有轉(zhuǎn)錄物物種平均讀數(shù)的見解,作者研究了選擇性剪接作為蛋白質(zhì)靶點變異的來源。五分之一(20.1%)的順式信號與至少一個組織中的順式sQTL共享(圖3B),其中84個沒有通過eQTL數(shù)據(jù)看到,這表明與pQTL相關(guān)的轉(zhuǎn)錄亞型被從大量分析轉(zhuǎn)錄本中屏蔽。與eQTL共定位相比,研究沒有觀察到對齊效應(yīng)方向的總體模式(圖3B)。后者可能解釋了90個蛋白質(zhì)靶標(biāo)實例,其中共定位順式sQTL解釋了超過10%的血漿濃度變化,并強調(diào)了剪接QTL確定蛋白質(zhì)靶標(biāo)血漿豐度變化潛在來源的能力。

研究觀察到多個例子,其中順式pQTL定位確定了生物學(xué)上可能的候選基因,這些基因與順式eQTL定位無關(guān)(圖4)。例如,在eQTL支持的CDCA8位點將RSPO1指定為子宮內(nèi)膜癌的候選致病基因?;蜷g變異rs113998067是子宮內(nèi)膜癌的先導(dǎo)信號,是R-spondin-1的次級順式pQTL,由RSPO1編碼。統(tǒng)計共定位證實了一個極有可能的共享信號。因此,作者估計子宮內(nèi)膜癌風(fēng)險增加91%,血漿R-spondin-1豐度增加。R-spondin-1是一種分泌型激活蛋白,作為典型Wnt信號通路的激動劑,作為成人干細(xì)胞生長因子發(fā)揮調(diào)節(jié)作用。然而,在小鼠模型中的研究表明,R-spondin-1上調(diào)雌激素受體α而不依賴于Wnt/β-catenin信號,因此可能增加雌激素介導(dǎo)的子宮內(nèi)膜癌風(fēng)險。作者注意到,rs113998067的效應(yīng)估計沒有性別差異,雄性和雌性小鼠的基因敲除模型分別顯示睪丸和卵巢發(fā)育異常,可能表明對生殖組織疾病有更廣泛的影響。

將GWAS匯總統(tǒng)計數(shù)據(jù)整合到該研究中,以確定與新冠病毒相關(guān)的四種不同的結(jié)果定義,范圍從對新冠病毒的易感性到需要住院治療的嚴(yán)重病例。這些GWA在納入病例數(shù)量上存在顯著差異(5101-38984)。作者復(fù)制了先前報道的候選基因ABO和OAS1,這兩個基因在這些不同的結(jié)果定義中顯示了一致的證據(jù)。對于ABO,順式pQTL也與肺栓塞共定位(圖5),肺栓塞是嚴(yán)重新冠病毒的常見并發(fā)癥,可能歸因于參與凝血級聯(lián)反應(yīng)的蛋白質(zhì)豐度改變。進(jìn)一步觀察到NSF(針對新冠病毒住院風(fēng)險)和BCAT2(針對嚴(yán)重新冠病毒)的提示性證據(jù),其中每一種都與這四種結(jié)果中的一種結(jié)果共享一個遺傳信號,因此需要外部驗證其在新冠病毒-或相關(guān)病理學(xué)中的可能作用。

在已知的膽結(jié)石位點SULT2A1發(fā)現(xiàn)了一個信號,該信號在膽鹽硫轉(zhuǎn)移酶(SULT2A1)和膽結(jié)石以及膽囊切除術(shù)風(fēng)險之間共享。Multitrait共定位進(jìn)一步證實,該信號還與肝臟中SULT2A1的mRNA表達(dá)、多種硫酸化類固醇的血漿濃度(包括雄激素和孕烯醇酮代謝物的硫酸鹽結(jié)合物)以及膽汁酸共享。與次級膽汁酸甘膽酸鹽血漿濃度降低同時出現(xiàn)的反向關(guān)聯(lián)表明石膽酸的形成減少,石膽酸是溶解脂肪(包括膽固醇)的基本清潔劑。對各種生物學(xué)實體的縱向整合表明,促進(jìn)膽固醇結(jié)晶和膽結(jié)石形成的過飽和膽汁是一種因果機(jī)制。FBLN3(由EFEMP1編碼的細(xì)胞外基質(zhì)糖蛋白)是一個與大量(n=37)疾病和其他表型相關(guān)的蛋白質(zhì)靶點,它顯示了多種結(jié)締組織疾病的基因-蛋白質(zhì)融合以及皮下脂肪組織中EFEMP1的基因表達(dá)(圖6B)。rs3791679的異常與血漿FBLN3豐度降低和結(jié)締組織或軟組織異常風(fēng)險增加有關(guān),包括疝氣、靜脈曲張等,其中一些以前曾在個體GWA中報道過,但尚未聯(lián)系到一起。這一系列人類臨床特征表明,較低的血漿A等位基因攜帶者水平導(dǎo)致彈性纖維形態(tài)改變或含量降低,這與Efemp1基因敲除小鼠的結(jié)果一致,該小鼠表現(xiàn)出異常的彈性纖維形態(tài),出現(xiàn)不同類型的疝氣和骨盆器官脫垂。FBLN3是細(xì)胞外基質(zhì)的一部分,廣泛表達(dá),但其功能尚不完全清楚。研究提供了關(guān)于其在大量結(jié)締組織疾病病因中的作用的見解。EFEMP1突變導(dǎo)致一種罕見的眼部疾病,稱為Doyne蜂窩狀視網(wǎng)膜營養(yǎng)不良(DHRD),其特征是由于細(xì)胞內(nèi)FBLN3的積累而導(dǎo)致視覺障礙。研究觀察到該蛋白位點的信號與視覺相關(guān)表型的共享性,包括使用隱形眼鏡(近視)和視盤面積減小,這是開角型青光眼的一個危險因素,低蛋白濃度與更高的風(fēng)險相關(guān),DHRD患者也觀察到了這一點。

蛋白質(zhì)組學(xué)技術(shù)及其與基因組數(shù)據(jù)整合的前景在于其在罕見和常見人類疾病中的應(yīng)用。雖然以前的研究開始利用PQTL的表型結(jié)果,但它們主要集中于識別和描述通過特定平臺測量的蛋白質(zhì)的遺傳結(jié)構(gòu)。該研究對物候組進(jìn)行了系統(tǒng)整合,并創(chuàng)建了人類健康的蛋白質(zhì)基因組圖譜,該圖譜識別了許多潛在的致病基因,并強調(diào)了不同人類條件下的基因驅(qū)動聯(lián)系。傳統(tǒng)的疾病分類依賴于共同出現(xiàn)的癥狀的集合,很少基于共同的病因。該研究為確定針對潛在遺傳原因的治療策略提供了機(jī)制上的理解。

?

教授介紹

Claudia Langenberg教授是劍橋大學(xué)MRC流行病中心的負(fù)責(zé)人,主要關(guān)注分子流行病學(xué)。她的工作整合了大規(guī)?;蚪M和代謝組學(xué)數(shù)據(jù),以發(fā)現(xiàn)、優(yōu)先排序和表征代謝途徑,并測試其在一系列疾病中的因果相關(guān)性和特異性,重點關(guān)注2型糖尿病。并且Claudia Langenberg教授以通訊作者在國際權(quán)威期刊Nat Genet.、PLoS Med、JAMA上發(fā)表論文多篇。

參考文獻(xiàn)

Pietzner M, Wheeler E, Carrasco-Zanini J, et al. Mapping the proteo-genomicconvergence of human diseases. Science. 2021;eabj1541.doi:10.1126/science.abj1541

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Nature |熱量限制和生酮飲食減緩腫瘤生長的機(jī)制 原創(chuàng)圖靈基因圖靈基因今天 收錄于話題#前沿分子生物學(xué)機(jī)制 越...
    圖靈基因閱讀 219評論 0 0
  • 內(nèi)容來源:“Hello 藥學(xué)” 一個專注于藥學(xué)相關(guān)知識和研究進(jìn)展分享的公眾號,愿與您共同學(xué)習(xí)進(jìn)步。 一、前言 方酸...
    Hello藥學(xué)閱讀 1,733評論 0 0
  • 首先介紹下自己的背景: 我11年左右入市到現(xiàn)在,也差不多有4年時間,看過一些關(guān)于股票投資的書籍,對于巴菲特等股神的...
    瞎投資閱讀 5,950評論 3 8
  • ![Flask](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAW...
    極客學(xué)院Wiki閱讀 7,835評論 0 3
  • 不知不覺易趣客已經(jīng)在路上走了快一年了,感覺也該讓更多朋友認(rèn)識知道易趣客,所以就謝了這篇簡介,已做創(chuàng)業(yè)記事。 易趣客...
    Physher閱讀 3,821評論 1 2

友情鏈接更多精彩內(nèi)容