讀文獻(xiàn):scAge方法介紹

來源:Trapp, A., Kerepesi, C. & Gladyshev, V.N. Profiling epigenetic age in single cells. Nat Aging 1, 1189–1201 (2021). https://doi.org/10.1038/s43587-021-00134-3

該文章介紹了一種預(yù)測單個細(xì)胞的表觀年齡(epigenetic age)的方法。
關(guān)鍵詞:DNA methylation, epigenetic age, age clock, single cell

背景:人類基因組中有很多位點(CpG sites)的甲基化水平與年齡顯著相關(guān),因此基于這些年齡相關(guān)的位點的甲基化水平可以構(gòu)建很準(zhǔn)確的年齡預(yù)測模型,如Horvath's clock。但是這些模型都是基于bulk samples,也就是一群細(xì)胞的平均年齡。怎樣基于單細(xì)胞甲基化測序數(shù)據(jù)預(yù)測單個細(xì)胞的表觀年齡還沒有人做過,這種可以預(yù)測單個細(xì)胞甲基化年齡的技術(shù)可以用于研究胚胎發(fā)育等特定細(xì)胞很少的場景。

難點:單個細(xì)胞就只有一套DNA,對單個細(xì)胞的甲基化測序數(shù)據(jù)只能隨機覆蓋一小部分基因組區(qū)域,并且對于測到的CpG位點,觀察到甲基化水平也只能是0或1兩種結(jié)果。(sparse and binarized methylation profiles)

scAge

scAge構(gòu)建過程:
1)生成參考集。基于bulk sample甲基化測序數(shù)據(jù),對每一個CpG位點,擬合其甲基化水平與年齡的線性回歸模型,獲得f_i(age)=\beta_i=a_i*Age+ b_i,其中i指代第i個CpG位點。
注:這個參考集只包括了748,955個CpG位點,這些位點在參考集大于90%的樣本中被測到了。

2)收集有效年齡相關(guān)CpG位點。

  • 針對每個單細(xì)胞,只保留出現(xiàn)在參考集中的CpG位點(common CpG sites)。
  • 然后對這些留下的CpG位點,基于它們與年齡的相關(guān)系數(shù)絕對值從大到小進(jìn)行排序(ranking them based on the absolute magnitude of their Pearson correlation with age)。
  • 最后每個單細(xì)胞只留下與年齡最相關(guān)的前1%的common CpG位點用于下一步分析。
    所以最后每個單細(xì)胞篩選獲得的CpG位點數(shù)量各不一樣。

3)估計有效年齡相關(guān)CpG位點的測序值出現(xiàn)概率。每一個上一步收集到的年齡相關(guān)CpG位點,其測序結(jié)果不是1(被甲基化了)就是0(未被甲基化),我們可以計算其在不同年齡情況(-20~60 months, step=0.1 months)下獲得觀測值(1或0)的概率。如果是1,概率就是f_i(age),如果是0,概率就是1-f_i(age)。該概率用Pr_i(age)表示。
注:f_i(age)為第一步線性模型所得。

4)極大似然估計年齡。假設(shè)各個CpG位點完全相互獨立,每個單細(xì)胞,所有有效位點的觀察值出現(xiàn)概率的乘積就可以代表在不同年齡下,觀察到測序結(jié)果的總概率值。因為所有概率都小于1,為了避免越乘越小,作者對乘積結(jié)果取了log,結(jié)果如下:
P(age)=\sum_i^nln(P_i(age))
對每個單細(xì)胞樣本,計算其在不同年齡下(-20~60 months, step=0.1 months)的概率值P(age),最大概率值所對應(yīng)的年齡即為該單細(xì)胞的預(yù)測表觀年齡。

模型預(yù)測效果:
作者基于三種細(xì)胞類型(liver,multi-tissue, blood)訓(xùn)練了三個模型,預(yù)測效果還不錯。


Age predictions on hepatocytes by three models

最后scAge的安裝和使用請參照:https://github.com/alex-trapp/scAge

scAge 的優(yōu)勢很明顯:可在單細(xì)胞分辨率下預(yù)測表觀年齡,在特定場景下會很有用。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • ![Flask](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAW...
    極客學(xué)院Wiki閱讀 7,813評論 0 3
  • 不知不覺易趣客已經(jīng)在路上走了快一年了,感覺也該讓更多朋友認(rèn)識知道易趣客,所以就謝了這篇簡介,已做創(chuàng)業(yè)記事。 易趣客...
    Physher閱讀 3,811評論 1 2
  • 雙胎妊娠有家族遺傳傾向,隨母系遺傳。有研究表明,如果孕婦本人是雙胎之一,她生雙胎的機率為1/58;若孕婦的父親或母...
    鄴水芙蓉hibiscus閱讀 3,902評論 0 2
  • 今天理好了行李,看到快要九點了,就很匆忙的洗頭洗澡,(心存一份念想,你總會打給我的??)然后把洗頭液當(dāng)成沐浴液了??,...
    bevil閱讀 2,924評論 1 1
  • 那年我們15,像陽光一樣溫暖的年紀(jì)。每天我都會騎自行車上學(xué),路過田野,工廠,醫(yī)院,村莊,有微風(fēng),有陽光,有綠...
    木偶說愛你閱讀 2,594評論 0 3

友情鏈接更多精彩內(nèi)容