什么是線粒體基因
線粒體是參與細(xì)胞凋亡啟動(dòng)和執(zhí)行的主要細(xì)胞器之一。線粒體基因在大多數(shù)細(xì)胞中表達(dá),其表達(dá)水平是細(xì)胞類型特異性的。也就是說這個(gè)也是和細(xì)胞類型及其狀態(tài)有關(guān)系的。
為什么scrna-seq需要處理線粒體
因?yàn)榫€粒體基因的高表達(dá)水平可能是:
- 樣品質(zhì)量差,導(dǎo)致大量細(xì)胞凋亡或裂解。
- 特定樣本的生物學(xué),例如腫瘤活檢,可能由于代謝活動(dòng)和/或壞死而增加線粒體基因表達(dá)。
凋亡細(xì)胞表達(dá)線粒體基因,并將這些轉(zhuǎn)錄產(chǎn)物輸出到哺乳動(dòng)物細(xì)胞的細(xì)胞質(zhì)中。例如,當(dāng)?shù)蛲龅募?xì)胞被放入正常的細(xì)胞懸液中,會(huì)檢測(cè)到更多的線粒體基因。檢測(cè)到的線粒體膜占總膜的百分比如圖所示

線粒體是參與細(xì)胞凋亡啟動(dòng)和執(zhí)行的主要細(xì)胞器之一 。細(xì)胞凋亡的過程依賴于一系列信號(hào)事件,包括線粒體基因表達(dá)的增加和半胱天冬酶的激活。 因此,我們?cè)谟?jì)算每個(gè)樣本中源自線粒體基因表達(dá)的UMIs數(shù)量時(shí),評(píng)估了獨(dú)特轉(zhuǎn)錄本的比例(percentage counts of MT-)
在> 80%活細(xì)胞的高質(zhì)量樣品中,我們只檢測(cè)到低比例的線粒體細(xì)胞(約3%) 與預(yù)期的一樣,在只包含20%活細(xì)胞(74%)的Digitonin高樣本中,線粒體轉(zhuǎn)錄本的數(shù)量最高 相比之下,含有50%活細(xì)胞的樣本只顯示線粒體基因表達(dá)略有增加(5-7%),這表明存活率確實(shí)與觀察到的線粒體轉(zhuǎn)錄本數(shù)量相關(guān)(線粒體基因在細(xì)胞中counts數(shù)越多,表明該細(xì)胞活力越弱)。
被裂解的細(xì)胞或細(xì)胞膜被破壞的細(xì)胞釋放它們的細(xì)胞質(zhì)轉(zhuǎn)錄本,而線粒體轉(zhuǎn)錄本可能仍然保留在雙膜結(jié)合的線粒體內(nèi) 具有完整線粒體的裂解細(xì)胞可能被gems包裹,這也增加了檢測(cè)到的線粒體轉(zhuǎn)錄片段的概率
如何處理
一般我們建議卡到15%以內(nèi)。
當(dāng)然還是要看這群細(xì)胞為什么會(huì)高??梢圆豢ㄩ撝抵苯幼鼋稻S分群,然后按分群來看小提琴圖,如果只有一個(gè)或幾個(gè)細(xì)胞群有差異的線粒體轉(zhuǎn)錄上調(diào)(把每個(gè)分群的差異基因拉出來看MT-基因有沒有高表達(dá))和低總UMI計(jì)數(shù)(某個(gè)cluster他的counts數(shù)很少),質(zhì)量差的細(xì)胞通常有低總UMI計(jì)數(shù),很少有上調(diào)基因(表明低總基因表達(dá)),而只有MT基因過表達(dá)。例如,在下面的圖中,您可以看到基于圖形的聚類t-SNE圖中聚類1(頂部的青色聚類)的基因表達(dá)。與上述鑒定死亡細(xì)胞的標(biāo)準(zhǔn)一致,在這個(gè)群集中只有線粒體基因上調(diào)。對(duì)cluster 9中的細(xì)胞也進(jìn)行了類似的觀察。這個(gè)群最有可能代表一個(gè)死亡或頻臨死亡的細(xì)胞群 此時(shí)再去除也可以。
另外一點(diǎn),我們注意到,cellRanger3比cellRanger 2檢測(cè)的MT(人的是MT開頭的基因,其他物種主要找到相應(yīng)的基因)高的細(xì)胞更多(umi拐點(diǎn)出現(xiàn)的更早)。原因主要是 cellRanger3或更高版本具有比版本2中的cell calling更敏感的算法,新算法基于EmptyDrops方法(Lun et al., 2018)。這種方法可以檢測(cè)到之前版本算法所遺漏的細(xì)胞,特別是死亡或垂死的細(xì)胞,RNA含量自然較低的細(xì)胞,或異質(zhì)性樣本中的細(xì)胞。

這就也是為什么我們會(huì)主動(dòng)地看看細(xì)胞中MT基因表達(dá)的原因,選擇從下游分析中排除這些細(xì)胞。而在cellranger count管道中,沒有直接的方法可以排除線粒體豐富的細(xì)胞 但是,您可以使用下面兩種方法中的任何一種來間接完成此任務(wù)

下面的圖顯示,與其他細(xì)胞相比,Cluster1和Cluster19中的細(xì)胞的總UMI計(jì)數(shù)也很低。

當(dāng)然我們最常用的還是Seurat。Seurat可用于篩選線粒體基因表達(dá)率高的細(xì)胞。