給免疫學(xué)家們的單細(xì)胞測序指南

近年來,單細(xì)胞測序(scRNA-seq)方法在免疫學(xué)領(lǐng)域的應(yīng)用迅速增加。隨著技術(shù)的廣泛應(yīng)用,用戶越來越難以選擇最佳的scRNA-seq方法和平臺(tái)來解決他們感興趣的生物學(xué)問題。在這里,我們比較了四種常用的scRNA-seq平臺(tái)的優(yōu)勢和局限性,以闡明它們在不同實(shí)驗(yàn)應(yīng)用中的適用性。我們還討論了如何整合不同scRNA-seq平臺(tái)生成的數(shù)據(jù)集,以及如何使用無偏倚生物信息學(xué)方法識(shí)別未知的單細(xì)胞群體。

Introduction

免疫系統(tǒng)由介導(dǎo)宿主抵御病原體的細(xì)胞、組織和器官網(wǎng)絡(luò)組成,但該網(wǎng)絡(luò)也在體內(nèi)平衡活動(dòng)中發(fā)揮關(guān)鍵作用,如組織發(fā)育和代謝。借助顯微鏡和流式細(xì)胞儀,免疫細(xì)胞可以很容易地根據(jù)特定的表面標(biāo)記分為不同的類型。然而,并不是所有的免疫細(xì)胞類型都可以通過表型標(biāo)記的單獨(dú)分析來完全解決,因?yàn)樵S多免疫細(xì)胞類型是由多個(gè)細(xì)胞譜系表達(dá)的,或者在炎癥過程中有不同的調(diào)節(jié)?;虮磉_(dá)研究是在大量分類或純化的免疫細(xì)胞上進(jìn)行的,試圖更好地理解它們的轉(zhuǎn)錄組。在這個(gè)過程中,新的和獨(dú)特的群體marker被識(shí)別,可以更有效地區(qū)分不同的免疫細(xì)胞。盡管如此,這種類型的分析并不考慮單個(gè)細(xì)胞之間基因表達(dá)的差異性,也不考慮具有重疊表型特征的不相關(guān)細(xì)胞類型的樣本污染的影響。因此,群體內(nèi)生物學(xué)上顯著的異質(zhì)性可以被掩蓋,相關(guān)信息被污染細(xì)胞的無關(guān)信號給平均掉了。這在研究時(shí)間動(dòng)態(tài)過程時(shí)尤為關(guān)鍵,例如,原始細(xì)胞通過多個(gè)過渡階段發(fā)展為終末分化的群體。對存在于連續(xù)分化和活化狀態(tài)的細(xì)胞進(jìn)行Bulk分析的方法導(dǎo)致了對其獨(dú)特特征的平均,并相應(yīng)失去了生物學(xué)上的重要信息。

NGS的進(jìn)步使得在單個(gè)細(xì)胞水平上研究免疫系統(tǒng)成為可能。單細(xì)胞rna測序(scRNA-seq)現(xiàn)在廣泛應(yīng)用于免疫學(xué)研究,尋求解決以前未被認(rèn)識(shí)的細(xì)胞異質(zhì)性,定義細(xì)胞發(fā)育和分化的關(guān)鍵過程,揭示造血的關(guān)鍵途徑,

了解預(yù)測免疫功能的基因調(diào)控網(wǎng)絡(luò)。單細(xì)胞轉(zhuǎn)錄組的靜態(tài)快照(static snapshot)可以提供一個(gè)強(qiáng)大的方法,了解細(xì)胞之間很少同步的分化和激活狀態(tài)的各個(gè)階段。

低起始量的RNA-seq方法的快速發(fā)展導(dǎo)致了scRNA-seq protocol的激增,每個(gè)protocol都有自己的優(yōu)點(diǎn)和局限性。因此,對于非專家來說,選擇最合適的方法來解決特定的研究問題,或評估單細(xì)胞方法是否適合特定的研究都是一種挑戰(zhàn)。在這里,我們列出了四種最常用的scRNA-seq方法,并討論了它們在工作流程、靈敏度、數(shù)據(jù)質(zhì)量和成本方面的優(yōu)勢和局限性(表1),從而提供了一個(gè)指南,可以幫助免疫學(xué)家為他們的scRNA-seq研究做出知情的選擇。我們還演示了如何進(jìn)行無偏單細(xì)胞識(shí)別,以及如何在下游分析之前整合不同scRNA-seq protocol獲得的數(shù)據(jù)。

image.jpeg

單細(xì)胞測序技術(shù)

自2009年第一個(gè)scRNA-seqprotocol發(fā)布以來,已經(jīng)有了關(guān)于scRNA-seq方法的擴(kuò)展,這些方法不同于mRNA轉(zhuǎn)錄本如何被放大來生成全長cDNA或在5'或3'端具有唯一分子標(biāo)識(shí)符(UMI)的cDNA。例如,SMART-seq ( switching mechanism at 5′ end of RNA template sequencing)及其改進(jìn)的protocol,SMART-seq2是用來生成全長cDNA的protocol,而MARS-seq( massively parallel RNA single-cell sequencing)、STRT( single-cell tagged reverse transcription)、CEL-seq( cell expression by linear amplification and sequencing),cell -seq2 , Drop-seq和inDrops(indexing droplets)是設(shè)計(jì)用于將UMIs納入cDNA的protocol。

為了促進(jìn)樣品制備的自動(dòng)化和簡單化,其中一些protocol可以與微流體或基于液滴的平臺(tái)一起使用,例如分別使用Fluidigm C1、10X Genomics的Chromium和1 CellBio的InDrop。

我們選擇關(guān)注以下scRNA-seq方法/平臺(tái),即MARS-seq、SMART-seq2、Fluidigm C1和10X Genomics Chromium,因?yàn)樗鼈円呀?jīng)被生物醫(yī)學(xué)科學(xué)家廣泛應(yīng)用于各個(gè)領(lǐng)域。

除了作為獨(dú)立的技術(shù)使用外,其中一些方法還可以與熒光激活細(xì)胞分選(FACS)相結(jié)合,后者用熒光團(tuán)偶聯(lián)抗體對細(xì)胞進(jìn)行染色,以便于從異質(zhì)懸浮液中分離。特別是,現(xiàn)在可以使用FACS索引排序,以分離具有已知特征的單個(gè)細(xì)胞(例如,定義的大小、粒度和選定的標(biāo)記表達(dá)),并記錄它們在檢測板中的位置。索引排序允許回溯性地處理意外問題,因?yàn)樗苊馐褂妙A(yù)定義的單元排序策略。

例如,一個(gè)罕見的細(xì)胞群的表型可能沒有明確的定義,因此,在各種不同的組合中分析多個(gè)不同的標(biāo)記可以幫助確定下游實(shí)驗(yàn)的更好的分選策略。

此外,該方法提供了重要的實(shí)驗(yàn)控制,特別是確定哪些細(xì)胞類型對protocol施加的方法和技術(shù)偏差最敏感的能力,例如,通過比較最初的數(shù)量和分類細(xì)胞的身份與那些通過后期質(zhì)量控制的細(xì)胞。

Massively Parallel RNA Single Cell Sequencing (MARS-seq)

MARS-seq是一種自動(dòng)化的scRNA-seq方法,該方法將來自目標(biāo)群體的單個(gè)細(xì)胞按facs分類為384孔板,其中包含裂解緩沖液。384孔板可以在樣品處理之前儲(chǔ)存很長一段時(shí)間,這使得在時(shí)間管理方面具有很大的靈活性。這種方法不受細(xì)胞大小、形狀、均勻性或總數(shù)的限制。

MARS-seq采用3'端計(jì)數(shù)mRNA測序方法,生成部分cDNA轉(zhuǎn)錄本(不是全長)。

這些cDNA在最初的逆轉(zhuǎn)錄階段被標(biāo)記為barcode和UMI,然后通過體外轉(zhuǎn)錄(IVT)進(jìn)行聚合和擴(kuò)增。UMI可以定量單個(gè)細(xì)胞內(nèi)單個(gè)基因的表達(dá)水平,從而減少在擴(kuò)增步驟中引入的技術(shù)變變性和偏差(這是相對于C1和SMART-seq2方法的明顯優(yōu)勢)。

pooling策略使cDNA擴(kuò)增的多路復(fù)用,這既簡化了過程,也大大增加了樣品的通量。目前,該方法可以檢測到每個(gè)原代細(xì)胞約500-3000個(gè)基因。

Fluidigm C1 Single Cell Full Length Messenger RNA (mRNA) Sequencing

Fluidigm C1是一種自動(dòng)化的微流體系統(tǒng),可以捕獲和處理多達(dá)96個(gè)單個(gè)細(xì)胞,在任何Illumina測序機(jī)上進(jìn)行相對mRNA定量。

細(xì)胞捕獲、裂解、逆轉(zhuǎn)錄和細(xì)胞多路復(fù)用發(fā)生在集成流控電路芯片中。目前有三種不同細(xì)胞尺寸的試劑盒(5-10、10-17和17-25 μM)可供使用,可以分析范圍廣泛的細(xì)胞大小,盡管輸入的細(xì)胞必須具有相對均勻的大小和形狀,以避免選擇偏差。

計(jì)數(shù)和制備至少需要10,000個(gè)細(xì)胞,這使得該平臺(tái)不適合在大塊細(xì)胞樣本中鑒定稀有群體。被檢測的細(xì)胞也必須是新鮮的并立即處理,因此這種方法可能很難與需要長時(shí)間處理的實(shí)驗(yàn)相結(jié)合。此外,由于每臺(tái)機(jī)器在給定的時(shí)間只能容納一個(gè)墨盒,因此需要多臺(tái)機(jī)器同時(shí)運(yùn)行多個(gè)cell population /墨盒。微流體墨盒的高成本也會(huì)限制每個(gè)項(xiàng)目中使用的樣本量。重要的是,C1系統(tǒng)允許在顯微鏡下單獨(dú)觀察捕獲的細(xì)胞,從而允許用戶在下游文庫制備之前排除空孔、雙體或含有細(xì)胞碎片的孔。

C1系統(tǒng)采用SMART-sequencing,并生成全長cDNA(不像MARS-seq和10X Genomics Chromium使用的部分轉(zhuǎn)錄本)。

C1技術(shù)目前能夠檢測每個(gè)原代細(xì)胞300-7000個(gè)基因。雖然最近引入的C1 mRNA Seq HT檢測顯著增加了系統(tǒng)通量(允許在一次運(yùn)行中捕獲多達(dá)800個(gè)個(gè)體細(xì)胞),但該方法使用3‘末端計(jì)數(shù)mRNA測序,因此失去了整個(gè)轉(zhuǎn)錄本的reads覆蓋。

Switching Mechanism at 5′ End of RNA Template (SMART-seq2)

SMART-seq2 SMART-seq的改進(jìn)版本(類似于Fluidigm C1),以改進(jìn)反轉(zhuǎn)錄,模板切換和pre-amplification步驟為了增加產(chǎn)量和互補(bǔ)脫氧核糖核酸數(shù)據(jù)庫生成的從每個(gè)細(xì)胞的長度(同時(shí)使用現(xiàn)成的試劑可用以較低的成本)。

SMART-seq2生成全長cdna,并在整個(gè)轉(zhuǎn)錄本上提供良好的閱讀覆蓋率,從而允許使用單核苷酸多態(tài)性(SNPs)檢測基因的異構(gòu)體或等位基因特異性表達(dá)。

然而,UMIs和條形碼不能合并,因此不可能對樣品進(jìn)行基因水平定量或多路復(fù)用,從而增加了下游加工的復(fù)雜性。

與MARS-seq類似,目標(biāo)群體中的單個(gè)細(xì)胞被分選到96孔或384孔PCR板中,預(yù)先填充裂解緩沖液(因此該方法與指數(shù)排序方法完全兼容),并且在樣品處理前,該板可以保存很長時(shí)間。

同樣,SMART-seq2不受細(xì)胞大小、形狀、同質(zhì)性或總數(shù)量的限制,因此它適用于處理非常罕見種群的實(shí)驗(yàn)。

與自動(dòng)化的scRNA-seq方法不同,這種反應(yīng)是在單個(gè)井中進(jìn)行的,需要人工移液,因此更耗費(fèi)時(shí)間,增加了技術(shù)的可變性。

因此,這種方法可能不是最有效的實(shí)驗(yàn),需要數(shù)千個(gè)單獨(dú)的細(xì)胞,盡管液體處理機(jī)器人可以用來減少移液問題(盡管大大增加了成本)。

重要的是,這種方法可以在每個(gè)原代細(xì)胞中檢測到更多的基因(約4000 ~ 7000)。

10X Genomics Chromium Single Cell RNA Sequencing

10X Genomics Chromium系統(tǒng)采用乳液凝膠珠(GEM)方法進(jìn)行基于液滴的單細(xì)胞快速封裝。使用此方法,每個(gè)凝膠珠標(biāo)記的寡核苷酸由一個(gè)獨(dú)一無二的條形碼,10 bp UMI適配器/引物測序,錨定30 bp oligo-dT(7)。這個(gè)系統(tǒng)允許高通量和減少需要分揀設(shè)備或涉及大量的試驗(yàn)板的工作流。

最多可同時(shí)處理8個(gè)不同的樣品,適合需要時(shí)間過程元素或多種處理的實(shí)驗(yàn)。

與上述其他方法相比,單個(gè)細(xì)胞的下游處理(逆轉(zhuǎn)錄、cDNA擴(kuò)增和文庫構(gòu)建)極其簡單,因?yàn)樗屑?xì)胞的反應(yīng)可以在一個(gè)試管中一起進(jìn)行(而不需要多個(gè)96孔板處理)。該平臺(tái)目前能夠在每個(gè)原代細(xì)胞中檢測500 1500個(gè)基因。

雖然在本文討論的方法中,10X Genomics Chromium系統(tǒng)是最經(jīng)濟(jì)、最節(jié)省時(shí)間的,但該protocol對細(xì)胞輸入提供的控制很少,而且容易受到選擇偏差的影響,導(dǎo)致對系統(tǒng)生物學(xué)的不準(zhǔn)確反映。

因此,如果分析的細(xì)胞數(shù)量不足,則可能不能恰當(dāng)?shù)乇硎鞠∩俚募?xì)胞群。此外,用戶無法確定在下游處理和質(zhì)量控制措施之前收集了哪些細(xì)胞。

這與基于facs的方法相反,在這種方法中,用戶知道哪些單元格已經(jīng)加載,以及它們是否通過了質(zhì)量控制措施。10X Genomics Chromium系統(tǒng)可以通過測序(CITE-seq)與轉(zhuǎn)錄組和表位的細(xì)胞索引(CITE-seq)結(jié)合使用,這種方法允許對數(shù)千個(gè)單細(xì)胞進(jìn)行無偏譜轉(zhuǎn)錄組分析的多重蛋白標(biāo)記檢測。

簡單地說,在處理scRNA-seq之前,細(xì)胞用抗體-寡核苷酸復(fù)合物染色。

染色的單細(xì)胞被封裝到納米級大小的水滴中,溶解在水滴中,從而釋放細(xì)胞mrna和抗體來源的寡聚體,這些寡聚體通過其3 poly A尾巴與含有寡聚體dt的凝膠珠結(jié)合,并在逆轉(zhuǎn)錄過程中被共享的細(xì)胞條形碼標(biāo)記(34)。

CITE-seq可用于單細(xì)胞水平的翻譯后基因調(diào)控研究,甚至可用于大抗體組的大規(guī)模免疫表型研究。因此,這可能會(huì)增強(qiáng)細(xì)胞表型的發(fā)現(xiàn)和描述,特別是具有細(xì)微轉(zhuǎn)錄組差異的細(xì)胞群體。

Considerations for Choosing the Right Platform: Biological Pragmatism at Best!

NGS和計(jì)算方法的進(jìn)步將繼續(xù)使scRNA-seq在一般實(shí)驗(yàn)室中更有吸引力。為特定的研究選擇一個(gè)合適的平臺(tái)顯然是至關(guān)重要的,但這高度依賴于正在處理的生物學(xué)問題的類型,并進(jìn)一步受到細(xì)胞數(shù)量、信息深度、和總成本(表1)。這里的一個(gè)主要挑戰(zhàn)是,大多數(shù)研究者將需要在進(jìn)行實(shí)驗(yàn)之前,對他們預(yù)期的細(xì)胞異質(zhì)性水平進(jìn)行合理的估計(jì)。

Which Protocol Should I Use?

選擇使用哪種scRNA-seqprotocol取決于研究問題的性質(zhì)。

技術(shù)上,這里描述的四種方法可以分為兩組:全長方法(SMART-seq2和Fluidigm C1)和基于分子標(biāo)記的方法(MARS-seq和10X基因組鉻)。

全長方法涵蓋了整個(gè)轉(zhuǎn)錄組,增加了可映射reads的數(shù)量,使其適用于包括細(xì)胞類型發(fā)現(xiàn)、評估組織組成、等位基因表達(dá)分析,甚至異構(gòu)體發(fā)現(xiàn)等應(yīng)用。

然而,全長方法的一個(gè)主要缺點(diǎn)是,它們不能通過將樣本池集成到一個(gè)單管來生成庫,從而增加了總體成本和勞動(dòng)力。

此外,不能合并UMIs以允許對轉(zhuǎn)錄本進(jìn)行數(shù)字量化。

相反,基于分子標(biāo)簽的方法是基于分子的5或3端測序,因此這些可以與UMIs結(jié)合,使樣品的多路復(fù)用,以提高基因表達(dá)的定量和通量。

然而,由于讀取被限制在文字記錄的一端,與全長方法相比,總體靈敏度降低。

盡管有這些缺點(diǎn),但基于標(biāo)簽的方法的低成本和高通量意味著它們現(xiàn)在被廣泛應(yīng)用于基因表達(dá)水平、細(xì)胞類型發(fā)現(xiàn)和組織組成的研究。

因此,平臺(tái)的靈敏度是一個(gè)關(guān)鍵的決定因素測序深度和每個(gè)細(xì)胞檢測到的基因總數(shù)。

一種方法的靈敏度被定義為能夠被自信地檢測到的尖峰插入控制所需的輸入RNA分子的最小數(shù)量。因此,高靈敏度可以檢測弱表達(dá)基因。

我們發(fā)現(xiàn)MARS-seq、Fluidigm C1和SMART-seq2檢測的中位數(shù)分別為4763、7572和9138個(gè)基因(36),這與我們在分析MARS-seq、SMART-seq2、Fluidigm C1和10X Genomics Chromium平臺(tái)生成的數(shù)據(jù)時(shí)觀察到的結(jié)果一致。

SMART-seq2在靈敏度方面優(yōu)于其他方法,這可能是因?yàn)榛跇?biāo)簽方法的轉(zhuǎn)錄本可能具有難以與基因組對齊的近端序列特征,因此具有更多可映射的reads。

How Many Cells Do I Need to Sequence?

單細(xì)胞實(shí)驗(yàn)的另一個(gè)關(guān)鍵考慮因素是發(fā)現(xiàn)所需的細(xì)胞數(shù)量,這反過來也取決于具體的研究目標(biāo)。例如,旨在描述免疫系統(tǒng)或發(fā)現(xiàn)罕見細(xì)胞群的研究可以使用breadth-based的方法,在這種方法中,可能會(huì)對數(shù)百到數(shù)萬個(gè)細(xì)胞進(jìn)行測序,以提供組織組成的合理分布。這種方法已經(jīng)被用于繪制多種組織,包括脾臟、大腦和腸。

Amit和同事展示的一項(xiàng)開創(chuàng)性工作是使用MARS-seq技術(shù)解剖小鼠脾臟內(nèi)的細(xì)胞多樣性(21)。

從1536個(gè)CD11c+單細(xì)胞中,他們確定了8個(gè)不同的轉(zhuǎn)錄組,分別對應(yīng)于B細(xì)胞、自然殺傷細(xì)胞、巨噬細(xì)胞、單核細(xì)胞和4個(gè)不同的樹突狀細(xì)胞(DC)亞群。

在一項(xiàng)繪制小鼠大腦細(xì)胞異質(zhì)性的獨(dú)立研究中,使用Fluidigm C1平臺(tái)對來自小鼠初級軀體感覺皮層S1區(qū)和海馬CA1區(qū)的3005個(gè)單個(gè)細(xì)胞進(jìn)行了測序。其中鑒定出了47種分子上不同的細(xì)胞亞類,它們與小鼠皮層中已知的主要細(xì)胞類型相對應(yīng)。在這些細(xì)胞中,發(fā)現(xiàn)了6種不同種類的少突膠質(zhì)細(xì)胞,可能代表了不同的成熟階段。

綜上所述,這些研究表明所需的細(xì)胞數(shù)量取決于群體中離散細(xì)胞狀態(tài)的數(shù)量。在一個(gè)細(xì)胞狀態(tài)在轉(zhuǎn)錄上不同且分布均勻的異質(zhì)群體中,1000 - 2000個(gè)單細(xì)胞可能足以實(shí)現(xiàn)不同細(xì)胞狀態(tài)的重新聚集。

然而,如果感興趣的細(xì)胞在混合細(xì)胞中具有不同的轉(zhuǎn)錄譜,那么它可能在較少的細(xì)胞和較淺的測序深度下被揭示。隨著基于液滴的技術(shù)的普及,將會(huì)有更多的低測序深度研究,檢測10到100倍以上的細(xì)胞。因此,研究人員應(yīng)該考慮哪種方法最適合他們的研究問題和預(yù)算。

What Are Some Potential Applications of scRNA-seq?

scRNA-seq已被用于多種免疫學(xué)研究。傳統(tǒng)上,免疫細(xì)胞被認(rèn)為是同質(zhì)的,盡管一些人群可能顯示功能異質(zhì)性。最近的scRNA-seq研究表明,曾經(jīng)被認(rèn)為是明確定義的免疫群體,可能包含具有重疊表型標(biāo)記的轉(zhuǎn)錄上不同的群體。

例如,Bjorklund等人在人類扁桃體中確定了四種不同的先天淋巴細(xì)胞(ILC)簇,它們與已知的表型特征的ILC群體相對應(yīng),即ILC1-3和自然殺傷細(xì)胞(NK)。此外,他們還發(fā)現(xiàn)了ILC3中三個(gè)在轉(zhuǎn)錄和功能上不同的亞群。類似地,Gury-BenAri等人評估了在小鼠小腸中helper-like ILC的異質(zhì)性。通過結(jié)合MARS-seq與染色質(zhì)免疫沉淀測序(CHIP-seq)和轉(zhuǎn)座酶可達(dá)染色質(zhì)測序(ATAC-seq),他們能夠獲得細(xì)胞的轉(zhuǎn)錄和調(diào)控。

總之,這些研究表明,scRNA-seq可以幫助揭示傳統(tǒng)表型研究中可能被掩蓋的細(xì)胞異質(zhì)性。scRNA-seq也可以用來描述組織并幫助鑒定疾病的分子驅(qū)動(dòng)因素。這些研究有助于更好地了解這種疾病的免疫反應(yīng)和致病性,并為開發(fā)治療、管理甚至治愈這種疾病的新藥物鋪平道路。scRNA-seq也可用于研究免疫功能,如抗原受體儲(chǔ)備。T細(xì)胞受體的序列可以從scRNA-seq序列中組裝,并根據(jù)reference進(jìn)行映射。

這些應(yīng)用將使人們更好地了解適應(yīng)性免疫如何對免疫損傷(如感染、自身抗原或疫苗接種)作出反應(yīng),并引領(lǐng)治療方法的發(fā)展。在發(fā)育背景下,Giladi等人最近解剖了小鼠骨髓中造血干細(xì)胞的分化軌跡,以單細(xì)胞分辨率跟蹤它們發(fā)展到每個(gè)造血細(xì)胞系。本研究使用MARS-seq對超過60385個(gè)個(gè)體細(xì)胞的基因表達(dá)進(jìn)行了分析,從而使作者能夠生成一個(gè)正常小鼠骨髓造血的無偏倚參考模型。認(rèn)識(shí)到這些方法的潛力,全球科學(xué)界現(xiàn)在已經(jīng)開始使用scRNA-seq技術(shù)進(jìn)行國際合作,以建立一個(gè)人體細(xì)胞圖譜,繪制人體中每一種細(xì)胞類型。當(dāng)完成時(shí),這個(gè)圖集將毫無疑問地推進(jìn)目前對人類生理學(xué)的理解,并對生物學(xué)和醫(yī)學(xué)的所有領(lǐng)域產(chǎn)生重大影響。

### A Computational Approach for Cell Type Identification of Unknown Single Cells

在scRNA-seq技術(shù)出現(xiàn)之前,細(xì)胞類型通常是通過一組針對預(yù)先選定的細(xì)胞表面標(biāo)記物的抗體來定義的(通常是根據(jù)對相關(guān)細(xì)胞譜系的預(yù)先了解和相關(guān)抗體的普遍可用性來確定的)。

隨著技術(shù)的不斷進(jìn)步,可以使用流式細(xì)胞術(shù)或大規(guī)模細(xì)胞術(shù)測量的每個(gè)細(xì)胞的標(biāo)記物數(shù)量已從<10增加到>40。

這種大量的標(biāo)記物使得對細(xì)胞異質(zhì)性進(jìn)行更詳細(xì)的分析成為可能,但仍然遠(yuǎn)遠(yuǎn)落后于采用轉(zhuǎn)錄組或蛋白質(zhì)組技術(shù)進(jìn)行細(xì)胞類型鑒定的無偏倚方法。

事實(shí)上,scRNA-seq技術(shù)現(xiàn)在能夠在很短的時(shí)間內(nèi)測量數(shù)千個(gè)單個(gè)細(xì)胞的轉(zhuǎn)錄組,計(jì)算方法的快速進(jìn)步使得以完全公正的方式對這些細(xì)胞進(jìn)行穩(wěn)健的識(shí)別成為可能。然而,生物學(xué)家在獲得scRNA-seq數(shù)據(jù)后面臨的主要挑戰(zhàn)是如何將數(shù)據(jù)聚類和/或進(jìn)行細(xì)胞識(shí)別。

許多不同的算法現(xiàn)在被用于對單細(xì)胞數(shù)據(jù)進(jìn)行聚類,包括共享最近鄰(SNN)、SNN- cliq、pcaReduce、通過imputation和降維聚類(CIDR)、單細(xì)胞共識(shí)聚類(SC3)、單細(xì)胞RNA-seq分析(SINCERA)、稀有細(xì)胞類型識(shí)別(RaceID)、GiniClust和單細(xì)胞潛變量模型(scLVM)。

在細(xì)胞群鑒定之后,每個(gè)細(xì)胞群中差異表達(dá)的基因被確定,然后被分配為已知/新的細(xì)胞類型(基于潛在的有偏差的血統(tǒng)標(biāo)記的先驗(yàn)知識(shí))。

Data Integration and Correction of Technical Variation

隨著scRNA-seq提供的數(shù)據(jù)產(chǎn)量的增加,研究人員現(xiàn)在可以挖掘現(xiàn)有的數(shù)據(jù)集來執(zhí)行多種不同類型的分析。然而,不同scRNA-seq平臺(tái)生成的數(shù)據(jù)集通常需要在下游分析之前進(jìn)行集成,并且在合并這些數(shù)據(jù)集之前必須糾正數(shù)據(jù)集之間的技術(shù)差異。當(dāng)scRNA-seq應(yīng)用于大量細(xì)胞時(shí),實(shí)驗(yàn)通常是分批進(jìn)行的,導(dǎo)致了顯著的組間差異,從而掩蓋了生物異質(zhì)性。 將批信息疊加到tSNE圖上顯示,這些亞群對應(yīng)于兩個(gè)獨(dú)立的試驗(yàn)運(yùn)行。為了消除這種批處理效應(yīng),Seurat包實(shí)現(xiàn)了典型相關(guān)分析(CCA)算法,該算法識(shí)別第1批和第2批相關(guān)度最高的維度,并將單元投射到這些維度上。CCA歸一化后,批次1和批次2中相同類型的細(xì)胞排列良好,兩次試驗(yàn)之間細(xì)胞分離不明顯。

image

Concluding Remarks

這里我們討論了一些廣泛使用的scRNA-seq平臺(tái)的相對優(yōu)勢和局限性,以及當(dāng)前分析單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)集的技術(shù)障礙。隨著下一代測序技術(shù)和計(jì)算方法的不斷改進(jìn),scRNA-seq在免疫學(xué)研究中的應(yīng)用將變得更加廣泛,最終甚至成為常規(guī)。 一旦完成一套完整的參考數(shù)據(jù)庫或免疫圖譜研究,將需要采用新的策略來進(jìn)行多重單細(xì)胞圖譜分析,并采用其他技術(shù)并行分析單個(gè)細(xì)胞的多個(gè)分子特征。 隨著這些技術(shù)的復(fù)雜性的增加,研究人員在選擇分析平臺(tái)時(shí)必須謹(jǐn)慎地根據(jù)特定的假設(shè)和生物學(xué)問題進(jìn)行指導(dǎo),希望能夠深入了解免疫系統(tǒng)在健康和疾病中的作用。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容