讀《Computational-method-for-single-cell-data-analysis》

跟著運來兄搭建自己的生物信息小書房。趁年輕,讀幾本硬書,到老了慢慢反芻。

如果讓我推薦一本比較全面的單細胞數(shù)據(jù)分析教材,我想會是《Computational-method-for-single-cell-data-analysis》。在2019年剛出版沒多久的時候,就有趁著一次在中科院的生物信息會議之后,打印了這本書(僅作個人學習之用)。

通過時間戳可以猜出來是哪個會議嗎?

本書談及單細胞數(shù)據(jù)分析深入淺出,一大特色是實操性很強,每一節(jié)都有代碼示例?,F(xiàn)在再翻看這本書,一個體會是:很多分析工具其實早就為我們做好了,不必為工具的不斷迭代而糾結。身處哪個時代,我們就用那個時代的工具來分析我們的數(shù)據(jù)。另一個體會是:雖然工具不斷迭代,但是生物學問題是不變的,比如如今我們還是會問:細胞類型和細胞狀態(tài)的區(qū)別到底是什么?連續(xù)中包含著離散嗎?

全書以單細胞數(shù)據(jù)質(zhì)控開始,以空間數(shù)據(jù)分析結束。完整介紹了單細胞數(shù)據(jù)分析的流程:

  • 質(zhì)控
  • 均一化
  • 高變異基因
  • 細胞類型鑒定
  • 稀有細胞類型
  • 小鼠細胞圖譜
  • 通路分析
  • 擬時序分析
  • 基因共表達網(wǎng)絡
  • 單細胞等位基因
  • 單細胞可變剪切
  • 單細胞表觀
  • 單細胞抗體
  • 空間轉(zhuǎn)錄組

借題發(fā)揮一下,這里分享一番讀者本人對單細胞數(shù)據(jù)分析中的數(shù)據(jù)質(zhì)控的基本看法。這一部分是大部分入門單細胞數(shù)據(jù)分析第一個要面臨的困惑:nFeature/mt 的閾值到底設置多少是合適的,5%,15%還是25%?單細胞的數(shù)據(jù)質(zhì)控到底有沒有一個統(tǒng)一的標準?

答案是還沒有。

為啥呢?

這就要回到單細胞這項技術解決的基本生物學問題上來:他回答的就是組織內(nèi)細胞的異質(zhì)性,什么叫異質(zhì)性?另一個名字叫:不一樣。

以線粒體基因的表達為例,一開始人們認為線粒體基因表達量高的細胞狀態(tài)不好,可能瀕臨死亡,這些細胞需要去除。隨著研究的深入,我們發(fā)現(xiàn)有些細胞類型線粒體基因表達量確實比一般的細胞高,比如神經(jīng)細胞。退一步講,瀕臨死亡的細胞就不值得被研究了嗎?一些腫瘤組織的線粒體基因確實較高呀,你按照5%的閾值去卡,10000個細胞還剩下200個。

再以細胞周期為例,在一些單細胞數(shù)據(jù)分析教程里演示了如何回歸掉細胞周期對分群的影響,得出的結論是:你看我對細胞周期進行了回歸,這樣細胞圖普就正常多了。然而,當我們研究的是腫瘤細胞的話,這樣的回歸是否有必要呢?腫瘤的一個特色就是細胞周期失控,一些細胞周期調(diào)控基因表達量很高。

另一方面,在數(shù)據(jù)分析的實踐中,我們從一個表達矩陣中刪除細胞、亞群、基因是一件很好操作的事情。但是如果在條件還不是那么明朗的情況下就貿(mào)然刪除掉某些細胞,再想把他們加回來就不好操作了:很多分析需要重新做。更重要的是:很多事,一旦錯過了,就不再。

所以單細胞數(shù)據(jù)質(zhì)控的一個基本原則是什么:

You cannot stop it if you cannot see it

特別在剛讀入數(shù)據(jù)的那個晚上,對手里的數(shù)據(jù)局勢還不是很明朗,不能以莫須有的名義刪除我們花了大貴價錢測來的細胞或者基因。說人話就是:在最開始的數(shù)據(jù)質(zhì)控中,我們可以把質(zhì)控條件設置的寬一些。然后再根據(jù)數(shù)據(jù)分布特征(如小提琴圖)或者基因通路來判斷某些亞群的去留??偨Y起來就是:

  • 具體問題具體分析
  • 數(shù)據(jù)質(zhì)控有理有據(jù)

回到咱們這本書上來,印象最深的內(nèi)容有郭老師參與寫作的scMCA: A Tool to Define Mouse Cell Types Based
on Single-Cell Digital Expression
這一章,介紹了小鼠細胞圖譜以及如何利用它來做細胞類型的鑒定,也是在那個時候開始follow這個團隊。

直到現(xiàn)在,我還在是不是翻看這本書,每有會意往往有得。

Computational-method-for-single-cell-data-analysis.png

這幾年單細胞數(shù)據(jù)朝著多組學、高通量的方向發(fā)展,單細胞數(shù)據(jù)分析也沉淀一些經(jīng)典的分析工具,同時也出現(xiàn)一些新興的實踐。不變的是我們不斷對生物學問題的探索和追問,讓我們一起在這個快速發(fā)展的領域:荷道以躬,輿之以言。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容