繼續(xù)反思:如何才能入門生信?

繼我前幾天的文章徹夜反思:我為什么總是學不好生信? 之后,我認為有必要去搞清楚,為啥我真的學不會生信,以及到底需要怎么樣才能學會生信。于是乎,我認真觀看了賣萌哥給我的推薦,信息如下:
平臺:B站
up主:鯪魚不會飛(孟浩巍老師)
題目:2020-02-08-生信入門的經(jīng)驗分享

為什么學起來這么困難?

缺乏對生信整個框架的認知

我對生信的理解就是,整理數(shù)據(jù),然后畫圖。因此,一直是從數(shù)據(jù)整理下手,然后學別人的畫圖代碼。當然也會跟著別人的項目pipeline走,但是出了既定的框架外,我就會非常的迷茫。一直以來,我在生信上所做的努力就是:
(1)學習基本的linux操作,掌握一套數(shù)據(jù)分析流程,比如RNA-seq;
(2)學習基本的測序知識,比如illumia的測序原理;
(3)重頭戲:學習R語言基礎,以及轉錄組數(shù)據(jù)分析流程。

我在完成上面學習之后,我發(fā)現(xiàn)一些很重要的問題:
(1)內(nèi)心沒有標準,對數(shù)據(jù)的質(zhì)量沒有把控,例如:我可能知道RNA-seq的QC結果最重要的是幾個quality的項目,但是卻不知道為什么。每次我拿到QC報告,總要問一下別人,我這個adapter的檢測沒有通過,影不影響后續(xù)的數(shù)據(jù)分析?一般得到的回復就是,咱們主要看看Q30等等,其他不是很重要。這背后真正的原因,其實是不清晰的,這就讓我感覺很模糊,沒有掌控感;
(2)我可能知道TPM比RPKM和FPKM好像現(xiàn)在用得更多,大約知道一些原因,但是我并不知道RPKM是FPKM的2倍,以及它的原因;
(3)我可能會重復R語言的代碼,但是我還是不知道為什么要做某些數(shù)據(jù)轉換,做與不做到底有啥區(qū)別?做到怎么樣才是對自己的數(shù)據(jù)負責,得到合理的結果。
出現(xiàn)以上原因是因為,我對測序原理沒有掌握好,對每一個步驟的測序數(shù)據(jù)的由來和作用并不清晰;其次是對于不同工具的理解仍然不夠,統(tǒng)計學知識也嚴重不足

學生信應該掌握什么?

首先需要認識到,生物信息學是要用計算機技術去解決大數(shù)據(jù),并且結合生物學背景來篩選出有意義的數(shù)據(jù)。因此,生信要結合計算機+生物背景知識,同時還需要有統(tǒng)計學知識,在這里孟老師講解得非常清晰:

image.png

(1)linux操作能力:在這里他僅僅提到了操作系統(tǒng)的能力,而我認為至少還要理解每一步驟的數(shù)據(jù)結構和意義,以及不同的數(shù)據(jù)能提供給我們的信息。你需要非常努力,才能看起來毫不費力。在這里他推薦了羅老師的30個linux基本操作命令(帶有相應的習題)。
(2)編程能力:這是我一直都未曾掌握的東西,對于半自助應用的我來說,一開始給我的定位就是不需要掌握編程能力,只要學好linux還有R語言即可??墒菚幊痰娜擞胠inux和不會編程的人是完全不同的感覺,在這一點上雖然我不是很著急,但是必須要有所學習。這里提到的是Python,C,C++,Java等東西。
(3)統(tǒng)計能力:這是我也一直忽略的,我認為R語言本身就有一套流程,我是用工具的人,我不需要去理解工具是怎么制作的,然而事實上是,我還得明白工作是怎么運作的,以及工具是要如何選擇。因此在后續(xù)方面要保持對基本統(tǒng)計學知識的掌握。
(4)生物能力:這里我就不談了,作為一個生物學基本研究人員,這是必備的素養(yǎng)。

孟老師推薦的半自助學習生信流程

半自助的意思是,只是分析數(shù)據(jù)--而后畫圖。全自助是還要在算法等等方法做一系列的努力。


image.png

(1)linux學習:羅老師3個文件,1-2天;
(2)統(tǒng)計學學習:《醫(yī)學統(tǒng)計學》漫長3個月,當然他在視頻中還有其他的推薦以及對統(tǒng)計學必備知識框架;
(3)測序基礎:illumia的視頻(我看過不少),但僅僅是視頻是不夠的,這其中還有很多細節(jié)需要去夯實,大約1周時間;
(4)選擇1篇文章,重復結果。

這里提出:上游幾乎一樣,下游則是對BAM文件的處理,并且他在知乎上有很多對于細節(jié)問題的解答,所以我打算過去看一波


image.png
結語:怎么說呢,我看生信入門相關視頻不算多也不算少,在生信的門口徘徊至少也有1年的,當然不可以否認這一年的努力,而正是這一年的努力,讓我能看得下這樣的教學視頻,并且可以得到一定的領悟。相信學習是一個緩慢爬坡的過程,總有迷惑的時候。我們盡量記錄下自己作為小白的心情,希望能為后來的人提供一些幫助,少走一些彎路。
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容