如何學(xué)習(xí)生信

什么是bioinformatician

如何你想成為一名生信人,那么至少你需要了解什么叫做生物信息學(xué)。否者,朝著錯誤的方向再努力也是白費(fèi)勁。

什么是生物信息學(xué)呢?在陳銘主編的《生物信息學(xué)》(科學(xué)出版社)的序中是這樣寫的:

生物信息學(xué)是20世界80年代末隨著人類基因組計劃的啟動而興起的一門新興交叉學(xué)科,體現(xiàn)了生物學(xué)、計算機(jī)科學(xué)、數(shù)學(xué)、物理學(xué)等等學(xué)科間的滲透與融合。它通過對生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的獲取、加工、儲存、檢索和分析,達(dá)到解釋數(shù)據(jù)所蘊(yùn)含的生物學(xué)意義從而解讀生命活動規(guī)律的目的。

百度詞條是這樣說的:

生物信息學(xué)(Bioinformatics)是研究生物信息的采集、處理、存儲、傳播,分析和解釋等各方面的學(xué)科,也是隨著生命科學(xué)和計算機(jī)科學(xué)的迅猛發(fā)展,生命科學(xué)和計算機(jī)科學(xué)相結(jié)合形成的一門新學(xué)科。它通過綜合利用生物學(xué),計算機(jī)科學(xué)和信息技術(shù)而揭示大量而復(fù)雜的生物數(shù)據(jù)所賦有的生物學(xué)奧秘。

在維基百科中,是這樣解釋的

Bioinformatics is an interdisciplinary field that develops methods and software tools for understanding biological data. As an interdisciplinary field of science, bioinformatics combines computer science, statistics, mathematics, and engineering to analyze and interpret biological data. Bioinformatics has been used for in silico analyses of biological queries using mathematical and statistical techniques.

從這些有兩個關(guān)鍵字:交叉學(xué)科,生物數(shù)據(jù)。

什么不是生物信息學(xué),你可以思考如下問題:

  • 如果一個程序員根據(jù)生物學(xué)家的解釋,寫出了一些代碼用來計算進(jìn)化樹,他是bioinformatician么?
  • 如果一個統(tǒng)計學(xué)家根據(jù)要求,來分析生物學(xué)試驗(yàn)中結(jié)果是否具有顯著性意義,那么他是bioinformatican么?
  • 如果一個研究生物的人,學(xué)了一些編程語言,然后用GWAS尋找QTL位點(diǎn),那么他是bioinformatician么?

以上問題沒有正確的答案,主要是我也想不出。
所以生物信息學(xué)是一個非常模糊的概念,以前看過一個段子,說只要你是一個搞生物的,到中關(guān)村買一臺電腦,你都可以說自己是做生物信息學(xué)了。

回到原來的話題,那什么是bioinformatician呢?就我而言,你可以把bioinformatician看成一個音樂家。當(dāng)音樂家聽到一首曲子的時候,他可以根據(jù)自己的經(jīng)驗(yàn)分析出這首曲子是如何演奏的,有哪些樂器,有沒有其他表達(dá)方式。也就說bioinformatician應(yīng)該了解他的數(shù)據(jù),知道數(shù)據(jù)是如何來的,如何分析他的數(shù)據(jù),懂得挑選方法。

如何成為bioinformatician

經(jīng)過剛才的介紹,你可能對bioinformatician有了新的理解,當(dāng)然光是知道是沒用的,如何練習(xí)才是一個比較重要的問題。
繼續(xù)用音樂家作比喻,成為一名音樂家必然是學(xué)習(xí)大量的樂理知識,至少熟練掌握了一門樂器,然后對其他的也有所涉及。因此成為一名bioinformatician也是如此,你需要對背景知識有一定的了解,然后不斷學(xué)習(xí)一些工具,通過使用這些工具加深你對生物數(shù)據(jù)的理解,提高你的分析能力。

在學(xué)習(xí)之前,我們需要如何學(xué)習(xí)才是比較好的學(xué)習(xí)方式,如下是我認(rèn)為比較好的學(xué)習(xí)方式:

學(xué)習(xí)姿勢

首先我們需要認(rèn)可自己學(xué)生信真的是因?yàn)闊釔?,而不是老板逼你,學(xué)習(xí)的過程中你要覺得自己能夠做好,每一次的錯誤都可以讓你不斷進(jìn)步,另外,你學(xué)習(xí)的知識是有用的,無論是幫助實(shí)驗(yàn)室成員還是解決自己的課題。

然后你需要建立一個學(xué)習(xí)框架,用于總結(jié)存放你學(xué)習(xí)到的內(nèi)容,我的學(xué)習(xí)框架如下:

框架構(gòu)建

你可以用專門的筆記軟件或者直接手寫,每天記錄自己的學(xué)習(xí)信息,然后每隔一段時間進(jìn)行總結(jié),然后把總結(jié)的內(nèi)容增加到自己的學(xué)習(xí)框架中。

在調(diào)整自己的學(xué)習(xí)態(tài)度,使用正確的學(xué)習(xí)方法后,我們就可以開始一步一步的學(xué)習(xí)了。一般而言,我們會很快忘記那些用不到的知識,所以學(xué)習(xí)的最好方式就是實(shí)戰(zhàn)。么從下周一開始,我會整理出我是如何學(xué)習(xí)mapping-by-sequencing(MBS)。
為什么選擇MBS呢?主要是我目前在學(xué),而且mapping大家都比較熟悉,所以比較好介紹把。

個人經(jīng)驗(yàn)(可以跳過)

這個部分主要是講我為什么進(jìn)入生物信息領(lǐng)域,你要是有興趣的話,可以看下。

我目前是研一,大學(xué)的專業(yè)是農(nóng)學(xué),接觸生物信息學(xué)這個概念是在大二下學(xué)期,當(dāng)時問我們學(xué)校比較擅長做生物信息的老師要了PPT學(xué)習(xí),當(dāng)時接觸也就是數(shù)據(jù)庫查找,序列比對,進(jìn)化樹這些內(nèi)容,所以我認(rèn)為生物信息學(xué)就是拿一個軟件跑跑數(shù)據(jù)就好了。后來我考上了研究生,在開學(xué)前到一個老師那里實(shí)習(xí),一個非常nice的師姐聽說我對生信感興趣于是給了我RNA-Seq的數(shù)據(jù)和一篇文獻(xiàn)(關(guān)于tophat的操作流程),然后我就回家開始學(xué)習(xí),其實(shí)也是迷迷糊糊。開學(xué)的時候,我找了一本書叫做RNA-seq data analysis,比較系統(tǒng)介紹了RNA-Seq分析的具體流程,我如獲至寶,不知疲倦的把書看了大半,但是數(shù)據(jù)還是沒有分析出來。后來由于輪轉(zhuǎn)制度,我去了另一個老師那里,那個老師聽說我做過一點(diǎn)RNA-Seq,于是就放我繼續(xù)折騰,這個時候我在美亞買了一本對我感觸最大的書bioinformatics data skills,這本書讓我真正的了解什么才算bioinformatician。
不過后來,又一次機(jī)緣巧合我知道了biostarhandbook,于是我看到了如下這張圖

Biostar

我對概念又一次重構(gòu)。
現(xiàn)在的我認(rèn)為學(xué)習(xí)一開始最重要,一個老司機(jī)帶路,會讓你對整個領(lǐng)域的理解都不一樣,可以避免走很多不必要的彎路。但是入門之后就靠自己了,別人幫不了你。

推薦閱讀:

一篇我總結(jié)的學(xué)習(xí)的正確姿勢:http://www.itdecent.cn/p/90168fa89c9a
MBS綜述:http://www.nature.com/nrg/journal/v15/n10/full/nrg3745.html

友情鏈接

http://blog.genesino.com/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容