作業(yè)1 淺談生物信息學(xué)認(rèn)知

剛開始入門生物信息學(xué)時,覺得自己無所不知;現(xiàn)在,越學(xué)越覺得自己什么都不知道。生物信息學(xué)涉獵繁多,我主要的工作是對微生物擴(kuò)增子測序數(shù)據(jù)進(jìn)行分析。

不論研究什么具體方向,生物信息分析入門,必要的是學(xué)會:

1. Linux系統(tǒng)基本操作

2. 熟練運用一種編程語言,對數(shù)據(jù)文件進(jìn)行編輯統(tǒng)計

3. 常用工具的使用

所以,不經(jīng)歷完以上我認(rèn)為都不能算入門,只能算入門中或聽說過生信。Biostar handbook這本書學(xué)完,可以算半入門。其實入不入門不影響研究生畢業(yè),完全可以和懂的人合作,生物醫(yī)學(xué)領(lǐng)域一年這么多畢業(yè)生,組學(xué)數(shù)據(jù)純自己分析的沒有幾個。入門之后的標(biāo)準(zhǔn)就是自學(xué)任何一個新工具一天無壓力,可用適合的統(tǒng)計方法闡釋數(shù)據(jù)。

入門后的階段,可以稱之為“流程”階段。入門時,學(xué)習(xí)單位是單個的工具,而進(jìn)入流程階段,就是要把單個工具通過簡單的語言串聯(lián),對數(shù)據(jù)實現(xiàn)自動化分析及報告。這個階段的主要學(xué)習(xí)資料就是文獻(xiàn)。學(xué)習(xí)新文獻(xiàn),完善自己的流程。入門階段可能還要靠公司幫你分析部分?jǐn)?shù)據(jù),流程階段的指標(biāo)就是比公司的標(biāo)準(zhǔn)流程更好。因為公司的標(biāo)準(zhǔn)流程一旦修改就牽扯整個業(yè)務(wù)線,公司選用的標(biāo)準(zhǔn)方案一般都是最穩(wěn)妥的,期間會有部分工具稍微落后或者剛被某些新文獻(xiàn)推翻。

一個段子:IT界調(diào)侃一個程序員的最佳方式——“哇,又在寫B(tài)ug呢!”;而生信領(lǐng)域(BT界)的是——“哇,又在寫流程呢!”。流程完善來完善去終歸是拼湊,說白了就是熟練工。如何突破流程階段,進(jìn)入下一階段——算法階段。生物醫(yī)學(xué)背景出身能跨越這一階段的,全球少有。算法階段需要什么:

1. 最優(yōu)化的代碼

2. 透徹的舊算法理解

3. 熟練的新算法應(yīng)用

這個階段我也不知道,說多了也純粹是YY。就對我而言,要進(jìn)入這個階段,還差精通C/C++語言性能優(yōu)化、計算機(jī)科學(xué)里的經(jīng)典算法、云計算、生物信息學(xué)里的經(jīng)典算法、人工智能的機(jī)器學(xué)習(xí)算法。

最后結(jié)合Biostar handbook里的一句話談一談最核心的一點。

“Bioinformatics is a data science that investigates how information is stored within and processed by living organisms.”

編程語言也好,算法也好,其始其終都是為了解決生物學(xué)問題。如果純粹為了炫技,就是本末倒置。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容