集成多組學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用

集成多組學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用大綱

機(jī)器學(xué)習(xí)及生物組學(xué)基礎(chǔ)(提前贈送視頻)

學(xué)習(xí)目標(biāo):對機(jī)器學(xué)習(xí)基本概念進(jìn)行介紹,讓大家對機(jī)器學(xué)習(xí)基本概念有大致了解。明確機(jī)器學(xué)習(xí)方法的適用性,優(yōu)勢,以及局限性等

1.什么是機(jī)器學(xué)習(xí)

2.機(jī)器學(xué)習(xí)的應(yīng)用實例

3.生物組學(xué)簡介(基因組學(xué),轉(zhuǎn)錄組學(xué),蛋白組學(xué),代謝組學(xué))

4.機(jī)器學(xué)習(xí)在在多組學(xué)數(shù)據(jù)分析的應(yīng)用

python語言基礎(chǔ)(提前贈送視頻)

學(xué)習(xí)目標(biāo):機(jī)器學(xué)習(xí)主流實現(xiàn)是python語言。學(xué)習(xí)機(jī)器學(xué)習(xí)之前,有針對性的對python進(jìn)行系統(tǒng)的學(xué)習(xí),數(shù)據(jù)的基本處理,以方便將來開展機(jī)器學(xué)習(xí)的學(xué)習(xí)

1.python安裝與開發(fā)環(huán)境的搭建

2.基本數(shù)據(jù)類型、組合數(shù)據(jù)類型

3.函數(shù)、列表、元組、字典、集合

4.控制結(jié)構(gòu)、循環(huán)結(jié)構(gòu)

5.Numpy模塊——矩陣的科學(xué)計算

6.Matplotlib模塊——數(shù)據(jù)處理與繪圖

7.Pandas模塊——csv數(shù)據(jù)處理與分析

8.Sklearn模塊——機(jī)器學(xué)習(xí)模型基礎(chǔ)軟件包調(diào)用

案例教學(xué)一:利用Python pandas讀取組學(xué)CSV數(shù)據(jù)并進(jìn)行數(shù)據(jù)初步分析

生物組學(xué)大數(shù)據(jù)預(yù)處理與探索分析

學(xué)習(xí)目標(biāo):在對高維組學(xué)數(shù)據(jù)進(jìn)行統(tǒng)計方法分析及機(jī)器學(xué)習(xí)建模過程前,需要對數(shù)據(jù)進(jìn)行預(yù)處理,如缺失值填補,降維可視化等,大數(shù)據(jù)預(yù)處理與探索分析是檢驗數(shù)據(jù)質(zhì)量與了解數(shù)據(jù)分布的必要過程。

1.高維組學(xué)數(shù)據(jù)的預(yù)處理框架

2.常用數(shù)據(jù)預(yù)處理方法:缺失值填補,標(biāo)準(zhǔn)化,歸一化,對數(shù)轉(zhuǎn)化

3.常用的降維方法,PCA,tSNE等

4.數(shù)據(jù)探索分析(EDA)

案例教學(xué)二:利用Python讀取組學(xué)CSV數(shù)據(jù)并進(jìn)行數(shù)據(jù)探索可視化分析(Exploratory data analysis,EDA)

經(jīng)典機(jī)器學(xué)習(xí)模型及多組學(xué)應(yīng)用

學(xué)習(xí)目標(biāo):對在多組學(xué)整合分析中最常使用的幾種機(jī)器學(xué)習(xí)模型進(jìn)行介紹,總結(jié)它們的優(yōu)缺點及適用范圍,通過動手實踐快速掌握幾種方法

1.線性模型(線性回歸、梯度下降、正則化、回歸的評價指標(biāo))

2.決策樹(決策樹原理、ID3算法、C4.5算法、CART算法)

3.支持向量機(jī)(線性支持向量機(jī)、可分、不可分支持向量機(jī))

4.集成學(xué)習(xí)(AdaBoost和GBDT算法、XGBoost算法、LightGBM算法)

5.模型選擇與性能優(yōu)化(數(shù)據(jù)清洗、特征工程、數(shù)據(jù)建模)

6.Scikit-learn機(jī)器學(xué)習(xí)庫的使用

案例教學(xué)三:基于轉(zhuǎn)錄組學(xué)數(shù)據(jù)進(jìn)行端到端的機(jī)器學(xué)習(xí)項目泛癌預(yù)測(數(shù)據(jù)預(yù)處理,數(shù)據(jù)建模,模型評估)

案例教學(xué)四:基于蛋白組學(xué)-代謝組學(xué)在COVID-19中生物標(biāo)志物發(fā)現(xiàn)研究

深度學(xué)習(xí)在組學(xué)數(shù)據(jù)中的應(yīng)用

學(xué)習(xí)目標(biāo):隨著高通量組學(xué)平臺的發(fā)展,生物醫(yī)學(xué)研究大多采取了多組學(xué)技術(shù)結(jié)合的方法,不同組學(xué)來源(如轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué))的數(shù)據(jù)可以通過基于深度學(xué)習(xí)的預(yù)測算法進(jìn)行整合,以揭示系統(tǒng)生物學(xué)的復(fù)雜工作。在這一部分我們會重點對基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)進(jìn)行系統(tǒng)的講解,學(xué)習(xí)常見的神經(jīng)網(wǎng)絡(luò)架構(gòu)在多組學(xué)分析的應(yīng)用。

1.深度學(xué)習(xí)介紹,常用神經(jīng)網(wǎng)絡(luò)架構(gòu)介紹

2.監(jiān)督學(xué)習(xí)介紹,神經(jīng)網(wǎng)絡(luò)在轉(zhuǎn)錄組學(xué)+代謝組學(xué)的疾病預(yù)測為例

3.無監(jiān)督學(xué)習(xí)介紹,高維組學(xué)數(shù)據(jù)降維,聚類分析,以單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)為例

案例教學(xué)五:基于t-SNE和UMAP進(jìn)行單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)降維,細(xì)胞亞型聚類分析。

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)與實踐

學(xué)習(xí)目標(biāo):從零開始手動實現(xiàn)一個神經(jīng)網(wǎng)絡(luò),在這一過程中對所涉及的原理進(jìn)行系統(tǒng)講解及實踐,讓大家能夠更深刻的理解算法背后的原理以及實現(xiàn)方法,之后有利于對其他機(jī)器學(xué)習(xí)更全面快速掌握

1.深度學(xué)習(xí)與機(jī)器學(xué)習(xí)區(qū)別與聯(lián)系

2.Perceptron, 神經(jīng)元基礎(chǔ)

3.神經(jīng)網(wǎng)絡(luò)的梯度下降法與損失函數(shù)

4.神經(jīng)網(wǎng)絡(luò)中的前向傳播與反向傳播

5.神經(jīng)網(wǎng)絡(luò)的模型評估

6.超參數(shù)優(yōu)化,batch size, learning rate

7.深度學(xué)習(xí)工具——Pytorch的使用

8.深度學(xué)習(xí)工具——Keras的使用

案例教學(xué)六:基于高維轉(zhuǎn)錄組學(xué)及手動構(gòu)建神經(jīng)網(wǎng)絡(luò)進(jìn)行特征篩選及預(yù)測

多組學(xué)聯(lián)合分析,闡明疾病分子機(jī)制

學(xué)習(xí)目標(biāo):從常見的多組學(xué)聯(lián)合分析策略出發(fā),如轉(zhuǎn)錄組+代謝組,蛋白組+代謝組等,對常用的數(shù)理統(tǒng)計分析方法進(jìn)行介紹,之后學(xué)習(xí)如何利用數(shù)據(jù)庫如KEGG等進(jìn)行生物功能富集分析,結(jié)合機(jī)器學(xué)習(xí)方法進(jìn)行生物標(biāo)志物的挖掘,疾病預(yù)測以及生物分子作用機(jī)制等。

1.常用生物組學(xué)實驗與分析方法,如轉(zhuǎn)錄組學(xué),代謝組學(xué)

2.常用組學(xué)數(shù)據(jù)庫介紹,如TCGA,PathBank,HMDB,KEGG

3.Python批量處理組學(xué)數(shù)據(jù)-歸一化處理,差異分析,相關(guān)性分析

4.生物功能分析:GO 功能分析、代謝通路富集、分子互作等

5.基于轉(zhuǎn)錄組學(xué)的差異基因篩選,疾病預(yù)測

6.基于差異基因,聯(lián)合代謝組學(xué)分析疾病分子發(fā)生機(jī)制

7.組學(xué)數(shù)據(jù)可視化,如火山圖,t-SNE降維,代謝通路網(wǎng)絡(luò)分析

8.組學(xué)特征(基因,蛋白,代謝物)選擇(隨機(jī)森林分析)

9.單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)分析及可視化分析

案例教學(xué)七:(包含以下內(nèi)容)

(1)轉(zhuǎn)錄組+代謝組的多組學(xué)分析胃癌,實現(xiàn)從“因”和“果”兩個層面來探究生物學(xué)問題,相互間進(jìn)行驗證

(2)從海量的數(shù)據(jù)中篩選出關(guān)鍵基因、代謝物及代謝通路

(3)深度解析胃癌腫瘤標(biāo)志物解釋腫瘤發(fā)生發(fā)展的復(fù)雜性和整體性案例

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)階

學(xué)習(xí)目標(biāo):學(xué)習(xí)前沿神經(jīng)網(wǎng)絡(luò)如卷積神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò),注意力機(jī)制,自編碼器,圖神經(jīng)網(wǎng)絡(luò)在生物組學(xué)及藥物篩選的應(yīng)用,遷移學(xué)習(xí)應(yīng)用等。

1.卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用(影像組學(xué))

2.循環(huán)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用(蛋白組學(xué))

3.注意力機(jī)制基礎(chǔ)及其應(yīng)用

4.自編碼器基礎(chǔ)及其應(yīng)用(轉(zhuǎn)錄組學(xué))

5.圖神經(jīng)網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用(代謝組學(xué))

6.遷移學(xué)習(xí)

7.深度學(xué)習(xí)框架——transformer的應(yīng)用

案例教學(xué)八:基于自編碼器進(jìn)行藥物/代謝物分子生成

深度學(xué)習(xí)在組學(xué)數(shù)據(jù)藥物發(fā)現(xiàn)的應(yīng)用

學(xué)習(xí)目標(biāo):基于基因表達(dá)特征建立疾病與小分子藥物之間的關(guān)聯(lián)關(guān)系,運用轉(zhuǎn)錄組學(xué),蛋白組學(xué),機(jī)器學(xué)習(xí)算法進(jìn)行藥物重定位。

1.基于生物組學(xué)的藥物發(fā)現(xiàn)基礎(chǔ)介紹

2.藥物分子化學(xué)特征提?。ǚ肿又讣y,描述符,分子圖)

3.圖神經(jīng)網(wǎng)絡(luò)預(yù)測藥物分子性質(zhì)

4.基于胰腺癌差異表達(dá)基因進(jìn)行藥物重定位

案例教學(xué)九:基于機(jī)器學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)進(jìn)行代謝物/藥物分子的性質(zhì)預(yù)測

案例教學(xué)十:以阿爾茨海默病為例,基于轉(zhuǎn)錄組學(xué)差異表達(dá)基因與深度學(xué)習(xí)模型進(jìn)行藥物重定位

AI+Science

學(xué)習(xí)目標(biāo):人工智能領(lǐng)域前沿內(nèi)容,讓大家了解最新的多組學(xué)與機(jī)器學(xué)習(xí)領(lǐng)域的研究動態(tài),同時介紹幾種更為先進(jìn)的機(jī)器學(xué)習(xí)算法。

1.集成學(xué)習(xí)在多組學(xué)數(shù)據(jù)聯(lián)合分析中的應(yīng)用

2.多組學(xué)數(shù)據(jù)庫在生物信息網(wǎng)絡(luò)的挖掘與應(yīng)用

3.生成模型在多組學(xué)數(shù)據(jù)的應(yīng)用與挑戰(zhàn)

4.影像組學(xué)進(jìn)階,弱監(jiān)督學(xué)習(xí)進(jìn)行影像組學(xué)的數(shù)據(jù)自動標(biāo)注與分類

案例教學(xué)十一:基于生成對抗模型進(jìn)行單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)深度特征提取

案例圖示1:基于蛋白組學(xué)-代謝組學(xué)的腫瘤生物標(biāo)志物發(fā)現(xiàn)

案例圖示2:基于GWAS-表型組學(xué)的肺癌風(fēng)險因子研究

案例圖示3:基于圖神經(jīng)網(wǎng)絡(luò)的代謝物分子性質(zhì)預(yù)測與鑒定

案例圖示4:基于自編碼器的單細(xì)胞轉(zhuǎn)錄組-蛋白組學(xué)整合分析

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 頭條 GPT-4既令人興奮又令人恐懼 [https://openai.com/research/gpt-4] 這篇...
    數(shù)科每日閱讀 151評論 0 1
  • 20230317星期五四點三十四張雙利《共產(chǎn)黨宣言》 昨天晚上出去轉(zhuǎn)了一會聽的是《共產(chǎn)黨宣言》,我就是對于共產(chǎn)主義...
    每天堅持閱讀 244評論 0 0
  • 難得糊涂,隨著年齡的增長,生活閱歷真的可以讓你醍醐灌頂。 托管中心有個孩子,小學(xué)三年級女孩,家庭條件優(yōu)越,...
    行走的小螞蟻閱讀 118評論 0 0
  • 昌瑞利 “五個一”打卡 始于2023 01 30日,今日打卡第29天) 愛心]立一個志 修身之志:讀《回家的路》到...
    CRL瑞閱讀 94評論 0 0
  • 跨平臺技術(shù)方案選擇Flutter總結(jié) 1、移動端的跨端技術(shù)選型 移動端的跨端技術(shù)方案,我們關(guān)注的點主要集中在這幾個...
    遙望星空forward閱讀 203評論 0 1

友情鏈接更多精彩內(nèi)容