深度學習

1. 什么是深度學習?

深度學習是機器學習(Machine Learning)的一個重要分支,其核心是多層神經(jīng)網(wǎng)絡(Deep Neural Networks)。
它擅長從大量數(shù)據(jù)中自動提取特征,尤其在圖像識別、語音識別、自然語言處理、生物醫(yī)學等領域表現(xiàn)出色。

2. 神經(jīng)網(wǎng)絡結(jié)構(gòu)(Neural Network)

神經(jīng)網(wǎng)絡模仿人腦神經(jīng)元連接結(jié)構(gòu),由多個層(Layer)組成,每層包括若干神經(jīng)元(Neuron)。
網(wǎng)絡結(jié)構(gòu)示意(簡化)

輸入層 ? 隱藏層1 ? 隱藏層2 ? 輸出層
         ↑          ↑
      ReLU等激活函數(shù)

3. 基本概念

概念 通俗解釋
神經(jīng)元(Neuron) 接收多個輸入,進行加權求和,通過激活函數(shù)輸出結(jié)果。
權重(Weight) 每個輸入的“重要程度”,訓練過程中模型會自動學習最優(yōu)的權重。
偏置(Bias) 給輸出加上的一個常數(shù),幫助模型更靈活地擬合數(shù)據(jù)。
層(Layer) 神經(jīng)元的集合,每層提取輸入的新特征。
前向傳播(Forward Propagation) 從輸入到輸出的計算過程。
激活函數(shù)(Activation Function) 給神經(jīng)網(wǎng)絡增加非線性表達能力,常見如 ReLU、Sigmoid、Tanh。
輸出層(Output Layer) 模型的最終輸出,用于做分類、回歸等任務。
損失函數(shù)(Loss Function) 衡量模型預測值與真實值的差距,如交叉熵、均方誤差。
反向傳播(Backpropagation) 利用鏈式法則,計算損失對每個參數(shù)的導數(shù),用于調(diào)整參數(shù)。
優(yōu)化器(Optimizer) 控制模型參數(shù)如何更新,使損失函數(shù)盡量減?。ㄈ?SGD, Adam)。
概念 表現(xiàn) 原因
------- ----------- -----------
過擬合 訓練集表現(xiàn)好,測試集差 模型太復雜,數(shù)據(jù)太少
欠擬合 訓練集和測試集都表現(xiàn)差 模型太簡單,沒學到特征

4、模型訓練流程概覽

  1. 輸入數(shù)據(jù)
  2. 前向傳播:計算輸出值
  3. 損失計算:用 loss function 比較輸出和標簽
  4. 反向傳播:計算梯度
  5. 參數(shù)更新:優(yōu)化器根據(jù)梯度更新權重
  6. 重復多輪(Epoch),直到模型收斂
  • 重要概念
名詞 含義
Epoch 完整遍歷一次訓練數(shù)據(jù)集
Batch 每次訓練使用的一小部分樣本
Learning Rate 控制權重更新的“步長”
Loss Curve 查看訓練損失和驗證損失變化曲線
Gradient Vanishing / Explosion 深層網(wǎng)絡中常見問題,需BatchNorm或殘差結(jié)構(gòu)緩解

5. 常見任務類型與輸出形式

任務類型 輸出形式 示例 常用損失函數(shù)
分類(Classification) 概率/類別索引 腫瘤良惡性識別、圖片分類 交叉熵損失(CrossEntropy)
回歸(Regression) 連續(xù)數(shù)值 表達量預測、價格預測 均方誤差(MSE)

深度學習擅長解決的問題類型

  • 圖像識別(如X光片判斷肺炎)
  • 文本分析(如診斷報告文本分類)
  • 序列建模(如基因序列、藥物分子SMILES)
  • 表達預測(如轉(zhuǎn)錄組、蛋白組預測)
  • 表征學習(如scRNA-seq降維、聚類

6. 常見模型結(jié)構(gòu)

模型類型 適用場景 特點
MLP(多層感知機) 表格/基本任務 基礎全連接網(wǎng)絡
CNN(卷積神經(jīng)網(wǎng)絡) 圖像識別、醫(yī)學影像 能提取局部空間特征
RNN / LSTM / GRU 時間序列/NLP 適合處理有順序的數(shù)據(jù)
Transformer NLP、多模態(tài)任務 支持并行處理長序列
AutoEncoder 表達壓縮、降維 編碼+解碼結(jié)構(gòu),用于特征提取
GNN(圖神經(jīng)網(wǎng)絡) 網(wǎng)絡結(jié)構(gòu)、生物通路 處理圖結(jié)構(gòu)數(shù)據(jù),如PPI網(wǎng)絡

7. 常用工具與框架

框架 特點
PyTorch 最適合初學者和研究者,調(diào)試靈活
TensorFlow + Keras 工業(yè)級部署好,自動化程度高
scikit-learn 非深度學習通用ML工具
Jupyter/Colab 免費可視化交互環(huán)境
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容