1. 什么是深度學習?
深度學習是機器學習(Machine Learning)的一個重要分支,其核心是多層神經(jīng)網(wǎng)絡(Deep Neural Networks)。
它擅長從大量數(shù)據(jù)中自動提取特征,尤其在圖像識別、語音識別、自然語言處理、生物醫(yī)學等領域表現(xiàn)出色。
2. 神經(jīng)網(wǎng)絡結(jié)構(gòu)(Neural Network)
神經(jīng)網(wǎng)絡模仿人腦神經(jīng)元連接結(jié)構(gòu),由多個層(Layer)組成,每層包括若干神經(jīng)元(Neuron)。
網(wǎng)絡結(jié)構(gòu)示意(簡化)
輸入層 ? 隱藏層1 ? 隱藏層2 ? 輸出層
↑ ↑
ReLU等激活函數(shù)
3. 基本概念
| 概念 |
通俗解釋 |
| 神經(jīng)元(Neuron) |
接收多個輸入,進行加權求和,通過激活函數(shù)輸出結(jié)果。 |
| 權重(Weight) |
每個輸入的“重要程度”,訓練過程中模型會自動學習最優(yōu)的權重。 |
| 偏置(Bias) |
給輸出加上的一個常數(shù),幫助模型更靈活地擬合數(shù)據(jù)。 |
| 層(Layer) |
神經(jīng)元的集合,每層提取輸入的新特征。 |
| 前向傳播(Forward Propagation) |
從輸入到輸出的計算過程。 |
| 激活函數(shù)(Activation Function) |
給神經(jīng)網(wǎng)絡增加非線性表達能力,常見如 ReLU、Sigmoid、Tanh。 |
| 輸出層(Output Layer) |
模型的最終輸出,用于做分類、回歸等任務。 |
| 損失函數(shù)(Loss Function) |
衡量模型預測值與真實值的差距,如交叉熵、均方誤差。 |
| 反向傳播(Backpropagation) |
利用鏈式法則,計算損失對每個參數(shù)的導數(shù),用于調(diào)整參數(shù)。 |
| 優(yōu)化器(Optimizer) |
控制模型參數(shù)如何更新,使損失函數(shù)盡量減?。ㄈ?SGD, Adam)。 |
| 概念 |
表現(xiàn) |
原因 |
| ------- |
----------- |
----------- |
| 過擬合 |
訓練集表現(xiàn)好,測試集差 |
模型太復雜,數(shù)據(jù)太少 |
| 欠擬合 |
訓練集和測試集都表現(xiàn)差 |
模型太簡單,沒學到特征 |
4、模型訓練流程概覽
- 輸入數(shù)據(jù)
- 前向傳播:計算輸出值
- 損失計算:用 loss function 比較輸出和標簽
- 反向傳播:計算梯度
- 參數(shù)更新:優(yōu)化器根據(jù)梯度更新權重
- 重復多輪(Epoch),直到模型收斂
| 名詞 |
含義 |
| Epoch |
完整遍歷一次訓練數(shù)據(jù)集 |
| Batch |
每次訓練使用的一小部分樣本 |
| Learning Rate |
控制權重更新的“步長” |
| Loss Curve |
查看訓練損失和驗證損失變化曲線 |
| Gradient Vanishing / Explosion |
深層網(wǎng)絡中常見問題,需BatchNorm或殘差結(jié)構(gòu)緩解 |
5. 常見任務類型與輸出形式
| 任務類型 |
輸出形式 |
示例 |
常用損失函數(shù) |
| 分類(Classification) |
概率/類別索引 |
腫瘤良惡性識別、圖片分類 |
交叉熵損失(CrossEntropy) |
| 回歸(Regression) |
連續(xù)數(shù)值 |
表達量預測、價格預測 |
均方誤差(MSE) |
深度學習擅長解決的問題類型
- 圖像識別(如X光片判斷肺炎)
- 文本分析(如診斷報告文本分類)
- 序列建模(如基因序列、藥物分子SMILES)
- 表達預測(如轉(zhuǎn)錄組、蛋白組預測)
- 表征學習(如scRNA-seq降維、聚類
6. 常見模型結(jié)構(gòu)
| 模型類型 |
適用場景 |
特點 |
| MLP(多層感知機) |
表格/基本任務 |
基礎全連接網(wǎng)絡 |
| CNN(卷積神經(jīng)網(wǎng)絡) |
圖像識別、醫(yī)學影像 |
能提取局部空間特征 |
| RNN / LSTM / GRU |
時間序列/NLP |
適合處理有順序的數(shù)據(jù) |
| Transformer |
NLP、多模態(tài)任務 |
支持并行處理長序列 |
| AutoEncoder |
表達壓縮、降維 |
編碼+解碼結(jié)構(gòu),用于特征提取 |
| GNN(圖神經(jīng)網(wǎng)絡) |
網(wǎng)絡結(jié)構(gòu)、生物通路 |
處理圖結(jié)構(gòu)數(shù)據(jù),如PPI網(wǎng)絡 |
7. 常用工具與框架
| 框架 |
特點 |
| PyTorch |
最適合初學者和研究者,調(diào)試靈活 |
| TensorFlow + Keras |
工業(yè)級部署好,自動化程度高 |
| scikit-learn |
非深度學習通用ML工具 |
| Jupyter/Colab |
免費可視化交互環(huán)境 |