熟女久久在线,www久久精品伊人

?<h1>人工智能之核心技術(shù) 深度學(xué)習(xí)</h1>第二章神經(jīng)網(wǎng)絡(luò)訓(xùn)練與優(yōu)化<img class="uploaded-img" src="https://upload-images.jianshu.io/upload_images/30827302-18b4b7fc1fba2b32.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" width="auto" height="auto"/>

<h1>整體訓(xùn)練過程概覽</h1>神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是一個迭代優(yōu)化過程，其核心是通過反向傳播計算梯度，并利用優(yōu)化算法更新參數(shù)，以最小化損失函數(shù)。同時，為防止過擬合和數(shù)值不穩(wěn)定，需引入正則化與穩(wěn)定技術(shù)。完整的訓(xùn)練流程如下：<img class="uploaded-img" src="https://upload-images.jianshu.io/upload_images/30827302-0cace929f230e2df.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" width="auto" height="auto"/>訓(xùn)練循環(huán)偽代碼<pre>for?epoch?in?range(max_epochs):????for?batch?in?dataloader:????????#?1.?前向傳播????????pred?=?model(batch.x)????????#?2.?計算損失????????loss?=?loss_fn(pred,?batch.y)????????#?3.?清零梯度????????optimizer.zero_grad()????????#?4.?反向傳播????????loss.backward()????????#?5.?梯度裁剪（可選）????????clip_gradients(model)????????#?6.?參數(shù)更新????????optimizer.step()????#?7.?調(diào)整學(xué)習(xí)率????scheduler.step()????#?8.?驗證?&?早停????val_loss?=?evaluate(model,?val_loader)????if?early_stop(val_loss):?break</pre><blockquote>??關(guān)鍵思想：<ul><li>??前向傳播決定“當(dāng)前做得多差”</li><li>??反向傳播 + 優(yōu)化器決定“如何改進”</li><li>??正則化 + 調(diào)度 + 早停確?！皩W(xué)得穩(wěn)、泛化好”</li></ul></blockquote>

模型初始化（Initialization）為什么重要？
糟糕的初始化會導(dǎo)致梯度消失/爆炸，使訓(xùn)練無法開始。常用方法：<blockquote>???實踐建議：現(xiàn)代框架（PyTorch/TensorFlow）默認初始化已較合理，但自定義層時務(wù)必注意。</blockquote>

一、前向傳播（Forward Pass）<ul><li>? 輸入數(shù)據(jù)通過網(wǎng)絡(luò)逐層計算：<img class="uploaded-img" src="https://upload-images.jianshu.io/upload_images/30827302-2b5b6f3201b4fb85.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" width="auto" height="auto"/></li><li>? 最終輸出用于計算損失。</li><li>??無參數(shù)更新，僅用于評估當(dāng)前模型性能。</li></ul>

二、損失函數(shù)（Loss Function）損失函數(shù)衡量模型預(yù)測值與真實值之間的差距，是訓(xùn)練的“指南針”。2.1 分類任務(wù)（1）交叉熵損失（Cross-Entropy Loss）<ul><li>??適用：多分類（Softmax + CrossEntropy）或二分類（Sigmoid + BCE）</li><li>??公式（二分類）：<img class="uploaded-img" src="https://upload-images.jianshu.io/upload_images/30827302-2d99773e733a5589.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" width="auto" height="auto"/></li><li>??優(yōu)點：梯度平滑、對錯誤預(yù)測懲罰大</li><li>??PyTorch 實現(xiàn)：nn.BCELoss()（需先 Sigmoid）、nn.CrossEntropyLoss()（內(nèi)部含 Softmax）</li></ul>（2）Focal Loss（解決類別不平衡）<ul><li>??動機：當(dāng)正負樣本極度不均衡時（如目標檢測中背景 vs 目標），標準交叉熵會讓模型“偷懶”只學(xué)多數(shù)類。</li><li>??公式：<img class="uploaded-img" src="https://upload-images.jianshu.io/upload_images/30827302-4e8906ce4795981c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" width="auto" height="auto"/></li><ul><li>??：正確類別的預(yù)測概率</li><li>??：聚焦參數(shù)（越大，越忽略易分樣本）</li><li>??：類別權(quán)重</li></ul><li>??效果：讓模型更關(guān)注“難分樣本”</li></ul><blockquote>??選擇原則：<ul><li>? 均衡數(shù)據(jù) → 交叉熵</li><li>? 極度不平衡（如醫(yī)學(xué)圖像、目標檢測）→ Focal Loss</li></ul></blockquote>

2.2 回歸任務(wù)<pre>分類是否回歸少多任務(wù)類型類別是否平衡?交叉熵Focal?Loss數(shù)據(jù)是否有異常值?MSEMAE?或?Huber</pre>

三、優(yōu)化算法目標：通過調(diào)整參數(shù)??最小化損失?3.1 梯度下降家族3.2 自適應(yīng)優(yōu)化器（自動調(diào)學(xué)習(xí)率）<blockquote>???實踐建議：<ul><li>? 默認用?AdamW（比 Adam 更穩(wěn)定）</li><li>? 學(xué)習(xí)率初始值：AdamW 常用?1e-3?~?5e-4</li></ul></blockquote>3.3 學(xué)習(xí)率調(diào)度（Learning Rate Scheduling）固定學(xué)習(xí)率易陷入局部最優(yōu)或震蕩。動態(tài)調(diào)整更高效：<pre>#?PyTorch?示例：余弦退火scheduler?=?torch.optim.lr_scheduler.CosineAnnealingLR(optimizer,?T_max=100)</pre>

四、反向傳播算法（Backpropagation）4.1 核心原理：鏈式法則神經(jīng)網(wǎng)絡(luò)是一個復(fù)合函數(shù)：求梯度??需層層回傳：<blockquote>???關(guān)鍵：從輸出向輸入逐層計算梯度，避免重復(fù)計算。</blockquote>4.2 梯度問題與解決方案權(quán)重初始化方法<ul><li>??Xavier 初始化：適用于 Sigmoid/Tanh
</li><li>??He 初始化：適用于 ReLU
</li></ul>

五、正則化技術(shù)（防止過擬合）5.1 參數(shù)正則化<blockquote>?? 注意：PyTorch 中?weight_decay?參數(shù)實現(xiàn)的是?L2 正則化</blockquote>5.2 隨機丟棄技術(shù)<pre>#?Dropout?示例nn.Sequential(????nn.Linear(128,?64),????nn.ReLU(),????nn.Dropout(0.5),???#?50%?神經(jīng)元隨機失活????nn.Linear(64,?10))</pre>5.3 Batch Normalization（BN）原理：對每個 mini-batch 的激活值做標準化：<ul><li>??：batch 均值與方差</li><li>??：可學(xué)習(xí)的縮放與偏移參數(shù)</li></ul>作用：<ul><li>? 緩解內(nèi)部協(xié)變量偏移（Internal Covariate Shift）</li><li>? 允許更高學(xué)習(xí)率</li><li>? 有一定正則化效果（可減少 Dropout 使用）</li></ul><blockquote>???LayerNorm：對單個樣本的所有特征做歸一化，適用于 RNN/Transformer</blockquote>5.4 早停（Early Stopping）<ul><li>? 監(jiān)控驗證集損失</li><li>? 當(dāng)驗證損失連續(xù) N 輪不再下降，提前終止訓(xùn)練</li><li>? 防止過擬合 + 節(jié)省計算資源</li></ul>

六、配套代碼實現(xiàn)（完整訓(xùn)練流程）<pre>import?torchimport?torch.nn?as?nnimport?torch.optim?as?optimfrom?torch.optim.lr_scheduler?import?CosineAnnealingLR#?1.?模型定義（帶?Dropout?和?BN）class?Net(nn.Module):????def?init(self,?input_dim,?num_classes):????????super().init()????????self.fc1?=?nn.Linear(input_dim,?128)????????self.bn1?=?nn.BatchNorm1d(128)????????self.fc2?=?nn.Linear(128,?64)????????self.dropout?=?nn.Dropout(0.5)????????self.fc3?=?nn.Linear(64,?num_classes)????def?forward(self,?x):????????x?=?torch.relu(self.bn1(self.fc1(x)))????????x?=?self.dropout(torch.relu(self.fc2(x)))????????x?=?self.fc3(x)????????return?x#?2.?數(shù)據(jù)（模擬）X?=?torch.randn(1000,?10)y?=?torch.randint(0,?2,?(1000,))#?3.?設(shè)置model?=?Net(input_dim=10,?num_classes=2)criterion?=?nn.CrossEntropyLoss()optimizer?=?optim.AdamW(model.parameters(),?lr=1e-3,?weight_decay=1e-4)scheduler?=?CosineAnnealingLR(optimizer,?T_max=50)#?4.?訓(xùn)練循環(huán)（含早停）best_val_loss?=?float('inf')patience?=?10trigger_times?=?0for?epoch?in?range(100):????model.train()????optimizer.zero_grad()????pred?=?model(X)????loss?=?criterion(pred,?y)????loss.backward()????????#?梯度裁剪（防爆炸）????torch.nn.utils.clip_grad_norm_(model.parameters(),?max_norm=1.0)????????optimizer.step()????scheduler.step()????#?模擬驗證（此處用訓(xùn)練損失代替）????val_loss?=?loss.item()????if?val_loss?<?best_val_loss:????????best_val_loss?=?val_loss????????trigger_times?=?0????else:????????trigger_times?+=?1????????if?trigger_times?>=?patience:????????????print(f"Early?stopping?at?epoch?{epoch}")????????????breakprint("Training?finished.")</pre>

七、總結(jié)圖譜<pre>訓(xùn)練目標損失函數(shù)優(yōu)化算法反向傳播正則化分類:?CrossEntropy?/?Focal回歸:?MSE?/?MAE?/?HuberSGD?家族自適應(yīng):?AdamW學(xué)習(xí)率調(diào)度鏈式法則梯度穩(wěn)定:?初始化?+?BNL1/L2DropoutEarly?StoppingBatchNorm</pre><blockquote>??黃金組合推薦：<ul><li>? 優(yōu)化器：AdamW</li><li>? 學(xué)習(xí)率：余弦退火 + warmup</li><li>? 正則化：Dropout + Weight Decay + Early Stopping</li><li>? 歸一化：BatchNorm（CNN） / LayerNorm（Transformer）</li></ul></blockquote>

<h1>資料關(guān)注</h1>公眾號：咚咚王
gitee：https://gitee.com/wy18585051844/ai_learning<img class="uploaded-img" src="https://upload-images.jianshu.io/upload_images/30827302-11dcc9dc028e97c0.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" width="auto" height="auto"/>《Python編程：從入門到實踐》
《利用Python進行數(shù)據(jù)分析》
《算法導(dǎo)論中文第三版》
《概率論與數(shù)理統(tǒng)計（第四版） (盛驟) 》
《程序員的數(shù)學(xué)》
《線性代數(shù)應(yīng)該這樣學(xué)第3版》
《微積分和數(shù)學(xué)分析引論》
《（西瓜書）周志華-機器學(xué)習(xí)》
《TensorFlow機器學(xué)習(xí)實戰(zhàn)指南》
《Sklearn與TensorFlow機器學(xué)習(xí)實用指南》
《模式識別（第四版）》
《深度學(xué)習(xí) deep learning》伊恩·古德費洛著花書
《Python深度學(xué)習(xí)第二版(中文版)【純文本】 (登封大數(shù)據(jù) (Francois Choliet)) (Z-Library)》
《深入淺出神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)+(邁克爾·尼爾森（Michael+Nielsen）》
《自然語言處理綜論第2版》
《Natural-Language-Processing-with-PyTorch》
《計算機視覺-算法與應(yīng)用(中文版)》
《Learning OpenCV 4》
《AIGC：智能創(chuàng)作時代》杜雨+&+張孜銘
《AIGC原理與實踐：零基礎(chǔ)學(xué)大語言模型、擴散模型和多模態(tài)模型》
《從零構(gòu)建大語言模型（中文版）》
《實戰(zhàn)AI大模型》
《AI 3.0》?

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

人工智能之核心技術(shù) 深度學(xué)習(xí) 第二章神經(jīng)網(wǎng)絡(luò)訓(xùn)練與優(yōu)化

人工智能之核心技術(shù) 深度學(xué)習(xí) 第二章神經(jīng)網(wǎng)絡(luò)訓(xùn)練與優(yōu)化

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

人工智能之核心技術(shù) 深度學(xué)習(xí) 第二章 神經(jīng)網(wǎng)絡(luò)訓(xùn)練與優(yōu)化

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

人工智能之核心技術(shù) 深度學(xué)習(xí) 第二章神經(jīng)網(wǎng)絡(luò)訓(xùn)練與優(yōu)化