久久婷婷三级图,亚洲影院91视频

?<h1>人工智能之核心技術(shù) 深度學(xué)習(xí)</h1>第三章卷積神經(jīng)網(wǎng)絡(luò)（CNN）<img class="uploaded-img" src="https://upload-images.jianshu.io/upload_images/30827302-c11ec17f9316d3b6.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" width="auto" height="auto"/>

<h1>前言：卷積神經(jīng)網(wǎng)絡(luò)（CNN）—— 計(jì)算機(jī)視覺(jué)核心</h1>卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network, CNN）是深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域取得革命性成功的基石。它通過(guò)模擬人類(lèi)視覺(jué)系統(tǒng)的局部感知和層次抽象機(jī)制，高效地從圖像中提取特征。

一、CNN 核心組件傳統(tǒng)全連接網(wǎng)絡(luò)處理圖像存在兩大問(wèn)題：<ol><li>1.?參數(shù)爆炸：一張 224×224 的 RGB 圖像有 150,528 個(gè)像素，若第一層有 1000 個(gè)神經(jīng)元，參數(shù)量高達(dá)?1.5 億！</li><li>2.?忽略空間結(jié)構(gòu)：全連接將像素視為無(wú)序向量，丟失了圖像的局部相關(guān)性。</li></ol>CNN 通過(guò)以下三大核心組件解決這些問(wèn)題：1.1 卷積層（Convolutional Layer）核心思想：<ul><li>??局部感受野（Local Receptive Field）：每個(gè)神經(jīng)元只關(guān)注輸入圖像的一小塊區(qū)域（如 3×3）。</li><li>??權(quán)值共享（Weight Sharing）：同一個(gè)卷積核在整個(gè)圖像上滑動(dòng)，使用同一組權(quán)重 → 大幅減少參數(shù)！</li></ul>關(guān)鍵超參數(shù)：輸出尺寸公式：其中??= 卷積核大小，?= padding，?= stride。<pre>輸入圖像?5x53x3?卷積核Stride=1,?Padding=0輸出特征圖?3x3</pre><blockquote>???為什么有效？
卷積操作天然捕捉邊緣、紋理、形狀等局部模式，且具有平移不變性（物體在哪都能識(shí)別）。</blockquote>

1.2 池化層（Pooling Layer）目的：降維 + 增強(qiáng)魯棒性（對(duì)微小位移不敏感）<ul><li>? 典型設(shè)置：2×2 窗口，Stride=2 → 尺寸減半</li><li>??無(wú)參數(shù)、不可學(xué)習(xí)</li></ul><pre>4x4?特征圖MaxPool?2x2,?Stride=22x2?輸出</pre>

1.3 全連接層（Fully Connected Layer）<ul><li>? 位于 CNN 末端，將前面提取的高維特征映射到類(lèi)別概率</li><li>? 輸入需展平（Flatten）為一維向量</li><li>??參數(shù)量大，是過(guò)擬合主要來(lái)源 → 常配合 Dropout 使用</li></ul>

1.4 卷積核設(shè)計(jì)原則

二、經(jīng)典 CNN 模型演進(jìn)2.1 LeNet-5（1998，Yann LeCun）<ul><li>??首個(gè)成功 CNN，用于手寫(xiě)數(shù)字識(shí)別（MNIST）</li><li>? 結(jié)構(gòu)：Conv → Pool → Conv → Pool → FC → FC</li><li>? 使用?tanh?激活，平均池化</li></ul><pre>InputConv1Pool1Conv2Pool2FlattenFC1FC2Output</pre><blockquote>???意義：證明了端到端學(xué)習(xí)圖像特征的可行性。</blockquote>

2.2 AlexNet（2012，ImageNet 冠軍）<ul><li>??引爆深度學(xué)習(xí)熱潮</li><li>? 創(chuàng)新點(diǎn)：</li><ul><li>? 使用?ReLU?激活（解決 Sigmoid 梯度消失）</li><li>??Dropout?防止過(guò)擬合</li><li>??GPU 加速訓(xùn)練</li><li>??重疊池化（3×3 window, stride=2）</li></ul></ul><blockquote>? 參數(shù)量：6000 萬(wàn)，遠(yuǎn)超 LeNet</blockquote>

2.3 VGG（2014）<ul><li>??統(tǒng)一使用 3×3 小卷積核，深度達(dá) 16~19 層</li><li>? 發(fā)現(xiàn)：深度比寬度更重要</li><li>? 結(jié)構(gòu)簡(jiǎn)潔，成為后續(xù)模型 backbone</li></ul><pre>#?VGG?塊示例def?vgg_block(num_convs,?in_channels,?out_channels):????layers?=?[]????for?_?in?range(num_convs):????????layers.append(nn.Conv2d(in_channels,?out_channels,?kernel_size=3,?padding=1))????????layers.append(nn.ReLU())????????in_channels?=?out_channels????layers.append(nn.MaxPool2d(kernel_size=2,?stride=2))????return?nn.Sequential(layers)</pre>
2.4 GoogLeNet / Inception（2014）<ul><li>? 引入?Inception 模塊：并行使用多種卷積核（1×1, 3×3, 5×5）+ 池化</li><li>??1×1 卷積用于降維，控制計(jì)算量</li><li>? 引入?輔助分類(lèi)器（中間層加 loss），緩解梯度消失</li></ul><pre>Input1x1?Conv1x1?Conv?-->?3x3?Conv1x1?Conv?-->?5x5?Conv3x3?MaxPool?-->?1x1?ConvConcatOutput</pre>
2.5 ResNet（2015，里程碑）<ul><li>??殘差連接（Residual Connection）?解決深度網(wǎng)絡(luò)退化問(wèn)題</li><li>? 核心思想：學(xué)習(xí)?殘差函數(shù)?，而非直接擬合?</li><li>? 公式：</li></ul><pre>xF(x):?兩層卷積Addy</pre><blockquote>? 效果：訓(xùn)練 1000+ 層網(wǎng)絡(luò)成為可能！ImageNet 錯(cuò)誤率降至 3.6%</blockquote>
2.6 DenseNet（2017）<ul><li>??密集連接：每一層接收前面所有層的特征作為輸入</li><li>? 公式：</li><li>? 優(yōu)點(diǎn)：特征重用、緩解梯度消失、參數(shù)更少</li></ul>
三、CNN 應(yīng)用場(chǎng)景3.1 圖像分類(lèi)（Image Classification）<ul><li>??任務(wù)：給整張圖打標(biāo)簽（如 “貓”、“狗”）</li><li>??代表模型：ResNet, EfficientNet</li><li>??評(píng)估指標(biāo)：Top-1 / Top-5 Accuracy</li></ul>3.2 目標(biāo)檢測(cè)（Object Detection）入門(mén)目標(biāo)檢測(cè) =?定位（Bounding Box） + 分類(lèi)R-CNN 系列演進(jìn)：<blockquote>???關(guān)鍵組件：<ul><li>??RoI Pooling / RoI Align：將不同尺寸區(qū)域映射為固定大小特征</li><li>??Anchor Boxes：預(yù)設(shè)多尺度框，提升召回率</li></ul></blockquote>
四、配套代碼實(shí)現(xiàn)（PyTorch）示例 1：構(gòu)建簡(jiǎn)易 CNN（類(lèi)似 LeNet）<pre>import?torchimport?torch.nn?as?nnclass?SimpleCNN(nn.Module):????def?init(self,?num_classes=10):????????super().init()????????self.features?=?nn.Sequential(????????????nn.Conv2d(3,?32,?kernel_size=5,?padding=2),??#?32x32x3?→?32x32x32????????????nn.ReLU(),????????????nn.MaxPool2d(2),?????????????????????????????#?→?16x16x32????????????nn.Conv2d(32,?64,?kernel_size=5,?padding=2),?#?→?16x16x64????????????nn.ReLU(),????????????nn.MaxPool2d(2),?????????????????????????????#?→?8x8x64????????)????????self.classifier?=?nn.Sequential(????????????nn.Flatten(),????????????nn.Linear(8??8?*?64,?256),????????????nn.ReLU(),????????????nn.Dropout(0.5),????????????nn.Linear(256,?num_classes)????????)????def?forward(self,?x):????????x?=?self.features(x)????????x?=?self.classifier(x)????????return?x#?測(cè)試model?=?SimpleCNN()x?=?torch.randn(1,?3,?32,?32)print(model(x).shape)??#?torch.Size([1,?10])</pre>示例 2：ResNet 基本殘差塊<pre>class?BasicBlock(nn.Module):????def?init(self,?in_channels,?out_channels,?stride=1,?downsample=None):????????super().init()????????self.conv1?=?nn.Conv2d(in_channels,?out_channels,?kernel_size=3,????????????????????????????????stride=stride,?padding=1,?bias=False)????????self.bn1?=?nn.BatchNorm2d(out_channels)????????self.relu?=?nn.ReLU(inplace=True)????????self.conv2?=?nn.Conv2d(out_channels,?out_channels,?kernel_size=3,????????????????????????????????padding=1,?bias=False)????????self.bn2?=?nn.BatchNorm2d(out_channels)????????self.downsample?=?downsample??#?用于維度匹配????def?forward(self,?x):????????identity?=?x????????out?=?self.relu(self.bn1(self.conv1(x)))????????out?=?self.bn2(self.conv2(out))????????if?self.downsample?is?not?None:????????????identity?=?self.downsample(x)????????out?+=?identity????????return?self.relu(out)</pre>

五、總結(jié)與對(duì)比<blockquote>??現(xiàn)代實(shí)踐建議：<ul><li>? 圖像分類(lèi)：ResNet-50 / EfficientNet-B0</li><li>? 移動(dòng)端：MobileNetV3 / ShuffleNet</li><li>? 目標(biāo)檢測(cè)：YOLOv8 / DETR</li></ul></blockquote><h1>資料關(guān)注</h1>公眾號(hào)：咚咚王
gitee：https://gitee.com/wy18585051844/ai_learning<img class="uploaded-img" src="https://upload-images.jianshu.io/upload_images/30827302-22c6b9c6d0f9789f.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" width="auto" height="auto"/>《Python編程：從入門(mén)到實(shí)踐》
《利用Python進(jìn)行數(shù)據(jù)分析》
《算法導(dǎo)論中文第三版》
《概率論與數(shù)理統(tǒng)計(jì)（第四版） (盛驟) 》
《程序員的數(shù)學(xué)》
《線性代數(shù)應(yīng)該這樣學(xué)第3版》
《微積分和數(shù)學(xué)分析引論》
《（西瓜書(shū)）周志華-機(jī)器學(xué)習(xí)》
《TensorFlow機(jī)器學(xué)習(xí)實(shí)戰(zhàn)指南》
《Sklearn與TensorFlow機(jī)器學(xué)習(xí)實(shí)用指南》
《模式識(shí)別（第四版）》
《深度學(xué)習(xí) deep learning》伊恩·古德費(fèi)洛著花書(shū)
《Python深度學(xué)習(xí)第二版(中文版)【純文本】 (登封大數(shù)據(jù) (Francois Choliet)) (Z-Library)》
《深入淺出神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)+(邁克爾·尼爾森（Michael+Nielsen）》
《自然語(yǔ)言處理綜論第2版》
《Natural-Language-Processing-with-PyTorch》
《計(jì)算機(jī)視覺(jué)-算法與應(yīng)用(中文版)》
《Learning OpenCV 4》
《AIGC：智能創(chuàng)作時(shí)代》杜雨+&+張孜銘
《AIGC原理與實(shí)踐：零基礎(chǔ)學(xué)大語(yǔ)言模型、擴(kuò)散模型和多模態(tài)模型》
《從零構(gòu)建大語(yǔ)言模型（中文版）》
《實(shí)戰(zhàn)AI大模型》
《AI 3.0》?

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

人工智能之核心技術(shù) 深度學(xué)習(xí) 第三章卷積神經(jīng)網(wǎng)絡(luò)（CNN）

人工智能之核心技術(shù) 深度學(xué)習(xí) 第三章卷積神經(jīng)網(wǎng)絡(luò)（CNN）

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

人工智能之核心技術(shù) 深度學(xué)習(xí) 第三章 卷積神經(jīng)網(wǎng)絡(luò)（CNN）

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

人工智能之核心技術(shù) 深度學(xué)習(xí) 第三章卷積神經(jīng)網(wǎng)絡(luò)（CNN）