經(jīng)過(guò)前面幾節(jié)的學(xué)習(xí),終于完成了我們的基礎(chǔ)部分,下面正式進(jìn)入到了深度學(xué)習(xí)部分。
第一個(gè)要講的當(dāng)然是cnn了,也就是卷積神經(jīng)網(wǎng)絡(luò),這一部分的內(nèi)容在之前的文章小白學(xué)cnn以及keras速成里面已經(jīng)很詳細(xì)的講解過(guò)了,所以這里也就不再細(xì)講了,直接進(jìn)入代碼部分。
Code
數(shù)據(jù)集仍然是使用MNIST手寫字體,和之前一樣做同樣的預(yù)處理。
model
# 定義 Convolution Network 模型
class Cnn(nn.Module):
def __init__(self, in_dim, n_class):
super(Cnn, self).__init__()
self.conv = nn.Sequential(
nn.Conv2d(in_dim, 6, 3, stride=1, padding=1),
nn.ReLU(True),
nn.MaxPool2d(2, 2),
nn.Conv2d(6, 16, 5, stride=1, padding=0),
nn.ReLU(True),
nn.MaxPool2d(2, 2),
)
self.fc = nn.Sequential(
nn.Linear(400, 120),
nn.Linear(120, 84),
nn.Linear(84, n_class)
)
def forward(self, x):
out = self.conv(x)
out = out.view(out.size(0), -1)
out = self.fc(out)
return out
model = Cnn(1, 10) # 圖片大小是28x28
use_gpu = torch.cuda.is_available() # 判斷是否有GPU加速
if use_gpu:
model = model.cuda()
# 定義loss和optimizer
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=learning_rate)
以上就是網(wǎng)絡(luò)的模型的部分了。和之前比主要增加了這些不一樣的部分
1
nn.Sequential()
這個(gè)表示將一個(gè)有序的模塊寫在一起,也就相當(dāng)于將神經(jīng)網(wǎng)絡(luò)的層按順序放在一起,這樣可以方便結(jié)構(gòu)顯示2
nn.Conv2d()
這個(gè)是卷積層,里面常用的參數(shù)有四個(gè),in_channels, out_channels, kernel_size, stride, padding
in_channels表示的是輸入卷積層的圖片厚度
out_channels表示的是要輸出的厚度
kernel_size表示的是卷積核的大小,可以用一個(gè)數(shù)字表示長(zhǎng)寬相等的卷積核,比如kernel_size=3,也可以用不同的數(shù)字表示長(zhǎng)寬不同的卷積核,比如kernel_size=(3, 2)
stride表示卷積核滑動(dòng)的步長(zhǎng)
padding表示的是在圖片周圍填充0的多少,padding=0表示不填充,padding=1四周都填充1維
3
nn.ReLU()
這個(gè)表示使用ReLU激活函數(shù),里面有一個(gè)參數(shù)inplace,默認(rèn)設(shè)置為False,表示新創(chuàng)建一個(gè)對(duì)象對(duì)其修改,也可以設(shè)置為True,表示直接對(duì)這個(gè)對(duì)象進(jìn)行修改4
nn.MaxPool2d()
這個(gè)是最大池化層,當(dāng)然也有平均池化層,里面的參數(shù)有kernel_size, stride, padding
kernel_size表示池化的窗口大小,和卷積層里面的kernel_size是一樣的
stride也和卷積層里面一樣,需要自己設(shè)置滑動(dòng)步長(zhǎng)
padding也和卷積層里面的參數(shù)是一樣的,默認(rèn)是0
模型需要傳入的參數(shù)是輸入的圖片維數(shù)以及輸出的種類數(shù)
train
訓(xùn)練的過(guò)程是一樣的,只是輸入圖片不再需要展開
這是訓(xùn)練20個(gè)epoch的結(jié)果,當(dāng)然你也可以增加訓(xùn)練次數(shù),修改里面的參數(shù)達(dá)到更好的效果,可以參考一下Lenet的網(wǎng)絡(luò)結(jié)構(gòu),自己重新寫一寫

大體上簡(jiǎn)單的卷積網(wǎng)絡(luò)就是這么構(gòu)建的,當(dāng)然現(xiàn)在也有很多復(fù)雜的網(wǎng)絡(luò),比如vgg,inceptionv1-v4,resnet以及修正的inception-resnet,這些網(wǎng)絡(luò)都是深層的卷積網(wǎng)絡(luò),有興趣的同學(xué)可以去看看pytorch的官方代碼實(shí)現(xiàn),或者去github上搜索相應(yīng)的網(wǎng)絡(luò)。
下一節(jié)我們將要開始一種特別適合序列數(shù)據(jù)的新的網(wǎng)絡(luò)結(jié)構(gòu),循環(huán)神經(jīng)網(wǎng)絡(luò)。
本文代碼已經(jīng)上傳到了github上
歡迎查看我的知乎專欄,深度煉丹
歡迎訪問(wèn)我的博客