久日AV成人在线电影,青青草原在线影院亚洲,顾冠忠,杨思雯

這里介紹三種特殊的結(jié)構(gòu)：spatial transformer layer，highway network & grid LSTM，還有recursive network。
本節(jié)介紹：spatial transformer layer.

如下圖所示，輸入5和6，你把他直接放大或者旋轉(zhuǎn)，對(duì)于CNN來(lái)說(shuō)，他認(rèn)為是不一樣的。那怎么辦呢？那中間加一個(gè)Layer，旋轉(zhuǎn)縮放層，即spatial transformer layer，也是一個(gè)NN layer。它不僅可以transform輸入圖像，也可以transform feature map。

那么我們要怎么對(duì)一個(gè)image/feature map做transform呢？我們假設(shè)以下圖左邊這個(gè)image是transform前的結(jié)果 $layer$ $l-1$ ，右邊這個(gè)image是transform后的結(jié)果 $layer$ $l$ ，很明顯，這次轉(zhuǎn)換是把image由上往下做了平移。

一般而言，一個(gè)全連接層的式子我們可以寫成： $a_{nm}^l = \sum\limits_{i = 1}^3 {\sum\limits_{j = 1}^3 {w_{nm,ij}^la_{ij}^{l - 1}} }$ ，第 $l$ 層里面的每一個(gè)神經(jīng)元的輸出是 $a_{nm}^l$ 。如果我們想做到以上的這個(gè)平移的轉(zhuǎn)換，我們只要適當(dāng)?shù)恼{(diào)整權(quán)重 $w_{nm,ij}^l$ 。那么什么樣的weight可以讓我們做到平移這件事呢？即： $a_{nm}^l = a_{(n - 1)m}^{l - 1}$ ，如果 $i=n-1,j=m$ 的話， $w_{nm,ij}^l = 1$ ，否則， $w_{nm,ij}^l = 0$ ,這樣子就可以做到平移。

接下來(lái)，我們來(lái)做放縮：

下圖上面是將圖像放大兩倍的做法；下面是將圖像縮小，移到右上角的做法：

接下來(lái)，我們來(lái)做image的旋轉(zhuǎn)：比如，逆時(shí)針旋轉(zhuǎn)120度：

如果我們想要控制兩張image之間的關(guān)系，我們要怎么做呢？如果只是旋轉(zhuǎn)平移縮放的話，即 $\varphi$ $tranform$ ，我們其實(shí)只需要 $6$ 個(gè)參數(shù)，也就是 $abcdef$ 這6個(gè)參數(shù)，我們就可以把一張image變成另外一張image。即：神經(jīng)網(wǎng)絡(luò)的輸入是一整張image，輸出是一個(gè)六維的vector： $[\begin{array}{*{20}{c}} a&b\\ c&d \end{array}][\begin{array}{*{20}{c}} e\\ f \end{array}]$