久操久热这里只有精品,欧美久久-区二区

本章涉及到的知識點(diǎn)清單：

1、數(shù)學(xué)期望的定義

2、KL散度的定義

3、零和博弈

4、GAN的工作原理

5、GAN的目標(biāo)函數(shù)

6、求解D的最優(yōu)解

7、反求解G使得G和D的概率分布差異最小

8、案例之GAN實(shí)現(xiàn)擬合二次函數(shù)

在推導(dǎo)GAN公式之前，需要預(yù)備一些數(shù)學(xué)期望和KL散度的知識點(diǎn)

一、數(shù)學(xué)期望的定義

期望：在概率論中，將實(shí)驗(yàn)中每次可能產(chǎn)生的結(jié)果的概率乘以其結(jié)果的總和，反映隨機(jī)變量平均取值的大小。根據(jù)其隨機(jī)變量的取值范圍不同，分為離散型和連續(xù)型

對于連續(xù)型隨機(jī)變量x，其概率密度函數(shù)為f(x)，則X的數(shù)學(xué)期望E(x)可以表示成微積分的形式

連續(xù)型期望

二、KL散度的定義

KL散度：在信息論中，用生成的概率分布Q來擬合逼近真實(shí)的概率分布P時(shí)，所產(chǎn)生的信息損耗，即描述兩個概率分布的差異，其本身是非對稱的

設(shè)x是連續(xù)型隨機(jī)變量，其真實(shí)概率分布為P(x)，擬合分布概率為Q(x)，則P對Q的KL散度為

P對Q的KL散度

三、零和博弈

GAN被稱為對抗式神經(jīng)網(wǎng)絡(luò)，啟發(fā)自博弈論中的二人零和博弈

零和博弈：指參與博弈的雙方，在嚴(yán)格的競爭下，一方的收益必然意味著另一方的損失，博弈過程中，雙方的各自收益和損失的相加總和永遠(yuǎn)為零，雙方完全不存在合作的可能。就好比下棋一樣，你和對手的每一步棋都是向著自己最有利的方向走，最終只有一方贏一方輸，而下棋的總成績永遠(yuǎn)為零

顯然，GAN也是由博弈雙方組成，分別為生成網(wǎng)絡(luò)G（Generator）和判別網(wǎng)絡(luò)D（Discriminator）

四、GAN的工作原理

GAN的工作過程

上圖中，x是真實(shí)數(shù)據(jù)，Pdata(x)是x的概率分布，z是噪點(diǎn)數(shù)據(jù)，P(z)是z的概率分布，其工作過程為：

(1)：從噪聲z進(jìn)行隨機(jī)抽樣，傳入G網(wǎng)絡(luò)，生成新數(shù)據(jù)G(z)和其概率分布Pg(G(z))

(2)：將真實(shí)數(shù)據(jù)和G生成的新數(shù)據(jù)一起傳入D網(wǎng)絡(luò)進(jìn)行真假判別，通過sigmoid函數(shù)來輸出判定類別

(3)：迭代優(yōu)化D和G損失函數(shù)，根據(jù)D來調(diào)整G

(4)：直到D和G達(dá)到收斂，即D無法判斷G產(chǎn)生數(shù)據(jù)的真假性，即Pg(G(z))已經(jīng)非常逼近Pdata(x)

至此，我們可以抽象看出GAN的目的，將隨機(jī)噪聲z通過G網(wǎng)絡(luò)得到一個和真實(shí)數(shù)據(jù)分布Pdata(x)差不多的生成分布Pg(G(z))，這個過程就是G和D相互博弈的過程

五、GAN的目標(biāo)函數(shù)

定義GAN的目標(biāo)函數(shù)為V(G，D)，在博弈過程中，G希望減少V的值讓自己生成的分布無法識別，而D希望增大V的值讓自己可以高效的判別出數(shù)據(jù)的真假類別，則V(G，D)的表達(dá)式為

目標(biāo)函數(shù)

其中E表示真實(shí)數(shù)據(jù)x和噪點(diǎn)數(shù)據(jù)z的數(shù)學(xué)期望

G網(wǎng)絡(luò)是一個生成器，可以是全連接神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等等，通過噪點(diǎn)分布P(z)，一般是高斯分布，得到一個生成數(shù)據(jù)的分布Pg(x)，我們希望Pg(x)非?？拷黀data(x)，來擬合逼近真實(shí)分布

D網(wǎng)絡(luò)是一個判別函數(shù)，需要解決傳統(tǒng)的二分類問題，其職責(zé)就是有效的區(qū)分真實(shí)分布和生成分布，即衡量Pg(x)和Pdata(x)之間的差距，并通過反復(fù)的迭代訓(xùn)練

六、求解D的最優(yōu)解

從目標(biāo)函數(shù)出發(fā)，由于V是連續(xù)的，我們將V寫成微積分的形式來表示期望