背景:只專(zhuān)注于單個(gè)模型可能會(huì)忽略一些相關(guān)任務(wù)中可能提升目標(biāo)任務(wù)的潛在信息,通過(guò)進(jìn)行一定程度的共享不同任務(wù)之間的參數(shù),可能會(huì)使原任務(wù)泛化更好。廣義...
強(qiáng)化學(xué)習(xí) 元素:actor(我們可以控制,決策我們的行為),Env,Reward(我們不能控制環(huán)境)主要方法:model-baed(對(duì)Env建模...
Unspervised learning主要任務(wù)目標(biāo)是發(fā)掘數(shù)據(jù)潛在有價(jià)值的結(jié)構(gòu),主要分為clustering,dimentionality re...
神經(jīng)網(wǎng)絡(luò)構(gòu)建好,訓(xùn)練不出好的效果怎么辦?明明說(shuō)好的擬合任意函數(shù)(一般連續(xù))(為什么?可以參考Neural Network and Deep Le...
David Silver說(shuō),AI = RL + DL = Deep Reinforcement Learning他的課程:RL Cource b...
這次給大家介紹一下GAN的generalized framework。其實(shí)很多研究都是這樣,先找到一個(gè)比較直觀好理解方法,然后去研究他的框架,發(fā)...
為了后面介紹seqGAN + RL的應(yīng)用,先來(lái)介紹一下這個(gè)很火的GAN,火到似乎女?huà)z上帝都是“干”出來(lái)的...稍提一點(diǎn)背景。統(tǒng)計(jì)機(jī)器學(xué)習(xí)中,這個(gè)...
Seq2Seq的資料很多,這里就簡(jiǎn)單介紹下吧。顧名思義,它就是一個(gè)sequence來(lái)預(yù)測(cè)另一個(gè)sequence的模型,主要是一個(gè)encoder-...