IP屬地:海南
背景:只專注于單個模型可能會忽略一些相關任務中可能提升目標任務的潛在信息,通過進行一定程度的共享不同任務之間的參數,可能會使原任務泛化更好。廣義...
強化學習 元素:actor(我們可以控制,決策我們的行為),Env,Reward(我們不能控制環(huán)境)主要方法:model-baed(對Env建模...
Unspervised learning主要任務目標是發(fā)掘數據潛在有價值的結構,主要分為clustering,dimentionality re...
神經網絡構建好,訓練不出好的效果怎么辦?明明說好的擬合任意函數(一般連續(xù))(為什么?可以參考Neural Network and Deep Le...
David Silver說,AI = RL + DL = Deep Reinforcement Learning他的課程:RL Cource b...
這次給大家介紹一下GAN的generalized framework。其實很多研究都是這樣,先找到一個比較直觀好理解方法,然后去研究他的框架,發(fā)...
為了后面介紹seqGAN + RL的應用,先來介紹一下這個很火的GAN,火到似乎女媧上帝都是“干”出來的...稍提一點背景。統(tǒng)計機器學習中,這個...
Seq2Seq的資料很多,這里就簡單介紹下吧。顧名思義,它就是一個sequence來預測另一個sequence的模型,主要是一個encoder-...