記錄一些最近讀文章的想法
新出爐的ICML2017的accepted paper list已經(jīng)看了個(gè)差不多,強(qiáng)化加deep果真很火。DeepMind似乎是最大贏家,占據(jù)了半壁江山吶。
我挑選了優(yōu)化和傳統(tǒng)領(lǐng)域的一些方法讀了幾篇,其中包括了time series + NMF 的策略, deep clustering + Kmeans方法(這篇文章我自認(rèn)為和ICML2016那篇DEC并沒有什么本質(zhì)不同,甚至如果單就實(shí)驗(yàn)結(jié)果來說可能DEC會(huì)更好)。
這幾篇文章的共同特點(diǎn)都是,故事說的不錯(cuò)。
這仿佛也是文章能中的一個(gè)很重要的特質(zhì)。
什么叫故事說的不錯(cuò)呢?就是你的工作“仿佛”很有價(jià)值。
比如我現(xiàn)在在看的這篇,他的故事就是說,有一些疾病,它可能有許多變種,治療手段會(huì)非常復(fù)雜。那我們希望能夠?qū)⑦@種疾病和它的變種分成幾大類來治療。我們會(huì)額外的獲得一些信息來幫助我們對(duì)于這些復(fù)雜變種的分類。那就是專家的領(lǐng)域知識(shí)(experts' view)XD。
這個(gè)問題本身就很有趣,看起來很有價(jià)值。
所以讀文章的第一步就是,找到這篇文章想要解決的實(shí)際問題。
當(dāng)然如果是一篇純理論的文章就算了,我最近要focus在解決實(shí)際問題上。
第二步,也是我認(rèn)為最重要的一步,那就是建模。
問題很容易找,大千世界有許許多多實(shí)際應(yīng)用問題,如何將他轉(zhuǎn)化成為一個(gè)可解的數(shù)學(xué)問題?這個(gè)步驟并不那么容易,也是我認(rèn)為學(xué)cs人士必須掌握的一個(gè)技能。
在我讀文章的時(shí)候,一般paper都會(huì)按照順序先說實(shí)際問題,這個(gè)時(shí)候我自己會(huì)思考,如果我面對(duì)這個(gè)問題會(huì)怎么建模?
然后再看我和文章中方法建模的不同,再問自己,為什么會(huì)不同?文中的建模方法有什么優(yōu)點(diǎn)?我的建模方法會(huì)不會(huì)提供解決這個(gè)問題的另一個(gè)思路?(大概這么想下去又可以生成一個(gè)新的算法咯雖然并沒有)
第三步,讀算法
算法基本可以說是一篇論文的核心,作者提出問題是為了提供一個(gè)“新穎又有效”的解決問題的方法。在計(jì)算機(jī)領(lǐng)域,這就是算法了。
在對(duì)數(shù)學(xué)模型很清楚的情況下,看看作者是怎么解決這個(gè)問題的。這是最為關(guān)鍵的部分。在這個(gè)部分,要解決以下三個(gè)問題
算法是什么? 為什么他能夠解決這個(gè)數(shù)學(xué)問題?他背后用到了哪些技術(shù)?
基本上讀完算法這篇文章就差不多咯。讀完再自己實(shí)現(xiàn)一下,基本對(duì)這個(gè)方法就非常理解了。然后就可以follow它做一些微小的工作了。
可能會(huì)繼續(xù)更新。