最近好像又發(fā)現(xiàn)了一個(gè)定律,自從開始關(guān)注機(jī)器學(xué)習(xí),好像整個(gè)世界都在聊機(jī)器學(xué)習(xí)啊、AI啊、深度學(xué)習(xí)了?
最近自己看見好多問題,就好像手里拿著一把錘子,看什么都是釘子,就好像機(jī)器學(xué)習(xí)能解決所有的問題一樣,好多公司也都好像也在抓著這么一根稻草,真的是這樣嗎?機(jī)器學(xué)習(xí),AI有我們想的這么好嗎?
但至少就我這三四個(gè)月的學(xué)習(xí),以及參考了很多位大大的意見。我的看法是:并不是這樣,AI不能解決所有的問題,它依然還有很長(zhǎng)的路要走。
但是機(jī)器學(xué)習(xí)確實(shí)給我提供了一個(gè)不一樣的思路去解決問題,我覺得這是它帶給我的最不一樣的地方。
機(jī)器學(xué)習(xí)幾乎所有模型的套路其實(shí)用一句話就能描述清楚了。
數(shù)據(jù)清洗,然后特征提取,進(jìn)行模型假定,接著進(jìn)行參數(shù)訓(xùn)練,然后進(jìn)行預(yù)測(cè)。
難嗎?其實(shí)不算特別難,至少對(duì)于剛剛?cè)腴T的我來說是這樣,可能畢竟還沒有到達(dá)各位大大那樣的思維境界。
就好像很多人問我大數(shù)據(jù)開發(fā)難嗎?我覺得不難。只是可能這些東西跟我們之前的開發(fā)認(rèn)知上有一定的偏差,人為想象它很難罷了,絕大部分人還是不愿意走出自己的舒適區(qū)的。
而且這上面幾個(gè)步驟,在大公司里可能每個(gè)步驟都有特定的同事在處理,一個(gè)人只處理比較少的內(nèi)容,但久而久之,必定生疏。
那么機(jī)器真的在學(xué)習(xí)嗎?還是我們?cè)趯W(xué)習(xí)?
機(jī)器學(xué)習(xí)只是機(jī)器在人的特定的業(yè)務(wù)需求下,在特定的假設(shè)中,去尋找到符合我們假設(shè)的參數(shù)得到的模型,從而對(duì)未發(fā)生的事情進(jìn)行概率預(yù)測(cè)。
用人話來說就是,我知道它應(yīng)該大致遵循這個(gè)規(guī)律,但是這個(gè)規(guī)律的詳細(xì)參數(shù)是怎樣呢?我不知道。但是我不管,我就要知道,破機(jī)器你去幫我跑跑跑算出來。
Q:學(xué)機(jī)器學(xué)習(xí)數(shù)學(xué)要求很高嗎?
A:入門簡(jiǎn)單掉庫嘛,不用很高。深入做調(diào)優(yōu)做提升做貢獻(xiàn),必須是。
Q:有什么事情是機(jī)器學(xué)習(xí)做不到的嗎?
A:有,吃喝拉撒生老病死
Q:那機(jī)器學(xué)習(xí)涉及哪些內(nèi)容呢
A:自己瞅瞅,我說出來估計(jì)天亮了。
長(zhǎng)圖預(yù)警,機(jī)器學(xué)習(xí)大家族。
Q:學(xué)機(jī)器學(xué)習(xí)最難的是把所有的算法學(xué)會(huì)嗎?
A:機(jī)器學(xué)習(xí)最難的部分是業(yè)務(wù)落地?,F(xiàn)成的方法能夠解決絕大部分的問題,花時(shí)間在分析業(yè)務(wù)目標(biāo)可能會(huì)更有效。
你涉及的業(yè)務(wù)可能也就涉及到其中的兩三個(gè)算法,用最簡(jiǎn)單的模型去試試看,可能比用復(fù)雜的模型更加有效。比如分類問題,用決策樹和SVM能解決大部分的問題。比如回歸問題,那么線性回歸的幾個(gè)Boss都能解決你的問題。
尊重奧卡姆剃刀原則,沒事別把神經(jīng)網(wǎng)絡(luò)啊深度學(xué)習(xí)啊搬出來。
據(jù)我所知,目前它們應(yīng)用在聲音, 圖像這類維度特別高的場(chǎng)景比較合適,又有多少業(yè)務(wù)場(chǎng)景涉及到這一類呢?絕大部分都是有監(jiān)督的分類問題,少部分聚類。
Q:我完全不會(huì)數(shù)學(xué),咋辦咋辦。
A:人生苦短,我用Python,直接調(diào)用現(xiàn)成的機(jī)器學(xué)習(xí)庫去。但還是把數(shù)學(xué)撿起來比較好。
Q:那我完全不會(huì)英語咋辦?
A:呃,那沒轍了,好好學(xué)英語吧。想看翻譯后的paper,估計(jì)得很長(zhǎng)時(shí)間以后了,還是劣質(zhì)版的。
那么機(jī)器學(xué)習(xí)對(duì)于我們來說應(yīng)該是什么呢?
解決問題的另外一個(gè)思路罷了,共勉,掰掰。
以上都是個(gè)人見解。
以上。
給IOS大大準(zhǔn)備的高清大圖