Andrew Ng教你如何學(xué)習(xí)機器學(xué)習(xí)——Quora問答

本期博客介紹如何學(xué)習(xí)人工智能,當(dāng)然不是由我本人來闡述,而是根據(jù)吳恩達(dá)老師的Quora回答進行總結(jié)和歸納。

Andrew Ng是大名鼎鼎的人工智能大師、是Stanford大學(xué)人工智能實驗室主任、是百度首席科學(xué)家、Coursera的創(chuàng)始人、Google眼鏡和無人車的初創(chuàng)成員。其權(quán)威和知名度不言而喻,本文就是基于他的Quora回答給大家講解下如何入門機器學(xué)習(xí)。

Andrew在Quora上的問答

Andrew在Quora上回答了一共9個問題,基本上都是和人工智能有關(guān)的,每個回答都超過萬人點贊,其影響力可想而知。下面按照點贊由高到低介紹下Andrew的回答。

1. 作為一個教育家,你有什么好的建議給學(xué)生們嗎?

當(dāng)決定如何花費你的時間時,我建議應(yīng)該從兩個方面進行考慮:

  • 你在做的事情能改變世界嗎?
  • 你將花多少來學(xué)習(xí)?

直到今天,我也是這樣來決定如何花費我時間的。


我們?nèi)缃竦纳鐣o每個人最好的機會來改變世界。隨著信息技術(shù)和現(xiàn)代通訊的發(fā)展,好的點子和產(chǎn)品將以超乎以往任何時候的速度來傳播。只要有好的點子和強大的執(zhí)行力,任何人都能很快地幫助到這個星球上的其他人。

因此,問問你自己:如果你所從事的工作成功超越你廣闊的夢想,那么它是否對其他人有重要影響。如果不是,那么繼續(xù)尋找些其它的事情來做。否則, 你就沒有發(fā)揮出你全部潛力。


第二,特別是當(dāng)你年輕時,不要去評估投資未來教育的價值。我所說的年輕是指小于100歲。

任何你所學(xué)到的東西都會在接下來的工作中遇到。但是這并不容易,一旦你離開了學(xué)校,花時間來學(xué)習(xí)都是相對的短期回報。也沒有老師在你旁邊給你打分并激勵你不斷學(xué)習(xí)。但是,你可以自驅(qū)動使得閱讀變得有趣,不斷創(chuàng)新你的點子,不斷與你值得學(xué)習(xí)的人交流,那么經(jīng)過一段時間以后,你在你的領(lǐng)域?qū)兂身敿馊瞬拧?/p>

對我來說,我十分熱愛閱讀。在我kindle中有超過1000本書,我會花費晚上和周末大量的時間來閱讀。我的閱讀套餐包括學(xué)術(shù)研究論文、商業(yè)策略書籍、創(chuàng)新方法、產(chǎn)品、我崇拜的人物傳記等等。我有時候也看看網(wǎng)絡(luò)課程(MOOCs)。我也很愛和能教我新知識的人交流,不管他是老朋友還是新伙伴。

這個學(xué)習(xí)的過程將幫助自己決定到底想做什么。當(dāng)你看了足夠多關(guān)于其他人改變世界的例子時,你將得到越來越多的好點子來改變這個世界。


總之,你不斷投資自己去學(xué)習(xí),即便這個過程非常困難。并且不斷的去尋找一個幫助人類發(fā)展的道路。

2. 在機器學(xué)習(xí)領(lǐng)域,你應(yīng)該如何開始你的職業(yè)生涯?

這要取決于你如何定義“機器學(xué)習(xí)職業(yè)生涯”。如果你說的是一個應(yīng)用現(xiàn)成工具的工作,比如R的工具庫,Python的scikit-learn庫。那么你在本科時上了2-3年的機器學(xué)習(xí)相關(guān)課程即可了,或者一些在線學(xué)習(xí)課程(如https://www.coursera.org/learn/machine-learninghttps://www.coursera.org/specializations/jhu-data-science)。

你也應(yīng)該進行一些實踐的項目,比如參加kaggle競賽,或者開放你的源碼在github上。(我強烈推薦使用python)如果你的工作是希望開發(fā)新的基礎(chǔ)機器學(xué)習(xí)算法,你應(yīng)該考取一個計算機或者數(shù)據(jù)統(tǒng)計領(lǐng)域的PhD(還有一些博士后研究者從其他領(lǐng)域如物理學(xué)轉(zhuǎn)到機器學(xué)習(xí)領(lǐng)域)

更多幫助可以參考:https://www.quora.com/How-do-I-learn-machine-learning-1

3. 在10-20年后,工作將會如何變化?

如果你是一個50年駕齡的卡車司機,由于無人車的發(fā)展導(dǎo)致你的工作沒有了,你將怎么做?

我們這個社會對有技能的人是有很大機會的。但問題是一些30年的工作經(jīng)驗將會大幅貶值。我們應(yīng)當(dāng)有更多的道德義務(wù)來幫助人們獲得新的技能和追逐新的機會。

幸運的是,隨著在線課程的發(fā)展和其它相當(dāng)規(guī)模的教育(比如Coursera、可汗學(xué)院、Lynda等),我們這樣做起來就相當(dāng)容易了。我不擔(dān)心未來20年里缺少重要工作機會——現(xiàn)在以及可見的未來里還有很多東西只有人能做而機器不能的。但是我關(guān)心有需要培訓(xùn)每個人的需求。

我也花費了一些基本的收入,這些收入用來提供給每個人一個合適的地方學(xué)習(xí)新的技能。我們現(xiàn)在的社會和政治現(xiàn)實來看,還沒有做好無理由的為每個人買單的準(zhǔn)備。我建議通過提高財政支出來提供他們更多學(xué)習(xí)技能的機會。因此,他們并不游手好閑,我們激勵這些沒有工作的人們并幫助他們重返崗位。

我非常喜歡Erik Brynjolfsson和Andrew McAfee關(guān)于這個話題的言論:第二次機器時代。

4. AI是不是一個對人類有威脅的存在?

今天擔(dān)心AI可能是邪惡的超智能體就像擔(dān)心火星上人口也會超載一樣,而我們至今還不能到火星。

AI已經(jīng)獲得里極大地進步,我對機器智能能夠創(chuàng)建一個更美好的社會抱有極其樂觀的態(tài)度。但是AI現(xiàn)在還非常有限,幾乎所有深度學(xué)習(xí)的經(jīng)濟和社會價值問題都是要通過監(jiān)督學(xué)習(xí),它受限于大量的格式化后的數(shù)據(jù)(比如進行了標(biāo)簽后的數(shù)據(jù))。盡管AI已經(jīng)幫助了成千上萬的人們,并且還會幫助更多人,但我看不到任何威脅到人類的可能。

往遠(yuǎn)點看,還有很多其他不需要監(jiān)督學(xué)習(xí)的AI形式,比如無監(jiān)督學(xué)習(xí)(我們需要更多的數(shù)據(jù),因為數(shù)據(jù)不需要被標(biāo)記)。在我的團隊或其它團隊中還有更多令人興奮的學(xué)習(xí)形式。我們所有人都希望有技術(shù)的突破,但是我們都不能預(yù)測什么時候會實現(xiàn)。

我認(rèn)為對邪惡AI的恐懼已經(jīng)使政策制定和領(lǐng)導(dǎo)者在這個假象上錯誤地進行了布局。還有其它AI可能導(dǎo)致的問題,尤其是對工作的變化。毫無疑問,AI在接下來十年會創(chuàng)造更好的社會,我們作為AI創(chuàng)造者也應(yīng)該解決我們導(dǎo)致的這一問題。我期望在線網(wǎng)絡(luò)課程能成為這解決方法的一部分,但我們還需要除了教育的更多東西。

5. 是什么原因使Andrew Ng來學(xué)習(xí)人工智能?

我想讓我們用AI來創(chuàng)造一個更好的世界。

正如工業(yè)革命解放了人類許許多多的體力勞動(你能想象如果你還需要自己洗衣服的生活嘛?),在未來AI將解放人類繁重的智力勞動。比如,擁有無人車的話將不會浪費人們一生中3年的時間來開車。這將給我們更多時間陪愛人以及追求更有價值的目標(biāo)。

當(dāng)我16歲的時候我開始學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)(現(xiàn)在稱為深度學(xué)習(xí)),當(dāng)時我還是新加坡國立大學(xué)的學(xué)生。我們當(dāng)時做的東西用現(xiàn)在的標(biāo)準(zhǔn)來看是微不足道的,但是在那時我覺得用幾行代碼讓計算機來學(xué)習(xí)是十分興奮的。

說一個好笑的事兒:我們當(dāng)時用的電腦跑emacs十分卡,所以我學(xué)習(xí)了vi,至今仍然用vi。

在那時,我還擔(dān)當(dāng)了一個辦公室助理的兼職工作,我做了許多復(fù)印件工作(事實上,我是辦公室助理的助理)。那時候我意識到了更智能的機器能幫我們做許多工作,這樣人類才可以做更多有挑戰(zhàn)性的工作。


在未來十年內(nèi),AI將改變這個社會。我們將從我們做什么變到我們讓計算機做什么。可能就在不久的未來,Quora上就有人問:“能自己開車的生活是什么樣的?”

6. Andrew Ng是怎樣看待深度學(xué)習(xí)的?

深度學(xué)習(xí)是一個令人振奮的工具來幫助許多人創(chuàng)造出現(xiàn)成的AI應(yīng)用。可以幫助實現(xiàn)無人駕駛汽車,精準(zhǔn)的語音識別,圖像理解程序等等。

雖然現(xiàn)在深度學(xué)習(xí)進展喜人,但是我認(rèn)為人有很多機會,特別是在精準(zhǔn)農(nóng)業(yè)、消費金融、醫(yī)療領(lǐng)域等。在那里我看到一個清晰的機會,深刻的學(xué)習(xí)可以有很大的影響,但我們沒有精力沒有時間來關(guān)注這一切。所以我相信深度學(xué)習(xí)不會很快就達(dá)到瓶頸期,而且它還會繼續(xù)快速增長。

深度學(xué)習(xí)也有些言過其實了。由于神經(jīng)網(wǎng)絡(luò)是非常高深且難以解釋的,我們許多人用人腦來解釋它。但是我們幾乎不知道生物大腦是如何工作的。UC Berkeley大學(xué)的Michael Jordan稱深度學(xué)習(xí)為“卡通”版的生物大腦——這是一個對我們都不懂的超簡化版東西的描述,我也很同意這一觀點。盡管媒體大肆炒作,我們幾乎無法建立達(dá)到人類水平的智能。因為我們根本不知道大腦是如何工作的,試圖盲目地復(fù)制我們在計算機中所知的東西并沒有導(dǎo)致特別有效的人工智能系統(tǒng)。相反,最有效的深學(xué)習(xí)工作,也是至今已經(jīng)取得進展的是從CS和工程原理來進行,最多是借鑒生物學(xué)靈感,而不是試圖盲目復(fù)制生物學(xué)知識。

具體來說,如果你聽到有人說:“大腦做到某個事情,而我的智能系統(tǒng)也會做想同事。所以我們是在建立一個模擬的大腦。”,我覺得他肯定是在扯淡!

許多用于深度學(xué)習(xí)的想法已經(jīng)存在了幾十年。為什么現(xiàn)在才流行起來?其進度的兩個主要原因是:(i)數(shù)據(jù)規(guī)模(ii)計算規(guī)模。隨著我們在網(wǎng)站和移動設(shè)備上花費更多的時間,在過去的二十年中,我們一直在迅速積累數(shù)據(jù)。直到最近,我們想出了如何利用大規(guī)模計算從而建立深度學(xué)習(xí)算法,從而可以利用這個龐大的數(shù)據(jù)量。

現(xiàn)在我們正處于兩個正反饋過程中,這加速了深度學(xué)習(xí)的發(fā)展:

首先,現(xiàn)在我們有龐大的機器來吸收大量的數(shù)據(jù),大數(shù)據(jù)的價值就更清晰了。這使得我們有了一個更大的動機來獲得更多的數(shù)據(jù),這反過來又激勵我們來建立更大且更快的神經(jīng)網(wǎng)絡(luò)。

第二,我們迅速地實現(xiàn)了深度學(xué)習(xí)也加快了創(chuàng)新,加速了深度學(xué)習(xí)的研究進展。許多人低估了對計算機系統(tǒng)投資對深度學(xué)習(xí)的影響。當(dāng)進行深度學(xué)習(xí)研究時,我們開始并不知道什么樣的算法會正常工作,我們的工作就是運行大量的實驗來找出它。如果我們有一個高效的計算平臺讓你一天跑一個實驗而不是一周跑一個的話,那么你的研究進展幾乎可以增加7倍速度!

這就是為什么我們組在2008年斯坦福大學(xué)里就開始倡導(dǎo)使用GPU來進行深度學(xué)習(xí)(但是是有爭議的,但現(xiàn)在幾乎每個人都這樣做了);現(xiàn)在我又推薦使用HPC(高性能計算/超級計算機)擴大深度學(xué)習(xí)的規(guī)模。機器學(xué)習(xí)應(yīng)該擁抱HPC。這些方法將使研究人員更有效率,促進我們整個領(lǐng)域的進步。


總之:深度學(xué)習(xí)已經(jīng)幫助AI取得了巨大的進步,但將來會有更好的AI!

7. 在工業(yè)界和在Stanford學(xué)術(shù)界工作有什么區(qū)別?

當(dāng)有人問我是否應(yīng)該在工業(yè)界還是學(xué)術(shù)界工作時,我通常建議他們先弄清楚他們想做什么。也就是說,你的使命是什么?你想讓世界發(fā)生什么樣的變化?當(dāng)你有了答案,你就可以知道在公司還是大學(xué)哪一個是更好的地方來完成你的使命。

以下是一些我認(rèn)為在商界工作更合適的理由:

  • 獲取重大資源,做大項目。人工智能研究日益資本集中,需要龐大的數(shù)據(jù)和計算資源。這些在公司更容易得到。
  • 強烈的團隊合作意識。當(dāng)你不需要太擔(dān)心作者排序問題或這項工作是否對你的博士論文有用,你可以更好地執(zhí)行團隊合作意識,追求團隊整體的目標(biāo)并慶祝團隊的成功。
  • 快速決策(取決于公司)。我喜歡工作在一個靈活的環(huán)境中,我們可以快速的在需要的地方獲取資源,從快速建立一個新的計算集群到購買大量的數(shù)據(jù),等等。
  • 通過產(chǎn)品創(chuàng)新和服務(wù)能夠直接幫助到大量的人們。

以下是一些我認(rèn)為在學(xué)術(shù)界工作比較好的方面:

  • 可以公開地探索任何話題。例如,在Stanford,我開始錄制教育視頻。最初沒有人認(rèn)為這是“真正的”Stanford工作;但這最后變成Coursera(同時Stanford也因此受益)。在Stanford,當(dāng)我和我的學(xué)生覺得要建立一個開源機器人平臺,我們不需要跟其他任何人評估就開始執(zhí)行。這使得ROS得以創(chuàng)建,它是一個非常成功的開源平臺。
  • 可以將100%的時間來學(xué)習(xí),甚至幾年沒有直接產(chǎn)出。像百度這樣的公司非常支持員工的成長,通常讓員工花幾個月的時間來學(xué)習(xí),但是讓員工這樣做幾年還是很難。
  • 獲得學(xué)位的能力。即使在今天,有一個高等學(xué)位是有幫助的。大學(xué)和公司都能很好地培養(yǎng)人才,而社會正變得非常善于鑒別能力,無論你從哪里獲得這種能力。

對于我自己,一個讓我一直很感興趣的使命是讓大眾獲得世界上最好的教育。我認(rèn)為我的公司(Coursera)會很好地執(zhí)行這一任務(wù)。最近,我想通過開發(fā)人工智能技術(shù)來讓我們幫助數(shù)以百萬計的人,我認(rèn)為我的公司(百度)將是很好地執(zhí)行這一使命。但是還有很多其他有價值的任務(wù),比如教育學(xué)生,研究某些領(lǐng)域,在大學(xué)里會執(zhí)行地更好。

8. 什么時候無人車能真正到消費者手中?

我希望在3年內(nèi),我們會在道路上擁有大量無人車輛,并在5年內(nèi)大規(guī)模生產(chǎn)。(隨意在你的日歷上做筆記,在3年或5年后檢查一下,看我的預(yù)測是否正確?。?/p>

我們最近通過Stanford10周年慶贏得了DARPA無人駕駛挑戰(zhàn)賽。為什么無人駕駛還要這么久?

首先,我認(rèn)為制造一輛能到處行駛汽車的過程是非常具有挑戰(zhàn)性的,這是最錯誤的目標(biāo)。無人駕駛最大的問題是解決所有角落的情況——所有奇怪的問題每10000或100000英里駕駛發(fā)生一次。機器學(xué)習(xí)很好地讓你的性能從90%的準(zhǔn)確率到99.9%,但它沒有讓我們從99.9%到99.9999%。我認(rèn)為從不同的目標(biāo)出發(fā)會更有希望:巴士或通勤車只開一條固定的公交路線或只是在一個小區(qū)域行駛。如果我們能確保路線的路面和車道標(biāo)記,以及是否有新的修繕等等,那么我們能實現(xiàn)真正的安全。然后,讓我們再慢慢添加路線,并逐步擴大地區(qū),這樣我們可以實現(xiàn)安全行駛。這是我們在百度采取的方法,我希望其他團體也采用這種方法。

第二,汽車本質(zhì)上是不同于人類看世界。例如,今天的計算機視覺無法可靠區(qū)分建筑工人揮手是指“你來吧”還是“快停止”。另一方面,我們的自動駕駛汽車是沒有盲點的,可以無時無刻看到周圍360度;我們的HPC(高性能計算機)系統(tǒng)也有比人類更快的反應(yīng)速度。我認(rèn)為我們不應(yīng)該指望自主汽車的駕駛方式和人類的駕駛方式完全一樣。我們可以使他們安全,可預(yù)測且可靠,但他們將不同于人類駕駛的汽車。我們作為技術(shù)人員,既要搞清楚基本規(guī)定也要對這些汽車有新期待,必須與政府和社會一起在這方面發(fā)揮重要的推動作用。

我對未來無人駕駛充滿樂觀態(tài)度。它將幫助人類節(jié)省大量時間,并大幅消除交通事故。我期待全球科技人員與政府、社會一起推動這一技術(shù)發(fā)展。

機器學(xué)習(xí)入門方法

通過Andrew給大家的回答,其實也基本能知道機器學(xué)習(xí)目前對于這個世界的發(fā)展是有很大作用。

  • 入門機器學(xué)習(xí)首先就是推薦Andrew在Coursera上的課程“Machine Learning”,可以說是這個是入門的精品課程。
  • Kevin Murphy的Machine Learning Textbook也是進階教學(xué)課程之一,非常有用。
  • github上有個awesome系列,其中ML系列里面推薦了無數(shù)本十分有意義的材料:github地址,有一本使用R語言的統(tǒng)計學(xué)書是十分有意義的。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容