人們在網(wǎng)絡上執(zhí)行搜索的時候,會彈出來一系列根據(jù)搜索的詞匯產(chǎn)生的結果,而且能對這些結果根據(jù)新聞、資訊、視頻進行分類;在網(wǎng)絡上進行購物的時候,沒有進行搜索可以根據(jù)用戶的歷史記錄進行推薦;高層面的根據(jù)人臉信息分析出用戶畫像針對性地投放廣告,這一切的操作都可以通過機器學習來完成。
一般來說我們設計程序需要知道這整件事的邏輯,比如條件,執(zhí)行方法,所需要的數(shù)據(jù)等。程序是愚蠢的只有我們告訴它要怎么做它才知道去怎么做,而機器學習是為了讓我們賦予機器能夠自我學習的能力,我們只要給它一個目標,它就能經(jīng)過反復的學習去強化自己的認知能力, 而我們要做的就是設計出這樣的一個算法模型,使得機器能夠自我學習并趨近于這個目標。
機器學習分為兩個大類,分別是監(jiān)督學習和非監(jiān)督學習。
監(jiān)督學習指的是我們設計出一套算法后需要讓機器進行學習的時候,比如圖像分類,我們會事先給它一些數(shù)據(jù),而這些數(shù)據(jù)是帶標簽的,比如一些貓的圖片和狗的圖片,將這些貓狗圖片輸入進機器后,機器根據(jù)反復的訓練學習,了解到貓的圖片的特征和狗的圖片的特征,一開始一般是結果很差,經(jīng)過多次的學習后能夠逐漸的分類出貓和狗這兩個類別。這種是有目標地學習,因為學習的目標有標簽,而且同樣類別的圖片是有一些共性,當目標類別較少的時候機器能比較容易地學習到圖像特征并進行分類,這種方式是有效且快捷的,所以比較廣泛地應用。
非監(jiān)督學習指的是我們只設計算法,不給圖片打上標簽,讓機器自己去學習大量圖片中各自的特征并進行分類,關注地更多的是聚類算法,因為聚類算法能將圖片有相同特征的情況下進行聚合,不同特征的進行分離。這是非常AI的一個方向,因為它真正地讓機器能夠有自學的能力和自我泛化的能力。好處是因為標注圖片需要花費大量人力資源,而非監(jiān)督學習是無標簽形式的,不需要花費人力資源給圖片打上標簽,并且可以循環(huán)擴增進行訓練,使模型越來越魯棒。但是目前來說非監(jiān)督的學習的算法設計成本較高,而且效果很難達到人類識別的效果,所以目前還處于研究階段。
我們要達到的目標是能夠自己設計一套算法,分析數(shù)據(jù)特征,使得機器能夠自我學習解決某些實際問題,了解到各種各樣的算法和其中的特點,它需要有一定的數(shù)學能力和代碼能力,在借下來的課程中慢慢學好,更希望能夠通過自己的想法將某些問題利用機器學習的方式去實現(xiàn)它!