機器學習領域存在不同思想的學派,主要學派包括符號學派、聯(lián)結學派、進化學派、貝葉斯學派、類推學派。
- 對于符號學派來說,所有的信息都可以簡化為操作符號,就像數(shù)學家那樣,為了解方程,會用其他表達式來代替本來的表達式。符號學者明白你不能從零開始學習:除了數(shù)據(jù),你還需要一些原始的知識。他們已經(jīng)弄明白,如何把先前存在的知識并入學習中,如何結合動態(tài)的知識來解決新問題。他們的主算法是逆向演繹,逆向演繹致力于弄明白,為了使演繹進展順利,哪些知識被省略了,然后弄明白是什么讓主算法變得越來越綜合。
- 對于聯(lián)結學派來說,學習就是大腦所做的事情,因此我們要做的就是對大腦進行逆向演繹。大腦通過調(diào)整神經(jīng)元之間連接的強度來進行學習,關鍵問題是找到哪些連接導致了誤差,以及如何糾正這些誤差。聯(lián)結學派的主算法是反向傳播學習算法,該算法將系統(tǒng)的輸出與想要的結果相比較,然后連續(xù)一層一層地改變神經(jīng)元之間的連接,目的是為了使輸出的東西接近想要的東西。
- 進化學派認為,所有形式的學習都源自于自然選擇。如果自然選擇造就我們,那么它就可以造就一切,我們要做的,就是在計算機上對它進行模仿。進化主義解決的關鍵問題是學習結構:不只是像反向傳播那樣調(diào)整參數(shù),它還創(chuàng)造大腦,用來對參數(shù)進行微調(diào)。進化學派的主算法是基因編程,和自然使有機體交配和進化那樣,基因編程也對計算機程序進行配對和提升。
- 貝葉斯學派最關注的問題是不確定性。所有掌握的知識都有不確定性,而且學習知識的過程也是一種不確定的推理形式。那么問題就變成,在不破壞信息的情況下,如何處理嘈雜、不完整甚至自相矛盾的信息。解決的辦法就是運用概率推理,而主算法就是貝葉斯定理及其衍生定理。貝葉斯定理告訴我們,如何將新的證據(jù)并入我們的信仰中,而概率推理算法盡可能有效地做到這一點。
- 對于類推學派來說,學習的關鍵就是要在不同場景中認識到相似性,然后由此推導出其他相似性。如果兩個病人有相似的癥狀,那么也許他們患有相同的疾病。問題的關鍵是,如何判斷兩個事物的相似程度。類推學派的主算法是支持向量機,主算法找出要記憶的經(jīng)歷,以及弄明白如何將這些經(jīng)歷結合起來,用來做新的預測。