面試題目總結(jié)

阿里機器學(xué)習(xí)面試的一些題目,

1.說一下KNN的過程(剛開始的時候和k-means搞混了。。。)

KNN是k nearest neighbor 的簡稱,即k最鄰近,就是找k個最近的實例投票決定新實例的類標(biāo)。KNN是一種基于實例的學(xué)習(xí)算法,它不同于貝葉斯、決策樹等算法,KNN不需要訓(xùn)練,當(dāng)有新的實例出現(xiàn)時,直接在訓(xùn)練數(shù)據(jù)集中找k個最近的實例,把這個新的實例分配給這k個訓(xùn)練實例中實例數(shù)最多類。KNN也稱為懶惰學(xué)習(xí),它不需要訓(xùn)練過程,在類標(biāo)邊界比較整齊的情況下分類的準(zhǔn)確率很高。KNN算法需要人為決定K的取值,即找?guī)讉€最近的實例,k值不同,分類結(jié)果的結(jié)果也會不同。

2. ID3 C4.5 CART根據(jù)什么選擇特征

ID3根據(jù)信息增益選擇特征。C4.5根據(jù)信息增益率。CART根據(jù)基尼指數(shù)

參考鏈接:決策樹(ID3、C4.5、CART)

3. 樸素貝葉斯的假設(shè)是什么?

所有樸素貝葉斯分類器都假定樣本每個特征與其他特征都不相關(guān)。

4. 如果某個特征在訓(xùn)練集出現(xiàn),測試集沒出現(xiàn)沒出現(xiàn),概率計算出來是0,怎么解決?

某特征在訓(xùn)練集中未出現(xiàn),避免概率計算為0,引入laplace平滑方法

5. SVM軟間隔目標(biāo)函數(shù),及對偶函數(shù)的形式

當(dāng)數(shù)據(jù)近似線性可分時,通過軟間隔最大化學(xué)習(xí)一個線性分類器,即線性支持向量機;當(dāng)數(shù)據(jù)線性不可分時,通過核技巧及軟間隔最大化學(xué)習(xí)非線性支持向量機。

目標(biāo)函數(shù)變?yōu)椋?/p>

求min

其中C稱為懲罰參數(shù),且C>0。在線性支持向量機中加入了懲罰項。

利用拉格朗日函數(shù)的對偶性,將問題變成一個極大極小優(yōu)化問題:

了解更多:SVM

6. 神經(jīng)網(wǎng)絡(luò)的誤差傳播的原理

BP網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
印象中記得老師講。以3層的為例。紫色圈圈的誤差,需要由它所有的輸入負(fù)責(zé),即每一個粉紅色的圈圈都對誤差負(fù)有責(zé)任,每個粉紅色的圈圈的誤差是兩個紫色圈圈分給它的誤差之和。

7.梯度提升樹

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 1.機器學(xué)習(xí)中特征的理解 def:特征選擇和降維 特征選擇:原有特征選擇出子集,不改變原來的特征空間 降維:將原有...
    CoolWell閱讀 982評論 0 0
  • 一.樸素貝葉斯 1.分類理論 樸素貝葉斯是一種基于貝葉斯定理和特征條件獨立性假設(shè)的多分類的機器學(xué)習(xí)方法,所...
    wlj1107閱讀 3,407評論 0 5
  • 昨晚19:00葉老師第八季《人人必修3堂時間管理課》第一節(jié)。 貌似葉老師的線上和線下課都上了不少了,但都沒有好好的...
    NicoleQIu閱讀 93評論 0 0
  • 上午來到學(xué)校馬上就要開始學(xué)習(xí)訓(xùn)練了,有點小激動!下午的時候,我們開始選擇連委進行開營儀式,我參加了授旗儀式,場面盛...
    MAZAN閱讀 240評論 0 0

友情鏈接更多精彩內(nèi)容