sklearn文檔 — 1.4. 支持向量機(jī)

原文章為scikit-learn中"用戶指南"-->"監(jiān)督學(xué)習(xí)的第四節(jié):Support Vector Machines"######

支持向量機(jī)(Support vector machines ,SVMs)是一組用于 分類(lèi)問(wèn)題,回歸問(wèn)題異常值監(jiān)測(cè) 的監(jiān)督學(xué)習(xí)方法。

其優(yōu)點(diǎn)在于:

  • 能夠有效的應(yīng)對(duì)高維空間內(nèi)的數(shù)據(jù)
  • 在維度數(shù)量遠(yuǎn)大于樣本數(shù)量的情況下也依舊高效
  • 在決策函數(shù)內(nèi)使用訓(xùn)練樣本的子樣本來(lái)進(jìn)行預(yù)測(cè)(這個(gè)也稱為支持向量),這一點(diǎn)能夠有效的減少內(nèi)存的使用
  • 多樣化:能夠在決策函數(shù)內(nèi)指定各種不同的 核函數(shù) ,在該類(lèi)里已經(jīng)提供了一些常見(jiàn)的核,不過(guò)也允許手動(dòng)指派自定義的核函數(shù)。

而它的缺點(diǎn)則有:

  • 如果特征的數(shù)量比樣本數(shù)量要大,那訓(xùn)練后的結(jié)果可能會(huì)很糟糕。
  • 不直接提供概率估計(jì),(如果)需要的話則要使用很耗費(fèi)性能的五層交叉驗(yàn)證來(lái)進(jìn)行計(jì)算。(可以參考下方的 分?jǐn)?shù)與概率

在 Scikit-Learn 里的支持向量機(jī)同時(shí)支持密集(numpy.ndarray類(lèi)型的數(shù)組,可以使用numpy.asarray函數(shù)進(jìn)行轉(zhuǎn)換)與稀疏(任何scipy.sparse類(lèi)型的數(shù)組)的樣本輸入向量。不過(guò)想要在稀疏數(shù)據(jù)上取的更好的效果,最好是先對(duì)數(shù)據(jù)再進(jìn)行額外的處理,最好是使用C-排序的numpy.ndarray(密集數(shù)據(jù))或** scipy.sparse.csr_matrix **(稀疏數(shù)據(jù))


(在嘗試翻譯這篇文檔的時(shí)候難免會(huì)因?yàn)楦鞣N問(wèn)題而出現(xiàn)錯(cuò)翻,如果發(fā)現(xiàn)的話,煩請(qǐng)指出,謝謝> <)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容