原文章為scikit-learn中"用戶指南"-->"監(jiān)督學(xué)習(xí)的第四節(jié):Support Vector Machines"######
支持向量機(jī)(Support vector machines ,SVMs)是一組用于 分類(lèi)問(wèn)題,回歸問(wèn)題 與 異常值監(jiān)測(cè) 的監(jiān)督學(xué)習(xí)方法。
其優(yōu)點(diǎn)在于:
- 能夠有效的應(yīng)對(duì)高維空間內(nèi)的數(shù)據(jù)
- 在維度數(shù)量遠(yuǎn)大于樣本數(shù)量的情況下也依舊高效
- 在決策函數(shù)內(nèi)使用訓(xùn)練樣本的子樣本來(lái)進(jìn)行預(yù)測(cè)(這個(gè)也稱為支持向量),這一點(diǎn)能夠有效的減少內(nèi)存的使用
- 多樣化:能夠在決策函數(shù)內(nèi)指定各種不同的 核函數(shù) ,在該類(lèi)里已經(jīng)提供了一些常見(jiàn)的核,不過(guò)也允許手動(dòng)指派自定義的核函數(shù)。
而它的缺點(diǎn)則有:
- 如果特征的數(shù)量比樣本數(shù)量要大,那訓(xùn)練后的結(jié)果可能會(huì)很糟糕。
- 不直接提供概率估計(jì),(如果)需要的話則要使用很耗費(fèi)性能的五層交叉驗(yàn)證來(lái)進(jìn)行計(jì)算。(可以參考下方的 分?jǐn)?shù)與概率 )
在 Scikit-Learn 里的支持向量機(jī)同時(shí)支持密集(numpy.ndarray類(lèi)型的數(shù)組,可以使用numpy.asarray函數(shù)進(jìn)行轉(zhuǎn)換)與稀疏(任何scipy.sparse類(lèi)型的數(shù)組)的樣本輸入向量。不過(guò)想要在稀疏數(shù)據(jù)上取的更好的效果,最好是先對(duì)數(shù)據(jù)再進(jìn)行額外的處理,最好是使用C-排序的numpy.ndarray(密集數(shù)據(jù))或** scipy.sparse.csr_matrix **(稀疏數(shù)據(jù))
(在嘗試翻譯這篇文檔的時(shí)候難免會(huì)因?yàn)楦鞣N問(wèn)題而出現(xiàn)錯(cuò)翻,如果發(fā)現(xiàn)的話,煩請(qǐng)指出,謝謝> <)