色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<noframes id="kioiw"><tbody id="kioiw"></tbody></noframes>

<dl id="kioiw"><dd id="kioiw"></dd></dl>

登錄注冊寫文章

機器學習第六章支持向量機學習筆記

機器學習第六章支持向量機學習筆記

1.如何為一個訓練集找到可以劃分不同類別樣本的劃分超平面

? ? ? ? 劃分超平面那可以通過一個線性方程來描述

? ? ? ? 使劃分超平面的劃分結(jié)果正確的訓練樣例稱為支持向量

? ? ? ? 兩個異類（超平面兩邊的）支持向量（訓練樣例）到超平面的距離之和為間隔

找到使訓練樣本具有最大間隔的劃分超平面，也就是找到滿足條件的參數(shù)w b，使間隔最大

2

訓練完成后只需保留支持向量（被正確劃分的向量）

對偶問題

3.如何處理非線性問題

1）高維映射

為了簡化高維映射后對偶問題的求解，我們構(gòu)造一個核函數(shù)

2）

為劃分超平面限定一個模型

X是多個不同屬性的值構(gòu)成的向量

W是為每個屬性賦予的權(quán)重值所構(gòu)成的向量

b為位移項，決定了超平面與原點之間的距離

所以這個超平面可擴展為

在能將訓練樣本分類正確的前提下找到對訓練樣本局部擾動容忍性(最魯棒)的超平面

我們需要運算一個條件極值

當這個超平面使各類訓練樣本集到它的距離之和最大時，該超平面作為閾值最合適，但為了使樣本被正確分類我們還需要一個約束條件。

樣本空間中任意點到超平面的距離可由平面內(nèi)點到直線的距離公式推廣而來

分母為向量w的模

我們?nèi)藶橐?guī)定被劃分為正類的標志值為1，負類為-1

所以兩個異類支持向量到超平面的距離和

被劃分正確的訓練樣本滿足

(一個訓練集線性可分）

當我們令

該目標超平面滿足條件

為了方便計算，等價于

（svm的基本型）

求解這個基本型可得到滿足條件的參數(shù)w和b，即正確且唯一的模型

二次規(guī)劃：目標函數(shù)二次項，限制條件一次項

而svm的基本型很明顯就是一個二次規(guī)劃問題，我們采用拉格朗日乘子法求解

因此我們可以得到關系式

把關系式代入原拉格朗日函數(shù)

因此求解原問題就變成了求解對偶問題

由于原問題有不等式約束，所以其對偶問題需要增加KKT條件

顯然，這個條件的解為

通用的二次規(guī)劃算法不夠高效，在這里我們

采用SMO：先固定兩個乘子之外的所有參數(shù)，然后求這兩個乘子上的極值.為什么是兩個而不是一個，因為我們之前計算出當原函數(shù)值最大時所有乘子和其對應標志值的乘積之和為0，所以如果每次選擇一個作為變量，則這個乘子可由其他已經(jīng)被固定的乘子導出。

如何選取這兩個參數(shù)

直觀來看，KKT 條件違背的程度越大，則變量更新后可能導致的目標函數(shù)值減幅越大.也就是逼近解的速度越快，

用約束條件

消去其中一個變量，得到一個關于ai的單變量二次規(guī)劃問題，求解得到ai aj

處理非線性問題

如果樣本空間非線性可分，則svm基本型的限制條件不成立

將樣本高維映射可使樣本在這個特征空間內(nèi)線性可分(降維打擊）

例如：

映射后的模型可表示為

例如：

而我們要找的超平面則也從二維變成五維

針對處理非線性問題改造svm基本型

同理可得其對偶問題

為了簡化運算，我們用核函數(shù)替換

核函數(shù):用一個函數(shù)通過低維的向量值直接計算出高維向量的內(nèi)積而不需要知道高維向量的具體形態(tài)

核函數(shù)使高維映射又變回低維運算

怎么確定核函數(shù)?

核函數(shù)成立的充要條件：

1.可替換

2.半正定

常用的核函數(shù)

由于在現(xiàn)實任務中往往很難確定合適的核函數(shù)使得訓練樣本在特征空間中線性可分;退一步說，

即使恰好找到了某個核函數(shù)使訓練集在特征空間中線性可分?也很難斷定這個貌似線性可分的結(jié)果不是由于過擬合所造成的

所以我們允許支持向量機在一些樣本上出錯.

這種不要求所有樣本被正確分類的向量機形式被稱為軟間隔，即不滿足約束

因此我們原來構(gòu)造的拉格朗日函數(shù)就不適用，但為了使優(yōu)化目標變?yōu)?在最大化間隔的同時，不滿足約束的樣本也要盡可能少，我們將原來的條件函數(shù)映射成一個損失函數(shù)，使其大小與不被正確分類的標志數(shù)量成正比

因此優(yōu)化目標可寫為

顯然，求解該函數(shù)需要綜合考慮間隔大，出錯少兩個條件，分別稱為結(jié)構(gòu)風險(間隔）和經(jīng)驗風險（誤差）

為了易求解，我們通常采用數(shù)學性質(zhì)更好的函數(shù)替代，稱為"替代損失"

被劃分錯誤的樣本距離超平面越遠損失函數(shù)的自變量z越小，1-z越大

這個約束條件由損失函數(shù)的定義推導而來

這同樣是一個二次規(guī)劃問題，同理可得到它的對偶問題及KKT條件

由KKT條件用同樣的方法可推出軟間隔支持向量機的最終模型僅與支持向量有關。

同樣用smo求解得到超平面

優(yōu)化目標由間隔大小和誤差程度構(gòu)成，可寫為更一般的形式

稱為正則化問題

支持向量回歸

假設我們能容忍 f(x) 與 y之間最多有一定的偏差，即僅當 f(x) 與 y 之間的差別絕對值大于 E 時才計算損失

用不敏感損失函數(shù)衡量損失程度，SVR 問題可形式化為

引入松弛變量

同樣用拉格朗日乘子法得到對偶問題和其KKT條件

由求偏導得到的關系式可將超平面擴展為

考慮上面提到的非線性可分情況下的特征映射形式，則表示為

I

）

核方法

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

機器學習第六章支持向量機學習筆記
基本概念劃分超平面：通過一個線性方程來分類訓練樣本支持向量：使劃分超平面的劃分結(jié)果正確的距離超平面最近的訓練樣...
69ae7603d0cc閱讀 1,780評論 0贊 0
統(tǒng)計學習方法之支持向量機
【概述】 SVM訓練分類器的方法是尋找到超平面，使正負樣本在超平面的兩側(cè)（分類正確性即“分得開”），且樣本到超平面...
sealaes閱讀 11,482評論 0贊 7

支持向量機
SVM支持向量機一、簡介支持向量機（support vector machines）是一種二分類模型，它的目的...
fallinmix閱讀 850評論 0贊 0
【機器學習】算法原理詳細推導與實現(xiàn)(四):支持向量機(上)
【機器學習】算法原理詳細推導與實現(xiàn)(四):支持向量機(上) 在之前的文章中，包括線性回歸和邏輯回歸，都是以線性分界...
TTyb閱讀 670評論 0贊 0
機器學習筆記
以西瓜書為主線，以其他書籍作為參考進行補充，例如《統(tǒng)計學習方法》，《PRML》等第一章緒論 1.2 基本術(shù)語 ...
danielAck閱讀 4,905評論 0贊 5

友情鏈接更多精彩內(nèi)容

贊1贊

贊賞

手機看全文

徐州市| 徐闻县| 宁明县| 翁牛特旗| 天门市| 安达市| 灯塔市| 九龙城区| 始兴县| 阳山县| 健康| 德兴市| 望谟县| 平陆县| 卢氏县| 马龙县| 阿瓦提县| 中方县| 安塞县| 微博| 永仁县| 紫云| 屯门区| 吉隆县| 那曲县| 澄江县| 徐闻县| 岳阳县| 福州市| 肇庆市| 太仓市| 昌平区| 宁南县| 昭通市| 东方市| 化德县| 南漳县| 双辽市| 汶川县| 海兴县| 宜黄县|

<abbr id="o6y8c"><tfoot id="o6y8c"></tfoot></abbr>

<fieldset id="o6y8c"></fieldset>

<button id="o6y8c"></button>