誤差與評(píng)估方法

機(jī)器學(xué)習(xí)誤差:

? ? 訓(xùn)練誤差或者經(jīng)驗(yàn)誤差:學(xué)習(xí)器在訓(xùn)練集上的誤差

? ? 泛化誤差:在新樣本上的誤差


評(píng)估方法:

? ? 留出法:直接將數(shù)據(jù)集分為互斥的集合,一個(gè)作為訓(xùn)練集一個(gè)作為測試集。

? ? ? ? ①訓(xùn)練和測試集的劃分要盡可能保持?jǐn)?shù)據(jù)分布的一致性

? ? ? ? ②單次使用留出法得到的估計(jì)結(jié)果往往不夠穩(wěn)定可靠

? ? 交叉驗(yàn)證法(k折交叉驗(yàn)證):將數(shù)據(jù)集劃分為k個(gè)大小相似的互斥子集,每個(gè)子集都盡可能保持?jǐn)?shù)據(jù)分布一致性,然后每次用k-1個(gè)子集的并集作為訓(xùn)練集,余下的那個(gè)子集作為測試集,進(jìn)行k次訓(xùn)練和測試。

????????①與留出法相似,存在多種劃分方式,通常需要隨機(jī)使用不同的劃分重復(fù)p次求均值

? ? 留一法:若樣本m個(gè),劃分k=m次,則得到了交叉驗(yàn)證法的一個(gè)特例。

????????①留一法訓(xùn)練出的模型和整個(gè)數(shù)據(jù)集訓(xùn)練出來的模型很相似,評(píng)估結(jié)果往往被認(rèn)為較準(zhǔn)確

? ? ? ? ②留一法開銷特別大

? ? 自助法:隨機(jī)從數(shù)據(jù)集D中采樣m次(重復(fù)采樣),得到m個(gè)數(shù)據(jù)的數(shù)據(jù)集作為訓(xùn)練集,剩下的作為測試集

? ? ? ? ①減少訓(xùn)練樣本規(guī)模不同造成的影響,同時(shí)還能比較高效地進(jìn)行實(shí)驗(yàn)估計(jì)(why?)

? ? ? ? ②自助法在數(shù)據(jù)集較小、難以有效劃分訓(xùn)練和測試集時(shí)很有用

? ? ? ? ③自助法產(chǎn)生的數(shù)據(jù)集改變了初始數(shù)據(jù)集的分布,引入了估計(jì)偏差。在初始數(shù)據(jù)量足夠時(shí),留出法和交叉驗(yàn)證法更常用一些。? ? ? ??


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本篇是合集文章,主要供各位童鞋系統(tǒng)學(xué)習(xí)和日后復(fù)習(xí)使用。本篇是舊篇中的“如何直觀地理解過擬合與欠擬合的那些事”,“分...
    浩彬老撕閱讀 868評(píng)論 0 0
  • 模型評(píng)估與選擇 原理 《機(jī)器學(xué)習(xí)》周志華 2.1 經(jīng)驗(yàn)誤差與過擬合 通常我們把分類錯(cuò)誤的樣本數(shù)占樣本總數(shù)的比例稱為...
    hxiaom閱讀 559評(píng)論 0 1
  • 簡介 此章節(jié)介紹了對(duì)模型的評(píng)估方法,以及對(duì)兩個(gè)或多個(gè)模型進(jìn)行比較的方法。 概念 錯(cuò)誤率(error rate):如...
    mulanfly閱讀 3,442評(píng)論 0 2
  • 作者:hooly微信公眾號(hào):一口袋星光 目錄: 1.說明;2.概念;3.bias-variance trade-o...
    hooly閱讀 6,026評(píng)論 0 5
  • 那時(shí)候除了考試分?jǐn)?shù)還有去我空間踩踩啊,17歲內(nèi)心戲太多,掙扎也太多,高三黨你們還好嗎? 張安松 2007-7-31...
    張安松閱讀 296評(píng)論 0 2

友情鏈接更多精彩內(nèi)容