交叉驗(yàn)證與網(wǎng)格搜索
交叉驗(yàn)證與網(wǎng)格搜索是機(jī)器學(xué)習(xí)中的兩個(gè)非常重要且基本的概念,但是這兩個(gè)概念在剛?cè)腴T的時(shí)候并不是非常容易理解與掌握,自己開(kāi)始學(xué)習(xí)的時(shí)候,對(duì)這兩個(gè)概念理解的并不到位,現(xiàn)在寫一篇關(guān)于交叉驗(yàn)證與網(wǎng)格搜索的文章,將這兩個(gè)基本的概念做一下梳理。
網(wǎng)格搜索
網(wǎng)格搜索(Grid Search)名字非常大氣,但是用簡(jiǎn)答的話來(lái)說(shuō)就是你手動(dòng)的給出一個(gè)模型中你想要改動(dòng)的所用的參數(shù),程序自動(dòng)的幫你使用窮舉法來(lái)將所用的參數(shù)都運(yùn)行一遍。決策樹中我們常常將最大樹深作為需要調(diào)節(jié)的參數(shù);AdaBoost中將弱分類器的數(shù)量作為需要調(diào)節(jié)的參數(shù)。
評(píng)分方法
為了確定搜索參數(shù),也就是手動(dòng)設(shè)定的調(diào)節(jié)的變量的值中,那個(gè)是最好的,這時(shí)就需要使用一個(gè)比較理想的評(píng)分方式(這個(gè)評(píng)分方式是根據(jù)實(shí)際情況來(lái)確定的可能是accuracy、f1-score、f-beta、pricise、recall等)
交叉驗(yàn)證
有了好的評(píng)分方式,但是只用一次的結(jié)果就能說(shuō)明某組的參數(shù)組合比另外的參數(shù)組合好嗎?這顯然是不嚴(yán)謹(jǐn)?shù)模闲W(xué)的時(shí)候老師就告訴我們要求平均??。所以就有了交叉驗(yàn)證這一概念。下面以K折交叉驗(yàn)證為例介紹這一概念。
————————————————
原文鏈接:https://blog.csdn.net/sinat_32547403/article/details/73008127