python sklearn模型中random_state參數(shù)的意義

????????random_state 相當(dāng)于隨機(jī)數(shù)種子random.seed() 。random_state 與 random seed 作用是相同的。

隨機(jī)數(shù)種子代碼演示:在1-100中取10個(gè)隨機(jī)數(shù)

????????第一段和第二段代碼完全相同,都沒(méi)有設(shè)置 random seed。它每次取的結(jié)果就不同,它的隨機(jī)數(shù)種子與當(dāng)前系統(tǒng)時(shí)間有關(guān)。

????????第三段和第四段代碼設(shè)置了相同的 random seed(123),它們?nèi)〉碾S機(jī)數(shù)就完全相同,多運(yùn)行幾次也是這樣。

????????第五段和第六段代碼設(shè)置了 不同的random seed ,于是運(yùn)行取隨機(jī)數(shù)的結(jié)果也不同。

????????如果你在需要設(shè)置隨機(jī)數(shù)種子的地方都設(shè)置好,那么當(dāng)別人重新運(yùn)行你的代碼的時(shí)候就能得到完全一樣的結(jié)果,復(fù)現(xiàn)和你一樣的過(guò)程。

random_state參數(shù):

? ? ? ?例如:在sklearn可以隨機(jī)分割訓(xùn)練集和測(cè)試集(交叉驗(yàn)證),只需要在代碼中引入model_selection.train_test_split就可以了:

from sklearn import model_selection

x_train, x_test, y_train,y_test=model_selection.train_test_split(x,y,test_size=0.2,random_state=0)

????????這里的random_state就是為了保證程序每次運(yùn)行都分割一樣的訓(xùn)練集和測(cè)試集。否則,同樣的算法模型在不同的訓(xùn)練集和測(cè)試集上的效果不一樣。

????????當(dāng)你用sklearn分割完測(cè)試集和訓(xùn)練集,確定模型和初始參數(shù)以后,你會(huì)發(fā)現(xiàn)程序每運(yùn)行一次,都會(huì)得到不同的準(zhǔn)確率,無(wú)法調(diào)參。這個(gè)時(shí)候就是因?yàn)闆](méi)有加random_state。加上以后就可以調(diào)參了。

參考文獻(xiàn):sklearn中的random_state

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容