機(jī)器學(xué)習(xí)中的random_state參數(shù)

原因:為什么需要用到這樣一個(gè)參數(shù)random_state(隨機(jī)狀態(tài))?

在此先簡(jiǎn)單羅列三種情況:

1、在構(gòu)建模型時(shí):

forest = RandomForestClassifier(n_estimators=100, random_state=0)

forest.fit(X_train, y_train)

2、在生成數(shù)據(jù)集時(shí):

X, y = make_moons(n_samples=100, noise=0.25, random_state=3)

3、在拆分?jǐn)?shù)據(jù)集為訓(xùn)練集、測(cè)試集時(shí):

X_train, X_test, y_train, y_test = train_test_split(

cancer.data, cancer.target, stratify=cancer.target, random_state=42)

如果不設(shè)置random_state的話會(huì)怎樣?

例如1中,每次構(gòu)建的模型是不同的。

例如2中,每次生成的數(shù)據(jù)集是不同的。

例如3中,每次拆分出的訓(xùn)練集、測(cè)試集是不同的。

之所以會(huì)這樣,是因?yàn)槟P偷臉?gòu)建、數(shù)據(jù)集的生成、數(shù)據(jù)集的拆分都是一個(gè)隨機(jī)的過(guò)程。

作用:控制隨機(jī)狀態(tài)。

random_state 它按一定的規(guī)則去取出我們的數(shù)據(jù)

原文鏈接:https://blog.csdn.net/ytomc/article/details/113437926

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容