我現(xiàn)在每天都在琢磨新的菜譜,琢磨怎么樣才能把菜做的清淡營(yíng)養(yǎng)又好吃,自從開(kāi)始買菜,才發(fā)現(xiàn)原來(lái)自己做飯吃這樣省錢,以前常聽(tīng)人說(shuō),但不理解這個(gè)省錢的程度,所以沒(méi)感覺(jué),現(xiàn)在我知道了,...
我們要開(kāi)始一個(gè)新的篇章:抽象改變世界 為什么我要說(shuō)這個(gè)東西? 不是說(shuō)因?yàn)槲荫R上要引入圖表,引入數(shù)學(xué)然后我們來(lái)講這個(gè)東西,而是說(shuō)我們來(lái)還原一下,把一個(gè)事情還原到它不失掉他的特殊...
我要成為一個(gè)雷打不動(dòng)的人: 早晨六點(diǎn)半起床、晚上十一點(diǎn)半熄燈睡覺(jué)。 日常作息安排大致如下: 6:30 起床,看一看知乎小密圈里邊有沒(méi)有我能回答的問(wèn)題,沒(méi)有的話就刷一刷首頁(yè)能讓...
關(guān)于擬合模型后給出特征的重要性這塊。我最近用r做隨機(jī)森林,它的importance有一個(gè)參數(shù)type 1的時(shí)候是準(zhǔn)確度下降,2的時(shí)候是基尼下降,參數(shù)不一樣對(duì)特征的排序也很不同,你知不知道應(yīng)該怎么選擇?
另外看你文章里說(shuō)用隨機(jī)森林不用特征選擇,是說(shuō)可以把變量直接全放進(jìn)去嗎?還是別的意思?
隨機(jī)森林再?gòu)?fù)習(xí)這里只是準(zhǔn)備簡(jiǎn)單談?wù)劵A(chǔ)的內(nèi)容,主要參考一下別人的文章,對(duì)于隨機(jī)森林與GBDT,有兩個(gè)地方比較重要,首先是information gain,其次是決策樹(shù)。這里特別推薦Andr...
創(chuàng)建虛擬變量的這一段。
我看一些實(shí)例中,如果是一個(gè)二元的類別變量,就直接轉(zhuǎn)化成一個(gè)0/1的變量。創(chuàng)建兩個(gè)0/1變量(var_male;var_female)是必要的嗎?
數(shù)據(jù)探索(Data Exploration)完整指導(dǎo)-下翻譯/編輯/部分原創(chuàng) Vivian Ouyang 原作者:Sunil Ray 在機(jī)器學(xué)習(xí)中,很多時(shí)候你會(huì)掙扎于怎么提高模型的準(zhǔn)確率。在這種時(shí)刻,數(shù)據(jù)探索的一些方法將幫助你解決...
博主真是高產(chǎn)。。
數(shù)據(jù)探索(Data Exploration)完整指導(dǎo)-上翻譯/編輯/部分原創(chuàng)Vivian Ouyang 原作者:Sunil Ray 在機(jī)器學(xué)習(xí)中,很多時(shí)候你會(huì)掙扎于怎么提高模型的準(zhǔn)確率。在這種時(shí)刻,數(shù)據(jù)探索的一些方法將幫助你解決這...
翻譯/編輯/部分原創(chuàng)Vivian Ouyang 原作者:Sunil Ray 在機(jī)器學(xué)習(xí)中,很多時(shí)候你會(huì)掙扎于怎么提高模型的準(zhǔn)確率。在這種時(shí)刻,數(shù)據(jù)探索的一些方法將幫助你解決這...
最后這個(gè)Features_1是干嘛的。。?
機(jī)器學(xué)習(xí)算法介紹(附上R和Python程序)-第一期翻譯/編輯/原創(chuàng)Vivian Ouyang 這個(gè)介紹主要是方便剛?cè)胄械臄?shù)據(jù)科學(xué)家。通過(guò)這個(gè)指導(dǎo),使你直接解決機(jī)器學(xué)習(xí)的問(wèn)題以及從中獲得經(jīng)驗(yàn)。而且我會(huì)盡量用簡(jiǎn)單易懂的方式來(lái)介紹...