向上取整/echart地圖不顯示/同時含離散和連續(xù)變量的決策樹

分析建模,日常問題整理(二十三)


2019.1.31~2019.2.18


    1. ceil()向上取整 math模塊函數(shù)
      print(math.ceil(0.1))
    1. echarts百度地圖不顯示圖像
      一定要同時加載bmap.js和輸入正確的ak碼,ak碼在申請時要設定瀏覽器端還是服務器端。
    <script src="/static/js/bmap.js"></script>
    <script src="http://api.map.baidu.com/api?v=2.0&ak=x7czkMIjCIPym3ouLKgecQ4f6kmEY0ZH"></script>
    1. pyecharts的line-橫軸類必須是字符串,如果是數(shù)值型,會顯示不出圖像的!
    1. 小樣本如何選擇模型
      訓練求解的模型參數(shù)受樣本影響特別大,樣本變化一點點,參數(shù)解就跳到另一組解去了。總之,模型是不穩(wěn)定的。(正好遇到這個問題)
      一是使用少量的穩(wěn)定的變量
      二是等數(shù)據(jù)積累足夠了再做模型吧

AIC:尋找可以最好地解釋數(shù)據(jù)但包含最少自由參數(shù)的模型
AIC=2k+nln(SSR/n)最小
elastic net:彈性網(wǎng)絡是一種使用 L1,L2范數(shù)作為先驗正則項訓練的線性回歸模型.這種組合允許學習到一個只有少量參數(shù)是非零稀疏的模型,就像 Lasso一樣,但是它仍然保持一些像Ridge的正則性質。我們可利用 l1_ratio 參數(shù)控制L1和L2的凸組合。彈性網(wǎng)絡是一不斷疊代的方法。
scikit-learn

彈性網(wǎng)絡目標函數(shù).jpg

對損失函數(shù)(目標函數(shù))加入一個懲罰項,使得模型由多解變?yōu)楦鼉A向其中一個解。
在最小二乘法中,可以這樣理解。XTX可能是不可逆的,通過加上正則項,迫使弱的特征的系數(shù)縮減為0.

    1. 同時包含離散變量和連續(xù)變量的決策樹模型在Python中的實現(xiàn)。
      R中可以同時處理,但是sklearn不行。
      使用ID3(只能處理離散變量),修改腳本處理存在連續(xù)變量的模型。
      cart只能同時處理離散變量和連續(xù)變量。如果同時包含離散變量和連續(xù)變量,需要把離散變量進行編碼或者啞變量轉換。
      lgbm在訓練單棵樹時能夠同時處理離散和連續(xù)變量,(大多數(shù)機器學習算法都不支持類別特征)LightGBM優(yōu)化了對類別特征的支持,可以直接輸入類別特征,不需要額外的one-hot編碼展開?!镜莑gb.fit()時還是會報錯不能float(x)???】

CTR特征是啥??
決策樹單獨用來做預估模型效果一般,但是有幾個用處
1)用來對連續(xù)變量選擇最優(yōu)分箱(這個可以嘗試一下)
2)用來選擇規(guī)則
3)提煉規(guī)則用來做衍生變量,使用衍生變量來做更精準的模型。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容