分析建模,日常問題整理(二十三)
2019.1.31~2019.2.18
- ceil()向上取整 math模塊函數(shù)
print(math.ceil(0.1))
- ceil()向上取整 math模塊函數(shù)
- echarts百度地圖不顯示圖像
一定要同時加載bmap.js和輸入正確的ak碼,ak碼在申請時要設定瀏覽器端還是服務器端。
- echarts百度地圖不顯示圖像
<script src="/static/js/bmap.js"></script>
<script src="http://api.map.baidu.com/api?v=2.0&ak=x7czkMIjCIPym3ouLKgecQ4f6kmEY0ZH"></script>
- pyecharts的line-橫軸類必須是字符串,如果是數(shù)值型,會顯示不出圖像的!
- 小樣本如何選擇模型
訓練求解的模型參數(shù)受樣本影響特別大,樣本變化一點點,參數(shù)解就跳到另一組解去了。總之,模型是不穩(wěn)定的。(正好遇到這個問題)
一是使用少量的穩(wěn)定的變量
二是等數(shù)據(jù)積累足夠了再做模型吧
- 小樣本如何選擇模型
AIC:尋找可以最好地解釋數(shù)據(jù)但包含最少自由參數(shù)的模型
AIC=2k+nln(SSR/n)最小
elastic net:彈性網(wǎng)絡是一種使用 L1,L2范數(shù)作為先驗正則項訓練的線性回歸模型.這種組合允許學習到一個只有少量參數(shù)是非零稀疏的模型,就像 Lasso一樣,但是它仍然保持一些像Ridge的正則性質。我們可利用 l1_ratio 參數(shù)控制L1和L2的凸組合。彈性網(wǎng)絡是一不斷疊代的方法。
scikit-learn

彈性網(wǎng)絡目標函數(shù).jpg
對損失函數(shù)(目標函數(shù))加入一個懲罰項,使得模型由多解變?yōu)楦鼉A向其中一個解。
在最小二乘法中,可以這樣理解。XTX可能是不可逆的,通過加上正則項,迫使弱的特征的系數(shù)縮減為0.
- 同時包含離散變量和連續(xù)變量的決策樹模型在Python中的實現(xiàn)。
R中可以同時處理,但是sklearn不行。
使用ID3(只能處理離散變量),修改腳本處理存在連續(xù)變量的模型。
cart只能同時處理離散變量和連續(xù)變量。如果同時包含離散變量和連續(xù)變量,需要把離散變量進行編碼或者啞變量轉換。
lgbm在訓練單棵樹時能夠同時處理離散和連續(xù)變量,(大多數(shù)機器學習算法都不支持類別特征)LightGBM優(yōu)化了對類別特征的支持,可以直接輸入類別特征,不需要額外的one-hot編碼展開?!镜莑gb.fit()時還是會報錯不能float(x)???】
- 同時包含離散變量和連續(xù)變量的決策樹模型在Python中的實現(xiàn)。
CTR特征是啥??
決策樹單獨用來做預估模型效果一般,但是有幾個用處
1)用來對連續(xù)變量選擇最優(yōu)分箱(這個可以嘗試一下)
2)用來選擇規(guī)則
3)提煉規(guī)則用來做衍生變量,使用衍生變量來做更精準的模型。