code: pandas入門與時間序列分析.ipynb
體會: pandas 的相關(guān)用法是在是太多了!隨用隨查:
參考中文網(wǎng)站:
https://zhuanlan.zhihu.com/p/25630700
http://www.th7.cn/Program/Python/201412/329841.shtml
http://www.cnblogs.com/zuizui1204/p/6423069.html
和下載的 pandas-cheat-sheet
- 趁熱打鐵,學(xué)習(xí) pandas:
https://yq.aliyun.com/articles/81469
dataframe 可以直接用 df.plot() 作圖,然后 plt.show() 顯示
聚合: 往往根據(jù)索引 index 來 groupby, 可以根據(jù)日期,也可以根據(jù)周; 比如這里的index已經(jīng)是 to_datatime 得到的;
df.groupby(df.index.week).counts() 或 means()
df.index.date
意思就是:對這張含時的二維數(shù)據(jù)表中的信息進(jìn)行處理,先按天或周聚合,得到的對象自然可以計(jì)數(shù)或求其平均值
-
http://www.julyedu.com/video/play/66/614
kaggle實(shí)戰(zhàn)
模型融合:
1.bagging 解決過擬合
如: 1:10的正負(fù)樣本,可以將負(fù)樣本分為10份,每份和正樣本訓(xùn)練得出一個分類器/回歸器,
1.JPG
使用 sklearn.ensemble.BaggingClassifier
隨機(jī)森林是其中的一種。
Adaboost 調(diào)樣本的權(quán)重