20170525 周四 pandas

code: pandas入門與時間序列分析.ipynb

  1. 完成 http://www.icourse163.org/learn/BIT-1001870002?tid=1001963001#/learn/examlist
    上的考試

體會: pandas 的相關(guān)用法是在是太多了!隨用隨查:
參考中文網(wǎng)站:
https://zhuanlan.zhihu.com/p/25630700
http://www.th7.cn/Program/Python/201412/329841.shtml
http://www.cnblogs.com/zuizui1204/p/6423069.html
和下載的 pandas-cheat-sheet

  1. 趁熱打鐵,學(xué)習(xí) pandas:
    https://yq.aliyun.com/articles/81469

dataframe 可以直接用 df.plot() 作圖,然后 plt.show() 顯示

聚合: 往往根據(jù)索引 index 來 groupby, 可以根據(jù)日期,也可以根據(jù)周; 比如這里的index已經(jīng)是 to_datatime 得到的;
df.groupby(df.index.week).counts() 或 means()
df.index.date

意思就是:對這張含時的二維數(shù)據(jù)表中的信息進(jìn)行處理,先按天或周聚合,得到的對象自然可以計(jì)數(shù)或求其平均值


  1. http://www.julyedu.com/video/play/66/614
    kaggle實(shí)戰(zhàn)

模型融合:
1.bagging 解決過擬合
如: 1:10的正負(fù)樣本,可以將負(fù)樣本分為10份,每份和正樣本訓(xùn)練得出一個分類器/回歸器,

1.JPG

使用 sklearn.ensemble.BaggingClassifier
隨機(jī)森林是其中的一種。

Adaboost 調(diào)樣本的權(quán)重

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容