機器學習讀書筆記

番茄又名西紅柿,是一種可以多吃有益健康的蔬菜
撰寫機器學習讀書筆記,總結自己系統(tǒng)學習sklearn的經驗,將整個學習過程寫成讀書筆記的形式分享給大家,共同進步。
根據學進度,近期將整理自己的筆記,撰寫系列文章,并同時發(fā)布Jupyter Notebook文件和Python腳本文件https://gitee.com/zengqs/slkern-notebook.git。
內容組織
基礎部分
工具篇
- 使用環(huán)境及庫
概念篇
- 使用pandas分析、清洗數據
- 一個機器學習系統(tǒng)的小案例
基本算法
介紹sklearn的基本算法
- 分類(Classification )
- 回歸(Regression)
- 聚類(Clustering )
- 降維(Dimensionality reduction)
- 模型選擇(Model Selection)
- 數據預處理(Preprocessing )
高級主題
- 管道
- 交叉驗證
- 網格搜索
- 圖像特征提取應用項目實戰(zhàn)
論文撰寫技巧
分享論文發(fā)表中需要用到的技巧
- 比較實驗環(huán)境的建立
- 圖表的繪制
公開數據集
所有數據集合提供本地版本,保存到Git托管服務器,方便下載測試
- IRIS
參考資料
- Hands-On Machine Learning with Scikit-Learn and TensorFlow
- Python 語言構建機器學習系統(tǒng) 第2版(影印版)
- Python數據挖掘入門與實踐
- scikit learn機器學習:常用算法原理及編程實戰(zhàn)
- Python機器學習及實踐:從零開始通往Kaggle競賽之路
- Python大戰(zhàn)機器學習:數據科學家的第一個小目標