主要簡介機器學習算法
1.懂原理
通過簡單語言進行數(shù)學推導。
2.會用工具
用現(xiàn)成的包
3.掌握編程語言
4.會優(yōu)化
根據(jù)自己的需求制定定制性的算法。
機器學習的幾個基本概念
機器學習的性質
機器學習方法的三要素
經驗風險與結構風險
目標:
了解
1.概念
2.實質
3.損失函數(shù)
4.經驗風險與結構風險
機器學習的基本概念
機器學習方法流程
- 輸入數(shù)據(jù) raw data
- 特征工程 features
特征(屬性、字段)。有些數(shù)據(jù)需要修整。 - 模型訓練 models
- 模型部署 deploy in production
-
模型應用 prediction
機器學習方法流程.png
輸入空間與輸出空間
輸入空間:輸入的所有可能取值的集合。
輸出空間:輸出的所有可能取值的集合。
輸入空間和輸出空間可以是有限元素的集合,也可以是整個歐式空間。可以是連續(xù)值集合,也可以是離散值集合。可以是同一個空間,也可以是不同空間。
通常情況下,速出空間比輸入空間小。
特征空間
特征:即屬性。
特征向量:多個特征組成的集合。
特征空間:特征向量存在的空間稱作特征空間。
特征可以從連續(xù)型轉變成離散型。
- 特征空間中每一維都對應了一個特征
- 特征康健可以和輸入空間相同,也可以不同。
- 需要將實例從輸入空間映射到特征空間。
- 模型實際上是定義于特征空間之上的。
假設空間
輸入空間到輸出空間的映射的集合。
《統(tǒng)計學習方法》《機器學習》
針對每一種輸入,都能找到一個映射,對應了輸出空間中某個輸出。
建模的過程就是,在假設空間中尋找一種和當前提供的數(shù)據(jù)匹配度最高的假設。
