https://classroom.udacity.com/courses/cs271/lessons/48688925/concepts/29449387610923
基本術(shù)語
- 完全可觀測(象棋)、部分可觀測(需要機(jī)器內(nèi)部記憶:紙牌)
- 確定性的(象棋)、隨機(jī)性的(骰子、紙牌)
- 離散(有限:象棋)、連續(xù)(無限:扔飛鏢)
- 良性(非抵抗你:天氣)、對抗性(象棋)
AI不確定性來源
- 傳感器限制
- 對抗者干擾
- 隨機(jī)性環(huán)境
- 計(jì)算機(jī)惰性
- 忽視
定義一個(gè)問題
- Initial state
- Actions (s) -> {a1, a2, a3...}
- Result (s, a) -> s'
- Goal test (s) -> T/F
- Path cost (s-a->s-a->s) -> n
Step cost (s, a, s') -> n

樹搜索
廣度優(yōu)先搜索(最短路徑搜索)
樹搜索所做的是狀態(tài)空間上的疊加

圖搜索

等代價(jià)搜索

三種遍歷算法

三種遍歷算的邊界

A*算法-貪婪算法和等代價(jià)算法的結(jié)合

A*算法

A*算法

A*算法對h函數(shù)的依賴

貝葉斯網(wǎng)絡(luò)

概率

概率

后驗(yàn)概率

貝葉斯規(guī)則

貝葉斯網(wǎng)絡(luò)

貝葉斯規(guī)則

貝葉斯網(wǎng)絡(luò)

條件獨(dú)立

條件概率

條件獨(dú)立

貝葉斯網(wǎng)絡(luò)的優(yōu)勢

效應(yīng)解釋

D隔離

公式


機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)