csci561 期末復(fù)習(xí)

1.UCS DFS BFS A* search

2.Game Minimax, αβ pruning

3.CSP

4.FOL resolution proof 將結(jié)果取反,和原有條件搞出空集

5.Inference in FOL

  • forward chaining 由已知條件modus poneus和and introduction 得到最后結(jié)果
  • backward chaining 從結(jié)果出發(fā)進(jìn)行替換得到所有結(jié)果,要畫(huà)圖的

6.CNF

7.Planing

  • Partial Order Plan

8.Neural Network 給一個(gè)網(wǎng)絡(luò)看輸出是什么或者設(shè)計(jì)

9.Naive Bayes

  • 給一個(gè)情景,算概率
  • 畫(huà)Bayesian Network

10.Decision Tree

  • 分類
  • 算information Gain
image.png
image.png

11.Markov Decision Processes

  • 箭頭是Reward,每個(gè)格子里的是Untility U(s) = R(s)+??maxa∑s1(P(s1|s,a)U(s1))
  • 把格子填滿后,各個(gè)方向就是Q值,Q值的計(jì)算:
    如果計(jì)算完U值要計(jì)算Q值,就是用下面的式子:
    有了策略π和立即回報(bào)函數(shù)r(s,a), Qπ(s,a)如何得到的呢?
    對(duì)s11計(jì)算Q函數(shù)(用到了上面Vπ的結(jié)果)如下:
    Qπ(s11,ar)=r(s11,ar)+ γ Vπ(s12) =0+0.9100 = 90
    Qπ(s11,ad)=r(s11,ad)+ γ *Vπ(s21) = 72

Q值怎么計(jì)算:Q(E,3,2)那就是MaxQ(4,2)=U(4,2) 既是相應(yīng)方向相鄰格子的U(也是maxQ)

  • 增強(qiáng)式學(xué)習(xí)要注意 第一次不改值,只是找到terminal在哪里
  • 這個(gè)是增強(qiáng)式學(xué)習(xí)的時(shí)候的式子,一般會(huì)給怎么行動(dòng)的,Q(s,a)← Q(s,a) + ?(R(s)+?? maxa’Q(s’,a’)?Q(s,a))

γ越大,小鳥(niǎo)就會(huì)越重視以往經(jīng)驗(yàn),越小,小鳥(niǎo)只重視眼前利益(R)
α學(xué)習(xí)速率(learning rate),γ折扣因子(discount factor)。根據(jù)公式可以看出,學(xué)習(xí)速率α越大,保留之前訓(xùn)練的效果就越少。折扣因子γ越大,

max_aQ(S', a)
所起到的作用就越大。
小鳥(niǎo)在對(duì)狀態(tài)進(jìn)行更新時(shí),會(huì)考慮到眼前利益(R),和記憶中的利益
max_aQ(S', a)
)。

image.png

12.Decision Networks

  • Compute expected utility (EU)
  • EU(AT∧?SB) = P(Acc|AT∧?SB)·U(Acc∧?SB) +P(?Acc|AT∧?SB)·U(?Acc∧?SB)
    隨機(jī)事件在兩個(gè)選擇下的概率乘以Utility
image.png

13.Choose 2 homework3 projects, each one about a different dataset

Describe how each project relates to search, knowledge representation, reasoning about uncertainty, learning
Compare and contrast the two projects, describing limitations and strengths

14.Expected Untility

image.png

a 是action ,s'是a這個(gè)動(dòng)作導(dǎo)致的結(jié)果,e是已經(jīng)發(fā)生的事情 比如 J,M

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 背景 一年多以前我在知乎上答了有關(guān)LeetCode的問(wèn)題, 分享了一些自己做題目的經(jīng)驗(yàn)。 張土汪:刷leetcod...
    土汪閱讀 12,890評(píng)論 0 33
  • Neil Zhu,簡(jiǎn)書(shū)ID Not_GOD,University AI 創(chuàng)始人 & Chief Scientist...
    朱小虎XiaohuZhu閱讀 12,311評(píng)論 7 17
  • 這天下午,我和閨蜜琪琪約好了午飯。因?yàn)轳R上要開(kāi)學(xué)了,所以我們將要又有好長(zhǎng)的時(shí)間見(jiàn)不到面了。舍不得,才要認(rèn)認(rèn)真真的多...
    阿俊xi閱讀 164評(píng)論 0 0
  • 感賞我今天早起去爬山,雖然雨很大,可是我還是找到了一處鍛煉的地方,感賞我今天又完成了一萬(wàn)步的計(jì)劃,并捐了步數(shù),感賞...
    畫(huà)中人11閱讀 235評(píng)論 3 1
  • 第一章 什么是社會(huì)心理學(xué) “事物是發(fā)展變化的” “盡管事物在變化,但我們不要以為所有的變化都是向著人道主義的方向發(fā)...
    小龍脫口秀閱讀 1,209評(píng)論 0 6

友情鏈接更多精彩內(nèi)容