基于模型的反射型智能體

處理部分可觀測性的最有效方法是讓智能體追蹤它現(xiàn)在觀測不到的部分世界。也就說說,智能體應(yīng)該維護(hù)某種依賴于感知歷史的內(nèi)部狀態(tài),從而至少反映當(dāng)前狀態(tài)的一些未觀測到的方面。對于剎車問題,內(nèi)部狀態(tài)范圍不僅限于攝像頭拍攝圖像的前一幀,要讓智能體能夠檢測車輛邊緣的兩個紅燈何時同時亮起或者熄滅。對于其他駕駛?cè)蝿?wù),如變道,如果智能體無法同時看到其他車輛,則需要追蹤他們的位置。為了在任何時候都能駕駛,智能體需要追蹤其鑰匙的位置。
隨著時間的推移,更新這些內(nèi)部狀態(tài)信息需要在智能體程序中以某種形式編碼兩種知識。首先,需要一些關(guān)于世界如何隨時間變化的信息,這些信息大致可以分為兩部分:智能體行為的影響和世界如何獨立于智能體而發(fā)展。例如,當(dāng)智能體順時針轉(zhuǎn)動方向盤時,汽車就會向右轉(zhuǎn);而下雨時,汽車的攝像頭就會被淋濕。這種關(guān)于“世界如何運(yùn)轉(zhuǎn)”的知識被稱為轉(zhuǎn)移模型。
其次,我們需要一些關(guān)于世界狀態(tài)如何反應(yīng)在智能體感知中的信息。例如,當(dāng)前面的汽車開始剎車時,前向攝像頭的圖像中會出現(xiàn)一個或多個亮起的紅色區(qū)域;當(dāng)攝像頭被淋濕時,圖像中會出現(xiàn)水滴狀物體并部分遮擋道路。這種知識稱為傳感器模型
轉(zhuǎn)移模型和感知模型結(jié)合在一起讓智能體能夠在傳感器受限的情況下盡可能的跟蹤世界的狀態(tài)。使用此類模型的智能體稱為基于模型的智能體

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容