這篇不錯,將強(qiáng)化學(xué)習(xí)中的經(jīng)典算法基礎(chǔ)概念清晰地列出來,有論文中的定義,還有算法的偽代碼。
這篇文章匯總了 Medium 上面關(guān)于 RL 的一些不錯的文章,包括概覽,基礎(chǔ)概念,應(yīng)用,Q-learning 等每個小板塊有幾篇文章,比較系統(tǒng),角度全面的。

這篇文章可以作為入門強(qiáng)化學(xué)習(xí)的一個基礎(chǔ)閱讀,里面提到的這幾個問題我很喜歡,不過文章還是有點(diǎn)短了一些。
這一篇列舉了好多書籍,感覺就是太多了,其實(shí)是很少能有人看得過來的,目前覺得就把下面兩個看完,其他的就是在多多實(shí)踐中思考問題搜尋答案比較高效了。
- Sutton, R. S. and Barto, A. G. (2018). Reinforcement Learning: An Introduction* (2nd Edition)*. MIT Press.
- David Silver, Reinforcement Learning, 2015. Slides. Video.