2020-02-24|2020-02-24 强化学习
1.马尔可夫决策过程
2.免模型的强化学习model free
a.Monte carlo「First visit」,「Ever visit」
b.TD-learning
C.Q-learning
D.Sarsa
【2020-02-24|2020-02-24 强化学习】E.DQN algorithm
文章图片
推荐阅读
- 由浅入深理解AOP
- 继续努力,自主学习家庭Day135(20181015)
- python学习之|python学习之 实现QQ自动发送消息
- 一起来学习C语言的字符串转换函数
- 定制一套英文学习方案
- 漫画初学者如何学习漫画背景的透视画法(这篇教程请收藏好了!)
- 《深度倾听》第5天──「RIA学习力」便签输出第16期
- 如何更好的去学习
- 【韩语学习】(韩语随堂笔记整理)
- 焦点学习田源分享第267天《来访》