2020-02-24|2020-02-24 强化学习

1.马尔可夫决策过程
2.免模型的强化学习model free

a.Monte carlo「First visit」,「Ever visit」
b.TD-learning
C.Q-learning
D.Sarsa
【2020-02-24|2020-02-24 强化学习】E.DQN algorithm
2020-02-24|2020-02-24 强化学习
文章图片

    推荐阅读