强化学习-学习笔记4|强化学习-学习笔记4 | Actor-Critic
RL中的价值学习和策略学习分别基于不同的思路完成对 agent 的自动控制,而actor-critic将两者结合在一起,策略网络扮演运动员的角色,价值网络扮演裁判的角色,分别训练,得到较为满意的结果。
推荐阅读
- java|基于SSM框架学习之Mybatis(一)详细步骤 附图
- spring|SSM框架学习——Spring事务
- 学习【鬼谷子】(抵巇)思想心得
- 笔记|idea2021创建maven web项目集成tomcat
- 学习|node.js项目打包
- react|react native学习笔记1——webstorm安装与配置
- macOS开发环境学习笔记
- 《非暴力沟通》学习会
- 计算机视觉|干货收藏!基于深度学习目标姿态估计的论文一览(2017-2020)
- 【机器学习】手写数字识别