强化学习7日打卡营学习总结和心得
【强化学习7日打卡营学习总结和心得】七天打卡,六次作业,五次直播,完整的参与了百度推出的强化学习7日打卡营。
课程收获
在科科老师的讲解下,了解到了强化学习的应用,
文章图片
了解到了基于价值的方法(saras,Q-learning)和基于策略的方法(REINFORCE算法),还有应用在连续动作空间的算法(DDPG)。其中DDPG算法和REINFORCE算法还需要多看看起数学原理。
强化学习个人感悟
强化学习就像是在不断的与环境进行交互通过奖惩机制然后选取收获最大的动作作为经验,当然面对未知邻域时不可能总凭过去的经验,这就有了在训练时随机选取一些未定的动作去与环境进行交互。
推荐阅读
- 由浅入深理解AOP
- 继续努力,自主学习家庭Day135(20181015)
- python学习之|python学习之 实现QQ自动发送消息
- 一起来学习C语言的字符串转换函数
- (七)谈条件
- 定制一套英文学习方案
- 漫画初学者如何学习漫画背景的透视画法(这篇教程请收藏好了!)
- 《深度倾听》第5天──「RIA学习力」便签输出第16期
- 如何更好的去学习
- 【韩语学习】(韩语随堂笔记整理)