强化学习7日打卡营学习总结和心得笔记

【强化学习7日打卡营学习总结和心得】七天打卡，六次作业，五次直播，完整的参与了百度推出的强化学习7日打卡营。
课程收获
在科科老师的讲解下，了解到了强化学习的应用，

文章图片

了解到了基于价值的方法（saras，Q-learning）和基于策略的方法（REINFORCE算法）,还有应用在连续动作空间的算法（DDPG）。其中DDPG算法和REINFORCE算法还需要多看看起数学原理。

强化学习个人感悟
强化学习就像是在不断的与环境进行交互通过奖惩机制然后选取收获最大的动作作为经验，当然面对未知邻域时不可能总凭过去的经验，这就有了在训练时随机选取一些未定的动作去与环境进行交互。

强化学习7日打卡营学习总结和心得

推荐阅读

大衬衣怎么搭配让人眼前一亮

玻璃胶如何使用？玻璃胶如何使用?

橙子是什么季节的水果怎么挑选橙子

华为手机忘记锁屏密码怎么办

如何快速升级公益服务器？公益服务器怎么升级最快

苹果动图如何保存苹果怎么保存贴吧动图

志高空调无法开机该怎么解决?,基本上用这几种方法

国庆节购车指南 2020国庆节买车优惠力度大吗

立式空调怎么消毒

华为S7703交换机,一个镜像口如何对应多个观察口？华为S7703的介绍

灵芝孢子粉怎么吃

linux的echo命令 linux中echo命令的用法

李白的《清平调》是李白最有意境的诗吗？

最新版excel怎么制作迷你图 excel2016怎么添加迷你图

湖北荆州一周天气预报_湖北荆州天气查询

新款混动汉兰达报价及图片新款汉兰达混动版落地多少钱

驱动桥类型驱动桥类型有哪几种

文明6全面开战神级难度教学全面开战怎么玩

玩咖女是什么意思

android中shape 的使用