1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听; 2、培训结束后,授课老师留给学员联系方式,保障培训效果,免费提供课后技术支持。 3、培训合格学员可享受免费推荐就业机会。☆合格学员免费颁发相关工程师等资格证书,提升职业资质。专注高端技术培训15年,端海学员的能力得到大家的认同,受到用人单位的广泛赞誉,端海的证书受到广泛认可。 |
Gym是为测试和开发RL算法而设计的环境/任务的集合。它让用户不必再创建复杂的环境。Gym用Python编写,它有很多的环境,比如机器人模拟或Atari 游戏。它还提供了一个在线排行榜,供人们比较结果和代码。
第1章 强化学习与常用的仿真环境平台介绍(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2等)
第2章 OpenAI gym中的常用仿真环境介绍,包括Atari 2600 游戏系列、MuJoCo 物理模拟器、Toy text 文本环境、Robotics机械手与机械臂模拟器等
第3章 马尔科夫决策过程MDP
第4章 基于gym的MDP实例讲解,基于OpenAI Gym构建股票市场交易环境
第5章 基于gym的强化学习实践:基于值函数的强化学习方法实现;基于策略梯度的强化学习方法实现
第6章 虚拟环境Universe: 一个用于训练解决通用问题 AI 的基础架构
第7章 基于Universe的强化学习实践:用OpenAI公司的Gym工具库和Universe平台为游戏创建人工智能机器人 |