OpenAI Gym是一款用于研发和比较强化学习算法的工具包,其中包括了各种环境,目前有模拟的机器人学任务、桌面游戏等计算任务。工具包中包含的环境将随时间不断增多,用户也会将他们自己创建的环境加入其中。这些环境都有一个通用交互界面,使用户能够编写可以应用于许多不同环境的通用算法。OpenAI Gym也有一个网站 [1] ,人们可以将他们在这些环境中的训练结果发布到网站上并分享他们的代码。这个网站的目的是让人们能简单地迭代并优化他们的强化学习算法,并对什么算法才是有效的算法有一个概念 [2] 。OpenAI Gym中包含一些经典的控制问题场景,比如独臂支撑(CartPole)、多连臂(Acrobot)和过山车(MountainCar),如图7-2所示。
图7-2 OpenAI Gym的经典控制问题场景
[1] https://gym.openai.com/envs/
[2] https://www.leiphone.com/news/201605/mgePHZcYq2KRyJ89.html