菜单 学习猿地 - LMONKEY

VIP

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练!告别无效练习

接私单赚外块

VIP优先接,累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

入驻
144
0

【转载】 gym atari游戏的环境设置问题:Breakout-v0, Breakout-v4, BreakoutNoFrameskip-v4和BreakoutDeterministic-v4的区别

原创
05/13 14:22
阅读数 62568


版权声明:本文为CSDN博主「ok_kakaka」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/clksjx/article/details/104053216

 

 

===============================================

 

 

如题:

  1. 首先是v0和v4的区别:带有v0的env表示会有25%的概率执行上一个action,而v4表示只执行agent给出的action,不会重复之前的action。
  2. 带有Deterministic的env表示固定跳4帧,否则跳帧数随机从(2, 5)    (2, 4)中采样。
  3. 带有NoFrameskip的env表示没有跳帧。

 

参考链接
https://github.com/openai/gym/issues/1280

 

 

 

==============================================

 

发表评论

0/200
144 点赞
0 评论
收藏