问答

当前位置

关于ai 课里rl project atari 的问他

  • Ta: 衡助教

reinforcement learning 里的proj 是一个小游戏叫atari
环境已配置好,现在我在跑程序,界面在updata target network 里
每10000次step 会更新一下。
在dqn.py文件里, if is_terminal or (max_episode_length is not None and t > max_episode_length): 是靠满足这个条件去 break的
我已经update到600000 steps了,想请问什么时候结束这个update,还是我要改参数才能结束?

0 个回复

我来回答

您没有权限

为提高问答质量,问答版块发言权限只向九章学员开放

登录 注册

© Jiu Zhang 2013-. All rights reserved. 京ICP备16004690号-1