openai-gymでランダムにpacmanを実行するための小さなプログラムを書きました。しかし、その行動は厄介なことに、if条件の下で実行されている文は1つだけです。ゲームはレンダリングされません(env.reset()が実行されていない可能性があるため)。一部の文はif条件で実行されず、一部は実行されません
import gym
episode = 0
#episode_reward = 0
#running_reward = None
env = gym.make("MsPacman-v0")
env.reset()
while True:
env.render()
action = env.action_space.sample()
#print (action)
_, __, done, ___ = env.step(action)
#print(reward)
#episode_reward += reward
if done:
print('Game over') #Why is this line not printed
episode = episode + 1 #Why is episode not getting updated
#running_reward = episode_reward if running_reward is None else running_reward * 0.99 + episode_reward * 0.01
#print('Episode %d, episode reward total was %f. running mean: %f' % (episode, episode_reward, running_reward))
print('Episode, ', episode) #Only this line is printed on screen
#episode_reward = 0
env.reset()
私はちょっと愚かな間違いをしたくないと思っています。
はい、まったく同じコードです。私はpython 2.7.13 –
[スクリーンショットにリンク](https://i.imgur.com/PqIQO0S.png)を使用しています。これがより信じられそうになることを願っています。 –
@PrabhatDoongarwalディレクトリ内に '.pyc'ファイルがいくつかある可能性はありますか?実際には以前のバージョンのスクリプトを実行していますか?代わりに、 '(Episode、 '0')'出力が 'env.action_space.sample()'か 'env.step(action)'のどちらかから来る可能性はありますか? – Paul