Je veux configurer un RL sur l'environnement OpenAI CarRacing-v0
, Mais avant cela, je veux comprendre l'espace d'action. Dans le code sur github la ligne 119 dit:
self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1])) # steer, gas, brake
Comment lire cette ligne? Bien que mon problème soit concret par rapport à CarRacing-v0
Je voudrais comprendre la notation spaces.Box()
en général
Box
signifie que vous traitez avec des quantités réelles.
Le premier tableau np.array([-1,0,0]
Sont les valeurs acceptées les plus basses, et le second np.array([+1,+1,+1])
sont les valeurs acceptées les plus élevées. Dans ce cas (en utilisant le commentaire), nous voyons que nous avons 3 actions disponibles:
[-1, 1]
[0, 1]
[0, 1]