web-dev-qa-db-fra.com

OpenAI Gym: Comprendre la notation `action_space` (espaces.Box)

Je veux configurer un RL sur l'environnement OpenAI CarRacing-v0, Mais avant cela, je veux comprendre l'espace d'action. Dans le code sur github la ligne 119 dit:

self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1]))  # steer, gas, brake

Comment lire cette ligne? Bien que mon problème soit concret par rapport à CarRacing-v0 Je voudrais comprendre la notation spaces.Box() en général

18
Toke Faurby

Box signifie que vous traitez avec des quantités réelles.

Le premier tableau np.array([-1,0,0] Sont les valeurs acceptées les plus basses, et le second np.array([+1,+1,+1]) sont les valeurs acceptées les plus élevées. Dans ce cas (en utilisant le commentaire), nous voyons que nous avons 3 actions disponibles:

  1. Direction: Valeur réelle en [-1, 1]
  2. Gaz: Valeur réelle en [0, 1]
  3. Frein: Valeur réelle en [0, 1]
25
Toke Faurby