Etude de Cas

Apprentissage d'un robot mobile à atteindre une destination de façon optimale.
On considère un robot se déplaçant dans une pièce de 12 cases (3 lignes de 4 colonnes) associé au tableau de renforcement suivant :

1 2 * 3

4 * 5 6

7 8 9 0

a\s 1 2 3 4 5 6 7 8 9 0

N -1 +1 -1 +1 +1

E -1 +1 +1 +1 +1

S +1 -1 +1 -1 -1

O +1 -1 -1 -1 -1