93
diaporamaMiscDM
◃
Ch. 6 App par renforcement
▹
Etude de Cas
Apprentissage d'un robot mobile à atteindre une destination de façon optimale.
On considère un robot se déplaçant dans une pièce de 12 cases (3 lignes de 4 colonnes) associé au tableau de renforcement suivant :
1
2
*
3
4
*
5
6
7
8
9
0
a\s
1
2
3
4
5
6
7
8
9
0
N
-1
+1
-1
+1
+1
E
-1
+1
+1
+1
+1
S
+1
-1
+1
-1
-1
O
+1
-1
-1
-1
-1