diaporamaMiscDM
 
◃  Ch. 6 App par renforcement  ▹
 

Etude de Cas

  • Apprentissage d'un robot mobile à atteindre une destination de façon optimale.
  • On considère un robot se déplaçant dans une pièce de 12 cases (3 lignes de 4 colonnes) associé au tableau de renforcement suivant :
    12*3
    4*56
    7890
    a\s1234567890
    N -1+1-1+1+1
    E -1+1+1+1+1
    S +1-1+1-1-1
    O +1-1-1-1-1