diaporamaMiscDM
 
◃  Ch. 6 App par renforcement  ▹
 

Apprentissage Pénalité - Récompense

  • Précurseur du renforcement
  • Utilisé pour la marche d'un robot héxapode (85)
  • Utilité : chute=-1, marche=+1, autre=0
  • Couplé à un perceptron pour rétropropagation