86
diaporamaMiscDM
◃
Ch. 6 App par renforcement
▹
Apprentissage Pénalité - Récompense
Précurseur du renforcement
Utilisé pour la marche d'un robot héxapode (85)
Utilité : chute=-1, marche=+1, autre=0
Couplé à un perceptron pour rétropropagation