diaporamaMiscDM
 
◃  Ch. 6 App par renforcement  ▹
 

Autres algorithmes

  • Mahadevan et Connel (1991) utilise une distance de Hamming pour généraliser les similitudes.
  • Sutton propose l'architecture Dyna (1991) pour améliorer la mise à jour de la mémoire.
  • Implantation dès 1992 du Q-Learning dans les réseaux de neurones : Q-CON (Lin 93), Q-KOHON
  • ...
  • Processus Décisionnels Markoviens