Escolar Documentos
Profissional Documentos
Cultura Documentos
Cet article dcrit une prolongation au renfort apprenant (RL), dans lequel un algorithme
standard de RL est augment avec un mcanisme pour une exprience de transfert acquise dans
un problme de nouveaux mais relatifs problmes. Dans cette approche, appele Progressive
RL, un agent acquiert l'exprience du fonctionnement dans un environnement simple par
l'exprimentation, et puis s'engage dans une priode d'introspection, l'o elle rationalise
l'exprience acquise et formule la connaissance symbolique dcrivant comment se comporter
dans cet environnement simple. En exprimentant plus tard dans un environnement plus
complexe mais plus relatif, il est guid par cette connaissance jusqu' ce qu'il acquire une
exprience directe. Un domaine d'essai avec 15 environnements de labyrinthe, disposs par ordre
de difficult, est dcrit. Une gamme des expriences dans ce domaine sont prsentes, cela
dmontrent l'avantage de RL progressif relativement une approche de base de RL dans laquelle
chaque puzzle est rsolu partir de zro. Les expriences analysent galement la connaissance
forme pendant l'introspection, illustrent comment la connaissance de domaine peut tre
incorpore, et prouvent que l'tude progressive de renfort peut tre employe pour rsoudre des
puzzles de complexe plus rapidement.