Optimisation d'un tuteur intelligent à partir d'un jeu de données fixé

Lucie Daubigney 1, 2 Matthieu Geist 2 Olivier Pietquin 2
1 MAIA - Autonomous intelligent machine
Inria Nancy - Grand Est, LORIA - AIS - Department of Complex Systems, Artificial Intelligence & Robotics
2 IMS - Equipe Information, Multimodalité et Signal
UMI2958 - Georgia Tech - CNRS [Metz], SUPELEC-Campus Metz
Résumé : Dans cet article, nous présentons une méthode générale pour optimiser un tuteur intelligent dans le domaine de l'acquisition d'une seconde langue. Plus particulièrement, le processus d'optimisation a pour but de trouver une stratégie qui propose la meilleure séquence de phases d'évaluation et d'enseignement afin de maximiser l'augmentation des connaissances de l'apprenant. La principale caractéristique de la méthode proposée est qu'elle est capable d'apprendre la meilleure stratégie à partir d'un jeu fixe de données, collectées à partir d'une stratégie définie à la main. Ainsi, aucun modèle, ni cognitif ni probabiliste de l'apprenant, n'est nécessaire. Seules sont requises des observations du comportement de l'apprenant alors qu'il interagit avec un système non-optimal. Pour ce faire, un algorithme de programmation dynamique approchée en mode hors-ligne est utilisé : l'algorithme LSPI (Least Square Policy Iteration). Des résultats obtenus avec des données simulées semblent prometteurs.
Document type :
Conference papers
Complete list of metadatas

https://hal-supelec.archives-ouvertes.fr/hal-00749498
Contributor : Sébastien van Luchene <>
Submitted on : Wednesday, November 7, 2012 - 4:11:45 PM
Last modification on : Wednesday, July 31, 2019 - 4:18:03 PM

Identifiers

  • HAL Id : hal-00749498, version 1

Citation

Lucie Daubigney, Matthieu Geist, Olivier Pietquin. Optimisation d'un tuteur intelligent à partir d'un jeu de données fixé. JEP 2012, Jun 2012, Grenoble, France. pp.241-248. ⟨hal-00749498⟩

Share

Metrics

Record views

377