Sébastien L'haire - Staf 11 - 12 septembre 1999

Fiche de lecture

WENGERS, E. (1987). Artificial Intelligence and Tutoring Systems: computational and cognitive approaches to the communication of knowledge. Los Altos (CA): Morgan Kaufmann Publishers.
Ch. 12: GUIDON: the epistemology of an expert system

En guise d'introduction, Wengers voit comme avantage d'utiliser des systèmes experts le fait qu'ils utilisent une connaissance procédurale. Les connaissances en elles-mêmes, sous forme de règles de production, sont séparée du moteur qui les utilise et les interprète. La connaissance est ainsi plus fine, en petites unités indépendantes. Le système peut aussi justifier ses choix et indiquer pourquoi il demande des informations supplémentaires à l'utilisateur. Dans ce cadre, il procède à l'examen de MYCIN.

MYCIN

Mycin est un des premiers et des mieux connus des systèmes experts. Développé à Stanford dans les années soixante-dix, il servait de système expert de consultation pour le diagnostic d'infections bactériennes. Le public cible était des étudiants en médecine.

L'architecture indépendante du domaine de MYCIN a donné lieu à un projet d'extension vers un système générique appelé EMYCIN, qui devait reprendre son moteur de raisonnement. EMYCIN a été testé dans des domaines variés. C'est ainsi que le chercheur William Clancey, dans le cadre de sa thèse de doctorat, a entrepris la création d'un système de tutoriel basé sur MYCIN. Les trois phases du projet étaient nommées GUIDON, NEOMYCIN et GUIDON2. Les résultats obtenus étaient inattendus et ont donné lieu à des découvertes importantes pour la construction de systèmes experts.

Même si un système expert a de bonnes capacités d'explications, il ne peut justifier ses actions que passivement. Il fallait donc ajouter des caractéristiques permettant de présenter les connaissances activement; ceci impliquait de sélectionner du matériel, de réagir face à l'apprenant et de mener une interaction efficace.

GUIDON

Le système GUIDON a pour buts d'évaluer l'utilisation pédagogique de la base de connaissances de MYCIN, de découvrir les connaissances supplémentaires que devrait avoir un système de tutoriel, et d'élaborer des stratégies d'enseignement indépendantes du domaine. Le tutoriel est basé sur l'apprentissage par cas, avec des problèmes concrets à résoudre. Le but de GUIDON est de guider le raisonnement de l'apprenant. Il dispose d'environ 450 règles qui peuvent être présentées comme exemples concrets quand ils sont adéquats pour le problème à résoudre. Cependant, il n'y a pas d'explication sur la manière dont la combinaison des symptômes et des faits entre eux amène au diagnostic. Les différents diagnostics possibles sont cotés par un facteur de certitude (certainity factor).

GUIDON propose un cas à l'apprenant et fournit une description. Puis l'apprenant doit poser des questions pour réunir les données importantes et proposer des hypothèses. Son comportement est comparé avec les connaissances du système expert, qui intervient si l'apprenant a besoin d'aide ou agit de manière non optimale. Le système "comprend" des phrases simples ou répond à quelques commandes frappées au clavier. Ses réponses sont construites à partir de phrases primitives stockées dans le système. GUIDON garde également un historique pour répondre de manière adéquate selon le contexte.

Le système de GUIDON sépare complètement les connaissances liées au domaine des connaissances pédagogiques. Cette modularité du système permet un grand degré de généralité. On peut aussi expérimenter différentes stratégies.

MYCIN utilisait une stratégie descendante: en partant des hypothèses et des diagnostics possibles, puis en utilisant différents sous-buts pour arriver aux indices disponibles. Les sous-buts peuvent être remplis par la conclusion d'autres buts ou par des questions à l'apprenant. MYCIN fournit à GUIDON non seulement les conclusions mais encore l'arbre de décisions contenant toutes ses inférences. Ainsi, GUIDON peut conduire le dialogue et voit à quels points il a besoin de poser des questions pour demander davantage d'informations. Le système voit aussi sur quelles caractéristiques il doit attirer l'attention de l'apprenant. Mais GUIDON a aussi besoin d'annotations, comme des textes emboîtés pour justifier les inférences ou des pointeurs vers des périodiques médicaux. Ces caractéristiques ont dû être attachées aux règles de MYCIN. Le système doit encore disposer de métaconnaissances sur les règles elles-mêmes et sur la façon dont elles sont représentées, de sorte qu'il puisse construire un raisonnement.

Le module tuteur de GUIDON est également basé sur des structures de règles. Il est générique et ne dépend pas de faits spécifiques au domaine de MYCIN, bien qu'il connaisse sa forme de représentation des connaissances. Le module tuteur est un petit système expert de 200 règles environ. Il doit gérer une interaction de tutoriel basée sur l'approche par cas. Il se réfère à une base de communication qui contient 3 parties:

Les règles du module tuteur permettent de conduire le dialogue et de mettre à jour le modèle de communication. Il aide à trouver des sous-buts. Il doit surtout aider l'apprenant à comprendre comment ses hypothèses s'adaptent avec l'information qu'il a à disposition. Pour cela, il doit voir quels faits ont amené l'apprenant à proposer telle hypothèse, et quel indice il a négligé qui aurait dû l'amener à rejeter son hypothèse.

GUIDON montre qu'il est possible d'implémenter un tutoriel dont la stratégie d'enseignement est basée sur le même système de représentation de règles que le domaine d'expertise. Mais le transfert d'une telle technique à d'autres domaines a été plutôt décevant du point de vue pédagogique, vu la diversité des connaissances. De plus, si l'apprenant suivait une stratégie valable mais différente de l'approche top-down de GUIDON, le système rejetait des hypothèses valables. En outre, il était difficile de mémoriser les règles.

NEOMYCIN

Les tares constatées ont conduit Clancey et son équipe à concevoir un autre système plus proche de la manière humaine d'établir un diagnostique, NEOMYCIN. Il a fallu trouver un système pour décompiler les règles et rendre visible la connaissance sous-jacente. L'examen des stratégies d'enseignement d'un bon professeur a montré qu'il demandait aux étudiants de justifier pourquoi les réponses à une question ou l'examen de données permettait de restreindre son ensemble d'hypothèses de départ. Dès lors, la nouveauté de NEOMYCIN est la séparation des connaissances sur la stratégie à adopter des règles et des faits propres au domaine. Au lieu d'aller en arrière des buts spécifiques vers les données, le système utilise des méta-connaissances, indépendantes du domaine, sur la stratégie de raisonnement pour un diagnostique médical. Ces règles permettent de gérer les hypothèses, en les groupant ou en les affinant. NEOMYCIN permet de couvrir davantage de maladies dont les symptômes peuvent être confondus. Des questions et des connaissances générales sont désormais regroupées. Si l'alcoolisme peut être une cause de maladies, le système éliminera l'hypothèse si le patient est un enfant. Auparavant, pour chaque maladie liée à l'alcoolisme, l'âge du patient constituait une règle supplémentaire. La nouvelle stratégie est donc beaucoup plus efficace, beaucoup plus proche du raisonnement humain et permet d'utiliser la connaissance du monde des apprenants.

HERACLES

Clancey voulait également faire un système indépendant du domaine, pour tous les types de résolution de problème. C'est ainsi qu'est né HERACLES, un système général de classification d'heuristiques. Le but de ce type de système est de classifier un cas dans une taxonomie prédéfinie en tenant compte des données. Ce qui revient à trouver une maladie ou des dysfonctionnements à partir de symptômes.

IMAGE

IMAGE est un système basé sur HERACLES pour reconnaître un plan. Le plan global est décomposé en buts puis en tâches et sous-tâches. Il prédit chaque pas de l'apprenant d'après un modèle de décomposition et génère une série d'hypothèses.

Conclusions

Bien que l'ouvrage de Wengers date un peu, la conclusion que l'on peut tirer de la lecture de ce chapitre reste la même. L'intelligence artificielle a suscité des espoirs immenses dans les années 80 pour l'enseignement assisté par ordinateur. La déception était à la hauteur de cet espoir. On peut voir, à la lecture de ce chapitre ardu et technique, plusieurs difficultés:

  1. Il faut exprimer des connaissances par des règles et des faits, dans un formalisme qui n'est pas intuitif. L'apprenant et l'expert humain auront tendance à étudier plusieurs hypothèses en parallèle, tandis qu'un système expert voudra décomposer un raisonnement par des buts étape par étape.
  2. Le nombre de règles et de faits à entrer dans l'ordinateur est immense. Un humain utilisera beaucoup sa connaissance du monde pour rejeter intuitivement et mécaniquement telle ou telle hypothèse. Il faut au contraire tout expliciter pour le système. Ceci rend la programmation d'un tel système très lourde.
  3. L'établissement de métarègles pour le raisonnement est loin d'être évidente. Il est ainsi difficile de faire un moteur générique de résolution de problèmes.

Ceci explique bien pourquoi les techniques de l'intelligence artificielle ne sont pratiquement plus utilisées dans l'enseignement des langues par ordinateur.