Agents conversationnels : l’ordinateur a la parole

A l’occasion d’Imagina 2002 (http://www.imagina.mc/), qui se déroule du 12 au 14 février 2002, Angela fera une sortie. Rencontre avec l’un de ses papas : Dominique Noël, fondateur d’As an Angel.

« Dans la famille des agents intelligents je voudrais la fille. » La voici, elle se prénomme Angela et c’est un agent conversationnel. De deuxième génération, elle est un peu plus évoluée que ses grandes soeurs, Cybèle, Ange ou Semantia. Elle bouge, elle parle et possède plusieurs cordes à son arc, à savoir plusieurs sujets de conversation. Ce n’est pas demain que nous pourrons considérer notre PC comme une compagnie qui nous dit bonjour le matin et à qui on demande de commander des croissants chez le boulanger en ligne du coin. En revanche, pour après demain, c’est envisageable. A l’occasion d’Imagina 2002 (http://www.imagina.mc/), qui se déroule du 12 au 14 février 2002, Angela fera une sortie. Rencontre avec l’un de ses papas : Dominique Noël, fondateur d’As an Angel (la société qui conçoit Angela), et auteur d’une thèse intitulée : « Réalité virtuelle de la réalité virtuelle : éléments pour une sémiotique des environnements et créatures tridimensionnels de synthèse ». Un homme de parole quoi !

Quelles est la nuance entre agents intelligents et agents conversationnels  ?

« Agents intelligents » est un terme générique qui désigne tout programme informatique capable d’agir, de fonctionner de façon autonome, parfois capable de mobilité, parfois doté de fonctions d’apprentissage, mais c’est assez rare. Il est donc capable d’accomplir une mission : typiquement c’est le cas d’un assistant d’achat. Je veux un lecteur de DVD ; j’ai repéré le modèle et je veux le meilleur prix. Là, un programme va aller chercher, comparer les prix et me donner la liste. Les agents conversationnels ont quelque chose de plus, qui les spécifie de façon très nette : ils sont capables de dialoguer. Il est nécessaire d’insister sur le terme de « dialogue » : ce ne sont pas des questions et des réponses. Dans un dialogue on peut effectivement avoir deux interlocuteurs dont l’un est interrogatif et directif, il pose des questions ; et l’autre lui répond. Mais il y a bien d’autres formes de dialogues : émettre un commentaire, exprimer une opinion, être expressif, être assertif, énoncer un fait, être déclaratif… Il y a donc plusieurs actes de langages. Donc toute la difficulté de concevoir des agents conversationnels est de passer de cette étape relativement simple de questions/réponses à une étape où un véritable dialogue s’instaure sur un sujet. Il faut alors prendre en compte l’éventualité que l’internaute émette une opinion et que l’agent ait une réponse pertinente qui ne donne pas envie à l’utilisateur d’abandonner la conversation. On peut rétorquer que beaucoup d’applications n’ont pas besoin de dialogue, mais ce n’est pas si vrai. Prenons l’exemple du guichet de la Poste : on veut savoir comment ouvrir une boîte postale. Nous sommes bien dans un schéma de question/réponse. Mais s’il n’y avait QUE les questions/réponses nous aurions tendance à prendre le guichetier pour une machine. Or nous apprécions que le guichetier fasse un commentaire, ou simplement sourie, soie aimable, ait une attitude. Cette attitude peut être recréée par l’apparence qu’on donne aux créatures 3D, mais il ne faut pas oublier que les expressions sont dues à ce qui est dit. C’est un tout : on communique à la fois verbalement et non-verbalement selon ce qu’on a envie de communiquer. Même dans une situation où l’on peut penser qu’il suffit d’avoir une réponse, si on mettait un robot qui sache répondre, les gens seraient frustrés et n’aimeraient pas. Et cette demande n’est pas seulement vraie pour le grand public, elle caractérise aussi les rapports humains professionnels. Vous n’avez pas envie que les gens avec qui vous travaillez se comportent comme des machines. Nous sommes ancrés dans le dialogue humain et ce qu’on attend d’un système informatique automatique c’est qu’il soit capable d’aller jusqu’à ce dialogue-là.

On ne veut plus que des machines dialoguent comme des machines…

Non. Je crois que c’est très clair. Si vous essayez de faire surfer votre grand-père, vous vous apercevez tout de suite que c’est un autre monde pour lui et que c’est très difficile. Avec un agent conversationnel, il lui suffit d’écrire sa phrase – ce qui rappelle la machine à écrire que tout le monde connaît -, d’appuyer sur « retour » et d’entendre une voix vous donnant une réponse. C’est une relation beaucoup plus conviviale, plus naturelle et qui s’ouvre au plus grand nombre. On touche à la fois les gens qui ne sont pas sur Internet parce que c’est compliqué, et aussi une frange d’usagers toujours à la recherche de nouveautés.

Mais aujourd’hui, en matière d’agents conversationnels nous n’en sommes quand même qu’au tout début ?

L’idée de faire des agents conversationnels, en anglais chatterbot ou conversational agent, date des années 60. Le premier chatterbot c’est Eliza, créée par un chercheur nommé Joseph Weizenbaum (http://www.lcs.mit.edu/people/bioprint.php3?Record_ID=66) dans les années 60 au MIT. Eliza est un programme qui fait une analyse syntaxique des énoncés de l’utilisateur. Si vous dites à Eliza, « je ne suis pas en forme, je ne me sens pas bien, je n’ai pas envie de travailler », elle a reconnu trois formes négatives et va vous demander :  » pourquoi êtes vous négatif ? ». Elle va souvent répondre à une question par une autre question. Si vous lui dites : « la vie est triste » elle va vous répondre : « pourquoi dites-vous que la vie est triste ? », ou « qu’est ce que ça vous fait que la vie est triste ? »
Elle a été conçue pour être psy ! Elle renvoie la balle systématiquement et malgré tout cela créeun dialogue. A tel point qu’à l’époque beaucoup de gens ont vraiment considéré Eliza comme un programme psychologue. Il y a même eu des améliorations. Une nouvelle version d’Eliza a d’ailleurs été développée par un psychiatre et des gens l’ont adoptée comme telle, alors qu’elle est vraiment ultra-limitée.

Vous avez créé Angela, qui est-elle ?

C’est un prototype d’agent conversationnel de deuxième génération. Elle a vocation, en terme de présentation et d’animation 3D, à se rapprocher davantage d’un être humain, elle est constamment animée contrairement à beaucoup d’agents qui ne bougent que quand ils parlent. Elle a une voix, ce qui n’est pas non plus fréquent, et en plus elle est capable de dialoguer sur différents sujets. En général, les agents conversationnels sont centrés sur un sujet. En français il n’en existe que deux : Ange, en Belgique, fabriqué par Archangélis (http://www.archangelis.com/) et Semantia (http://www.semantia.com). Ces agents savent relativement peu de choses, ou plutôt ils savent beaucoup de choses mais sur un sujet précis : par exemple Semantia ne renseigne que sur les services et produits de la société. Avec Angela nous avons essayé de faire quelque chose de plus générique et de plus proche de l’interlocuteur humain qui peut parler de plusieurs sujets. Evidemment on est à 1 % du chemin qu’il nous reste à faire voire, 1 pour un million. L’idée est, à la fois, de montrer que sur un sujet donné on peut avoir un dialogue construit, mais en même temps qu’elle ait toute une série de réponses sur une série de thèmes pratiques de façon à avoir suffisamment de connaissances pour être intéressante et que le dialogue se poursuive. Evidemment la difficulté est d’arriver à développer du dialogue dans différents domaines  : d’abord il faut reconnaître les domaines qui intéressent le plus grand nombre et, en fonction, développer tout ça.
Elle est donc de deuxième génération en termes d’attributs humains mais aussi en termes de technologie puisque l’idée est de la développer avec des technologies plus innovantes que la seule reconnaissance de formes. Avec ce prototype, Angela évolue toutes les semaines. Aujourd’hui, par exemple, sa voix n’est pas extraordinaire, c’est une voix de synthèse, métallique. Mais les industriels qui fabriquent des voix de synthèse s’améliorent sans cesse et elle aura une meilleure voix très rapidement.

Qu’utilisez-vous comme technologie
 ?
Nous utilisons un logiciel édité par Barbara Hayes-Roth, une grande spécialiste de l’intelligence artificielle de l’université de Stanford (http://www.ai.sri.com/). Il s’agit d’une technologie de dialogue fondée sur des techniques très simples consistant à reconnaître des phrases clés. Exemple, la question : « Je veux la météo à Paris »
Le système décompose la phrase : #je veux #météo #Paris. Elle va comprendre « je veux » et comprendre en même temps « je cherche », « je voudrais », etc. C’est ce qu’on appelle un « token group ». « Météo » elle va comprendre « le temps qu’il fait » et « à Paris » elle va reconnaître que c’est une indication de localisation et reconnaître la capitale. Quand l’utilisateur écrit cette phrase, Angela retrouve les motifs qui composent la réponse et possède une variété de répliques pour y répondre, afin de ne pas toujours dire la même chose, et elle affiche une URL qui va vous donner la météo à Paris ou, si vous demandez Chamonix, elle affiche la page de la météo de Chamonix. C’est très simple finalement. En face de motifs on a une réponse. Dès qu’un motif est reconnu par Angela elle a une réponse prête.

Et où en est la recherche dans les laboratoires aujourd’hui ?

Dans les laboratoires universitaires, des technologies très pointues sont développées. Elles sont à vocation générique et visent à pouvoir traiter n’importe quel énoncé. Elles fonctionnent avec des programmes d’analyse syntaxique assez poussés.
Il y a quatre couches linguistiques : la couche la plus basse c’est la lexicologie, puis vient la syntaxe, puis la sémantique et la couche la plus haute, la rhétorique/pragmatique. Aujourd’hui, la technologie qu’utilise Angela est au niveau le plus bas : la lexicologie. C’est de la reconnaissance de mots-clés, on ne cherche pas encore à détecter les phénomènes de grammaire. Mais dans les labos, il existe déjà des programmes d’analyse syntaxique et quelques rares programmes qui incorporent un peu d’analyse sémantique. Et pour l’instant nous en sommes là de la recherche. Ces recherches universitaires devront déboucher sur des solutions commercialisées dans dix ans. Jusqu’à il y a un an, il n’y avait plus beaucoup de laboratoires qui s’intéressaient à ce type de recherche. Aujourd’hui, on note un renouveau sur la question : les interactions en langage naturel sont désormais dans les priorités des grands appels d’offres publics et des programmes européens.
Autre chose : l’interaction entre l’usager et l’agent conversationnel se fait par le clavier. La reconnaissance vocale n’est pas encore à un niveau qui permette d’envisager sérieusement, à court terme, de dialogue avec un agent conversationnel par la voix. Mais la reconnaissance vocale est sans doute un des éléments qui fera décoller les agents conversationnels : quand on pourra s’adresser à eux directement par la voix.


Quelles sont les applications d’Angela et des agents conversationnels ?

Il faut distinguer deux grands marchés : le grand public et les entreprises.
Pour le marché grand public, l’idée est de proposer, à terme, une assistante personnalisée à tout citoyen connecté à Internet. C’est un moyen d’interagir avec son ordinateur et avec internet. Imaginons, dans cinq ans, vous allumez votre ordinateur – s’agira-t-il d’un ordinateur comme ce PC ou d’un simple écran qui s’allume tout seul ?- Angela apparaît et vous salue selon le moment de la journée : si c’est le matin elle va vous demander si vous avez passé une bonne nuit et « que puis je faire pour vous ? ». Vous pourrez lui dire – car d’ici là on pourra surfer par la voix – « je veux la météo du jour » et elle surfera sur Internet pour vous, ira chercher votre courrier, et aura suffisamment de capacités de dialogue pour éventuellement jouer le rôle d’une compagnie. L’objectif est de construire ce service qui prendra vraisemblablement la forme d’un assistant virtuel téléchargeable et gratuit sur internet, dans un premier temps, avec des fonctions qui s’amélioreront progressivement. Car votre assistant virtuel n’apparaîtra pas uniquement sur votre ordinateur à la maison, il vous suivra sur votre portable de troisième génération, sur votre assistant personnel, au bureau et pourquoi pas, via la set top box, sur l’écran de la télévision interactive. L’assistant virtuel pourra vous suivre partout, y compris dans votre voiture.
Pour le marché des entreprises c’est très vaste , ça touche à différents secteurs à l’intérieur même de l’entreprise : la communication institutionnelle, la communication produit, la communication interne, l’organisation, le marketing électronique car grâce à Angela on peut faire du profilage assez facilement. Il est plus facile de répondre à quelques questions d’Angela dans une conversation que de remplir un formulaire en ligne. On peut intervenir dans la relation client, car tous les aspects de la relation client sont présents puisque l’interface conversationnelle sera en front office par rapport au client : les possibilités sont énormes, de l’hôte virtuel, au formateur, à l’animateur Internet. On peut aussi imaginer des agents récréatifs, des jeux… L’idée s’inscrit évidemment dans la perspective de progression du commerce électronique et du commerce en ligne. On est clairement un outil qui sera d’abord de différenciation pour les annonceurs et de meilleure productivité pour le commerce électronique et le commerce mobile.

Et quel est le modèle économique, pour le marché grand public, puisque vous parlez de téléchargement gratuit ?
Notre credo est de penser que les agents conversationnels vont, en plus d’être une nouvelle interface, être un nouveau média. On pourrait imaginer une chaîne de télévision interactive qui soit entièrement animée par des agents virtuels, qui parleraient et feraient le programme.
C’est un nouveau média : à travers un agent conversationnel vous pouvez tout faire passer. Si vous lui dites « je veux voir le journal de TF1 », elle vous envoie le JT de TF1, pareil pour un programme de radio ou une Une de quotidien. A partir de là, elle peut faire passer des messages publicitaires  : sur le ton de la conversation elle vous demande dans quel pays vous aimeriez aller, vous lui dites « le Maroc » et hop elle vous envoi e sur une promo de Nouvelles Frontières. Elle peut détailler la demande et l’affiner jusqu’à vous proposer exactement ce que vous cherchez. Pour l’aspect grand public on se retrouve dans un modèle de portail, sauf que le portail ce n’est plus un site internet mais un agent conversationnel.
Et à terme, il y aura des versions payantes d’Angela pour le grand public, personnalisées et sans publicité ! Propos recueillis par Cécile Plet

À lire aussi sur internetactu.net