Quand l’intelligence artificielle apprend le sens commun

Les « agents intelligents » sont depuis longtemps un des concepts phares du Medialab du Massachusetts Institute of Technology : petits programmes agissant en dessous de la conscience de l’utilisateur, ils sont là pour l’aider, pour adapter l’interface, voir pour prendre des décisions par eux mêmes (y compris des décisions d’achat). Autrement dit, l’agent intelligent est là pour agir en lieu et place de son maître humain comme un bon démon toujours prêt à rendre service. Il représente un changement conceptuel important en informatique car jusqu’ici la plupart des programmes se contentent de mettre à exécution les intentions conscientes de l’utilisateur.

Apparue dans les années 90, cette conception avait déclenché une certaine polémique, et notamment l’ire de Jaron Lanier qui avait déclaré : « Les agents ne sont intelligents que dans la mesure où ils arrivent à nous rendre plus bêtes qu’eux ». Force est de constater que les années qui ont suivi ont plutôt donné raison à Lanier. Les agents de recherche, qui partaient sur le web en quête d’informations pour l’utilisateur, ont été éliminés par Google, un moteur de recherche « classique » mais puissant et facile d’utilisation. Les « agents d’interface » ont disparu avec l’échec évident de l’irritant Clippy, l’agent Microsoft Office qui venait proposer son aide d’une manière intempestive et incongrue.

Mais le groupe de recherche sur le sujet existe toujours au Medialab, et de nouveaux projets sont en cours, sous la direction d’Henri Lieberman.

La production principale du labo Agent logiciel (software agent), repose sur le couple ConceptNet et OpenMind Common Sense (que l’on pourrait traduire par « l’esprit ouvert du sens commun »), deux logiciels sur lesquels s’appuient de multiples applications. L’idée derrière ce projet n’est pas neuve : créer une base du sens commun, regroupant des milliers de faits connus de tous mais généralement ignorés par les programmes informatiques, comme par exemple que les oiseaux possèdent des ailes, mais qu’ils ne peuvent pas tous voler, que les maisons ont en général au moins une porte par laquelle on peut entrer, et très souvent (mais pas forcément toujours) des fenêtres… que les voitures roulent mais que les animaux marchent, et possèdent un certain nombre de pattes, deux, quatre, six, huit ou plus, mais jamais trois, etc. Lorsqu’un agent intelligent tombe sur un document, il peut consulter une telle « base de connaissances » pour en tirer un certain nombre d’inférences, de déductions concernant les faits qu’il analyse.

La plus connue de ces bases est Opencyc, qui regroupe plus d’un million de ces données. Opencyc est certes fascinant, mais son usage est complexe et réservé à une petite poignée de spécialistes.

C’est ici qu’intervient le Medialab : « OpenMind Common Sense » est tout sauf compliqué ou difficile d’accès. C’est une espèce de Wikipedia du sens commun. Rien de plus simple (après la création d’un compte gratuit) qu’entrer diverses assertions, par exemple que Buffy est une série télévisée, ou que Maui est une île.

Cette gigantesque base de données va donc servir à plusieurs des projets du groupe « software agents ». Elle peut être utile dans son « état brut », ou être employée dans sa version raffinée : ConceptNet. ConceptNet prend les formulations de OpenMind et les organise de manière plus formelle, crée des « réseaux sémantiques » mettant en relation les multiples données amassées par Open Mind.

A partir du couple OpenMind/ConceptNet, le groupe « software agents » a donc créé une multitude d’applications « intelligentes ». Par exemple il devient possible de générer automatiquement des scènes pour des jeux vidéos ou des mondes virtuels à partir de phrases en langage naturel.

Leur approche se veut en tout cas radicalement différente de celle qui anime les acteurs du web sémantique. Selon les membres de ce groupe, « les efforts actuels en vue de la création du web sémantique sont basés sur la création de métadonnées lisibles par les machines (…). On suppose généralement que la seule manière de créer un agent web intelligent est de réaliser un nouveau web, spécialement dédié aux machines et employant un langage logique unifié. Nous essayons de franchir cette barrière entre humains et machines en prenant une direction opposée, en donnant aux machines la capacité de comprendre et raisonner en langage naturel, et la connaissance du monde dans lequel nous vivons. »

Un autre projet du groupe est encore plus ambitieux, et peut être aussi plus inquiétant (en tout cas inquiétant pour les finances des premiers expérimentateurs). Common Sense Investing est un assistant électronique qui se propose de donner des conseils d’investissements ! Muni d’une interface en langage naturel, il s’adapte au niveau de son interlocuteur en lui posant des questions correspondantes : « Au lieu de demander quelle est votre tolérance au risque », alors que l’utilisateur pourrait ne pas comprendre cette notion, il demandera : « êtes vous souvent à découvert sur votre carte de crédit ? «

Le trio d’agents intelligents Creo-Miro-Adeo est un autre exemple des travaux basés sur OpenMind Common Sense. Le premier des trois, Creo, fonctionne avec les pages web comme beaucoup d’utilitaires déjà existant sous Windows. Il se contente d’enregistrer les actions d’un utilisateur sur le web pour les réexécuter d’un simple clic. Par exemple, comme le montrent les vidéos disponibles, il est possible de se rendre sur le site de sa banque, d’entrer son numéro d’utilisateur et son mot de passe pour consulter l’état de son compte courant. Creo peut enregistrer cette séquence d’actions et la refaire plus tard.

Adeo n’est pas beaucoup plus futuriste, mais peut se révéler tout a fait utile. Son rôle consiste en effet à se connecter sur l’ordinateur de l’utilisateur pour récupérer les enregistrements Creo et les exécuter sur le mobile. Pour continuer avec notre exemple, il devient très simple de consulter son compte depuis son téléphone, sans avoir à taper des tas de chiffres sur un clavier minuscule.

Des trois, Miro est le plus ambitieux, celui qui s’approche le plus d’un agent au sens propre du terme. Lui aussi prend comme base les « enregistrements » de Creo, puis utilise la base sémantique OpenMind Common Sense pour généraliser ces demandes. Par exemple, si l’utilisateur a commandé du lait sur le site d’un épicier en ligne, Miro recherchera tous les termes désignant de la nourriture sur des pages web visitées et les soulignera : cliquer sur ces mots emmènera l’internaute directement sur le site de l’épicier en ligne, prêt à envoyer la commande. Ici encore les remarques de Lanier gardent toute leur valeur : comme toutes les agents sémantiques, on peut se demander si Miro constituera au final une aide véritable ou une nuisance.

0 commentaires

joss dit :

09/10/2007 à 12:32

Quelle est la différence entre un(e) secrétaire et un(e) assistant(e) de direction dans le rapport de son supérieur au monde extérieur ? Le premier filtre dans une certaine mesure les communications entrantes et s’assure de la disponibilité de son chef avant de transmettre. Le second s’appuie sur ses connaissances du métiers, de la personnalité de son employeur, etc… pour prendre des décisions concernant son chef sans lui en référer systématiquement.

Quel rapport avec les agents ? Eh bien on nous fait miroiter des assistants personnels digitaux, alors qu’on aura déjà fait un grand pas en avant le jour où on aura à disposition des secrétaires logiciels… La prochaine étape est la gestion de l’attention et non pas la traduction d’intentions : l’agent transmet l’information et la décision reste du ressort de l’humain. Au-delà de la question technique qui est loin d’être réglée, j’y vois deux raisons : la confiance (ou son absence) dans l’agent et l’incomplétude de l’information sur le contexte fournie à l’agent.

Je pense que les longues minutes passées à s’accorder sur une date de rendez-vous resterons d’actualité encore un bout de temps.
Xavier dit :

16/10/2007 à 12:32

La décision ne reste pas forcément du ressort de l’humain, tout dépend des applications des Agents en question.
Nous développons par exemple des Agents Intelligents de trading, et nous développons un Agent spécialisé par action.
Aujourd’hui nous avons des Agents prévisionnistes, qui donnent un simple avis. Libre à l’utilisateur de prendre position ou pas.
Dans quelques semaines nous allons implémenter des Agents traders qui véritablement vont conseiller à l’achat ou la vente.
Le but étant d’effacer le biais humain… ou plutôt le libre arbitre.

La puissance des Agents dans notre cas doit justement permettre à l’humain de ne plus prendre de décision « au feeling » et de faire entièrement confiance à des robots qui intègrent toute l’information qu’il est possible d’intégrer.
Jean-Philippe de Lespinay dit :

01/10/2008 à 8:21

L’agent réellement intelligent utilise des techniques d’Intelligence Artificielle, qui lui permet d’être conversationnel. L’article « Quand l’intelligence artificielle apprend le sens commun » parle de projets alors que des agents intelligents tournent tous les jours ! Sur cette page-là : http://www.tree-logic.com, on voit un agent intelligent jouant le rôle d’un commercial. Sur celle-ci : http://www.youboss.tv/node/130, on voit fonctionner Tiara, un soft extraordinaire qui fait fonctionner l’ordinateur par le raisonnement, ce qui lui permet de dialoguer vocalement, de guider ses utilisateurs, d’enregistrer et d’exploiter leurs connaissances, et, plus étonnant encore ! d’écrire des programmes pour eux, qui peuvent être vocaux et conversationnels.
Willy.Wauters dit :

24/04/2010 à 2:52

Seriez-vous intéresser à une version atypique du sens commun selon laquelle le sens commun est une innée poursuite d’une longue chaîne de mises à jour de l’intuition de lignées de 1500 génération confrontant ses intuitions à un modifié enregistrement relationnel et cela à raison de milliards de populations plus ou moins instruites d’intelligence

J’espère que mes imaginations à partir d’aphorismes ne vous ont pas dérangé.