Parlez-vous HTML ?

Parlez-vous HTML ? Voilà la question qui s’est posée lors de la table ronde « Eclairages pour le 21e siècle » (que vous pourrez écouter en ligne ici), où l’on a vu se confronter les points de vue d’un programmeur, Aurélien Fache, d’une anthropologue et linguiste, Clarisse Herrenschmidt, auteur du passionnant Les Trois Ecritures : langue, nombre, code, d’un professeur d’informatique et de linguistique, Jean Veronis, et d’un romancier Frédéric Werst, inventeur d’une langue fictive, celle des Wards.

Cinq thèmes majeurs majeurs se sont dégagés : la nature du langage informatique et ses rapports avec les langues naturelles, l’esthétique du code, les progrès envisageables de l’intelligence artificielle, l’enseignement de l’informatique et les mythes qui sous-tendent le développement des langages informatiques.

parlezvoushtml

D’où vient le « langage » informatique ?

Pour aborder la relation entre programmation et langues naturelles, il faut d’abord se pencher sur les définitions. Et il est difficile de définir ce qu’est une langue, rappelle l’anthropologue Clarisse Herrenshmidt.

« Une langue, nous savons intuitivement ce que c’est. C’est une notion plus qu’un concept. Ca nous sert à vivre et pas seulement à communiquer. A atteindre différents niveaux de conscience, dont celle de la rationalité la plus pure. La langue est un apprentissage constant : on n’a jamais fini de parler, mais il est difficile de prendre la parole. La langue n’est jamais unique : il y a des niveaux de langues, plusieurs langues dans une langue… La qualité des langues humaines est qu’elles sont plus ou moins inter-compréhensibles. Elles manifestent toutes quelque chose de l’humanité : le langage ! C’est-à-dire la compétence globale d’un cerveau humain à créer des langues. »

(…) « La langue est un phénomène social. Si on parle seul une langue, ce ne peut pas être une langue. Les mots qu’on apprend nous sont imposés, même si on gagne ensuite la liberté de les transformer. La langue est imposée et délimite un univers sémiologique de signes et de symboles avec lesquels les gens sont peu ou prou d’accord. L’écriture par contre est extrêmement indépendante de la langue. Il existe plusieurs façons d’écrire le japonais et on pourrait imaginer une écriture syllabique plutôt qu’alphabétique pour écrire le français. Il n’y a pas de relation stricte entre l’écriture et la langue. L’écriture est une mécanique technique qui nécessite de la matière et a comme qualité de faire passer la langue de l’invisible au visible.

Qu’est-ce qu’un langage et qu’est ce qu’un code ? Et d’ailleurs, pourquoi assimile-t-on si facilement la programmation des ordinateurs à un « langage » ? Après tout, personne ne conçoit ainsi les mathématiques, sauf de manière très métaphorique. Et la différence est énorme entre la langue naturelle, toute en richesse et en ambiguïtés, et le code informatique, exact, n’admettant pas l’interprétation et finalement d’une expressivité assez pauvre. Au début, rappelle Jean Veronis, on communiquait avec les ordinateurs via des fiches ou des trous dans une carte. On aurait pu continuer comme cela. Pourquoi donc a-t-on absolument ressenti le besoin de se rapprocher d’un langage ?

De fait, la convergence entre informatique et linguistique a peut-être des origines historiques. Noam Chomsky, le fameux linguiste dont les théories ont dominé la seconde moitié du XXe siècle, occupait au MIT un bureau voisin de celui des chercheurs en Intelligence Artificielle. Jean Veronis évoque donc la possibilité d’une influence croisée entre les deux mondes à ce moment charnière : les théories linguistiques influençant l’informatique naissante et en retour, les spéculations des chercheurs en IA colorant les théories de Chomsky.

C’est peut-être même antérieur à cette époque, note encore Jean Veronis. Pourquoi les premiers ordinateurs sont-ils apparus ? Pour résoudre les problèmes cryptographiques liés à la Seconde Guerre mondiale. Dans les années 50, les ordinateurs étaient à peine nés qu’on s’essayait déjà à la traduction automatique. Warren Weaver, co-développeur avec Shannon de la théorie de l’information pensait qu’ainsi on pourrait un jour arrêter les guerres !

Pour Clarisse Herrenschmidt, l’étrange similarité entre langues naturelles et langage informatique tend encore à s’atténuer si on y ajoute un troisième terme : l’écriture. Dans notre tradition occidentale, c’est le nombre qui a présidé à la naissance de l’écriture. Les nombres figurent parmi les premiers signes écrits. En 600 avant Jésus-Christ, les Ioniens inventent la monnaie qui constitue, selon la thèse de Clarisse Herrenschmidt, la seconde écriture. Sur les pièces sont frappés des nombres et des figures géométriques représentant des relations numériques.

Et d’ailleurs, d’où vient l’informatique ? En fait, il s’agit d’une extension des mathématiques. Lorsque Turing et Church ont mis au point leur fameux théorème, ils cherchaient avant tout une réponse à certaines questions sur la nature des mathématiques posées par Hilbert.

Frédéric Werst nous a expliqué, de son côté, que lorsqu’il a inventé la langue des Wards, les nombres sont parmi les mots qu’il ait créés.

« L’écriture est un geste physique, dans l’espace, corporel… Même s’il se réduit a inscrire quelque chose sur une feuille de papier. Elle se déroule dans une durée, dans un temps. Mais l’écriture est aussi quelque chose de plus solitaire que la langue. Le régime de communication de l’écriture n’est pas le même que l’oral. Il y a un délai qui est fondamental dans le déploiement de l’écriture. »

Plus c’est beau, plus c’est efficace

La question de l’esthétique a également entraîné de nombreuses discussions. Chacun peut apprécier l’esthétique de la langue, et il existe aussi une esthétique propre à l’écriture. En Chine, la beauté d’un poème est tout autant dépendante de la calligraphie des caractères que de leur signification. Frédéric Werst explique que, lorsqu’il a créé ses textes dans la langue des Wards, il avait pour habitude de les calligraphier. Pas seulement de les écrire.

L’esthétique se répercute-t-elle au niveau du code informatique ? Pour Aurélien Fache, il existe des langages de programmation plus esthétiques que d’autres : par exemple, Python, qui exige les indentations lors de la rédaction de fonctions d’un programme, crée spontanément du code plus élégant.

Plus important encore que la beauté visuelle du code, il y a l’esthétique algorithmique. Un programme peut être beau, au même sens qu’une équation, s’il exprime un processus de la manière la plus économique et claire possible. Mais les deux types d’esthétique sont souvent liés, rappelle Jean Veronis : lorsqu’un programme est mal structuré au plan visuel, que les parenthèses ou les indentations sont placées n’importe comment, etc., on peut s’attendre à ce qu’en général, la pensée qui s’exprime soit elle aussi confuse et floue, bien qu’il existe évidemment des exceptions.

Mais le code informatique autorise-t-il le jeu, la transgression, comme le permet le langage ? « C’est la différence entre le langage, où tout est jeu, et le code, où rien ne l’est. Et plus encore quand on a un but littéraire. En littérature, la transgression n’entraîne pas le plantage. », rappelle Frédéric Werst. « En programmation, la transgression, cela n’existe pas, cela s’appelle un bug », explique Aurélien Fache.

Jean Veronis rappelle lui qu’il y a des façons ludiques de programmer, que certains hackers s’amusent par exemple à écrire du code sans aucune lettre… Des pratiques assez proches, en fait de celle de l’Oulipo, ce groupe d’écrivains qui cherchait à jouer de toutes les manières avec l’écriture (et dont le livre de George Perec, La disparition, où ne figure pas la lettre « e », reste sans doute l’exemple le plus célèbre).

Les limites de l’intelligence artificielle

La question fondamentale réside bien dans la compréhension du langage naturel par les machines, clé de la « véritable » intelligence artificielle, celle que « mesure » le test de Turing. Test dont Turing lui-même pensait qu’il pourrait être réussi par les machines aux alentours de l’an 2000. On en est loin ! Jean Veronis, se rappelle, adolescent, l’impact qu’a eu sur le lui le film 2001 l’odyssée de l’espace, dans lequel on voyait le fameux Hal 9000 converser avec des humains. A l’époque, pour les conseillers scientifiques de Stanley Kubrick (parmi lesquels Marvin Minsky, l’un des papes de l’IA au MIT), une telle conception paraissait tout à fait réaliste. Aujourd’hui, non seulement on ne sait pas quand cette prouesse sera réalisée, si elle l’est un jour, mais en tout cas, Jean Veronis ne croit guère qu’elle aura lieu de son vivant.

Les deux premières tâches que se sont assignés les chercheurs en IA alors qu’émergeait la discipline, explique-t-il, furent le jeu d’échecs et le traitement automatique du langage. Dans le second cas, on a très peu avancé. Dans le premier, les ordinateurs sont effectivement capables d’atteindre et dépasser le niveau des grands maîtres. Mais leur façon de jouer n’a rien d’humain : ils se contentent de calculer des milliers de coups d’avance, alors qu’un champion d’échecs ne prévoit que quelques coups et sélectionne spontanément les meilleures actions.

Jean Veronis est aussi très sceptique vis-à-vis du « web sémantique ». A ses yeux, l’idée de placer des métadonnées dans les pages web pour les rendre lisibles par des machines était peut-être valable aux débuts du web, quand il y avait peu de pages, toutes exécutées par des professionnels. Mais aujourd’hui, il ne faut pas compter sur les millions d’internautes pour renseigner correctement le web sémantique, qui se heurtera d’un côté à la barrière de l’incompétence et de l’autre à celle de la malveillance (le « tagging » volontairement incorrect de certaines pages, à des fins de spam ou de référencement, par exemple).

Le Graal de l’intelligence artificielle, de la machine aussi intelligente que nous est un mythe qui a présidé à la création de l’information. Cette volonté de reproduire le cerveau humain est importante dans les écrits de von Neuman, qui a inventé l’architecture de l’ordinateur à la même époque où l’on faisait les premières découvertes sur les neurones. L’analogie avec le cerveau a été une métaphore fondatrice.

(…) Certes, les machines aux échecs, sont plus fortes que les humains, mais sur le langage, elles ne comprennent rien à rien. Même la façon dont elles gagnent les humains aux échecs n’a rien à voir avec la façon dont les humains jouent à ce jeu. Les humains ont du mal à expliquer leur tactique et examinent peu de coups à l’avance. La machine, elle, imagine des milliards de possibilités. Elles ont gagné au échecs par d’autres voies que l’intelligence naturelle.

(…) L’idée du web sémantique est une idée honnête et généreuse. A l’origine, le web était un immense bazar. On ne savait pas ce qu’étaient les sites, leurs natures. On a donc cherché à ajouter des métadonnées, permettant de préciser par exemple que telle page est une page qui parle du sport. Mais cette simplification n’était possible que quand le web était encore une affaire de spécialiste. Mais pour construire un système de métadonnées, il faudrait que les gens veuillent le faire, ce qui sous-estime d’abord l’incompétence totale de la population : l’un va mettre chien et l’autre caniche, et comment peut-on relier les deux occurrences ? Et cela sous-estime la malveillance. J’ai analysé deux millions de tags sur les vidéos de DailyMotion et l’on constate vite que les gens mettent des termes qui n’ont rien à voir avec leur vidéo pour les référencer. Sous cette forme, le web sémantique est une vue de l’esprit. Cela peut peut-être s’appliquer dans les secteurs spécialisés, comme la documentation de niche, mais pas au-delà… »

Tous programmeurs ?

La question de l’éducation à la programmation a été surtout marquée par une intervention virulente de Jean Veronis contre l’idée du « plan informatique à l’école » et celle que tout le monde devrait apprendre à être programmeur. « Je peux utiliser une voiture, ou prendre l’avion, mais je n’ai pas besoin de savoir les fabriquer, argumente-t-il. Pourquoi cela devrait-il être différent avec les ordinateurs ? ». Il reconnaît cependant l’importance de disposer de certaines notions fondamentales, par exemple, savoir comment fonctionne un moteur de recherche. « Certains de mes étudiants », explique-t-il, « croient que lorsqu’ils effectuent une requête Google, les « robots » se mettent alors en marche pour aller chercher l’info en temps réel sur le net ». Et de souligner la difficulté d’établir une éducation multidisciplinaire, notamment en France : dans les universités, les linguistes et les informaticiens communiquent rarement entre eux.

« Il faut enseigner à l’honnête homme du XXIe siècle comment fonctionne les choses qu’il y a autour de lui. Il faut comprendre les mécanismes. Comprendre comment fonctionne un moteur de recherche, par exemple. Le problème, c’est que le train va plus vite que les voyageurs. »

Mythologie de la programmation

Au final, il faut bien se poser la question du caractère mythique de l’idée d’un cerveau mécanique, qui serait comme la reproduction de celui de l’être humain. Le rêve de la création d’un « Golem » a aujourd’hui plusieurs siècles. De même, rappelle Veronis, les recherches sur le « langage universel » qui sous-tendent les projets de la traduction automatique existaient déjà dans les spéculations de philosophes du XVIe siècle. Du reste, les espoirs de réduire le langage au nombre se retrouvent dans des pratiques comme la gematria des kabbalistes du moyen-âge.

Clarisse Herrenschmidt, de son côté, voit dans Turing un créateur de mythe contemporain, qui a cherché à externaliser le cerveau sous la forme d’un ordinateur. Ce faisant, il ne faisait que répéter les actions des Anciens, qui eux aussi avaient créé leurs écritures en imaginant une externalisation machinique de l’organe de la pensée. Ainsi, le premier signe utilisé par les Mésopotamiens pour signifier le mot « écriture » était une bouche, une représentation de la parole. Et le caractère Ionien employé pour désigner la monnaie était un œil, parce que c’est avec l’oeil qu’on peut estimer la valeur d’un bien. Aussi ne s’étonnera-t-on pas que l’ordinateur soit apparu, de la même manière, comme un « cerveau électronique » !

Rémi Sussan et Hubert Guillaud

À lire aussi sur internetactu.net

4 commentaires

  1. On nous apprend à considérer qu’il faut prendre soin de la nature, la respecter, la préserver pour les générations futures. Or, n’est-il pas remarquable qu’on ne puisse pas dire de la même manière qu’il faut prendre soin de la langue, la respecter, etc…? Pour les éducateurs, par exemple, ce serait bien utile. Mais ce que nous savons — ou ne savons pas — de la langue ne nous permet pas vraiment de le faire. C’est comme si, en la matière, nous manquions d’un point d’appui. Situation étrange, un peu vertigineuse.

  2. « Il reconnaît cependant l’importance de disposer de certaines notions fondamentales, par exemple, savoir comment fonctionne un moteur de recherche »

    +

    « “Il faut enseigner à l’honnête homme du XXIe siècle comment fonctionne les choses qu’il y a autour de lui. Il faut comprendre les mécanismes. Comprendre comment fonctionne un moteur de recherche, par exemple. Le problème, c’est que le train va plus vite que les voyageurs.”

    Il n’y aurait pas en conclusion du paragraphe l’aveu même du paradoxe que soulève son opinion ?

    Que son « intervention virulente » sur le sujet de « notions fondamentales » pour l’ « honnête homme » (j’adore le qualificatif) peut faire sourire et qu’on pourrait trouver bien des exemples de choses bien plus « fondamentales », — et pas nécessairement dans le domaine informatique — que lui-même, ne connaît probablement malgré son importance tant pour son quotidien que pour son existence et que cela ne l’empêche pas de dormir … ni de se lever, ni d’écrire.

    N’est-il pas en train de réaliser en fin de paragraphe ce que d’autres, et pas des moindres, avaient réalisé bien avant lui ? Par ex :

    We live in a society exquisitely dependent on science and technology, in
    which hardly anyone knows anything about science and technology.
    — Carl Sagan

    PS : Notez le exquisitely

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *