ReCaptcha : nous travaillons tous pour Google

Par le 24/02/14 | Aucun commentaire | 698 lectures | Impression

Quand on s’intéresse au travail, le monde du numérique est un monde fascinant dont on ne sait jamais s’il faut l’admirer ou s’en affliger.

donttypeUn exemple. Vous êtes tranquillement sur Internet, et puis, à un moment de votre navigation, vous devez remplir un CAPTCHA. Le CAPTCHA, c’est cette suite de signes un peu déformés qu’on vous demande de transcrire pour prouver que vous êtes bien un être humain, et pas un programme informatique (pour vous enregistrer sur un site, laisser un commentaire…). Le mot CAPTCHA, prononcé en bon anglais ça donne “capture”, c’est pour completely automated public Turing test to tell computers and humans apart soit, si je traduis grossièrement “test de Turing entièrement automatisé pour distinguer les ordinateurs des humains”. Là, il faut faire un peu d’histoire de l’informatique. On parle de Test de Turing car quand le grand mathématicien et pionnier de l’informatique Alan Turing, au sortir de la Seconde Guerre mondiale, s’était intéressé à l’intelligence artificielle, il avait postulé qu’un ordinateur pourrait être dit intelligent le jour où un être humain conversant avec lui, il ne saurait pas s’il est en train de discuter avec un ordinateur ou un autre être humain. C’est cela qu’on appelle le Test de Turing, test complètement théorique quand Turing y rêvait. Le CAPTCHA, c’est donc une sorte de Test de Turing visant à constater si on a affaire à un être humain ou une machine, mais dans une version assez sommaire (il ne s’agit pas d’une conversation, mais d’une transcription de signes). C’est l’université Carnegie-Mellon (à Pittsburgh en Pennsylvanie) qui a mis au point ce système, qui s’est vite répandu parce qu’il fonctionne assez bien. Il fonctionne bien, oui, mais voilà…

Certains cherchent à contourner l’obstacle qu’il représente, le plus souvent pour des campagnes de marketing automatisé. Il existe des programmes qui arrivent à retranscrire certaines suites de signes, mais plus souvent, le meilleur moyen est de faire appel à des êtres humains. Il existe donc des sociétés – indiennes notamment, car la main d’œuvre est très peu chère -, qui s’en sont fait une spécialité. Pour presque rien, des opérateurs décodent des CAPTCHA en série (jusqu’à plusieurs centaines par heure), qui fournissent autant de points d’entrée qui vont permettre ensuite à des robots de se faire passer pour des hommes, et donc à d’autres entreprises de se livrer à leur marketing automatisé. Intéressant, cette dialectique de l’homme et de la machine, intéressant comment un petit programme implémenté sur un site à un bout du monde fait travailler à l’autre bout du monde.

Mais le CAPTCHA pose la question du travail à un autre degré, plus étonnant encore. Quel dommage, se sont dit un jour les chercheurs de l’université Carnegie-Mellon, quel dommage que tous les jours, des centaines de millions d’internautes transcrivent des signes déformés et que cela ne serve à rien… Et ils ont inventé un système qui s’appelle Re-CAPTCHA et qui consiste à utiliser ces millions de transcriptions effectuées par les internautes pour améliorer les logiciels de numérisation des livres. En effet, quand on numérise des livres, bien souvent, des caractères sont déformés (parce que la page est abîmée, froissée, parce que l’encre a coulé, etc.) et les logiciels de reconnaissance de caractère peinent alors à déchiffre! r et retranscrire ces passages. En utilisant la retranscription humaine, plus fine, plus souple, plus intuitive, on améliore les logiciels. Ce qu’a très vite compris… Google. Et oui, encore Google. Google, qui avec son projet Google Books numérise les livres du monde entier par brassée, s’est empressé d’acheter le système Re-CAPTCHA à l’université Carnegie-Mellon pour améliorer ses logiciels de reconnaissance textuelle. Ce qui signifie une chose toute simple : quand vous transcrivez un CAPTCHA, il y a des chances pour que vous participiez à l’amélioration des logiciels de Google, il y a des chances, donc, que vous travailliez pour Google.

captcha

Cet exemple minuscule du CAPTCHA illustre à mon sens deux caractéristiques du travail à l’ère numérique :

Le monde du numérique est un monde fascinant.

Xavier de la Porte

Retrouvez chaque jour de la semaine la chronique de Xavier de la Porte (@xporte) dans les Matins de France Culture dans la rubrique Ce qui nous arrive sur la toile à 8h45.

L’émission du 22 février 2014 de Place de la Toile recevait Fadi Chehadé (@icann_president), président de l’ICANN pour tenter de cerner le rôle et les pouvoirs de la principale autorité de régulation de l’internet dans un monde Post-Snowden.

Les commentaires sont fermés.