Un article de la revue Wired analyse longuement les méthodes de Meaningful Machines entreprise dont le programme réussirait une traduction automatique Espagnol-Anglais bien supérieure à celle offerte par ses concurrents. La technique de Meaningful Machines (‘les machines qui en disent long ») est une méthode statistique, assez proche de celle utilisée par des logiciels comme Google (voir « les statistiques au secours de la traduction« ). Elle présente cependant quelques différences importantes : l’algorithme jusqu’ici utilisé impliquait une base de données importante de traductions préalablement effectuées, comprenant à chaque fois la source et la cible, le programme cherchant alors dans ce volumineux ensemble d’informations la version la plus adaptée. Le problème, explique Wired, étant que chaque type de texte devait être mis en rapport avec des documents appartenant à la même catégorie : par exemple, les écrits techniques doivent être comparés entre eux, et pas avec des extraits de roman.
Meaningful Machines recourt à une stratégie différente. L’ordinateur commence par traduire des phrases, ou des portions de phrases en utilisant un dictionnaire bilingue, comme le faisaient les programmes de traduction d’antan. Mais cette fois, il va générer toutes les traductions possibles de la phrase, y compris les moins probables ou les plus insensées. Ensuite, il lui faudra comparer ces différents résultats à une base de textes écrits dans le langage cible (en l’occurrence, environ 150 gigaoctets de pages anglaises glanées sur le web), pour sélectionner la version la plus crédible.
Reste à voir si les performances de Meaningful Machines seront bientôt validées officiellement, car ce programme ne fait pas partie des concurrents évalués dans le récent rapport du NIST (National Institute of Standards and Technology), qui concernait, il est vrai, l’Arabe et le Chinois, et non l’Espagnol.