Après les « fake news », les « fake data » et « fake pictures » ?

On le sait : pour éduquer les actuelles IAs, basées sur des réseaux de neurones, il faut des data, beaucoup de data. Bien plus, en fait, que de petites startups ne peuvent s’en procurer. Quelles solutions ont-elles alors à leur disposition ? Les fabriquer, nous explique Wired.

C’est à cette tâche que sont attelées plusieurs entreprises, comme Spil.ly, qui a ainsi fabriqué des millions d’images en insérant des humains virtuels à l’intérieur de photographies prises dans le monde réel.

La société Neuromation, de son côté, utilise des images de synthèse représentant des cochons dans le cadre d’une demande d’un client désirant utiliser des cameras reliés à une IA pour gérer son bétail.

Neuromation, qui souhaite, nous dit l’article, devenir fournisseur de telles données artificielles, a aussi créé des images de rayons d’épiceries (comme celle ci-dessous, qui n’est pas une photographie réelle, mais bien une image de synthèse) pour le compte de la société OSA HP, une société d’analyse du marché comptant Auchan parmi ses clients.

Cette passion pour les données fabriquées ne se limite plus à de petites startups. Les grosses entreprises s’intéressent aussi à ce modèle. Google, nous rappelle Wired, entraîne des robots dans des mondes simulés, tandis que Microsoft a utilisé deux millions de phrases synthétiques pour apprendre à un logiciel comment traduire en arabe un dialecte libanais. Apple s’y est mis aussi : en 2016, nous dit encore Wired, ses équipes de recherches ont publié un papier sur la génération d’images représentant des yeux, en vue de les utiliser dans des programmes de tracking de l’oeil. Un an après, rappelle le magazine, Apple sortait l’iPhone X, susceptible de se débloquer en reconnaissant le visage de son possesseur et en suivant son regard.

On pourrait penser que pour fonctionner, ces images doivent être extrêmement réalistes. Apparemment, ce n’est pas le cas. Comme l’a avoué Adam Schuster, ingénieur chez Spil.ly : « quand j’ai observé pour la première fois l’ensemble des données synthétiques, j’ai pensé : c’est horrible. Comment est-il possible que l’ordinateur puisse en tirer des leçons ?… Mais ce qui compte, c’est ce que l’ordinateur comprend d’une image. »

Espérons que ces données synthétiques ne vont pas véhiculer leur lot de biais…

À lire aussi sur internetactu.net