L’intelligence artificielle embarquée, une solution pour des interfaces vocales respectueuses de la vie privée ?

Dans une tribune pour Les Echos, Rand Hindi (@randhindi), PDG de Snips (@snips), estime que les services numériques doivent prendre la protection des données personnelles au sérieux, défendant la privacy by design, la protection de la vie privée par la conception. Reste qu’à l’heure de l’interconnexion des systèmes via l’informatique en nuage (Cloud Computing) qui échangent en permanence les données des utilisateurs pour les rendre productives, cette privacy by design est difficile à mettre en oeuvre.
C’est notamment le cas en ce qui concerne les interfaces vocales, comme les enceintes connectées Google Home ou Amazon Echo, ainsi que la plupart des objets connectés, qui, pour fonctionner, collectent énormément de données personnelles (voir par exemple L’enfer de la maison intelligente). En attendant que des technologies de chiffrement solides soient disponibles pour que les données personnelles que ces objets utilisent ne soient pas accessibles facilement, les utilisateurs sont contraints de faire confiance aux entreprises qui proposent ces technologies, alors même que les fuites de données, leurs reventes et les problèmes de confidentialité peuvent être nombreux. Pourtant, rappelle Rand Hindi, il existe une alternative simple : « traiter les requêtes vocales de l’utilisateur directement sur l’appareil auquel il parle ». C’est ce qu’on appelle le Edge Computing (le traitement des données à la périphérie) ou Fog Computing ou encore l’intelligence artificielle embarquée : « au lieu de centraliser les données et de les traiter dans le cloud, vous les décentralisez complètement en les traitant directement sur l’appareil ». Simple ! Cette technologie permet ainsi d’utiliser l’appareil sans connexion, de réduire les fuites de données et la surveillance. Et ce alors que les technologies de traitement de la voix en local existent déjà, souligne celui qui en développe et qui propose une interface pour permettre à d’autres de les intégrer à leurs appareils.

Cette technologie montre qu’une autre manière d’innover est possible. Elle est par exemple au coeur du récent rapport de l’Arcep sur les terminaux, ainsi que d’un des débats que l’Arcep avait organisés le jour de la présentation de ce rapport. Yann Lechelle, directeur des opérations de Snips, y expliquait très simplement les enjeux de Snips : créer des applications qui reconnaissent des commandes vocales en local, sur des cas d’usages spécifiques. On peut ainsi remplacer les boutons d’une machine à café par une commande vocale qui comprenne et opère une gamme de commande, sans avoir besoin d’envoyer tout ce que vous dites dans le cloud et sur les serveurs distants de l’entreprise qui vous fournit un appareil connecté. Bien sûr, cela signifie que la machine ne pourra pas répondre à toutes les demandes, comme Alexa ou Google Home. Mais est-ce le but de toutes nos machines connectées ? On sait encoder le langage d’usage, créer le modèle, en réduisant les cas d’usages et faire que la machine comprenne plusieurs centaines de commandes liées à son fonctionnement. L’enjeu bien sûr est d’une part de préserver la vie privée des utilisateurs, mais plus encore, de garder de la maîtrise. « Si demain votre machine à café fonctionne avec Alexa ou Google Home, ce sont eux qui domineront le marché », et ce alors que le périmètre fonctionnel des interfaces vocales est bien souvent spécifique, circonscrit à des cas d’usages limités.

A cette table ronde, un autre acteur, Alexandre Zapolsky (@alex_zapolsky), PDG de Linagora, rappelait que la commande vocale s’annonce comme l’interface de demain, la prochaine vague de consommation du numérique. Mais lui aussi soulignait que le risque est que tous les services passent par le prisme de quelques acteurs centralisateurs et qu’ils privilégient certains services au détriment des autres. Le risque est bien à terme le renforcement de monopoles sur les services vocaux. Linagora développe notamment Linto, un produit libre, gratuit et open source pour que ceux qui développent des services puissent les « vocaliser » sans passer par des acteurs tiers. Les banques par exemple ne vont pas avoir envie qu’Amazon ou Google soient au courant des revenus de leurs clients… et ce d’autant qu’elles risquent demain de devenir leurs concurrents directs. Linto est un Alexa pour le monde de l’entreprise que chacun pourra utiliser en marque blanche pour développer ses propres services.

Les avantages de ces technologies sont nombreux, que ce soit en terme de réduction de la circulation de données, d’amélioration de la sécurité, de protection de la vie privée, des temps de réponse voir même d’éco-conception.

A l’heure où les assistants vocaux sont appelés à devenir la fonctionnalité de demain, il faut rappeler, comme le pointe très bien l’interview de Joana Revis, orthophoniste-vocologiste et maître de conférence associée à la faculté de médecine d’Aix Marseille Université pour le Laboratoire d’innovation numérique de la Cnil (@lincnil) combien la voix est spécifique et combien elle exprime nombre de nos caractéristiques : genre, âge, émotion, tempérament, caractéristiques psychiques, intensions… autant de caractéristiques qui peuvent être interprétées ou imitées par les machines. La commodité de la commande vocale ne doit pas se faire sur l’exploitation d’une donnée éminemment biométrique et personnelle comme la voix.

À lire aussi sur internetactu.net