Lire électroniquement sur les lèvres

Apprendre à un logiciel à lire sur les lèvres n’est pas facile au moins parce que pour un mouvement peuvent correspondre plusieurs « sons ». Les êtres humains qui déchiffrent les paroles sur les lèvres utilisent le contexte de ce qui se dit ou l’expression faciale de leur interlocuteur pour s’aider… Si les ordinateurs n’en sont pas encore là, les recherches progressent. Des chercheurs d’Intel et d’IBM ont mis au point un programme qui permet d’associer à chaque mouvement des lèvres, les sons qui peuvent en être émis. Dans un environnement bruyant par exemple, en ajoutant une information visuelle (le visage et la bouche de son interlocuteur), la reconnaissance du langage peut être considérablement améliorée. IBM envisage ainsi d’ajouter une minuscule caméra aux microphones pour améliorer, grâce à ce procédé, les programmes de reconnaissance vocale.
L’info : Technology Review, septembre 2003 (enregistrement obligatoire)  : http://www.technologyreview.com/articles/innovation30903.asp?p=1
Le programme de recherche d’Intel « Audio-visual speech recognition » : http://www.intel.com/research/mrl/research/avcsr.htm

À lire aussi sur internetactu.net

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *