Moteurs de recherche vidéo, une nouvelle étape

L’indexation et les services de recherche dans les fichiers vidéo disponibles en ligne est un enjeu de taille. Les acteurs traditionnels s’affrontent déjà sur ce terrain mais quelques nouveaux entrants entendent tirer leur épingle du jeu.

Le monde des moteurs de recherche est en plein renouveau. D’un côté, Google multiplie les services pour étendre les possibilités en matière de recherche en ligne : Google Maps (navigation visuelle sur une carte et recherche textuelle et locale associée) ou Google Vidéo (recherche dans les programmes vidéo) sont ainsi venus s’ajouter à une longue liste de possibilités permettant à l’internaute de préciser la nature de sa recherche.

D’un autre côté, de nombreuses alternatives à Google sont apparues ces dernières années et, outre les grands portails, beaucoup d’entreprises proposent des moteurs généralistes ou spécifiques.

Parmi celles-ci figure Blinkx, qui peut paraître emblématique d’une nouvelle tendance pour les moteurs. Cette dernière s’exprime notamment par deux choses : les dossiers « intelligents » et l’indexation de fichiers vidéo.

La notion de « dossier intelligent » (smart folders) est relativement nouvelle. Elle consiste à permettre à l’utilisateur de ne plus seulement chercher dans le « passé » (ce qui a déjà été publié) mais surtout dans « l’avenir » (ce qui sera, peut-être, publié un jour). Ainsi, un utilisateur, après avoir saisi les mots clés définissant sa recherche, va-t-il constituer un dossier qui se remplira a posteriori, au fur et à mesure qu’ils apparaîtront, des résultats de sa recherche. Ce type de fonctionnement existe sur d’autres moteurs (notamment PubSub, pour les blogs) et devrait se généraliser sur les outils installés (en complément du système d’exploitation) sur le poste de l’utilisateur.

Mais la principale innovation de Blinkx est son service de recherche dans les fichiers vidéo issus de la télévision, surnommé Blinkx.tv. D’autres services proposent une fonction similaire (notamment Google ou Yahoo), mais ils reposent sur l’indexation de retranscriptions textuelles des vidéos, ou des pages Web qui les accompagnent. Blinkx fonctionne différemment. Le moteur parcourt le Web et identifie des fichiers vidéo. Ceux-ci sont lus et, via une technologie de reconnaissance de la parole, indexés sous forme de texte, synchronisé avec la vidéo. Comme le souligne Suranga Chandratillake, cofondateur de Blinkx, « non seulement nous savons qu’une expression a été prononcée dans un fichier vidéo, mais nous savons exactement à quel endroit elle l’a été » (extrait d’une interview-podcast avec Suranga Chandratillake).

Blinkx TV

Comme résultat de sa recherche, l’utilisateur se voit donc proposer des liens pointant vers des fichiers vidéo, dont la lecture démarre à l’endroit exact correspondant aux mots cherchés. Et potentiellement, l’intégralité du contenu de la vidéo devient « indexable » et « cherchable », de façon automatisée.

(On notera que d’autres outils fonctionnent de façon similaire : par exemple, Speechbot. Limité à l’audio, ce projet de recherche mené par HP propose de rechercher dans le contenu de plus de 15000 heures de programmes radio, indexées après reconnaissance vocale)

Un magnétoscope dans le moteur

Comme nous le suggérions en début d’année, l’indexation de la vidéo en ligne est un enjeu considérable pour l’avenir du Web.

Des outils comme Blinkx apportent assurément un début de solution. Mais celle-ci n’est pas forcément définitive. Par construction, l’indexation d’une vidéo est limitée à la bande son qui l’accompagne. Difficile d’envisager indexer avec cette méthode un documentaire animalier, simplement illustré d’une musique de fond. On peut même imaginer qu’une interview ne contienne pas forcément tous les mots-clés définissant au mieux la personnalité qui s’exprime. Et, plus généralement, ce type d’indexation souffre des mêmes désavantages que celle du web lui-même. En cherchant dans Blinkx des interviews télévisées de Steve Jobs, je suis ainsi parvenu à un extrait vidéo de la BBC dans lequel le présentateur, répondant à un téléspectateur, explique qu’il aimerait un jour effectuer une interview de Steve Jobs…

Il est donc probable qu’il soit nécessaire de coupler plusieurs techniques (en particulier des metadonnées) pour parvenir à une indexation globale et pertinente du contenu en ligne, en particulier des vidéos.

Mais les technologies existantes augurent déjà d’usages nouveaux. Certains d’entre eux ne sont pas très éloignés de ce que l’on pourrait appeler un « magnétoscope sur IP ». Indiquez quelques-unes de vos stars favorites et un répertoire intelligent – accessible à tout moment en ligne – se remplira à l’avenir des liens vers des vidéos qui correspondent aux programmes télévisés dans lesquels elles apparaissent. Indiquez un film dont vous attendez la sortie, et vous serez alerté dès que sa bande annonce est disponible en ligne…

Un dicton des temps modernes se résumait jusqu’à présent en « Soyez accessibles par Google, ou vous mourrez ». Le conseil s’adresse notamment aux créateurs de contenus au format texte, mais pourrait bien désormais s’appliquer aux producteurs d’émissions télévisées.

Reste à savoir de quels contenus on parle. D’une manière un peu paradoxale, on constate l’apparition d’une dichotomie artificielle : les nouveaux moteurs vidéo n’indexent que les contenus de programmes télévisés et semblent ignorer les autres contenus vidéo en ligne. La vidéo sur l’internet a déjà ses « classiques », sous la forme de petits films que tout internaute « se doit d’avoir vu » (et, le plus souvent, a effectivement vu) : Bad Day, Star Wars Kid ou Numa Numa Dance, téléchargées chacune par plusieurs millions, voire dizaines de millions d’internautes, ne sont que les premiers épisodes « cultes » du vaste programme télévisé mondial que pourrait devenir l’internet.

Bad DayNuma Numa Dance

Or la recherche de ces vidéos sur les nouveaux moteurs de recherche dédiés illustre bien leurs limites actuelles. En cherchant « Numa Numa Dance » sur Blinkx, on ne trouve rien en rapport avec la fameuse vidéo, tandis que Google Vidéo ne rapporte qu’un seul résultat, ô combien significatif : une émission télévisée de la chaîne ABC qui chronique le phénomène engendré sur l’internet par la désopilante danse de Gary Brolsma… (dans le même temps, la version traditionnelle de Google fournit en réponse à la même requête pas moins de 150 000 pages web – dont la plupart conduisent à la vidéo en téléchargement)

Pourtant, comme le souligne sur son blog Roger McNamee, l’un des investisseurs qui supporte Akimbo, un système de distribution de contenu vidéos télévisés via l’internet, « dès à présent, les utilisateurs consomment de la vidéo sur l’internet – principalement sous la forme de vidéos au format court ou d’animations ; ils sont en train de développer des habitudes de consommation qui peuvent potentiellement menacer l’hégémonie dont Hollywood pouvait se prévaloir jusqu’à présent en matière de contenu vidéo ».

Ce décalage étonnant, qui conduit à séparer les contenus vidéo par type de producteurs (en schématisant, les chaînes télévisées d’un côté, les productions amateurs de l’autre) n’a donc pas beaucoup de sens. Dans une certaine mesure, il est pourtant renforcé par des services un peu similaires à celui de Blinkx, mais dans le monde de la télévision traditionnelle (voir par exemple TiVo, Akimbo ou tvtv.fr). On peut même arguer qu’une sorte de divergence est en train de s’opérer, entre d’un côté le monde du net et de l’autre celui de la télévision. Entre d’un côté des services « 100 % Web », qui traitent indifféremment le texte, les liens hypertextes, le son et l’image, fixe ou animée, et s’utilisent avec un navigateur traditionnel, et de l’autre des services à valeur ajoutée proposés via des décodeurs numériques et autres services propriétaires, accessibles sur un téléviseur. Ou, enfin, entre une logique de moteur de recherche (qui parcourt le web et indexe les vidéos qu’il y trouve) et le principe d’annuaire (une sélection de programmes « approuvés », rangés et classifiés en grandes thématiques).

Il est probable que cette divergence s’accroisse encore davantage. Les fondateurs de Blinkx semblent – logiquement – favorables à l’élargissement du service, pour traiter notamment les fichiers qui s’échangent sur les réseaux P2P (lire par exemple cet article, qui s’interroge par ailleurs sur les modèles économiques des nouveaux outils de recherche). Si le défi n’est pas trivial, ni au plan technique, ni au plan juridique, il semble en effet utile – et même nécessaire – de le relever pour parvenir à des outils d’indexation conformes aux pratiques en vigueur sur le web.

Les moteurs vidéo, Blinkx en tête, ont passé une première étape dans l’indexation nécessaire de contenus qui n’étaient jusqu’alors que peu, difficilement ou pas du tout accessibles en ligne via des moteurs de recherche. Mais il leur reste maintenant à intégrer le fait – ou à le faire admettre – que l’immense majorité du contenu vidéo de demain ne proviendra pas de chaînes télévisées, mais des internautes eux-mêmes.

À lire aussi sur internetactu.net

0 commentaires

  1. Tout d’abord merci pour vos articles de très grandes qualités et je profite de ce commentaire pour citer Pooxi.com qui j’espère méritera sa place dans un prochain article.