Moteurs de recherche (I)

Les outils de recherche d’information représentent le deuxième usage de l’Internet… après le mail. Sans eux nous sommes certains de nous perdre dans l’océan d’informations qu’est le web. Véritables guides, ils sont capables de lire 2 milliards de pages en une demi-seconde ou, mieux encore, de trouver un modèle économique ! Dans le même temps, les outils de recherche sont finalement comme le web : encore à l’état de prototype. Rencontre avec Olivier Andrieu, consultant, spécialiste des moteurs de recherche et du référencement, auteur du site www.abondance.com et de l’ouvrage « Trouver l’info sur le web », aux éditions Eyrolles… et avec Google, par la voix de Franck Poisson, responsable des ventes chez Google France.

Les outils de recherche d’information représentent le deuxième usage de l’Internet… après le mail. Sans eux nous sommes certains de nous perdre dans l’océan d’informations qu’est le web. Véritables guides, ils sont capables de lire 2 milliards de pages en une demi-seconde ou, mieux encore, de trouver un modèle économique ! Dans le même temps, les outils de recherche sont finalement comme le web : encore à l’état de prototype. Rencontre avec Olivier Andrieu, consultant, spécialiste des moteurs de recherche et du référencement, auteur du site www.abondance.com et de l’ouvrage « Trouver l’info sur le web », aux éditions Eyrolles… et avec Google, par la voix de Franck Poisson, responsable des ventes chez Google France.

Olivier Andrieu : « Nous allons vers une thématisation des moteurs de recherche »
Franck Poisson, Google France : « Il n’est pas question de rendre l’accès au moteur payant »

Olivier Andrieu : « Nous allons vers une thématisation des moteurs de recherche »

La recherche d’information est un enjeu fondamental dans l’usage de l’Internet, mais aussi un enjeu économique ?

D’autant plus économique que l’information est diffusée par les outils de recherche, qui finalement la détiennent quasiment. Donc les enjeux sont non seulement techniques, économiques mais aussi politiques.

Est-ce qu’aujourd’hui l’internaute lambda a effectivement tous les outils à sa disposition pour rechercher l’information ?

Ah, est-ce qu’ils les auront un jour ? En tout cas aujourd’hui l’internaute a de bons outils pour rechercher l’info. Ensuite, c’est comme tout : il faut savoir les utiliser. Mais en l’espace de six ans l’accès aux moteurs de recherche, et surtout leur facilité d’usage a évolué de façon extraordinaire. L’arrivée de Google en est un exemple frappant.

Dès qu’on évoque la recherche d’information on parle aussitôt de la possible commercialisation de cette recherche avec le risque, demain, de devoir payer pour rechercher une information. Mythe ou réalité  ?

Aujourd’hui c’est un mythe. Il y a énormément d’outils très efficaces, qui restent gratuits. On trouve vraiment tout ce qu’on veut à partir du moment où on sait utiliser ces outils. Ensuite, cette information il s’agit de la traiter, de la synthétiser, de la valider et c’est du travail. Mais pour identifier l’info je ne pense pas qu’il soit nécessaire d’utiliser des outils payants. On a peut être besoin de professionnels du traitement de l’information, mais c’est encore un autre domaine. Je sais que les spécialistes de la recherche d’info travaillent à mettre au point des outils plus pointus, avec des thématiques précises et qui seraient payants. D’ici quelques années, on y viendra. Mais pour l’instant dans la majorité des cas, les outils type Google ou Yahoo ! permettent de faire gratuitement des recherches et de très bien défricher un sujet.

Comment voyez-vous l’avenir de ces outils, leur évolution ?

On voit une grande orientation vers cette fameuse « thématisation » des moteurs de recherche. Il en existe aujourd’hui des centaines spécialisés dans le commerce, la santé, etc. Il y a même des outils de recherche spécifiques pour les étudiants. Une autre voie également s’oriente vers la régionalisation de la recherche : d’ici quelques années il va y avoir de plus en plus d’outils de recherche spécifique à une région. Le haut débit, quant à lui va surtout amener de nouvelles interfaces de type Kartoo.

Il y a eu plusieurs époques dans les outils de recherche : la première a été la grande période d’Altavista ; un excellent moteur qui nécessitait quand même une connaissance de la syntaxe d’interrogation, notamment la syntaxe avancée, la syntaxe booléenne. Puis, Google est arrivé en disant :  » nous savons que les utilisateurs tapent un ou deux mots clés ; plutôt génériques et nous allons essayer d’être pertinents sur cette base là ; sans demander aux gens de s’adapter au moteur. « 
L’étape suivante est peut être dans le type de moteur que l’on trouve sur AOL France ou sur Voilà, des moteurs qui tentent de proposer des pistes à l’internaute. Vous tapez  » sucre  » et on vous demande s’il s’agit de la ville de Sucrea en Bolivie, de recettes à base de sucre ou d’études sur le marché du sucre dans le monde.
Côté pseudo langage naturel il existe des systèmes comme Askjeeves qui sont déjà pas mal, c’est un des sites les plus consultés dans le monde anglophone. Ce n’est pas du vrai langage naturel mais c’est pas mal adapté au web. Il y a également d’autres voies comme le peer to peer avec des outils comme human speech, qui permettent de faire des recherches un peu comme le fait Napster : sur des fichiers, des favoris. Un outil qui peut être pas mal dans le cadre de communautés. Sachant que dans le cadre de communautés spécifiques type médecin ou banquier, de plus en plus les résultats s’achètent… En tout cas l’ordre des résultats et ça aussi il faudra en tenir compte dans l’avenir. Sur Altavista les liens payés sont quasi identiques aux liens naturels.

On parle également beaucoup du web invisible. De quoi s’agit-il exactement  ?

Le web invisible est celui qui n’est pas dans les moteurs. Toutes les archives du Figaro ou du Monde, par exemple, qui sont accessibles en mode payant, ou en passant par un formulaire internet de recherche n’apparaissent pas dans les moteurs. En général, le web invisible est tout ce qui est dans les bases de données. Beaucoup de sites web de commerce électronique sont dans le web invisible. Amazon est un cas typique. Pour pallier ce problème ils payent des gens pour en mettre un peu dans le web visible. On sait que le web c’est quatre à cinq milliards de pages. Mais le web invisible est lui impossible à quantifier.

À lire aussi sur internetactu.net