Où se situe l’intelligence des moteurs ?

Les analystes et les concepteurs de moteurs nous le répètent : nul ne sait faire le tour du web. Tant mieux, c’est certainement ce qui fait que notre curiosité et nos envies demeurent intactes. Pourtant, parce qu’ils sont l’une des premières voies d’entrées au web, les concepts qui sous-tendent des moteurs aussi étonnant que Google par exemple, sont intéressants à décrypter. Au moins par ce qu’ils nous disent en creux.

Quand Google dit qu’il n’a pas l’intention d’indexer l’ensemble du web, on peut le comprendre, car on est tout à fait à même de se dire que « l’infini », ne peut s’enfermer dans une machine, surtout quand l’univers est en expansion. Par contre, quand Franck Poisson nous dit que les pages non indexées ne sont pas forcément intéressantes, voilà qui nous interpelle plus avant. Parce que le « jugement » n’est pas fondé. Comme il le dit, il est celui d’une machine, d’un algorithme, certes ingénieux, mais pas forcément totalement pertinent. Ce n’est pas parce que c’est très référencé, très vu, très lu… que c’est bien, que c’est mieux. Ce n’est pas parce que le livre « d’Amélie Angot » est en tête des ventes qu’il est le plus intéressant. Ce n’est pas parce qu’on aime qu’on est objectif… Et ce n’est pas parce qu’on lit ou qu’on achète, qu’on est d’accord, qu’on trouve ça bien, etc. En même temps, il est certainement pertinent de dire que dans le numérique, dans le foisonnement numérique, parfois – mais pas tout le temps – la qualité se perçoit très vite. Quand on met des travaux universitaires en ligne par exemple (mémoires, thèses…), pour un spécialiste, la qualité, la vraie qualité du travail est tout de suite plus visible. Mais, ce n’est pas parce que telle thèse qui touche un sujet d’actualité est plus référencé, qu’elle est meilleure que les autres…

On ne peut – peut-être – pas tout attendre de l’intelligence des machines. Si l’on poursuit dans la réflexion, on voit en fait, que l’intelligence des moteurs est d’abord celle des internautes qui s’en servent. Avec l’expérience, on n’utilise pas un annuaire ou un moteur de la même façon qu’un néophyte. On touche mieux ce que l’on cherche, on sait mieux utiliser l’interface, mieux choisir les mots clés, mieux fouiller les résultats, mieux surfer sur les liens qui nous conduisent de pages en pages. On sait aussi avec l’expérience, fouiller ce web invisible, ce web déconnecté du web et aller y chercher précisément ce qu’on y cherche. Et là, il n’est pas sûr qu’un moteur y arrive seul. Pour renseigner, qualifier des informations, des contenus, on a encore besoin des hommes. Même si XML, le web sémantique ou le langage naturel vont peut-être pouvoir nous y aider ; leur action sera circonscrite à certains champs, à certaines données…

Bref, on voit que « le choix éditorial » (et non pas que le choix technique) des moteurs est à l’origine de véritables pertinences. Aujourd’hui, techniquement, Google est le meilleur. Outre ses nombreuses autres qualités, le choix de son algorithme est pertinent pour le plus grand nombre. Parce que les utilisateurs sont encore un peu perdus dans le foisonnement et qu’on se raccroche à ce qu’on connaît un peu pour avancer. On sait pourtant que du fait de sa profusion, du fait de ses lacunes, Google n’est pas forcément plus pertinent qu’une autre base de donnée comme BN-Opale de la Bibliothèque nationale, le site du Monde ou les bases de données du ministère de la Culture… Selon ce que l’on cherche, la qualification de l’information, son indexation, sa spécificité sont primordiales.

Bases de données du Ministère de la Culture :
http://www.culture.gouv.fr/culture/bdd/index.html
Les catalogues de la bibliothèque nationale :
http://catalogue1.bnf.fr/framesWEB.jsp;jsessionid=NQMQF3JPVLR3CMZR4DZ0DOQ
Aleph, est un exemple de petit moteur spécialisé dans le domaine des sciences humaines et sociales, dont le travail a pour base des sites spécialisées ce qui peut offrir un tri des résultats plus pertinent qu’un moteur généraliste.
http://www.aleph.ens.fr

À lire aussi sur internetactu.net