La limite des mots-clefs

Nova Spivack, le président de Radar Networks, une start-up qui travaille à des solutions web sémantique, s’est récemment intéressé à la productivité des mots-clefs. Selon lui, à mesure que le web va devenir plus important et plus complexe, la productivité de la recherche par mots-clefs va rapidement décroître. Le langage naturel, s’il devrait être un meilleur moyen de chercher l’information, risque également de s’appauvrir avec le temps, parce que comme les mots-clefs, il ne peut pas vraiment voir ou utiliser la structure de l’information. Pour souligner combien le web sémantique va devenir la prochaine étape du web (Nova Spivack parle de Web 3.0 – et même de Web 4.0), il produit un schéma particulièrement éclairant. Selon lui, comme il l’illustre, sans le Web sémantique, la productivité des moteurs de recherche va stagner avant de décliner, parce que que le web va continuer à croître en taille et en complexité.

« Aujourd’hui, une requête typique sur Google retourne des centaines, des milliers, voire des millions de résultats – mais nous n’en consultons vraiment que la première voire la seconde page. Que faire des autres résultats que nous ne regardons pas ? […] La recherche par mots-clefs ne comprend pas le sens de l’information. La recherche en langage naturel est un peu meilleure pour comprendre le sens de l’information – mais elle ne s’intéresse pas plus à la structure de l’information. Pour vraiment améliorer la productivité de la recherche sur le web, nous aurons besoin de nouvelles approches qui structureront les données – c’est-à-dire qui seront capable de chercher dans et entre des bases de données structurées et pas seulement sur du texte sans structure ou de l’HTML semi-structuré. Tel est l’un des bénéfices du Web sémantique à venir : il va rendre possible de naviguer et rechercher dans le web comme dans une base de données. »

À lire aussi sur internetactu.net

0 commentaires

  1. Passionnante problématique parce que nous sommes concernés tant comme clients de l’information que comme éditeurs.
    La question « subsidiaire » et bientôt obligatoire, sera « quand vous dites , de quoi parlez-vous ? »

    J’ai un exemple tout frais avec le site – en projet – de Bordeaux Voiles.
    A votre avis, cet artisan bordelais propose-t-il des :
    1 voiles ?
    2 voiles ?
    3 voilages ?
    4 tauds, capotes et bâches ?
    La réponse est 1 et 4.
    Ah, pas 2 ? et bien non… pas 2.

    Généralisons : comment faire, aujourd’hui, pour qualifier de façon économique, efficace et pérenne nos sites, blogs, services en ligne, e-business etc. pour :
    – être facilement et pertinemment trouvable sur les systèmes de recherche (google, je veux dire)
    – apparaitre quand l’internaute cherche ce que l’on a à offrir et ne pas apparaitre s’il cherche autre chose (par exemple des… voiles, pièce textile d’habillement)

    Aujourd’hui, nous disposons de toute la richesse du vocabulaire pour remplir des pages de rédactionnel construit pour bien enrober le concept (ici « bateau », « GV », « foc », « enrouleur », « guindant » etc.) au cas où notre futur client aurait la bonne idée d’ajouter des mots clés dont la combinaison cerne son besoin. Mais ça va bien avec des internautes qui ont du vocabulaire… les autres, et bien ils prennent ce qui tombe sur la première page de recherche de leur ISP, si ça leur va à peu près, autrement ils laissent tomber et se détournent du média (lire : retournent regarder M6). Et qui sont les premières victimes ? Eux même !

    Je ne pensais pas aller ci loin, mais je suis obligé de conclure que l’impasse dans laquelle se trouve le web pré-sémantique est préjudiciable à la civilisation.
    Pfou… en effet, ça va loin…

  2. Eh bien, cela semble confirmer la pertinence de la conception du moteur de recherche EXALEAD qui offre dans son interface de résultats des outils nouveaux et puissants pour trier la foule des réponses, au moyen de la « Zapette », (en droite d’écran) laquelle se réfère à l’annuaire dmoz. Exalead offre en plus une option de visualisation réduite des pages web correspondantes par vignette, solution supprémentaire pour discriminer si besoin.

  3. Les internautes qui savent correctement se servir des moteurs de recherche et des multiples options de recherche survivront plus longtemps.

  4. vivisimo propose une recherche en cluster plutot efficace avec une classification thématique générée à partir des mots clés tapés et en fonction de l’index contenu dans l a base. Google ne propose pas une telle « augmentation » de la recherche. En fait le probleme est surtout une classification hierarchique ( rang 1, 2 3, etc …) pour des raisons commeciales ….

  5. Nous venons de mettre en ligne un nouveau service pour vous tous : Webzzle.com

    C’est une nouvelle approche pour développer le Web sémantique qui va bien au delà de ce qu’on a vu jusqu’à présent. Le système en est à son début mais il est prometteur. Plus de 1000 personnes l’utilisent en à peine 2 mois.

    Testez le vous aussi.