De la prévisibilité des tendances de recherche

Yoosi Matias, Niv Efron et Yair Shimshoni, chercheurs aux Google Labs d’Israël travaillent sur Google tendance de recherche, l’outil qui permet d’accéder aux pratiques de recherches des utilisateurs du moteur. Comme ils l’expliquent dans un billet sur le blog de Google Research, l’évolution de certaines requêtes sont très saisonnières, comme la recherche « ski » liée à l’hiver, ou celles autour du basket-ball liée aux matchs. « Lorsque l’on regarde les tendances de l’ensemble du volume de recherches liées à des catégories particulières, on observe des habitudes régulières dans certaines catégories »… Des tendances assez prévisibles qui finissent même par se répéter d’année en année. Bien sûr, ceci n’est pas valable pour toutes les catégories : les tendances sont très irrégulières et difficiles à prévoir, notamment en ce qui concerne des requêtes liées à des évènements, des personnalités ou de l’information.

On comprend vite l’intérêt de pouvoir établir des estimations des tendances de recherches à venir, comme l’a montré le travail d’autres chercheurs de Google sur la grippe aviaire. Quelles sont donc les requêtes qui sont les plus prévisibles ? Quelles sont les thématiques les plus prévisibles et comment se fait la distribution de la prévisibilité entre les différentes catégories ?

A ce jour, le travail des chercheurs (.pdf) montre que :

  • plus de la moitié des requêtes les plus populaires de Google sont prévisibles sur une période de 12 mois, avec un taux d’erreur moyen de 12 % environ. Et à contrario, bien évidemment près de la moitié des requêtes les plus populaires ne sont pas prévisibles.
  • Certaines catégories sont particulièrement prévisibles (la santé, l’alimentation et la boisson, les voyages…), alors que d’autres le sont beaucoup moins (le divertissement, les communautés en ligne…).
  • Les tendances de requêtes agrégées par catégories sont plus prévisibles qu’isolées.
  • Il existe un lien évident entre la prévisibilité et la saisonnalité pour de nombreux types de requêtes.
  • L’intérêt est de montrer à la fois la réalité des requêtes et le niveau de prévision de la méthode utilisée, car tout se joue dans les écarts.

Comme souvent avec Google, le modèle a été jugé suffisamment pertinent pour qu’il soit dès à présent intégré à Google tendance de recherche. Quand vous faites une requête, vous pouvez désormais avoir accès aux prévisions de recherches sur ce terme pour les 12 prochains mois.

La requête ski dans Google trends avec les tendances à venir
Image : La requête ski dans Google Trends avec les tendances de requête à venir sur ce terme.

Comprendre la chaine alimentaire

L’algorithme de Google peut d’ailleurs servir à bien d’autres choses, comme le raconte Wired. Les scientifiques savent depuis longtemps que la chaîne alimentaire et les interactions entre espèces sont des éléments clefs dans la compréhension des facteurs qui président à l’extinction des espèces. D’où l’idée de Stefano Allesina, écologiste à l’université de Californie, et Mercedes Pascual de l’université du Michigan, d’adapter l’algorithme de Google, le célèbre PageRank, à la chaîne alimentaire, comme l’explique leur article publié dans PLoS. L’idée était de répondre à la question : quelle extinction d’espèce, dans un réseau alimentaire, pouvait conduire à la plus grande réaction en chaîne ?

L’algorithme de Google permet de prendre en compte les connexions entre espèces, mais aussi leur importance relative. « Ce que nous avons prouvé c’est que l’importance d’une espèce peut être connectée à la quantité de matière qui s’écoule d’eux », explique Stefano Allesina. « Si une espèce mange beaucoup de choses et que beaucoup de choses la mangent, elle tend à être importante. »

La plupart des défenseurs de l’environnement concentrent leur action et leur étude sur une seule espèce. Or il faut tenir compte du fait que les espèces sont interdépendantes et qu’elles sont empêtrées dans un réseau d’interaction multi-espèces. Pour les écosystèmes sur le point de s’effondrer, comme les environnements marins mis en périls par la surpêche, Allesina affirme qu’une approche réseau pourrait faire toute la différence dans les politiques de préservation à mettre en place.

À lire aussi sur internetactu.net

1 commentaire

  1. Prétendre utiliser le PageRank est amusant et publicitaire.

    Ils auraient pu aussi dire utiliser une matrice de Leontieff des consommations inter-espèces : cela aurait été à mon avis plus pertinent, mais évidemment moins « trendy ».

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *