Nos tweets peuvent-ils prédire une attaque cardiaque ?

Maria Konnikova (@mkonnikova) pour le New Yorker se demande si les tweets peuvent prédire notre risque d’accident vasculaire. Oui, je sais, ça n’a pas l’air très sérieux dit comme ça, mais donnons-lui le crédit de nous expliquer pourquoi…

Nos tweets, comme tout ce qu’on poste en ligne ou les traces qu’on laisse de soi sur les réseaux disent beaucoup de nous. En tout cas, c’est ce que montre AnalyzeWords, un outil en ligne d’analyse de nos tweets élaboré par le psychologue de l’université du Texas James Pennebaker qui étudie depuis longtemps les liens entre le langage, le bien-être et la personnalité (Xavier de la Porte l’avait évoqué dans une de ses chroniques en montrant que la manière dont les couples s’expriment entre eux pouvait prédire le succès de leur relation). Pennebaker dirige un programme de recherche appelé Linguistic Inquiry and Word Count (Liwc) qui repose sur logiciel d’analyse de texte qui calcule les mots que nous utilisons, leur fréquence et contexte pour évaluer notre état psychologique. Depuis sa création, le Liwc a montré les liens entre les mots que nous utilisons et notre comportement, en s’intéressant notamment aux mots de remplissages et aux mots fonctions, ces mots qui servent à relier d’autres mots (”quelque chose”, “ce”, “et”, “je veux dire”, “vous savez”,…). Pennebaker et ses équipes ont ainsi montré que les mots qu’on utilise lors d’une première rencontre peuvent prédire l’intérêt de chacun, ou que les mots que nous utilisons indiquent clairement notre place sociale ou notre place hiérarchique ou encore qu’ils peuvent très précisément dire si nous sommes une femme ou un homme, un jeune ou un vieux, quelqu’un de consciencieux ou pas… Bien évidemment, à l’heure où tous nos mots sont accessibles en ligne, ce type d’étude est désormais capable d’accéder à un contenu encore plus vaste pour tenter de trouver des corrélations encore plus significatives. Mais corrélation n’est pas causalité.

Des chercheurs de l’université de Pennsylvanie sous la direction du psychologue Johannes Eichstaedt (directeur du World Well-Being Project) ont analysé 826 millions de tweets provenant de l’ensemble des comtés américains et ont donné à chaque comté un profil émotionnel pour voir si cela se corrélait avec le nombre de décès par maladie cardiaque. Et bien c’était le cas. Les comtés où les tweets contenaient des mots les plus hostiles, agressifs, haineux étaient également ceux où le taux de décès par maladie cardiovasculaire était les plus nombreux. Inversement, là où les tweets avaient tendance à refléter des émotions plus positives, le taux de décès par maladie cardiaque était moins fréquent.

Certes, il est connu que le stress, la colère, la solitude augmentent le risque cardiovasculaire. Pour autant, comme l’ont souligné les chercheurs, les gens qui tweets ne sont pas ceux qui meurent ! La plupart des utilisateurs de Twitter n’ont pas l’âge des maladies cardiaques. Ceux qui tweetent leur ressentiment n’ont pas de liens directs avec ceux qui ont plus de risque d’avoir une maladie cardiovasculaire… Pour les chercheurs, le langage utilisé sur Twitter est une fenêtre sur les effets puissants du contexte communautaire. D’autres études épidémiologiques ont montré que des faits généraux d’une communauté comme sa cohésion sociale ou son capital social ont des conséquences sur la santé des individus qui la compose. D’une manière générale, rappelle Konnikova, les gens qui vivent dans les communautés les plus pauvres ou les plus fragmentées sont en moins bonne santé que ceux qui vivent dans des communautés plus riches ou plus intégrées. En fait, le pouvoir de prédiction de Twitter s’explique en grande partie par les variables socio-économiques des communautés que les individus représentent. Les tweets négatifs, stressés ou en colère des plus jeunes reflètent le stress de leur environnement et cet environnement a un effet sur la santé des plus âgés.

Cette recherche est caractéristique des Big Data appliquées à la psychologie, estime Maria Konnikova. Une façon de faire la lumière sur les tendances culturelles et sociales difficiles à appréhender dans les enquêtes de terrain. Pennebaker utilise actuellement des données provenant de Twitter pour comprendre comment certaines valeurs comme la cohésion familiale ou la foi évoluent au fil du temps.

En 2013, des chercheurs de Microsoft ont utilisé 70 000 tweets de personnes soufrant de dépression pour créer un index prédictif permettant d’identifier d’autres utilisateurs déprimés en fonction de leurs messages sur les médias sociaux. Leur modèle sert également à prédire le risque de dépression postnatale chez les nouvelles mères, simplement en analysant les mots qu’elles utilisent dans leurs tweets. Demain, les psychiatres pourraient obtenir l’autorisation de leurs patients pour avoir accès à leurs appels téléphoniques, e-mail et profils sociaux pour savoir si leur état dépressif augmente…, imagine Eichstaedt (ils n’auront certainement pas besoin d’accéder à tout cela, puisque des applications se proposent déjà de déterminer le niveau de déprime de leurs utilisateurs). Indépendamment de leur valeur prédictive, Pennebaker rappelle que les médias sociaux peuvent aussi avoir une valeur thérapeutique : certaines de ses études ont montré que tenir un journal permet de récupérer plus rapidement d’expériences négatives. Une étude de 2013 montrait d’ailleurs que cet effet était encore plus marqué pour les blogueurs qui publient des articles ouverts aux commentaires et au public.

Hubert Guillaud

À lire aussi sur internetactu.net