Évaluations : comment sommes-nous passés de l’amélioration au contrôle ?

À l’heure où chaque service en ligne nous demande sans cesse de l’évaluer, n’allons-nous pas basculer dans une fatigue de la rétroaction permanente ? C’est la question que pose la professeure d’anglais, spécialiste des humanités numériques, Megan Ward (@meganeward1) pour The Atlantic, auteure de Seeming Human, un livre qui s’intéresse à comment la littérature victorienne a travaillé à rendre ses personnages réalistes en refusant la « mécanicité » au profit de l’intériorité, alors que bien souvent la routine et la prédictibilité, sont les caractéristiques des personnages réussis.

Dans son article pour The Atlantic, Megan Ward explique que nous sommes harcelés de demandes de commentaires, de notes, de rétroaction, de feedback… « Les entreprises assurent que les commentaires des utilisateurs sont importants pour elles, mais sans que cela n’entraîne de changements perceptibles ». Peu à peu, nous avons plutôt l’impression de devoir répondre à un harcèlement sans fin, jusqu’à n’être plus qu’un rouage du digital labor dans la machine censée la faire tourner.

Megan Ward rappelle qu’on peut faire remonter l’importance de cette boucle de rétroaction – qui motive cette injonction à notre participation – aux théories de Norbert Wiener, l’inventeur de la cybernétique, pour qui la rétroaction était une méthode générique de contrôle d’un système, visant à utiliser les résultats passés pour modifier les performances à venir des systèmes. « La cybernétique a promis une utopie de l’autorégulation systémique », expose-t-elle. Les êtres humains, comme les machines, peuvent modifier leurs comportements en tirant les leçons de leurs succès ou échecs passés. Loin de caractériser un automate sans âme, la boucle de rétroaction était censée témoigner du pouvoir d’adaptation des machines comme des hommes (« l’usage humain des êtres humains » qu’évoquait Wiener dans Cybernétique et société). Comme l’exprimait Stafford Beer dans son livre Decision and control : « Si la cybernétique est la science du contrôle, le management est la profession du contrôle ». Mais pour les théoriciens du management, le contrôle par la rétroaction s’est rapidement imposé comme étant bien plus important que l’amélioration. Plus que d’améliorer la régulation des systèmes, la boucle de rétroaction avait surtout la vertu de permettre de garder le contrôle. Si la rétroaction négative améliore l’efficacité et la performance, la rétroaction positive, elle, pousse le système à sa propre performance, comme un thermostat qui chaufferait un appartement vide. Aujourd’hui pourtant, la valeur de la rétroaction s’est inversée, explique Megan Ward. Les commentaires positifs sont devenus le Saint Graal des plateformes d’évaluation alors que les commentaires négatifs, eux, sont bien souvent devenus problématiques. Tant et si bien que pour elle, les systèmes d’évaluation n’aident plus à construire une meilleure expérience : ils l’homogénéisent. Les restaurants ou les hôtels mal notés sur TripAdvisor ou sur Google sont relégués au fin fond des listes de résultats et, plus qu’un contrôle de qualité, le feedback développe surtout des effets d’homogénéisation de l’offre. La rétroaction positive devient une évaluation du service plus qu’une mesure de la performance du système. Et les évaluations ne remontent plus vraiment dans le système qu’elles sont censées évaluer. En fait, c’est un peu comme si le développement de métriques faisait reculer l’amélioration de la performance qu’elles étaient censées produire. Le feedback est recherché pour lui-même, comme le pointait Jerry Muller, comme si tous les commentaires, dans leur surproduction, étaient devenus interchangeables. La mesure dépend plus du nombre et de la rapidité des réactions que de leur pertinence ou de leur qualité, qui semblent ne plus avoir une grande importance.

Pourtant, pour Wiener, toutes les rétroactions n’étaient pas égales : la bonne rétroaction n’est pas un flux sans fin, mais un flux qui s’adapte au modèle de performance du système. Or, « le fait de valoriser indifféremment tout type de retour d’information provenant de n’importe quelle source réduit sa capacité à réguler le système ». Les critiques que l’on trouve sur Amazon ou Yelp ne sont pas inutiles pour autant, mais elles ne sont pas utilisées pour améliorer ce qu’elles évaluent.

Pour Megan Ward, peut-être que ces retours d’utilisateurs sont trop passionnés, désordonnés… pour produire de l’amélioration. « Le problème des boucles de rétroaction n’est peut-être pas que les boucles de rétroaction sont déshumanisantes, mais qu’elles ne le sont pas assez ».

L’enjeu n’est donc peut-être pas de recueillir toute forme de rétroaction, de notation ou de commentaire, mais de rechercher les rétroactions qui vont permettre d’améliorer le fonctionnement du système. La rétroaction ne signifie pas qu’on vous écoute et cliquer sur un like n’est définitivement pas la même chose que faire entendre sa voix… Trop souvent, la rétroaction consiste in fine à introduire du bruit dans le système, quand recueillir moins d’information, de meilleure qualité, plus pertinente, pourrait elle produire de meilleurs résultats.

Un article du Chronicle of Higher Education permet de mettre un peu de contexte à cette question de la rétroaction et de l’évaluation. L’article de Nancy Bunge professeur émérite de littérature à l’université d’État du Michigan fait le point sur les limites de l’évaluation des professeurs par leurs étudiants. La recherche montre depuis longtemps que nombre de facteurs contaminent ces évaluations : des biais de genre, des critères de beauté viennent polluer massivement ces enquêtes, alors qu’elles ont un impact réel sur l’évaluation des professeurs (la mathématicienne Cathy O’Neil nous avait déjà alerté sur les limites des méthodes d’évaluation des professeurs aux États-Unis). Un des autres biais très connus est que les étudiants ont tendance à mieux évaluer les professeurs qui les notent les plus généreusement. Enfin, les évaluations poussent les étudiants à se prendre pour des clients et encourage à les déresponsabiliser de leur éducation, comme si leurs profs en étaient les seuls responsables. Pour Nancy Bunge, l’évaluation créée des étudiants passifs et arrogants qui sapent l’esprit de classe et tirent la qualité vers le bas.

Entre la partialité des évaluations et le fait que les résultats de celles-ci soient peu corrélés aux résultats des étudiants, plusieurs institutions américaines se posent donc la question de réformer ces formes d’évaluation. L’université de Californie du Sud (USC) par exemple a récemment modifié son questionnaire d’évaluation, rapporte Inside Higher Education. Les étudiants évalueront toujours leurs professeurs, mais également leur propre implication et ces évaluations ne seront plus utilisées pour prendre des décisions sur l’affectation des professeurs. Les questionnaires ont supprimé les questions de popularité, pour privilégier des questions sur la conception du cours, son impact, les pratiques pédagogiques… Les étudiants sont également désormais invités à interroger leur apport au cours.

Si les établissements restent accrochés aux évaluations traditionnelles, c’est parce qu’elles sont faciles et qu’elles permettent en quelques minutes d’obtenir un résultat et des classements, qui seraient bien plus longs à obtenir, si l’établissement devait par exemple visiter les salles de classe, relire les programmes, contrôler les rendus… C’est pourtant dans ce sens que souhaite aller également l’USC, en introduisant une évaluation par les pairs, c’est-à-dire par d’autres professeurs, basée sur une observation des cours, un examen des matériaux de cours et de travaux pratiques… afin qu’ils améliorent la qualité des cours et de l’éducation.

Pour répondre à la tyrannie des métriques, il faut assurément remettre sans arrêt en question ce qu’elles produisent et comment elles sont produites, en vérifiant sans cesse qu’elles produisent bien de l’amélioration plutôt que du contrôle.

À lire aussi sur internetactu.net