La hiérarchie des connaissances est elle vraiment dépassée ?

« Le Futur du web a 100 ans », un titre étrange pour un article de la revue en ligne Nautilus (@nautilusmag) sur les idéologies qui ont façonné la toile au cours du dernier siècle. Si les noms de Vannevar Bush et Ted Nelson nous sont connus, l’auteur, Alex Wright (@alexgrantwright), nous fait découvrir d’autres acteurs bien moins fameux, comme l’inventeur et avocat belge Paul Otlet, ou bien célèbres, mais dans un domaine très différent, comme c’est le cas de H.G. Wells. Mais si « Le Futur du web a 100 ans », c’est parce que, selon Wright, certaines des idées de ces pionniers, depuis longtemps oubliées et rejetées, pourraient bien, dans un avenir proche, se révéler des sources d’inspiration pour rénover la structure du réseau, qui connaît actuellement des problèmes de plus en plus handicapants.

C’est donc au XIXe siècle, explique Wright, que le désir de créer un système mondial d’organisation des connaissances commence à se manifester chez certains penseurs. En effet, à cette époque, certains se montrent, pour la première fois, inquiets de la surcharge d’informations, de l’infobésité comme on dit aujourd’hui : les journaux commencent à se multiplier, l’imprimé s’installe partout, avec deux fléaux inévitables : la primauté de la quantité sur la qualité, et le caractère éphémère d’une bonne partie des informations.

Le rêve d’une encyclopédie universelle

51ZgP6tpzELPour Alex Wright, cette quête d’un encyclopédisme universel va prendre deux directions différentes des deux côtés de l’Atlantique. Côté européen, il s’intéresse particulièrement à Paul Otlet ; il est d’ailleurs l’auteur d’un livre, Cataloging the World, entièrement consacré à l’avocat belge. Ce dernier cherchait à créer un « répertoire bibliographique universel » et pour cela s’associa à son collègue juriste Henri La Fontaine (qui se lancera par la suite dans la politique et obtiendra le prix Nobel de la paix en 1913). Ensemble ils vont fonder le Mundaneum, un gigantesque espace, à la fois musée et bibliothèque, comportant plus de 100 salles…

Les deux hommes créeront la Classification décimale universelle (CDU), s’inspirant du travail plus ancien de Melvil Dewey. Ce système a encore cours dans des bibliothèques universitaires ou à Beaubourg, bien que son « ancêtre », la classification Dewey, ait tendance à le remplacer de plus en plus (les bibliothèques municipales utilisent Dewey).

Ces systèmes sont bien sûr totalement opposés à la vision du web. Ils impliquent l’existence d’un grand nombre de « curateurs » autrement dit des conservateurs et des bibliothécaires susceptibles de catégoriser chaque ouvrage à la bonne place – avec toutes les ambiguïtés et les désaccords que ça entraîne, évidemment. Mais contrairement à son prédécesseur, Dewey, Otlet était très conscient de la difficulté de placer un document en un seul et unique lieu. C’est pourquoi il peut être considéré comme l’inventeur des premiers hyperliens. En effet, en sus de son système de classification hiérarchique et traditionnel, Otlet introduisit des tables auxiliaires proposant un système de code établissant des relations horizontales entre les domaines de l’arborescence.

Wright cite d’autres chercheurs européens mûs par la même obsession, comme Wilhelm Ostwald ou Emanuel Goldberg, mais c’est H.G. Wells qui reste le plus remarquable. L’auteur de La Guerre des mondes est connu pour s’être investi dans une multitude de causes, mais j’avoue que sa passion pour l’encyclopédisme m’avait échappé. Pourtant, en 1938 il publiait une série d’essais sous le titre très « cyber » de Cerveau planétaire.

« Toutes les angoisses et les horreurs du temps présent sont fondamentalement intellectuelles, écrit-il. Le monde doit unir son esprit. » Un propos particulièrement intéressant de Wells, puisqu’anticipant, avec quarante ans d’avance, les espoirs utopiques des premiers prophètes du web…

Là encore, Wells envisage un système hiérarchique, contrôlé par des milliers de « bibliothécaires » qu’il nomme des « samouraïs »…

Le web : anarchisme et individualisme américain

Ce désir d’une hiérarchie des connaissances est donc essentiellement mû par un espoir utopique, et non par un désir autoritaire de contrôler la connaissance conclue Wright. Mais aux Etats-Unis va naître une autre utopie, celle du web, « plat » et non hiérarchique telle que nous le connaissons.

Paul Otlet / Informationsmanagement

Vannevar Bush est bien plus connu qu’Otlet, même en France. C’est lui qui, avec le « Memex« , va imaginer un système d’organisation des documents sans hiérarchie, uniquement basé sur un système d’association et de liens. Bizarrement le nom de « Memex » est revenu dans l’actualité ces derniers jours, puisque c’est ainsi que la DARPA a baptisé son moteur de recherche conçu pour explorer le « deep web » ou le « dark web », les millions de pages non indexées par les moteurs traditionnels comme Google et souvent associés à diverses activités criminelles…

L’idée de Vannevar Bush allait passionner Douglas Engelbart, inventeur de la souris, qui allait essayer de matérialiser le projet en en créant une première version nommée le « oN-Line System » ou NLS, dont il fait la démonstration en 1968, en compagnie de ses nouvelles interfaces homme-machine, lors de ce qu’on a appelé « la mère de toutes les démos« . Le concept allait attirer l’intérêt des adeptes de la contre-culture naissante. Ken Kesey, le romancier auteur de Vol au dessus d’un nid de coucou et créateur des fameux Acid Tests, aurait dit du NLS que « c’était la chose la plus importante après l’Acide ». A noter que le célèbre Stewart Brand, qui aida à l’organisation de « la mère de toutes les démos » faisait également partie de la bande de Kesey, les « Merry Pranksters« …

Il y aurait d’ailleurs encore beaucoup à dire sur les liens entre les mouvements hippies et le gout pour l’encyclopédisme. Par exemple, à la même époque, Timothy Leary, autre grande figure du psychédélisme, créait la fondation Castalia, « Castalia » étant un hommage au livre d’Hermann Hesse, Le jeu des perles de verre qui met en scène, lui aussi, un système d’organisation globale de la pensée humaine, cette fois sous la forme d’un jeu…

Ted Nelson, qui reprit l’idée avec son projet Xanadu, partage aussi cette fibre anarchiste et ne fait pas mystère de sa répulsion pour les institutions et les hiérarchies, et particulièrement pour l’institution, universitaire « qui développe en chacun de nous l’attitude que le monde est divisé en « sujets », que ces sujets sont bien définis et bien compris, et qu’il existe des « bases », c’est-à-dire une hiérarchie de compréhension. »

Les limites du web « horizontal »

Pourquoi donc, alors que le web « horizontal » est entré dans les mœurs, au point de renouveler complètement les discours sur les organisations, l’éducation, et la société elle-même, revenir sur les tentatives « dinosauriennes » de classification verticale des connaissances, fussent-elles imaginées par des écrivains prestigieux comme H.G. Wells ?

C’est parce qu’en fait ce type de structuration anarchique n’a pas tenu toutes ses promesses. Selon Wright : « Là où Otlet et Wells envisageaient des organisations transnationales financées par le service public, nous avons maintenant une oligarchie de corporations. »

De fait, précise-t-il : « En conséquence, la plupart d’entre nous comptent sur les entreprises à but lucratif pour rendre le web sûr, utile et utilisable. Aujourd’hui, Google et une poignée d’autres grosses compagnies Internet comme Facebook, Twitter, et Amazon se voient accorder le rôle qu’Otlet envisageait pour le Mundaneum : canaliser la production intellectuelle de la planète. Google exclut comme il le désire les sites de son index pour des raisons qu’il n’est pas tenu de divulguer – les secrets du robot Googlebot sont des mystères delphiques connus de son seul cercle intérieur d’ingénieurs. Un nombre croissant d’utilisateurs du web adoptent la recherche par mot clé et la timeline de Facebook comme leurs interfaces fondamentales ».

Au final, affirme-t-il : « Alors que le web peut être horizontal et ouvert tant dans l’imagination du public que dans la rhétorique du World Wide Web Consortium, un tel réseau plat est peut être tout autant utopique et inaccessible que la bibliographie universelle d’Otlet. »

Et Wright de noter que le web sémantique pourrait bien constituer une alternative par sa création d’ontologies très proches, dans leur système de classification, des entreprises d’Otlet… Tout en reconnaissant que ce projet date de 2001, qu’il a été très largement critiqué…

Pourtant, s’il est vrai que le web sémantique repose sur des ontologies ou des systèmes de classification hiérarchiques, rien n’empêche d’élaborer plusieurs ontologies concurrentes, aucune ne prétendant organiser le web à elle toute seule. Autrement dit, le web sémantique serait tout aussi horizontal que le web classique, mais à un niveau meta. De fait lorsque chacun d’entre nous organise son flux RSS (une technologie qui a elle aussi tendance à disparaître, je sais bien, mais qui restera à mon avis indispensable à ceux qui font profession de collecter et analyser l’information…) il crée sa propre ontologie, son propre « web sémantique ». D’ailleurs, à l’origine RSS était l’acronyme de RDF Site summary, RDF (Resource Description Framework) étant le « langage » propre au web sémantique (depuis, on a supprimé la référence à la RDF, sans doute parce que c’était un gros mot, et RSS veut maintenant dire « Really Simple Syndication »).

Un autre bon exemple d’un système hiérarchique cohabitant avec le web serait WolframAlpha. Ce « moteur de recherche », si on persiste à l’appeler ainsi, cherche en réalité une réponse numérique à diverses questions à partir d’un petit nombre de documents scannés et mis en forme par une équipe de moderne « samouraïs », pour employer l’expression de Wells. A noter que Wolfram se montre très critique vis-à-vis du « web sémantique » et de son système de catégories trop « médiévales » à son avis, sans pour autant se jeter dans les bras d’un système purement horizontal et anarchiste.

Il me semble qu’on aura toujours besoin de samouraïs, de classificateurs soucieux de faire partager leur organisation de la connaissance. Mais plutôt qu’opposer les classifications hiérarchiques de type Otlet à un web plat et horizontal, il vaudrait mieux imaginer des îlots de hiérarchie surnageant dans un océan d’information non structurée.

Wright émet dans son article l’hypothèse que le « web des données », concept selon lequel le réseau pourrait être organisé automatiquement par des algorithmes, pourrait nous permettre de nous passer des « curateurs » humains. Je me permets d’en douter. Je ne vois pas personnellement comment un algorithme pourrait à lui seul reproduire la page du prix Nobel Gerard’t Hooft sur les bases de la physique théorique, par exemple. De même, lorsqu’on fait une recherche en profondeur, il est préférable de faire confiance au site d’un spécialiste et suivre les liens de sa page Web ou son blogroll, plutôt que se lancer à corps perdu dans une recherche Google par mots-clés. Rien ne vaut un catalogage par un expert, et à mon avis pour un bout de temps encore.

Rémi Sussan

À lire aussi sur internetactu.net

0 commentaires

  1. Merci pour cet article qui reprend parfaitement ce que je raconte à mes étudiants dans mes cours ainsi que dans mon dernier ouvrage La Documentation dans le numérique ainsi que dans du Tag au Like.
    Je constate également que les américains redécouvrent une généalogie plus longue de cette histoire et c’est intéressant.

  2. Entant que point de vue personnel sur l’apprentissage de la physique, la page de Gerard ‘t Hooft « HOW to BECOME a GOOD THEORETICAL PHYSICIST » est intéressante. Mais entant que hiérarchisation/agglomération d’informations, je préfère un algorithme qui analyse automatiquement des Gigas de publications scientifiques pour m’informer de ce que je dois connaître pour être un bon chercheur en physique. Ce dernier a une meilleure vision d’ensemble et moins de biais.
    Autant je suis sceptique sur les avancées de l’IA dite « forte » et la robotique humanoïde, autant je pense que ce type d’algorithme pourra être très efficace dans un avenir proche.

    Dans 15 ans Gerard ‘t Hooft réecrira une page « pourquoi je pense que les étudiants en physique devraient continuer à étudier la mécanique classique malgré ce que suggère les robot-agglomérateurs ».

  3. Je trouve étrange de parler de hiérarchie des connaissances dans le web sans parler de l’encyclopédie Wikipédia, peut-être le plus gros projet Internet à l’heure actuelle, d’autant plus en regard de la dernière phrase de l’article. Wikipédia a son propre système de catégorisation (qui n’est pas inspiré de Dewey, ni de la CDU), mais aussi une flopée d’hyperliens dans ses articles, donc on se rapproche, je cite, « des îlots de hiérarchie surnageant dans un océan d’information non structurée ».

  4. Merci de ce qui pourrait être un petit coup de pouce :).

    Toutefois, dans le principe même, il n’y a pas nécessairement d’alternative entre un réseau hiérarchique et un réseau de liens, tel que le web, et Alex Wright rappelle que T. Berners-Lee a théorisé les deux, d’où effectivement les idées de « méta-réseaux » ou de « tables auxiliaires ». L’ « association » n’est pas non plus alternative à l’ « indexation ».

    Je connais mal le fonctionnement de Wolfram/Alpha, mais si la voie suivie semble passionnante, il n’est pas non plus certain qu’elle soit alternative aux recherches « classiques » sur le langage naturel, notamment car lorsque celles-ci recourent à des ontologies ou des réseaux conceptuels, il s’agit aussi de représentations symboliques, qui peuvent éventuellement être formalisées sous forme mathématique et incorporées à des règles. Watson constitue d’ailleurs une alternative (pour le coup), qui supporte RDF.

    Mais au-delà de l’enjeu de la structure, il y a celui de l’ « autorité ». Si l’ « anarchie » du web est effectivement canalisée par les grands moteurs de recherche ou réseaux sociaux, ils se préoccupent justement de plus en plus de hiérarchisation des connaissances a priori, de même que Wikimedia.
    Une question est dès lors de savoir quel rôle entendent jouer les institutions qui disposent traditionnellement d’une forme d’autorité sur des champs de connaissances ou peuvent y aspirer. Le « web sémantique » intègre d’ailleurs la notion d’ontologie, issue de pratiques institutionnelles, mais sans reprendre leur tropisme hiérarchique. Plusieurs institutions participent déjà à des initiatives d’uniformisation ou d’interopérabilité des langages de structuration de l’information au niveau mondial.

    D’autre part, comme l’explique Alex Wright à propos du « Linked data movement », la volumétrie produite par le web et l’efficience des technologies ne permettent plus que ce travail de structuration soit exclusivement humain, ni d’ailleurs que ses produits (ontologies…) restent figés. Mais Alex Wright évoque l’ « automatisation du processus de classification par des ordinateurs fouillant le web et créant des ontologies… », pas de la production de contenus eux-mêmes, même si cela existe aussi.

    Par ailleurs, je cite le livre de Jean-Pierre Balpe sur le sujet : « Hyperdocuments, hypertextes, hypermédias » (1990).

  5. Excellent article.

    En matière de hiérarchisation du contenu d’Internet, on peut s’attacher à chercher le point de bascule entre les bénéfices de l’approche automatisée et ceux de l’approche éditoriale.

    Le coût de l’automatisation n’est pas nul mais son utilité marginale est d’un point de vue statistique marginalement constant et son coût marginal est fortement décroisant, tandis que le coût du travail éditorial est en réalité d’une utilité marginale décroissante et d’un coût constant. Il y a très ainsi vraisemblablement un espace dans lequel l’approche éditoriale est à la fois qualitativement et économiquement supérieure à l’approche algorithmique, mais cet espace peine concrètement aujourd’hui à exister.

    En effet, les solutions de recherche ont une exigence de fiabilité et d’exhaustivité que l’approche éditoriale seule ne peut réaliser. Ainsi une solution me semble être de penser une articulation synergique entre l’éditorial et l’algorithmique, de réfléchir à la fois à ce que l’éditorial et l’algorithmique ont comme qualités indépendamment l’un de l’autre, mais aussi ce qu’ils peuvent apporter l’un à l’autre.

    C’est précisément ce que nous essayons de faire, avec peu de moyen aujourd’hui, avec le service que nous avons longuement développé et récemment lancé, Netguide.com.

  6. Pour alimenter le débat voici une citation de Mille Plateaux :
    « Ce qui compte, c’est que l’arbre-racine et le rhizome-canal ne s’opposent pas comme deux modèles : l’un agit comme modèle et comme calque transcendants, même s’il engendre ses propres fuites ; l’autre agit comme processus immanent qui renverse le modèle et ébauche une carte, même s’il constitue ses propres hiérarchies, même s’il suscite un canal despotique. » p. 31
    https://www.zotero.org/luckysemiosis/items/itemKey/RFGZH5QR

  7. Ce qui m’étonne dans les discussions sur la classification c’est de faire comme si c’était possible de classer effectivement par la technique ou la science en évacuant tout conflit, ce qui débouche sur deux extrêmes: on a soit le web plat, qui oscille entre l’égalitarisme béat et le populisme de tout est relatif donc toutes les vérités se valent, ou le web horizontal, nécessairement fasciste (alors on invente un tas de termes pseudo-scientifiques, rdf et tout le tralala).
    Ces deux extrêmes sont bonnet blanc et blanc bonnet, et les exemples les plus criants se trouvent déjà dans les premiers systèmes de classement de la connaissance et du monde: Dans son « Système naturel » de 1735, Linné, sans crainte de taper dans le fonds terminologie de la politique et de l’ordre social, parle de « règne » animal. Le vertical, hiérarchique, y est concilié à l’horizontal, naturel, puisque devant Dieu nous tous égaux parce qu’absolument uniques.
    Je ne vous étonnerai pas si je vous dis qu’à mon avis rien de bien scientifique ne peut sortir de cette conception là du classement, dont les oppositions ne sont pas vraiment productives. Pas plus d’ailleurs que ne le sont les visions tu conflit total, parce qu’il reste à démontrer que l’on peut communiquer toute une classification uniquement par la force de coups de massue ou autres. Il y a une intercompréhension, bien sûr, mais elle ne resulte ni d’un automatisme total pas plus que d’un rapport de forces total. Pour ce qui est de la prévision, c’est gênant parce que dans l’innovation, c’est les sens nouveaux qui comptent, or ils échappent au algorithmes, à la rigueur on peut leur trouver des caractéristiques propres (Merton, Goffman, Price et les research fronts etc), mais c’est tellement fragile tout ça, tellement idéaliste.
    L’usage des langages formel est lui-même tellement dépendant de l’usage de normes sociales et à son tour normatif que l’approche la moins pire serait encore par l’absurde, c’est à dire exclure des résultats tout ce l’algorithme n’arrive pas à réduire à lui-même. Mais après comment trier entre « en cours d’émergence » et « sans queue ni tête ». Classer impose de mesurer le monde à une aune, une aune qui se présente souvent comme objective et/ou naturelle (l’un parce que l’autre et inversement, comme la misère au bras de la charité), mais c’est toujours l’aune de quelqu’un. Le mètre du parisien Lavoisier, supposé réalité rationnelle, universelle et naturelle, était étrangement proche de la brasse parisienne. Pratique! Donc, quand certains disent qu’ils classent, il ne font souvent que reproduire des différences sociales en aggravant leur part indissociable d’inégalité sociale. Plus j’entends algorithme, classement rationnel, etc, plus j’entends le règne du monde animal de Linné. Un classement viable non seulement du point de la science comme du point de vue social, devrait partir du principe que tous les classements n’ont en commun que d’être contredits et d’accorder une place et une visibilité variable à cette contradiction. La Leçon inaugurale au Collège de France du sociologue Bourdieu, aussi pompeux que le titre puisse paraître, a un passage qui paraît comique, mais ne s’agit-il pas de la grave aporie de tout classement:
    « La classification anthropologique se distingue des taxinomies zoologiques ou botaniques en ce que les objets qu’elle met – ou remet – à leur place sont les sujets classants. Il suffit de penser à ce qui adviendrait si, comme dans les fables, les chiens les renards et les loups avaient voix au chapitre s’agissant de la classification des canidés et des limites de variation acceptable parmi les membres reconnus de l’espèce et que la hiérarchie des caractéristiques retenues pour déterminer les rangs dans la hiérarchie des genres et des espèces soit de nature à commander les chances d’accès à la pitance, ou au prix de beauté. » (BOURDIEU, P. Leçon sur la leçon. Ed. Minuit, 1982.)

  8. En ce qui concerne le Traité de Documentation de Paul Otlet, c’est, me semble-t-il, un must read. Vous risquez d’être surpris, jettez un coup d’oeil sur le texte intégral, par exemple p. 390 à 392, téléchargeable ici:
    https://archive.org/details/OtletTraitDocumentationUgent
    On n’a pas besoin de s’attarder beaucoup devant ce monument datant de 1935 pour se rendre compte que Vannevar Bush a moins été l’inventeur de quoi que ce soit d’original qui touche à Internet, que le chef du Office of Scientific Research and Development pendant la 2e guerre. Mais Bush met en contact les divers univers souvent clos de l’innovation (militaire, industrie des communications, enseignement…), opérant une synergie capitale pour l’essor aux US d’une recherche universitaire et publique (recherche jusqu’alors trustée c’est le cas de le dire par des boîtes comme ATT, qui va par ses brevets jusqu’à menacer l’autonomie nationale des US), qui débouche sur des technologies de communication du domaine public, lisez Internet. (à ce titre, je recommande le ch. 14 du livre « Piracy: The Intellectual Property Wars from Gutenberg to Gates » de Adrian JOHNS [University of Chicago Press, 2009.] et après, seulement après, la petite histoire d’Internet qu’on trouve dans La Galaxie Internet de Manuel Castells (2001) — et on s’apercevra à quel point ce sociologue technophile a pu être victime de ce que sont collègue feu Bourdieu appelle l’amnésie de la genèse.)
    Il faut dire que depuis la fin de la 2e guerre, l’histoire des sciences et technologies est réécrite. Les propagandistes américains et britanniques sont mis sur le devant de la scène (souvent au détriment des bons, qui ne manquent pas non plus, je pense à l’approche de Shapin de la Révolution scientifique dans son livre éponyme de 1996), pas moins d’ailleurs que ceux de l’axe l’avaient été avant eux.
    Et dans ce genre de situation, les perles comme Otlet, qui en plus de pacifiste était aussi féministe, on les cache, on les étouffe par le silence, puis on les réemballe et on les débite comme des inventions à soi. C’est paraît-il de bonne guerre. Moi je reste fidèle à Otlet: je n’en veux pas de cette guerre-là. Et Otlet aura quand même réussi à faire triompher sa CDU à l’Unesco, ce qui n’est pas peu. Mais le progrès va si vite, et on tellement de travail pour trompeter son succès, alors on a si vite oublié, surtout lorsqu’il s’agit de la contribution des autres et qu’elle n’a jamais eu rien qui lui arrive à la cheville.

  9. @Daniel Merigoux

    Sur vos conseils, j’ai effectivement été regarder les pages 390 à 392 du livre d’Otlet, et il est intéressant de noter qu’il y parle, entre autres de « télélecture » (utiliser la télévision pour lire des textes à distance), de « machine à traduire » et d’ « écriture et lecture directe » (autrement dit, pour employer des expressions anglo-saxonnes consacrées, text-to-speech et speech-to-text). Impressionnant…
    Ceci dit, si quelqu’un peut m’expliquer pourquoi la classification Dewey tend à remplacer la CDU en France, je suis preneur…

  10. Rémi, au delà de considérer des techniques et des applications particulières (dont il offre un état époustouflant) dans le moindre détail, Otlet a conçu tout un (le?) système. Je cite p. 415 (p. 212 du pdf):

    424 Le Réseau Universel d’lnformation et Documentation (4e echelon de l’Organisation internationale)
    424.1 Principes du Réseau
    De I’enquête sur les faits, de l’étude sur les travaux et les organisations existantes, on peut dégager l’esquisse suivante d’une Organisation mondiale.
    Il sera organise un Réseau Universel mettant en rapport coopératif tous les organismes particuliers de documentation, tant publics que privés, à la fois pour la production et pour I’utilisation,
    Le Réseau, de quelque manière que ce soit, doit relier les uns aux autres les centres producteurs, distributeurs, utilisateur, de toute spécialisation et de tout lieu…
    – – – – – – –
    En ce qui concerne l’intérêt ou la découverte (ou la reconnaissance explicite) d’Otlet dans le monde anglo-saxon, il remonte au moins à 1975, avec la publication de The universe of information de Boyd RAYWARD, bon auteur de l’université de Chigaco, dont le sous-titre (notez bien, le sous-titre) est: « THE WORK OF PAUL OTLET FOR DOCUMENTATION AND INTERNATIONAL ORGANISATION ».