Les microformats, prochaine étape du web sémantique ?

Vous ne connaissez pas les microformats ? Bon. Ca va être un peu technique a expliquer.

Pour Frédéric Cavazza, consultant, le principal intérêt est de « rendre exploitable par des robots du contenu à la base crée pour des humains. Exploitable veut dire qu’à partir d’une requête structurée il est possible de rapatrier des informations précises. Par exemple « va sur le site XX pour parcourir sa liste de liens et me rapatrier tous les sites dont les auteurs se connaissent personnellement ». Ça n’a l’air de rien, mais ce type de requête structurée peut vous éviter d’avoir à investir des milliards de dollars dans un algorithme d’indexation plus performant que celui de Google. »

Bien, mais comment cela fonctionne-t-il ? Ecoutons Stéphane Lee qui est très compréhensible pour qui connaît un petit peu le HTML :

Prenons le cas des attributs de blocs <div> qui définissent une zone dans la page web. Aujourd’hui, la principale raison qui pousse un développeur à ajouter un descriptif du genre <div class= »toto »> est le fait qu’il pourra traiter la présentation de ce bloc dans une feuille de style CSS. Il pourra en effet décrire la présentation qu’il souhaite donner à ce bloc dans une directive de type div.toto {font-size:12px ; }.

Le « toto » n’a évidemment aucune signification, sinon pour lui. Si maintenant, au lieu de choisir « toto », il choisit <div class= »blog_entry_title »> conformément à un à un micro-format standard. Non seulement il pourra continuer à appliquer des directives de présentations CSS sur son bloc, mais ce bloc pourra également être interprété par des robots ou des protocoles adhérant au micro-format. Son contenu correspondra au titre d’un article de blog, et toute machine pourra le traiter comme tel, pour agréger, mixer, reformater, communiquer, extraire, inclure, etc.

« Il s’agit d’utiliser les capacités qui résident déjà au coeur de XHTML en créant des librairies de valeurs d’attributs afin d’assurer un nommage commun de la définition d’un document », explique Karl Dubost. « Les tenants des micro-formats sont en train de faire un constat simple : xHTML permet de tout faire, sans avoir besoin d’ajouter une couche XML à côté ou au dessus », complète Stéphane Lee. « Ceux qui connaissent HTML le savent bien : ces attributs sont sous-utilisés, puisqu’ils n’ont aucune signification, sinon pour le concepteur de la page Web en question. Il suffit de se mettre d’accord sur la signification des attributs et de les affecter à bon escient pour que tout prenne un sens ! »

Karl Dubost, va encore un peu plus loin pour expliquer les applications à venir de ces formats : « On pourrait imaginer que la présence d’une carte de visite dans une page Web permette d’avoir une fonctionnalité dans le navigateur du type « Ajouter cette carte à mon carnet d’adresse » ou encore qu’un calendrier de conférences, de festivals, de cinéma permette d’ajouter directement une entrée dans son propre calendrier électronique. ». Mais voilà… les attributs ne sont pas encore définis ni adoptés, souligne-t-il avec raison.

Pour autant que ceux-ci trouvent des dénominations communes, l’avantage des microformats pourrait être de répondre à des besoins ponctuels mieux adaptés à l’inertie des formats. En effet, contrairement à un développement en XML, les microformats ne demandent pas de redévelopper ses pages, mais seulement quelques adaptations sur certaines balises au cas par cas… Mais comme le souligne Karl Dubost, ils ne rendent pas pour autant le web sémantique accessible à tous – la syntaxe reste ardue -, et ne suppléent pas forcément au besoin de passer, à terme, au XML.

À lire aussi sur internetactu.net

0 commentaires

  1. c’est très élégant,
    mais cela me semble être un fork par rapport à l’idée :

    blabla

    je n’arrive pas à voir l’avantage des microformats,
    les commentaires en (X)HTML sont là pour commenter le code, et commenter c’est bien.

    bravo pour ce site, que je découvre par cet article cité par Antoine Moreau sur la liste licence art libre

    cordialement,
    ff

  2. oups c’est illisible
    donc l’idée est :
    ouverture de commentaire | balise de début rdf | fin de commentaire
    blabla
    ouverture de commentaire | balise de fin rdf | fin de commentaire

  3. Le problème, avec des spécifications, c’est de mettre tout le monde d’accord… bon courage !

    L’avenir est-il vraiment à la meta-meta-meta-donnée ?

  4. Pour moi, la sémantique doit rester le domaine des balises. L’attribut class n’a pas valeur sémantique. Autant créer son propre espace de nommage XML et l’intégrer dans XHTML. C’est STANDARD, CONFORME et VALIDE. Après, standardiser ces espaces de nommage ne peut-être qu’une bonne chose.