Dominique Ramsey : « Il ne faudra pas attendre longtemps pour que la plupart des utilisateurs actifs soient mentionnés dans un fichier FOAF »

Dominique Ramsey, développeur, est l’auteur de l’un des tous premiers annuaires FOAF, Plink. Il revient avec nous sur les enjeux et les risques de la généralisation de fichiers décrivant des personnes sur le web.

Dominique Ramsey (http://www.domramsey.com) est un développeur anglais pour le moins actif. Il gère une dizaine de projets en ligne, qu’il s’agisse de sites ou d’outils mis à disposition des internautes, parmi lesquels Ask My Network (http://www.askmynetwork.com), une communauté sociale basée sur la théorie des six degrés de connaissance, AnyRSS (http://www.local-news.net), un agrégateur RSS d’informations locales, ou Plink (http://beta.plink.org), un annuaire de personnes basé sur FOAF.

Internet Actu nouvelle génération : FOAF semble encore très confidentiel. Connaissez-vous des exemples d’utilisation effective de la technologie, par exemple en entreprise ?

Dom Ramsey : Je ne connais pas d’exemples d’une utilisation interne de FOAF au sein d’une organisation, mais il y en aura sûrement. Au fur et à mesure que FOAF va se populariser, cela arrivera, et on pourra l’utiliser par exemple pour lier les données relatives à des étudiants ou des salariés au reste du monde. Mais il est vrai qu’il existe des moyens plus simples de le faire aujourd’hui.

Iang : Dans FOAF, la manière de se protéger de fausses informations n’est pas très claire. Qu’est-ce qui empêche quelqu’un de créer un fichier FOAF et de le présenter comme étant le mien ?

Dom Ramsey : Techniquement, rien n’empêche cela. Cependant, les données FOAF doivent être vues comme toute autre donnée personnelle et les fichiers FOAF doivent être traités comme les autres documents. L’utilisation de ce type de données implique des obligations légales et des questions relatives à la confidentialité. Et le fait que ces données soient encapsulées dans un fichier FOAF ne change rien à cela. Si je publie de fausses informations sur quelqu’un dans un autre format, il y aura également des conséquences.
Ceux qui publient des fichiers FOAF doivent être sensibilisés à ces questions, et la permission de la personne concernée doit être obtenue avant toute publication de données personnelles.
On pourrait aussi imaginer des solutions techniques pour limiter le problème des données fausses ou incorrectes. De plus en plus de sites communautaires proposent en option de publier des données personnelles en fonction des profils des utilisateurs, qui peuvent être vérifiés. Les sites utilisant ces données (les « consommateurs FOAF ») pourraient les limiter à celles provenant de sources fiables, et ignorer le reste.
De façon alternative, un système similaire au Page Rank de Google pourrait être implémenté : on donnerait à chaque morceau d’information un classement basé sur la source et sur le nombre de sources qui confirment ces données. Les données douteuses auraient donc un classement inférieur, et pourraient donc être filtrées.
Mais la responsabilité première quant à la fourniture de données FOAF correctes revient toujours à l’éditeur.
Eduquer les utilisateurs est également très important. Les gens doivent savoir quel genre d’information est publié, pourquoi elle est publiée, et comment ces données peuvent être utilisées. Par exemple, publier votre code postal dans un fichier FOAF signifie que je peux dire à tout le monde à quelle distance vous vous trouvez par rapport à moi, qui d’autre habite près de chez vous, ou s’il pleut chez vous en ce moment, mais aussi, potentiellement, cela implique que je peux donner des détails comme votre numéro de téléphone ou votre adresse exacte, en cherchant avec votre nom dans un annuaire.

Iang : D’ailleurs, comment fonctionne la protection contre les spammeurs dans FOAF ?

Dom Ramsey : La plupart des fichiers FOAF n’identifient les individus que par leur adresse email, mais publier ces adresses en vrai texte n’est évidemment pas une bonne idée. C’est pour cela que la plupart des sites produisant des fichiers FOAF encodent les adresses email, avec une méthode de cryptage à sens unique appelée SHA1. Cela produit une chaîne de caractères hexadécimaux, et les adresses email ne sont jamais réellement stockées, ce qui évite qu’elles soient accidentellement publiées ou utilisées par des spammeurs.

Iang : Quelle pourrait-être l’évolution de FOAF ?

Dom Ramsey : A l’avenir, je ne pense pas du tout que beaucoup de gens vont publier eux-mêmes leur propre fichier FOAF. Même aujourd’hui, l’énorme majorité des données FOAF sont publiées par des sites communautaires et des plate-formes de blogging. C’est par exemple le cas de LiveJournal, qui je crois dispose de plus de trois millions d’utilisateurs, et qui a récemment commencé à publier du FOAF.
Il ne faudra donc pas attendre longtemps pour que la plupart des utilisateurs actifs de l’internet soient mentionnés quelque part dans un fichier FOAF. Le vrai defi est de protéger la vie privée des gens et de donner un sens à cet énorme volume d’information.

Iang : Plink affiche à ce jour plus de 33 000 fichiers FOAF de personnes. Quel est le rythme de croissance, et quels sont vos projets ultérieurs ?

Dom Ramsey : Plink intègre un crawler, mais je l’ai débranché récemment, en raison du gros volume de données FOAF qui existe désormais.
A lui tout seul, Plink pourrait contenir près de cinq millions de noms dès aujourd’hui, mais je n’ai malheureusement pas les ressources ou les moyens financiers de laisser cela se produire. Les gens peuvent donc s’ajouter manuellement s’ils le souhaitent, et la croissance est gérable.
Je travaille sur plusieurs autres projets, et n’ai pas eu beaucoup de temps à consacrer à Plink. Le futur est probablement de faire croître le volume de données, et de lier entre elles plus de données, comme les informations géographiques, les fils d’information produits par les blogs, ou les données météorologiques.

Propos recueillis par Cyril Fiévet

À lire aussi sur internetactu.net

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *