Logiciels, Internet, moteurs de recherche

Dernier ajout : 10 juillet.

Derniers articles

Une occasion à ne pas manquer pour les éditeurs

RSS ou Le futur de la veille

Une chance pour les internautes et les professionnels de l’information

Lundi 10 avril 2006

Lire la suite »

[mise à jour au 31 décembre 2008 : dans le domaine juridique, les fils RSS restent encore largement du futur : voir notre article Veille : les limites des outils Web 2.0 ....]

Vous l’avez peut-être constaté, de plus en plus de sites web proposent les titres et abstracts de leurs nouveaux articles à travers des fils RSS : plus simples et plus rapides à produire qu’une newsletter, les fils RSS permettent également chez l’utilisateur un filtrage plus fin.

Le RSS : qu’est-ce que c’est ?

Format RSS

Le RSS est en fait un format de fichier XML très simple qui répertorie les références bibliographiques d’articles. Essentiellement : titre (champ title), adresse web (URL ; champ link), date et résumé. Le côté XML de la chose signifie simplement que le fichier doit obéir — plus ou moins selon les versions du RSS utilisé — aux règles de syntaxe définies par le XML, notament : « toute balise est écrite en minuscules » ou « toute balise doit être ouverte puis fermée ».

Fil RSS

Un fil RSS (en anglais "news feed"), c’est donc un fichier qui liste les nouveaux documents publiés sur un site web. Ce n’est pas une page web (c’est-à-dire un fichier au format HTML), ce qui explique pourquoi il n’est pas bien présenté, voire quasi-illisible, quand on le lit avec un navigateur web comme Microsoft Internet Explorer, Opera, Netscape Navigator ou Mozilla Firefox.

Voici à quoi ressemble, concrètement, du RSS. C’est un extrait du fichier RSS des brèves publiées par ce weblog : il s’agit de la liste des dernières brèves que j’ai publiées, précédées du rappel du nom et de l’adresse de mon blog :

- <rss version="0.91">
- <channel>
   <title>Le Journal d'un documentaliste juridique</title>
   <link>http://www.precisement.org/blog/</link>
   <description/>
   <language>fr</language>
   [...]
 - <item>
   - <title>Association française d'information funéraire</title>
   - <link>http://www.precisement.org/blog/breve.php3?id_breve=11</link>
     <date>2005-02-13 03:22:04</date>
   - <description>Informations juridiques et financières précises (y compris des mises en garde) sur les contrats d'obsèques et ceux d'assurance frais d'obsèques, la sélection d'une société de pompes funèbres, le transfert et la conservation du corps, les funérailles, la mise en bière et les concessions funéraires. Egalement les chroniques de Damien Dutrieux, consultant, enseignant et formateur, spécialiste du droit funéraire</description>
   </item>
 - <item>
 - <title> [...]
</channel>

Comme vous pouvez le constater, l’annonce de chaque brève est introduite par <item> et close par </item>. Entre ces deux balises d’ouverture et de fermeture, on trouve le titre de la brève (<title></title>), son adresse web (<link></link>), sa date de publication (<date></date>) et sa description (<description></description>). Et ainsi de suite.

Lecteur RSS

Enfin, un lecteur RSS ou aggrégateur de fils RSS (en anglais : "feed reader" ou "news aggregator"), c’est tout simplement un logiciel pour lire les fils RSS. Plus précisément, un logiciel [1] ou un site web (i.e. un aggrégateur en ligne) [2], qui affiche de manière lisible les fils RSS et permet de les classer et de les gérer individuellement ou en bloc.

Un véritable lecteur RSS doit notamment être capable d’importer un ensemble de fils RSS (i.e. les nouveautés d’un ensemble de sites web), ce qui évite de s’abonner "à la main" à plusieurs centaines de fils. Il doit être aussi capable d’exporter vos propres sélections de fils (ce groupe de fils RSS qu’on importe ou exporte s’appelle un fichier OPML [3]). Idéalement, un bon lecteur RSS doit être capable de ne pas re-télécharger les titres que vous avez supprimés (plus rare, ça : de toutes les solutions que j’ai testées, le plug-in pour Thunderbird est le seul à savoir le faire).

Le RSS : à quoi ça sert ? quels avantages ?

L’utilité du RSS pour les internautes : plus d’info, plus vite, et surtout mieux filtrée

Le RSS, c’est le rêve du "push" (l’utilisateur ne cherche plus l’information, elle vient vers lui) [4] devenu enfin réalité. C’est, pour l’utilisateur, la possibilité de lire plus d’informations en moins de temps et de manière plus confortable, sans être envahi par cette information. L’utilisateur en effet sélectionne lui-même les publications qui l’intéresse, et par des filtres par mots-clés [5], peut également trier dans un même fil RSS.

Le RSS, c’est donc une veille qui peut s’apparenter à la lecture des sommaires des revues, les sujets inintéressants en moins. Or, c’est encore ce type de veille — la lecture des sommaires de revues — qui reste le moyen favori des juristes pour tenir à jour leurs connaissances en droit.

Les clés du RSS pour les utilisateurs :

  • des fils RSS externes sont intégrables sur un site web ou un intranet ... sans autre effort que celui de les sélectionner. C’est ce qu’on appelle "syndiquer" des sites. Voir à titre d’exemple très parlant la quantité de fils RSS intégrés au site ServiceDoc.info de Stéphane Cottin et dont il lit et affiche une partie sur sa page d’accueil
  • mieux, des plug-ins gratuits (petits logiciels qui s’ajoutent au navigateur, notamment Internet Explorer — un exemple —, voire au logiciel de messagerie) permettent de lire facilement ces informations. Il est très probable que les prochaines versions de Outlook ou Internet Explorer intégreront en standard la lecture des fils RSS.

Les professionnels de l’information juridique ne devraient donc pas négliger le développement du RSS.

Moins de spam

Le RSS, c’est aussi moins de spam ou en tout cas un spam mieux contrôlé — spam qui est en train de "tuer" l’e-mail et par ricochet les newsletters. Spam qui a déjà largement contribué à tuer les forums de discussion Usenet (en anglais : "Usenet groups").

Les avantages du RSS pour les éditeurs juridiques

La clé du RSS pour les éditeurs : les bases éditoriales sont maintenant produites au format XML. Or le RSS n’est rien d’autre qu’un format XML très simple. Le produire à partir des bases de données éditoriales ne devrait donc pas être coûteux.

Que les lecteurs s’abonnent à ses fils, que des sites partenaires reproduisent les titres de ses publications ou que les juristes et documentalistes juridiques intègrent des fils RSS sur leurs intranets, l’éditeur peut ainsi faire de la publicité pour ses publications pour un coût dérisoire et sans avoir à "donner" du texte intégral ou des extraits, alors que ce texte intégral n’est qu’à un clic si l’internaute est abonné ou accepte un paiement au document — de type AlloPass par exemple.

Enfin, RSS ne met aucunement en danger la propriété intellectuelle des éditeurs : en effet, il ne diffuse que les titres et adresses web des articles, plus éventuellement — et c’est bien sûr très utile — un abstract. Créer un fil RSS pour une publication en ligne d’un éditeur ne donne en soi aucun accès au texte des articles.

LexisNexis US offre déjà un fil RSS pour les actualités juridiques de Mealey et Westlaw fournit une version RSS d’IntraClips, son composant pour intranet IntraClips. Du côté des données juridiques officielles brutes, le US Copyright Office publie depuis 2005 quatre fils RSS, permettant ainsi de se tenir à jour de Current Legislation et du Federal Register.

Pour aller plus loin

Pour découvrir des fils RSS juridiques :

  • Vingt-sept sites publics diffusant du RSS : une liste établie par le site Service-Public.fr au 24 février 2006
  • le fichier OPML de fils RSS juridiques (un fichier OPML permet d’importer dans un lecteur RSS un ensemble de fils sans avoir à le faire fil par fil invididuellement et "à la main") d’Arnaud Dumourier
  • celle beaucoup plus large (documentation juridique et fils américains inclus) établie par Stéphane Cottin sur son Juriblog
  • le travail de John Doyle : ce bibliothécaire américain de la Washington and Lee Law School a réuni les sommaires de plus de 600 revues juridiques américaines pour en faire autant de fils RSS. Il va bientôt s’attaquer aux revues non américaines, comme il l’explique dans sur son journal en ligne.

Pour plus d’informations sur le RSS, vous pouvez lire :

Emmanuel Barthe
documentaliste juridique


Un wiki, c’est quoi et ça marche comment ?

Un outil pour aider les collaborateurs à participer à l’intranet

Mercredi 15 février 2006

Lire la suite »

Les wikis, ce sont ces sites web où tout le monde peut créer ou modifier des pages, et ajouter des commentaires en bas de la page. On en parle beaucoup. Notamment pour les sites web d’associations, ou les intranets documentaires ...

Wiki : c’est quoi ?

Le plus célèbre d’entre eux est bien le projet
Wikipedia, une
encyclopédie libre (autrement dit, gratuite et librement
réutilisable) qui a prouvé un assez bon degré de fiabilité [6], même si ses articles n’atteignent pas le niveau d’exhaustivité,
d’expertise et de détails de la Britannica ou de
l’Universalis [7] (un exemple du côté encore très léger de
Wikipedia avec l’article "Droit").

Beaucoup d’avantages et quelques inconvénients

Mais qui sait qu’il est relativement facile de créer un wiki [8] — et plus facile encore de créer ou modifier une page d’un wiki — ou que les wikis rendent très aisée la participation des collaborateurs à la mise à jour des intranets ? Par ailleurs, l’allure visuelle (la "charte graphique") du wiki peut être mise aux couleurs et logos de n’importe quel organisme.

Les seules limites des wiki :

  • la syntaxe un peu bizarre pour les habitués de Word. Ainsi, pour obtenir du gras, il faut écrire __gras__ chez CraoWki [9] et ’’’gras’’’ chez MediaWiki (voir infra pour la syntaxe de MediaWiki). L’avantage de cette syntaxe, c’est que n’importe quel navigateur web peut modifier un site wiki. Les wikis sont indépendants des logiciels utilisés sur les ordinateurs des auteurs. De toute façon, certains wikis ont un éditeur de texte WYSIWYG avec des icônes de de style Word, soit en standard comme le logiciel payant et hébergé Centraldesktop soit par ajout d’un plug-in, comme TWiki
  • il est essentiel d’avoir un animateur qui amorce le processus et entretient la dynamique du groupe ?. Ce point est souligné par tous les articles cité ci-dessous
  • l’absence de hiérarchie des auteurs et de leurs contributions suppose un administrateur pour organiser après coup les articles et structurer le site wiki et ses rubriques.

Wiki : comment faire ?

« Comment faire ? » me direz-vous. Vite, quelques guides simples [10].

- La philosophie, la démarche, l’utilité, les avantages, les problèmes :

  • une bonne synthèse : Les sites wikis, nouveaux outils de travail collaboratifs / Michèle Battisti (compte-rendu d’un atelier organisé par l’ADBS le 28 septembre 2004 et animé par François Olléon et Jean Michel), Documentaliste-Sciences de l’information vol. 41 n° 4-5 octobre 2004 p. 278-280
  • rédigé par un documentaliste pour des documentalistes et publié sur le remarquable site LLRX : Using a Wiki for Documentation and Collaborative
    Authoring
    par Michael Angeles
  • Blogs et wikis : Il faut les utiliser ! / Gilles Balmisse, spécialiste de la veille et du knowledge management, devenu consultant (Knowldege Consult), L’Informatique Professionnelle n° 234 mai 2005 p. 20 (2e partie de l’article, la première portant sur les blogs)
  • Wiki, le summum du collaboratif / l’équipe du Journal du Net, Journal du Management, novembre 2003. Cet article traite surtout de l’expérience de développement de deux wikis chez Cetelem, supervisée par Charles Népote.

- Les aspects techniques et pratiques, comment installer un wiki, comment s’en servir :

  • Wiki En Une Minute (une page du WikiWikiWeb, le premier site wiki, créé par Walt Cunningham, un développeur américain qui créa le premier logiciel wiki en 1995) [11]
  • Wiki Getting Started FAQ : questions-réponses basiques sur les Wikis et leur fonctionnement (WikiWikiWeb)
  • plus détaillé : Présentation Générique Des Wikis / Christophe Ducamp, avec les versions PowerPoint et PDF de sa présentation du 1er juin 2004 à l’Ecole Nationale des Ponts et Chaussées
  • soyez opérationnel avec le logiciel wiki MediaWiki, par exemple pour enrichir ou mettre à jour un article de l’encyclopédie Wikipedia : les règles pour débuter avec MediaWiki et la syntaxe détaillée pour MediaWiki.

- Lancez-vous !

  • entraînez vous *sans aucun danger* dans ... un "bac à sable", autrement dit un terrain d’entraînement, par exemple celui du logiciel wiki Wikini ou celui de son concurrent MediaWiki !
  • choisissez votre wiki grâce aux articles de Framasoft sur les logiciels de wiki, il y a du choix ou avec les comparatifs détaillés du site Wikimatrix
  • si vous voulez un wiki dont le fonctionnement interne et la documentation sont en français, avec une communauté française correcte, et que vous êtes un utilisateur averti, c’est xWiki qu’il vous faut [12]
  • si vous voulez un wiki pour les besoins internes d’une entreprise, il vous faut des wikis protégeables par mot de passe et de préférence par différents niveaux d’accès (plus de détails sur notre brève) :
    • pour des besoins limités, avec hébergement gratuit : pbwiki
    • TWiki : un logiciel wiki open source, gratuit, tourné vers les intranets collaboratifs et donc gérant finement les niveaux d’accès
    • lise aussi l’article suivant : Le mécanisme de publication wiki / Renaud Edouard-Baraud, 01 Informatique 3 février 2006.

Emmanuel Barthe
documentaliste juridique


Google Book Search : des risques pour les bibliothèques

Les centres d’information face aux moteurs : au delà des outils de recherche

Yahoo/Google Answers : les bibliothécaires et les documentalistes font mieux et depuis longtemps

Mercredi 14 décembre 2005

Lire la suite »

Grâce à un billet d’Olivier Ertzscheidt [13] (affordance.info), je viens de tomber sur un magnifique article sur Google Book Search (ex-Google Print), parfaitement argumenté. Et qui me donne envie de préciser la valeur des professionnels de l’information et celles de leurs centres d’information.

Les bibliothèques et centres de documentation sont plus que la somme de leurs ressources

A Risky Gamble with Google / Siva Vaidhyanathan, "assistant professor" de culture et communication à l’Université de New York, The Chronicle Review vol. 52 n° 15 p. B7 (accès réservé sur http://chronicle.com et en accès libre sur le site de l’auteur
http://www.nyu.edu/classes/siva/archives/002445.html)

Quelques citations, que l’on peut résumer ainsi : « Pour leurs utilisateurs, les bibliothèques sont plus que la somme de leurs livres » :

« It means making sense of what a library signifies to a community and the individuals in that community. Libraries are more than resources. They are both places and functions. They are people and institutions, budgets and books, conversations and collections. They are greater than the sum of their books. The presumption that Google’s powers of indexing and access come close to working as a library ignores all that libraries mean to the lives of their users. All the proprietary algorithms in the world are not going to replace them. »

« We need services like that provided by Google Library. But they should be "Library Library" projects. Libraries should not be relinquishing their core duties to private corporations for the sake of expediency. »

« We have become obsessed with seeing everything in the universe as "information" to be linked and ranked. We have focused on quantity and convenience at the expense of the richness and serendipity of the full library experience. We are making a tremendous mistake. »

L’auteur dans sa conclusion soutient que de tels projets devraient être ceux des bibliothèques (une pierre dans le jardin du président de la BNF, Jean-Noël Jeanneney) et il souligne également la richesse, la valeur humaine et politique de la bibliothèque — et aussi du centre de documentation en entreprise ajouterais-je — : le centre d’information construit une communauté humaine et soutient ses valeurs.

A mon avis, pour que de tels projets restent ceux des bibliothécaires et documentalistes, il serait impératif que ceux-ci cessent de laisser aux seuls informaticiens le monopole de l’implémentation des outils documentaires et bibliothéconomiques. L’informatique est suffisamment adulte aujourd’hui pour être à la portée de qui prend le temps de s’y consacrer. Les professionnels de l’information peuvent et doivent se réapproprier les outils informatiques, surtout avec les possibilités offertes par le XML [14] et l’informatique open source actuelle [15]. Mieux, les meilleures équipes peuvent et doivent, tels des chercheurs, créer de nouvelles applications documentaires. C’est ce à quoi appelle, en somme, Leo Waaijers, responsable du projet DAREnet d’accès aux ressources numériques bâties par les universités hollandaises, dans son article From libraries to "libratories" [16]. Après tout, les premiers bibliothécaires étaient d’abord des lettrés, ils maîtrisaient l’écriture, c’est-à-dire l’outil de l’époque.

Siva Vaidhyanathan rappelle ainsi que les fondateurs de la démocratie américaine estimaient que la République ne pouvait survivre sans bibliothèques. Pour ma part, je pense notamment aux animations assurées en bibiliothèque pour les enfants, à la promotion de la lecture publique faite par les bibliothécaires en zones rurales ou banlieue, aux expositions thématiques d’ouvrages sur des sujets comme les droits de l’Homme ou la liberté de la presse. Je pense aussi aux espaces pour que les collégiens, les lycéens et les étudiants puissent faire leurs devoirs, avec les encyclopédies et les conseils des bibliothécaires sous la main. Et surtout, on peut se souvenir de cette atmosphère de travail intellectuel ou bien de ces enfants perdus, heureux, dans leurs bandes dessinées, cette valorisation implicite de la pensée et de la littérature — et d’une pensée et littérature de qualité.

Les centres d’information en tant que sélectionneurs, hiérarchiseurs, fiabiliseurs et interprètes

Côté centres de documentation (ou plutôt documentalistes), on ne les prétendra pas indispensables à la démocratie, mais particulièrement utiles à la circulation d’une information fiable en entreprise. Surtout s’ils sont animés par des professionnels dynamiques et communiquants — ce qu’est la nouvelle génération : le portrait du bibliothécaire documentaliste perdu sous des piles de livres est complètement "à côté de la plaque". Mes collègues et moi assurons des veilles spécialisées, créons des collections d’ouvrages et de revues, des intranets, des bibliothèques numériques et des applications de KM, comme la base de modèles de contrats développée par Carole Guelfucci, documentaliste du cabinet d’avocats Bignon Lebray [17]. Si on veut vraiment comparer avec Google ou une plateforme en ligne, disons que nous faisons de l’humain et de l’adapté là où ils font de l’automatique, et que nous fiabilisons, hiérarchisons et interprétons une information massivement hypertrophiée. On ne peut pas transmettre des informations valables pour des humains sans qu’elles passent par un filtre et interprète humain. Les spécialistes de l’information sont ces filtres. Un bon exemple : la veille, que les moteurs et éditeurs rêvent d’automatiser avec des alertes automatiques sur questions ou sur profil. On déchante vite. Pour plus de détails sur les limites humaines du suivi de l’actualité et les réponses que peut apporter un documentaliste, voir notre article Suivre l’actualité juridique ou Les défis de la veille.

Car les bibliothèques et centres de documentation, ce ne sont pas seulement des documents en accès libre. C’est aussi — et de nos jours de plus en plus — une sélection des meilleurs documents. Malgré tous leurs algorithmes, les moteurs ne sélectionnent rien par eux-mêmes. Seuls les êtres humains sélectionnent. Google et les autres ne sont rien sans la pertinence des liens hypertextes. Et qui tisse tous ces liens si pertinents ? [18]

Incidemment, histoire de prouver que les moteurs n’ont pas l’apanage des solutions informationnelles innovantes, très loin de là [19], voici quelques exemples de services questions-réponses assurés principalement par des bibliothécaires [20]. Ainsi, par exemple, la BNF assure un service appelé SINDBAD (Service d’INformation Des Bibliothécaires A Distance) [21]. Il faut savoir que ce type de service est assuré en bibliothèques publiques et privées depuis des lustres, particulièrement dans les pays anglo-saxons. C’est ce qu’on appelle un service de référence.

La bibliothèque en tant que collection — ce que n’est pas un moteur ni Google Book Search ou Google Library

Sur un plan plus politique, les projets actuels des moteurs amènent des interrogations formulées par des personnes comme John Mason et Alain Giffard [22] :

  • Une documentation avancée pour une bibliothèque au coeur de la production-circulation des savoirs ? / John Mason, Google et la bibliothèque globale, débat virtuel, BPI, 15 juin 2005 : « Le projet de Google nous conduit donc à penser à nouveau la question des rapports entre une conception universaliste et générale voire totalisante de la mémoire, de La Bibliothèque, et une manière de concevoir la mémoire du monde numérique comme un agrégat vivant de mémoires différenciées, elles-mêmes dynamiques et de pratiques d’exploration exploitation de ces mémoires très variées. »
  • Sur la Bibliothèque Numérique Européenne / Alain Giffard (dirige la Mission interministérielle pour l’accès public à la micro-informatique, à l’Internet et au multimédia), Ars Industrialis, séance du 5 novembre 2005, Concepts et pratiques des technologies cognitives à partir de la question des bibliothèques numériques :
    • « Chacune de ces bibliothèques a sa propre organisation, son intelligence de collection, qui seraient inévitablement perdues si tous les livres étaient redistribués dans une collection unique. » Là aussi, je fais le parallèle avec le travail des spécialistes de l’information du secteur privé : pour construire les bibliothèques papier ou numériques des structures qui les emploient, ceux-ci sélectionnent et orientent les acquisitions. Ce caractère est perdu lorsqu’on passe par les seules plateformes en ligne des éditeurs
    • « Absence d’utilisation des liens dans Google Print : il semble bien que le classement [reposera] sur l’audimat et ne sera pas à même de représenter et d’utiliser le réseau des lectures. Google Print s’éloignerait ainsi de l’hypertexte, de la philosophie du web, des idées même de Google. S’ajoute à cela, le parti pris, particulièrement décevant, de traiter séparément le web (Google), les livres numérisés (Google Print), et la littérature grise (Google scholar) : on aurait difficilement pu trouver manière plus rustique d’approcher le moteur de recherche multimédia, qui est au programme de la bibliothèque numérique depuis au moins dix ans. C’est assez cher payer l’abandon du point de vue des bibliothèques — l’oubli de la collection organisée au sein de la collection unique — et des lecteurs considérés, à la différence de la philosophie du web, comme de purs consommateurs. »

Les questions posées valent aussi bien pour Google que pour Yahoo ou MSN. On se demande d’ailleurs s’il ne serait pas temps de promouvoir des moteurs de recherche réellement publics et open source (exemple pour un moteur open source : Nutch, en partie basé sur Lucene et implémenté comme moteur interne sur le portail Droit francophone).

Emmanuel Barthe
documentaliste juridique


1 | ... | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33

Dernières brèves