Logiciels, Internet, moteurs de recherche

Dernier ajout : 14 novembre.

Derniers articles

Stop ! (Ralentissons Internet)

Du besoin de fonctionner moins vite pour analyser mieux

Samedi 6 mai 2017

Lire la suite »

Le 5 mai 2017, LeMonde.fr publiait une tribune de Corentin Lamy, Eloge de la lenteur sur le Web :

« En vingt ans, l’accès à Internet est devenu meilleur marché, plus rapide et indissociable de notre quotidien. Jusqu’à devenir obsédant. Tout y est accessible, rapide, urgent. Et parce que tout est urgent, tout est devenu futile. Le philosophe italien Maurizio Ferraris, auteur de Mobilisation totale (PUF, 2016), compare l’état de mobilisation permanente induit par Internet à une guerre intime et à une forme de servitude volontaire. »

Servitude volontaire : en effet. J’ai parfois l’impression qu’au bout de 30 mn sur Internet [1], je ressemble à un "gamer" compulsif qui n’arrive plus à lâcher sa manette de jeu et veut absolument terminer la partie en cours [2] : « Juré, c’est la dernière. » Longtemps, je me suis comporté comme un jeune enfermé dans une pâtisserie, qui se goinfre jusqu’à vomir ... et se lasser un temps des gâteaux. Puis se regoinfrer etc.

Ad vitam eternam ? Eh bien non. J’ai carrément désinstallé mon dernier jeu en ligne.

J’ai aussi fini par prendre l’habitude le soir de ne plus surfer (sinon, pour dormir, c’est raté ...).

Je continuerai à poster sur ce blog de long billets réfléchis, argumentés, avec notes de bas de page. Je lis tous les documents que je cite. Je les analyse d’une manière un minimum critique. Je discute avec des acteurs du secteur. Je fais relire mes projets de billet. Tout cela prend du temps. M’empêche de réagir à chaud, de surfer la vague. Et me fait aussi perdre des lecteurs, du trafic [3], des (très maigres) revenus publicitaires.

Mais cette réflexion et cette lenteur permettent d’amasser beaucoup d’informations, de décrypter, de deviner ce qui se passe derrière les apparences puis de le vérifier, et au final d’être mieux informé — je veux dire plus finement et plus profondément — que ceux qui suivent le 20 heures cacophonique perpétuel mâtiné de café du commerce qu’est le bal de l’info et des rumeurs sur le Net.

Pour prendre un exemple, je n’ai pas suivi la mode open access (OA) aveuglément depuis que j’écris sur Internet. J’ai sélectionné les revues en accès libre que j’ai présentées sur ce blog. Et longtemps, il y en eut très peu et très peu de qualité. Idem pour les sites gratuit. J’en ai parlé mais en les voyant à travers le prisme de la qualité du contenu, des interfaces et des fonctionnalités de recherche. C’est parce que j’ai analysé et testé les ressources gratuites comme les payantes et que j’ai discuté avec leurs concepteurs, que j’ai pu prendre du recul et ne pas encenser une mode (bases de données payantes) puis une autre (revues gratuites) [4].

C’est ce temps passé et cette réflexion qui me permettent aujourd’hui de dire que l’accès libre en droit français est mûr. En effet :

  • il y avait la semaine dernière 560 thèses de droit sur le serveur TEL, toutes autorisées pour publication par le jury, souvent sur des sujets qui intéressent les professionnels
  • il existe à avril 2017 au moins 26 revues juridiques francophones de qualité en open access [5].

Ralentir n’empêche pas de suivre les informations mais sans y être collé toute la journée. J’espace mes moments de veille. Quand je faisais un panorama de presse, je passais la presse en revue le matin à 10h et une autre fois vers 13h. Et j’arrêtais là. Bien sûr, une information urgente pouvait toujours arriver, mais ce serait les productifs qui la géreraient. Pas moi — ne pas être toujours le plus rapide est parfois dur à accepter.

Un de mes collègues (non documentaliste) ne regarde sa messagerie qu’une à deux fois par jour. Il privilégie le téléphone. Chapeau. Je ne peux pas, vu que je travaille en équipe mais à distance. Mais je n’active jamais le signalement des nouveaux mails. Jamais.

Mon compte personnel Twitter, par exemple, n’est pas alimenté tous les jours. Je n’en ai ni le temps ni l’envie. Et je ne suis qu’une trentaine de comptes Twitter.

Or il se trouve que des domaines professionnels sont eux aussi concernés par cette mode tyrannique de l’accélération. En droit, la doctrine [6] depuis une quinzaine d’années ne prend plus guère le temps de faire autre chose que résumer et expliquer la jurisprudence et les réformes. Les critiques sérieuses et approfondies deviennent rares. Elle ne sont plus que le domaine rabougri des revues mensuelles comme la revue de débat Droit social et les revues trimestrielles comme la RTD Civ. ou la RGDA.

Mon message est simple : tenez vous informé mais pour en savoir plus, ralentissez, espacez vos connexions, prenez votre téléphone, discutez hors ligne [7], prenez le temps de tester, de vérifier, de creuser, de réfléchir, de critiquer avec des arguments solides, au lieu de.copier-coller, forwarder et RT plus vite que votre ombre.

Emmanuel Barthe
bibliothécaire documentaliste, geek et internaute depuis 1996


Wikipedia : l’encyclopédie qui s’est rangée

De la contre-culture au politiquement correct

Vendredi 3 mars 2017

Lire la suite »

J’ai contribué à quelques articles (juridiques surtout) dans Wikipedia. Et cela fait longtemps que je voulais écrire non plus dans mais *sur* cette encyclopédie libre en ligne passée en 20 ans de la contre-culture au politiquement correct.

Car c’est vrai : je ne trouve plus que partiellement mon compte dans Wikipedia (WP pour celles et ceux qui y écrivent souvent).

Des règles très contraignantes partout : l’exemple de la création de nouveaux articles devenue quasi-impossible

Je regrette que Wikipedia soit devenue à mon avis si pleine de procédures, de règles quasi-juridiques et d’administrateurs (dits "admins") arbitres (au sens arbitres dans l’arbitrage commercial, donc juges). Pour moi — c’est mon impression et je peux me tromper — écrire plus de quelques lignes dans Wikipedia est de facto devenu aussi difficile que d’être membre d’un club à l’anglaise.

A part pour faire quelques corrections, j’ai l’impression que l’orientation "encyclopédie neutre" interdit désormais de créer [8] ou modifier substantiellement tout article.

La volonté de neutralité impose aussi de ne rien écrire qui ne soit écrit ailleurs, dans un média "respectable" (presse, y compris sa version en ligne, et ouvrages d’abord). Tout "travail inédit" [9] a tendance à être dénoncée par une question ou un bandeau ou simplement effacée, quand bien même les informations qu’elle donne sont exacts, notoires ou constatable par soi-même. Pour un exemple, voir l’échange suivant (traduit en français) [10] sur la page de discussion de l’article de WP sur le logiciel gratuit d’édition d’images IrfanView :

« Il devrait être mentionné comme critique que ce programme ne précharge PAS les images ! On est à l’âge de pierre, là ! Proxide 02:16, 23 décembre 2010 (UTC)
Je suis d’accord, mais si aucune source source fiable et indépendante ne le dit, nous ne le devrions pas non plus. —Lexein (talk) 00:09, 10 September 2011 (UTC) »

Ce qui rend cet exemple encore plus net, c’est que Lexein, le wikipédien qui répond est à la fois le principal contributeur de l’article [11] et un vétéran de Wikipedia — il fait même partie des 4000 contributeurs en langue anglaise les plus actifs de WP de tous les temps.

Le moindre manquement aux règles [12] est sanctionné par une suppression immédiate [13] par un administrateur de ce qui a représenté plusieurs heures de travail. Or il est difficile aux non admins de connaître ces règles dans le détail [14] et ces suppressions se font généralement sans grande diplomatie. Ca m’est arrivé. C’est arrivé aussi à d’autres : je l’ai deviné à plusieurs reprises à travers des discussions en ligne sur WP.

Ayant modéré une liste de discussion [15] pendant quatre ans, je ne peux pas nier la nécessité d’empêcher les très nombreux vandales et contributeurs de mauvaise foi de défigurer Wikipedia. Je peux à la limite comprendre que les admins soient fatigués et "tirent sur tout ce qui bouge sans poser de question". Mais malheureusement ce comportement même, par son manque de respect pour les contributeurs de bonne foi qui se voient supprimer leur travail bénévole sans avertissement ni explication, fait des dégâts.

Des articles devenus très lisses

Mais dans le même temps, tout article sur une société où une personnalité est trop souvent "lissé", réécrit habilement (ça se voit quand même) par ses communicants. Certes, un bandeau souvent signale cela mais à part sur les articles concernant les sociétés et personnalités controversées ou à la mode, ces "edits" (modifications) ne sont ni "revertés" (annulées) ni réécrits. Peu de gens s’en soucient et ceux qui s’en soucient manquent et de temps et de force de frappe face aux communicants. Dans cette bataille de communication, des groupes particuliers à visées idéologiques cherchent, inversement, à subrepticement détourner les articles de WP, à les tourner dans leur sens.

Le corollaire, de mon point de vue : je ne trouve plus dans Wikipedia ces infos croustillantes, ces interprétations divergentes qui en faisaient le sel (allez, si ! parfois dans les versions archivées on tombe sur une info non politiquement correcte mais en fait il faut savoir ce qu’ on cherche ... et le chercher longuement puisque les archives ne semblent pas indexées par le moteur de WP ni par Google). On dispose désormais d’une encyclopédie neutre [16] très riche et qui rend service. Certes. Mais on a beaucoup perdu pour ce gain.

Désolé d’être aussi cru, mais c’est un fait : Wikipedia ne pense plus, elle résume ou cite des gens qui pensent — et encore, pas des sites personnels, mais des sources très "consacrées". Eliminant ainsi plein d’informations qu’on ne trouvait guère ailleurs.

Les experts boutés hors de Wikipedia

La page de WP List of Wikipedians by number of edits [17] explique ceci :

« Dans une discussion sur la suppression, le vote pour Garder ou Supprimer un article donné émis par un éditeur ayant un nombre d’"edits" dans WP de 67 330 peut se voir donner plus de poids que le même vote émis par quelqu’un qui n’a fait que 12 "edits". »

Etre un gros contributeur et un expert de WP compte donc beaucoup dans l’encyclopédie. Et souvent plus que le fait d’être un véritable expert du sujet traité dans l’article [18]. L’exemple paroxystique bien connu en est la bataille livrée par le romancier américain Philip Roth pour faire rectifier l’article WP portant sur lui [19]. Plus banalement, Benjamin Coriat, économiste et universitaire français pourtant classé à gauche et spécialiste des communs, dit [20] :

« Wikipédia, ce n’est pas forcément très bien gouverné, parce que les économistes qu’on trouve dans Wikipédia, les définitions qu’on trouve dans Wikipédia, il y a beaucoup à dire. »

Un nombre non négligeable d’articles, même non "chauds", et malgré l’obligation de citer des sources "consacrées" [21], sont :

  • primo, de fait, entre les mains de non-experts (devenus en revanche des experts de WP)
  • secundo, manquent cruellement de recul et de sens critique.

D’après ce que je sais, ce type de comportement et de fonctionnement dissuade beaucoup d’experts de contribuer à WP.

Recul et sens critique — pour tout dire, vivacité — c’est ce que participation des experts et autorisation des "travaux inédits" pourraient apporter. Certes, modérer tout ça et y faire le ménage serait probablement plus ardu, puisque les règles de neutralité et d’absence de contenu original ne pourraient plus servir de garde-fous stricts (et aveugles).

Mais cela attirerait peut-être plus de volontaires (réellement qualifiés). Et après tout, c’est bien ainsi que WP fonctionnait à ses débuts et elle comptait déjà énormément d’articles et de contributeurs.

Les arguments sur cette évolution

On peut penser que cette évolution vers le lisse, le purement factuel et le neutre est un choix qui a été fait pour crédibiliser Wikipedia, pour faire sérieux, comme une "vraie" encyclopédie. Et aussi parce que les contributeurs de WP n’avaient pas le temps et les connaissances pour faire le travail d’un comité scientifique ou éditorial. Voir à ce sujet ce que le fondateur Jimmy Wales [22] (en 2003-2004) et le premier organisateur de WP Larry Sangler ont écrit. Et c’est d’ailleurs ce qui a été souvent avancé dans les articles de presse que j’ai pu lire à ce sujet.

Toutefois, je me demande parfois si en réalité ce n’est pas aussi pour éviter les pressions et procès en diffamation sur un site devenu incontournable et donc trop gênant. Wikipedia à tant crû qu’elle a dépassé — et de très loin — la diffusion de toutes les encyclopédies ayant existé avant elle. Sans parler de théorie du complot, je pense que WP est devenue "mainstream" et que de fait, elle a dû assumer un (gros) inconvénient de tout média trop dominant aujourd’hui : le "politiquement correct".

Pourtant, pour ne prendre qu’un exemple, l’Encyclopaedia Universalis (EU) elle-même n’était guère neutre — disons au minimum ses articles en sciences humaines et sociales (SHS) [23] et une partie de ceux en sciences exactes [24]. Oh que non ! Pour avoir pas mal travaillé dessus dans ma jeunesse (fin années 70 + les années 80 : pas d’Internet à cette époque), je peux vous garantir que l’Encyclopaedia n’était pas neutre. Chaque article était rédigé par un seul auteur — c’est toujours le cas — et il en profitait évidemment pour défendre ses thèses. Evidemment, l’EU avait un conseil scientifique, que WP n’a pas.

Ça avait aussi des inconvénients, les articles pouvaient être très difficiles à comprendre. Mais au moins ça pensait — et ça pensait avec des arguments. Comme WP à ses débuts. A mon avis, Wikipedia est devenu un super Quid. Sans la fiabilité à 100% du Quid [25].

Mais trêve de tirades, je vais vous lasser avec mes rengaines à la "C’était mieux avant". Tant pis ou tant mieux (c’est selon) pour Internet si Wikipedia est devenue "mainstream" [26].

Emmanuel Barthe
bibliothécaire documentaliste juridique, webmestre


Any Yahoo Pipes true substitute out there ?

Tools for RSS feed merging and filtering

Mercredi 30 novembre 2016

Lire la suite »

Pipe dreams by darwin Bell

The loss of Yahoo Pipes in August 2015 [27] was a major blow to the monitoring/research community and also web site authors looking for selected content. Its ability to combine and filter multiple RSS feeds into one feed was unique among free hosted services.

This post will focus on how we could replace Yahoo Pipes for these functions [28]. We will not deal here with the web page scraping Pipes was able to do too [29].

So I went looking for substitutes which could merge and filter feeds. I mean, real ones : as simple as Pipes. For instance, they shall have a graphic user interface (GUI) ; coding shouldn’t be necessary. The only difficulty allowed should be the use of regular expressions (Regex).

Free hosted substitutes

  • FeedCombine, RSSMix, FeedRinse or ChimpFeedr (to merge feeds into one feed) then FeedSifter or FeedRinse (to filter the mega-feed) can answer simple needs.
    FeedRinse can do more, as it accepts Regex but it can’t merge more than 5 feeds, is slow and bugs according to La Bibliothèque du CHUM’s test.
    FeedCombine cannot combine more than 5 feeds, say Anik Dumont-Bissonnette.
    ChimpFeedr is very simple at "chomping" (as their web site says) feeds.
    RSSMix, according to the same test, works perfectly, merging up to 100 feeds
  • Feed Informer combines and filters feeds, but filtering can only be done using AND or OR operators
  • IFTTT doesn’t seem to do exactly that : merging and filtering RSS feeds into one feed. Which is not to say it does not have its (numerous) advantages in the field of monitoring services.

Paid hosted substitutes

Self-hosted solutions (need coding skills)

In the sources listed below, I found other free or paid total or partial replacements — but you have to host them on your own server and/or they’re far too complicated for the average information professional :

  • Tiny Tiny RSS (TT-RSS) is an RSS reader with very interesting RSS feeds filtering features (open source)
  • Huginn by cantino (open source on GitHub). According to a MakeUseOf article, « this is the most popular of all the GitHub solutions mentioned, and has a huge, active support community behind it. It’s well documented and easy to use »
  • WebHookit, based on Node.js and mongoDB (open source)
  • Pypes (open source on GitHub), a Python application
  • Rss Percolator (open source on GitHub). Downloads, aggregates and filters RSS feeds
  • ClickScripts (open source on GitHub)
  • Bipio (open source). See the Getting started page (developer documentation) for a quick presentation. Bipio is a graph pipelining API talking RESTful JSON
  • Neddick (open source on GitHub).
  • pipe2py (open source on GitHub). You need to backup your YP pipes before. It uses JSON and the Google App Engine
  • Pipes2js (open source on GitHub)
  • Superpipes (open source), to be hosted on a Debian server
  • open source edition of MuleSoft’s Anypoint Studio
  • Quadrigram seems too graphics-oriented to me (apparently free).

NB : the first four services are recommended [34] by Serge Courrier, a French consultant specialising in RSS readers and the use of RSS feeds for monitoring web sites [35].

Walled gardens

RSS is important to information professionals and, as we’ve seen, much used by people whose job is to monitor web resources. But this does not prevent RSS implementation from receding. If you look into the list of applications which can be connected by IFTTT, you will find that RSS is just one among more than a hundred of mostly proprietary ones ... Walled gardens again.

Did I miss something ? Do you know about any simple tool that could replace the "RSS mashup" function of Yahoo Pipes ? I’m interested in free as well as paid for services.

Emmanuel Barthe
law librarian researcher, open law specialist and monitoring solutions specialist


Sources for this article

Here are the links I found to some articles/blog posts and a number of forum discussions about Yahoo Pipes substitutes :

This article was written with the the help of Serge Courrier.


1 | ... | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ... | 33

Dernières brèves