Logiciels, Internet, moteurs de recherche

Dernier ajout : 4 août.

Derniers articles

Les commentaires sous les articles de presse en ligne : inutiles et nocifs

Vendredi 8 juin 2018

Lire la suite »

Des commentaires sous l'article du Parisien du 8 juin 2018 sur le refus d'intervention des militaires au Bataclan

Les commentaires sous les articles de presse en ligne, à quelques exceptions près (le Financial Times par exemple) sont toujours aussi inutiles et sentent toujours aussi mauvais.

Un exemple récent sur le site du Parisien (groupe Les Échos Le Parisien), sous cet article, dont le sujet est un véritable miel à mouches :
Bataclan : des familles de victimes demandent des comptes à l’Etat, Le Parisien.fr 7 juin 2018

Florilège de com’ [1] :
« Bon courage et bonne chance sa va être très long depuis des années ont protèges les assassins aux noms de présomption d’innocence et Taubira qui en remis une couche ces années vont être chère en vie humaine »
« Cette anomalie choquante laisse à penser que le donneur d’ordre, donc le gouvernement, était secrètement complice des islamistes. Quelle autre explication ?? »

Et ce, malgré les précautions louables mais insuffisantes prises par les journaux : obligation de s’inscrire (création d’un compte ou, plus souvent, connexion à son compte Google ou Facebook) ou carrément d’être client, amélioration des outils et chartes de modération (notamment l’implémentation croissante de Disqus ou Netino).

Certains medias ont mis en place des chartes d’une sévérité drastique. Du genre de celle de Numerama, finalement mise en place en février 2018 et dont l’article 4, par exemple, prévient très franchement :

« La liberté d’expression n’est pas un absolu. Vous avez le droit de tout dire, effectivement, mais également le devoir de subir les conséquences de vos propos. Tout manquement aux règles entraînera la suppression des messages et le bannissement définitif des auteurs impliqués. Numerama est une société privée et ces espaces de discussions sont la propriété d’Humanoid, qui se réserve le droit de les modérer comme elle les entend, sans préavis. »

Dans le cas présent, Le Parisien n’exige que le minimum : se connecter à son compte Google ou FB. C’est clairement insuffisant.

Soyons franc : les journaux, tout comme les réseaux sociaux, "kiffent" les commentaires, le débat, les scandales. En effet, tout ce qui fait le buzz apporte du trafic, donc des revenus publicitaires.

Mais certains se sont rendus compte que le gain était très faible, et les dégâts sur les articles, notamment en terme d’agressivité, désastreux. Ceux-là ont supprimé les commentaires. Un exemple : l’hebdo belge Le Vif/L’Express (groupe Roularta) a décidé de fermer la possibilité de commenter les articles sur son site.

Très franchement, personnellement, c’est pour moi un soulagement que de ne pas tomber sur ces com’ nauséabonds.

La réalité, c’est que les gens heureux n’ont généralement rien à dire, et les mécontents toujours trop à (mé)dire.

De surcroît, le niveau de connaissance moyen du commentateur d’article en ligne est tel qu’il n’apporte aucune information ni aucun argument supplémentaire à l’article. Qui plus est, la plupart des gens commentent sans avoir lu en entier et s’ils ont lu, sans pleinement comprendre. En analysant 70 millions de commentaires depuis dix-sept années, le quotidien britannique The Guardian est arrivé à une conclusion assez déprimante : la zone en bas de ses articles se transforme souvent en champ de bataille et le débat "constructif" entre ses lecteurs est rare.

Les forums, y compris sur les réseaux sociaux (particulièrement Facebook et Twitter [2]), sont d’abord et avant tout un gigantesque défouloir pour les radicaux de tout poil, avec une préférence pour le racisme, l’europhobie et l’anti-mondialisation. Côté politique, l’extrême-droite, très active, est devant l’extrême-gauche. Le reste du spectre politique est quasiment absent [3].

Je le redis : lire les commentaires sous les articles de presse en ligne :

  • me fait désespérer de la nature humaine
  • me donne parfois envie de vomir
  • et me fait perdre mon temps.

On cite souvent le chiffre de 90% de spam parmi la masse d’emails [4]. Il faudrait aussi se poser la question pour le Web. Quel est le taux de déchets informationnel et idéologique sur le Web ?

Et la question de la lutte contre cela. Messieurs-dames de la presse, le fact-checking [5], c’est bien. Mais supprimer les commentaires sous les articles, ce serait mieux.

Emmanuel Barthe
veilleur


Wikipedia : l’encyclopédie qui s’est rangée

De la contre-culture au politiquement correct

Dimanche 3 juin 2018

Lire la suite »

J’ai contribué à quelques articles (juridiques surtout) dans Wikipedia. Et cela fait longtemps que je voulais écrire non plus dans, mais *sur* cette encyclopédie libre en ligne, passée en 20 ans de la contre-culture au politiquement correct.

Car c’est vrai : je ne trouve plus que partiellement mon compte dans Wikipedia (WP pour celles et ceux qui y écrivent souvent).

Des règles très contraignantes partout : l’exemple de la création de nouveaux articles devenue quasi-impossible

Je regrette que Wikipedia soit devenue à mon avis si pleine de procédures, de règles quasi-juridiques et d’administrateurs (dits "admins") qui ont un véritable rôle d’arbitres (au sens d’arbitre dans l’arbitrage commercial, donc juges). Pour moi — c’est mon impression et je peux me tromper — écrire plus de quelques lignes dans Wikipedia est de facto devenu aussi difficile que d’être membre d’un club à l’anglaise.

A part pour faire quelques corrections ou de petits ajouts, j’ai l’impression que l’orientation "encyclopédie neutre" interdit désormais de créer [6] ou modifier substantiellement tout article.

La volonté de neutralité impose aussi de ne rien écrire qui ne soit écrit ailleurs, dans un média "respectable" (presse, y compris sa version en ligne, et ouvrages d’abord). Tout "travail inédit" [7] a tendance à être dénoncé par une question ou un bandeau ou simplement effacé, quand bien même les informations qu’il donne sont exactes, notoires ou constatables par soi-même. Pour un exemple, voir l’échange suivant (traduit en français) [8] sur la page de discussion de l’article de WP sur le logiciel gratuit d’édition d’images IrfanView :

« Il devrait être mentionné comme critique que ce programme ne précharge PAS les images ! On est à l’âge de pierre, là ! Proxide 02:16, 23 décembre 2010 (UTC)
Je suis d’accord, mais si aucune source source fiable et indépendante ne le dit, nous ne le devrions pas non plus. —Lexein (talk) 00:09, 10 September 2011 (UTC) »

Ce qui rend cet exemple encore plus net, c’est que Lexein, le wikipédien qui répond est à la fois le principal contributeur de l’article [9] et un vétéran de Wikipedia — il fait même partie des 4000 contributeurs en langue anglaise les plus actifs de WP de tous les temps.

Le moindre manquement aux règles [10] est sanctionné par une suppression immédiate [11] par un administrateur de ce qui a représenté plusieurs heures de travail. Or il est difficile aux non admins de connaître ces règles dans le détail [12] et ces suppressions se font généralement sans grande diplomatie. Ca m’est arrivé. C’est arrivé aussi à d’autres : je l’ai deviné à plusieurs reprises à travers des discussions en ligne sur WP.

Ayant modéré une liste de discussion [13] pendant quatre ans, je ne peux pas nier la nécessité d’empêcher les très nombreux vandales, contributeurs de mauvaise foi et agences de communication [14] de défigurer Wikipedia. Je peux à la limite comprendre que les admins soient fatigués et "tirent sur tout ce qui bouge sans poser de question". Mais malheureusement ce comportement même fait des dégâts, par son manque de respect pour les contributeurs de bonne foi qui se voient supprimer leur travail bénévole sans avertissement ni explication.

Des articles devenus très lisses

Dans le même temps, tout article sur une société où une personnalité est trop souvent "lissé", réécrit habilement (ça se voit quand même) par ses communicants. Certes, un bandeau souvent signale cela mais à part sur les articles concernant les sociétés et personnalités controversées ou à la mode, ces "edits" (modifications) ne sont ni "revertés" (annulées) ni réécrits. Peu de gens s’en soucient et ceux qui s’en soucient manquent et de temps et de force de frappe face aux communicants. Un exemple récent (juin 2019) : l’agence de publicité d’un marque de sport place ses photos sur Wikipedia. Dans cette bataille de communication, des groupes particuliers à visées idéologiques cherchent, inversement, à subrepticement détourner les articles de WP, à les tourner dans leur sens.

Le corollaire, de mon point de vue : je ne trouve plus dans Wikipedia ces infos croustillantes, ces interprétations divergentes qui en faisaient le sel (allez, si ! parfois dans les versions archivées on tombe sur une info non politiquement correcte mais en fait il faut savoir ce qu’ on cherche ... et le chercher longuement puisque les archives ne semblent pas indexées par le moteur de WP ni par Google). On dispose désormais d’une encyclopédie neutre [15] très riche et qui rend service. Certes. Mais on a beaucoup perdu pour ce gain.

Désolé d’être aussi cru, mais c’est un fait : Wikipedia ne pense plus, elle résume ou cite des gens qui pensent — et encore, pas des sites personnels, mais des sources très "consacrées". Eliminant ainsi plein d’informations qu’on ne trouvait guère ailleurs.

Les experts boutés hors de Wikipedia

La page de WP List of Wikipedians by number of edits [16] explique ceci :

« Dans une discussion sur la suppression, le vote pour Garder ou Supprimer un article donné émis par un éditeur ayant un nombre d’"edits" dans WP de 67 330 peut se voir donner plus de poids que le même vote émis par quelqu’un qui n’a fait que 12 "edits". »

Etre un gros contributeur et un expert de WP compte donc beaucoup dans l’encyclopédie. Et souvent plus que le fait d’être un véritable expert du sujet traité dans l’article [17]. L’exemple paroxystique bien connu en est la bataille livrée par le romancier américain Philip Roth pour faire rectifier l’article WP portant sur lui [18]. Plus banalement, Benjamin Coriat, économiste et universitaire français pourtant classé à gauche et spécialiste des communs, dit [19] :

« Wikipédia, ce n’est pas forcément très bien gouverné, parce que les économistes qu’on trouve dans Wikipédia, les définitions qu’on trouve dans Wikipédia, il y a beaucoup à dire. »

Même Alexandre Moatti, historien des sciences, contributeur avoué de Wikipedia et ex-membre du conseil d’administration de Wikimedia France, reconnaît, dans une contribution en défense de Wikipedia, que dans les sciences humaines et sociales (SHS), le flou est plus grand — ce qui implicitement permet l’existence d’articles WP contestables [20].

Un nombre non négligeable d’articles, même non "chauds", et malgré l’obligation de citer des sources "consacrées" :

  • primo, sont de facto entre les mains de non-experts (devenus en revanche des experts du fonctionnement de Wikipedia)
  • deuxio, sont malgré la présence de (plus ou moins nombreuses) notes de bas de page, mal documentés. Les non spécialistes, en effet, ne sont le plus souvent pas abonnés aux bases de données de la discipline et n’ont pas accès à un centre de documentation ou une bibliothèque spécialisé
  • tertio, manquent cruellement de recul et de sens critique.

D’après ce que je sais, ce type de comportement des wikipédiens et de fonctionnement de Wikipedia dissuade beaucoup d’experts de contribuer à WP [21].

Recul et sens critique — pour tout dire, vivacité —, c’est ce que la participation des experts et l’autorisation des "travaux inédits" (abrégés en TI en langage wikipédien) pourraient apporter. Certes, modérer tout ça et y faire le ménage serait probablement plus ardu, puisque les règles de neutralité et d’absence de contenu original ne pourraient plus servir de garde-fous stricts (et aveugles).

Mais cela attirerait peut-être plus de volontaires (réellement qualifiés). Et après tout, c’est bien ainsi que Wikipedia fonctionnait à ses débuts et elle comptait déjà énormément d’articles et de contributeurs.

Les arguments sur cette évolution

On peut penser que cette évolution vers le lisse, le purement factuel et le neutre est un choix qui a été fait pour crédibiliser Wikipedia, pour faire sérieux, comme une "vraie" encyclopédie. Et aussi parce que les contributeurs de WP n’avaient pas le temps et les connaissances pour faire le travail d’un comité scientifique ou éditorial. Voir à ce sujet ce que le fondateur Jimmy Wales [22] (en 2003-2004) et le premier organisateur de WP Larry Sangler ont écrit. Et c’est d’ailleurs ce qui a été souvent avancé dans les articles de presse que j’ai pu lire à ce sujet.

Toutefois, je me demande parfois si en réalité ce n’est pas aussi pour éviter les pressions et procès en diffamation sur un site devenu incontournable et donc trop gênant. Wikipedia à tant crû qu’elle a dépassé — et de très loin — la diffusion de toutes les encyclopédies ayant existé avant elle. Sans parler de théorie du complot, je pense que WP est devenue "mainstream" et que de fait, elle a dû assumer un (gros) inconvénient de tout média trop dominant aujourd’hui : le "politiquement correct".

Pourtant, pour ne prendre qu’un exemple, l’Encyclopaedia Universalis (EU) elle-même n’était guère neutre — disons au minimum ses articles en sciences humaines et sociales (SHS) [23] et une partie de ceux en sciences exactes [24]. Oh que non ! Pour avoir pas mal travaillé dessus dans ma jeunesse (fin années 70 + les années 80 : pas d’Internet à cette époque), je peux vous garantir que l’Encyclopaedia n’était pas neutre. Chaque article était rédigé par un seul auteur — c’est toujours le cas — et il en profitait évidemment pour défendre ses thèses. Evidemment, l’EU avait un conseil scientifique, que WP n’a pas.

Ça avait aussi des inconvénients, les articles pouvaient être très difficiles à comprendre. Mais au moins ça pensait — et ça pensait avec des arguments. Comme WP à ses débuts. A mon avis, Wikipedia est devenu un super Quid. Sans la fiabilité à 100% du Quid [25].

Mais trêve de tirades, je vais vous lasser avec mes rengaines à la "C’était mieux avant". Tant pis ou tant mieux (c’est selon) pour Internet si Wikipedia est devenue "mainstream" [26].

Emmanuel Barthe
bibliothécaire documentaliste juridique, webmestre


Solutions pour se constituer ou partager une base de données juridique professionnelle

Moteurs de recherche, CMS, GED ...

Mercredi 16 mai 2018

Lire la suite »

Tout est parti d’une question posée sur la liste de discussion Juriconnexion par un avocat solo sur les outils à la disposition des cabinets pour créer leur propre base de données juridique (jurisprudence, articles, etc...). En clair, y a-t-il des produits ou solutions à recommander qui permettent le la recherche et le partage avec d’autres collègues/confrères, voire l’exportation/importation automatique de données ?

De manière générale, il n’existe pas à ma connaissance de produit sur étagère ni a fortiori d’application gratuite qui ferait tout cela et marcherait tout seul. Mais qui en fassent une partie assez facilement, oui.

Si plus de 300 documents ou que vous ne partagez pas de réseau local, il faut envisager du cloud, un (gros) logiciel de gestion électronique de documents (GED) ou un site web partagé doté d’un CMS et/ou d’un moteur de recherche.

Simple, facile et rapide

- Moins de 300 à 500 documents ? Si vous êtes en réseau local Windows ou Apple et que le nombre de documents est faible (moins de quelques centaines), les bons vieux répertoires suffisent. Pour moteur de recherche, prenez celui de l’Explorateur Windows.

- Mettre les documents sur un espace Google ou autre cloud (testez Cozy Cloud par exemple, il est français et ne vend pas vos données) et partager les codes d’accès.
L’avis de Beatriz Chatain, knowledge manager du cabinet d’avocats CMS-BFL [27] : « Les solutions de type Google Drive [28] ont l’intérêt de pouvoir être collaboratives mais au bout d’un moment, le problème de volume peut se poser aussi et donc il faudra payer. Le montant devrait toutefois être moins important qu’un outil ad hoc de type GED. Attention quand même aux accès et à la sécurité ... »

Difficulté moyenne, nettement plus personnalisé

- Le logiciel MediaWiki qui "propulse" Wikipedia a été plusieurs fois utilisé pour de telles bases. Par exemple pour la base de doctrine du Barreau, dite la Grande Bibliothèque du Droit (GBD). MediaWiki n’est pas forcément simple à installer [29], mais après, il suffit de créer une nouvelle page puis de copier coller le document dedans.

- Le portail et logiciel documentaire PMB de la société PMB Services. Selon la description de ma collègue Carole Guelfucci, « plusieurs cabinets d’avocats utilisent ce logiciel libre. A l’origine, PMB est un logiciel plutôt dédié aux bibliothèques (publiques) mais avec de la personnalisation, il peut tout à fait s’adapter à la gestion d’unités documentaires de toutes sortes comme la jurisprudence ou la doctrine.
PMB est un logiciel libre donc gratuit dans l’absolu. Néanmoins, pour son paramétrage et sa personnalisation et pour obtenir un portail qui corresponde aux attentes, il est conseillé de se faire aider, en l’occurrence par le prestataire PMB Services..
On ne paye pas de licence mais du service. Le coût de la solution dépend du degré de personnalisation. Plus qu’une base de données de connaissances, on obtient dans ce cas un véritable portail documentaire. Tout dépend alors de la nature du projet »
Un point important : il existe un club bien actif des utilisateurs juridiques de PMB. Les comptes-rendus de ses réunions sont disponibles sur le blog de Carole.

- SharePoint de Microsoft est un logiciel de gestion de contenu ("content management System"", CMS) pour intranets. Comme le rappelle Beatriz Chatain, il permet de réaliser des arborescences, est collaboratif et peut être utilisé assez "rapidement" sans développement particulier. L’avantage de SharePoint en entreprise, c’est que la licence SharePoint est souvent déjà incluse dans la licence Office globale négociée par la firme.

- Le moteur de recherche et d’indexation dtSearch. Cette solution est, selon le traducteur Jean-Marie Le Ray, « la Rolls-Royce des moteurs de ce genre ». Disponible en plusieurs déclinaison, la version de base (dtSearch Desktop with Spider – single user) est à 199 USD. Après on passe à 1000, 2500 USD et plus. Il est possible avec dtSearch desktop with Spider d’indexer tout le contenu de son ordinateur local et/ou d’un site web, et d’effectuer des recherches à distance. Une version de dtSearch peut même fonctionner sur les très puissants hébergements cloud AWS (Amazon Web Services) et Microsoft Azure.
Leur slogan ("Find anything, anywhere, instantly !") n’est pas usurpé : J.M. Le Ray dit utiliser ce produit depuis des années et avoir indexé avec 20 tera-octest de données texte (des centaines de millions de termes indexés). De plus, selon lui, le processus d’indexation est extrêmement rapide.
Un des spécialistes français de dtSearch est le traducteur Dominique Pivard.

Ambitieux et très puissant

- Pour un professionnel solo ou une petite équipe, la base de données Open Avocat montée par l’avocat spécialiste du contentieux des accidents médicaux Dimitri Philopoulos, et qui réutilise Legifrance, est un bon exemple de ce qui est possible pour un coût très faible.
Mais attention : pour les données Legifrance, elles sont en XML. Leur traitement optimal demande des compétences informatiques

- Pour une grosse structure, rappelle Beatriz Chastain, « les systèmes de GED de type iManage (ex-MailSite, ex-FileSite) permettent de gérer des arborescences assez finement construites avec des fonctionnalités très développées. C’est ce que les cabinets de grande taille ont en général, mais c’est cher ».

Une remarque personnelle : l’absence de produit simple à part les "drives" des "clouds" — que d’anglicismes ! — laisse un peu de place pour un produit web centré autour d’un moteur de recherche efficace, rapide et sécurisé par code d’accès. Cela dit, le moteur, c’est toute la difficulté : des qu’on veut de l’optimisé, sauf exception à la dtSearch, ça a tendance à chiffrer.

NB : si vous voulez garder les décisions au format PDF, c’est possible, mais les moteurs de recherche sont moins bons ou plus chers.

Des contacts et des SSII

- Aller faire un tour un soir à une réunion Open Law. Il y a dans ce forum beaucoup de contacts à prendre et de trucs à échanger.

- Plusieurs legal tech ont des compétences dans ces domaines mais celles-ci ne sont pas gratuites. Des sociétés connues ? Luxia, Lexbase, Doctrine.fr ... (liste non exhaustive, merci aux membres de la liste de compléter).

- Faire appel à un documentaliste indépendant pour élaborer une solution peut permettre de mettre en place quelque chose de pratique et pas très cher. Pour une liste des documentalistes indépendants, voir sur ce blog notre billet Documentalistes juridiques free lance et autres indépendants du secteur de l’information juridique. Et là, comme le souligne ma collègue Carole Guelfucci, PMB peut être un choix de logiciel, l’importance de la prestation de service de la société PMB pouvant étre réduite par les connaissances du documentaliste. La société PMB a d’ailleurs l’habitude de travailler avec des bibliothécaires documentalistes.

D’autres pistes ? Les commentaires sont ouverts.

Emmanuel Barthe
documentaliste juridique


1 | ... | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ... | 36

Dernières brèves