Actualités : derniers articles

Les robots avocats et juges de demain ?

L’intelligence artificielle en droit : les termes du débat

Justice prédictive, legal tech, ROSS, Minority report, machine learning, réseaux neuronaux, NLP, Big data etc.

Lundi 16 janvier 2017

Un sujet très tendance

Les Echos (10 janvier 2017) viennent de publier un article au titre provocateur : Les robots seront-ils vraiment les avocats de demain ?.

En fait, ses auteurs, Pierre Aidan, cofondateur de Legalstart.fr [1] et Florence Gsell, professeur de droit à l’université de Lorraine, réagissent, dans le but de rassurer les professions judiciaires, à un autre article beaucoup plus provocateur sur le fond, celui publié en octobre 2016 à la Harvard Business Review, par le célèbre juriste et consultant britannnique Richard Susskind et son fils Daniel, économiste : Technology Will Replace Many Doctors, Lawyers, and Other Professionals (Les nouvelles technologies remplaceront beaucoup de médecins, juristes et autres professionnels libéraux). Cet autre article n’est en fait qu’un résumé du dernier ouvrage des Susskind publié en octobre 2015 : The Future of the Professions : How Technology Will Transform the Work of Human Experts (Le futur des professions libérales : comment les nouvelles technologies vont transformer le travail des experts humains) (Oxford University Press, OUP).

La Semaine juridique publie, elle, une étude d’Antoine Garapon, magistrat, secrétaire général de l’Institut des hautes études sur la Justice (IHEJ) et spécialiste reconnu des questions de justice, intitulée « Les enjeux de la justice prédictive » [2]. Et pour ne pas être en reste, le Recueil Dalloz s’empare aussi du sujet avec une tribune de Marc Clément, Premier conseiller à la cour administrative d’appel de Lyon [3].

La revue Expertises, enfin, publie une interview de Rubin Sfadj, avocat aux barreaux de Marseille et New York et grand blogueur et twitto devant l’Eternel. Interview portant sur l’IA juridique [4] et plus concrète et plus claire — plus tranchée, peut-on dire — que les deux articles précédents.

Depuis les premiers succès commerciaux de ROSS, l’application au droit des faillites américain du système de machine learning développé par IBM, Watson, l’intelligence artificielle (IA) en droit est devenue tendance [5]. On parle beaucoup aussi de justice prédictive.

De quoi parle t-on exactement ?

Mais de quoi parle t-on exactement ? Et quels sont les véritables risques pour les professionnels du droit et leurs "paralegals", documentalistes et veilleurs ?

Il y a d’abord trois technologies, qu’il faut distinguer, et derrière ces technologies il y a des applications et leurs développeurs, grosses sociétés de l’informatique et de l’Internet ou start-ups, l’ensemble de ces sociétés étant communément appelé les "legal tech" [6] :

On peut rapprocher ces articles d’une note de McKinsey qui vient de paraître sur le futur du travail [10].

ROSS : points forts et limites d’un moteur de recherche en langage naturel à base de machine learning avec supervision

C’est surtout le produit d’IBM qui fait parler de lui. Et même si, de fait, on peut parler d’une intense campagne de presse, je crois qu’on tient une confirmation du basculement du droit dans la véritable IA dans les articles sur l’implémentation de ROSS par le petit cabinet d’avocats américain Salazar Jackson : en effet, selon le principal associé de cette firme, ROSS fait aussi bien et plus vite les recherches qu’un jeune collaborateur et de plus il est capable de les résumer en un mémo [11].

Bien sûr, ROSS nécessite une interaction homme-machine. Il s’améliore en apprenant des retours des juristes sur ses recherches [12].

ROSS est pour l’instant spécialisé uniquement dans le droit américain de la faillite (US bankruptcy law). Mais la diversité des tâches et des domaines possibles est une caractéristique du machine learning le plus récent (depuis environ 2015).

Le dirigeant et co-fondateur de ROSS Intelligence, Andrew Arruda, expliquait justement en août 2016 :

« La version actuelle du système est utilisée pour aider les juristes spécialisés en procédures collectives travaillant dans des firmes américaines. Les futures versions du système couvriront d’autres domaines du droit et d’autres juridictions. »

Et Watson, l’application d’IBM dont dérive ROSS, sert à de multiples tâches. Comme répondre aux mails adressés par les clients d’une banque, travailler dans certains cafés Nestlé au Japon sous le nom de Pepper, tout en mettant ses formidables capacités intellectuelles au service de la lutte contre la criminalité en ligne [13].

Autre exemple : la Lettre de l’Expansion du 16 janvier signale que le réseau social interne développé par Orange, installé chez eux à l’automne 2015 [14] et également vendu par l’opérateur sous le nom de Business Together Sharespace [15] « s’appuie sur la technologie "machine learning" [...] et inclut des robots à même de suggérer à l’utilisateur des informations pertinentes ou des collègues susceptibles d’enrichir son activité ».

A priori (le manque d’information détaillées sur ROSS étant criant), les limites d’un système comme ROSS, sont :

  • comme pour les bases de données en ligne, son manque de confidentialité. Je sais que les éditeurs de services en ligne garantissent la "confidentialité" des données de leurs clients, mais de fait, si elles ne sont pas cryptées de bout en bout, elles ne sont pas réellement confidentielles. Il serait intéressant à cet égard de savoir si ROSS crypte les données de ses clients
  • sa dépendance à la "data"
  • le poids du passé (même s’il pourra certainement intégrer les projets de loi), car la donnée c’est du passé
  • sa dépendance aux personnes qui "l’entraînent" (machine learning supervisé)
  • son degré d’acceptation par la société. Si l’on s’en tient à l’histoire récente des innovations, les systèmes ML en droit finiront, selon toute probabilité, par être assez rapidement acceptés par les consommateurs de droit. Les professionnels du droit risquent, à long terme, de devoir suivre
  • à court et moyen terme, le délai d’implémentation en droit français. ROSS en son état actuel limité au droit américain des faillites, aurait été développé en trois ans à partir de Watson. Compte tenu des spécificités du droit français (pas de la common law ... mais pas un véritable problème [16]), de l’absence pour l’instant de disponibilité en accès libre [17] des décisions de justice judiciaire de première instance [18] avant des années malgré la loi Lemaire pour une République numérique [19] et de la nécessité d’un partenariat entre un éditeur juridique et un éditeur de système de machine learning [20], cela devrait prendre au minimum cinq ans et peut-être plus.

Pourquoi une montée des IA en droit

Une des raisons de la probable montée de ces systèmes : les économies réalisées. C’est, avec la rapidité, LE motif mis en avant par le managing partner d’une "small law firm" spécialisée en droit américain des faillites, le domaine de ROSS.

Or la Justice a justement un problème budgétaire criant, reconnu par Jean-Jacques Urvoas, le ministre de la Justice lui-même ... [21] Une tribune iconoclaste aux Echos, rédigée par des non juristes (évidemment ...), propose d’ailleurs de confier la justice française à l’intelligence artificielle [22].

Impact prévisible des IA sur les stagiaires, paralegal et documentalistes juridiques ?

Ces outils auront aussi un impact sur la recherche — et donc la veille — documentaire juridique : les tâches répétitives et "découpables" en petits morceaux seront robotisées, les autres ne le seront pas. Par exemple, ROSS réalise la recherche booléenne et la première analyse des résultats. Selon les termes d’Andrew Arruda [23] (traduction par nos soins) :

« La technologie AI de ROSS remplace le besoin d’utiliser les opérateurs et mots-clés de la recherche booléenneed par du langage ordinaire. Si un juriste d’affaires a besoin de connaître la différence entre les deux concepts juridiques "loss" et "recoupment", tout ce dont le juriste a besoin est de demander à ROSS : "Quelle est la différence entre "loss" et "recoupment" ?
Le résultat fourni par le système va au-delà de la simple identification des arrêts pertinents. Au lieu de cela, il attire l’attention du juriste sur les passages clés dans l’affaire qui devrait répondre idéalement à la question posée.
Quand vous posez une question à ROSS sur l’état du droit, vous la posez comme vous le feriez avec un collègue humain. ROSS découpe la phrase pour déterminer le sens de la question, puis conduit la recherche. »

Autrement dit, d’ici *peut-être* cinq ou sept ans et selon le délai nécessaire pour adapter ROSS au droit français [24], plus le travail du documentaliste juridique procédera, comme le dit Jean Gasnault (La Loi des Ours), « d’heuristiques pointues pratiquant pour partie un mode intuitif (opérer par rapprochements semi conscients) », et j’ajouterais : plus il aura une conscience d’artisan et d’expert de haut vol (notamment dans la maîtrise des sources méconnues ou mal indexées [25]), moins au final il aura de chances d’être automatisé. Mais aussi : plus il travaillera *avec* l’IA.

Pour les postes de paralegal orienté recherches et veille (par exemple, les spécialistes de la recherche, de la veille et de l’enregistrement des brevets) et pour les jeunes collaborateurs (qui font aux Etats-Unis énormément de recherches, ce qui correspond en France aux stagiaires), une étude d’Altman Weill datant de 2015 est pessimiste [26]. La brève précitée de la Lettre de l’Expansion est encore plus explicite : « Watson [...] est réputé pour son rôle dans la destruction d’emplois ». Pour les autres paralegals, le risque à court terme, surtout en France, est faible mais à long terme, leurs tâches découpables seront probablement automatisées.

Toutefois, le Conseil d’orientation pour l’emploi (COE) dans un rapport publié le 12 janvier 2017, moins de 10% des emplois sont "très exposés" aux mutations technologiques et présentent donc le risque d’être supprimés, mais près de la moitié devront évoluer [27]. Les emplois supra ne sont pas dans la liste des 10% du COE.

IA en droit et SF

Et si on en arrivait là où Google semble être du fait de l’intégration de machine learning dans ses algorithmes (ses ingénieurs ne savent plus totalement en détail comment leur moteur fonctionne : en tout cas, c’est ce que dit un scientifique chez un rival, Qwant) ?

Eh bien ce serait peut-être pire : on ne saurait même plus qui ni pourquoi nous juge. Power to the machine.

La science-fiction a déjà envisagé ces risques [28] :

  • Rémy cite le tome 3 de la bande dessinée SOS Bonheur (scénario de Jean Van Hamme, dessin de Griffo). Le tome 3 parle de justice automatisée : chaque avocat soumet ses conclusions dans une machine et la machine rend son verdict, le juge n’est là que pour contrôler le bon fonctionnement de cette dernière. Ainsi la justice est aveugle et équitable puisqu’elle est censée rendre le même verdict pour tous ceux qui sont dans la même situation sur tout le territoire. Jusqu’au jour où la machine condamne un homme qui a commis un délit mineur à la peine de mort alors que cette dernière a été abolie il y a déjà de nombreuses années. Peut-on désobéir à la machine au risque de remettre en cause tous les autres jugements déjà rendus ?
  • nous avons (presque) tous vu le film Minority report de Steven Spielberg avec Tom Cruise (d’après la nouvelle éponyme de Philip K. Dick). Même si ce sont des êtres humains spéciaux (des"precogs") qui y tiennent le rôle des logiciels et des données et statistiques, le sens en est clair :
    • les programmes sont écrits par des êtres humains, dans l’intérêt de certains
    • et comme tels seront toujours biaisés. Particulièrement si l’information qui y est entrée est biaisée. Illustrations récentes aux USA avec les programmes prédictifs de la police. Antoine Garapon évoque lui aussi ce risque. Pour une vue plus large et un point sur les principaux programmes en cours.

Si le machine learning finit, ce qui est probable selon nous (cf supra), par être utilisé par le juge, il est à espérer que les conclusions d’Antoine Garapon et Marc Clément (dans les articles de revues juridiques cités au debut de ce billet) s’imposeront :

Eviter le risque de « l’effet "moutonnier" de la justice prédictive qui pousse au conformisme et réclame plus aux juges qui estiment qu’ils doivent aller à contre-courant, c’est-à-dire faire leur métier tout simplement !

« Il sera donc capital que les modes de raisonnement inscrits dans les algorithmes soient parfaitement explicites et maîtrisés par le juge. Il conviendra, de plus, que des méthodes alternatives soient proposées et que l’on ne se retrouve pas en situation de monopole avec une seule technologie utilisable. »

Concernant la justice prédictive, Me Sfadj souligne que lorsque les outils de justice prédictive seront utilisés par la puissance publique, cet usage devrait reposer sur trois grands principes éthiques :

  • le principe de responsabilité conduisant à désigner pour chaque algorithme utilisé une personne référente, à l’instar du directeur de publication en droit de la presse
  • le principe de clarté, c’est-à-dire la mention explicite dans une décision de justice élaborée avec l’aide d’un algorithme de ce procédé et la motivation sur laquelle repose le recours à ce type d’outil
  • le principe de précision permettant de corriger une source d’erreur à tout stade du traitement algorithmique.

Du côté des structures privées, ne faudra t-il pas pour les meilleures structures maintenir une expertise en recherche et veille afin de contrôler la pertinence des réponses (car un mémo fourni par ROSS est bel et bien au minimum une amorce de réponse) ?

ROSS, un inconnu

Mais pour éviter de trop conjecturer et en apprendre plus, il serait bien de pouvoir tester ces IA. Et de lire autre chose que des communiqués à peine dissimulés.

En effet, il n’existe aucune démo gratuite en accès libre, le site web du produit ROSS est d’un vide intersidéral (le compte Twitter est beaucoup plus riche !) et que les cabinets d’avocats utilisateurs ne lâchent aucun exemple d’utilisation ni de recherche ni aucun autre détail.

Emmanuel Barthe
bibliothécaire documentaliste et veilleur juridique, spécialiste des moteurs de recherche pour le droit et des données juridiques publiques
licence en droit


Une "webliographie" sélective et rapide sur ROSS :


En gratuit, beaucoup de sujets, mais peu de corrigés

Annales d’examens en droit disponibles gratuitement sur le Web et chez les éditeurs

N’oubliez pas les ouvrages des éditeurs

Jeudi 22 décembre 2016

Les étudiants en droit cherchent souvent les sujets d’examen des années précédentes (dites "annales"), de préférence accompagnés des corrigés.

La règle du payant pour avoir des corrigés ... et ses rares exceptions

- Pour avoir les corrigés — denrée rare en gratuit —, il faut choisir des ouvrages publiés par des éditeurs, essentiellement dans les collections suivantes :

L’autre avantage des annales payantes chez les éditeurs, c’est de commencer par une partie méthodologique, autrement dit de précieux conseils et recommandations pratiques pour analyser le sujet, y répondre, préparer son plan ou rédiger.

Evidemment, si votre bibliothèque universitaire (BU) a ces ouvrages en rayon, ce sera gratuit pour vous, étudiants en droit. Mais souvent, lors des révisions avant les examens, les annales sont toutes empruntées ... Il vous reste alors trois solutions :

  • acheter une édition d’occasion d’il y a un ou deux ans [30] (donc à prix cassé : elle ne doit pas dépasser 8 à 9 euros) en ligne [31] ou chez Gibert Jeune (place Saint-Michel à Paris)
  • acheter ou commander la dernière édition, neuve, aux mêmes endroits que ci-dessous, en ajoutant n’importe quelle librairie près de chez vous, Amazon ou Gibert Joseph [32]
  • ou utiliser les sites web gratuits ci-dessous.

Les deux seules exceptions que j’ai trouvées à la règle du payant pour avoir des corrigés, c’est la rubrique A vos copies ! sur Dalloz Etudiant et le site web de la prépa Centre de formation juridique (voir infra). Les corrigés y sont toutefois moins fouillés et non signés :

- Dalloz Etudiant : A vos Copies ! : des commentaires d’arrêts en droit civil, administratif et libertés publiques. En moyenne un par mois depuis 2012

- Centre de formation juridique (CFJ) [une prépa aux examens en droit] : Annales des facultés de droit
Très riche : de Licence 1 à L3, voire M1 ; entre 4 et 10 années de recul ; toutes les grandes facs de droit ; toutes les matières. Et surtout, avec corrigés. Sur inscription gratuite (il faut donner une adresse email et répondre à des questions sur sa scolarité).
Exemples :

Des annales gratuites sur le Web ... mais sans corrigés

Sinon, voici une liste de répertoires gratuits d’annales d’examens en droit disponibles sur le Web, mais sans corrigés.

- Nantes :

- Paris 2 :

- Poitiers [mise à jour, merci Rémy] :

  • Annales 2016 de la faculté de droit de Poitiers
    Toutes les années sont là : de la capacité en droit et du L1 à Master 2. Ils utilisent le site Calameo, ce qui suppose que Flash soit installé et fonctionne au sein du navigateur web. Ce qui n’est pas toujours le cas, notamment sous Firefox ...

- Strasbourg :

- Toulon :

- Toulouse :

- Versailles :

Pour compléter ou mettre à jour cette liste :

  • demandez aux bibliothécaires de votre BU (bibliothèque universitaire) ou tapez annales dans le catalogue en ligne de votre BU
  • tapez "annales OR corrigés OR sujets droit" dans Google ou "annales en droit" dans Bing ou les mêmes chaînes de caractère dans Startpage (ex-Ixquick). Attention : les annales trouvées peuvent ne pas être de la dernière session ou être des annales d’IEJ ou de CRFPA. Ne pas confondre non plus avec la revue en ligne Les Annales de droit
  • connectez vous à l’intranet (ENT) [33] de votre université et regardez s’il contient des annales.

J’ai oublié les annales de votre fac ? Ajoutez les dans les commentaires infra.

Emmanuel Barthe
bibliothécaire documentaliste juridique en bibliothèque universitaire


80% des Français trouvent « le langage judiciaire peu compréhensible »

Le droit n’est pas assez accessible ni compréhensible : professionnels du droit, et si vous vulgarisiez ?

Une étude sur l’accessibilité du droit en France suggère des pistes de marketing juridique innovant

Samedi 10 décembre 2016

Le Village de la Justice a publié en mai 2015 une étude sur l’accès au droit et les besoin en matière d’information juridique en France réalisée suite à sondage par l’AVIJED (PDF, 17 pages) [34].

Elle amène à suggérer aux professionnels du droit :

  • de tailler étroitement leurs publications sur le Web pour leurs clients et prospects
  • d’utiliser la simplicité et la force de conviction de l’image à l’appui de leurs propos
  • et de faire former leurs clients aux principaux sites juridiques publics pour mieux valoriser le travail du juriste.

Face au constat alarmant que "88% des citoyens français estiment que la Justice est trop complexe et que 80% d’entre-eux considèrent que le langage judiciaire est peu compréhensible" [35], l’AVIJED en partenariat avec le Village de la justice a initié simultanément en 2013 deux enquêtes sur l’accès au Droit.

L’une s’adressait au grand public et s’interrogeait sur la relation des citoyens au Droit et leurs besoins en terme d’information juridique ; la seconde s’adressait aux professionnels du Droit afin de connaître notamment, la place et la mise en oeuvre de la vulgarisation juridique dans leur quotidien professionnel. J’ai répondu à la deuxième enquête.

Les pratiques de recherche d’information juridique du grand public

Sur les recherches d’information juridique menées par les particuliers, l’étude souligne sans le dire expressément le rôle clé des sites web publics, et d’abord Legifrance et service-public.fr, les deux sites phares tenus par la DILA [36]. Les sondés (128 répondants) obtiennent en effet leur information juridique à 82% sur Internet :

  • sur des sites officiels publics tels que Legifrance ou service-public.fr (24%)
  • sur des forums internet (13%)
  • sur des sites d’aide juridique associatifs ou privés (12%)
  • sur des sites de professionnels du droit (13%)
  • 20% des participants ont par ailleurs utilisé un moteur de recherche par mot clé pour les orienter dans leur recherche juridique
  • le reste des participants recherche des informations juridiques dans la presse ou des livres (6,5%), directement auprès d’associations ou permanences publiques d’aides juridiques (4%) et directement auprès de professionnels du droit (7,5%). [...]

« Les participants ont un regard critique sur l’information juridique recherchée : 60% des sondés ne font pas systématiquement confiance aux éléments trouvés par eux-mêmes et 5% n’ont jamais ou presque jamais confiance dans les informations trouvées. En revanche, 35% précisent avoir souvent confiance dans l’information dénichée. [...]

La moitié des participants à ce sondage (50%) a plus confiance dans les informations provenant de services publics que dans les informations provenant de services privés ! Seuls 6,5 % des sondés font plus confiance aux informations provenant de services privés, tandis-que les 43,5 % restant n’ont pas d’a priori sur le sujet. »

La vulgarisation du droit par les professionnels

Sur la vulgarisation du droit par les professionnels (105 répondants) :

« La vulgarisation juridique fait partie de la pratique quotidienne des professionnels du droit : 78% des sondés vulgarisent le droit dans leurs professions de manière régulière. [...]

Certains commentaires libres laissés par des sondés décrivent les méthodologies utilisées pour vulgariser. Les pratiques les plus citées ont été les suivantes :

  • se mettre à la place de son interlocuteur en imaginant les questions qu’il peut se poser et comment y répondre
  • utiliser des exemples concrets, des schémas, des graphiques, des illustrations pour rendre le droit plus attractif.

[...] L’exercice de la vulgarisation semble toutefois ne pas être évident pour la grande majorité : elle est plus ou moins simple pour 50% des participants, plutôt difficile pour 41% d’entre eux, et très difficile dans 5% des cas.

Malgré cela, les participants ne dirigent jamais ou presque jamais (dans 69% des cas), ou de manière non systématique (dans 21% des cas), les clients/justiciables vers d’autres services de vulgarisation.

Lorsqu’ils décident effectivement d’orienter les clients/justiciables vers ces services, ils le font essentiellement vers des sites ou des organismes publics. »

Des conclusions à tirer pour les professionnels du droit

Il y a là clairement des conclusions à tirer pour les professionnels du droit, car si leurs sites web et leurs blogs sont tout aussi fiables que ceux de Legifrance ou service-public.fr, ils sont aussi en très bonne position pour devenir les champions de la vulgarisation du droit et faire revenir en consultation les Français [37]. Aucune PME, aucune TPE ne devrait aller qu’en dernier recours chez un avocat ou un notaire. Et pour les particuliers, l’heure au téléphone à 90 euros n’est pas si cher payer vu l’exhaustivité et la fiabilité d’un professionnel du droit. Les relations du particulier ou du dirigeant de TPE sont certes animés par les meilleures intentions dans leurs conseils, mais comme la médecine, le droit reste un domaine technique où les erreurs et les délais dépassés coûtent bien plus cher que 90 euros.

L’étude de l’AVIJED suggère des pistes de valorisation pour les professionnels du droit, autrement dit de marketing et de "business development" :

  • alimenter leur site web en informations juridiques taillées pour leurs clients, aisément compréhensibles par eux. Le point essentiel est là : rédiger selon leur niveau de lecture et leur vocabulaire, soigner la lisibilité de la police de caractères, prévoir une version pour impression et une version mobile du site ...
  • investir dans des "legal information designers", comme SketchLex. L’efficacité dans la vulgarisation et la force de conviction des dessins, schémas et logos réalisés par ces juristes dessinateurs sont redoutables
  • et de faire former leurs clients à Legifrance ... pour mieux leur en montrer les limites. Car ce sont là des documents juridiques officiels mais bruts de décoffrage, sans aucune explication ni interprétation. Quant à service-public.fr, s’il utilise un langage compréhensible par (presque) tous et traite quasiment tous les problèmes juridiques de base des particuliers, il ne prend quasiment pas en compte la jurisprudence, ne traite que des sujets classiques et très brièvement. La valeur ajoutée du juriste professionnel est alors évidente.

Retrouvez l’étude complète sur le site du Village de la Justice.

Emmanuel Barthe
documentaliste juridique / webmestre / veilleur / formateur


Dernières brèves

Qu’apporte le GCRJ ?

Guide de citation des références juridiques : le Bluebook français est né

Une rapide évaluation

Lundi 5 décembre 2016

Lire la suite »

Le groupe Droit du Syndicat national de l’édition (SNE) a publié en juin 2016 son Guide de citation des références juridiques (GCRJ) sur un site web appelé Ref-Lex [1]. Un travail de deux ans pour harmoniser les pratiques des neuf éditeurs du groupe Droit du SNE et rédiger ce guide, comme l’explique rapidement l’entretien donné par Guillaume Deroubaix et Julien Chouraqui du SNE à ActuaLitté [2].

Le guide est téléchargeable aux formats PDF, XLS et XML.

Comme le rappelle la page Notre démarche, le GCRJ est en fait l’héritier d’une liste SNE des acronymes et abréviations en droit datant de 2004.

Mais ce guide est beaucoup plus que ça. Il est le résultat de deux ans de travail des représentants de neuf éditeurs juridiques français (Berger Levrault, Lextenso, LexisNexis, Dalloz, Editions Législatives, Francis Lefebvre, Wolters Kluwer, Weka, Thomson Reuters) et, même s’il ne patronne pas de son logo le site, de l’éditeur juridique belge Larcier. Un grand absent : Lexbase.

Cinq innovations cruciales

Cinq innovations cruciales ont été apportées au document de 2004 (cf notamment la même page Notre démarche) :

- Des documentalistes juridiques ont été consultés (merci
Juriconnexion :-)

- Ce n’est plus un PDF qui disparaissait du Web de temps à autre mais un site web, visiblement destiné à être pérenne.

- Cette nouveau guide sera à l’avenir mis à jour (si besoin est) au moins deux fois par an. L’ancienne version ne l’était pas.

- L’ancien document de 2004 n’était qu’une liste d’acronymes et d’abréviations accompagnés de leurs développés [3].
Le nouveau est d’abord un guide de citation, d’écriture des références bibliographiques, comme le dit son titre, et accessoirement une liste d’abréviations. La syntaxe de citation d’une référence bibliographique en droit est censée désormais être figée dans le marbre : termes retenus, ordre, abréviations, et même ponctuation.

- Surtout, cette nouvelle version a été réalisée dans un but d’interoperabilité [4]. En clair : les éditeurs à l’origine de ce guide ont choisi d’harmoniser leurs références bibliographiques, sigles et abréviations à compter de juin 2016. L’entretien avec ActuaLitté est explicite à cet égard. Pour citer la FAQ du site : "S’agissant des éditeurs membres du groupe de travail, la recommandation est d’appliquer ces règles dans toutes les nouvelles publications et celles qui sont mises à jour à compter de la diffusion du guide. En revanche, il n’y a pas d’obligation de reprise du fonds existant."
_On sent là que l’effet du Web 3.0 documentaire et éditorial (métadonnées, XML, Open access, archivage OAI, plateformes de publication numériques etc.) a joué à plein. Mais aussi l’influence du Bluebook américain [5], influence expressément reconnue par le groupe Droit du SNE.

Moralité : il a fallu du temps, mais ça valait le coup d’attendre. Bravo aux participants des éditeurs au groupe de travail.

Tentative d’évaluation critique rapide

Maintenant, tentons une évaluation critique rapide [6] :

- Le GCRJ est *très détaillé et très rigoureux*. La version de 2004, aussi riche fut-elle, n’avait pas ce côté "système".
Mais cette rigueur a un inconvénient, déjà relevé par le célèbre juge américain Posner [7] à propos du Bluebook : la complexité, la prolixité (la 20e édition du Bluebook fait 560 pages ...) font d’après Posner inutilement perdre du temps aux juristes quand ils doivent relire leurs articles et recherches et vérifier la syntaxe de leurs références. Et beaucoup d’acronymes et abréviations sont incompréhensibles au commun des juristes — tiens, que croyez-vous que soit l’AJCT, l’ALD, le Dupont ou la CNITAAT ?
C’est probablement pour éviter cet inconvénient que le GCRJ ne rend pas obligatoire tous les éléments d’une citation. Seuls les caractères en rouge sont obligatoires. Ainsi, pour citer un article paru dans une revue juridique, le GCRJ n’exige rien d’autre que titre de l’article, abréviation du périodique et date (voir copie écran supra). Même pas l’auteur. Alors que la recommandation complète contient : Auteur(s), titre de l’article, abréviation du périodique | date, n° du périodique, rubrique, type d’article abrégé | n° de l’article, n° de la ou des pages.

- L’interopérabilité est devenue un besoin critique de nos jours. Ne pas avoir tardé plus longtemps, de la part des éditeurs français/francophones, est bien vu. Prochaine étape : une implémentation française des DTD et schémas XML pour le droit proposés par Legal XML (Akoma Ntoso) ou MetaLex ?

- Le numéro ISBN est désormais recommandé — mais pas obligatoire, dommage — quand on cite un ouvrage. On va enfin pouvoir très facilement retrouver cet ouvrage et le commander sur le Web.

- Le numéro ECLI semble, si j’en crois les exemples donnés, consacré pour citer la jurisprudence. Mais alors pourquoi le numéro ELI pour les textes officiels n’apparait-il pas dans ces mêmes exemples ? Et pourquoi ni l’affichage de l’ECLI ni celui de l’ELI ne sont-ils obligatoires ? En effet, la page Remarque préliminaire sur les identifiants uniques explique : « Selon les cas, et au choix de l’éditeur, ils seront ou non visibles dans les contenus éditoriaux, mais nécessairement présents dans les métadonnées. Lorsqu’ils sont apparents, ces numéros figurent en fin de référence [...]. » Ce que confirme cette autre page du guide.
Est-ce à dire que c’est trop tôt ? Autrement dit : pas encore mais plus tard ? Je pense au contraire que ces numéros doivent apparaître systématiquement *en clair* et dès aujourd’hui.

- La date à laquelle la ressource a été consultée n’est pas retenue par le guide. Or désormais la majorité des ressources consultées le sont en ligne. Et leur mise à jour est devenue plus fréquente encore que sur la version papier. Pensez à la récente réforme du droit des obligations, pensez au droit boursier, au droit fiscal ... La date de rédaction/fraîcheur/mise à jour ne suffit pas. En effet, une ressource citée peut parfaitement avoir été consultée plusieurs jours avant ... une mise à jour, pour ne pas dire plusieurs mois dans le cas d’ouvrages. Alors pourquoi cet oubli ?

- Le GCRJ ne devrait pas admettre que l’on puisse omettre "Cass." devant la chambre de la juridiction judiciaire suprême. Mais c’est une tradition, et puis "Cass." est implicite, me dira t-on. Eh bien, pas pour tout le monde : cela prive grand public et algorithmes d’une donnée de la plus grande et évidente importance.

- Du côté des numéros et autres identifiants, j’aurais une « objection votre Honneur ! » (oui je sais, ça ne se dit pas en France) : le numéro RG (rôle général) n’est pas un véritable identifiant unique. Il ne l’est que combiné au nom ou ou numéro du registre (pénal, civil ...) dans lequel il est inscrit. En pratique, dans une base d’arrêts de cour d’appel sélective il est suffisant. Mais dans une base approchant l’exhaustivité comme Jurica, pas toujours. Et lorsque les décisions pénales du fond auront rejoint Jurica ...

- Le groupe Droit du SNE à fait le choix de l’interopérabilité. Mais alors pourquoi a t-il choisi de s’écarter sur deux points de la norme de citation ISO existante ? Leurs raisons sont valables en tant que telles (encore que : mettre la collection juste après l’éditeur favorise la confusion entre les deux) mais pas dans le contexte de l’interopérabilité. Et puis, pour deux petits points, ça ne me semble pas en valoir le coup.
Enfin, à tout prendre, si on voulait s’écarter de la norme ISO 690, il eut été de mon point de vue plus inspiré de le faire en citant le mois de parution des monographies. En effet, paraître avant ou après la date d’entrée en vigueur d’une réforme n’est pas anodin du tout et j’ai fréquemment rencontré le problème. Au point qu’en catalogage, j’ai dès les années 2000 ajouté le mois de parution dans la zone Notes de la notice.

- Ergonomie : les tableaux ne passent pas sur mobile. C’est plus que gênant, car l’usage du mobile pour aller sur Internet vient de dépasser celle sur ordinateur [8]

Au cu de sa couleur dominante, l’expression Livre Rouge ("Red Book") m’est venue pour désigner ce guide. Je sais que l’expression peut faire penser aux Codes Dalloz mais justement, ce sont des codes, pas des livres. Ref-Lex a déjà été utilisé au moins trois fois pour autre chose (cf note 1) et reste vague, et GCRJ est tout aussi peu évocateur qu’un acronyme comme CNITAAT

Hélas Sadri Saïeb, mon collègue de l’Institut suisse de droit comparé (ISDC), m’a informé que les Canadiens utilisent déjà le terme Red Book. Sinon, je pensais à "Guide du SNE" puisqu’on parlait autrefois de la "liste du SNE", mais c’est peu attirant.

Je suis preneur de toute autre appellation. Sinon la pratique en créera peut-être une ?

En conclusion, le GCRJ a (presque) tout pour devenir le Bluebook français. Pour qu’il le devienne, il reste aux juristes et aux auteurs à l’adopter. Le côté optionnel de nombreux éléments devrait faciliter cela. Le risque, c’est que les options utiles voire indispensables (comme l’auteur, ou la date de consultation d’une ressource en ligne) restent l’apanage des seuls éditeurs professionnels.

Emmanuel Barthe
bibliothécaire documentaliste juridique, veilleur, formateur

NB : Je note au passage que la page Jurisprudence française donne raison à l’adage d’origine latine selon lequel « Là où la loi ne distingue pas, il n’y a pas lieu de distinguer ». En effet, la page précise : « Depuis le 19 janvier 2006, la CNIL a adopté une nouvelle position et recommande de ne plus distinguer selon que l’accès aux bases de données est gratuit ou réservé. Il est ainsi recommandé d’anonymiser toutes les décisions de droit interne. » Comme nous le mentionnons depuis 2006 [9], ce n’est pourtant pas le cas encore chez tous les éditeurs, notamment hors de ce groupe de neuf éditeurs. Et même chez les neuf, il peut y avoir encore du ménage à faire dans les coins. Les fichiers PDF sont particulièrement concernés.


Any Yahoo Pipes true substitute out there ?

Tools for RSS feed merging and filtering

Mercredi 30 novembre 2016

Lire la suite »

Pipe dreams by darwin Bell

The loss of Yahoo Pipes in August 2015 [10] was a major blow to the monitoring/research community and also web site authors looking for selected content. Its ability to combine and filter multiple RSS feeds into one feed was unique among free hosted services.

This post will focus on how we could replace Yahoo Pipes for these functions [11]. We will not deal here with the web page scraping Pipes was able to do too [12].

So I went looking for substitutes which could merge and filter feeds. I mean, real ones : as simple as Pipes. For instance, they shall have a graphic user interface (GUI) ; coding shouldn’t be necessary. The only difficulty allowed should be the use of regular expressions (Regex).

Free hosted substitutes

  • FeedCombine, RSSMix, FeedRinse or ChimpFeedr (to merge feeds into one feed) then FeedSifter or FeedRinse (to filter the mega-feed) can answer simple needs.
    FeedRinse can do more, as it accepts Regex but it can’t merge more than 5 feeds, is slow and bugs according to La Bibliothèque du CHUM’s test.
    FeedCombine cannot combine more than 5 feeds, say Anik Dumont-Bissonnette.
    ChimpFeedr is very simple at "chomping" (as their web site says) feeds.
    RSSMix, according to the same test, works perfectly, merging up to 100 feeds
  • Feed Informer combines and filters feeds, but filtering can only be done using AND or OR operators
  • IFTTT doesn’t seem to do exactly that : merging and filtering RSS feeds into one feed. Which is not to say it does not have its (numerous) advantages in the field of monitoring services.

Paid hosted substitutes

Self-hosted solutions (need coding skills)

In the sources listed below, I found other free or paid total or partial replacements — but you have to host them on your own server and/or they’re far too complicated for the average information professional :

  • Tiny Tiny RSS (TT-RSS) is an RSS reader with very interesting RSS feeds filtering features (open source)
  • Huginn by cantino (open source on GitHub). According to a MakeUseOf article, « this is the most popular of all the GitHub solutions mentioned, and has a huge, active support community behind it. It’s well documented and easy to use »
  • WebHookit, based on Node.js and mongoDB (open source)
  • Pypes (open source on GitHub), a Python application
  • Rss Percolator (open source on GitHub). Downloads, aggregates and filters RSS feeds
  • ClickScripts (open source on GitHub)
  • Bipio (open source). See the Getting started page (developer documentation) for a quick presentation. Bipio is a graph pipelining API talking RESTful JSON
  • Neddick (open source on GitHub).
  • pipe2py (open source on GitHub). You need to backup your YP pipes before. It uses JSON and the Google App Engine
  • Pipes2js (open source on GitHub)
  • Superpipes (open source), to be hosted on a Debian server
  • open source edition of MuleSoft’s Anypoint Studio
  • Quadrigram seems too graphics-oriented to me (apparently free).

NB : the first four services are recommended [17] by Serge Courrier, a French consultant specialising in RSS readers and the use of RSS feeds for monitoring web sites [18].

Walled gardens

RSS is important to information professionals and, as we’ve seen, much used by people whose job is to monitor web resources. But this does not prevent RSS implementation from receding. If you look into the list of applications which can be connected by IFTTT, you will find that RSS is just one among more than a hundred of mostly proprietary ones ... Walled gardens again.

Did I miss something ? Do you know about any simple tool that could replace the "RSS mashup" function of Yahoo Pipes ? I’m interested in free as well as paid for services.

Emmanuel Barthe
law librarian researcher, open law specialist and monitoring solutions specialist


Sources for this article

Here are the links I found to some articles/blog posts and a number of forum discussions about Yahoo Pipes substitutes :

This article was written with the the help of Serge Courrier.


Legifrance et les autres n’ont pas de fil RSS ? Gênant mais contournable

Créer un flux RSS pour un site web qui n’en possède pas

Les services de création de fils RSS recommandés

Mercredi 30 novembre 2016

Lire la suite »

Les sites juridiques officiels et le RSS

Certains (doit on dire beaucoup ?) se plaignent que ne figurent toujours pas de flux RSS (je peux les comprendre !) sur beaucoup de sites publics — et non des moindres, comme Legifrance (à part le sommaire par e-mail du JORF, mais l’e-mail est hors concours dans cet article :-) [19] ou les sites des Bulletins officiels.

Seuls les sites éloignés de France ou au minimum de son administration semblent avoir plus de liberté pour créer des fonctions de veille. Exemples :

On a plus généralement l’impression que les sites publics ont interdiction de créer des fonctionnalités de veille — même basiques comme les alertes e-mail, les newsletters et les fil RSS [20]. Alors que le grand public et les associations — et pas seulement les professionnels — en ont besoin. Et la diffusion du droit ne s’en porterait pas plus mal ...

Pour les plus pressés et ceux que la technique effraie, ils peuvent récupérer des fils déjà créés grâce aux services précités. Mais ils sont très rares. Un exemple : les circulaires, un service créé par Guillaume Adréani, ex-responsable de la documentation du Défenseur des droits, grâce au service Feed43 : circulaire.legifrance.gouv.fr (ce flux fonctionne très bien).

Certains services en ligne permettent de contourner ce manque : ce sont des services de création de fils RSS. Ils créent des flux RSS à partir de quasiment n’importe quelle page web.

Les services de création de fils RSS recommandés

Voici les services de création de fils RSS recommandés et utilisés par la communauté des veilleurs français :

- gratuits (plus ou moins) :

  • Feed43, un service assez technique mais puissant : expressions régulières acceptées, création d’un nombre illimité de flux, avec une mise à jour toutes les six heures. Version payante avec mise à jour toutes les heures
  • Fivefilters Feed Creator : limité à 10 résultats par fil. On peut acheter le logiciel pour l’installer sur son propre serveur à partir de 20 euros
  • Deltafeed. Une version gratuite limitée à 15 fils et des versions payantes. Deltafeed est le travail d’un développeur Allemand
  • Queryfeed : très simple d’utilisation, il offre un grand nombre d’opérateurs et de champs. Malgré ce nom très américain, le développeur de Queryfeed est russe
  • dernier arrivé : Exileed permet de créer des fils RSS pour les seuls réseaux sociaux suivants : Vkontakte (le développeur d’Exileed est lui aussi russe), Google+, Twitter, Instagram, Facebook, Youtube, Tumblr et d’autres

- payants, plus "industriels", avec essai gratuit [21] :

  • Feed43 : voir supra. Je le classe ici aussi, vu la puissance de ses fonctionnalités
  • Feedity : des références prestigieuses. La version gratuite de Feedity est très limitée, le rafraichissement ne se fait qu’une fois par jour, ne ramène que les 5 dernières actus par jour et surtout, le fil se désactive s’il n’y a rien eu de neuf depuis 7 jours sur la page [22]. C’est généralement insuffisant. C’est pourquoi je l’ai listé dans les services payants
  • FetchRSS (ajouté, cf les commentaires infra) : la version gratuite étant très limitée [23], c’est fondamentalement un service payant. Très simple d’utilisation, il offre en option un délimiteur (pour créer un fil RSS ne fonctionnant qu’à partir des modifications d’une partie de la page suivie) et gère les grands réseaux sociaux : Facebook, Twitter, YouTube, SoundCloud, Instagram et les deux grands sites marchands que sont Amazon et eBay
  • FeedsAPI.com.

Attention, les grands réseaux sociaux suppriment leurs fils RSS natifs, il faut donc passer par les solutions alternatives recommandées par la communauté :

A noter (mais assez complexe à mettre en oeuvre) : il est possible de créer un fil RSS à partir des résultats d’un Google Search Engine (GSE). Voir l’article Créer des flux RSS sur Google Search via Google Custom Search Engine (mai 2016) rédigé par des étudiants du Master Intelligence Economique et Stratégies Compétitives de l’Université d’Angers.

Pour trouver de nouveaux services de création de fils RSS

Des pistes pour trouver d’autres services de création de flux RSS :

  • consultez la slide très élaborée publiée par Serge Courrier sur son Slideshare : Schéma d’une plateforme de veille "modulaire" 100% RSS (màj 24 novembre 2016)
  • suivez le Scoopit dédié au RSS de S. Courrier RSS Circus : les agrégateurs/lecteurs de flux [24], le RSS va t-il mourir (il n’est pas près de décéder en réalité), les services de création de fils RSS etc.
  • ou cherchez avec la requête web page to OR create OR generator RSS dans un moteur comme Exalead, Google ou Bing. Exemple avec Google : web page to OR create OR generator RSS.

Une page de Bryan Coder, veilleur professionnel et formateur, tient à jour une liste de presque tous les services qui fonctionnent bien à l’heure actuel : Tout ce qu’il faut savoir pour obtenir des flux RSS sur le web 2.0.

Et pour votre veille sur le RSS, abonnez vous :

Ok, j’ai un fil RSS. Maintenant, j’en fais quoi ?

Après, on colle l’adresse du flux RSS créé au bon endroit dans son lecteur/agrégateur de flux RSS comme The Old Reader (gratuit jusqu’à 100 fils), Feedly, Inoreader (payant mais le meilleur lecteur RSS en termes de fonctionnalités à l’heure actuelle) ou Netvibes (gratuit, fonctions avancées payantes) et le tour est joué.

Notez qu’on peut, avec certains outil filtrer par mots-clés les fils RSS reçus avant de les renvoyer, toujours en RSS. Voir à cet égard :

Et si vraiment on veut du mail in fine, on passe par un service "RSS to Mail" :

Tout ça est un peu compliqué, certes, mais nécessité fait loi. Et puis, on n’a plus tellement le choix : si un bibliothécaire/documentaliste/veilleur/chercheur n’est pas un geek aujourd’hui, quel peut être son avenir professionnel à long terme ?

Emmanuel Barthe
bibliothécaire documentaliste et veilleur juridique


 

Page parrainée par Convention.fr, le spécialiste des conventions collectives et affichages