Portails juridiques officiels - Diffusion des données juridiques publiques

Dernier ajout : 4 décembre.

Derniers articles

Légifrance : analyse raisonnée de la nouvelle version (bêta)

Mercredi 4 décembre 2019

Lire la suite »

Attention : ce billet sera fréquemment mis à jour pendant la durée de la bêta.


Page d’accueil de la bêta de la prochaine version de Légifrance, vue sous smartphone

La DILA, le Secrétariat général du Gouvernement et la SSII Sword, qui sont les "auteurs techniques" de Légifrance (sans parler des institutions producteurs des contenus comme le Conseil constitutionnel, la Cour de cassation, le Conseil d’Etat, la CNIL etc.) viennent de sortir une version bêta de Légifrance. Autrement dit une vue assez proche de ce sera Légifrance dans un futur très proche.

Pour mémoire, en dehors de publier l’essentiel du droit français brut (hors commentaires [1], Légifrance est la plateforme juridique publique *la plus consultée en France* avec Servicepublic.fr. En effet, depuis 2012, ces deux sites sont désormais parmi les deux premiers de la toile gouvernementale ou sinon juste derrière Bercy [2].

La version actuelle, censée disparaître entre début janvier et fin mars 2020 [3], est celle mise en place en 2008 [4]. Elle a donc 10 ans.

La DILA, à qui nous avons transmis les remarques infra, nous a répondu juste après leur première mise à jour de la bêta. Leurs réponses sont en italique, après nos remarques, et précédées de la mention "DILA".

DILA : La date de bascule de l’ancienne vers la nouvelle version n’est pas à ce jour arrêtée. Selon le principe même de la bêta, nous souhaitons en effet avoir pris en compte les retours (évalués comme les plus "irritants ") des bêta testeurs dans les itérations à venir.
Il est également prévu de ne pas figer le site après bascule pour continuer à proposer de nouvelles fonctionnalités en réponse aux attentes exprimées et/ ou aux évolutions des usages.

Les nouveautés

Voici les principales nouveautés signalées par les articles publiés le lendemain du lencement officiel de la bêta le 7 octobre [5] — et dûment constatées par nos soins. La source la plus exhaustive et la plus intéressante est bien sûr le guide de la bêta.

- Nouvelle interface :

  • comme l’écrit le Monde du Droit, « le site abandonne son aspect de portail pour un accès simplifié aux contenus » : le moteur de recherche devient global et central. A l’expérience, il prend en quelque sorte le pouvoir au sein du site
  • conçue nativement pour les appareils mobiles (smartphones et tablettes). C’est ce qu’on appelle le "responsive web design" (RWD, traduit généralement par design adaptatif) [6]

    Ce petit bonhomme stylisé, c’est le futur accès à un compte/profil personnel
  • création de l’espace personnel permettant d’enregistrer des recherches et de personnaliser des alertes. D’où la présence de l’icône "bonhomme" en haut à droite des pages de la bêta
  • des travaux seront consacrés à l’intégration des liens de Légifrance (les liens dans le sens inverse existant déjà) vers les fiches de Service-public.fr.

DILA : Les deux fonctions précédentes ne sont pas encore disponibles et seront mises en place à partir du second semestre 2020.

- Nouveaux contenus :

  • le plus notable est la mise en ligne des versions numérisées de tous les Journal officiel Lois et décrets papier, les plus anciens datant de 1869. Ces JORF anciens sont des PDF texte (derrière l’image, le texte a été OCRisé) accessibles uniquement via la recherche par date. La recherche dans les fichiers PDF des JO est possible mais uniquement numéro par numéro
  • les tables analytiques du JO jusqu’en 2015
  • sinon, la nouvelle version inclut les études et fiches d’impact des lois, ordonnances, décrets et arrêtés et les avis du Conseil d’État rendus sur les projets de loi. Cependant, ces contenus étaient déjà disponibles sur les sites web de l’Assemblée nationale et du Sénat et des liens dans les dossiers législatifs y menaient.

- Nouvelles fonctionnalités :

  • recherche :
    • le moteur de recherche est désormais le très populaire moteur open source Elasticsearch [7]
    • la fonction de recherche du site modernisé se décline en trois types :
      • une nouvelle recherche multi fonds a été mise en place avec un classement par pertinence et des "facettes" (colonne de gauche pour affiner les résultats par fonds documentaire (textes consolidés, codes, jurisprudence judiciaire ...). On ne peut sélectionner/affiner que par un seul fonds. A noter que dans les résultats de cette recherche globale, les textes consolidés sont privilégiés par rapport à leurs versions initiales (version JO)
      • la recherche précise (équivalent de la recherche simple du site actuel)
      • la recherche avancée (équivalent de la recherche experte du site actuel)
    • il est désormais possible de saisir les numéros d’articles avec différents formats. Exemple : saisir L 112-2, L.112-2 ou L. 112-2 permet désormais dans tous les cas de trouver l’article L112-2
    • il est également désormais possible d’effectuer des recherches avec une chaîne de caractères tronquée (ex : 112-* pour les articles ou EIN ?14*L pour un NOR) dans les champs spécifiques tels que les numéros textes, NOR, numéros d’articles, etc.
    • le moteur propose des "pré-résultats" : une liste de titres (sans extraits donc) supposés être les plus pertinents
  • le "Chrono Légi" permet de suivre l’évolution dans le temps de la rédaction d’un article de loi, de décret ou de code avec un comparateur de versions qui met en évidence les modifications apportées
  • une fonction de comparaison/visualisation des ajouts/suppressions/modifications entre 2 versions d’un article d’article jusqu’au niveau de l’alinéa (bouton "Comparer" dans l’onglet "Versions" des articles)
  • selon le Monde du Droit : « pensé nativement pour l’opendata, le nouveau site a une architecture technique fondée sur des API de consultation (interface de programmation applicative), qui vont faciliter l’accès et la réutilisation des données juridiques par d’autres sites ou applications tierces. Il est ainsi possible de créer une recherche vocale via ces API ».

DILA : Les APIs ont été ouvertes le 29 novembre après-midi lors d’une présentation dans le cadre de la semaine de l’innovation publique. Vous pouvez retrouver les éléments sur la page suivante : https://beta.legifrance.gouv.fr/contenu/pied-de-page/open-data-et-api

- Statistiques et suivi des utilisateurs
Le nouveau Légifrance utilise :

  • l’outil français de statistiques de consultation de site/pages web AT Internet
  • les services de Hotjar, basée à Malte, « afin de deviner les besoins des utilisateurs et d’optimiser le site. Hotjar utilise des cookies et d’autres technologies pour collecter des données sur le comportement des utilisateurs et leurs appareils (en particulier l’adresse IP (capturée et stockée uniquement sous forme anonyme), la taille de l’écran, le type d’appareil (identifiants uniques), les informations du navigateur, l’emplacement géographique (pays uniquement), langue préférée utilisée pour afficher notre site Web). Hotjar stocke ces informations dans un profil utilisateur pseudonymisé. Hotjar et Légifrance s’engagent à ne jamais utiliser ces informations pour identifier des utilisateurs individuels ou pour les faire correspondre à d’autres données sur un utilisateur individuel »
  • le service reCAPTCHA de Google pour protéger l’accès aux informations nominatives concernant des particuliers présentes dans les Journaux officiels. Autrement dit, hors nominations de fonctionnaires : changements de nom, naturalisations. Là aussi, un tracking existe : « Vos données seront communiquées à Google et utilisées par leurs services. Toutefois, votre adresse IP sera préalablement raccourcie par Google dans les États membres de l’UE ou de l’EEE (Espace économique européen) – et sera ainsi anonyme. Dans certains cas exceptionnels, votre adresse IP complète sera transmise à un serveur de Google aux États-Unis et raccourcie ensuite. Au nom de l’exploitant de ce site web, Google utilisera ces informations pour évaluer votre utilisation de ce service. L’adresse IP fournie par reCAPTCHA par votre navigateur ne sera pas fusionnée avec d’autres données de Google. Cette collection des données est sujette à la Charte de confidentialité de Google. »

Premières réactions

En vrac, voici mes premières impressions et réactions, complétées par celles de collègues documentalistes juridiques. Elles datent d’avant la première mise à jour de la bêta, faite le 27 novembre. NB : vous pouvez retrouver les principales évolutions de la bêta ayant été mises en place ou en cours de mises en place à l’adresse suivante : https://beta.legifrance.gouv.fr/contenu/pied-de-page/informations-de-mise-a-jour

- Donner son avis : il est possible de donner son "feedback" directement depuis la version bêta : sur chaque page du site, l’outil « Votre avis » est disponible pour faire son retour. Il permet d’enregistrer la page consultée. Très bonne idée, d’autant que si version actuelle reste en ligne jusqu’en mars 2020, cela laisse suffisamment de temps pour collecter une grande masse de retours et améliorer ce qu’il faut.


Le feedback possible sur chaque page : profitez-en !

- Pseudonymisation : il reste encore un certain nombre d’arrêts incomplètement pseudonymisés. Il suffit hélas d’une seul oubli dans une décision pour que toute celle-ci perde son respect du RGPD et de la loi Informatique et libertés. Exemple :

- Coût et performances :

  • coût : l’article de GNT parle d’un coût de 3,3 millions d’euros sur deux ans pour cette nouvelle version. Le rapport Assemblée nationale sur les publications officielles annexé au projet de loi de finances pour 2019 et rédigé par Marie-Christine Dalloz parlait d’ « un coût estimé à 3,8 millions d’euros ». Pas de dérapage, donc semble-t-il. Un très bon point pour les équipes ayant travaillé sur ce projet
  • une partie importante de ce cette somme est passée dans 18 mois de développements et 6 mois de tests utilisateurs et de réglages, expliquent les Actualités du droit (Lamy)
  • il est possible qu’une autre partie de ce coût soit passée dans l’hébergement (les serveurs web), assuré par Atos, et la connexion. En effet, la charge est importante : plus de 12 millions de visiteurs uniques pour Legifrance en 2005, 15 millions en 2006, 84 millions de visites en 2012 et 117,5 millions en 2016. En 2018, Légifrance enregistrait 120 millions de visites
  • le chargement de la page d’accueil du site est rapide voire très rapide sous Chrome pour Android avec un smartphone de base à 200 euros (Samsung Galaxy gamme J), plus laborieux sous Firefox. Mais on sait que le navigateur de Google pré-charge pages et liens dans le navigateur et sur ses serveurs, ce qui biaise la comparaison.

- Interface :

  • passage en "responsive design" (RWD). Il était temps, mais en même temps il ne fallait pas aller trop vite sur un site aussi complexe. D’un côté, tous les web mag’, les sites d’actualité et les versions web des réseaux sociaux sont au format adaptatif depuis des années, du fait que les consultations par mobile sont devenues majoritaires en 2015. Et, comme mentionné sur ce blog, Lextenso est passé en RWD en 2017, Lexis 360, EUR-Lex, Dalloz-Avocats et Lamyline en 2018 ... [8]. De l’autre côté, basculer Légifrance en site adaptatif sans réflexion globale ni redesign complet aurait probablement été très difficile (et un gâchis d’argent public) quand on voit l’ensemble des fonctionnalités logées en haut et dans la colonne de gauche et toutes ces bases très différentes
  • accessibilité : Légifrance se soucie depuis 2012 d’accessibilité aux personnes handicapées (cf rapport d’activité 2012 de la DILA et la déclaration de conformité publiée sur le site) et c’est franchement méritoire. Car l’obligation pour un acteur public de rendre ses sites web et applications conformes au RGAA, le référentiel général d’accessibilité pour les administrations, est très relative. En effet, comme l’explique la Gazette des communes, la notion de « charge disproportionnée » à l’article 4 du décret n° 2019-768 du 24 juillet 2019 [9] permet à un acteur de ne pas se mettre en conformité avec le RGAA [10]. Des sanctions sont certes prévues pour les organismes qui ne respecteraient pas le décret. Mais hélas, non pas parce que leurs sites et applications ne sont pas accessibles aux personnes handicapées, mais parce qu’ils ne feraient pas figurer une « déclaration de conformité » à la réglementation. En clair, pour éviter l’amende – de 2000 à 20 000 euros – il suffit de d’annoncer sur son site que celui-ci n’est pas "accessible" [11]. Donc chapeau au SGG et à la DILA [12]
    A rebours de cette tendance, avec l’ensemble de ses pages s’adaptant aux écrans de portables, Légifrance, peut-être poussé par son statut de 2e site public de France, progresse heureusement sur ce chemin
  • pour choisir une base de données (un "fonds") dans le nouveau Legifrance, ce serait bien d’avoir comme avant juste à cliquer sur un lien (un seul clic) dans la page d’accueil, au lieu de :
    • soit devoir dérouler le menu déroulant des bases puis en choisir une (deux clics). Sans compter qu’on perd la vue d’ensemble des bases
    • soit passer par le menu dans le bandeau supérieur. En effet, en version ordinateur, il serait optimal d’améliorer sa visibilité et en version smartphone (RWD), il est encore moins pratique, caché dans le menu "hamburger" (trois barres en haut à droite) (trois clics)

      Liste des fonds indexés (i.e. cherchables) dans Légifrance
  • lisibilité / ergonomie du texte : le texte des décisions de justice et des textes officiels est devenu beaucoup plus lisible sous smartphone. La lecture sur appareil mobile devient facile alors qu’elle était un chemin de croix (redimensionner et déplacer le texte en permanence était nécessaire pour le lire). C’est une grande amélioration
  • sous-sections de Codes très longues : les pages web deviennent trop longues et il devient impossible en pratique d’imprimer un article seul. Un redécoupage des pages web des sous-sections à partir d’un certain nombre d’articles serait utile. Exemple : article 39 terdecies du Code général des impôts (CGI) :
    • la page web est extrêmement longue et on se retrouve un peu perdu dedans :
      • on ne voit plus dans quelle partie du code on se situe, le plan étant tout en haut
      • si on se déplace verticalement un peu trop loin ou trop vite, on quitte l’article recherché et revenir dessus peut devenir délicat. Certes, il y a le lien "Naviguer dans le sommaire du code", mais il n’est pas évident de comprendre sa fonction du premier coup et il faut encore se déplacer dedans et faire deux clics supplémentaires pour retrouver son article 39 terdecies (sachant que la plupart des internautes ignorent hélas la fonction Chercher dans la page : sur ordinateur Windows Ctrl + F ou sur smartphone menu du navigateur web > Chercher dans la page)
        DILA : Un travail ergonomique va avoir lieu pour améliorer la visibilité des informations comme le positionnement du contenu consulté dans le sommaire ainsi que la date de la version. Il est noté aussi qu’il est prévu de réactiver le surlignage du contenu recherché.
    • surtout, comment faire pour imprimer juste cet article de code ? Il faut apparemment remonter tout en haut de la page pour accéder au bouton "Imprimer" mais dans ce cas, on perd de vue son article et ... on imprime une bonne partie du Code (89 pages A4 !)
      DILA : La vision d’un seul article et donc son impression sera disponible très bientôt.
  • cette version réécrit Légifrance uniquement pour les smartphones. C’est bien de s’adapter à son époque et aux usages, mais attention à ne pas prendre un train de retard. En effet, l’actualité 2019 laisse penser que ce format va évoluer. Samsung a sorti en 2019 son smartphone pliable, deux fois plus grand que d’habitude donc, le Fold. Et Huawei lui colle aux basques avec son Mate X, qui se présente une fois ouvert comme une mini-tablette [13]. Les autres fabricants ne vont pas tarder ...
  • dans la bêta, les liens ELI ne fonctionnent pas. Exemple : https://beta.legifrance.gouv.fr/eli/ordonnance/2019/7/17/2019-741/jo/texte aboutit pour l’instant à une erreur 404
    DILA : Les liens ELI fonctionnement maintenant.
  • l’intégration des liens des textes officiels présents sur Légifrance vers les fiches de Service-public.fr sera un grand service rendu aux particuliers. En effet, Servicepublic.fr présente de manière courte et "grand public" les grandes réformes (lois, ordonnances).
    DILA : L’intégration des liens vers service-public.fr n’est pas encore disponible et elle sera mise en place à partir du second semestre 2020.

- Contenus :

  • recul du JORF à 1869 : les années 1871 à 1948 étaient déjà disponibles sur la base Gallica de la BNF, mais il est clair que :
    • le "trou" (IIIe République) du JORF Lois et décrets sur Légifrance est réparé. Jusqu’ici, Légifrance ne reculait en HTML que jusqu’en 1990 mais les PDF chargés reculaient jusqu’au début de la IVe République
    • ce sera mieux mis en valeur et plus facile à retrouver sur Légifrance
    • enfin, il est cohérent d’avoir le maximum de recul réuni avec le maximum de fraîcheur
    • JORF anciens :
      • je suppose donc que la BNF a accepté de "prêter" ses PDF
        DILA : Un travail en commun a été réalisé entre la DILA et la BNF pour la numérisation et la reconnaissance de caractère (97% de reconnaissance sur l’ensemble du fond).
      • le texte intégral de ces JO ajoutés n’est pas cherchable. Tout au plus pourra-t-on accéder à la table analytique année par année. L’expression"JO anciens" désigne ici selon toute vraisemblance la période pré-1990 puisque actuellement le texte intégral des textes officiels pré-1990 n’est disponible qu’en PDF (exemple avec une loi de 1988 [14] : sa fiche au format HTML, son texte intégral au format PDF ; exemple avec une loi de 1948 : fiche, texte PDF [15]). C’est une grosse limite. On aurait aimé trouver les JO anciens en HTML (pages web classiques) et indexés. On me dira : c’est beaucoup de travail pour des numéros peu demandés. Peu demandés ? Par les juristes, peut-être. Mais par les généalogistes et autres chercheurs d’ancêtres ainsi que les historiens, certainement pas
        DILA : Suite à la présence d’information personnelle dans ces Journaux officiels, il a été demandé, après une analyse juridique, de ne pas permettre une recherche globale dans le contenu.
      • le rapport Assemblée nationale sur les publications officielles annexé au projet de loi de finances pour 2019, lorsqu’il évoquait le projet de modernisation de Légifrance en cours, parlait de recul jusqu’en 1939 seulement. Le rapport du Sénat sur le même sujet parlait bien, lui, de 1869. Les promesses ont donc été tenues, voire améliorées
  • les échéanciers des décrets d’application des lois ne sont pas du tout faciles à trouver, en tout cas par le menu. Le lien Echéancier est certes écrit en majuscule, mais il reste minuscule, n’attire pas du tout l’attention et n’est atteignable que par un chemin complexe et peu intuitif pour le non juriste/grand public : Autour de la loi > Législatif et réglementaire > Dossiers législatifs > Lois publiées > Année > Loi ... > Echancier, soit 8 clics (exemple) [16]
    DILA : L’accès est optimisé en passant directement par le texte de la loi suite à une recherche par exemple. Le lien sur l’échéancier est directement accessible au début du texte.

    Le long chemin vers les échéanciers
  • la page Application des ordonnances est vide (pour l’instant). Son titre similaire à celui de page Application des lois peut faire penser qu’elle ne consistera pas en (ni ne renverra vers) un échéancier des décrets d’application des ordonnances, un contenu qui manque à Légifrance
    DILA : L’échéancier des ordonnances sera bien mis en place.
  • les "Informations complémentaires concernant le texte" (lien "En savoir plus sur ce texte") ont disparu, notamment :
    • a) les très utiles mots-clés. Ces mots-clés sont des descripteurs pris ni dans le texte ni dans le thésaurus SARDE. Ils comportent parfois des mots techniques et non juridiques notamment en anglais et pouvant utilement aider lors d’une recherche thématique sur les textes officiels. Par exemple : les dérivés sont un type de produits financiers dont il est souvent question depuis la crise de 2008. Le principal organisme qui "fait" les normes dans cette industrie est l’ISDA, basé à Londres. Or, dans le texte des lois, ordonnances, décrets et arrêtés, le mot "dérivés" n’apparaît quasiment jamais (et ISDA, qui est un sigle, encore moins). Les mots-clés des "informations complémentaires" réparent ces inévitables absences, assurant ainsi une bien plus grande pertinence au moteur de recherche de Légifrance
    • b) et les précieux (bien que pas toujours exhaustifs) "textes d’application". Les "textes d’application" dans "En savoir plus... " s’avèrent particulièrement précieux dans le cas des ordonnances : en effet, contrairement aux lois, celles-ci n’ont pas d’échéancier des décrets d’application dans Légifrance — et ceci ne change hélas pas dans la bêta (cf remarque juste supra).

DILA : Suite à une analyse globale sur SARDE et sur les mots clefs, il a été identifié un défaut très important de complétude ainsi qu’un vocabulaire non contrôlé, cela a pour conséquence que 70% des recherches faites sur SARDE ne renvoient aucun résultat et quand il y a des résultats sur cette recherche ou en utilisant les mots clefs, la liste n’est pas complète. Aussi pour le Légifrance modernisé, il a été décidé d’implanter les fonctions suivantes pour couvrir le besoin et essayer de ne pas mal orienter l’internaute :

  • mise en place de la gestion des singuliers/pluriels et masculin/féminin (fonction implémentée à travers une liste sur lequel des mises à jour régulières seront réalisées)
  • mise en place d’un gestion de synonymes et acronymes, par exemple Code général des impôts fonctionne aussi avec l’acronyme CGI (fonction implémentée à travers une liste sur lequel des mises à jour régulières seront réalisées)
  • mise en place des textes dits (Fonction en cours d’implémentation permettant de couvrir le type de recherche suivante loi macron renverra entre autres la loi 2015-990)


En cliquant sur le lien En savoir plus ..., dans le Légifrance actuel, on obtient des informations complémentaires utiles sur le texte, particulièrement la liste des décrets d’application pris et les "mots-clés". Tout cela devrait disparaître

- La recherche :

  • avec Elasticsearch, deux bénéfices :
    • le temps de réponse du moteur de recherche a été nettement amélioré. Le délai d’affichage du résultat cliqué est lui, plus variable
    • et on voit les résultats s’afficher au fur et à mesure que l’on tape ("search-as-you-type" [17])

      Grâce au moteur Elasticsearch, les résultats s’affichent dès le 3e caractère tapé : vive le "search-as-you-type" !
  • une vraie perte si elle se confirme : les plans de classement du Bulletin de la Cour de cassation et de la jurisprudence administrative, si pratiques pour arriver a une grande pertinence (100 fois mieux que la recherche en plein texte) — mais hélas non tenus à jour par leurs institutions respectives —, ont disparu
    DILA : Les travaux sont en cours pour permettre l’accès aux plans de classement mis à jour
  • si on sélectionne un fonds en particulier (page d’accueil : Tous les contenus > Sélectionner un fonds), cliquer à nouveau dessus ne le désélectionne pas, ce qui est inhabituel et contre-intuitif. En fait, pour revenir à l’interrogation de la totalité du site, il faut sélectionner le fonds "Tous les contenus" [18]. Et on ne peut sélectionner qu’un seul fonds à la fois. En revanche, comme on ne peut sélectionner qu’un seul fonds, si on clique sur un autre fonds, cela désélectionne le premier
  • le moteur simple devrait pouvoir être amélioré. Il a du mal avec des recherches a priori simples et le tri par pertinence a lui aussi des ratés.
    Exemple : Chambre criminelle 30 octobre 1996 Bulletin criminel 389 sur Tous les contenus dans Tous les champs ne trouve que deux résultats, mais pas l’arrêt Cass. crim. recherché (Bull. crim. 1996 n° 389 p. 1131), pourtant présent. Si on tape — encore plus simple — Chambre criminelle 30 octobre 1996, on obtient 1600 résultats, mais le premier résultat est un arrêt du 30 janvier 2019, l’arrêt n’est pas dans les 10 premiers et si on affiche les 100 premiers résultats, les arrêts inédits du 30 octobre 1996 apparaissent avant les publiés (ce devrait être l’inverse, les publiés étant a priori plus importants). En revanche, la recherche par le numéro de pourvoi (n° 94-83650) aboutit sans problème à un seul résultat : le bon. Attention toutefois à saisir le n° avec le point. NB : la recherche simple par le n° 94-83.750 renvoie deux résultats et non un seul.
    Ce problème dans le moteur simple est moins présent sur les textes officiels. Les pré-résultats de loi 2019-486 ne trouvent la loi PACTE du 22 mai 2019 qu’en 3e position mais si on lance la recherche, la loi PACTE est bien en premier sur les 104 résultats, suivie très logiquement de son rectificatif. En revanche, les décrets d’application de la loi comportant le n° de la loi dans leur titre n’apparaissent pas juste après le rectificatif, comme ce devrait être le cas, mais après trois textes n’ayant rien à voir avec la loi PACTE, l’un étant une décision n° 2019-486 [19] — une décision, pas une loi.
    En résumé, les informations présentes dans les références du document devraient se voir donner nettement plus de poids dans le classement par pertinence. Dans l’exemple de l’arrêt supra, ici, ces informations sont : Cour de cassation Chambre criminelle 30 octobre 1996 n° 94-83.650 Bulletin criminel n° 389 p. 1131.
    C’est un point clé selon nous, voire critique. En effet, si le nouveau Legifrance est conçu principalement comme une base de données globale et non comme plus un portail avec des rubriques — ce qui semble être le choix fait — alors la pertinence des résultats du moteur seront LA clé de la réussite du nouveau site.
    DILA : La présence du point ne sera plus nécessaire avant la fin de période bêta pour les numéros de pourvois. Les exemples remontés par les testeurs vont aussi nous permettre de continuer à améliorer la pertinence.

  • la recherche avancée :
    • elle est presque cachée. Pourtant, quoi qu’en disent les éditeurs juridiques avec lesquels nous discutons, elle reste indispensable pour les recherches fines et tout autant pour les veilles
    • son implémentation pourrait être améliorée :
      • l’opérateur de proximité est toujours là et c’est heureux. Le nombre de mots est réglable. Mais il est un peu caché et pas facile à utiliser
      • changer d’opérateur logique (ET ou OU) entre les groupes de mots est tout sauf évident
      • en version ordinateur, si on ne cherche que dans Jurisprudence judiciaire, l’affinage spécifique à la Cour de cassation dans la colonne de gauche est honnêtement peu pratique. Sans compter que la faible largeur de la colonne le rend peu attrayant. Bizarrement, une partie du problème disparaît si on passe en version smartphone puisque les champs qui étaient dans la colonne de gauche prennent alors toute la largeur de l’écran


Sous ordinateur : Recherche > Jurisprudence judiciaire > Cour de cassation > Affiner (colonne de gauche)


Sous smartphone : Recherche > Jurisprudence judiciaire > Cour de cassation > Affiner

      • toujours dans cette recherche de jurisprudence judiciaire de la Cour de cassation, on note la présence de quatre zones de recherche sous "Publication au bulletin", "Nature de la décision", "Formation" et "Décision attaquée". Mais on n’en voit pas trop l’utilité puisque ce sont les cases à cocher qui font le travail et que faire défiler leurs options est rapide, la longueur des listes étant limitée — sauf peut-être pour "Décision attaquée".


Recherche > Jurisprudence judiciaire > Cour de cassation > Affiner : les quatre zones de saisie inutiles

      • enfin, graphiquement, et en termes de logique, dans la recherche avancée, l’emboîtement des options et des lignes est très "confusionnant", particulièrement sous smartphone. Comme si on avait voulu trop bien faire. Deux suggestions alternatives :
        • ne garder que la boîte des opérateurs booléens
        • ou revenir à la ligne de commande : on note les opérateurs et les champs en mode texte (ET, OU, SAUF, proximité [20], parenthèses, troncature à droite). Puisqu’on dit que la recherche avancée est essentiellement un truc de spécialistes de la recherche, pourquoi ne pas leur faciliter le travail et leur laisser la bride sur le cou ?

DILA : Le retour des internautes sur la recherche avancée sont très divers, aussi nous prévoyons d’abord de traiter en priorité les bugs remontés puis de travailler par étape sur l’ergonomie.


Sous smartphone : l’interface (non déployée) de la recherche avancée : un emboîtement de petits blocs confusionnant

  • les "pré-résultats" (suggestion de résultats) présentent certains inconvénients :
    • ils ne sont pas forcément pertinents : on cherche le décret n° 2014-1036 du 11 septembre 2014 portant publication de l’accord sous forme d’échanges de lettres entre le gouvernement de la République française et le gouvernement du Royaume d’Arabie Saoudite sur doubles impositions en matière d’impôts sur le revenu et sur les successions. On saisit : échange de lettres Arabie Saoudite et dans la liste déroulante on se retrouve avec 6 résultats dont les deux décrets antérieurs (1989 et 1995) mais pas celui de 2014. Il faut lancer la recherche pour obtenir le décret de 2014 (qui se présente en premier et là, c’est très pertinent). Mais l’absence du décret recherché dans la pré-liste de résultats est un peu déroutante. Une personne qui penserait avoir toutes les réponses sur cette liste indicative n’irait peut être pas plus loin
    • si on clique sur un des pré-résultats (ou même si on passe simplement sa souris par-dessus sous ordinateur — sans cliquer —, ce qui là est carrément un bug), Légifrance bêta considère qu’on a cherché exactement ce document-là et non les mots-clés saisis. On ne peut donc plus revenir en arrière, i.e. on perd sa recherche, elle est effacée. C’est franchement gênant, surtout s’il s’avère qu’on a cliqué sur un résultat non pertinent ou qu’en réalité il y avait plusieurs résultats intéressants ou pertinents

DILA : Le bug a été corrigé sur la suggestion et pour l’instant elle a été désactivé sur la version mobile. Dans un second temps, nous allons travailler sur la pertinence de la suggestion.


La pré-liste de résultats (suggestion de résultats) sur la recherche "échange de lettres Arabie Saoudite" ne trouvait pas le dernier décret publié

  • le thésaurus SARDE a été retiré. Dommage. Même s’il n’avait plus l’air d’être tenu à jour, c’est une perte car un outil très puissant et très pertinent dans le maquis des termes utilisés par l’administration
    DILA : Explication plus en amont de la raison de la suppression de SARDE
  • la nouvelle recherche multi-fonds évite d’avoir à savoir dans quelle base de données juridique chercher. Certes. Mais, comme nous l’avons déjà maintes fois écrit — encore tout récemment sur Twitter —, et comme nous le rappelons à chaque formation :
    • Légifrance est une *plateforme*, un *portail*, une *collection* de bases très différentes. *Pas* une base de données en elle-même. Ce moteur global a donc les limites inhérentes à ce genre d’exercice. Les éditeurs juridiques, confrontés depuis longtemps à ce problème, tentent — comme ici ce nouveau Légifrance — de le résoudre en offrant ce qu’on appelle les facettes : une colonne (à gauche en général) avec des cases à cocher permet de choisir le type de source du droit désiré (jurisprudence, textes, doctrine ...) ou des domaines du droit (affaires, sociétés, concurrence ...).
      Mais pour autant, les méga-bases ne sont pas la réponse miracle aux difficultés de la recherche d’informations en ligne. Au contraire, savoir segmenter sa recherche et n’interroger qu’un seul type de source du droit (la doctrine, typiquement), une seule matière (cas de le base Navis, qui est structurée par domaine du droit) ou une seule base est la clé. La pertinence des résultats de Google crée des illusions chez les concepteurs de plateformes : cette pertinence découle directement des liens hypertextes créés par les auteurs, les internautes et les webmestres. C’est certes dommage, mais Légifrance ne peut pas et ne pourra pas en faire autant
      DILA : C’est pour cela que nous gardons la recherche simple et avancée sur un fond et que l’internaute peut choisir à ce moment des types de tri autre que par pertinence.
  • la possibilité de saisir les numéros d’articles avec différents formats (L 112-2, L.112-2, L. 112-2, L112-2) peut paraître un détails. Mais avant, ce n’était opas possible. IL *fallait* savoir que le L, le D ou le R devait être tapé collé contre le numéro, ce qui n’était ni évident ni intuitif et constituait une source majeure d’incompréhension et d’échec des utilisateurs dans la recherche
  • les termes saisis dans le moteur de recherche n’y restent pas lorsque les résultats apparaissent. Ils sont déportés dans une boîte sur le côté gauche. Heu ... C’est :
    • anti-intuitif
    • contraire à une pratique établie et hyper-répandue
    • et anti-pratique. Parce qu’il faut faire ça dans une fenêtre toute petite et qu’on se retrouve à devoir gérer deux zones différentes au lieu d’une. Parce qu’en RWD, l’interface vous amène sur cette zone alors que vous voudriez changer de requête
  • textes officiels : le champ Titre est sélectionné par défaut : tant mieux si les mots-clés tapés y figurent, mais ce n’est pas toujours le cas. Loin de là, même ...

DILA : Pour des raisons d’uniformité, "Tous les champs" sera bientôt sélectionné par défaut pour "Tous les fonds".


Les descripteurs dits "Mots-clés" ont disparu. Définitivement semble t-il

  • comme on pouvait le penser suite à la disparition des "Informations complémentaires concernant le texte", le champ de recherche Mots-clés (les fameux descripteurs non pris dans SARDE ni dans le texte intégral) a lui aussi disparu de la recherche avancée. Un rapide mais optimal test me laisse penser que ces descripteurs ne sont pas non plus restés cachés "par derrière" (la preuve par le Mot-clé Brexit ET Nature du texte = loi OU décret). Adieu Mots-clés. Il va falloir chercher par "retrait du Royaume Uni de l’Union européenne", car par "Brexit" on ne peut plus — mais qui va y penser ? A part les juristes, je ne vois pas
  • il reste une question importante : clairement, le tri des résultats se fait par pertinence. Mais quels sont les critères exacts de cette « pertinence » ?
    DILA : Nous réfléchissons à donner plus d’information sur le calcul de la pertinence.

- API [21] : la voilà, elle aussi en version bêta ! Elle est proposée via le portail PISTE et son utilisation est soumise à certaines conditions : licence ouverte 2.0, CGU de PISTE, CGU spécifiques de l’API Légifrance et quotas détaillés sur le portail PISTE. Bien lire tout ça. On note par exemple dans la licence ouverte 2.0 l’obligation des réutilisateurs — même hors API — de citer la source et une date de mise à jour (cf extrait de la licence infra).
Comme je l’ai déjà écrit sur ce blog, le simple fait de proposer une API est déjà un grand progrès [22]. Cela dit, elle est réclamée et attendue depuis longtemps (2016 au bas mot) [23]. Cette API avait été prévue dès l’annonce en 2017 dans un "bleu" budgétaire que des crédits allaient être consacrés à la refonte du site [24].


Extrait de la licence ouverte 2.0

- Statistiques et suivi des utilisateurs
Ce type d’engagement (anonymisation, non croisement des données ...) peut laisser quelque peu dubitatif au vu de son caractère, en pratique, essentiellement déclaratif, et si on se place sur le long terme, notamment au vu des évolutions très importantes des politiques et des pratiques de confidentialité des grands de l’Internet. Vous pouvez activer DoNotTrack (DNT) dans les paramètres de votre navigateur pour éviter ce "tracking" et surtout utiliser un bloqueur de publicités, de traçage et de pop-ups comme Ublock Origin ou ABP (AdBlock Plus) ou encore un navigateur pro-vie privée comme Brave [25].

DILA : Des évolutions vont avoir lieu pour prendre en compte les dernières recommandation de la CNIL et les dernières décisions de jurisprudence sur ce sujet.

Conclusion

Légifrance ne se réduit pas à des contenus, un moteur de recherche et des API. Aucune initiative privée ne refera gratuitement ce qui coûte une vingtaine de millions d’euros par an [26]. La diffusion, le respect et l’effectivité du droit dans une société de l’information et la défense du droit français dans un monde de forum shopping sont à ce prix. Surtout avec l’inflation législative [27] et la complexification réglementaire. Légifrance en tant que Service public de la diffusion du droit par Internet (SPDDI) a permis que la connaissance du droit et partant son respect ou son interprétation ne soient plus un privilège. Ses statistiques de consultation et ses citations dans la presse le prouvent à l’envi.

Tout gain de la future version de Légifrance en facilité d’utilisation sera un gain pour la diffusion du droit français et son effectivité. Les suggestions et remarques supra veulent y aider.

Emmanuel Barthe
juriste, documentaliste, veilleur


Anonymisation des décisions de justice : le point sur les dernières évolutions et leurs finalités

Vendredi 29 novembre 2019

Lire la suite »

Sommaire

Pseudonymisation et non anonymisation (ou les subtilités du RGPD à la française)

Délivrance d'une copie n'est pas open data (ou les subtilités de la loi du 23 mars 2019)

Les finalités de l'évolution européenne et internationale

Le droit national : des priorités désormais sanctionnées

Le développement de la référence neutre

Un billet d’humeur sous forme d’interview publiée en libre accès sur Dalloz Actualité [28] nous amène à faire le point sur l’état actuel et les finalités de l’anonymisation de la jurisprudence — plus exactement la pseudonymisation des décisions de justice.

Selon les professeurs de droit Nathalie Blanc et Pierre-Yves Gautier, l’article 33 de la loi de programmation et de réforme de la justice du 23 mars 2019 érigerait « l’anonymat en postulat pour les "noms et prénoms des personnes physiques mentionnées dans la décision, lorsqu’elles sont parties ou tiers" (avec une extension aux magistrats et greffiers). En outre, comme « elle porte sur les éléments de la décision permettant l’identification des parties, pas seulement leur nom, s’il existe un risque d’atteinte "à la sécurité ou au respect de la vie privée de ces personnes ou de leur entourage" », qui conduirait finalement selon les deux universitaires à « supprimer toutes les données personnelles contenues dans les décisions, autrement dit "toute information se rapportant à une personne physique identifiée ou identifiable" selon la définition du RGPD » [29].

Ce n’est pas vraiment le cas.

Pseudonymisation et non anonymisation (ou les subtilités du RGPD à la française)

Cela aurait pu être le cas si une interprétation extrêmement extensive du règlement européen de protection des données personnelles [30] avait été soutenue par les pouvoirs publics. Mais on en est très loin [31]. De facto, le choix fait par la Cour de cassation, qui supervise tout cela du côté judiciaire, semble être de :

  • pseudonymiser — et non, plus rigoureux, anonymiser au (nouveau) sens du RGPD, c’est-à-dire retirer tout élément d’identification et de ré-identification. Pseudonymiser, c’est le choix déjà mis en place de longue date suite à la recommandation de la CNIL de 2001 puis son bilan d’application de 2006. La recherche remplacement des noms par leurs chaînes de caractères (regex) est actuellement gérée avec des règles et s’appuie sur la technologie d’Expert System, ex-Temis (ex-cartouches Luxid)
  • aller un plus loin, mais sans véritablement anonymiser. Par exemple : retirer les noms des membres des forces de l’ordre, les adresses (recommandation CNIL 2001), les numéros de carte bancaire ou de plaque minéralogique, les références de cadastre. Là aussi, pour la Cour de cassation, c’est la continuation d’un choix (un peu moins) ancien. Tout cela, avant même la loi Lemaire de 2016 (et donc a fortiori avant celle du 23 mars 2019), elle le faisait déjà pour ses propres arrêts
  • étendre cette technique aux décisions d’appel et de première instance par une automatisation (machine learning, ML) avec, probablement des sondages pour assurer un contrôle minimal a posteriori et des corrections. C’est prudent, car Michael Benesty, ingénieur machine learning et spécialiste des techniques d’anonymisation de la jurisprudence, a constaté en 2016 que le taux de succès en ML était insuffisant. Pour le citer [32] : « Même en affichant un taux de 96% de mentions correctement identifiées, on se retrouve avec un taux de décisions effectivement (c’est-à-dire complètement) anonymisées d’à peine plus de 60% ! [...] On voit bien que l’approche anonymisation à 100% via le machine learning (c’est-à-dire sans aucune intervention humaine) se heurte à un plafond de verre. » Toutefois, les ingénieurs machine learning d’Etalab envoyés assister la Cour de cassation ont beaucoup progressé en 2019 en utilisant deux librairies de "Named Entity Recognition" bien connues, Spacy et Zalando Flair [33] : « diminution de 32% du taux d’erreur avec une meilleure utilisation de la connaissance de l’ensemble des données au lieu de simplement travailler au niveau de la phrase ».

Un point de vocabulaire est essentiel ici pour bien comprendre le débat : jusqu’à l’entrée en application en mai 2018 du règlement européen général de protection des données personnelles (RGPD), le terme "anonymisation" désignait le remplacement des noms des personnes physiques par des lettres. Depuis l’avènement du RGPD, il peut désigner deux choses. En droit, il désigne une impossibilité d’identifier ou de ré-identifier les personnes, ce qui suppose dans les décisions de justice la suppression de tous les indices autres que les noms des personnes. Au point que le RGPD considère qu’il n’a pas à s’appliquer dans le cas où les données sont (réellement) anonymisées. Hors du droit, dans le langage non juridique, "anonymisation" tend à désigner une ré-identification rendue extrêmement difficile — ce qui n’est pas exactement la même chose que la définition juridique "à la RGPD".

Enfin, en droit, le RGPD a mis en avant une nouvelle notion : la pseudonymisation ou pseudo-anonymisation, qui existait déjà dans les faits et consiste justement à se contenter de remplacer les noms de personnes par des lettres (ne correspondant pas à leurs initiales). Ce nouveau terme de pseudonymisation désigne donc désormais ce qu’on appelait précédemment "anonymisation". Les termes du débat, quand il ne se tient pas entre spécialistes, sont donc souvent imprécis voire ambigüs.

A ce propos, dans l’interview publiée sur Dalloz Actualité, l’utilisation systématique du mot anonymisation, sans jamais utiliser celui de pseudonymisation, peut faire tiquer les spécialistes du droit du traitement des données personnelles dans les décisions de justice.

Délivrance d’une copie n’est pas open data (ou les subtilités de la loi du 23 mars 2019)

Le point de vue des auteurs du billet aurait également pu se justifier en partie si la loi avait confondu d’une part la diffusion en numérique pour les bases de données (service public de diffusion du droit par Internet, dit SPDDI, et donc, dans le futur, open data [34]) et d’autre part la communication de copies de décisions [35]. Mais ce n’est pas le cas, malgré une certaine similarité des termes entre les articles sur l’open data (diffusion numérique en masse de jeux de données [36]) et la délivrance d’une copie (unique, qu’elle soit papier ou numérique, et portant sur une ou quelques décisions). C’est ce que Bertrand Cassar, doctorant en droit du numérique, qualifie de différence entre la publicité et la publication d’une décision de justice [37] et le magazine Archimag de distinction entre open data et open access [38].

Mais ce n’est pas le cas. L’article 33 de la loi du 23 mars 2019 distingue bien deux cas :

  • diffusion des données publiques (publication / open data) :
    « Sous réserve des dispositions particulières qui régissent l’accès aux décisions de justice et leur publicité, les jugements sont mis à la disposition du public à titre gratuit sous forme électronique.
    Par dérogation au premier alinéa, les nom et prénoms des personnes physiques mentionnées dans le jugement, lorsqu’elles sont parties ou tiers, sont occultés préalablement à la mise à la disposition du public. Lorsque sa divulgation est de nature à porter atteinte à la sécurité ou au respect de la vie privée de ces personnes ou de leur entourage, est également occulté tout élément permettant d’identifier les parties, les tiers, les magistrats et les membres du greffe.
    Les données d’identité des magistrats et des membres du greffe ne peuvent faire l’objet d’une réutilisation ayant pour objet ou pour effet d’évaluer, d’analyser, de comparer ou de prédire leurs pratiques professionnelles réelles ou supposées. La violation de cette interdiction est punie des peines prévues aux articles 226-18, 226-24 et 226-31 du code pénal, sans préjudice des mesures et sanctions prévues par la loi [Informatique et libertés].
    Les éléments permettant d’identifier les personnes physiques mentionnées dans le jugement, lorsqu’elles sont parties ou tiers, sont occultés si leur divulgation est de nature à porter atteinte à la sécurité ou au respect de la vie privée de ces personnes ou de leur entourage. »
  • délivrance d’une copie (publicité / open access) :
    « Les tiers peuvent se faire délivrer copie des jugements, sous réserve des demandes abusives, en particulier par leur nombre ou par leur caractère répétitif ou systématique.
    Les éléments permettant d’identifier les personnes physiques mentionnées dans le jugement, lorsqu’elles sont parties ou tiers, sont occultés si leur divulgation est de nature à porter atteinte à la sécurité ou au respect de la vie privée de ces personnes ou de leur entourage. »

L’occultation dans les bases de données de noms de personnes autres que les personnes physiques parties ou tiers (juges, greffiers) et d’éléments autres que les noms de personnes n’est donc pas le cas général. Il est lié à un risque pour la sécurité ou la vie privée et ces risques ne sont pas systématiques (on pense surtout au droit pénal et aux personnalités — pour le droit de la famille ou du travail, les juges ne risquent rien et il est déjà de bonne pratique de supprimer les adresses).

Quant aux copies commandées auprès des greffes, elles ne perdront généralement pas les noms des parties (sauf là encore risque pour leur sécurité ou leur vie privée) et jamais ceux des juges ni des greffiers. Mais les commandes en masse (destinées à un scan puis un OCR de masse) sont désormais bannies. Et sur ce dernier point, il ne fait aucun doute que les greffes, débordés, s’appuieront sur la loi.

Si on peut à la limite accepter le terme de « postulat » pour « l’anonymat des parties personnes physiques », il faut donc nuancer le propos. Mais on peut encore moins affirmer, comme le font les deux auteurs, que la loi de réforme de la justice « conduit à supprimer toutes les données personnelles contenues dans les décisions, autrement dit "toute information se rapportant à une personne physique identifiée ou identifiable" selon la définition du RGPD ». Tout dépend du support, plus précisément de la source (open data ou copie) et des cas (risque pour la vie privée ou la sécurité). Comme on l’a vu, il suffit de lire le RGPD et l’article 33 de la loi pour se convaincre du contraire.

D’autant que les interviewés oublient de rappeler que les parties personnes morales (sociétés, organismes publics) ne sont pas protégées par le RGPD, pas plus qu’elles ne l’étaient par la loi Informatique et libertés.

Les finalités de l’évolution européenne et internationale

Il faut rappeler que cette réforme n’est pas une lubie du législateur français mais la phase finale d’une politique de l’Union Européenne constante amorcée en 1985 avec la première directive sur la protection des données personnelles, pour aboutir dans une nouvelle ère ouverte par le RGPD. Autrement dit, il y aura une diffusion libre de la jurisprudence en open data avec des données anonymisées, ou rien.

Les codes concernés (Code de l’organisation judiciaire et Code de justice administrative) disposent désormais tous deux que « les noms et les prénoms des personnes physiques mentionnées dans le jugement, lorsqu’elle sont parties ou tiers, sont occultées préalablement à la mise à la disposition du public ». Ce que les deux Codes appellent "mise à disposition du public" est une façon bien franco-française et officielle de désigner la diffusion numérique en masse — l’open data, autrement dit, puisque open data implique mise à disposition gratuite avec droit de réutilisation et rediffusion.

Il ne s’agit pas de gêner la pratique des professionnels et des chercheurs en droit (et pas seulement des éditeurs), mais de la mise en œuvre d’une liberté publique importante. Y avait-il moyen de choisir une autre voie ?

Les premiers travaux du groupe JURINFO (Etats membres en charge des données judiciaires + CJUE + Office des publications de l’UE + Commission européenne + Conseil) animé par le Conseil de l‘UE, dont les archives sont en ligne (mais pas toujours en texte intégral), ont porté sur les questions d’anonymisation des décisions, depuis 1990. Plusieurs enquêtes successives ont relevé des pratiques de plus en plus convergentes venant des Etats membres, tendant à l’anonymisation. On apprend ainsi que nos voisins allemands pratiquent la publication anonymisée dans les revues papier depuis le XIXème siècle. Il semble que cela n’ait pas handicapé le monde juridique universitaire allemand.

Déjà en 2006, selon le bilan publié cette année-là par la CNIL sur l’application de sa recommandation initiale de 2001 [39], dans l’UE, « une majorité de pays [...] ne [permettait] la mise en ligne sur Internet que des décisions de justice préalablement anonymisées, soit que ce choix résulte des dispositions législatives nationales (République tchèque, Estonie, Suède), soit que ce choix découle d’une prise de position de l’autorité nationale de protection des données à caractère personnel (Pays-Bas, Danemark, Portugal et Lettonie). De plus, certains pays [avaient] fait le choix, parfois ancien, de procéder à l’anonymisation systématique des décisions de justice quel que soit le support de diffusion (Allemagne, Autriche, Pologne, Hongrie, Finlande et Grèce) » [40].

Même les pays de common law commencent à pratiquer l’anonymisation. On constatera sur le site des arrêts de la Cour suprême du Canada que plusieurs arrêts sont diffusés sans le nom des parties. Une tendance qui s’accroit année après année.

Et même la presse générale, appelée en contre-exemple de mauvaise pratique dans cette interview, a néanmoins commencé depuis quelques années à pratiquer une communication de plus en plus anonymisée sur les affaires judiciaires.

Le droit national : des priorités désormais sanctionnées

On peut comprendre l’agacement des interviewés. Un des auteurs du présent billet l’a partagé autrefois [41].

Toutefois, on a du mal à les suivre dans leurs prises de position après qu’ils aient constaté qu’on peut retrouver facilement les noms dans certaines affaires et disent : "Pourquoi imposer le silence aux éditeurs juridiques ?" (on a d’ailleurs l’impression à ce moment qu’ils se font les porte-parole autant des éditeurs que des enseignants)

Certes, avec le système actuel, il y aura toujours une proportion de noms faciles à retrouver malgré la pseudonymisation, par la presse ou les moteurs de recherche d’Internet.

Mais déjà, l’effectivité du droit n’a jamais eu rien de garanti (incidemment, en droit français, c’est un secteur de recherche quasiment vide).

Et surtout, le billet ne prend pas en compte que les priorités ont changé depuis la loi du 6 janvier 1978. L’état actuel du droit est dédié à la lutte contre le fichage en ligne de masse et la constitution d’un casier judiciaire bis.

Les auteurs ont également tendance à assimiler, peut-être pour mieux appuyer leur démonstration, d’une part le principe d’anonymisation des parties personnes physiques dans les décisions de justice (poussé voire créé par la recommandation CNIL de 2001), et d’autre part le renforcement partiel de ce principe par la loi de programmation et de réforme de la justice de 2019. Deux textes séparés par 18 ans ... Le premier un véritable principe (même si sa consécration législative n’est venue qu’avec la loi de 2019), le second, des cas limités.

De toute façon, la pseudonymisation est une obligation légale sanctionnable. Et elle a déjà été sanctionnée lorsque des particuliers se sont plaints, et ce par deux décisions : CE 10e et 9e SSR, 23 mars 2015, n° 353717, 10000 euros de sanction ; TA Paris 2e ch. 7 novembre 2016 n° 1507125, 1000 euros de sanction, publié fin janvier 2017 dans la Lettre du TA de Paris [42]. De surcroît, on peut se demander pourquoi donc Legifrance puis les éditeurs ont fini par pseudonymiser leur stock d’arrêts, alors que cela représentait un très gros travail et que l’obligation n’était pas encore gravée dans la loi ...

Le développement de la référence neutre

Enfin, si l’on peut reconnaître le caractère peu pratique de l’état actuel du droit, il est largement contrebalancé par le développement très net du recours à la référence neutre (dit aussi identifiant unique) pour citer les arrêts. On parle là du numéro de pourvoi/requête/RG et plus encore du numéro ECLI, proposé [43] par l’Union européenne, sur la mise en place duquel la DILA et la Cour de cassation ont particulièrement travaillé et que le site des éditeurs juridiques SNE Reflex sur les règles de citation recommande d’utiliser. Certes, ce n’est pas aussi facile à mémoriser que "l’affaire Dupont". ECLI, même si son usage demande un peu d’exercice, ce n’est pas non plus d’une complexité effarante. D’autant qu’il permet de retrouver en ligne à coup sûr la décision correspondant à cette référence. ECLI est déjà disponible pour les arrêts de la Cour de cassation, et à terme chaque décision d’une juridiction française disposera de son numéro ECLI.

Mais dans votre tête ou dans une discussion orale ou un cours (non publié en ligne de préférence), rien n’interdit d’utiliser le nom des parties. Même s’il est vrai qu’avec les nouvelles règles de pseudonymisation *avant* transmission de la copie de la décision, ce sera quasi-impossible avec les nouveaux arrêts [44].

Enfin, lorsque les professeurs Blanc et Gautier se demandent « comment, dans une affaire complexe, comprendre la décision, lorsque les parties s’appellent X, Y et Z », la réponse, qui reste à mettre en place il est vrai, est simple : copier-coller dans son traitement de texte l’arrêt et utiliser la fonction Rechercher Remplacer en sélectionnant Tout remplacer pour remplacer X par n’importe quel nom et ainsi de suite. Imparfait mais largement suffisant ici. Temps de travail : 30 secondes.

Emmanuel Barthe
juriste documentaliste
ancien webmestre technique d’un site web de juridiction et à ce titre quotidiennement confronté aux problèmes juridiques et pratiques de la pseudonymisation
Jean Gasnault
juriste documentaliste, consultant
La Loi des Ours


Clair, compréhensible

Nouveau site de l’Autorité française de la concurrence : les plus et les moins

Mais pas de redirection automatique ...

Mercredi 13 novembre 2019

Lire la suite »

Le site de l’Autorité française de la concurrence (ADLC) a été "revampé" et le nouvelle version est sortie ce 7 novembre. Voici mes premières impressions.

Charte graphique, web design : plus clair, plus aéré, adapté aux portables

- C’est beau, mais assez lisse et standard. Le nouveau site utilise beaucoup de ces images libres de droits qu’on voit maintenant un peu partout sur les sites "corporate".
Chez les sites des AAI et juridictions, on voit clairement monter une mode : le "revampage" avec "responsive design" (dit RWD : design adapté aux mobiles), vidéos, belles images et gros caractères. Il y a notamment un air de parenté avec le site du Conseil constitutionnel. Ce qui présente des avantages et des inconvénients, comme ici :

  • avantages :
    • plus grande lisibilité sous appareils mobiles. C’est devenu crucial de nos jours
    • les illustrations et le texte aéré donnent plus envie de lire
    • le site fait plus professionnel. Cela semble important vu le "niveau judiciaire" de l’Autorité. Une question de standing, en quelque sorte
  • inconvénients :
    • le revers d’une certaine standardisation : le site se distingue visuellement moins de la masse, beaucoup de sites et blogs, notamment sous WordPress, ayant déjà pris cette apparence
    • comme pour le site du Conseil constitutionnel, cette mode fait perdre à l’information disponible sur les pages du site de l’ADLC sa "compacité". Notamment du fait de la place prise par les images et les blocs en haut des pages éditoriales, particulièrement quand on est sous smartphone — ce qui va à l’encontre du but initial du "responsive design". Sur les pages des décisions et avis, en revanche, le problème ne se pose pas, celles-ci étant évidemment sans illustration.


Perte de place en haut sur les pages éditoriales du nouveau site de l’ADLC


Même problème de perte de place en haut sur le site du Conseil constitutionnel


Idem, en moins net, sur le site du Conseil d’Etat


Et idem, en moins net là aussi, sur le site de la Cour des comptes

Nouveaux contenus

@fcdumonteil signale que :

  • les sections "Qui sommes nous" et "La concurrence et vous", ont été étoffées, rendant le tout plus pédagogique
  • à l’inverse, les coordonnées des rapporteurs ont disparu.

Isabelle de Silva précise sur Twitter que l’Autorité va « continuer à compléter les contenus pédagogiques, avec des petits films pour expliquer les infractions de concurrence, à l’intention des PME notamment ».

Structure/rubriques du site : simple et aisément compréhensible

- La structure du site semble plus compréhensible que le nouveau site du Conseil constitutionnel. Tout particulièrement, les publications ont leur propre rubrique (on ne doit pas aller les chercher dans Actualités et événements comme chez le Conseil, ce qui n’est pas évident). NB : à propos de cet aspect du nouveau site du Conseil, certains ont eu la dent beaucoup plus dure que votre serviteur [45].

Moteur de recherche

- Le moteur est rapide et ses déclinaisons incluent, comme dans la précédente version du site, la possibilité de sélectionner les secteurs professionnels/industries, notion clé en droit de la concurrence. Le singulier trouve le pluriels et vice versa. Si on écrit un numéro de décision sans ses tirets, ça passe. En revanche, si on oublie le zéro devant, ça casse. Reste à faire des tests plus fins sur le moteur de recherche ...


La recherche de décisions et avis par secteur est possible. Précieux

- Attention : les décisions de contrôle des concentrations (n° 18-DCC-178 par ex.) ne sont pas dans le moteur "Avis et décisions". Peu de gens pensent à les chercher dans "Décisions de contrôle des concentrations" (vécu). D’autant que la redirection des anciens liens vers les décisions DCC se fait vers la page de recherche "Avis et décisions". La co-existence de deux listes/moteurs est contre-intuitive et "confusionnante". Surtout avec l’intitulé très large ("Avis et décisions") pour le 1er moteur. Résultat : des juristes pensent que les décisions DCC ne sont plus présentes sur le nouveau site de l’Autorité ... Ce qui n’est PAS le cas.

Pas de redirection automatique systématique ni de texte intégral au format HTML

- Un moins : les anciens liens hypertextes, même vers les PDF, sont cassés :-/ Et il n’y a pas de redirection automatique vers les nouvelles URL, juste une redirection vers la page de recherche des décisions et avis. Ce qui n’est pas si mal, mais tout de même dommage. La redirection automatique permanente des anciennes adresses vers les nouvelles est une bonne pratique de la refonte de site web [46].

Pour prendre un exemple dans le monde juridique : Lextenso, qui est sur le point de passer sa base en ligne sur un autre nom de domaine et avec des URL différentes a prévu une redirection automatique de *toutes* les adresses anciennes vers les nouvelles.

La Netscouade, qui a réalisé cette nouvelle version, est est une agence de web design expérimentée et habituée aux clients institutions mais l’ADLC a peut-être estimée que ce n’était pas utile. Cet oubli est un peu surprenant. Est-il prévu à court terme de corriger cela ?

- Un regret persistant : la refonte du site aurait pu être l’occasion de mettre enfin les avis et décisions au format HTML (page web), ce qui aurait facilité :

  • leur lecture, tout particulièrement sous smartphone
  • leur indexation et leur référencement par les moteurs de recherche — lutant ainsi contre le problème exposé supra de l’absence de redirection automatique des liens.

Emmanuel Barthe
documentaliste juridique, veilleur, webmestre


Les décisions et avis restent au format PDF seul


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 83

Dernières brèves