Portails juridiques officiels - Diffusion des données juridiques publiques

Dernier ajout : 10 décembre.

Derniers articles

L’Open data parlementaire a beaucoup progressé entre fin 2013 et 2017

Travaux parlementaires : le Sénat met tout en ligne depuis 1958

Et l’Assemblée nationale met en ligne ceux de la IVe République

Mardi 10 octobre 2017

Lire la suite »

La couverture des travaux législatifs (ou documents et débats parlementaires) anciens sur Internet à beaucoup progressé ces dernières années. Voici un rapide panorama.

Les PDF des anciens travaux du Sénat

Découverte grâce à la recherche d’une juriste et le signalement d’un collègue documentaliste juridique, la page web en question s’appelle "Documents déposés au Sénat". Voici son adresse en clair : http://www.senat.fr/dossiers-legislatifs/depots/depots.html

Le contenu remonte au 9 décembre 1958, soit le début officiel de la Ve République et concerne les types de documents parlementaires Sénat (PAS Assemblée nationale) suivants :

  • projet de loi
  • proposition de loi
  • proposition de résolution
  • rapport législatif
  • rapport d’information
  • rapport de commission d’enquête.

Les documents parlementaires déposés au Sénat les plus récents sont également disponibles à partir cette page. Les documents ne sont pas classés par dossier législatif mais par session parlementaire puis par numéro de document (donc dans l’ordre de dépôt). Il faut donc un peu de Ctrl+F ou de googling pour retrouver ses petits.

Pour les débats (l’équivalent du JO Sénat Débats), c’est sur cette page-là, signalée par ma collègue Sandrine : Comptes rendus intégraux des séances de décembre 1958 à mai 1996. Son URL en clair : http://www.senat.fr/comptes-rendus-seances/5eme/seances/archiveSeances.html

Ces PDF-là ne sont pas liés au dossiers législatifs, contrairement aux textes déposés. Ils sont classés par année puis par mois, pas par session parlementaire.

C’est un discret mais énorme pas en avant de la part du Sénat dans la diffusion des données publiques juridiques. Mais attendons les critiques sur le format, qui je pense ne tarderont pas. Regards Citoyens aura certainement un commentaire. En tout cas, je n’ai pas vu de communiqué sur le site du Sénat.

Les PDF de l’Assemblée nationale

L’Assemblée nationale avait déjà mis en ligne (signalé par Gildas Berthelot du Service de documentation du Conseil constitutionnel) :

Sauf erreur de ma part, il manque toujours les rapports législatifs et les projets et propositions de loi déposés à l’Assemblée nationale pour la Ve République.

Les travaux législatifs de la loi de 1966 sur les sociétés commerciales deviennent ainsi partiellement accessibles en ligne à tout intéressé.

Dans les quatre cas, il s’agit de PDF image avec derrière le texte OCRisé. On peut donc ouvrir un document et chercher dedans. Et je suppose que Google est déjà en train d’indexer cela en détail.

Comme ce sont des données publiques, on peut considérer que si l’opération de diffusion en open data de plus de jurisprudence est de facto bloquée, celui des textes officiels, catégorie travaux préparatoires, a nettement progressé.

Merci à l’AN, merci au Sénat. Rappelons que lors de l’élaboration de la loi Lemaire, les députés avaient été invités à appliquer l’open data aux données des assemblées parlementaires, ce qui fut repoussé au nom de la séparation des pouvoirs. Ces mises en ligne ne sont pas exactement une réponse à cette incitation mais montrent le souci des assemblées parlementaires françaises de ne pas "rater le coche" de la diffusion et de l’open data des données juridiques publiques.

Les bases de données parlementaires actuelles déjà mises en open data

Ce souci de l’Open data s’était déjà exprimé auparavant. Les deux assemblées avaient déjà mis en place des sites pour diffuser leurs bases de données actuelles [4] :

  • en octobre 2013, ouverture de la Plateforme des données ouvertes du Sénat (data.senat.fr). Aujourd’hui, on peut y télécharger les bases Dossleg (Dossiers législatifs), Ameli (Amendements), Questions et Sénateurs. Poursuivant cette démarche, le Sénat vient de mettre en place un dispositif spécial à l’occasion du scrutin sénatorial de septembre 2017 [5] : les candidats puis les résultats des élections sénatoriales de septembre 2017 ont été rendus disponibles en open data en ligne.
  • en juin 2015, l’AN s’est lancé avec Data.Assemblee-nationale.fr [6]. Les jeux de données mis à disposition sont similaires à ceux du Sénat. Mentionnons bien clairement que dans les deux cas, la base Dossiers législatifs ne contient pas le texte intégral des documents parlementaires, mais leurs intitulés, dates, auteurs, liens etc.

Ne pas oublier les retraitements de ces données opérés par l’association Regards citoyens, disponibles sur les sites suivants :

Et la IIIe République ?

Pour les travaux parlementaires sous la IIIe République, il faut aller sur Gallica, le site d’ouvrages et revues anciens (hors droits d’auteur) scannés par la Bibliothèque nationale de France (BNF) :

Emmanuel Barthe
bibliothécaire documentaliste juridique


Logiciels ou XML ?

Anonymiser automatiquement les décisions de justice : des solutions

Anonymiser à la source est plus facile et moins cher

Dimanche 1er octobre 2017

Lire la suite »

Vous êtes une association, un particulier, un organisme, une institution juridique dans un pays en voie de développement. Vous voulez mettre sur votre site les décisions de justice mais sans courir le risque de publier les noms des personnes physiques — ce qui peut être interdit [7] ou préjudiciable. Vous voulez au minimum les pseudonymiser, idéalement les anonymiser (pseudonymiser, c’est remplacer les noms par des lettres, anonymiser, au sens du nouveau règlement européen RGPD [8], c’est empêcher une ré-identification). Pour cela, vous cherchez un logiciel permettant de les anonymiser automatiquement.

Voici une tentative de réponse, rédigées après quelques consultations.

En résumé, et contrairement à ce qu’on pourrait penser, si on se donne la peine de "XMLiser" la chaîne de production numérique, anonymiser à la source est plus facile et moins cher.

Anomymiser ex-post

Pour anonymiser a posteriori, on peut utilisé les solutions éprouvées :

Voyez aussi :

Peut-être pouvez vous aussi voir si l’Institut de Veille Sanitaire français vous autoriserait à utiliser leur logiciel d’anonymisation et s’il pourrait être adaptable à votre cas.

Anomymiser ex-ante

S’il vous est possible d’encadrer dès la rédaction des décisions les noms des personnes physiques, vous pouvez anonymiser à la source :

  • par des balises XML (invisibles à l’impression / visualisation) définies dans la DTD. Une modification de la feuille de style XSL permettrait alors de ne diffuser que des arrêts anonymisés [11]. C’est la solution du Conseil d’Etat français, et la plus rapide et la moins chère in fine
  • voire très éventuellement par des (ou une chaîne de) caractères spéciaux visibles uniques dans le document (exemples : ^ ou ¤ ou %µ*), caractères qu’une macro Word avec des Rechercher et des Remplacer (ou un programme similaire sur tous les docts) pourra utiliser pour nettoyer les documents. Mais l’automatisation par macro ne suffit pas et laisse encore plein de travail humain. Tant et si bien que généralement il vaut mieux tout refaire à la main ...

En effet :

  • il ne suffit pas de caviarder (supprimer les noms), encore faut-il que la décision continue d’être lisible (donc ne pas mettre Monsieur X à toutes les parties, surtout quand il y en a plusieurs avec le même nom)
  • il ne faut pas anonymiser les personnes morales ni les professionnels du droit (sauf quand ils deviennent des parties, ce qui arrive parfois)
  • enfin, la pseudonymisationymisation ne suffit pas, il faut dépersonnaliser (retirer adresse, profession rare, fait célèbre ou médiatique, numéro de carte bancaire, plaque minéralogique, numéro de cadastre, etc.). Cela, aucun rechercher/remplacer automatisé (les fameuses "règles"), aucun regex ne permet de le faire ...

La solution XML/XSL serait donc clairement à privilégier. Toutefois, l’"XMLisation" de la chaîne de production numérique, quand on part de simples documents Word diversement structurés et de fichiers PDF, est un chantier lourd, long et initialement coûteux.

Merci d’avance de vos retours d’expérience (les commentaires sont ouverts ou par mail), qui permettront d’enrichir ce billet.

Emmanuel Barthe
documentaliste juridique, veilleur, formateur


Utiliser Legifrance à 100%

Ou comment savourer chaque feuille du mille-feuilles

Vendredi 15 septembre 2017

Lire la suite »

Legifrance, une gourmandise ? Je n’irai peut-être pas jusque là ;-) mais un mille-feuilles, oui. Pourquoi un mille-feuilles ?

Des bases de données mélangées

Un mille-feuilles, d’abord, parce que Legifrance n’est pas un simple site web. C’est un produit très complexe, réalisé par un éditeur public, la DILA, et une importante SSII, Sword, avec des bases de données anciennes, dont plusieurs constituées à partir des années 60, combinées entre elles et dont le contenu et la structure diffèrent grandement [12].

Les seuls points communs entre ces bases de données :

  • c’est du juridique, pas des informations sur les entreprises (dites informations légales [13])
  • c’est de la donnée brute (à l’exception des abstracts et résumés de jurisprudence des bases CASS et JADE) et pas du commentaire.

Ces bases de données, de surcroît, sont dans plusieurs cas mélangées.

Principaux exemples de ces mélanges :

  • dans Jurisprudence judiciaire, sont en fait mélangées trois bases de données différentes :
    • CASS, autrement dit les arrêts publiés au Bulletin de la Cour de cassation
    • INCA, c’est-à-dire les arrêts INédits (non publiés au Bull. civ. et crim.) de la CAssation
    • et CAPP, une sélection importante d’arrêts de cours d’appel. CASS et CAPP sont elles mêmes extraites de la base Jurinet, un outil interne à la Cour de cassation)
  • dans Les autres textes législatifs et réglementaires se cachent en fait :
    • le Journal officiel édition Lois et décrets (texte intégral du JORF depuis 1998, mais sans les mesures nominatives)
    • le contenu des anciennes bases LEX (textes avant 1998) et REFLEX (liens entre les textes : tel décret applique telle loi, telle article de loi abroge tel autre ...)
    • la base LEGI des textes consolidés (mis à jour).

Une base non mélangée, en revanche :

  • Jurisprudence administrative est extraite d’une seule base tenue par le Conseil d’Etat appelée Ariane et devenue JADE pour Legifrance.

Non mélangée, mais quand même modifiée : les juridictions suprêmes ne fournissent pas leurs bases telles quelles : à part les descripteurs (appelés Titrage pour la Cour de cassation), la plupart des enrichissements, notamment les liens et les rapports pré-décision, sont retirés.

A ce jour, sont exclues du contenu de Legifrance, les décisions de la Cour des comptes et des chambres régionales des comptes (CRC). Elles sont toutefois accessibles par le biais du site de la Cour des Comptes.

Des trucs de recherche méconnus

Un mille-feuilles, secundo, parce que les meilleures fonctionnalités de recherche de Legifrance sont bien cachées.

Les "trucs" suivants sont méconnus. Alors même qu’ils permettent d’exploiter Legifrance à 100%.

Conseils généraux

- N’hésitez pas à passer d’abord par Google pour une recherche de texte officiel ou de jurisprudence des cours suprêmes. Legifrance étant aujourd’hui très bien indexé par Google, si le document recherché est présent dans Legifrance, il y a de fortes chances pour que Google vous le trouve. Vous pouvez même cibler uniquement Legifrance en utilisant le champ site. Il suffit d’ajouter site:legifrance.gouv.fr à la fin de vos requêtes Google (pas d’espace entre site, les deux points et le nom de domaine).

- Utilisez de préférence l’interface de recherche experte plutôt que la recherche simple. Surtout si vous êtes un juriste ou un documentaliste.
C’est une règle générale des bases de données : ici comme ailleurs, utiliser la recherche avancée vous garantit d’avoir accès à la totalité du contenu de la base de données et à la totalité des fonctionnalités de recherche. Et dans Legifrance, non seulement de nombreuses fonctionnalités de recherche ne sont disponibles qu’en recherche experte, mais certaines informations aussi, comme — nous allons le voir infra — en matière de concordance entre un nouvel article de Code et son ancienne version et pour accéder aux versions futures (non encore entrées en vigueur) d’un article de Code.

- Dans le champ Mots-clés, si vous tapez vos termes sans réglage spécial, ils seront recherchés à 10 mots l’un de l’autre. Vous êtes, sans le savoir, en train d’utiliser ce qu’on appelle un opérateur de proximité.
C’est particulièrement efficace en recherche de jurisprudence car les arrêts inédits sont non enrichis en abstracts et peu structurés. Il faut donc compenser ce manque d’information riche et pertinente par une utilisation plus fine du texte intégral des arrêts.

Jurisprudence

- Si vous êtes en jurisprudence et que vous voulez que *tous* vos résultats soient dans un sujet précis (par exemple la responsabilité civile) et ainsi les rendre plus pertinents et réduire le nombre à passer en revue, la fonctionnalité de recherche reine est le plan de classement de la jurisprudence.
En jurisprudence judiciaire, il s’appelle Titrage, il est accessible en bas de l’interface de recherche experte, il ne couvre vraiment que les arrêts de la Cour de cassation publiés au Bulletin et manque de rigueur [14]. En jurisprudence administrative, il s’appelle Plan de classement de la jurisprudence administrative (PCJA), et là, en revanche, il est très rigoureux et les publicistes l’utilisent volontiers pour cibler correctement une recherche.
Ces plans de classement ne sont repris par aucune plateforme d’éditeur (c’est bien dommage), ils constituent une exclusivité Legifrance.
Deux particularités à ne pas oublier dans le fonctionnement des plans de classement :

  • lorsque vous choisissez cette option de recherche, pour que la fonction "Recherche" soit effective, n’oubliez pas de choisir un élément dans le pavé "Décision" ou dans le pavé "Etendue de la recherche"
  • dans la recherche par le titrage, le déroulement de l’arborescence s’effectue en cliquant sur un des termes proposés ou sur la petite croix noire. La sélection de la recherche se réalise en cochant la petite case (le petit carré blanc) placée devant le terme choisi.

- En jurisprudence, les noms de personnes physiques sont anonymisés, mais seulement ceux-là :

  • il est donc impossible de chercher un arrêt par le nom de la partie personne physique
  • en revanche, il est possible de trouver la décision par la dénomination des personnes morales (nom de société) ou le patronyme d’un auxiliaire de justice, car ils sont exclus du périmètre de l’anonymisation.

- Dans l’interface de recherche de la jurisprudence judiciaire, le numéro d’affaire (dit n° de pourvoi) s’écrit sans le point : 05-20111 et non 05-20.111.

- Pour chercher un arrêt de la Cour de cassation par son numéro de Bulletin (Bull. Civ. Bull. Crim.), bien penser à cocher "Décisions de la Cour de cassation", au préalable, avant la sélection d’autres rubriques pour éviter un trop grand nombre de réponses. Là aussi, cette possibilité de chercher par la référence de publication au Bulletin des arrêts de la Cour n’a pas été reprise par les moteurs de recherche de jurisprudence des plateformes des éditeurs. C’est donc une exclusivité Legifrance.

- Si vous voulez connaître le délai de chargement des décisions de justice sur Legifrance : une fois sur l’interface de recherche, cliquez en haut à droite sur le lien Mise à jour.

Textes officiels

- Pour chercher un article de code dans les textes officiels et les Codes, il faut l’écrire sans espace (et sans l’astérisque le cas échéant) entre la lettre et les chiffres [15]. Exemples : L511-1 ou R123-18.

- La base dénommée "Autres textes législatifs et réglementaires" et celle des Codes permettent d’obtenir la version à jour (on dit "consolidée") d’un texte (loi, ordonnance ou décret) ou d’un article de Code non seulement au jour d’aujourd’hui mais aussi à une date donnée. En clair : Legifrance peut reculer dans le temps.
Pour cela, une fois un texte trouvé, il faut aller dans la colonne de gauche intitulée "Navigation" et, sous la mention "Version consolidée à la date du ...", saisir la date et cliquer sur "Consulter".
Toutefois, cette fonctionnalité ne marche pas toujours et surtout, elle ne peut pas fonctionner sur les années ’70 et antérieures. De plus, sur de longs textes de réforme comme par exemple la loi NRE de 2001 [16], la version consolidée peut ressembler à un véritable gruyère. En effet, le plus souvent, le texte affiché est littéralement troué de partout : la plupart des articles se contentant de modifier des articles de Codes déjà existant, la version consolidée ne fait donc que renvoyer à ces articles de Codes par lien hypertexte, au lieu de les afficher Si on s’intéresse à plus que quelques articles, c’est peu pratique et frustrant.

- Les tables des matières des codes sont parfois modifiées à l’issue d’une refonte ou d’une création de code. Dans ce cas, une table de concordance indique les correspondances entre l’ancienne numérotation et la nouvelle numérotation et inversement.
Ces tables de concordance sont accessibles par deux chemins différents dans Legifrance :

- La concordance d’un article de code en particulier se retrouve dans les mentions Anciens/Nouveaux articles présents sous l’article consulté en recherche experte ou après avoir cliqué sous la mention "En savoir plus sur cet article" située à côté de chaque numéro d’article en recherche experte.

- Un article nouveau de Code avec une entrée en vigueur différée dans le temps (il n’a donc pas encore d’existence juridique) est consultable uniquement par le biais de la recherche experte.

- La recherche par thème (plus précisément, par descripteur) est possible dans les textes officiels et les Codes grâce au thésaurus Sarde. Elle est accessible au centre de la page d’accueil en tapant un ou des mots-clés dans la zone de saisie sous "Recherche thématique sur la législation et la réglementation en vigueur".

- Legifrance offre la possibilité de rechercher les mesures de transposition adoptées par la France pour chaque directive européenne (la transposition est une sorte de traduction en droit national des dispositions de la directive). A partir d’un texte européen, le texte transposé en droit français se recherche par la rubrique Recherche des mesures de transposition des directives européennes. Il suffit de taper le numéro de la directive (ex. : 2000-10) ou, à défaut, sa date de signature ou de publication et/ou un ou plusieurs mots significatifs. de rechercher les références des textes législatifs et réglementaires nationaux qui ont été expressément notifiés par la France aux services de la Commission européenne comme mesure nationale d’exécution (base MNE) [17].
Hélas, la base des MNE n’est pas souvent à jour, car elle dépend justement de notifications officielles.

- Conventions collectives. Plutôt que de chercher par mot-clés dans les CCN, il vaut nettement mieux afficher directement le texte de base de la convention recherchée : il est alors moins difficile de trouver le point précis de la CCN qui vous intéresse, grâce notamment au sommaire, d’autant plus que s’affiche alors dans la colonne de gauche un filtre pour les questions usuelles les plus fréquentes (durée des congés payés, congés exceptionnels, durée de la période d’essai, préavis, indemnités de licenciement)

- Voir aussi notre article paru sur ce blog en 2009 sur le même sujet : Un "tuto" pour la recherche de textes officiels sur Legifrance.

Avertissement

Attention toutefois :

- Le moteur de recherche de Legifrance parfois donne des résultats illogiques. Ne pas hésiter alors à effacer la recherche et la reprendre à zéro. Si cette "réinitialisation" ne change rien, simplifiez votre requête ou allez carrément sur une plateforme payante d’éditeur.

- En cas de grosse réforme, la mise à jour des Codes et autres textes consolidés modifiés peut prendre plusieurs jours.

- Les échéanciers des décrets d’application (dans les dossiers législatifs, loi par loi) ne sont pas forcément mis à jour le jour même de la publication du décret. Ainsi le decret d’application sur les licences open data de la loi Lemaire a été publié le 27 avril 2017 et le 28 il n’était pas dans l’échéancier.

En savoir plus : l’Aide et les ateliers de Legifrance

Comme le rappelle ma collègue Carole Guelfucci [18] :

Emmanuel Barthe
bibliothécaire documentaliste juridique, spécialiste des données publiques juridiques
formateur à la recherche documentaire en droit


1 | ... | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | ... | 80

Dernières brèves