Portails juridiques officiels - Diffusion des données juridiques publiques

Dernier ajout : 9 octobre.

Derniers articles

Les limites de la diffusion des décisions de justice

L’open data des décisions des cours d’appel et tribunaux n’est pas pour demain

Quelles voies emprunter pour y arriver ?

Jeudi 19 octobre 2017

Lire la suite »

Roseline Letteron, professeur de droit public à l’Université Paris-Sorbonne, a publié le 28 novembre 2016 sur son blog Liberté Libertés Chéries le billet suivant : Le mythe de la liberté d’accès aux décisions de justice. NextINpact, écrivant sur les futurs décrets d’application de la loi Numérique, titraient quant à eux le 29 décembre 2016 : Loi Numérique : la mise en Open Data des décisions de justice prendra "plusieurs années".

Avec le développement ces dernières années de l’open data [1], le thème de l’imperfection de la diffusion des décisions de justice est devenu une "tarte à la crème". Répondre à ces deux articles me donne l’occasion de l’analyser ici en détail.

Sommaire

Précisions à apporter au billet du professeur Letteron
Pseudonymisation : un nouveau mot. Anonymisation : un nouveau sens
Pourquoi l'open data de la jurisprudence du fond restera longtemps en "stand-by"
La loi Lemaire et les moyens nécessaires
Pseudonymiser et anonymiser : un travail énorme et difficile
La responsabilité juridique des pouvoirs publics
La délicate question des décisions pénales et des tribunaux de commerce
Un calendrier prévisionnel mais incertain
Conclusion - Mission impossible pour les pouvoirs publics ? - Et les acteurs privés ?

Précisions à apporter au billet du professeur Letteron

J’aimerais déjà apporter plusieurs précisions au billet du professeur Letteron :

- Sur l’application de la directive "PSI" aux décisions de justice

A propos de la directive 2003/98 du 17 novembre 2003 concernant la réutilisation des informations du secteur public (dite "PSI") qui mentionne que son champ d’application s’étend aux « documents [...] de la filière judiciaire [2] et de la filière administrative », ce qui justifie l’open data de *toutes* les décisions de justice judiciaire, il faut apporter plusieurs précisions :

  • cette mention est dans le considérant 16 de la directive. Elle n’est pas affirmée par un article de celle-ci
  • de surcroît, ce n’est que tout récemment, dans le débat autour du projet de loi Lemaire pour une République numérique, que ce considérant a commencé à être invoqué
  • pour bien faire comprendre l’importance de cette précision : ce considérant tend à dire que les décisions de justice sont des données publiques *réutilisables*. Or, jusqu’ici, le droit français classait la jurisprudence dans des données non administratives (séparation des pouvoirs ...) et donc, ipso facto, non réutilisables au titre du droit français résultant de la transposition de la directive.
    Seule la CADA, dans un avis peu connu Ministre de la justice n° 20103040 du 27 juillet 2010 que Mme Letteron cite, avait jusqu’ici tenté d’aller contre cette position restrictive, sans d’ailleurs évoquer le considérant 16 mais l’article 11-3 de la loi n° 72-626 du 5 juillet 1972 selon lequel « les tiers sont en droit de se faire délivrer copie des jugements prononcés publiquement ».
    A l’origine de cette position restrictive sur la réutilisabilité de la jurisprudence au titre de la directive, il y avait la façon très française de transposer la directive PSI initiale, en associant étroitement, par la rédaction de la "loi CADA" du 17 juillet 1978, communicabilité des documents administratifs et réutilisabilité des informations (données) publiques. Pour simplifier : document administratif = document communicable = document réutilisable. Donc, selon cette conception peu partagée par les autres Etats membres de l’UE, si des données publiques étaient contenues dans un document non administratif, elles n’étaient pas réutilisables ...
    La saisine de la CADA réagissait probablement contre l’arrêt Bertin du Conseil d’Etat rendu seulement deux mois et demi mois auparavant et d’ailleurs cité dans l’avis (CE n° 303168 du 7 mai 2010) : en définissant de manière extensive la notion de document juridictionnel et en affirmant sa non-communicabilité, il pouvait menacer la réutilisation de la jurisprudence par les licences Legifrance, tant gratuite pour une réutilisation ponctuelle, que payantes, en place à cette époque depuis 2002.

- Accès à JuriCA

Selon Mme Letteron :

« Les décisions des cours d’appel figurent dans une base de données gérée par la Cour de cassation, JuriCA, souvent présentée comme "un outil de communication et de recherche" indispensable à la "construction des savoirs juridique et sociologique. C’est sans doute vrai pour les magistrats qui bénéficient, heureusement, d’un accès direct et gratuit par l’intranet Justice. Pour les autres, leur curiosité scientifique n’est pas suffisante pour justifier un accès à JuriCA. Il faut aussi de l’argent, et même beaucoup d’argent. »

Pourtant, la curiosité scientifique, si elle émane d’une équipe ou d’un chercheur universitaire, peut être suffisante pour justifier un accès *gratuit* à JuriCA et ce, depuis au moins 2009, grâce aux conventions de recherche entre équipes de master et Cour de cassation [3].

- La position de la CADA sur les décisions de justice

Le professeur Letteron écrit :

« Dans un conseil du 27 juillet 2010, [la CADA] s’estime compétente pour rendre un avis sur toute décision défavorable en matière de réutilisation des informations publiques contenues dans des jugements ou arrêts judiciaires. En revanche, dans un avis du 28 avril 2016, elle déclare irrecevable une demande dirigée contre le refus opposé par la Cour de cassation à un accès aux décisions contenues dans JuriCA, en vue de leur réutilisation. Celles-ci ne sont pas considérées comme des "documents administratifs" au sens de la loi du 17 juillet 1978. Autrement dit, la CADA est incompétente pour se prononcer sur l’accès aux décisions de justice [...] »

Le refus de la CADA de reconnaître le caractère de document administratif — donc communicable — aux décisions de justice ne date pas de 2010 : il remonte au minimum à 2005 [4].

Quant à son avis du 27 juillet 2010, comme nous l’avons vu plus haut, il s’agit selon toute probabilité, vu le contexte, d’une décision d’exception au sens premier du terme, destinée à protéger les licences Legifrance potentiellement menacées par l’arrêt Bertin précité.

Ajoutons enfin que la CADA ne rend que des avis — c’est le Conseil d’Etat qui tranche. Et justement, jusqu’à aujourd’hui, le Conseil d’Etat ne s’est jamais prononcé sur la réutilisation de décisions de justice en tant que données publiques, uniquement sur la communicabilité de documents juridictionnels qui n’étaient pas des décisions de justice

- La loi Lemaire pour une République numérique du 7 octobre 2016 est allée un peu plus loin que l’état du droit décrit dans le billet du professeur Letteron : ses articles 20 et 21 créent un principe de mise à disposition gratuite de toutes les décisions de justice, administrative comme judiciaire, et de tout niveau (de la 1ère instance aux cours suprêmes).

- Mme Letteron félicite Doctrine.fr pour son action pro-open data. lI est toutefois difficile de penser que cette action pro-open data soit totalement désintéressée. L’intérêt des legal techs françaises dans le débat actuel est en partie d’ordre financier : si l’Etat se met à diffuser même les jugements des tribunaux et paye pour ces traitements de données, les barrières d’entrée sur ce marché tomberont et les entrants sur le marché n’auront plus à faire de lourds investissements. Il n’est pas question que d’open data ici, il est aussi question de concurrence.

Pseudonymisation : un nouveau mot. Anonymisation : un nouveau sens

Dans ce billet, nous utiliserons le terme anonymisation dans son nouveau sens fort d’impossibilité de réidentification des personnes physiques. Le simple remplacement des noms par des lettres porte désormais le nom de pseudonymisation.

Pour deux raisons :

  • parce que ce qu’on appellait communément "anonymisation" (remplacer des noms par des lettres) n’assure qu’un anonymat très relatif : bien souvent les circonstances, les faits relatés dans la décision de justice permettent par recoupement de retrouver l’identité des parties. Pire, les pseudonymes ne sont pas supprimés selon les règles actuellement utilisées [5] et les noms de personnes dans les noms de sociétés non plus [6]. Pour être plus précis, on utilise donc désormais le terme de pseudonymisation
  • l’autre raison de ce changement de vocabulaire et la plus importante, est le Règlement général de protection des données du 27 avril 2016 (RGPD) [7] qui s’appliquera à partir de mars 2018. Selon le RGPD [8], l’anonymisation consiste à empêcher une réidentification selon l’état actuel de l’art. Si une décision de justice laisse possible une réidentification indirecte, alors elle n’est pas réellement, véritablement anonymisée. Et si elle n’est pas anonymisée, alors elle est soumise au droit des données personnelles institué par le RGPD et donner lieu à déclaration, être soumise au consentement des personnes physiques citées etc., traitement lourd et impraticable dans le cadre de l’Open data.
    Autrement dit et en une phrase, le RGPD exige, pour ne pas appliquer toute la rigueur du droit des données personnelles, que la base soit anonymisée au sens fort où, en l’état actuel de l’art, la réidentification est impossible.

Pourquoi l’open data de la jurisprudence du fond restera longtemps en "stand-by"

Maintenant, sur le débat de fond :

- Si l’on tient pour le principe de transparence et pour l’objectif de diffusion du droit, la mise à disposition gratuite de toute la jurisprudence au format numérique est LA position, dans l’idéal.

- Mais même dans l’action publique, le nerf de la guerre (je n’ai pas dit le principe de toute chose) reste l’argent. Surtout en ces temps de recettes fiscales — et donc de budgets publics — en baisse.

Les montants disponibles à la DILA, au Ministère de la Justice, à la Cour de cassation et dans les juridictions du fond pour structurer, traiter, pseudonymiser (a fortiori anonymiser) et diffuser les arrêts des cours d’appel (base Jurica) sont limités (cela dit, ces montants étaient bien plus limités avant l’arrivée de Legifrance). C’est d’abord pour cette raison que les éditeurs ont longtemps eu de facto le monopole de la diffusion de la jurisprudence : leurs clients avaient les budgets pour financer indirectement ce travail.

La loi Lemaire et les moyens nécessaires

La loi du 7 octobre 2016 pour une République numérique parle d’open data des décisions du fond (articles 20 et 21).

Mais les moyens nécessaires, tant techniques (ils sont aujourd’hui connus des experts : XMLisation de tous les documents avec DTD ou schéma XML, rénovation massive du parc informatique et augmentation très importante du débit des connexions intranet et internet) que humains (augmenter les effectifs des greffiers, aujourd’hui débordés), et également financiers, ne sont pas du ressort de cette loi — ni d’aucune autre d’ailleurs :

- En réalité, aujourd’hui, une décision facile à structurer (pour qu’elle soit aisée à mettre en base de données) et à pseudonymiser serait, idéalement, un fichier XML balisé avec une centaine de champs minimum et doté de liens vers d’autres fichiers XML. Produire de la jurisprudence judiciaire de 1ère et 2ème instance structurée supposerait donc :

  • élaboration par les services informatiques de la juridiction judiciaire suprême et ceux de la chancellerie, avec les magistrats, d’une DTD ou d’un schéma XML (il existe une première version pour les arrêts de la Cour de cassation) et sa validation par le ministère
  • des moyens en infrastructure (connexion, matériel, logiciels) pour l’instant indisponibles en juridiction
  • une révolution (très contraignante) dans la façon pour les magistrats de rédiger une décision.

- Pouvoir gérer les volumes en cause : si les juridictions administratives ne rendent "que" 230 000 décisions par an, les juridictions judiciaires en produisent, elles, près de 3,8 millions par an dont 1,2 million en matière pénale ... Le tout avec 32 000 ETP [9] seulement en greffiers et magistrats [10].

- Numériser les décisions de première instance. Ronan Guerlot, adjoint au directeur du Service de documentation, des études et du rapport (SDER) de la Cour de cassation [...], cité par Libération, estime qu’il faudra patienter quatre à cinq ans une fois que le décret d’application de la loi sera entré en vigueur pour informatiser toutes les décisions de justice. « Le plus difficile sera de faire remonter les décisions de première instance du TGI. Nous disposons souvent de minutes [original d’un acte de justice, ndlr] papier, il faudra donc créer des outils informatiques », explique-t-il. En revanche, pour la justice administrative, c’est déjà prêt : les décisions des cours administratives d’appel sont déjà sur Legifrance et celles des tribunaux administratifs sont déjà en base de données — mais cette dernière n’est pas accessible au public et n’a in fine pas été mise en vente aux éditeurs.

- Les institutions, très logiquement, étaient axées sur les juridictions suprêmes et non sur les cours d’appel et les tribunaux. Sans compter un refus très latin de la "case law". Praticiens et éditeurs ont toujours su, eux, l’importance de la jurisprudence et particulièrement des arrêts d’appel. Pour autant, et comme le souligne le premier commentaire sous l’article de NextINpact (commentaire laissé par un avocat, de toute évidence), la grande masse des décisions des tribunaux est et restera « inintéressante au possible » [11].

Pseudonymiser et anonymiser : un travail énorme et difficile

Sur l’obligation de pseudonymisation [12] (on ne parle plus d’anonymisation mais de pseudonymisation, voir en introduction de ce billet) avant de publier une décision de justice sur Internet :

- Jurisprudence administrative : peu ou pas de problème pour pseudonymiser (replacer les noms par des lettres) les décisions des juridictions administratives : les noms de parties dans leurs décisions sont balisés/taggués dans le XML.

- Jurisprudence judiciaire :

  • le Service de documentation, des études et du rapport de la Cour de cassation (SDER) doit reprendre en 2017 les tâches confiées jusque là à la DILA [13]
  • il faut distinguer ici trois, voire quatre chantiers d’anonymisation : 1. celui des arrêts de la Cour de cassation (25 600 affaires terminées en 2015) — déjà réglé, pour les inédits (base CASS) comme pour les publiés au Bulletin (base INCA) —, 2. celui des arrêts civils de cour d’appel (base Jurica) (236 000 décisions en 2015), 3. celui des jugements des tribunaux civils (2,55 millions sans compter les tribunaux de commerce [14], mais en incluant TGI, TI, juridictions de proximité, TASS et Conseils de prud’hommes) et 4. celui de la jurisprudence pénale du fond [15] (1,2 million) [16].
    En effet, les décisions de la Cour sont la plupart du temps brèves et sobrement motivées, donc relativement faciles et rapides à anonymiser. Les arrêts d’appel, eux, sont nettement plus prolixes et donc plus complexes et plus longs à anonymiser. Et la masse des décisions de civiles de première instance, même si elles sont souvent brèves et très sobrement motivées comme bizarrement celles de la Cour de cassation (mais pas pour les mêmes raisons), est écrasante. Enfin, les décisions du fond en matière pénale, jusqu’ici diffusées ni par Legifrance ni par JuriCA, nécessitent du fait même de la matière plus de précautions, même si elles sont souvent peu ou pas motivées
  • en première instance, il restera, une fois celui-ci numérisé, à anonymiser l’énorme stock purement papier évoqué par M. Guerlot du SDER (voir supra).

- L’absence de schéma ou DTD XML rend l’anonymisation extrêmement difficile. Plus encore sur les décisions judiciaires dont la structure et le langage sont beaucoup moins systématiques et réguliers qu’en jurisprudence administrative.

- Pseudonymiser, en effet, ne se limite pas à faire du Rechercher Remplacer sur les seuls noms de personne contrairement à ce qu’on pourrait croire à première vue [17]. C’est beaucoup plus compliqué que ça.

D’abord parce que les logiciels ont souvent du mal à traiter de nombreux cas. Autrement dit, « il est extrêmement difficile d’avoir plus de 90% des décisions parfaitement pseudo-anonymisées, sauf à employer des moyens humains très importants pour la relecture » (dixit Michael Benesty, fiscaliste, spécialiste et praticien du machine learning en droit avec son site Supra Legem [18]) :

  • deux exemples classiques en une seule proposition (fictive) : « le président de la société Robert, M. Franck Robert ». Certains logiciels experts vont anonymiser la "société Robert" en "société X..." parce que Robert est un prénom alors que les noms de personnes morales ne se pseudonymisent pas [19], d’autres vont laisser le nom de famille du président intact parce qu’il s’écrit comme un prénom, aboutissant ainsi à laisser intact les nom et prénom d’une partie personne physique [20]
  • autre exemple, fréquent lui aussi (noms fictifs) : « la caissière Jeanine Plombeit, employée à la supérette Zaz dans la commune de Tiersset, a été licenciée pour faute grave le 14 juin 2015 ». Il se trouve que la commune ne compte que 500 âmes : même en pseudonymisant le nom de famille, la combinaison de son nom, du nom de la commune et de la raison sociale de son ex-employeur indiquera à tous les habitants des alentours, y compris les employeurs potentiels de Mme Plombeit, de qui il s’agit et ce qui lui est arrivé. Il va donc falloir, exceptionnellement, anonymiser le prénom et la commune : ce n’est pas la recommandation de la CNIL qui le l’exige mais le respect de l’esprit de la loi Informatique et libertés et la lettre du RGPD
  • on consultera d’autres types de difficultés dans le billet de Michael Benesty (Supra Legem) intitulé Techniques d’anonymisation (pseudonymisation) des décisions de justice et leurs limites [21]
  • même la toute dernière technologie, autrement dit le machine learning, échoue, de l’aveu même de M. Benesty, à atteindre un taux de succès suffisant [22].

On retombe donc sur l’importance de la vérification humaine. Mais avec 3,8 millions de décisions par an à vérifier, il est évident que le coût en ETP d’un contrôle systématique sera hors de portée.

Encore n’a-t-on parlé ici que de pseudonymisation. Avec la loi République numérique et le RGPD, il faut aller plus loin. Comme nous l’avons vu en introduction, le règlement général de protection des données, encore plus exigeant que la loi République numérique, s’il est appliqué conformément à son esprit (la lettre, c’est différent, voir commentaire infra de Bruno Mathis), exige une véritable anonymisation, c’est-à-dire une impossibilité de ré-identification. À cet esprit du RGPD, il faut ajouter un lobbying des magistrats [23] et des greffiers [24] pour être également anonymisés et la position du Sénat, clairement défavorable à l’open data en général et à l’open data judiciaire en particulier [25] Il faudra donc repérer et supprimer les mentions de métier/profession, presque tous les noms de lieu et tous les passages permettant une réidentification par recoupement avec d’autres informations et bases de données ... Autant dire qu’"on n’est pas arrivé".

La responsabilité juridique des pouvoirs publics

Cette exigence de véritable anonymisation, au sens fort du terme, est renforcée par la responsabilité des pouvoirs publics.

Selon M. Benesty, avec la loi Lemaire, la responsabilité de l’administration pourrait être engagée pour chaque décision de justice mal anonymisée. En effet, la loi Lemaire prévoit qu’en plus de la pseudonymisation, le risque de réidentification devra être pris en compte. Très exactement, selon le texte : « [les] jugements sont mis à la disposition du public à titre gratuit dans le respect de la vie privée des personnes concernées. Cette mise à disposition du public est précédée d’une analyse du risque de ré-identification des personnes ». M. Benesty propose une vérification humaine dans les matières "sensibles", telle que sélectionnées par la CNIL [26].
Confirmation, sur la base principalement de la loi Informatique et libertés (donc sans même invoquer la loi Lemaire), par le TA de Paris, qui condamne le 7 novembre 2016 l’Etat pour défaut d’anonymisation sur Legifrance d’un arrêt d’appel en matière de divorce [27].

Pour finir, le RGPD prévoit de lourdes sanctions pour les producteurs de données personnelles soumis au droit des données personnelles et ne respectant pas leurs obligations. Ici, ce serait la DILA, autant dire l’Etat ...

La délicate question des décisions pénales et des tribunaux de commerce

C’est sur les chantiers 3 et 4 évoqués supra (collecte et anonymisation 3. des décisions civiles et commerciales de première instance et 4. des décisions pénales de 1ère et 2e instances) que le travail sera le plus long, pour les raisons citées plus haut. Le paragraphe important dans l’article de NetxINpact est la citation du ministère de la Justice à propos des décisions pénales du fond et des jugements de première instance (notez le conditionnel dans les deux phrases et le "moyennant" ...) :

« En matière pénale, le déploiement de Cassiopée dans les cours d’appel permettrait d’intégrer les arrêts rendus en matière pénale moyennant le développement d’un applicatif adapté. Les décisions de première instance seraient intégrées à la base de données dans un second temps. »

Enfin, il y a la question des jugements des tribunaux de commerce. Le fonctionnement des Tcom est pris en charge par les greffiers de commerce et leur personnel. Les greffiers des tribunaux de commerce sont certes des officiers publics et ministériels nommés par le garde des sceaux mais ils exercent dans un cadre libéral : ce sont de véritables chefs d’entreprise [28] La saisie et le stockage des décisions ne sont donc pas pris en charge par le ministère de la Justice. D’ailleurs, les greffes des Tcom *vendent* leurs décisions.

Un calendrier prévisionnel mais incertain

Est paru dans le Recueil Dalloz du 20 juillet 2017 un article de MM. Buat-Ménard et Giambiasi, tous deux magistrats et travaillant au ministère de la Justice, intitulé « La mémoire numérique des décisions judiciaires. L’open data des décisions de justice de l’ordre judiciaire ».

On peut y lire différents développements sur l’anonymisation des décisions judiciaires et la place et le rôle de la jurisprudence à l’aune de l’Open data.

Une partie de l’article nous intéresse plus particulièrement, qui s’intitule « Les perspectives de mise en œuvre » où les auteurs confirment les délais déjà donnés en janvier par le ministre de la Justice d’alors [29] : cet open data judiciaire pourrait être mis en œuvre en trois étapes : la mise à disposition des décisions de la Cour de cassation (de 6 mois à un an après l’entrée en vigueur du décret à venir), puis celle des Cours d’appel (près de 36 mois seraient nécessaires, toujours après l’entrée en vigueur du décret) et enfin celle des décisions de premier degré (dans un délai de 3 à 8 ans).

Ainsi le ministère de la Justice émet-il l’hypothèse d’un open data complet en … 2025. Pour mémoire dans un article des Echos du 22 mars 2017, il était question d’un open data effectif sous 5 ans.

Deux autres choses sont à souligner dans cet article :

  1. un aspect crucial du projet : l’article paru au Dalloz parle d’anonymisation — forte — et non de simple pseudonymisation (qu’on appelait anonymisation jusqu’à la publication du nouveau règlement européen de protection des données personnelles dit RGPD qui entrera en vigueur en 2018). Le nouvel objectif et critère promu par le RGPD est bien d’empêcher toute dé-anonymisation (ou ré-identification) en l’état actuel de la technique. Or on sait repersonnaliser des données bancaires ou hospitalières pseudonymisées. Il faut donc ne plus se limiter à la solution actuelle, où l’on remplace les noms par des lettres — solution anciennement dénommée anonymisation et qu’on appelle depuis le RGPD pseudonymisation
  2. ce texte est l’adaptation écrite d’une intervention de M. Buat-Ménard, préparée conjointement par les auteurs, le 9 mars 2017, lors de la journée d’étude consacrée à La mémoire numérique de la justice, co-organisée par la Sous-direction de la statistique et des études du ministère de la Justice et l’Institut des hautes études sur la justice. Et il ne comporte aucun avertissement comme quoi il ne serait qu’une position personnelle des deux magistrats. On semble donc avoir là une prise de position publique du ministère, bien établie car réitérée tant sous présidence Hollande que sous celle d’Emmanuel Macron.

On peut donc déduire de cet article au Recueil Dalloz qu’au vu du RGPD et des obligations qui lui échoient, le ministère de la Justice a fait le choix pour l’avenir et pour la mise en open data de l’ensemble de la jurisprudence de l’anonymisation (au sens nouveau du terme, donc forte), non de la simple pseudonymisation mais carrément de l’anonymisation.

Conclusion - Mission impossible pour les pouvoirs publics ? - Et les acteurs privés ?

Avec tous les écueils listés supra, on peut estimer que des retards supplémentaires ou pour le moins une réalisation partielle sont possibles voire probables.

Que va-t’il se passer sur le terrain entre-temps, est une question à laquelle je me garderais bien de répondre. Mais la réponse pourrait bien définir le futur de facto (et non de juro ; c’est le genre de situation qu’on a longtemps connu en matière de données personnelles dans la jurisprudence) si les pouvoirs publics se situent dans des délais aussi longs. Espérons que les acteurs (qui incluent les éditeurs juridiques et les institutions tout autant que les legal tech) suivront la position que vient de prendre le ministère.

Emmanuel Barthe
bibliothécaire documentaliste juridique
spécialiste des données publiques juridiques


L’Open data parlementaire a beaucoup progressé entre fin 2013 et 2017

Travaux parlementaires : le Sénat met tout en ligne depuis 1958

Et l’Assemblée nationale met en ligne ceux de la IVe République

Mardi 10 octobre 2017

Lire la suite »

La couverture des travaux législatifs (ou documents et débats parlementaires) anciens sur Internet à beaucoup progressé ces dernières années. Voici un rapide panorama.

Les PDF des anciens travaux du Sénat

Découverte grâce à la recherche d’une juriste et le signalement d’un collègue documentaliste juridique, la page web en question s’appelle "Documents déposés au Sénat". Voici son adresse en clair : http://www.senat.fr/dossiers-legislatifs/depots/depots.html

Le contenu remonte au 9 décembre 1958, soit le début officiel de la Ve République et concerne les types de documents parlementaires Sénat (PAS Assemblée nationale) suivants :

  • projet de loi
  • proposition de loi
  • proposition de résolution
  • rapport législatif
  • rapport d’information
  • rapport de commission d’enquête.

Les documents parlementaires déposés au Sénat les plus récents sont également disponibles à partir cette page. Les documents ne sont pas classés par dossier législatif mais par session parlementaire puis par numéro de document (donc dans l’ordre de dépôt). Il faut donc un peu de Ctrl+F ou de googling pour retrouver ses petits.

Pour les débats (l’équivalent du JO Sénat Débats), c’est sur cette page-là, signalée par ma collègue Sandrine : Comptes rendus intégraux des séances de décembre 1958 à mai 1996. Son URL en clair : http://www.senat.fr/comptes-rendus-seances/5eme/seances/archiveSeances.html

Ces PDF-là ne sont pas liés au dossiers législatifs, contrairement aux textes déposés. Ils sont classés par année puis par mois, pas par session parlementaire.

C’est un discret mais énorme pas en avant de la part du Sénat dans la diffusion des données publiques juridiques. Mais attendons les critiques sur le format, qui je pense ne tarderont pas. Regards Citoyens aura certainement un commentaire. En tout cas, je n’ai pas vu de communiqué sur le site du Sénat.

Les PDF de l’Assemblée nationale

L’Assemblée nationale avait déjà mis en ligne (signalé par Gildas Berthelot du Service de documentation du Conseil constitutionnel) :

Sauf erreur de ma part, il manque toujours les rapports législatifs et les projets et propositions de loi déposés à l’Assemblée nationale pour la Ve République.

Les travaux législatifs de la loi de 1966 sur les sociétés commerciales deviennent ainsi partiellement accessibles en ligne à tout intéressé.

Dans les quatre cas, il s’agit de PDF image avec derrière le texte OCRisé. On peut donc ouvrir un document et chercher dedans. Et je suppose que Google est déjà en train d’indexer cela en détail.

Comme ce sont des données publiques, on peut considérer que si l’opération de diffusion en open data de plus de jurisprudence est de facto bloquée, celui des textes officiels, catégorie travaux préparatoires, a nettement progressé.

Merci à l’AN, merci au Sénat. Rappelons que lors de l’élaboration de la loi Lemaire, les députés avaient été invités à appliquer l’open data aux données des assemblées parlementaires, ce qui fut repoussé au nom de la séparation des pouvoirs. Ces mises en ligne ne sont pas exactement une réponse à cette incitation mais montrent le souci des assemblées parlementaires françaises de ne pas "rater le coche" de la diffusion et de l’open data des données juridiques publiques.

Les bases de données parlementaires actuelles déjà mises en open data

Ce souci de l’Open data s’était déjà exprimé auparavant. Les deux assemblées avaient déjà mis en place des sites pour diffuser leurs bases de données actuelles [31] :

  • en octobre 2013, ouverture de la Plateforme des données ouvertes du Sénat (data.senat.fr). Aujourd’hui, on peut y télécharger les bases Dossleg (Dossiers législatifs), Ameli (Amendements), Questions et Sénateurs. Poursuivant cette démarche, le Sénat vient de mettre en place un dispositif spécial à l’occasion du scrutin sénatorial de septembre 2017 [32] : les candidats puis les résultats des élections sénatoriales de septembre 2017 ont été rendus disponibles en open data en ligne.
  • en juin 2015, l’AN s’est lancé avec Data.Assemblee-nationale.fr [33]. Les jeux de données mis à disposition sont similaires à ceux du Sénat. Mentionnons bien clairement que dans les deux cas, la base Dossiers législatifs ne contient pas le texte intégral des documents parlementaires, mais leurs intitulés, dates, auteurs, liens etc.

Ne pas oublier les retraitements de ces données opérés par l’association Regards citoyens, disponibles sur les sites suivants :

Et la IIIe République ?

Pour les travaux parlementaires sous la IIIe République, il faut aller sur Gallica, le site d’ouvrages et revues anciens (hors droits d’auteur) scannés par la Bibliothèque nationale de France (BNF) :

Emmanuel Barthe
bibliothécaire documentaliste juridique


Utiliser Legifrance à 100%

Ou comment savourer chaque feuille du mille-feuilles

Vendredi 15 septembre 2017

Lire la suite »

Legifrance, une gourmandise ? Je n’irai peut-être pas jusque là ;-) mais un mille-feuilles, oui. Pourquoi un mille-feuilles ?

Des bases de données mélangées

Un mille-feuilles, d’abord, parce que Legifrance n’est pas un simple site web. C’est un produit très complexe, réalisé par un éditeur public, la DILA, et une importante SSII, Sword, avec des bases de données anciennes, dont plusieurs constituées à partir des années 60, combinées entre elles et dont le contenu et la structure diffèrent grandement [34].

Les seuls points communs entre ces bases de données :

  • c’est du juridique, pas des informations sur les entreprises (dites informations légales [35])
  • c’est de la donnée brute (à l’exception des abstracts et résumés de jurisprudence des bases CASS et JADE) et pas du commentaire.

Ces bases de données, de surcroît, sont dans plusieurs cas mélangées.

Principaux exemples de ces mélanges :

  • dans Jurisprudence judiciaire, sont en fait mélangées trois bases de données différentes :
    • CASS, autrement dit les arrêts publiés au Bulletin de la Cour de cassation
    • INCA, c’est-à-dire les arrêts INédits (non publiés au Bull. civ. et crim.) de la CAssation
    • et CAPP, une sélection importante d’arrêts de cours d’appel. CASS et CAPP sont elles mêmes extraites de la base Jurinet, un outil interne à la Cour de cassation)
  • dans Les autres textes législatifs et réglementaires se cachent en fait :
    • le Journal officiel édition Lois et décrets (texte intégral du JORF depuis 1998, mais sans les mesures nominatives)
    • le contenu des anciennes bases LEX (textes avant 1998) et REFLEX (liens entre les textes : tel décret applique telle loi, telle article de loi abroge tel autre ...)
    • la base LEGI des textes consolidés (mis à jour).

Une base non mélangée, en revanche :

  • Jurisprudence administrative est extraite d’une seule base tenue par le Conseil d’Etat appelée Ariane et devenue JADE pour Legifrance.

Non mélangée, mais quand même modifiée : les juridictions suprêmes ne fournissent pas leurs bases telles quelles : à part les descripteurs (appelés Titrage pour la Cour de cassation), la plupart des enrichissements, notamment les liens et les rapports pré-décision, sont retirés.

A ce jour, sont exclues du contenu de Legifrance, les décisions de la Cour des comptes et des chambres régionales des comptes (CRC). Elles sont toutefois accessibles par le biais du site de la Cour des Comptes.

Des trucs de recherche méconnus

Un mille-feuilles, secundo, parce que les meilleures fonctionnalités de recherche de Legifrance sont bien cachées.

Les "trucs" suivants sont méconnus. Alors même qu’ils permettent d’exploiter Legifrance à 100%.

Conseils généraux

- N’hésitez pas à passer d’abord par Google pour une recherche de texte officiel ou de jurisprudence des cours suprêmes. Legifrance étant aujourd’hui très bien indexé par Google, si le document recherché est présent dans Legifrance, il y a de fortes chances pour que Google vous le trouve. Vous pouvez même cibler uniquement Legifrance en utilisant le champ site. Il suffit d’ajouter site:legifrance.gouv.fr à la fin de vos requêtes Google (pas d’espace entre site, les deux points et le nom de domaine).

- Utilisez de préférence l’interface de recherche experte plutôt que la recherche simple. Surtout si vous êtes un juriste ou un documentaliste.
C’est une règle générale des bases de données : ici comme ailleurs, utiliser la recherche avancée vous garantit d’avoir accès à la totalité du contenu de la base de données et à la totalité des fonctionnalités de recherche. Et dans Legifrance, non seulement de nombreuses fonctionnalités de recherche ne sont disponibles qu’en recherche experte, mais certaines informations aussi, comme — nous allons le voir infra — en matière de concordance entre un nouvel article de Code et son ancienne version et pour accéder aux versions futures (non encore entrées en vigueur) d’un article de Code.

- Dans le champ Mots-clés, si vous tapez vos termes sans réglage spécial, ils seront recherchés à 10 mots l’un de l’autre. Vous êtes, sans le savoir, en train d’utiliser ce qu’on appelle un opérateur de proximité.
C’est particulièrement efficace en recherche de jurisprudence car les arrêts inédits sont non enrichis en abstracts et peu structurés. Il faut donc compenser ce manque d’information riche et pertinente par une utilisation plus fine du texte intégral des arrêts.

Jurisprudence

- Si vous êtes en jurisprudence et que vous voulez que *tous* vos résultats soient dans un sujet précis (par exemple la responsabilité civile) et ainsi les rendre plus pertinents et réduire le nombre à passer en revue, la fonctionnalité de recherche reine est le plan de classement de la jurisprudence.
En jurisprudence judiciaire, il s’appelle Titrage, il est accessible en bas de l’interface de recherche experte, il ne couvre vraiment que les arrêts de la Cour de cassation publiés au Bulletin et manque de rigueur [36]. En jurisprudence administrative, il s’appelle Plan de classement de la jurisprudence administrative (PCJA), et là, en revanche, il est très rigoureux et les publicistes l’utilisent volontiers pour cibler correctement une recherche.
Ces plans de classement ne sont repris par aucune plateforme d’éditeur (c’est bien dommage), ils constituent une exclusivité Legifrance.
Deux particularités à ne pas oublier dans le fonctionnement des plans de classement :

  • lorsque vous choisissez cette option de recherche, pour que la fonction "Recherche" soit effective, n’oubliez pas de choisir un élément dans le pavé "Décision" ou dans le pavé "Etendue de la recherche"
  • dans la recherche par le titrage, le déroulement de l’arborescence s’effectue en cliquant sur un des termes proposés ou sur la petite croix noire. La sélection de la recherche se réalise en cochant la petite case (le petit carré blanc) placée devant le terme choisi.

- En jurisprudence, les noms de personnes physiques sont anonymisés, mais seulement ceux-là :

  • il est donc impossible de chercher un arrêt par le nom de la partie personne physique
  • en revanche, il est possible de trouver la décision par la dénomination des personnes morales (nom de société) ou le patronyme d’un auxiliaire de justice, car ils sont exclus du périmètre de l’anonymisation.

- Dans l’interface de recherche de la jurisprudence judiciaire, le numéro d’affaire (dit n° de pourvoi) s’écrit sans le point : 05-20111 et non 05-20.111.

- Pour chercher un arrêt de la Cour de cassation par son numéro de Bulletin (Bull. Civ. Bull. Crim.), bien penser à cocher "Décisions de la Cour de cassation", au préalable, avant la sélection d’autres rubriques pour éviter un trop grand nombre de réponses. Là aussi, cette possibilité de chercher par la référence de publication au Bulletin des arrêts de la Cour n’a pas été reprise par les moteurs de recherche de jurisprudence des plateformes des éditeurs. C’est donc une exclusivité Legifrance.

- Si vous voulez connaître le délai de chargement des décisions de justice sur Legifrance : une fois sur l’interface de recherche, cliquez en haut à droite sur le lien Mise à jour.

Textes officiels

- Pour chercher un article de code dans les textes officiels et les Codes, il faut l’écrire sans espace (et sans l’astérisque le cas échéant) entre la lettre et les chiffres [37]. Exemples : L511-1 ou R123-18.

- La base dénommée "Autres textes législatifs et réglementaires" et celle des Codes permettent d’obtenir la version à jour (on dit "consolidée") d’un texte (loi, ordonnance ou décret) ou d’un article de Code non seulement au jour d’aujourd’hui mais aussi à une date donnée. En clair : Legifrance peut reculer dans le temps.
Pour cela, une fois un texte trouvé, il faut aller dans la colonne de gauche intitulée "Navigation" et, sous la mention "Version consolidée à la date du ...", saisir la date et cliquer sur "Consulter".
Toutefois, cette fonctionnalité ne marche pas toujours et surtout, elle ne peut pas fonctionner sur les années ’70 et antérieures. De plus, sur de longs textes de réforme comme par exemple la loi NRE de 2001 [38], la version consolidée peut ressembler à un véritable gruyère. En effet, le plus souvent, le texte affiché est littéralement troué de partout : la plupart des articles se contentant de modifier des articles de Codes déjà existant, la version consolidée ne fait donc que renvoyer à ces articles de Codes par lien hypertexte, au lieu de les afficher Si on s’intéresse à plus que quelques articles, c’est peu pratique et frustrant.

- Les tables des matières des codes sont parfois modifiées à l’issue d’une refonte ou d’une création de code. Dans ce cas, une table de concordance indique les correspondances entre l’ancienne numérotation et la nouvelle numérotation et inversement.
Ces tables de concordance sont accessibles par deux chemins différents dans Legifrance :

- La concordance d’un article de code en particulier se retrouve dans les mentions Anciens/Nouveaux articles présents sous l’article consulté en recherche experte ou après avoir cliqué sous la mention "En savoir plus sur cet article" située à côté de chaque numéro d’article en recherche experte.

- Un article nouveau de Code avec une entrée en vigueur différée dans le temps (il n’a donc pas encore d’existence juridique) est consultable uniquement par le biais de la recherche experte.

- La recherche par thème (plus précisément, par descripteur) est possible dans les textes officiels et les Codes grâce au thésaurus Sarde. Elle est accessible au centre de la page d’accueil en tapant un ou des mots-clés dans la zone de saisie sous "Recherche thématique sur la législation et la réglementation en vigueur".

- Legifrance offre la possibilité de rechercher les mesures de transposition adoptées par la France pour chaque directive européenne (la transposition est une sorte de traduction en droit national des dispositions de la directive). A partir d’un texte européen, le texte transposé en droit français se recherche par la rubrique Recherche des mesures de transposition des directives européennes. Il suffit de taper le numéro de la directive (ex. : 2000-10) ou, à défaut, sa date de signature ou de publication et/ou un ou plusieurs mots significatifs. de rechercher les références des textes législatifs et réglementaires nationaux qui ont été expressément notifiés par la France aux services de la Commission européenne comme mesure nationale d’exécution (base MNE) [39].
Hélas, la base des MNE n’est pas souvent à jour, car elle dépend justement de notifications officielles.

- Conventions collectives. Plutôt que de chercher par mot-clés dans les CCN, il vaut nettement mieux afficher directement le texte de base de la convention recherchée : il est alors moins difficile de trouver le point précis de la CCN qui vous intéresse, grâce notamment au sommaire, d’autant plus que s’affiche alors dans la colonne de gauche un filtre pour les questions usuelles les plus fréquentes (durée des congés payés, congés exceptionnels, durée de la période d’essai, préavis, indemnités de licenciement)

- Voir aussi notre article paru sur ce blog en 2009 sur le même sujet : Un "tuto" pour la recherche de textes officiels sur Legifrance.

Avertissement

Attention toutefois :

- Le moteur de recherche de Legifrance parfois donne des résultats illogiques. Ne pas hésiter alors à effacer la recherche et la reprendre à zéro. Si cette "réinitialisation" ne change rien, simplifiez votre requête ou allez carrément sur une plateforme payante d’éditeur.

- En cas de grosse réforme, la mise à jour des Codes et autres textes consolidés modifiés peut prendre plusieurs jours.

- Les échéanciers des décrets d’application (dans les dossiers législatifs, loi par loi) ne sont pas forcément mis à jour le jour même de la publication du décret. Ainsi le decret d’application sur les licences open data de la loi Lemaire a été publié le 27 avril 2017 et le 28 il n’était pas dans l’échéancier.

En savoir plus : l’Aide et les ateliers de Legifrance

Comme le rappelle ma collègue Carole Guelfucci [40] :

Emmanuel Barthe
bibliothécaire documentaliste juridique, spécialiste des données publiques juridiques
formateur à la recherche documentaire en droit


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 71

Dernières brèves