L’or noir de la data

Open data, le désenchantement

Le cas de l’open data judiciaire

Mercredi 5 mai 2021, par Emmanuel Barthe // Portails juridiques officiels - Diffusion des données juridiques publiques

L’arrêté publiant le calendrier de l’open data des décisions de justice vient d’être publié au JO [1]. Le mouvement français pro-open data peut triompher, même si les dates du calendrier étaient prévisibles de longue ... date.

Cette étape dans l’avancée de l’open data [2] en France m’inspire des sentiments mitigés.

Sommaire

Retour sur la mission Bothorel
Contraindre l’administration à l’open data est-elle une politique efficace ?
Open data des décisions de justice c/ sélection
Open data judiciaire et common law
Désenchantement

Retour sur la mission Bothorel

Mais revenons un peu en arrière. La mission Bothorel Politique publique de la donnée avait lancé une consultation en ligne, qui a donné lieu à un rapport remis en décembre 2020.

J’ai hésité à participer à cette consultation. Et si j’avais dû y participer, c’aurait été de manière très sélective, voire critique. J’ai choisi de ne pas y participer. De toute façon, on sentait bien que l’orientation du rapport était déjà prévue, et je ne voyais pas non plus disparaître du jour au lendemain les blocages que le rapport allait immanquablement dénoncer.

Sur la forme, on sentait la tentative de filiation avec l’initiative République numérique, la consultation qui a précédé le projet de loi Lemaire de 2016 qui a forcé l’open data judiciaire [3]. Mais, là, le délai (1 mois seulement), le manque quasi-total d’argumentation dans les contributions, le manque de débat et la présence dominante des groupes d’intérêts donnaient l’impression d’un exercice de peu de portée, contrairement au rapport Trojette de 2013 et à la loi de 2016. Enfin, la lettre de mission parlait des données d’intérêt général. Or dans les retours, on ne dressait que les pourtours et les freins de l’open data en général.

J’étais d’accord avec un des contributeurs à la consultation : oui, les textes législatifs et réglementaires sur l’open data sont peu appliqués. Mais il y a tant de textes non appliqués : faut-il vraiment faire appliquer ceux-ci ? Pourquoi ne se pose-t-on pas la question suivante : pourquoi ne sont-ils pas appliqués ?

Contraindre l’administration à l’open data est-elle une politique efficace ?

Prenons un exemple : les collectivités — entre autres — ont bien d’autres urgences (et soucis financiers en ce moment [4]) pour qu’on vienne les embêter avec l’open data. C’est du moins ce que l’application concrète de la loi NOTRe du 7 août 2015 a montré. Cette loi a d’ailleurs été modifiée en conséquence, comme je l’ai écrit ici [5], par la loi Lemaire (octobre 2016) et un décret d’application de celle-ci. Et malgré cela, les collectivités renâclent toujours.

Il y a aussi à mon sens une question de priorité. On est déjà en retard sur les data des ministères, alors si on veut que les collectivités suivent un exemple, il faudrait peut-être d’abord finir de persuader et convertir les ministères, AAI et autres autorités centrales, non ?

Or, dès la page de présentation de la mission Bothorel, on parlait de « blocages ». Donc 1. de problèmes et en conséquence 2. de forcer la main des administrations si je comprends bien.

Ca se vérifie dans les contributions. Une de celles-ci proposait de renforcer les moyens de la CADA. Une bonne idée en apparence, la CADA étant en effet débordée et ayant pris beaucoup de retard pour rendre ses avis. Mais la CADA, c’est un peu le policier de l’open data, sans armes certes (elle rend des avis, pas des décisions). Donc c’est de la contrainte quand même et de l’aval. Pas de la conviction ni de l’amont. Le sociologue Michel Crozier a écrit (et largement démontré) : « On ne change pas la société [française] par décret ». Eh bien, l’administration, surtout en France, est une forme de société et il est (tentant mais) illusoire d’espérer la changer par décret. Par exemple, l’ouvrage de Raphaëlle Bacqué L’Enfer de Matignon montre selon plusieurs Premiers ministres la lenteur de l’administration à appliquer les réformes, malgré leurs efforts.

Une autre contribution propose proposait « d’obliger les acteurs publics à informer les utilisateurs de leurs data de toute évolution à venir sur le format des données produites puis d’inciter les producteurs publiques à inclure les utilisateurs de data dans leurs réflexions sur l’évolution des données ». Là aussi, on sent bien l’idée derrière : contraindre l’administration.

Or ce que les heurs (CASS, INCA, JADE, CONSTIT) et malheurs (Juridice, JuriCA etc.) de l’open data des décisions de justice montrent très bien, c’est que sans moyens financiers, informatiques et humains importants et sans architecture technique et informatique cohérente (production et GED, balisage, formats de documents, unification des formats etc.), mais aussi sans intérêt propre à l’administration (par exemple, pour la Cour de cassation, un des intérêts de produire les bases CASS et plus tard INCA a été de pouvoir interroger puis diffuser sa propre jurisprudence), l’open data est un voeu pieux ou très partiel ou raté (au choix). Même le rapport d’étape de la mission Bothorel faisait ce constat d’un investissement insuffisant. Mais un constat n’est pas une ligne budgétaire. Et si une des contributions-propositions faites à la mission consistait à rédiger un guide pour unifier les formats, elle ne proposait pas de partir des formats existants ni de s’appuyer sur les besoins des administrations.

Soyons honnêtes : avec la disette budgétaire renforcée depuis la révision générale des politiques publiques (RGPP) apparue sous Dominique de Villepin (devenue modernisation de l’action publique, MAP), les licences payantes abondant le budget de l’administration productrice des données "vendues" répondraient en bonne part à ce problème d’incentive. Sans cette rentrée d’argent, je doute par exemple que la base JuriCA ait été maintenue jusqu’à aujourd’hui par la Cour de cassation.

Même si depuis le rapport Trojette (2013), le gouvernement privilégie nettement les licences gratuites, la loi française autorise encore un « retour sur investissement raisonnable » (RIR) [6]. De plus, le Conseil d’Etat avait développé une jurisprudence sur la tarification au coût qui permettait d’éviter les abus tarifaires et les évictions du marché [7].

Cela dit, il y a d’autres incentives que l’argent pour des administrations. Pour une institution de haut niveau, augmenter son influence, améliorer sa communication, perfectionner l’analyse de son action, par exemple.

Sans intérêt bien compris de l’administration, l’open data est un voeu pieux. Si le GFII propose un open data des entreprises contre leur indemnisation, pourquoi donc l’administration devrait-elle faire plus d’open data — et a fortiori un open data de qualité — avec moins ?

Même aux USA pays d’origine du mouvement Open data, en open data des décisions de justice, on ne va pas aussi loin.

Pour fournir des data de qualité (bien formatées, bien balisées, sans erreur, à jour), les administrations auraient besoin qu’on leur montre ce qu’elles ont à y gagner. Et comme c’est d’un changement culturel dont on parle, il faudrait les y former et en prendre le temps.

Open data des décisions de justice c/ sélection

L’open data des décisions de justice devrait devenir réalité en 2026. Y gagnera-t-on une meilleure compréhension du droit positif ?

La masse (plus de 4 millions de décisions par an) nécessitera en tout cas de renforcer les efforts de sélection et d’enrichissement en méta-données raisonnées, comme par exemple les répertoires de jurisprudence (Bull. Civ., Bull. Cass., Recueil Lebon) ou les plans de classement de la jurisprudence de la Cour et du Conseil d’Etat [8]. Cela suffira-t-il ? Le Bulletin de la Cour a actuellement plus de trois ans de retard ne publie que 10% des arrêts de la Cour ... Les legal tech de la justice dite prédictive estiment que les particuliers pourront mieux évaluer leurs chances de succès et donc plus aisément transiger, gagnant ainsi du temps et économisant des frais d’avocats. Probable, mais est-ce si certain ? N’aurait-il pas mieux valu ne publier qu’une sélection — ce que font plusieurs pays ? [9]

Une chose est certaine : cet open data va créer des revenus pour les éditeurs et les legal tech et il va créer des postes chez ces mêmes structures et dans les juridictions suprêmes. Les entrepreneurs d’intérêt général (IEG) de la Cour de cassation ne sont pas près de partir, je pense. Et l’open data nécessite un analyste informatique au SDER.

Open data judiciaire et common law

L’open data judiciaire va-t-il faire entrer le droit anglo-saxon et ses mécanismes (common law, case law, stare decisis) dans le droit français ? Autrement dit, va-t-il fragiliser la loi en faisant de la jurisprudence une source du droit beaucoup plus forte et faire de la France un pays de common law ? C’est une question parfois posée, notamment par les barreaux de province et les cabinets d’avocats d’affaires franco-français.

Ma réponse de Normand (que je ne suis pas) : un peu. Et : oui et non. En clair : pas trop, car le mouvement ne vient pas du droit lui-même, et tout dépend du domaine (juridique).

À mon humble avis, l’influence du droit anglo-saxon sur le droit français n’est bien réelle qu’en droit des affaires, surtout en ingénierie juridico-fiscale financière. Donc dans le domaine des contrats d’affaires, et sauf dans le monde OHADA.

Trois conclusions émergent à la lecture du peu de littérature disponible sur ce sujet étroit [10]. Selon Béatrice Castellane, Laurent Cohen-Tanugi et la BICCL :

  • la domination du droit anglo-saxon a plus à voir avec la domination et le dynamisme de l’économie américaine dont les innovations commerciales, économiques et financières s’imposent un peu partout dans le monde, qu’avec les particularités de notre droit
  • depuis la Révolution de 1789, la jurisprudence est montée en importance en France et les points communs entre droit français/continental et droits anglo-saxons se sont accrus. Cf notamment la progression du droit écrit et de la codification en droit anglo-saxon mais aussi la façon dont la jurisprudence française en matière de responsabilité civile non-contractuelle ("tort") a créé un corps de règles protégeant des droits émergents
  • l’intervention des juges dans le contrat (interprétation par la recherche de l’intention des parties) et la protection des consommateurs et de la partie faible est plus marquée en France que dans le monde anglo-saxon.

Personnellement, je trouve le droit français des particuliers particulièrement immune à cette influence. Mais moins depuis la fin des années 2000 avec le commerce électronique qui soumet de plus en plus les particuliers à des contrats qui sont généralement des traductions voire au mieux des adaptations en droit français. Sauf que le droit français de la consommation est d’ordre public. Mais encore faut-il que le consommateur ou une association attaque en justice ...

Désenchantement

Soyons clair : ni open access ni open data ne vont résoudre tous les problèmes de la science et du management des collectivités d’un coup de baguette magique. Ces mouvements ou en tout cas leur résultante me font de plus en plus penser à un miroir aux alouettes. Ils semblent naturels ("on l’a payé avec nos impôts") et promettent monts et merveilles (transparence, lutte contre la corruption, nouvel or noir de la data). Mais primo, les conseilleurs ne sont pas les payeurs : concrètement, ce sont les collectivités et l’Etat qui payent la production de la data, pas les tech ni les éditeurs. Et secundo, les bénéficiaires ne sont pas forcément ceux (les citoyens) à qui les fondateurs et penseurs de ces mouvements pensaient au départ [11].

Open access et open data n’ont plus la même magie, ils ont trop manqué leurs objectifs annoncés (open access [12]) et ont été trop menés vers des fins qui ont plus à voir avec l’alimentation d’une industrie de l’information qu’avec la transparence et les services pratiques rendus aux citoyens (open data). Le Groupement français des industries de l’information (GFII), dont je respecte l’expertise technique, ne s’en cache pas, dans ses contributions au rapport Bothorel. L’industrie de l’information est d’ailleurs largement à l’origine de l’open data en Europe puisque c’est en partie à son lobbying [13] que l’on doit la première directive européenne sur le sujet [14].

Mes positions sur l’open data [15] ont évolué. J’ai touché du doigt les problèmes concrets, les limites, les problèmes budgétaires, le manque d’ "incentives". Tant en échangeant avec les acteurs qu’en travaillant au SDER de la Cour de cassation en 2016 et dans les groupes de travail d’Open Law en 2014-2015. J’ai vu aussi que la data brute, aussi bonne soit sa qualité, ne sera que rarement réutilisable telle quelle par les citoyens, à l’exception des rapports officiels. A rapprocher de mon désenchantement vis-à-vis d’Internet, comme l’écrit Romain Badouard [16].

Il m’est difficile aujourd’hui de défendre des projets d’open data qui ne sont pas mûrs et/ou se font contre et sans les organisations publiques. Si les mirages peuvent faire avancer dans le désert, ils ne trompent que ceux dont le jugement est déjà trompé par la soif. Surtout, ils ne désaltèrent pas. La data n’est pas de l’eau.

Mais, comme le pétrole, elle peut constituer une nouvelle industrie et un nouvel or noir. Et c’est bien pour ça qu’on la fait émerger. Et beaucoup moins pour son "utilité citoyenne".

Emmanuel Barthe
documentaliste juridique, veilleur, formateur, spécialiste des données publiques juridiques

Notes de bas de page

[2Open data que l’on peut définir comme la diffusion et la réutilisation libres et gratuites des données publiques. Pour aller plus loin, lire : Open data définition : qu’est-ce que c’est ? A quoi ça sert ?, Le Big Data, 5 novembre 2019.

[3Rappelons que les dispositions sur l’open data judiciaire dans le projet de loi Lemaire n’étaient pas présentes dans le texte initial du Gouvernement et n’avaient de toute évidence pour origine ni la Chancellerie ni la Cour de cassation ni des parlementaires.

[4Suppression ou baisse par plusieurs réformes des revenus procurés par les impôts locaux, sans compter la baisse de longue date de la dotation globale de fonctionnement (DGF). A quoi s’ajoute les dépenses supplémentaires dûes à la crise sanitaire et les rentrées diminuées dûes à la baisse d’activité des entreprises.

[7Sur l’ancien régime français de réutilisation des données publiques : Le nouveau régime juridique de la réutilisation des informations publiques, par Bruno Ricard, Droit(s) des archives,
16 mai 2017, Données publiques : les licences ont failli devenir gratuites sur ce blog, 29 juin 2012.

[8Appelé plan de classement de la jurisprudence administrative (PCJA) pour le Conseil d’Etat.

[9Penser les finalités de la nécessaire ouverture des bases de données de jurisprudence, intervention de Jean-Paul Jean, président de chambre à la Cour de cassation, directeur du Service de documentation, des études et du rapport (SDER), colloque « La jurisprudence dans le mouvement de l’open data », Cour de cassation, 14 octobre 2016. Extrait (le gras est de nous) :
« L’open data, entre service public et marché
Toutes ces décisions présentent-elle un intérêt pour la diffusion de la jurisprudence ? Est-il plus simple de tout traiter de façon quasi-automatisée, ce qui fera le bonheur des start-ups qui feront tourner les logiciels et les algorithmes de plus en plus sophistiqués, sur des niches d’information les plus diverses qui intéresseront des clients pour un service payant correspondant à des besoins spécifiques, qui peuvent ne pas être uniquement juridiques ?
Ou bien, est-il souhaitable et peut-on réellement cibler ce qui constitue la finalité première, la diffusion de la jurisprudence pour aider à la régulation par le droit, et donc sélectionner les décisions ? Le comité des ministres du Conseil de l’Europe, dans une recommandation de 1995 préconisait d’ailleurs une sélection des décisions afin "d’éviter l’accumulation d’informations inutiles" (Recommandation n° R (95) 11 du comité des ministres aux Etats membres relative à la sélection, au traitement, à la présentation et à l’archivage des décisions judiciaires dans les systèmes de documentation juridique automatisé).
Le fait qu’une décision judiciaire soit rendue en audience publique est une chose, qu’elle soit remise aux parties en est une autre, qu’elle soit diffusée publiquement et notamment sur Internet, en est une troisième ; qu’elle soit retraitée avec des millions d’autres via les algorithmes des moteurs de recherche nous fait entrer dans une nouvelle dimension dont nous ne pouvons pas mesurer aujourd’hui l’ampleur des conséquences. Les services proposés se démultiplient aujourd’hui dans le marché de l’information juridique et judiciaire, bien au-delà des seuls domaines de la banque ou de l’assurance, et plus généralement chez les acteurs intéressés à l’évaluation des risques par les calculs de probabilité et l’analyse actuarielle. »

[10Case Law in a Legal System Without Binding Precedent : The French Example, par Laurent Cohen-Tanugi, avocats et visiting lecturer, Stanford Law School, 2016. Case Law in France, par Marc Ancel, Journal of Comparative Legislation and International Law, Vol. 16, No. 1 (1934), pp. 1-17 (pas de texte intégral gratuit). Continental Civil Law v Common Law in International Contractual Disputes, par Béatrice Castellane, présidente honoraire de la Franco-British Lawyers Society, 22 janvier 2018. Introduction to French tort law, BICCL.

[11L’open data peut-il (encore) servir les citoyens ?, par Samuel Goëta et Clément Mabi, Mouvements 2014/3 (n° 79), pp. 81-91.

[12Les éditeurs en sciences pures ont simplement basculé une bonne moitié de leurs revues en open access, gagnant ainsi sur les deux tableaux. Les éditeurs en SHS sont plus hésitants, mais pourraient bien en faire autant.

[14Directive 2003/98 du 17 novembre 2003 concernant la réutilisation des informations du secteur public, transposée en droit français par l’ordonnance n° 2005-650 du 6 juin 2005 relative à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques.

[15Ex-réutilisation des informations du secteur public, ex-réutilisation des données publiques.

[16Le désenchantement de l’internet. Désinformation, rumeur et propagande, par Romain Badouard, FYP éditions, 2017, coll. Présence/Questions de société. Chez le même éditeur, lire également Le startupisme : Le fantasme technologique et économique de la startup nation, par Antoine Gouritin.

Répondre à cet article