L’or noir de la data pour les entreprises. Et pour les administrations ?

Open data, le désenchantement

Le cas de l’open data judiciaire

Mardi 6 juillet 2021, par Emmanuel Barthe // Portails juridiques officiels - Diffusion des données juridiques publiques

L’arrêté publiant le calendrier de l’open data des décisions de justice a été publié au JO ce printemps [1]. Le mouvement français pro-open data peut triompher, même si les dates du calendrier étaient prévisibles de longue ... date.

Cette étape dans l’avancée de l’open data [2] en France m’inspire des sentiments mitigés. L’occasion d’une analyse critique de l’open data en France sous un angle classique en politique : qui y gagne ?

Sommaire

Retour sur la mission Bothorel
Contraindre l'administration à l'open data est-elle une politique efficace ?
Améliorer la connaissance ?
Open data des décisions de justice c/ sélection
Open data judiciaire et common law
Désenchantement

Retour sur la mission Bothorel

Mais revenons un peu en arrière. La mission Bothorel Politique publique de la donnée avait lancé une consultation en ligne, qui a donné lieu à un rapport remis en décembre 2020.

J’ai hésité à participer à cette consultation. Et si j’avais dû y participer, c’aurait été de manière très sélective, voire critique. J’ai choisi de ne pas y participer. De toute façon, on sentait bien que l’orientation du rapport était déjà prévue, et je ne voyais pas non plus disparaître du jour au lendemain les blocages que le rapport allait immanquablement dénoncer.

Sur la forme, on sentait la tentative de filiation avec l’initiative République numérique, la consultation qui a précédé le projet de loi Lemaire de 2016 qui a forcé l’open data judiciaire [3]. Mais, là, le délai (1 mois seulement), le manque quasi-total d’argumentation dans les contributions, le manque de débat et la présence dominante des groupes d’intérêts donnaient l’impression d’un exercice de peu de portée, contrairement au rapport Trojette de 2013 et à la loi de 2016. Enfin, la lettre de mission parlait des données d’intérêt général. Or dans les retours, on ne dressait que les pourtours et les freins de l’open data en général.

J’étais d’accord avec un des contributeurs à la consultation : oui, les textes législatifs et réglementaires sur l’open data sont peu appliqués. Mais il y a tant de textes non appliqués : faut-il vraiment faire appliquer ceux-ci ? Pourquoi ne se pose-t-on pas la question suivante : pourquoi ne sont-ils pas appliqués ?

Contraindre l’administration à l’open data est-elle une politique efficace ?

Prenons un exemple : les collectivités — entre autres — ont bien d’autres urgences (et soucis financiers en ce moment [4]) pour qu’on vienne les embêter avec l’open data. C’est du moins ce que l’application concrète de la loi NOTRe du 7 août 2015 a montré. Cette loi a d’ailleurs été modifiée en conséquence, comme je l’ai écrit ici [5], par la loi Lemaire (octobre 2016) et un décret d’application de celle-ci. Et malgré cela, les collectivités renâclent toujours.

Il y a aussi à mon sens une question de priorité. On est déjà en retard sur les data des ministères, alors si on veut que les collectivités suivent un exemple, il faudrait peut-être d’abord finir de persuader et convertir les ministères, AAI et autres autorités centrales, non ?

Or, dès la page de présentation de la mission Bothorel, on parlait de « blocages ». Donc 1. de problèmes et en conséquence 2. de forcer la main des administrations si je comprends bien.

Ca se vérifie dans les contributions. Une de celles-ci proposait de renforcer les moyens de la CADA. Une bonne idée en apparence, la CADA étant en effet débordée et ayant pris beaucoup de retard pour rendre ses avis. Mais la CADA, c’est un peu le policier de l’open data, sans armes certes (elle rend des avis, pas des décisions). Donc c’est de la contrainte quand même et de l’aval. Pas de la conviction ni de l’amont. Le sociologue Michel Crozier a écrit (et largement démontré) : « On ne change pas la société [française] par décret ». Eh bien, l’administration, surtout en France, est une forme de société et il est (tentant mais) illusoire d’espérer la changer par décret. Par exemple, l’ouvrage de Raphaëlle Bacqué L’Enfer de Matignon montre selon plusieurs Premiers ministres la lenteur de l’administration à appliquer les réformes, malgré leurs efforts.

Une autre contribution propose proposait « d’obliger les acteurs publics à informer les utilisateurs de leurs data de toute évolution à venir sur le format des données produites puis d’inciter les producteurs publiques à inclure les utilisateurs de data dans leurs réflexions sur l’évolution des données ». Là aussi, on sent bien l’idée derrière : contraindre l’administration.

Or ce que les heurs (CASS, INCA, JADE, CONSTIT) et malheurs (Juridice, JuriCA etc.) de l’open data des décisions de justice montrent très bien, c’est que sans moyens financiers, informatiques et humains importants et sans architecture technique et informatique cohérente (production et GED, balisage, formats de documents, unification des formats etc.), mais aussi sans intérêt propre à l’administration (par exemple, pour la Cour de cassation, un des intérêts de produire les bases CASS et plus tard INCA a été de pouvoir interroger puis diffuser sa propre jurisprudence), l’open data est un voeu pieux ou très partiel ou raté (au choix). Même le rapport d’étape de la mission Bothorel faisait ce constat d’un investissement insuffisant. Mais un constat n’est pas une ligne budgétaire. Et si une des contributions-propositions faites à la mission consistait à rédiger un guide pour unifier les formats, elle ne proposait pas de partir des formats existants ni de s’appuyer sur les besoins des administrations.

Soyons honnêtes : avec la disette budgétaire renforcée depuis la révision générale des politiques publiques (RGPP) apparue sous Dominique de Villepin (devenue modernisation de l’action publique, MAP), les licences payantes abondant le budget de l’administration productrice des données "vendues" répondraient en bonne part à ce problème d’incentive. Sans cette rentrée d’argent, je doute par exemple que la base JuriCA ait été maintenue jusqu’à aujourd’hui par la Cour de cassation.

Même si depuis le rapport Trojette (2013), le gouvernement privilégie nettement les licences gratuites, la loi française autorise encore un « retour sur investissement raisonnable » (RIR) [6]. De plus, le Conseil d’Etat avait développé une jurisprudence sur la tarification au coût qui permettait d’éviter les abus tarifaires et les évictions du marché [7].

Cela dit, il y a d’autres incentives que l’argent pour des administrations. Pour une institution de haut niveau, augmenter son influence, améliorer sa communication, perfectionner l’analyse de son action, par exemple.

Sans intérêt bien compris de l’administration, l’open data est un voeu pieux. Si le GFII propose un open data des entreprises contre leur indemnisation, pourquoi donc l’administration devrait-elle faire plus d’open data — et a fortiori un open data de qualité — avec moins ? Car le problème de la qualité des données disponibles en open data est réel : il suffit de lire ce bilan publié par les équipes de data.gouv.fr elles-mêmes [8]. Je cite : « Il existe une problématique de qualité des réutilisations. On retrouve ici une certaine similitude avec les problématiques rencontrées sur la qualité des données. »

Même aux USA pays d’origine du mouvement open data, en open data des décisions de justice, on ne va pas aussi loin.

Pour fournir des data de qualité (bien formatées, bien balisées, sans erreur, à jour), les administrations auraient besoin qu’on leur montre ce qu’elles ont à y gagner. Et comme c’est d’un changement culturel dont on parle, il faudrait les y former et en prendre le temps.

Améliorer la connaissance ?

Il est également nécessaire de démystifier le rôle des intermédiaires et particulièrement des entreprises de la tech et de leurs représentants.

Selon beaucoup de ses partisans [9], comme Jean-Marc Lazard (Opendatasoft), l’open data « est une façon de redistribuer la connaissance » [10].

Je dirais les choses autrement :

  • le grand public ne peut pas exploiter la data seul, il faut des sociétés (parfois des bénévoles, comme Guillaume Rozier sur les données sur le Covid-19 avec son site Covid Tracker) et ensuite des journalistes ou des professionnels du secteur pour analyser les données
  • il faut aussi des associations/groupes d’intérêts (tels par exemple la French Tech ou Regards Citoyens, auteur du site Nos Députés) et sociétés pour pousser à la roue. C’est leur intérêt et ça contribue au mouvement
  • l’open data est d’abord et essentiellement une façon de redistribuer la donnée — et les richesses économiques qu’elle permet par son exploitation, comme le montrent d’ailleurs différents argumentaires publiés par le Groupement français pour l’industrie de l’information (GFII) qui regroupe les éditeurs de bases de données français
  • l’open data n’est donc pas une façon directe de redistribuer la connaissance, mais il peut participer indirectement et à long terme à l’amélioration de la connaissance.

Open data des décisions de justice c/ sélection

L’open data des décisions de justice devrait devenir réalité en 2026. Y gagnera-t-on une meilleure compréhension du droit positif ?

La masse (plus de 4 millions de décisions par an) nécessitera en tout cas de renforcer les efforts de sélection et d’enrichissement en méta-données raisonnées, comme par exemple les répertoires de jurisprudence (Bull. Civ., Bull. Cass., Recueil Lebon) ou les plans de classement de la jurisprudence de la Cour et du Conseil d’Etat [11]. Cela suffira-t-il ? Le Bulletin de la Cour a actuellement plus de trois ans de retard ne publie que 10% des arrêts de la Cour ... Les legal tech de la justice dite prédictive estiment que les particuliers pourront mieux évaluer leurs chances de succès et donc plus aisément transiger, gagnant ainsi du temps et économisant des frais d’avocats. Probable, mais est-ce si certain ? N’aurait-il pas mieux valu ne publier qu’une sélection — ce que font plusieurs pays ? [12]

Une chose est certaine : cet open data va créer des revenus pour les éditeurs et les legal tech et il va créer des postes chez ces mêmes structures et dans les juridictions suprêmes. Les entrepreneurs d’intérêt général (IEG) de la Cour de cassation ne sont pas près de partir, je pense. Et l’open data nécessite un analyste informatique au SDER.

Open data judiciaire et common law

L’open data judiciaire va-t-il faire entrer le droit anglo-saxon et ses mécanismes (common law, case law, stare decisis) dans le droit français ? Autrement dit, va-t-il fragiliser la loi en faisant de la jurisprudence une source du droit beaucoup plus forte et faire de la France un pays de common law ? C’est une question parfois posée, notamment par les barreaux de province et les cabinets d’avocats d’affaires franco-français.

Ma réponse de Normand (que je ne suis pas) : un peu. Et : oui et non. En clair : pas trop, car le mouvement ne vient pas du droit lui-même, et tout dépend du domaine (juridique).

À mon humble avis, l’influence du droit anglo-saxon sur le droit français n’est bien réelle qu’en droit des affaires, surtout en ingénierie juridico-fiscale financière. Donc dans le domaine des contrats d’affaires, et sauf dans le monde OHADA.

Trois conclusions émergent à la lecture du peu de littérature disponible sur ce sujet étroit [13]. Selon Béatrice Castellane, Laurent Cohen-Tanugi et la BICCL :

  • la domination du droit anglo-saxon a plus à voir avec la domination et le dynamisme de l’économie américaine dont les innovations commerciales, économiques et financières s’imposent un peu partout dans le monde, qu’avec les particularités de notre droit
  • depuis la Révolution de 1789, la jurisprudence est montée en importance en France et les points communs entre droit français/continental et droits anglo-saxons se sont accrus. Cf notamment la progression du droit écrit et de la codification en droit anglo-saxon mais aussi la façon dont la jurisprudence française en matière de responsabilité civile non-contractuelle ("tort") a créé un corps de règles protégeant des droits émergents
  • l’intervention des juges dans le contrat (interprétation par la recherche de l’intention des parties) et la protection des consommateurs et de la partie faible est plus marquée en France que dans le monde anglo-saxon.

Personnellement, je trouve le droit français des particuliers particulièrement immune à cette influence. Certes moins depuis la fin des années 2000 avec le commerce électronique qui soumet de plus en plus les particuliers à des contrats qui sont généralement des traductions voire au mieux des adaptations en droit français. Sauf que le droit français de la consommation est d’ordre public. Mais encore faut-il que le consommateur ou une association attaque en justice ...


De la donnée comme or noir

Désenchantement

Soyons clair : ni open access ni open data ne vont résoudre tous les problèmes de la science et du management des collectivités d’un coup de baguette magique. Ces mouvements ou en tout cas leur résultante me font de plus en plus penser à un miroir aux alouettes. Ils semblent naturels ("on l’a payé avec nos impôts") et promettent monts et merveilles (transparence, lutte contre la corruption, nouvel or noir de la data).

Mais primo, les conseilleurs ne sont pas les payeurs : concrètement, ce sont les collectivités et l’Etat qui payent la production de la data, pas les tech ni les éditeurs. Et secundo, les bénéficiaires ne sont pas forcément ceux (les citoyens) à qui les fondateurs et penseurs de ces mouvements pensaient au départ [14].

Open access et open data n’ont plus la même magie, ils ont trop manqué leurs objectifs annoncés [15] et ont été trop menés vers des fins qui ont plus à voir avec l’alimentation d’une industrie de l’information — à la croissance météorique, certes, mais aux acteurs dominants essentiellement non européens — qu’avec la transparence et les services pratiques rendus aux citoyens (open data). Le Groupement français des industries de l’information (GFII), dont je respecte l’expertise technique, ne s’en cache pas, dans ses contributions au rapport Bothorel. L’industrie de l’information est d’ailleurs largement à l’origine de l’open data en Europe puisque c’est en partie à son lobbying [16] que l’on doit la première directive européenne sur le sujet [17]. A la même époque, les mêmes groupes d’intérêts ont obtenu la protection du droit sui generis du producteur de base de données [18].

Pour l’industrie de l’information, l’open data est surtout l’occasion de passer à un nouveau "business model" avec un contenu gratuit ou peu cher à récupérer — mais dont le nettoyage et le traitement ont des coûts, il faut le reconnaître.

Hors des éditeurs et des producteurs de bases de données, la plupart des entreprises du secteur privé n’ont pas en interne les capacités ou le savoir-faire pour retraiter les data. Elles achètent donc sur étagère aux éditeurs et producteurs de bases de données. Quelque part, les associations et les citoyens sont dans la même situation, si ce n’est qu’ils ne peuvent pas se payer les produits susnommés. Les associations compétentes sont trop peu nombreuses pour vraiment apporter quelque chose aux citoyens, même s’il y a quelques exceptions comme Regards Citoyens [19]. Et les formats des données fournies sont si divers et les données si "à nettoyer" ...

Le travail de Guillaume Rozier sans cesse cité en exemple depuis un an n’est pas représentatif de la règle mais une exception puisque a. G. Rozier n’est pas un citoyen ou une association lambda mais un "geek" professionnel capable de retraiter et publier les données lui-même et b. il a forcé le ministère de la Santé à publier les données.

Le secteur public aimerait bien profiter lui aussi de la data, mais il manque de crédits, de personnel et de compétences [20]. Et il n’est hélas pas dans la culture des ministères d’échanger ni de collaborer sur la data avec leur voisin. Enfin, la règle du chef de bureau qui oblige à demander systématiquement l’autorisation de son n+1 pour toute initiative sortant du même bureau, qui lui-même va souvent également demander à son n+1 contribue également à ralentir la construction de bases et d’applications à partir des données publiques. Mais la situation peut être différente d’une institution ou d’un service à l’autre.

Les "entrepreneurs d’intérêt général" (EIG) sont une réponse, mais trop peu et surtout trop tard. Le secteur privé a pris trop d’avance et le secteur public devrait en devenir dépendant.

Mes positions sur la valeur même de l’open data [21] ont évolué elles aussi. J’ai touché du doigt les problèmes concrets, les limites, les problèmes budgétaires, le manque d’ "incentives". Tant en échangeant avec les acteurs qu’en travaillant au SDER de la Cour de cassation en 2016 et dans les groupes de travail d’Open Law en 2014-2015. J’ai vu aussi que la data brute, aussi bonne soit sa qualité, ne sera que rarement réutilisable telle quelle par les citoyens, à l’exception des rapports officiels. A rapprocher de mon désenchantement vis-à-vis d’Internet, comme l’écrit Romain Badouard [22].

Il m’est donc difficile aujourd’hui de défendre des projets d’open data qui ne sont pas mûrs et/ou se font contre et sans les organisations publiques et sans bénéficier directement aux particuliers. Si les mirages peuvent faire avancer dans le désert, ils ne trompent que ceux dont le jugement est déjà trompé par la soif. Surtout, ils ne désaltèrent pas. La data n’est pas de l’eau.

Mais, comme le pétrole, elle peut constituer une nouvelle industrie et un nouvel or noir. Et c’est bien pour ça qu’on la fait émerger. Et beaucoup moins pour son "utilité citoyenne".

Emmanuel Barthe
documentaliste juridique, veilleur, formateur, spécialiste des données publiques juridiques

Notes de bas de page

[2Open data que l’on peut définir comme la diffusion et la réutilisation libres et gratuites des données publiques. Pour aller plus loin, lire : Open data définition : qu’est-ce que c’est ? A quoi ça sert ?, Le Big Data, 5 novembre 2019.

[3Rappelons que les dispositions sur l’open data judiciaire dans le projet de loi Lemaire n’étaient pas présentes dans le texte initial du Gouvernement et n’avaient de toute évidence pour origine ni la Chancellerie ni la Cour de cassation ni des parlementaires.

[4Suppression ou baisse par plusieurs réformes des revenus procurés par les impôts locaux, sans compter la baisse de longue date de la dotation globale de fonctionnement (DGF). A quoi s’ajoute les dépenses supplémentaires dûes à la crise sanitaire et les rentrées diminuées dûes à la baisse d’activité des entreprises.

[7Sur l’ancien régime français de réutilisation des données publiques : Le nouveau régime juridique de la réutilisation des informations publiques, par Bruno Ricard, Droit(s) des archives,
16 mai 2017, Données publiques : les licences ont failli devenir gratuites sur ce blog, 29 juin 2012.

[9Au nombre desquels je compte, mais de façon raisonnée et non pas absolue, comme le lecteur l’aura compris.

[10"L’open data est une façon de redistribuer la connaissance", intervew de Jean-Marc Lazard (Opendatasoft) par Alice Vitard, L’Usine Digitale, 1er juin 2021.

[11Appelé plan de classement de la jurisprudence administrative (PCJA) pour le Conseil d’Etat.

[12Penser les finalités de la nécessaire ouverture des bases de données de jurisprudence, intervention de Jean-Paul Jean, président de chambre à la Cour de cassation, directeur du Service de documentation, des études et du rapport (SDER), colloque « La jurisprudence dans le mouvement de l’open data », Cour de cassation, 14 octobre 2016. Extrait (le gras est de nous) :
« L’open data, entre service public et marché
Toutes ces décisions présentent-elle un intérêt pour la diffusion de la jurisprudence ? Est-il plus simple de tout traiter de façon quasi-automatisée, ce qui fera le bonheur des start-ups qui feront tourner les logiciels et les algorithmes de plus en plus sophistiqués, sur des niches d’information les plus diverses qui intéresseront des clients pour un service payant correspondant à des besoins spécifiques, qui peuvent ne pas être uniquement juridiques ?
Ou bien, est-il souhaitable et peut-on réellement cibler ce qui constitue la finalité première, la diffusion de la jurisprudence pour aider à la régulation par le droit, et donc sélectionner les décisions ? Le comité des ministres du Conseil de l’Europe, dans une recommandation de 1995 préconisait d’ailleurs une sélection des décisions afin "d’éviter l’accumulation d’informations inutiles" (Recommandation n° R (95) 11 du comité des ministres aux Etats membres relative à la sélection, au traitement, à la présentation et à l’archivage des décisions judiciaires dans les systèmes de documentation juridique automatisé).
Le fait qu’une décision judiciaire soit rendue en audience publique est une chose, qu’elle soit remise aux parties en est une autre, qu’elle soit diffusée publiquement et notamment sur Internet, en est une troisième ; qu’elle soit retraitée avec des millions d’autres via les algorithmes des moteurs de recherche nous fait entrer dans une nouvelle dimension dont nous ne pouvons pas mesurer aujourd’hui l’ampleur des conséquences. Les services proposés se démultiplient aujourd’hui dans le marché de l’information juridique et judiciaire, bien au-delà des seuls domaines de la banque ou de l’assurance, et plus généralement chez les acteurs intéressés à l’évaluation des risques par les calculs de probabilité et l’analyse actuarielle. »

[13Case Law in a Legal System Without Binding Precedent : The French Example, par Laurent Cohen-Tanugi, avocats et visiting lecturer, Stanford Law School, 2016. Case Law in France, par Marc Ancel, Journal of Comparative Legislation and International Law, Vol. 16, No. 1 (1934), pp. 1-17 (pas de texte intégral gratuit). Continental Civil Law v Common Law in International Contractual Disputes, par Béatrice Castellane, présidente honoraire de la Franco-British Lawyers Society, 22 janvier 2018. Introduction to French tort law, BICCL.

[14L’open data peut-il (encore) servir les citoyens ?, par Samuel Goëta et Clément Mabi, Mouvements 2014/3 (n° 79), pp. 81-91.

[15Les éditeurs en sciences pures ont simplement basculé une bonne moitié de leurs revues en open access, gagnant ainsi sur les deux tableaux. Les éditeurs en SHS sont plus hésitants, mais pourraient bien en faire autant.

[17Directive 2003/98 du 17 novembre 2003 concernant la réutilisation des informations du secteur public, transposée en droit français par l’ordonnance n° 2005-650 du 6 juin 2005 relative à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques.

[18Directive 96/9/CE du 11 mars 1996 concernant la protection juridique des bases de données, JOCE L 77 du 27 mars 1996, p. 20–28. Transposée en droit français par la loi n° 98-536 du 1er juillet 1998 portant transposition dans le code de la propriété intellectuelle de la directive 96/9/CE, JORF n° 151 du 2 juillet 1998, elle-même codifiée dans le Code de la propriété intellectuelle aux articles L 341-1 à L 343-4.

[19Cela dit, cela fait plus d’un an qu’ils n’ont rien publié sur leur blog. L’association semble en sommeil.

[20Voir Open data : une révolution silencieuse dans l’administration, par Solveig Godeluck, Les Echos.fr, 6 juillet 2021. L’article est par ailleurs décevant car il esquive largement ces sujets très politiques.

[21Ex-réutilisation des informations du secteur public, ex-réutilisation des données publiques.

[22Le désenchantement de l’internet. Désinformation, rumeur et propagande, par Romain Badouard, FYP éditions, 2017, coll. Présence/Questions de société. Chez le même éditeur, lire également Le startupisme : Le fantasme technologique et économique de la startup nation, par Antoine Gouritin.

Répondre à cet article