Actualités : derniers articles

Open data : au tour de la base SARDE

Le "thésaurus" des textes publiés au JORF

Lundi 13 juin 2016

Communiqué DILA début juin 2016 :

« L’éditeur officiel français, la DILA, poursuit son travail de mise à disposition de ses données et ouvre la base SARDE.

SARDE (Système d’Aide à la Recherche Documentaire Elaborée) est un référentiel conçu pour alimenter un mode de recherche thématique sur la majeure partie des textes législatifs et réglementaires en vigueur.

Sont référencés les textes publiés dans l’édition "Lois et décrets" du Journal officiel ainsi que dans les Bulletins officiels diffusés par la DILA.

Ce référentiel comporte environ 16000 descripteurs organisés sur 2 niveaux hiérarchiques. »

La base est téléchargeable gratuitement et librement sur le Répertoire des informations publiques (RIP) de la DILA.

SARDE est un quasi-thésaurus. Sur Legifrance, elle permet une recherche par un sujet (large ou précis) sur les textes officiels et les Codes.


Un moteur de recherche unique pour les informations légales

Le Portail de la publicité légale des entreprises (PPLE) est enfin en ligne

Vendredi 10 juin 2016

Sur la liste Juriconnexion, Elsa signale que les trois acteurs du domaine de la publicité légale : l’Association de la Presse pour la Transparence Economique (APTE) [1], le Conseil national des greffiers des tribunaux de commerce (CNGTC) et la Direction de l’information légale et administrative (DILA), mettent à la disposition des usagers, depuis mars 2016, un nouveau portail d’accès à la publicité légale des entreprises.

Pour en savoir plus :

Attention : à part le BODACC, les résultats du moteur de recherche du site PPLE renvoie vers des ressources partiellement payantes. Il s’agit des sites Infogreffe et Actulégales :

En clair, PPLE, dont la sortie était initialement prévue pour mars 2015, est un méta-moteur pour ces trois sites afin de faciliter les recherches et la veille sur les entreprises.

Ce site est le résultat du travail d’un groupement d’intérêt public (voir la convention constitutive de ce GIP) regroupant justement les trois organismes sus-mentionnés, créé par arrêté du Premier ministre du 3 février 2014 [3].

Point très positif : il semble bien que cette fois, les entreprises d’Alsace Moselle (département du Bas-Rhin et Haut-Rhin et de Moselle), jusqu’ici hors des principales plateformes comme le notait Didier Frochot, ont été incluses : un exemple avec la liste des entreprises du Bas-Rhin.

Emmanuel Barthe
veilleur et formateur


Une chronologie

Open data et données juridiques publiques en France : les pouvoirs publics sont lancés

La preuve par 10

Dimanche 5 juin 2016

Finalement, le rapport de juillet 2011 rédigé par Mines Paris Tech pour le ministre en charge de l’économie numérique et la Délégation aux Usages de l’Internet "Les données publiques au service de l’innovation et de la transparence - Pour une politique ambitieuse de réutilisation des données publiques" (PDF) [4] et le débat sur l’opportunité de la gratuité des données publiques n’auront pas accouché d’une souris [5]. En tout cas dans le domaine juridique.

En effet, côté données juridiques publiques, les pouvoirs publics français sont vraiment lancés dans l’open data. La preuve par 10 chronologiquement :

- Mai 2011 : le Premier ministre François Fillon pose la nouvelle règle [6] : « la gratuité est le principe, la redevance l’exception » par sa circulaire du 26 mai 2011 relative à la création d’Etalab [7].

- 5 décembre 2011 : lancement du site Data.gouv.fr [8].

- 2012-2014 : ce n’est pas de l’open data mais ça va dans le sens de l’open data, ça accompagne ce mouvement : adoption des numéros et URL (adresses web) stables ECLI(European Case Law Indentifier [9] par la Cour de cassation et le Conseil d’Etat et le Conseil constitutionnel en 2012 et 2013 [10] et ELI (European Law Identifier [11]) par la DILA en octobre 2014. ECLI et ELI permettent de citer (et à terme rechercher, y compris par des automates) respectivement les décisions de justice des juridictions des de l’Union européenne et des Etats membres et les textes officiels adoptés par l’UE et les Etats membres [12]. Même les JO ont leur ELI. Exemple : le JORF du 5 novembre 2014 http://www.legifrance.gouv.fr/eli/jo/2014/11/5 On voit aussi les ELI sous deux formes (selon que le texte a un numéro ou pas, par exemple pour les décrets), mais, par défaut, le NOR est intégré. Exemple pour le décret n° 2014-1315 du 3 novembre NOR : FCPT1413681D : ELI : http://www.legifrance.gouv.fr/eli/decret/2014/11/3/FCPT1413681D/jo/texte ; ELI : http://www.legifrance.gouv.fr/eli/decret/2014/11/3/2014-1315/jo/texte ECLI et ELI avaient préalablement été adoptés en 2011 et 2012 respectivement au niveau européen.

- 2013 : le Sénat publie les bases suivantes en open data sur le portail dédié data.senat.fr [13] :

  • les travaux législatifs (base Dosleg) : ensemble des informations sur les documents parlementaires déposés au Sénat (références depuis octobre 1977 et liens vers le texte intégral depuis octobre 1995)
  • les amendements (base Ameli) : ensemble des amendements déposés au Sénat en commission (depuis octobre 2010) et en séance publique (depuis octobre 2001)
  • les questions (base Basile-questions) : ensemble des informations sur les questions écrites et orales posées par les sénateurs au Gouvernement (références et/ou texte intégral selon la date de la question)
  • les comptes rendus des débats : ensemble des informations relatives aux comptes rendus intégraux de la séance publique depuis janvier 2003. Les comptes rendus intégraux eux-mêmes seront prochainement disponibles.

- Juillet 2013 : Un article discrètement niché dans la loi Fioraso sur l’enseignement supérieur [14] élargit aux chercheurs l’accès aux données de l’administration fiscale [15], jusque là particulièrement bien protégées, sous réserve d’un engagement de confidentialité [16] : « L’accès des tiers, à des fins de recherche scientifique, aux informations recueillies à l’occasion des opérations de détermination de l’assiette, de contrôle, de recouvrement ou de contentieux des impôts, droits, taxes et redevances prévus au code général des impôts peut être autorisé par décision du ministre chargé du budget, après avis favorable du comité du secret statistique institué par l’article 6 bis de la loi n° 51-711 du 7 juin 1951 sur l’obligation, la coordination et le secret en matière de statistiques. » Il s’agit de l’article 104 de la loi, qui modifie l’article L. 135 D du Livre des procédures fiscales (LPF) (voir l’article modifié).

- Novembre 2013 : publication du rapport Trojette sur l’ouverture des données publiques. Son titre est explicite : "Ouverture des données publiques - Les exceptions au principe de gratuité sont-elles toutes légitimes ?" La Gazette des communes le dit à sa façon : Open data : Le rapport Trojette habille pour l’hiver les redevances sur les données publiques.

- Juin 2014 : les licences Legifrance deviennent gratuites et quasi-open data [17] par le décret n° 2014-648 du 20 juin 2014 modifiant le décret n° 2002-1064 du 7 août 2002 relatif au service public de la diffusion du droit par l’internet [18] et son arrêté d’application du 24 juin 2014 relatif à la gratuité de la réutilisation des bases de données juridiques et associatives de la direction de l’information légale et administrative [19].

- Eté 2014 : la DILA met concrètement en téléchargement libre, gratuit et anonyme les bases JORF, CONSTIT, CNIL, ASSOCIATIONS et DEPOTS DES COMPTES ANNUELS DES ASSOCIATIONS [20].

- Octobre 2014 : la DILA prépare l’ouverture (diffusion gratuite) des informations légales et données économiques sur les entreprises publiées dans ses trois bulletins officiels BODACC, BOAMP et BALO (information du 30 octobre 2014).

- Octobre 2014 : la DILA organise un prix Open Law de l’accès au droit [21]. Présentation des projets en lice le 11 décembre 2014.

- Septembre 2015 : la DILA met concrètement en téléchargement libre, gratuit et anonyme les bases CASS (arrêts publiés au Bulletin), INCA (INédits de la CAssation), CAPP (sélection d’arrêts de cours d’appel) et JADE (Conseil d’Etat et cours administratives d’appel) [22].

- Fin 2015 : le président de l’Assemblée nationale Claude Bartolone a annoncé le 12 novembre 2014 que d’ici fin 2015 plus de 800.000 documents de l’AN seront accessibles en open data [23]. Le compte rendu de la réunion du mercredi 12 novembre 2014 organisée par le Bureau de l’Assemblée nationale liste des informations qui seront concernées par cette ouverture :

  • les documents parlementaires ;
  • les coordonnées des députés ;
  • les mandats ;
  • le résultat des scrutins publics ;
  • le rattachement des députés à un parti politique ;
  • l’utilisation de la réserve parlementaire ;
  • la liste des représentants d’intérêts inscrits sur le registre ;
  • la liste des personnalités auditionnées par les commissions ;
  • la présence des députés en commission.

- Avril 2016 : le code source du calculateur d’impôt (dit "Calculette Impôts") est mis en libre accès gratuit [24] sur OpenFisca.

- Fin mai 2016 : le thésaurus des textes publiés au JORF (textes officiels et Codes), SARDE, est mis par la DILA en open data [25].

Voilà, on en est là. Pour l’instant. Comme qui dirait : « What’s next ? »

Emmanuel Barthe
juriste veilleur, spécialiste des données publiques juridiques


Dernières brèves

An open letter to the LinkedIn security team

Some questions I have

Jeudi 26 mai 2016

Lire la suite »

Dear LinkedIn secury team,

You just sent me an email telling me about the recent publishing on the internet of LI IDs and hashed passwords from 2012.

My sincere thanks for this notification. On the one hand, it’s very positive that LI acknowledges the situation.

On the other hand :

Why don’t you start by exacting from users that they use complex passwords (i.e. with at least one digit and one sign not being a letter) ?
Instead of asking for their phone number, which is much more privacy invading.

Also, why is it that the press has told about the leak days before you sent me this email ?

And finally, why is it that the accounts concerned dit not have their passwords reset in 2012, when the original leak happened ? Does that mean that you did not detect it at the time ?

Thanks for listening.

Sincerely,

E. Barthe

PS 1 : Don’t forget that the European General Data Protection Regulation (GDPR) will come into force in 2018. Although they are not automatic at all, it contains huge penalties for this kind of leak.
PS 2 : I know LI is not the only internet business having those massive data leaking problems. But that is no excuse. And those businesses should beware too the GDPR sanctions.


Des listes de portails open data

Pour trouver des jeux de données publiques réutilisables gratuitement et librement

Lundi 2 mai 2016

Lire la suite »

NB : cette liste est une ébauche à compléter.

- OpenDataSoft : La liste des Portails Open Data dans le Monde : carte interactive et liste. La liste permet une recherche sommaire par chaîne de caractère (exemple : "econo" pour des portails de statitiques économiques). Semble le plus riche des portails cités ici.

- Data Portals : carte interactive et liste (cherchable comme indiqué supra). Concoctée par des experts open data. Service offert par l’Open Knowledge Foundation (OKF).

- CKAN instances around the world : une liste. Tri par pays ou type d’organismes auteur.

- OpenDataMonitor (projet financé par la Commission européenne) : carte interactive. Uniquement des jeux de données en Europe. Permet des comparaisons sur certains critères qualitatifs ou quantitatifs.

- Portail des données ouvertes de l’Union européenne : contrairement aux autres répertoires cités ici, celui-ci n’offre pas d’accès géographique (en effet, les jeux de données proviennent des institutions de l’UE, pas des Etats membres), mais fournit en revanche un accès par sujet. A signaler aussi les onglets Applications et Le coin des développeurs.

Connaissez-vous d’autres listes/répertoires/annuaires/bases de données de portails open data au niveau international ? Les commentaires sont ouverts.


Synthèse et explications

Les revues en SHS à l’heure des logiciels d’édition et des plateformes de diffusion en ligne

Cairn, Revues.org, Persée, Isidore, barrière mobile, open access, OAI ...

Dimanche 17 avril 2016

Lire la suite »

Le billet qui suit a été rédigé en février 2015 pour guider une amie dans le monde nouveau (pour elle) des revues scientifiques en ligne. Je le reprend ici quasiment sans mise à jour ni réécriture, brut de décoffrage et avec son côté "les grandes lignes seulement".

Les petites et moyennes revues françaises en sciences humaines et sociales (SHS) utilisent désormais en partie le modèle d’affaires ("business model") du Web-gratuit-et-bien-référencé-par-Google pour augmenter leur diffusion, valoriser leurs numéros et mieux vendre leurs articles et leurs abonnements. Tout en maintenant leur indépendance et en baissant leurs coûts de production et de diffusion [1].

Pour cela, le processus d’édition des revues change :

  • un fichier Word ou RTF déjà balisé par des styles permet de récupérer facilement et automatiquement les informations dans les champs (Titre, Auteur, Résumé etc.)
  • le logiciel d’édition électronique (CMS) :

Lodel est un de ces CMS, c’est celui qui est derrière Revues.org :

Les méta-données (Titre, Auteurs, Mots-clés, Date, Titre de la revue ; mais pas forcément le texte intégral) sont laissées en accès libre et reconnues automatiquement par les robots indexeurs (on appelle ça le moissonnage OAI-PMH [3]) : non seulement les robots indexeurs des moteurs de recherches du Web (Google, Bing) mais aussi et surtout ceux de logiciels de bibliothèque comme PMB et de bases de données internes aux structures, ou externes comme celle tenue par l’Université allemande de Bielefeld BASE, accessible gratuitement en ligne. Le portail français Isidore fonctionne selon le même principe :

Ce sont les éditeurs, les revues et les institutions (Universités) qui sont derrière les trois plateformes de revues en ligne Cairn (plus orienté éditeurs privés), Revues.org (plus orienté universités, il fait partie de OpenEdition géré par le Cleo) et Persée (orienté diffusion de collections patrimoniales [4] et sociétés savantes). Exemples et liens utiles :

Le tout est interrogeable, entre autres sources, sur le méga-portail des publications françaises en SHS Isidore :

Concrètement, ces portails en ligne financés en commun mélangent un accès gratuit aux numéros anciens et le vente des productions récentes à la pièce (quelques euros l’article) ou par bouquets de revues. Les éditeurs ou les revues déterminent eux-mêmes quelle période de leurs collections est en accès gratuit. C’est souvent le modèle de la barrière mobile ("moving paywall") qui est appliqué : la dernière ou les 2 ou 3 dernières années de la revue sont payantes.

L’abonnement direct auprès de l’éditeur reste possible pour certaines revues (ex. les revues des Editions du CNRS sont à la fois disponibles à la vente auprès du CNRS et sur le portail Cairn). Pour d’autres, toutes les fonctions de vente et abonnement sont déléguées au portail. Par exemple, les revues des Presses de la FNSP sont uniquement disponibles sur Cairn.

Emmanuel Barthe
documentaliste, gestionnaire de site web