Portails juridiques officiels - Diffusion des données juridiques publiques

Dernier ajout : 11 octobre.

Derniers articles

Google Dataset Search (bêta) : une marge de progression importante

Le portail Etalab pourrait aider

Mardi 18 septembre 2018

Lire la suite »

Simon Chignard d’Etalab a testé Google Dataset Search (GDS) (encore en version bêta) et en livre un compte-rendu sur son blog [1].

Google Dataset Search (GDS) est le nouveau moteur de recherche de jeux de données open data développé par Google AI. Dataset se traduit par "jeu de données" en français.

Le test de S. Chignard

Pour une présentation de GDS, lire le billet de Nature https://www.nature.com/articles/d41586-018-06201-x [2]

L’évaluation de Simon Chignard est décevante. Principalement :

  • « comme cela a déjà été souligné par d’autres, notamment ce billet de Singapour [en fait le bibliothécaire geek américain Aaron Tay, billet *très* intéressant] l’expérience utilisateur n’est pas à la hauteur de la qualité à laquelle Google nous avait habitué, même en mode bêta. Ici le moteur ne propose ni recherche par facette, ni tri selon la date de fraîcheur ou format de fichier par exemple. C’est minimaliste. »
  • « il n’y a pas de miracle : la découvrabilité des données est un problème complexe que Google, malgré sa bonne volonté et son expertise n’a pas (encore) réussi à résoudre. »

Cependant, comme le rappelle Frédéric Charles de Suez Smart Solutions (voir le fil de discussion Twitter), « Google c’est le pur mode agile. On pose un MVP [produit minimum viable], on regarde les usages, on coupe ou on développe. Donc ce n’est qu’une première "flavor" [3] de ce qu’ils peuvent faire ».

Test personnel sur le juridique

J’ai testé GDS sur mon domaine. Je rejoins S. Chignard. Sur le droit et les données juridiques publiques, ce n’est pas encore ça :-( Ainsi, taper le mot-clé "droit" https://toolbox.google.com/datasetsearch/search?query=droit&docid=5H10VrhD%2BqcVLOxTAAAAAA%3D%3D … devrait amener dans les premiers résultats les jeux de données publiés par Legifrance, la Cour de cassation, le ministère de la Justice et Conseil d’Etat. Eh bien non, aucun.

Avec "cassation", c’est la cata : https://toolbox.google.com/datasetsearch/search?query=cassation&docid=YrLq%2Fxfj8PzLTwoqAAAAAA%3D%3D … "justice" fait à peine mieux.
Pour permettre l’évaluation de ces résultats de GDS, voici ce que le moteur devrait trouver avec ces mots-clés :
https://www.data.gouv.fr/fr/search/?q=justice
https://www.data.gouv.fr/fr/search/?q=cassation
https://www.data.gouv.fr/fr/search/?q=jurisprudence

On le voit, data.gouv.fr est très mal indexé par GDS. S. Chignard confirme : « Pour data.gouv.fr par exemple, Google Dataset Search a amené la semaine dernière un peu plus de 550 visites ... sur un total de 81 000. »

Data.gouv.fr peut lui aussi mieux faire

En défense de Google Dataset Search, il faut reconnaître que les datasets juridiques de data.gouv.fr ne sont pas toujours accompagnés des bons mots-clés :

  • par exemple, sur la page du jeu de données Jurisprudence anonymisée de la Cour des comptes (2006-2008 et 2010-2015) … le mot "droit" n’apparaît pas dans le texte de présentation
  • le droit, le juridique n’est même pas une catégorie thématique du portail d’Etalab. Clairement, data.gouv.fr pourrait bénéficier d’un classement thématique plus précis, plus détaillé, et avec des sous-classes — un seul sous-niveau pourrait suffire à mon avis.

En discutant sur Twitter avec un formateur SEO de Google, Vincent Courson, et S. Chignard, je cerne un peu mieux les causes et remèdes possibles — mais ça reste en partie du domaine de la supputation.

Vincent Courson fait remarquer qu’au début de Google, le moteur s’appuyait fortement sur le déclaratif des gérants de sites web (les balises méta [4] titre et description) pour comprendre de quoi parlait une page web. Aujourd’hui, le moteur va beaucoup plus loin en se baant sur beaucoup d’autres signaux, et préfère d’ailleurs les signaux réels (contenu des textes, champ lexical, images, etc...) plutôt que les signaux déclaratifs. C’est notamment l’effet du NLP (traitement du langage naturel) à la sauce ML (machine learning) implémenté par Google.

Pour S. Chignard la question est : quels sont les signaux réellement pertinents pour les jeux de données ? La pertinence du Page Rank tenant en partie à l’analyse des liens, ce n’est pas forcément aisé à ce stade pour les données puisque par définition il y aura peu de liens vers un jeu de données (un document ayant lui un sens, attirera beaucoup plus de liens).

Cela dit, désormais, le PR n’est plus du tout un facteur majoritaire pour Google Search. Mais cette évolution du moteur a pris des années. C’est peut-être le temps qu’il faudra à GDS, avance Vincent Courson.

Sinon, il estime que le balisage Schema peut servir pour indiquer les détails sur la "coquille" elle-même : titre, keywords, owner, etc... Mais pour autant, il se baserait plutôt sur l’analyse de la data elle-même, plutôt que la coquille.

C’est vrai, le contenu réel est plus pertinent et n’importe quel site peut tricher sur son texte de présentation et ses métadonnées. Il faudrait donc se baser sur le seul jeu de données ?

Je ne pense pas. Je me dis :

  • que certains jeux ayant une masse énorme, cela peut rendre le travail d’indexation extrêmement lourd et difficile
  • et qu’ici une part importante des sites sont des sites officiels, peu susceptibles du jeu malsain consistant à tricher sur la description et les métadonnées des pages. Et les algorithmes le "savent" puisque c’est marqué dans les URLs desdits sites (.gouv.fr).

En résumé, le travail de description thématique par les sites officiels de leurs jeux de données reste à mon avis une piste importante pour améliorer la pertinence des recherches de datasets — et d’ailleurs, pour tous les moteurs du Web.

Souci à long terme ?

Aaron Tay conclut son billet de manière très claire : « Leaving Google dataset search as the one and only comprehensive dataset search is dangerous, Google is a commercial company and could at any time shutter the service. There has been recent talk about the need for open infrastructure on top of open data and open access and clearly the same holds for dataset search tools. »

S. Chignard redoute que les sites officiels se fassent quasiment déposséder de facto de leurs jeux de données : « Il sera alors temps de se poser la question du risque de désintermédiation des plateformes open data au profit du moteur de recherche » Pas faux.

Emmanuel Barthe
recherchiste juridique, veilleur


Du mieux pour les non juristes

EUR-Lex : nouvelle version optimisée pour les seuls mobiles

Une catastrophe ergonomique pour les knowledge workers

Mardi 18 septembre 2018

Lire la suite »

Le site juridique officiel de l’UE, EUR-Lex, vient de faire peau neuve ce 11 septembre 2018 pour s’adapter aux mobiles.

Une vidéo de 4 mn en anglais expose les changements les plus importants :

Toutefois, pour en savoir plus, il faut lire la page Latest development d’EUR-Lex et faire ses propres tests.

Suppression des onglets = perte sèche en ergonomie

A première vue, si les utilisateurs d’interfaces mobiles seront certainement satisfaits, les réactions des professionnels risquent d’être mitigées.

Principal changement : le système à onglet a été remplacé par un système très web 1.0 de pages rubriques réunies par une page sommaire.


La nouvelle page d’accueil/sommaire d’EUR-Lex au 11 septembre 2018, sous ordinateur/PC/grand écran

La facilité de navigation du site est directement — et en partie négativement — impactée :

  • la structure du site, son organisation par rubriques est plus claire, il faut le reconnaître. Ca va bénéficier au grand public non juriste
  • il est désormais impossible de passer directement d’une rubrique à une autre.

Il faut à chaque fois :

  • soit, si on est sur ordinateur, repasser par la page d’accueil, que ce soit par le bouton Back du navigateur ou en cliquant sur le lien Page d’accueil dans le chemin de fer/fil d’Ariane sur fond noir disponible en haut de page
  • soit, si on est sous smartphone, cliquer sur le bouton MENU.

Autant c’est acceptable voire plus simple sur un smartphone, autant sur un ordinateur fixe ou portable, c’est anti-pratique. Et désolé, mais le petit bouton MENU bleu d’EUR-Lex ne répond pas aux règles standard en la matière, celles du menu dit "hamburger" pour smartphone :

  • positionnement non respecté : il devrait être tout en haut et à gauche, à la place de l’actuel logo EUR-Lex. Voyez par exemple le respect presque général de ce standard dans la variété des designs web de menus hambugers présentés sur la page Hamburger Menu Design Inspiration du site CodeMyUI
  • graphisme/dessin non standard :
    • le menu doit consister en 3 lignes noires [5] voire blanches, contrastant fortement, et assez épaisses pour ne pas être ratées.
      En effet, comme le rappellent aussi bien le jeune développeur et spécialiste UX (ergonomie) Nick Babich [6] que le cabinet Nielsen Norman du vieux gourou et fondateur de l’UX (ou "usability") Jakob Nielsen, « le principal désavantage du menu hamburger est sa faible "découvrabilité" » [7]. Parmi les solutions, N. Babich suggère notamment ... une barre de menus [8]. Orienté applications pour iPhone, le designer Fabian Sebastian, dans un post sur son blog Medium UX Planet va même jusqu’à affirmer que « les barres d’onglets sont les nouveaux menus hamburger » [9]. Elle aussi orientée iOS,la société Apptimize a publié un Ultimate guide to the hambruger menu dans lequel elle voit bien la valeur des menus hamburger, mais propose aussi des alternatives quand cela est indiqué
    • il doit se fermer non en cliquant à nouveau sur le hamburger mais en cliquant sur une croix apparue en haut à gauche.

Ce non respect des standards rend ce menu difficile à repérer et identifier comme tel.

Du point de vue des "knowledge workers" (veilleurs, documentalistes, juristes ..), c’est une régression ergonomique : se déplacer et chercher dans EUR-Lex prend une fois et demie plus de temps, car il faut multiplier les clics et on a perdu toute vue globale.

EUR-Lex aurait pu développer une version mobile en plus de la version par onglets ou réfléchir à une autre solution pour garder cette vue d’ensemble du site et la navigation rapide qu’on avait. OK, ça a un coût, mais c’est quand même l’éditeur officiel de l’Union européenne, qui publie plus de 200 000 textes par an (toutes versions linguistiques comprises) et fait 5 millions de visites par mois ... A ce niveau, il est possible de faire un effort.


La nouvelle page d’accueil/sommaire d’EUR-Lex au 11 septembre 2018, sous smartphone

Lorsqu’on rétrécit la page d’EUR-Lex, elle s’adapte de la manière habituelle pour un site mobile : les menus et les colonnes passent en étagement vertical. La lisibilité sous smartphone est donc assurée, et les tablettes ont elles aussi une mise en page adaptée.

Fonctions recherche et alerte : pas de changement

Seule la page de recherche avancée et la possibilité, sous un compte personnel, de mettre en place une veille par RSS ont été épargnées. Maigre consolation. NB : si vous cliquez sur Recherche dans une page rubrique, vous êtes renvoyé sur la page Recherche avancée.

Pour autant, les tweets d’EUR-Lex ne montrent pas de signe de passage un jour à une alerte par email. La fonction de veille proposée — et pourtant je suis partisan du RSS — est moins simple.

Je connais les arguments anti-e-mail. Je suis le premier à les rappeler : gérer une "mailing list" de cette taille (des dizaines de milliers d’adresses email) est une tâche épouvantable — rien que la gestion des adresse mail devenues fausses. Et il faut l’outsourcer, sinon ça peut aisément "tuer" le serveur (de messagerie). Pour autant, rien à faire, une alerte e-mail manque.

D’autres sites basculent vers une version optimisée uniquement pour mobile

Et EUR-Lex n’est pas le seul. On a récemment vu une nouvelle version de Lexis 360 optimisée pour les seuls appareils mobiles, où heureusement il y a eu très peu de pertes [10]. Et Lextenso, depuis 2017, est aussi sur une version optimisée pour mobile.

Du fait du passage par les consultations mobiles de la barre des 50%, on peut s’attendre à d’autres évolutions de ce style ailleurs. Et pour faire des économies, une seule version : la mobile.

Disons le donc clairement : ce qui commence à ressembler à une dictature du mobile n’a pas que des avantages. Car au bureau, on ne travaille pas sur mobile, mais sur grand écran. Il n’y a pas que les traders qui travaillent avec un double écran. Du fait de la nécessité d’avoir de visualiser de nombreux documents en même temps, les juristes s’y mettent aussi.


Une des pages rubriques de la nouvelle version d’EUR-Lex au 11 septembre 2018, sous ordinateur/PC/grand écran

Réorganisation du site

Côté organisation du site, les rubriques du site ont été revues.

Le menu comporte quatre catégories principales, en plus du JOUE déporté en haut à droite : Législation de l’UE, Jurisprudence de l’UE, Législation et jurisprudence nationales et Informations.

La plupart des rubriques et sous-rubriques ont été renommées. Par exemple :

  • "Législation de l’UE" s’appelle maintenant "Actes juridiques", ce qui est plus logique et plus rigoureux, sans conteste, mais va perturber des habitudes bien ancrées
  • "Procédures législatives" est devenue "Procédures d’élaboration de la législation". Là, c’est plus clair pour les non juristes, mais moins clair pour les juristes. C’est bien ce que je disais plus haut : cette nouvelle version n’est pas pour les professionnels
  • "Répertoire de la jurisprudence de l’Union européenne" devient "Répertoire de la jurisprudence". Là, ok, c’est juste plus simple et ça revient au même
  • "Mesures nationales de transposition" — ex-mesures nationales d’exécution (MNE) [11] — devient "Transposition nationale". Là, en revanche, je ne suis pas certain que ce soit plus clair pour les grand public. Le juriste lui n’y verra que du feu
  • "Actes préparatoires de l’UE" devient "Documents préparatoires". Là, ok, c’est un peu plus clair pour le grand public, sans que le juriste y perde.

Cybersécurité : passage en HTTPS

Probablement sous la pression de Google qui depuis 2018 stigmatise les sites non-sécurisés (non HTTPS) et par souci de passer aux nouveau standards de cybersécurité, EUR-Lex a adopté le protocole HTTPS. Tous les accès à EUR-Lex au moyen du protocole HTTP sont automatiquement réorientés pour utiliser le protocole HTTPS.

L’HyperText Transfer Protocol Secure, plus connu sous l’abréviation HTTPS — littéralement « protocole de transfert hypertexte sécurisé » — est la combinaison du HTTP avec une couche de chiffrement comme SSL ou TLS.

HTTPS permet au visiteur de vérifier l’identité du site web auquel il accède, grâce à un certificat d’authentification émis par une autorité tierce, réputée fiable. Il garantit théoriquement la confidentialité et l’intégrité des données envoyées par l’utilisateur et reçues du serveur [12].

Je continue de tester. D’autres remarques viendront peut-être enrichir ce post.

Le fil Twitter du débat est .

Emmanuel Barthe
documentaliste juridique, veilleur


Les vraies dates de rentrée des députés et des sénateurs

La rentrée parlementaire, c’est quand ?

Où trouver l’agenda des assemblées

Mardi 4 septembre 2018

Lire la suite »

En ce début septembre, une question dans l’air du temps revient : la rentrée parlementaire 2018 pour les députés et les sénateurs, c’est quand ?

Les approximations massives des médias et des "ordres du jour" des sites parlementaires

Les journaux — Ouest France, par exemple — vous diront que c’est le 12 septembre. C’est faux — aux trois quarts faux pour être précis.

Même la chaîne Public Sénat ne dit qu’une partie de la vérité [13]. Eux au moins ajoute que le 12 septembre ne concerne que les députés. Les sénateurs, eux, rentrent le 25 septembre selon Public Sénat.

Même les sites web parlementaires manquent totalement de précision et donnent l’impression que les députés et sénateurs rentrent bien après les Français :

Les dates précises


Agenda de l’Assemblée nationale du 5 septembre 2018

En fait, ces dates du 12 et du 25 septembre sont celles des séances plénières, celles que les chaînes de télévision parlementaires (Public Sénat en direct et LCP TV Direct) filment en continu, celles où les députés discourent ou apostrophent leurs rivaux. La séance plénière, c’est ce qui se passe sur les bancs de l’Assemblée ou du Sénat, en public.

Pour connaître les vraies dates de rentrée des députés et des sénateurs, il faut prendre en compte que pour passer en séance, un projet de loi doit d’abord être passé en revue dans une commission. Par exemple, la commission des lois ou la commission des finances. Ces commissions épluchent le texte proposé et commencent déjà à le modifier. C’est leur version du texte qui sera proposée au vote en séance plénière, pas celle d’origine [14].

Et ce travail en commission, il faut donc bien le commencer avant la reprise de la séance (plénière) [15].

Donc, en réalité, les députés qui ont été nommés pour siéger dans les commissions vont commencer à travailler plus tôt, et pour certains (ceux de la commission spéciale chargée d’examiner le projet de loi Pacte) dès le 5 septembre. Les sénateurs aussi.

Les textes qui leur sont soumis étant le plus souvent très techniques, ils ont beaucoup de travail de lecture et d’analyse, et plus encore de travail de rédaction s’ils veulent faire adopter une modification — on dit "déposer un amendement". La moindre erreur technique ou juridique dans la rédaction ou dans la procédure de dépôt et leur amendement sera recalé aussi sec.

Pour voir les vraies dates de rentrée, il faut déjà consulter la page "Agenda" de chacun des sites web parlementaires :


Agenda du Sénat du 5 septembre 2018

Un député, un sénateur, ça travaille, l’air de rien

Il faut aussi prendre en compte que le boulot d’un député/e, c’est aussi de servir d’ "assistante sociale" de sa circonscription. Il/elle relaye les demandes auprès de l’administration, il vérifie qu’on n’oublie pas sa ville ou son territoire dans tout projet de loi, toute négociation interministérielle ou tout arbitrage de l’exécutif.

Un/e député/e ou un/e sénateur/ice a également beaucoup de rendez-vous et d’échanges, notamment en face-à-face sur Paris. Il doit rencontrer ses informateurs, les groupes d’intérêts [16] qu’il représente (officieusement), ses contacts au sein du Gouvernement et de la haute administration et les journalistes.

Tout cela fait que même les parlementaires qui ne sont pas dans des commissions sont rentrés dès les premiers jours de septembre. Et s’ils ne sont pas forcément encore sur Paris (Internet et le téléphone, ça sert à ça), ça ne va pas tarder.

Ah oui, là, on a moins l’impression qu’ils se défilent, les parlementaires ;-) [17]

Emmanuel Barthe
recherchiste juridique, veilleur


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 79

Dernières brèves