Portails juridiques officiels - Diffusion des données juridiques publiques

Dernier ajout : 3 janvier.

Derniers articles

Le nouveau droit des marchés publics en deux pages

Mercredi 19 septembre 2018

Lire la suite »

Le 1er octobre 2018, tous les marchés publics devront être passés et signés en version électronique et en ligne sur Internet. Même si c’était bien pratique, le papier, c’est fini.

En même temps, le droit des marchés publics reste compliqué.

Comment, quand on est patron d’une petite PME, retenir l’essentiel ? Comment ne pas se perdre dans le fouillis des textes officiels ?

Simple : commencez par lire ce PDF de deux pages publié par le ministère des Finances. Comme ça, vous serez prêts pour l’échéance du 1er octobre.

Ce PDF s’appelle "2018 : la dématérialisation de la commande publique (pour les entreprises)" mais oubliez ce titre. Ce qui compte, c’est qu’il vous donne le B-A-BA des marchés publics tels qu’ils se pratiquent aujourd’hui.

Vous voulez en savoir plus sans vous prendre la tête ? Alors lisez ces deux pages web :

Bravo, vous venez de passer votre brevet d’initiation aux marchés publics.

Vous en savez maintenant assez pour vous lancer et répondre à votre premier appel d’offre. Les appels d’offres sont tous sur le Bulletin officiel des annonces de marchés publics (BOAMP).

Si vous avez du temps et déjà une culture juridique, vous pouvez approfondir vos connaissances en lisant le Guide « "très pratique" de la dématérialisation des marchés publics au 1er octobre 2018, version Opérateurs économiques (PDF, 45 pages).

Emmanuel


Google Dataset Search (bêta) : une marge de progression importante

Le portail Etalab pourrait aider

Mardi 18 septembre 2018

Lire la suite »

Simon Chignard d’Etalab a testé Google Dataset Search (GDS) (encore en version bêta) et en livre un compte-rendu sur son blog [1].

Google Dataset Search (GDS) est le nouveau moteur de recherche de jeux de données open data développé par Google AI. Dataset se traduit par "jeu de données" en français.

Le test de S. Chignard

Pour une présentation de GDS, lire le billet de Nature https://www.nature.com/articles/d41586-018-06201-x [2]

L’évaluation de Simon Chignard est décevante. Principalement :

  • « comme cela a déjà été souligné par d’autres, notamment ce billet de Singapour [en fait le bibliothécaire geek américain Aaron Tay, billet *très* intéressant] l’expérience utilisateur n’est pas à la hauteur de la qualité à laquelle Google nous avait habitué, même en mode bêta. Ici le moteur ne propose ni recherche par facette, ni tri selon la date de fraîcheur ou format de fichier par exemple. C’est minimaliste. »
  • « il n’y a pas de miracle : la découvrabilité des données est un problème complexe que Google, malgré sa bonne volonté et son expertise n’a pas (encore) réussi à résoudre. »

Cependant, comme le rappelle Frédéric Charles de Suez Smart Solutions (voir le fil de discussion Twitter), « Google c’est le pur mode agile. On pose un MVP [produit minimum viable], on regarde les usages, on coupe ou on développe. Donc ce n’est qu’une première "flavor" [3] de ce qu’ils peuvent faire ».

Test personnel sur le juridique

J’ai testé GDS sur mon domaine. Je rejoins S. Chignard. Sur le droit et les données juridiques publiques, ce n’est pas encore ça :-( Ainsi, taper le mot-clé "droit" https://toolbox.google.com/datasetsearch/search?query=droit&docid=5H10VrhD%2BqcVLOxTAAAAAA%3D%3D … devrait amener dans les premiers résultats les jeux de données publiés par Legifrance, la Cour de cassation, le ministère de la Justice et Conseil d’Etat. Eh bien non, aucun.

Avec "cassation", c’est la cata : https://toolbox.google.com/datasetsearch/search?query=cassation&docid=YrLq%2Fxfj8PzLTwoqAAAAAA%3D%3D … "justice" fait à peine mieux.
Pour permettre l’évaluation de ces résultats de GDS, voici ce que le moteur devrait trouver avec ces mots-clés :
https://www.data.gouv.fr/fr/search/?q=justice
https://www.data.gouv.fr/fr/search/?q=cassation
https://www.data.gouv.fr/fr/search/?q=jurisprudence

On le voit, data.gouv.fr est très mal indexé par GDS. S. Chignard confirme : « Pour data.gouv.fr par exemple, Google Dataset Search a amené la semaine dernière un peu plus de 550 visites ... sur un total de 81 000. »

Data.gouv.fr peut lui aussi mieux faire

En défense de Google Dataset Search, il faut reconnaître que les datasets juridiques de data.gouv.fr ne sont pas toujours accompagnés des bons mots-clés :

  • par exemple, sur la page du jeu de données Jurisprudence anonymisée de la Cour des comptes (2006-2008 et 2010-2015) … le mot "droit" n’apparaît pas dans le texte de présentation
  • le droit, le juridique n’est même pas une catégorie thématique du portail d’Etalab. Clairement, data.gouv.fr pourrait bénéficier d’un classement thématique plus précis, plus détaillé, et avec des sous-classes — un seul sous-niveau pourrait suffire à mon avis.

En discutant sur Twitter avec un formateur SEO de Google, Vincent Courson, et S. Chignard, je cerne un peu mieux les causes et remèdes possibles — mais ça reste en partie du domaine de la supputation.

Vincent Courson fait remarquer qu’au début de Google, le moteur s’appuyait fortement sur le déclaratif des gérants de sites web (les balises méta [4] titre et description) pour comprendre de quoi parlait une page web. Aujourd’hui, le moteur va beaucoup plus loin en se baant sur beaucoup d’autres signaux, et préfère d’ailleurs les signaux réels (contenu des textes, champ lexical, images, etc...) plutôt que les signaux déclaratifs. C’est notamment l’effet du NLP (traitement du langage naturel) à la sauce ML (machine learning) implémenté par Google.

Pour S. Chignard la question est : quels sont les signaux réellement pertinents pour les jeux de données ? La pertinence du Page Rank tenant en partie à l’analyse des liens, ce n’est pas forcément aisé à ce stade pour les données puisque par définition il y aura peu de liens vers un jeu de données (un document ayant lui un sens, attirera beaucoup plus de liens).

Cela dit, désormais, le PR n’est plus du tout un facteur majoritaire pour Google Search. Mais cette évolution du moteur a pris des années. C’est peut-être le temps qu’il faudra à GDS, avance Vincent Courson.

Sinon, il estime que le balisage Schema peut servir pour indiquer les détails sur la "coquille" elle-même : titre, keywords, owner, etc... Mais pour autant, il se baserait plutôt sur l’analyse de la data elle-même, plutôt que la coquille.

C’est vrai, le contenu réel est plus pertinent et n’importe quel site peut tricher sur son texte de présentation et ses métadonnées. Il faudrait donc se baser sur le seul jeu de données ?

Je ne pense pas. Je me dis :

  • que certains jeux ayant une masse énorme, cela peut rendre le travail d’indexation extrêmement lourd et difficile
  • et qu’ici une part importante des sites sont des sites officiels, peu susceptibles du jeu malsain consistant à tricher sur la description et les métadonnées des pages. Et les algorithmes le "savent" puisque c’est marqué dans les URLs desdits sites (.gouv.fr).

En résumé, le travail de description thématique par les sites officiels de leurs jeux de données reste à mon avis une piste importante pour améliorer la pertinence des recherches de datasets — et d’ailleurs, pour tous les moteurs du Web.

Souci à long terme ?

Aaron Tay conclut son billet de manière très claire : « Leaving Google dataset search as the one and only comprehensive dataset search is dangerous, Google is a commercial company and could at any time shutter the service. There has been recent talk about the need for open infrastructure on top of open data and open access and clearly the same holds for dataset search tools. »

S. Chignard redoute que les sites officiels se fassent quasiment déposséder de facto de leurs jeux de données : « Il sera alors temps de se poser la question du risque de désintermédiation des plateformes open data au profit du moteur de recherche » Pas faux.

Emmanuel Barthe
recherchiste juridique, veilleur


Du mieux pour les non juristes

EUR-Lex : nouvelle version optimisée pour les seuls mobiles

Une catastrophe ergonomique pour les knowledge workers

Mardi 18 septembre 2018

Lire la suite »

Le site juridique officiel de l’UE, EUR-Lex, vient de faire peau neuve ce 11 septembre 2018 pour s’adapter aux mobiles.

Une vidéo de 4 mn en anglais expose les changements les plus importants :

Toutefois, pour en savoir plus, il faut lire la page Latest development d’EUR-Lex et faire ses propres tests.

Suppression des onglets = perte sèche en ergonomie

A première vue, si les utilisateurs d’interfaces mobiles seront certainement satisfaits, les réactions des professionnels risquent d’être mitigées.

Principal changement : le système à onglet a été remplacé par un système très web 1.0 de pages rubriques réunies par une page sommaire.


La nouvelle page d’accueil/sommaire d’EUR-Lex au 11 septembre 2018, sous ordinateur/PC/grand écran

La facilité de navigation du site est directement — et en partie négativement — impactée :

  • la structure du site, son organisation par rubriques est plus claire, il faut le reconnaître. Ca va bénéficier au grand public non juriste
  • il est désormais impossible de passer directement d’une rubrique à une autre.

Il faut à chaque fois :

  • soit, si on est sur ordinateur, repasser par la page d’accueil, que ce soit par le bouton Back du navigateur ou en cliquant sur le lien Page d’accueil dans le chemin de fer/fil d’Ariane sur fond noir disponible en haut de page
  • soit, si on est sous smartphone, cliquer sur le bouton MENU.

Autant c’est acceptable voire plus simple sur un smartphone, autant sur un ordinateur fixe ou portable, c’est anti-pratique. Et désolé, mais le petit bouton MENU bleu d’EUR-Lex ne répond pas aux règles standard en la matière, celles du menu dit "hamburger" pour smartphone :

  • positionnement non respecté : il devrait être tout en haut et à gauche, à la place de l’actuel logo EUR-Lex. Voyez par exemple le respect presque général de ce standard dans la variété des designs web de menus hambugers présentés sur la page Hamburger Menu Design Inspiration du site CodeMyUI
  • graphisme/dessin non standard :
    • le menu doit consister en 3 lignes noires [5] voire blanches, contrastant fortement, et assez épaisses pour ne pas être ratées.
      En effet, comme le rappellent aussi bien le jeune développeur et spécialiste UX (ergonomie) Nick Babich [6] que le cabinet Nielsen Norman du vieux gourou et fondateur de l’UX (ou "usability") Jakob Nielsen, « le principal désavantage du menu hamburger est sa faible "découvrabilité" » [7]. Parmi les solutions, N. Babich suggère notamment ... une barre de menus [8]. Orienté applications pour iPhone, le designer Fabian Sebastian, dans un post sur son blog Medium UX Planet va même jusqu’à affirmer que « les barres d’onglets sont les nouveaux menus hamburger » [9]. Elle aussi orientée iOS,la société Apptimize a publié un Ultimate guide to the hambruger menu dans lequel elle voit bien la valeur des menus hamburger, mais propose aussi des alternatives quand cela est indiqué
    • il doit se fermer non en cliquant à nouveau sur le hamburger mais en cliquant sur une croix apparue en haut à gauche.

Ce non respect des standards rend ce menu difficile à repérer et identifier comme tel.

Du point de vue des "knowledge workers" (veilleurs, documentalistes, juristes ..), c’est une régression ergonomique : se déplacer et chercher dans EUR-Lex prend une fois et demie plus de temps, car il faut multiplier les clics et on a perdu toute vue globale.

EUR-Lex aurait pu développer une version mobile en plus de la version par onglets ou réfléchir à une autre solution pour garder cette vue d’ensemble du site et la navigation rapide qu’on avait. OK, ça a un coût, mais c’est quand même l’éditeur officiel de l’Union européenne, qui publie plus de 200 000 textes par an (toutes versions linguistiques comprises) et fait 5 millions de visites par mois ... A ce niveau, il est possible de faire un effort.


La nouvelle page d’accueil/sommaire d’EUR-Lex au 11 septembre 2018, sous smartphone

Lorsqu’on rétrécit la page d’EUR-Lex, elle s’adapte de la manière habituelle pour un site mobile : les menus et les colonnes passent en étagement vertical. La lisibilité sous smartphone est donc assurée, et les tablettes ont elles aussi une mise en page adaptée.

Fonctions recherche et alerte : pas de changement

Seule la page de recherche avancée et la possibilité, sous un compte personnel, de mettre en place une veille par RSS ont été épargnées. Maigre consolation. NB : si vous cliquez sur Recherche dans une page rubrique, vous êtes renvoyé sur la page Recherche avancée.

Pour autant, les tweets d’EUR-Lex ne montrent pas de signe de passage un jour à une alerte par email. La fonction de veille proposée — et pourtant je suis partisan du RSS — est moins simple.

Je connais les arguments anti-e-mail. Je suis le premier à les rappeler : gérer une "mailing list" de cette taille (des dizaines de milliers d’adresses email) est une tâche épouvantable — rien que la gestion des adresse mail devenues fausses. Et il faut l’outsourcer, sinon ça peut aisément "tuer" le serveur (de messagerie). Pour autant, rien à faire, une alerte e-mail manque.

D’autres sites basculent vers une version optimisée uniquement pour mobile

Et EUR-Lex n’est pas le seul. On a récemment vu une nouvelle version de Lexis 360 optimisée pour les seuls appareils mobiles, où heureusement il y a eu très peu de pertes [10]. Et Lextenso, depuis 2017, est aussi sur une version optimisée pour mobile.

Du fait du passage par les consultations mobiles de la barre des 50%, on peut s’attendre à d’autres évolutions de ce style ailleurs. Et pour faire des économies, une seule version : la mobile.

Disons le donc clairement : ce qui commence à ressembler à une dictature du mobile n’a pas que des avantages. Car au bureau, on ne travaille pas sur mobile, mais sur grand écran. Il n’y a pas que les traders qui travaillent avec un double écran. Du fait de la nécessité d’avoir de visualiser de nombreux documents en même temps, les juristes s’y mettent aussi.


Une des pages rubriques de la nouvelle version d’EUR-Lex au 11 septembre 2018, sous ordinateur/PC/grand écran

Réorganisation du site

Côté organisation du site, les rubriques du site ont été revues.

Le menu comporte quatre catégories principales, en plus du JOUE déporté en haut à droite : Législation de l’UE, Jurisprudence de l’UE, Législation et jurisprudence nationales et Informations.

La plupart des rubriques et sous-rubriques ont été renommées. Par exemple :

  • "Législation de l’UE" s’appelle maintenant "Actes juridiques", ce qui est plus logique et plus rigoureux, sans conteste, mais va perturber des habitudes bien ancrées
  • "Procédures législatives" est devenue "Procédures d’élaboration de la législation". Là, c’est plus clair pour les non juristes, mais moins clair pour les juristes. C’est bien ce que je disais plus haut : cette nouvelle version n’est pas pour les professionnels
  • "Répertoire de la jurisprudence de l’Union européenne" devient "Répertoire de la jurisprudence". Là, ok, c’est juste plus simple et ça revient au même
  • "Mesures nationales de transposition" — ex-mesures nationales d’exécution (MNE) [11] — devient "Transposition nationale". Là, en revanche, je ne suis pas certain que ce soit plus clair pour les grand public. Le juriste lui n’y verra que du feu
  • "Actes préparatoires de l’UE" devient "Documents préparatoires". Là, ok, c’est un peu plus clair pour le grand public, sans que le juriste y perde.

Cybersécurité : passage en HTTPS

Probablement sous la pression de Google qui depuis 2018 stigmatise les sites non-sécurisés (non HTTPS) et par souci de passer aux nouveau standards de cybersécurité, EUR-Lex a adopté le protocole HTTPS. Tous les accès à EUR-Lex au moyen du protocole HTTP sont automatiquement réorientés pour utiliser le protocole HTTPS.

L’HyperText Transfer Protocol Secure, plus connu sous l’abréviation HTTPS — littéralement « protocole de transfert hypertexte sécurisé » — est la combinaison du HTTP avec une couche de chiffrement comme SSL ou TLS.

HTTPS permet au visiteur de vérifier l’identité du site web auquel il accède, grâce à un certificat d’authentification émis par une autorité tierce, réputée fiable. Il garantit théoriquement la confidentialité et l’intégrité des données envoyées par l’utilisateur et reçues du serveur [12].

Je continue de tester. D’autres remarques viendront peut-être enrichir ce post.

Le fil Twitter du débat est .

Emmanuel Barthe
documentaliste juridique, veilleur


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 80

Dernières brèves