Portails juridiques officiels - Diffusion des données juridiques publiques

Dernier ajout : 9 octobre.

Derniers articles

Retards sur le sommaire HTML, pas d’indexation avant trois jours

JOUE électronique authentique : des défauts de jeunesse

Explications et solutions

Mercredi 14 mai 2014

Lire la suite »

Les problèmes

Sur la liste Juriconnexion, plusieurs veilleurs et documentalistes juridiques ont remarqué que depuis la mise en place du nouvel EUR-Lex (l’ancienne version n’est plus tenue à jour depuis fin mars 2014), la consultation du Journal officiel de l’Union Européenne (JOUE) est rendue plus difficile qu’avant par l’absence fréquente sur les dates récentes des sommaires du JOUE en HTML (pages web). Le site précise dans ces cas-là que « le texte n’est pas affiché parce que la version HTML du document n’a pas encore été publiée ou n’existe pas ».

Autre difficulté créée par ce retard : comment faire un lien hypertexte vers un texte précis (et non un JOUE entier) ?

Autre problème classique sur EUR-LEX : les alertes par e-mail.

A noter enfin que pendant 2-3 jours, ces nouveaux documents non signalés par un sommaire HTML ne sont pas non plus indexés par le moteur d’EUR-Lex.

Les explications

L’explication de Stéphane Cottin :

« L’importante modification de EUR-Lex depuis cette année est (en partie) issue de la décision de faire de la version électronique du JOUE une "forme de publication juridiquement contraignante" (règlement n° 216/2013 du Conseil du 7 mars 2013 ) et donc depuis lors "seul le Journal officiel publié sous forme électronique (ci-après dénommé « édition électronique du Journal officiel ») fait foi et produit des effets juridiques."

Un des effets de bord de cette décision est que la version pdf signée est celle qui est privilégiée, et d’abord mise en ligne. Les autres versions (dont HTML) peuvent mettre 3 jours ouvrables à être réalisées : voir le point 3 de la très instructive FAQ d’EUR-Lex. »

Voici les réponses du helpdesk d’EUR-Lex obtenues par une collègue :

« 1. En règle générale les Journaux Officiels en version électronique sont chargés dans EUR-Lex au cours de la journée de publication, après qu’on leur ait attribué une signature électronique. Ceci peut engendrer certains retards en effet. La chaîne de publication est toutefois en cours d’amélioration et nous espérons pouvoir accélérer ces procédures dans un futur proche.

2. Les JOs doivent être publiés en deux formats dans EUR-Lex, HTML et PDF. Ce dernier est le format correspondant à la signature électronique et devrait être toujours présent. Le HTML suit normalement peu après, mais dans certain cas isolés, suite à des contraintes techniques, il peut être en effet en retard. Normalement au plus tard quelques jours après la date de publication officielle les deux formats doivent pouvoir y être.
Pour tout cas spécifiques où vous ne voyez pas ces deux formats, nous vous invitons à nous contacter pour plus d’informations et pour qu’on puisse effectuer des vérifications.

3. En effet le sommaire est disponible uniquement une fois que le HTML est mis à disposition aussi, car il s’agit du format ouvert par le système pour afficher le sommaire. Une fois nos actuels problèmes résolus il devrait être toujours disponible afin de permettre la visualisation du sommaire. En attendant, il est vrai que la seule solution est d’ouvrir le PDF du JO complet pour avoir accès aux différents textes.

4. Le problème de création de liens vers les documents qu’un JO contient, en effet uniquement possible lorsque le HTML est disponible, sera aussi résolu, comme indiqué au point 3.

5. La construction manuelle d’un lien est toujours possible, mais pas nécessaire du moment que le HTML du JO est disponible. Il suffit en effet de suivre les liens proposés et de copier le lien depuis la notice des documents, une fois effectué le choix de format (PDF) et la langue requise. De nouveau, le bon fonctionnement d’une telle procédure dépend de la disponibilité (nécessaire) du JO en format HTML, qui ne sera plus un problème une fois nos problèmes actuels résolus.

6. Le documents que les JOs contiennent sont directement disponibles dans EUR-Lex, mais leur indexation requiert quelques jours (et ça a toujours été le cas). Avant la fin de telle indexation, qui correspond aussi à l’attribution d’un CELEX, les documents ne peuvent pas être trouvés via des recherches sur base d’identifiants. Durant ces 2-3 jours, il n’est possible de trouver les documents que via le sommaire des JOs ou via des recherches "texte" dans leurs titres.

7. Il est possible d’être informé à chaque publication de JO, via le service RSS d’EUR-Lex. Aucun service email n’a été maintenu malheureusement [1]

Nous vous invitons à consulter les pages suivantes à ce sujet, et éventuellement nous recontacter s’il vous faudra une aide ultérieure.

Pour un exemple pratique, veuillez aussi consulter notre tutoriel->http://eur-lex.europa.eu/content/guided-tour/home-guided-tour.html]. »

Des solutions

S. Cottin propose des solutions au problème évoqué :

Il est toujours possible d’imprimer "au format PDF" juste les pages concernées et ainsi de réaliser le jour même un document pdf (sans attendre l’HTML) d’un texte publié au JOUE, sans avoir à les imprimer puis rescanner.

Et pour réaliser des liens directs vers des parties du JOUE (créer ou même anticiper des URI), les explications sont au point 16 de la FAQ. »

Stéphane Dufour (BIU Cujas) propose une autre solution :

« On ne trouve donc ce règlement que dans la version PDF du JO. Il est possible d’extraire certaines parties d’un PDF avec Acrobat pro :

  • Ouvrez le fichier PDF dans Acrobat et choisissez Outils > Pages > Extraire
  • Spécifiez l’intervalle de pages à extraire
  • Dans la boîte de dialogue Extraire des pages, cochez la case Extraire les pages sous forme de fichiers distincts

A titre personnel, sur le problème du délai d’indexation de 2 à 3 jours, à part la lecture des derniers JOUE, j’évoquerai la possibilité d’interroger les bases payantes, où l’indexation des textes officiels est plus rapide (normalement au plus tard dans la journée).

D’autres bugs

Stéphane Dufour a « trouvé aussi d’autres bugs sur EUR-Lex​ :

  • certains liens, notamment vers l’Observatoire législatif, ne sont pas encore opérationnels pour les textes avant 2014
  • de même, si vous effectuez une recherche depuis l’interface intégrée au site Europa "Consulter la législation", les résultats ne tiennent pas compte de vos critères d’interrogation. Il faut donc privilégier l’accès direct à EUR-Lex http://eur-lex.europa.eu
  • les filtres disponibles pour restreindre la recherche ne fonctionnent pas tous ; parfois le message suivant s’affiche : "Service temporairement indisponible Error​ :​java.lang.IllegalArgumentException" ».

J’ajouterai à cette liste quelques illogismes, comme le fait de trouver au mois de mai 2014, sur l’agenda 2014 du JOUE sur EUR-LEX, les mois de juin à décembre 2014.

Ou que la recherche avancée soit si peu mise en avant, alors que seule cette interface permet de chercher par mot-clé (la recherche simple ne le permet pas, aussi incroyable que cela puisse paraître) [2]. Et encore, pour mettre des mots - clés en expression, il faut cliquer sur Options ...

L’expérience montre que lors des changements de version, les problèmes de jeunesse d’EUR-Lex peuvent durer longtemps, notamment du fait que les budgets affectés sont limités — comme chez Legifrance. Toutefois, avec le temps, la majeure partie d’entre eux finissent par être réglés.

Emmanuel Barthe


BODACC.fr : des alertes e-mail gratuites bientôt disponibles ?

Vendredi 31 janvier 2014

Lire la suite »

Stéphane, sur la liste Juriconnexion, signale que la lettre Info presse de la DILA n° 16 du 20 janvier 2014 contenait ceci :

« Dans le courant du 1er trimestre 2014, la Direction de l’information légale et administrative (DILA) proposera gratuitement un service d’alertes dédié aux annonces commerciales du BODACC. Pour bénéficier de ce nouveau service de veille, il suffira de créer un compte utilisateur sur le site BODACC.fr et de définir des critères de recherche (numéro d’immatriculation au registre du commerce et des sociétés, dénomination de l’entreprise, mot-clé, …). L’abonné sera ensuite alerté quotidiennement par courrier électronique de toute nouvelle publication d’annonces commerciales au BODACC. »

A signaler que Pressedd a retiré ce contenu de sa base de presse au 31 décembre 2013 mais qu’un éditeur juridique a annoncé qu’il le chargera sur sa plateforme en ligne en 2014.

Pour les autres fournisseurs du BODACC et d’alertes mail sur celui-ci, voir mon billet sur ce blog : Accéder au BODACC : problèmes et solutions.
Nous y écrivions justement : « l’accès en ligne étant devenu gratuit (sur bodacc.fr) une seule limite demeure aujourd’hui : la veille, autrement dit être alerté sur les modifications parues au BODACC concernant une entreprise. Le site bodacc.fr ne l’offre toujours pas. Et ailleurs [voir les ressources listées dans le billet], c’est payant. »


Les licences Legifrance deviennent gratuites. L’UNESCO lance son Open Access Repository

Comme les choses changent ... dans l’édition juridique

Et le futur ? : La bataille du référencement

Dimanche 19 janvier 2014

Lire la suite »

Deux révolutions toutes fraîches

Comme les choses changent depuis quelques années dans l’édition juridique. Parfois, on se frotte les yeux, tant on a du mal à y croire. Côté éditeurs publics, juste deux exemples, littéralement "incroyables" il y a 10 ans, voire même 6-7 ans [3] :

  • les bases de données juridiques publiques (CASS, INCA, JADE, JORF etc.), autrement dit le contenu de Legifrance devient librement et gratuitement réutilisables. Fin des licences payantes Legifrance (donc pas de celles des bases Jurica ni Ariane Intégrale [4]).
    Quelques conséquences a priori prévisibles :
    • comme l’écrit Michel Vajour pour le GFII : « Cette élimination totale [5] des barrières à la réutilisation des bases juridiques, qui place la France parmi les pays les plus innovants en matière de réutilisation, devrait permettre un développement des usages de l’information juridique, en particulier pour des applications analytiques basées sur des technologies de "text mining" et de "data mining" ». Google et al. ne devraient pas être longs à saisir l’opportunité.
    • cela sert la diffusion du droit français face au "forum shopping"
    • le marché de l’édition juridique ne devrait à mon avis pas voir de baisse de prix dans les bases de données, mais en revanche les petits acteurs et les futurs entrants seront en situation (un peu) plus favorable qu’auparavant
  • et — tiens ! comme par hasard, et comme quoi le mouvement est global — du côté international, l’UNESCO vient de lancer son Open Access Repository (OAR) en rendant plus de 300 livres, rapports et articles en ligne accessibles gratuitement. L’OAR opérera sous une nouvelle licence ouverte développée par les Creative Commons (CC) spécifiquement pour les organisations internationales (communiqué UNESCO du 10 décembre 2013).

Le problème/la clé est que désormais, c’est la visibilité — autrement dit l’indexation par les moteurs publics et la duplication par les grands acteurs — qui comptent dans une société mondiale de l’information de plus en plus concurrentielle — et, pour le systèmes juridiques, dans un monde de "forum shopping" croissant. Et cette tendance était déjà à l’oeuvre depuis des années. Quelques exemples :

  • Legifrance avait pris un virage notable lorsqu’il devint facilement indexable par les moteurs de recherche (notamment par Google) grâce aux URLs (adresses web) fixes des documents. Autrement dit, plus besoin de se rendre sur la page d’accueil de Legifrance, on reste sur son moteur favori, ce qui facilite l’interrogation du fonds. Il est vrai toutefois que ça fonctionne beaucoup mieux avec les textes officiels qu’avec la jurisprudence [6]
  • mi-2012, déjà, les licences Legifrance avaient failli devenir gratuites
  • autre exemple : le travail de l’Université de Bielefeld, une démonstration toute simple de l’utilité des entrepôts institutionnels moissonnables.

Pour reprendre — en la tordant quelque peu — une célèbre expression, ne tendrait-on pas à aller vers : « Publish freely online or perish » ? A titre d’exemple dans le milieu avocats, le site et newsletter associée Lexology [7] assure justement cette meilleure /indexation/diffusion/visibilité en reprenant les articles d’actualité et newsletters [8] publiés par les cabinets d’avocats d’affaires internationaux.

Et le futur alors ? Les fonds ...

Puisque 10 ans plus tôt, on n’aurait pas cru, faisons alors un peu de prospective sur les 5 à 10 ans.

On peut envisager un fonds français en doctrine comparable au Legal SSRN grâce à :

  • la libération des œuvres scientifiques financées par l’Etat et la mise en open data des données et métadonnées (titre, auteur, date, mots-clés etc.) sous le site d’archives "ouvertes" HAL [9], deux événements qui se produiront probablement d’ici 5 ans
  • les revues libres juridiques qui seront à ce moment indexées/interrogeables sous Isidore.

Pour les petits acteurs, l’exemple de Cairn est topique. Ce type de portail de revues scientifiques permet à des petits fonds scientifiques peu diffusés d’augmenter leur référencement et en proposant tant rediffusion et de la vente à la pièce qu’abonnement annuel forfaitaire pour tel ou tel "paquet" de revues. Pourquoi ? Parce qu’ils regroupent les petites revues et parce que leurs métadonnées sont moissonnées (récoltées et mises en base de données automatiquement) par Isidore.

Les profondes modifications de Google Scholar [10] sont aussi un signe de l’usage de plus en plus admis de la recherche intelligente, profonde, croisée, "décomplexée", tout ce qui est permis par les normalisations et les nouvelles puissances de calcul. Evidemment, cela pose des problèmes (vie privée, concurrence...) mais ce n’est pas nouveau en tant que tel, on ne peut pas dire qu’on est pris par surprise : ces problèmes juridiques changent juste d’échelle, et cela permet incidemment de régler d’autres difficultés (plagiat, archivage pérenne, preuve...).

On peut aussi suivre l’action plus modeste mais assez efficace d’Helinia qui communique beaucoup par réseaux sociaux (Twitter, Facebook) et qui contribue à mettre en valeur des colloques, des mélanges ou des thèses en accès libre. En revanche Pages de Doctrine, du fait de son obligation de connexion pour consultation, n’est pas pertinent puisque cela empêche de moissonner leurs métadonnées.

A noter que là, on n’est plus dans l’édition juridique publique mais chez les petits acteurs privés.

A signaler qu’une thèse juridique primée (prix 2014 de la CNIL) [11] a été pour la première fois mise et laissée en accès libre. Il va donc y avoir de plus en plus d’œuvres juridiques scientifiques en accès libre sur Internet. 2014 et 2015 risquent d’être déterminantes à cet égard.

... et leur référencement (portails et moteurs)

A propos de la bataille du référencement, il est de l’intérêt bien compris des laboratoires de recherche juridique de :

  • savoir se déclarer dans HAL (la publication et le rayonnement scientifique sont parmi les critères d’évaluation de l’AERES) et dans le Legal SSRN (y compris pour les publications payantes, puisqu’on leur demande juste les métadonnées)
  • savoir utiliser Zotero et Cairn, Revues.org et Isidore.

Un travail qui pourrait et devrait être mené par les bibliothèques universitaires (BU).

On peut aller un cran plus loin : le moteur de recherche et le référencement devenant des passages obligés, de là, il faut envisager la nécessité d’utiliser des concurrents du moteur dominant (Bing en tant que consommateur, Ixquick et surtout sa version "anonymisée" de Google, Startpage, YaCy) et d’avoir à terme ses propres outils face à Google, Twitter et leurs homologues chinois, Baidu et Sina Weibo.

Idéalement, seraient indispensables :

  • des outils au code "ouvert" pour éviter toute tentation de détournement (autrement dit, publicité des sources et des algorithmes)
  • la confidentialité des recherches, parce que rien que par la liste des mots clefs ramenée à sa plage d’adresses IP, on peut déduire la stratégie d’une entreprise (qui peut d’ailleurs influencer à son tour en orientant ses recherches de façon à induire telle ou telle analyse ...).

Voir pour cela deux billets récents : Les moteurs de recherche anonymes, libres et décentralisés (septembre 2013) et Petit aperçu des moteurs de recherche libres sur Internet (sept. 2012).

Bien évidemment, le débat n’est pas clos, surtout sur le rôle des éditeurs — qui ne sera pas en baisse à mon avis [12]. Les commentaires sont les bienvenus.


1 | ... | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | ... | 71

Dernières brèves