Retards sur le sommaire HTML, pas d’indexation avant trois jours

JOUE électronique authentique : des défauts de jeunesse

Explications et solutions

Mercredi 14 mai 2014, par Emmanuel Barthe // Portails juridiques officiels - Diffusion des données juridiques publiques

Les problèmes

Sur la liste Juriconnexion, plusieurs veilleurs et documentalistes juridiques ont remarqué que depuis la mise en place du nouvel EUR-Lex (l’ancienne version n’est plus tenue à jour depuis fin mars 2014), la consultation du Journal officiel de l’Union Européenne (JOUE) est rendue plus difficile qu’avant par l’absence fréquente sur les dates récentes des sommaires du JOUE en HTML (pages web). Le site précise dans ces cas-là que « le texte n’est pas affiché parce que la version HTML du document n’a pas encore été publiée ou n’existe pas ».

Autre difficulté créée par ce retard : comment faire un lien hypertexte vers un texte précis (et non un JOUE entier) ?

Autre problème classique sur EUR-LEX : les alertes par e-mail.

A noter enfin que pendant 2-3 jours, ces nouveaux documents non signalés par un sommaire HTML ne sont pas non plus indexés par le moteur d’EUR-Lex.

Les explications

L’explication de Stéphane Cottin :

« L’importante modification de EUR-Lex depuis cette année est (en partie) issue de la décision de faire de la version électronique du JOUE une "forme de publication juridiquement contraignante" (règlement n° 216/2013 du Conseil du 7 mars 2013 ) et donc depuis lors "seul le Journal officiel publié sous forme électronique (ci-après dénommé « édition électronique du Journal officiel ») fait foi et produit des effets juridiques."

Un des effets de bord de cette décision est que la version pdf signée est celle qui est privilégiée, et d’abord mise en ligne. Les autres versions (dont HTML) peuvent mettre 3 jours ouvrables à être réalisées : voir le point 3 de la très instructive FAQ d’EUR-Lex. »

Voici les réponses du helpdesk d’EUR-Lex obtenues par une collègue :

« 1. En règle générale les Journaux Officiels en version électronique sont chargés dans EUR-Lex au cours de la journée de publication, après qu’on leur ait attribué une signature électronique. Ceci peut engendrer certains retards en effet. La chaîne de publication est toutefois en cours d’amélioration et nous espérons pouvoir accélérer ces procédures dans un futur proche.

2. Les JOs doivent être publiés en deux formats dans EUR-Lex, HTML et PDF. Ce dernier est le format correspondant à la signature électronique et devrait être toujours présent. Le HTML suit normalement peu après, mais dans certain cas isolés, suite à des contraintes techniques, il peut être en effet en retard. Normalement au plus tard quelques jours après la date de publication officielle les deux formats doivent pouvoir y être.
Pour tout cas spécifiques où vous ne voyez pas ces deux formats, nous vous invitons à nous contacter pour plus d’informations et pour qu’on puisse effectuer des vérifications.

3. En effet le sommaire est disponible uniquement une fois que le HTML est mis à disposition aussi, car il s’agit du format ouvert par le système pour afficher le sommaire. Une fois nos actuels problèmes résolus il devrait être toujours disponible afin de permettre la visualisation du sommaire. En attendant, il est vrai que la seule solution est d’ouvrir le PDF du JO complet pour avoir accès aux différents textes.

4. Le problème de création de liens vers les documents qu’un JO contient, en effet uniquement possible lorsque le HTML est disponible, sera aussi résolu, comme indiqué au point 3.

5. La construction manuelle d’un lien est toujours possible, mais pas nécessaire du moment que le HTML du JO est disponible. Il suffit en effet de suivre les liens proposés et de copier le lien depuis la notice des documents, une fois effectué le choix de format (PDF) et la langue requise. De nouveau, le bon fonctionnement d’une telle procédure dépend de la disponibilité (nécessaire) du JO en format HTML, qui ne sera plus un problème une fois nos problèmes actuels résolus.

6. Le documents que les JOs contiennent sont directement disponibles dans EUR-Lex, mais leur indexation requiert quelques jours (et ça a toujours été le cas). Avant la fin de telle indexation, qui correspond aussi à l’attribution d’un CELEX, les documents ne peuvent pas être trouvés via des recherches sur base d’identifiants. Durant ces 2-3 jours, il n’est possible de trouver les documents que via le sommaire des JOs ou via des recherches "texte" dans leurs titres.

7. Il est possible d’être informé à chaque publication de JO, via le service RSS d’EUR-Lex. Aucun service email n’a été maintenu malheureusement [1]

Nous vous invitons à consulter les pages suivantes à ce sujet, et éventuellement nous recontacter s’il vous faudra une aide ultérieure.

Pour un exemple pratique, veuillez aussi consulter notre tutoriel->http://eur-lex.europa.eu/content/guided-tour/home-guided-tour.html]. »

Des solutions

S. Cottin propose des solutions au problème évoqué :

Il est toujours possible d’imprimer "au format PDF" juste les pages concernées et ainsi de réaliser le jour même un document pdf (sans attendre l’HTML) d’un texte publié au JOUE, sans avoir à les imprimer puis rescanner.

Et pour réaliser des liens directs vers des parties du JOUE (créer ou même anticiper des URI), les explications sont au point 16 de la FAQ. »

Stéphane Dufour (BIU Cujas) propose une autre solution :

« On ne trouve donc ce règlement que dans la version PDF du JO. Il est possible d’extraire certaines parties d’un PDF avec Acrobat pro :

  • Ouvrez le fichier PDF dans Acrobat et choisissez Outils > Pages > Extraire
  • Spécifiez l’intervalle de pages à extraire
  • Dans la boîte de dialogue Extraire des pages, cochez la case Extraire les pages sous forme de fichiers distincts

A titre personnel, sur le problème du délai d’indexation de 2 à 3 jours, à part la lecture des derniers JOUE, j’évoquerai la possibilité d’interroger les bases payantes, où l’indexation des textes officiels est plus rapide (normalement au plus tard dans la journée).

D’autres bugs

Stéphane Dufour a « trouvé aussi d’autres bugs sur EUR-Lex​ :

  • certains liens, notamment vers l’Observatoire législatif, ne sont pas encore opérationnels pour les textes avant 2014
  • de même, si vous effectuez une recherche depuis l’interface intégrée au site Europa "Consulter la législation", les résultats ne tiennent pas compte de vos critères d’interrogation. Il faut donc privilégier l’accès direct à EUR-Lex http://eur-lex.europa.eu
  • les filtres disponibles pour restreindre la recherche ne fonctionnent pas tous ; parfois le message suivant s’affiche : "Service temporairement indisponible Error​ :​java.lang.IllegalArgumentException" ».

J’ajouterai à cette liste quelques illogismes, comme le fait de trouver au mois de mai 2014, sur l’agenda 2014 du JOUE sur EUR-LEX, les mois de juin à décembre 2014.

Ou que la recherche avancée soit si peu mise en avant, alors que seule cette interface permet de chercher par mot-clé (la recherche simple ne le permet pas, aussi incroyable que cela puisse paraître) [2]. Et encore, pour mettre des mots - clés en expression, il faut cliquer sur Options ...

L’expérience montre que lors des changements de version, les problèmes de jeunesse d’EUR-Lex peuvent durer longtemps, notamment du fait que les budgets affectés sont limités — comme chez Legifrance. Toutefois, avec le temps, la majeure partie d’entre eux finissent par être réglés.

Emmanuel Barthe

Notes de bas de page

[1Note personnelle : autrement dit, Lex Alert est mort. Il faut savoir que la maintenance d’une messagerie est gourmande en ressources informatiques (serveurs, logiciels, problèmes, temps), donc généralement coûteuse.

[2On dirait un EUR-Lex fait par et pour l’administration européenne, assez peu pour les citoyens et PME.

Répondre à cet article