Actualités : derniers articles

Legifrance et les autres n’ont pas de fil RSS ? Gênant mais contournable

Créer un flux RSS pour un site web qui n’en possède pas

Les services de création de fils RSS recommandés

Lundi 5 décembre 2016

Les sites juridiques officiels et le RSS

Certains (doit on dire beaucoup ?) se plaignent que ne figurent toujours pas de flux RSS (je peux les comprendre !) sur beaucoup de sites publics — et non des moindres, comme Legifrance (à part le sommaire par e-mail du JORF, mais l’e-mail est hors concours dans cet article :-) [1] ou les sites des Bulletins officiels.

Seuls les sites éloignés de France ou au minimum de son administration semblent avoir plus de liberté pour créer des fonctions de veille. Exemples :

On a plus généralement l’impression que les sites publics ont interdiction de créer des fonctionnalités de veille — même basiques comme les alertes e-mail, les newsletters et les fil RSS [2]. Alors que le grand public et les associations — et pas seulement les professionnels — en ont besoin. Et la diffusion du droit ne s’en porterait pas plus mal ...

Pour les plus pressés et ceux que la technique effraie, ils peuvent récupérer des fils déjà créés grâce aux services précités. Mais ils sont très rares. Un exemple : les circulaires, un service créé par Guillaume Adréani, ex-responsable de la documentation du Défenseur des droits, grâce au service Feed43 : circulaire.legifrance.gouv.fr (ce flux fonctionne très bien).

Certains services en ligne permettent de contourner ce manque : ce sont des services de création de fils RSS. Ils créent des flux RSS à partir de quasiment n’importe quelle page web.

Les services de création de fils RSS recommandés

Voici les services de création de fils RSS recommandés et utilisés par la communauté des veilleurs français :

- gratuits (plus ou moins) :

  • Feed43, un service assez technique mais puissant : expressions régulières acceptées, création d’un nombre illimité de flux, avec une mise à jour toutes les six heures. Version payante avec mise à jour toutes les heures
  • Fivefilters Feed Creator : limité à 10 résultats par fil. On peut acheter le logiciel pour l’installer sur son propre serveur à partir de 20 euros
  • Deltafeed. Une version gratuite limitée à 15 fils et des versions payantes. Deltafeed est le travail d’un développeur Allemand
  • Queryfeed : très simple d’utilisation, il offre un grand nombre d’opérateurs et de champs. Malgré ce nom très américain, le développeur de Queryfeed est russe
  • dernier arrivé : Exileed permet de créer des fils RSS pour les seuls réseaux sociaux suivants : Vkontakte (le développeur d’Exileed est lui aussi russe), Google+, Twitter, Instagram, Facebook, Youtube, Tumblr et d’autres

- payants, plus "industriels", avec essai gratuit [3] :

  • Feed43 : voir supra. Je le classe ici aussi, vu la puissance de ses fonctionnalités.
  • Feedity : des références prestigieuses. La version gratuite de Feedity est très limitée, le rafraichissement ne se fait qu’une fois par jour, ne ramène que les 5 dernières actus par jour et surtout, le fil se désactive s’il n’y a rien eu de neuf depuis 7 jours sur la page [4]. C’est généralement insuffisant. C’est pourquoi je l’ai listé dans les services payants
  • FeedsAPI.com.

Attention, les grands réseaux sociaux suppriment leurs fils RSS natifs, il faut donc passer par les solutions alternatives recommandées par la communauté :

A noter (mais assez complexe à mettre en oeuvre) : il est possible de créer un fil RSS à partir des résultats d’un Google Search Engine (GSE). Voir l’article Créer des flux RSS sur Google Search via Google Custom Search Engine (mai 2016) rédigé par des étudiants du Master Intelligence Economique et Stratégies Compétitives de l’Université d’Angers.

Pour trouver de nouveaux services de création de fils RSS

Des pistes pour trouver d’autres services de création de flux RSS :

  • suivez le Scoop it dédié au RSS de Serge Courrier RSS Circus : les agrégateurs/lecteurs de flux [5], le RSS va t-il mourir (il n’est pas près de décéder en réalité), les services de création de fils RSS etc.
  • ou cherchez avec la requête web page to OR create OR generator RSS dans un moteur comme Exalead, Google ou Bing. Exemple avec Google : web page to OR create OR generator RSS.

Une page de Bryan Coder, veilleur professionnel et formateur, tient à jour une liste de presque tous les services qui fonctionnent bien à l’heure actuel : Tout ce qu’il faut savoir pour obtenir des flux RSS sur le web 2.0.

Et pour votre veille sur le RSS, abonnez vous :

Ok, j’ai un fil RSS. Maintenant, j’en fais quoi ?

Après, on colle l’adresse du flux RSS créé au bon endroit dans son lecteur/agrégateur de flux RSS comme The Old Reader (gratuit jusqu’à 100 fils), Feedly, Inoreader (payant mais le meilleur lecteur RSS en termes de fonctionnalités à l’heure actuelle) ou Netvibes (gratuit, fonctions avancées payantes) et le tour est joué.

Et si vraiment on veut du mail in fine, on passe par un service "RSS to Mail" :

Tout ça est un peu compliqué, certes, mais nécessité fait loi. Et puis, on n’a plus tellement le choix : si un bibliothécaire/documentaliste/veilleur/chercheur n’est pas un geek aujourd’hui, quel peut être son avenir professionnel à long terme ?

Emmanuel Barthe
bibliothécaire documentaliste et veilleur juridique


Qu’apporte le GCRJ ?

Guide de citation des références juridiques : le Bluebook français est né

Une rapide évaluation du "Red Book"

Jeudi 1er décembre 2016

Le groupe Droit du Syndicat national de l’édition (SNE) a publié en juin 2016 son Guide de citation des références juridiques (GCRJ) sur un site web appelé Ref-Lex [6]. Un travail de deux ans pour harmoniser les pratiques des neuf éditeurs du groupe Droit du SNE et rédiger ce guide, comme l’explique rapidement l’entretien donné par Guillaume Deroubaix et Julien Chouraqui du SNE à ActuaLitté [7].

Le guide est téléchargeable aux formats PDF, XLS et XML.

Comme le rappelle la page Notre démarche, le GCRJ est en fait l’héritier d’une liste SNE des acronymes et abréviations en droit datant de 2004.

Mais ce guide est beaucoup plus que ça. Il est le résultat de deux ans de travail des représentants de neuf éditeurs juridiques français (Berger Levrault, Lextenso, LexisNexis, Dalloz, Editions Législatives, Francis Lefebvre, Wolters Kluwer, Weka, Thomson Reuters) et, même s’il ne patronne pas de son logo le site, de l’éditeur juridique belge Larcier. Un grand absent : Lexbase.

Cinq innovations cruciales

Cinq innovations cruciales ont été apportées au document de 2004 (cf notamment la même page Notre démarche) :

- Des documentalistes juridiques ont été consultés (merci
Juriconnexion :-)

- Ce n’est plus un PDF qui disparaissait du Web de temps à autre mais un site web, visiblement destiné à être pérenne.

- Cette nouveau guide sera à l’avenir mis à jour (si besoin est) au moins deux fois par an. L’ancienne version ne l’était pas.

- L’ancien document de 2004 n’était qu’une liste d’acronymes et d’abréviations accompagnés de leurs développés [8].
Le nouveau est d’abord un guide de citation, d’écriture des références bibliographiques, comme le dit son titre, et accessoirement une liste d’abréviations. La syntaxe de citation d’une référence bibliographique en droit est censée désormais être figée dans le marbre : termes retenus, ordre, abréviations, et même ponctuation.

- Surtout, cette nouvelle version a été réalisée dans un but d’interoperabilité [9]. En clair : les éditeurs à l’origine de ce guide ont choisi d’harmoniser leurs références bibliographiques, sigles et abréviations à compter de juin 2016. L’entretien avec ActuaLitté est explicite à cet égard. Pour citer la FAQ du site : "S’agissant des éditeurs membres du groupe de travail, la recommandation est d’appliquer ces règles dans toutes les nouvelles publications et celles qui sont mises à jour à compter de la diffusion du guide. En revanche, il n’y a pas d’obligation de reprise du fonds existant."
_On sent là que l’effet du Web 3.0 documentaire et éditorial (métadonnées, XML, Open access, archivage OAI, plateformes de publication numériques etc.) a joué à plein. Mais aussi l’influence du Bluebook américain [10], influence expressément reconnue par le groupe Droit du SNE.

Moralité : il a fallu du temps, mais ça valait le coup d’attendre. Bravo aux participants des éditeurs au groupe de travail.

Tentative d’évaluation critique rapide

Maintenant, tentons une évaluation critique rapide [11] :

- Le GCRJ est *très détaillé et très rigoureux*. La version de 2004, aussi riche fut-elle, n’avait pas ce côté "système".
Mais cette rigueur a un inconvénient, déjà relevé par le célèbre juge américain Posner [12] à propos du Bluebook : la complexité, la prolixité (la 20e édition du Bluebook fait 560 pages ...) font d’après Posner inutilement perdre du temps aux juristes quand ils doivent relire leurs articles et recherches et vérifier la syntaxe de leurs références. Et beaucoup d’acronymes et abréviations sont incompréhensibles au commun des juristes — tiens, que croyez-vous que soit l’AJCT, l’ALD, le Dupont ou la CNITAAT ?
C’est probablement pour éviter cet inconvénient que le "Red Book" — comme je serais tenté de l’appeler vu sa couleur dominante — ne rend pas obligatoire tous les éléments d’une citation. Seuls les caractères en rouge sont obligatoires. Ainsi, pour citer un article paru dans une revue juridique, le GCRJ n’exige rien d’autre que titre de l’article, abréviation du périodique et date (voir copie écran supra). Même pas l’auteur. Alors que la recommandation complète contient : Auteur(s), titre de l’article, abréviation du périodique | date, n° du périodique, rubrique, type d’article abrégé | n° de l’article, n° de la ou des pages.

- L’interopérabilité est devenue un besoin critique de nos jours. Ne pas avoir tardé plus longtemps, de la part des éditeurs français/francophones, est bien vu. Prochaine étape : une implémentation française des DTD et schémas XML pour le droit proposés par Legal XML (Akoma Ntoso) ou MetaLex ?

- Le numéro ISBN est désormais recommandé — mais pas obligatoire, dommage — quand on cite un ouvrage. On va enfin pouvoir très facilement retrouver cet ouvrage et le commander sur le Web.

- Le numéro ECLI semble, si j’en crois les exemples donnés, consacré pour citer la jurisprudence. Mais alors pourquoi le numéro ELI pour les textes officiels n’apparait-il pas dans ces mêmes exemples ? Et pourquoi ni l’affichage de l’ECLI ni celui de l’ELI ne sont-ils obligatoires ? En effet, la page Remarque préliminaire sur les identifiants uniques explique : « Selon les cas, et au choix de l’éditeur, ils seront ou non visibles dans les contenus éditoriaux, mais nécessairement présents dans les métadonnées. Lorsqu’ils sont apparents, ces numéros figurent en fin de référence [...]. » Ce que confirme cette autre page du guide.
Est-ce à dire que c’est trop tôt ? Autrement dit : pas encore mais plus tard ? Je pense au contraire que ces numéros doivent apparaître systématiquement *en clair* et dès aujourd’hui.

- La date à laquelle la ressource a été consultée n’est pas retenue par le guide. Or désormais la majorité des ressources consultées le sont en ligne. Et leur mise à jour est devenue plus fréquente encore que sur la version papier. Pensez à la récente réforme du droit des obligations, pensez au droit boursier, au droit fiscal ... La date de rédaction/fraîcheur/mise à jour ne suffit pas. En effet, une ressource citée peut parfaitement avoir été consultée plusieurs jours avant ... une mise à jour, pour ne pas dire plusieurs mois dans le cas d’ouvrages. Alors pourquoi cet oubli ?

- Le GCRJ ne devrait pas admettre que l’on puisse omettre "Cass." devant la chambre de la juridiction judiciaire suprême. Mais c’est une tradition, et puis "Cass." est implicite, me dira t-on. Eh bien, pas pour tout le monde : cela prive grand public et algorithmes d’une donnée de la plus grande et évidente importance.

- Du côté des numéros et autres identifiants, j’aurais une « objection votre Honneur ! » (oui je sais, ça ne se dit pas en France) : le numéro RG (rôle général) n’est pas un véritable identifiant unique. Il ne l’est que combiné au nom ou ou numéro du registre (pénal, civil ...) dans lequel il est inscrit. En pratique, dans une base d’arrêts de cour d’appel sélective il est suffisant. Mais dans une base approchant l’exhaustivité comme Jurica, pas toujours. Et lorsque les décisions pénales du fond auront rejoint Jurica ...

- Le groupe Droit du SNE à fait le choix de l’interopérabilité. Mais alors pourquoi a t-il choisi de s’écarter sur deux points de la norme de citation ISO existante ? Leurs raisons sont valables en tant que telles (encore que : mettre la collection juste après l’éditeur favorise la confusion entre les deux) mais pas dans le contexte de l’interopérabilité. Et puis, pour deux petits points, ça ne me semble pas en valoir le coup.
Enfin, à tout prendre, si on voulait s’écarter de la norme ISO 690, il eut été de mon point de vue plus inspiré de le faire en citant le mois de parution des monographies. En effet, paraître avant ou après la date d’entrée en vigueur d’une réforme n’est pas anodin du tout et j’ai fréquemment rencontré le problème. Au point qu’en catalogage, j’ai dès les années 2000 ajouté le mois de parution dans la zone Notes de la notice.

- Ergonomie : les tableaux ne passent pas sur mobile. C’est plus que gênant, car l’usage du mobile pour aller sur Internet vient de dépasser celle sur ordinateur [13]

A propos, que pensez-vous de Livre Rouge ("Red Book") pour désigner ce guide ? Je sais que l’expression peut faire penser aux Codes Dalloz mais justement, ce sont des codes, pas des livres. Quant au petit manuel de l’ex-dirigeant communiste chinois, c’est un peu loin maintenant. Ref-Lex a déjà été utilisé au moins trois fois pour autre chose (cf note 1) et reste vague, et GCRJ est tout aussi peu évocateur qu’un acronyme comme CNITAAT. Sinon je pensais à "Guide du SNE" puisqu’on parlait autrefois de la "liste du SNE", mais c’est peu attirant.

Je suis preneur de toute autre appellation. Sinon la pratique en créera peut-être une ?

En conclusion, le GCRJ a (presque) tout pour devenir le Bluebook français. Pour qu’il le devienne, il reste aux juristes et aux auteurs à l’adopter. Le côté optionnel de nombreux éléments devrait faciliter cela. Le risque, c’est que les options utiles voire indispensables (comme l’auteur, ou la date de consultation d’une ressource en ligne) restent l’apanage des seuls éditeurs professionnels.

Emmanuel Barthe
bibliothécaire documentaliste juridique, veilleur, formateur

NB : Je note au passage que la page Jurisprudence française donne raison à l’adage d’origine latine selon lequel « Là où la loi ne distingue pas, il n’y a pas lieu de distinguer ». En effet, la page précise : « Depuis le 19 janvier 2006, la CNIL a adopté une nouvelle position et recommande de ne plus distinguer selon que l’accès aux bases de données est gratuit ou réservé. Il est ainsi recommandé d’anonymiser toutes les décisions de droit interne. » Comme nous le mentionnons depuis 2006 [14], ce n’est pourtant pas le cas encore chez tous les éditeurs, notamment hors de ce groupe de neuf éditeurs. Et même chez les neuf, il peut y avoir encore du ménage à faire dans les coins. Les fichiers PDF sont particulièrement concernés.


Très internationales ...

Revues juridiques en accès gratuit : une sélection

... et très universitaires

Dimanche 6 novembre 2016

Depuis, disons, 2007-2008, la création de revues juridiques en accès gratuit (et non en libre accès ou "open access" [15]) est repartie, et surtout, elles tiennent la route.

Derrière, souvent des universitaires (pour la rédaction) et des universités ou des centres de recherche (pour le financement). Une tendance croissante : les nouvelles revues juridiques gratuites sont très orientées mondialisation, donc droit international, DIP, droit communautaire et droit comparé.

Après la première vague constituée par les revues de droit des NTIC :

Après les revues universitaires :

  • le Journal des accidents et des catastrophes (JAC) du Centre européen de recherches sur le droit des accidents collectifs et des catastrophes (CERDACC) de l’IUT de Colmar, qui officie sur Internet depuis février 2000
  • Neptunus, la revue de droit maritime du Centre de droit maritime et océanique (CDMO) de l’Université de Nantes. Neptunus et le JAC ont fait partie des pionniers
  • Champ pénal, nouvelle revue française de criminologie, soutenue par Revues.org, le portail de revues en ligne en sciences humaines et sociales du CNRS et de l’EHESS. Champ pénal est arrivée en 2004
  • le site Persée.fr lancé en 2005, propose des collections certes déjà anciennes mais en accès libre et gratuit (les dernières années de la revue sont payantes et non présentes sur Persée.fr [16], les archives elles sont en ligne sur Persée et gratuites)
  • Actualités Droit international (ADI) du Réseau Internet pour le Droit International (RIDI), revue internationale d’actualité des droits de l’Homme [19]
  • Droits fondamentaux, une revue annuelle sur les droits de l’Homme, publiée par le Centre de recherche sur les droits de l’homme et le droit humanitaire (CRDH) de l’Université Paris II Panthéon-Assas en partenariat avec l’Université de Nantes (service de la formation continue) et avec le soutien de l’Agence universitaire de la Francophonie (AUF). Les archives remontent à 2001
  • la revue Droit et société publiée par le Réseau européen Droit et société (RED&S) avec le soutien de la Maison des sciences de l’homme (MSH) [20]. Tous les articles en ligne gratuitement de 1985 à 2003 (merci la LGDJ) ...
  • SCRIPTed, sous-titrée "A Journal of Law, Technology & Society", s’est lancée en mars 2004.
    Aujourd’hui, bien d’autres revues juridiques gratuites existent en langue étrangère, et pas seulement en anglais.

Après, enfin, les revues d’organismes officiels :

Voici donc :

- Jus Politicum, sous-titrée "Revue de droit politique" — en fait de droit constitutionnel [21].
Trois numéros depuis son lancement en 2008. Mise en page [22] et graphisme [23] somptueux. C’est magnifique et parfaitement lisible, avec les articles en PDF et avec des abstracts en français, anglais et néerlandais : top !
Jetez un coup d’oeil à la liste des membres du conseil de rédaction et du conseil scientifique (en bas de la présentation de la revue) : il y a du beau monde [24]. Allez, un exemple d’article publié dans le n° 1 : Situation présente du constitutionnalisme. Quelques réflexions sur l’idée de démocratie par le
droit
par Jean-Marie Denquin. On trouve même des podcasts !

- European Journal for Legal Studies (EJLS), présenté sur ce blog [25] et lancé en 2007

- Utrecht Law Review, de l’Université néerlandaise du même nom. Une plateforme scientifique pour la recherche juridique trans-frontières, comme le dit la présentation de la revue, qui est d’abord l’oeuvre d’universitaires néerlandais.
Du droit international et comparé, avec des numéros spéciaux à thème, le tout depuis septembre 2005. Et ici comme chez la précédente, on aborde le droit des affaires [26].
Par exemple, le dernier numéro porte sur le droit européen et trans-frontières des sociétés (Companies Crossing Borders within Europe, mars 2008), avec notamment un article sur la société européenne par Noëlle Lenoir. Oui, l’auteure du rapport sur la SE de mars 2007, elle-même. En droit des affaires, on peut signaler aussi le numéro de juin 2006 Special on Supervision and Supervisory Authorities
Là aussi, du PDF et une mise en page nickel. C’est top, vous dis je !

- Existant depuis déjà longtemps (1977), Pouvoirs, revue française d’études constitutionnelles et politiques, passe à la rentrée 2008 sur le Net. Seules les trois dernières années (en glissant) sont payantes, tout le reste depuis 1994 est en PDF gratuit. La chronique de droit constitutionnel de Pierre Avril et Jean Gicquel est, elle, gratuite sur l’ensemble de la période.
Voyez notamment les numéros suivants : Qui gouverne la France ? (janvier 1994) [27], Europe, de la Communauté à l’Union (avril 1994), L’argent des élections (septembre 1994), La démocratie municipale (avril 1995), Les juges (septembre 1995), Les groupes d’intérêt (novembre 1996), La responsabilité des gouvernants (janvier 2000), Les cours européennes. Luxembourg et Strasbourg (janvier 2001), Transparence et secret (avril 2001), Le Code civil (septembre 2003), Le Conseil d’État (novembre 2007).

- Lancée en décembre 2008, Jurisdoctoria est une revue de droit public comparé et de théorie juridique entièrement consacrée à la jeune recherche et dotée d’un mode de sélection des articles publiés d’une rigueur à saluer. Elle publie à peu près un numéro (toujours thématique) par an avec dedans 6 à 7 articles

- La Revue semestrielle de droit animalier (RSAD), signalée par François-Xavier sur la liste Juriconnexion, est publiée sous les auspices de la faculté de Limoges et de son Observatoire des mutations institutionnelles et juridiques (OMIJ). Elle est divisée en trois parties : une partie Actualité juridique (sous la direction de Jacques Leroy, professeur de droit privé à l’Université d’Orléans) ; une partie Dossier thématique (sous la direction de Florence Burgat, directeur de recherche en philosophie à l’INRA) permettant de mettre en exergue un sujet particulièrement sensible sur lequel se croiseraient les points de vue de juristes et de non juristes (l’expérimentation animale, la corrida, les animaux compagnons de solitude, l’abattage rituel, le végétarisme, l’abeille, les animaux classés nuisible, l’animal de compétition, la Chine, l’animal face aux biotechnologies…) ; une partie Doctrine et débats (sous la direction de Claire Vial, professeur de droit public à l’Université Montpellier I) dans laquelle sont publiées des études approfondies, souvent prospectives, sur l’animal tel qu’il est saisi par le droit. La revue est en open access et téléchargeable en PDF.

- Lancée début 2008, une revue de veille en droit des assurances : Actuassurance, dirigée par deux maîtres de conférences de l’Université Lyon III, Sabine Abravanel-Jolly et Axelle Astegiano-La Rizza [28]. Actuassurance se distingue par une périodicité de parution plus élevée que les autres revues juridiques libres et une grande régularité de publication : tous les deux mois, sauf au mois d’août [29].

- la Revue des Juristes de Sciences Po (RJSP), lancée en décembre 2009. Le numéro 2 abritait un dossier thématique sur l’arbitrage et ses évolutions. Cette revue est réalisée par l’Association des Elèves et Diplômés Juristes de Sciences Po. Le n° 3 est sorti seulement en janvier 2011, mais le contenu, essentiellement constitué d’interviews de et d’articles écrits par de professionnels du droit — notamment du droit des affaires (avocats) — est de très haute tenue

- la Revue du droit de la régulation (Regulatory Law Review), lancée en 2010. Je reprend ici la description qu’en a faite Benoît Bréard sur la liste Juriconnexion :
« Cette revue dont Marie-Anne Frison-Roche est la directrice doit faire l’objet, selon la présentation générale qui en est faite, d’une publication en anglais, avec de brefs résumés en français, sur deux supports : papier (aux Petites Affiches) et électronique.
La version électronique de la revue [est censé offrir] gratuitement l’accès au texte intégral des articles ainsi qu’à une newsletter. La mise à jour du site est annoncée comme devant se faire de manière permanente. »

- la Revue de droit Henri Capitant / Henri Capitant Law Review, une revue juridique française lancée fin septembre 2010, bilingue, numérique et papier, et en accès gratuit pour sa version numérique.

- la Revue de jurisprudence de la Cour d’appel administrative d’appel de Lyon, sur le site de l’Association lyonnaise de droit administratif (Alyoda), a démarré très fort fin 2010 et continue avec régularité. Alyoda réunit la CAA de Lyon, des avocats publicistes du Barreau de Lyon et des enseignants-chercheurs en droit public de la Faculté de droit de l’Université Jean Moulin - Lyon 3

- la Revue Francophone de la Propriété Intellectuelle, dont le n° 1 est paru en 2015. La RFPI est la première revue internationale en langue française et en accès libre dédiée à la propriété intellectuelle.

D’autres revues juridiques en "open access" ? Parcourez la liste de la BIU Cujas. Attention : cette liste mélange revues payantes et gratuites. Et toutes les revues en accès libre identifiées sur la liste de Juriconnexion sont répertoriées dans le wiki de Juriconnexion [30].

Certaines revues, y compris parmi les pionnières, n’ont pas — ou ont mal — survécu

- la RAJF, par exemple, dirigée par Benoît Tabaka, avec tous ses articles en droit public. Le site rajf.org, en sommeil depuis fin 2005, est resté un an hors ligne, de l’été 2007 à l’été 2008 [31]. La RAJF "is finally back" en ligne, mais avec des mises à jour juste pour 2008.

- la Revue ASPECTS, sous-titrée Revue d’études francophones sur l’État de droit et la démocratie, était une revue animée par l’Agence Universitaire de l’Agence de la Francophonie. Elle intéressait ceux qui pratiquent le droit francophone comparé. Le troisième numéro avait pour thème Le conflit des égalités. Le site actuel est hélas vide de contenu et l’ancien nom de domaine revue-aspects.info est à vendre

- la Revue juridique polynésienne (RJP), une revue de l’Institut de recherche interdisciplinaire sur le développement insulaire et le Pacifique (IRIDIP) de l’Université de la Polynésie française. Ses archives en ligne remontaient à 1994 mais tout à disparu du Web. Le dernier numéro publié, le hors-série n° 14, datait de juin 2012. Son successeur The Comparative Law Journal of the Pacific - Journal de Droit Comparé du Pacifique à publié quelques numéros semble t-il mais très difficiles à trouver en ligne (voir si le site de l’Université Paris Descartes le volume 2015)

Même sommeil pour :

  • Droit TIC, fondé et animé par Julien Le Clainche
  • The l.i.n.k., newsletter et quasi-revue sur le droit de l’Internet et des télécoms dans les pays européens, rédigée par un réseau d’avocats spécialisés dans ce domaine, tenait le choc, vaille que vaille, depuis 2000. Elle a disparue corps et biens à une date que je n’ai pas pu fixer.

Au final, il y a eu peu de réelles disparitions. Le vrai problème réside dans la difficulté de maintenir la richesse et la régularité des contributions, d’une part, et le financement (des permanents d’abord : rédacteurs-en-chef/secrétaires de rédaction) d’autre part.

Pour remédier à ces difficultés, véritable plaie des revues juriste gratuites, plusieurs moyens existent :

  • Juriscom fait la différence avec beaucoup de ses homologues, et pour y arriver elle a "recruté" une rédactrice-en-chef bénévole, Sandrine Rouja. Le JAC a eu recours à la même technique du "permanent" en "recrutant" comme rédacteur-en-chef bénévole Jo Laengy
  • on peut aussi avoir recours à la communauté, celle des chercheurs mais aussi des professionnels, technique qui fut très utilisée par Droit-TIC, qui à la fois renvoyait vers beaucoup d’articles en ligne mais aussi hébergeait de nombreux mémoires en droit de l’Internet. Dans un style très différent, Jurisdoctoria s’appuie elle aussi sur la communauté des chercheurs en droit mais en faisant pour chaque futur numéro un appel à contributions
  • enfin, cas le plus fréquent, le fait pour une revue en ligne de correspondre à une équipe de recherche universitaire aide à lui assurer une mise à jour régulière et des articles de fond [32]. Mais ce n’est pas une garantie à 100%, car plusieurs revues de ce type ont des difficultés à sortir plus d’un numéro par an
  • ce qui s’est beaucoup développé avec le support internet, c’est le recours aux platefomes d’édition en ligne : Revues.org, Persée.fr. Plusieurs exemples ont été cités supra.

Emmanuel Barthe
bibliothécaire documentaliste juridique


Dernières brèves

Une chronologie

Open data et données juridiques publiques en France : les pouvoirs publics sont lancés

La preuve par 10

Samedi 5 novembre 2016

Lire la suite »

Finalement, le rapport de juillet 2011 rédigé par Mines Paris Tech pour le ministre en charge de l’économie numérique et la Délégation aux Usages de l’Internet "Les données publiques au service de l’innovation et de la transparence - Pour une politique ambitieuse de réutilisation des données publiques" (PDF) [1] et le débat sur l’opportunité de la gratuité des données publiques n’auront pas accouché d’une souris [2]. En tout cas dans le domaine juridique.

En effet, côté données juridiques publiques, les pouvoirs publics français sont vraiment lancés dans l’open data. La preuve par 10 chronologiquement :

- Mai 2011 : le Premier ministre François Fillon pose la nouvelle règle [3] : « la gratuité est le principe, la redevance l’exception » par sa circulaire du 26 mai 2011 relative à la création d’Etalab [4].

- 5 décembre 2011 : lancement du site Data.gouv.fr [5].

- 2012-2014 : ce n’est pas de l’open data mais ça va dans le sens de l’open data, ça accompagne ce mouvement : adoption des numéros et URL (adresses web) stables ECLI(European Case Law Indentifier [6] par la Cour de cassation et le Conseil d’Etat et le Conseil constitutionnel en 2012 et 2013 [7] et ELI (European Law Identifier [8]) par la DILA en octobre 2014. ECLI et ELI permettent de citer (et à terme rechercher, y compris par des automates) respectivement les décisions de justice des juridictions des de l’Union européenne et des Etats membres et les textes officiels adoptés par l’UE et les Etats membres [9]. Même les JO ont leur ELI. Exemple : le JORF du 5 novembre 2014 http://www.legifrance.gouv.fr/eli/jo/2014/11/5 On voit aussi les ELI sous deux formes (selon que le texte a un numéro ou pas, par exemple pour les décrets), mais, par défaut, le NOR est intégré. Exemple pour le décret n° 2014-1315 du 3 novembre NOR : FCPT1413681D : ELI : http://www.legifrance.gouv.fr/eli/decret/2014/11/3/FCPT1413681D/jo/texte ; ELI : http://www.legifrance.gouv.fr/eli/decret/2014/11/3/2014-1315/jo/texte ECLI et ELI avaient préalablement été adoptés en 2011 et 2012 respectivement au niveau européen.

- 2013 : le Sénat publie les bases suivantes en open data sur le portail dédié data.senat.fr [10] :

  • les travaux législatifs (base Dosleg) : ensemble des informations sur les documents parlementaires déposés au Sénat (références depuis octobre 1977 et liens vers le texte intégral depuis octobre 1995)
  • les amendements (base Ameli) : ensemble des amendements déposés au Sénat en commission (depuis octobre 2010) et en séance publique (depuis octobre 2001)
  • les questions (base Basile-questions) : ensemble des informations sur les questions écrites et orales posées par les sénateurs au Gouvernement (références et/ou texte intégral selon la date de la question)
  • les comptes rendus des débats : ensemble des informations relatives aux comptes rendus intégraux de la séance publique depuis janvier 2003. Les comptes rendus intégraux eux-mêmes seront prochainement disponibles.

- Juillet 2013 : Un article discrètement niché dans la loi Fioraso sur l’enseignement supérieur [11] élargit aux chercheurs l’accès aux données de l’administration fiscale [12], jusque là particulièrement bien protégées, sous réserve d’un engagement de confidentialité [13] : « L’accès des tiers, à des fins de recherche scientifique, aux informations recueillies à l’occasion des opérations de détermination de l’assiette, de contrôle, de recouvrement ou de contentieux des impôts, droits, taxes et redevances prévus au code général des impôts peut être autorisé par décision du ministre chargé du budget, après avis favorable du comité du secret statistique institué par l’article 6 bis de la loi n° 51-711 du 7 juin 1951 sur l’obligation, la coordination et le secret en matière de statistiques. » Il s’agit de l’article 104 de la loi, qui modifie l’article L. 135 D du Livre des procédures fiscales (LPF) (voir l’article modifié).

- Novembre 2013 : publication du rapport Trojette sur l’ouverture des données publiques. Son titre est explicite : "Ouverture des données publiques - Les exceptions au principe de gratuité sont-elles toutes légitimes ?" La Gazette des communes le dit à sa façon : Open data : Le rapport Trojette habille pour l’hiver les redevances sur les données publiques.

- Juin 2014 : les licences Legifrance deviennent gratuites et quasi-open data [14] par le décret n° 2014-648 du 20 juin 2014 modifiant le décret n° 2002-1064 du 7 août 2002 relatif au service public de la diffusion du droit par l’internet [15] et son arrêté d’application du 24 juin 2014 relatif à la gratuité de la réutilisation des bases de données juridiques et associatives de la direction de l’information légale et administrative [16].

- Eté 2014 : la DILA met concrètement en téléchargement libre, gratuit et anonyme les bases JORF, CONSTIT, CNIL, ASSOCIATIONS et DEPOTS DES COMPTES ANNUELS DES ASSOCIATIONS [17].

- Octobre 2014 : la DILA prépare l’ouverture (diffusion gratuite) des informations légales et données économiques sur les entreprises publiées dans ses trois bulletins officiels BODACC, BOAMP et BALO (information du 30 octobre 2014).

- Octobre 2014 : la DILA organise un prix Open Law de l’accès au droit [18]. Présentation des projets en lice le 11 décembre 2014.

- Septembre 2015 : la DILA met concrètement en téléchargement libre, gratuit et anonyme les bases CASS (arrêts publiés au Bulletin), INCA (INédits de la CAssation), CAPP (sélection d’arrêts de cours d’appel) et JADE (Conseil d’Etat et cours administratives d’appel) [19].

- Fin 2015 : le président de l’Assemblée nationale Claude Bartolone a annoncé le 12 novembre 2014 que d’ici fin 2015 plus de 800.000 documents de l’AN seront accessibles en open data [20]. Le compte rendu de la réunion du mercredi 12 novembre 2014 organisée par le Bureau de l’Assemblée nationale liste des informations qui seront concernées par cette ouverture :

  • les documents parlementaires ;
  • les coordonnées des députés ;
  • les mandats ;
  • le résultat des scrutins publics ;
  • le rattachement des députés à un parti politique ;
  • l’utilisation de la réserve parlementaire ;
  • la liste des représentants d’intérêts inscrits sur le registre ;
  • la liste des personnalités auditionnées par les commissions ;
  • la présence des députés en commission.

- Avril 2016 : le code source du calculateur d’impôt (dit "Calculette Impôts") est mis en libre accès gratuit [21] sur OpenFisca.

- Fin mai 2016 : le thésaurus des textes publiés au JORF (textes officiels et Codes), SARDE, est mis par la DILA en open data [22].

- La loi n° 2016-1321 du 7 octobre 2016 pour une République numérique, dite loi Numérique ou loi Lemaire est entrée en vigueur. Elle prévoit l’open data des décisions du fond : autrement dit, la diffusion et la réutilisation gratuites des décisions des cours d’appel judiciaires et administratives et des tribunaux de l’ordre judiciaire (tribunaux d’instance (TI) et de grande instance (TGI), conseils de prud’hommes (CPH), tribunaux de commerce (Tcom), tribunaux de sécurité sociale (TASS) et de l’ordre administratif (TAA).
Sous une réserve très forte : le respect — renforcé par rapport aux exigences de la loi Informatique et libertés et du règlement européen qui sera applicable à partir de mars 2018 — de l’anonymat des justiciables personnes physiques. Pour être précis : « Cette mise à disposition du public est précédée d’une analyse du risque de ré-identification des personnes. » La faisabilité de cet open data-là va dépendre des termes du décret, qui est encore en cours d’élaboration à l’heure où nous rédigeons ces lignes.
Pour mémoire, la diffusion de la jurisprudence, son anonymisation et son open data on fait l’objet d’un colloque très riche en informations le 24 octobre à la Cour de cassation. Toutes les interventions sont disponibles gratuitement en vidéo et deux bibliographies quasi-exhaustives ont été publiées à cette occasion [23].

Voilà, on en est là. Pour l’instant. Comme qui dirait : « What’s next ? »

Emmanuel Barthe
juriste documentaliste, veilleur, spécialiste des données publiques juridiques


Inventaire

Les collections anciennes de revues juridiques dans Gallica

Une mine jusqu’en 1939

Dimanche 23 octobre 2016

Lire la suite »

 [24] Voici les liens vers les collections anciennes de revues juridiques dans Gallica :

Attention, la collection est souvent moins complète qu’annoncé :

  • moins complète qu’annoncé dans la notice Gallica. Par exemple, la notice (cliquer sur le titre de la revue en haut de la page) de la collection de la Revue trimestrielle du droit des sociétés et du droit financier annonce 1932-1944, alors que seules les années 1932 à 1936 sont en ligne. Cette différence semble venir d’un copier-coller des dates de la notice présente dans le catalogue BN Opale des collections papier de la Bibliothèque nationale. Cela peut signifier que la BNF entend continuer son programme de numérisation sur ces revues à court ou moyen terme
  • de plus, même en se basant sur la liste des volumes (et non sur la notice Gallica), on a parfois de mauvaises surprises :
    • des années considérées comme faisant partie de la collection peuvent être en fait de simples tables (exemple : l’année 1792 du Bull. civ. est en fait une table alphabétique 1792-1824)
    • si on cherche l’arrêt Blanco (Tribunal des conflits 8 février 1873, Leb. supp. 1, p. 61) Le Lebon 1873 est censé y être, mais il manque justement les 150 pages du premier supplément où devrait se trouver cet arrêt [26].

Pour compléter ce billet :
- celui d’un précurseur, Jean Stouf, ancien étudiant en histoire devenu bibliothécaire : Périodiques juridiques anciens sur Gallica, dernière mise à jour 14 décembre 2012, sur le blog Biblioweb d’Hypotheses.org
- la fiche du Jurisguide : Gallica : les revues juridiques, par Isabelle Fructus (BIU Cujas), dernière mise à jour novembre 2012.

Pour la comparaison (à l’avantage de Gallica en termes de contenu) avec Google Books, voir notre article Gallica contre Google Books : le match !.

Emmanuel Barthe
bibliothécaire documentaliste juridique


Utiliser Google pour des recherches juridiques

Une méthode de recherche fiable sur le Web

Dimanche 9 octobre 2016

Lire la suite »

Sommaire
I. Comment fonctionne Google
II. Comment interroger Google
III. Recherche avancée : exemple d’utilisation
IV. Pour aller plus loin

I. Comment fonctionne Google : quelques principes à retenir

Le contenu de Google :

- Google est un moteur de recherche sur le Web = la plus grande base de données de pages web [27].

- Mais tout n’est pas dans Google et tout n’est pas forcément bien référencé dans Google :

  • Google n’indexe généralement pas les bases de données payantes. Il peut toutefois indexer les titres d’articles payants, car ceux-ci sont affichés avec leur lien sur des pages gratuites (voir par exemple les titres des articles des revues de Lextenso) ou bien le site payant a un fil RSS. Il peut même indexer non seulement le titre mais aussi les auteurs et les mots-clés (pas le texte intégral) lorsque l’éditeur laisse ses métadonnées disponibles librement et gratuitement pour le moissonnage OAI (exemple des articles de revues de LexisNexis, voir infra)
  • il ne couvre pas tout le Web : ni le Web payant, ni le contenu de nombreuses bases de données gratuites [28], ni les sites qui lui interdisent l’accès à tout ou partie de leurs pages (le fameux fichier robots.txt) etc. Au total, on estime que Google n’indexe (i.e. ne reproduit le contenu et ne le place dans son index [29]), au mieux, que la moitié environ des pages web gratuites librement accessibles. Les pire estimations, sous-entendant certes une définition du Web très large puisqu’incluant les darknets, donnent seulement 4% du Web comme indexé [30].
    Un exemple important de ces sites-bases de données plus ou moins difficiles à indexer pour Google sont les bases de données de Legifrance, à l’exception notable (et bien pratique ...) des textes consolidés (LEGI) et du JORF [31]. Il faut donc selon les cas interroger Legifrance par les interfaces de recherche de chacune de ses bases de données (en savoir plus). C’est particulièrement vrai pour la jurisprudence
  • à noter que le machine learning [32] (apprentissage statistique automatique [33]) est utilisé pour toutes les requêtes Google depuis juin 2016. Cet algorithme de Google est appelé RankBrain. Comme l’explique Olivier Duffez de WebRankInfo, « RankBrain est un système basé sur le machine learning permettant à Google de mieux comprendre les requêtes des internautes. Il peut s’agir de requêtes très longues et précises (très longue traîne) ou de requêtes n’ayant jamais été faites et peu similaires à d’autres plus connues. Grâce aux nouvelles méthodes d’intelligence artificielle dont Google est devenu un des plus grands spécialistes mondiaux, RankBrain parviendrait à mieux comprendre ces requêtes difficiles » [34]. Pour autant, le type de requête que décrit O. Duffez (longues, beaucoup de mots peu ou moyennement utilisés) — et qui est le propre des recherches juridiques pointues — ne réussit pas toujours dans Google. C’est probablement autant une limite du Web gratuit [35] que celle du moteur américain
  • à noter également que, comme l’explique Sylvain Peyronnet, chief scientist du moteur Qwant et co-fondateur du laboratoire de recherche privé ix-labs [36], dans une interview au Journal du Net [37], il n’y a depuis longtemps plus un (le PageRank d’origine), ni deux, ni trois algorithmes qui font fonctionner le moteur de recherche de Google mais un grand nombre (peut-être 200 !) d’algorithmes et ils s’influencent les uns les autres tout en étant pondérés par des critères ... et fréquemment modifiés pour améliorer les résultats ou lutter contre les spécialistes du SEO trop habiles [38]
  • Google peut aussi avoir des difficultés à faire remonter en haut du classement de ses résultats des documents très longs où l’information pertinente est noyée dans la masse. Ainsi, sur les PDF très longs (à partir de 30 à 40 pages environ), il indexera tout le document mais privilégiera très nettement dans son classement les mots-clés placés dans le titre, la balise title ou les premières pages écran du document. C’est particulièrement net si on ne restreint pas la recherche avec site: ou filetype:pdf Exemple : les références bibliographiques dans les fichiers PDF que constituent les trois parties des Notes de doctrine relatives aux arrêts de la CJUE et du TPI sur Curia. Contre-exemple : les références bibliographiques des revues de LexisNexis sur http://www.lexisnexis.fr/droit-document car chaque référence a sa propre page web
  • Google peut être en retard sur les mises à jour des sites web les moins populaires ou mettre des jours ou des semaines à indexer correctement un nouveau site web (voir infra), notamment parce que personne n’a encore fait un lien vers lui. Mais il indexe en temps réel les mises à jour des sites institutionnels, universitaires, de presse, des blogs populaires et de tout autre site populaire ou fiable [39]
  • parce qu’il dépend du contenu d’Internet, il ne couvre ni le papier ni la littérature grise. Quoique ... Avec Google Books et surtout le partenariat de très grandes bibliothèques [40], Google indexe énormément d’ouvrages en anglais. Mais du fait de l’opposition des éditeurs français, le contenu en droit français est pour l’instant faible — pas en droit belge.

Les résultats de Google :

- Les résultats sont classés par pertinence. La "pertinence selon Google" tient compte :

  • d’abord des liens pointant vers les pages web et de la qualité de ceux-ci (Google les considère comme autant de recommandations), c’est-à-dire en fait de la qualité de celles-ci (les pages vers lesquelles ils pointent) autant que de la qualité du site faisant les liens. Exemple paroxystique : un site universitaire (site de qualité quasiment par nature selon Google, voir infra) fait des liens vers des pages web du blog d’une spécialiste reconnue du sujet (site de qualité selon Google du fait des nombreux liens établis vers lui par d’autres spécialistes et par la communauté réunie autour de ce sujet, voir infra)
  • et ensuite des mots contenus dans la page web, ceux du titre informatique de la page (balise title), du titre réel de celle-ci (balise H1 ou h2 sinon) et du nom du fichier HTML étant les plus importants
  • de la "qualité" (selon Google) de la page. Le nom de domaine est important ici : les sites universitaires (avec "univ" dans leur nom de domaine en France ou .edu aux USA) et gouvernementaux (.gouv.fr en France, .gov aux Etats-Unis) sont favorisés ; les sites personnels sont défavorisés, sauf s’ils ont leur propre nom de domaine, une forte réputation au sein de leur communauté
  • de la fraîcheur/fréquence de mise à jour de la page. Par exemple, un site personnel réputé dans une communauté, sur des requêtes Google sur lesquelles il possède des pages très pertinentes, va pourtant reculer en bas de la première page des résultats de Google s’il n’est pas mis à jour chaque semaine.

- Cette pertinence est réelle : en règle générale, il suffit de consulter les 30, voire les 50, premiers résultats pour trouver sa réponse et avoir balayé l’essentiel des sites. En général ... Ce qui veut dire que parfois il faut aller jusqu’au 100e résultat (exemple vécu).

- Cependant les résultats de Google sont de temps à autre — ça vient par vagues — pollués par les résultats de sites publicitaires quasiment vides de contenu juridique, comme les sites faisant de la publicité pour des livre de droit du licenciement destinés aux particuliers [41]. Une fois ceux-ci identifiés, Google les "bannit" de son index, mais le problème revient de temps à autre.

- Les résultats sont en général très "frais" :

  • Google indexe très régulièrement les sites importants (exemples : Assemblée nationale, Sénat, etc.)
  • Google privilégie les sites à mise à jour très fréquente, tels les sites de presse (lemonde.fr, liberation.fr, etc.) et les blogs, en les réindexant de une à plusieurs fois par jour
  • néanmoins et de manière logique vu sa préférence pour les liens hypertextes et pour les sites à mise à jour fréquente, Google peut avoir quelques jours de retard sur certaines rubriques peu consultées de sites très vastes et jusqu’à une semaine de retard — en général, plutôt quelques jours — sur l’actualité des sites web les moins importants, qui eux-mêmes sont rarement mis à jour. De même, Google peut mettre jusqu’à plusieurs semaines pour indexer correctement un nouveau site web, c’est-à-dire indexer la totalité de ses pages et les faire monter en tête des résultats sur les questions pertinentes [42].

II. Comment interroger Google

L’essentiel :

  • laisser un espace revient à utiliser l’opérateur logique ET implicite
  • cherchez à utiliser des expressions plutôt que des suites de mots. Google "accroche" mieux là dessus (voir explication détaillée infra).

- 1. Ne vous laissez pas influencer par les suggestions de Google [43]. Prenez 30 secondes pour réfléchir aux mots-clés que vous allez utiliser. Car, même avec Google, cela peut faire la différence entre trouver et ne pas trouver :

  • pensez aux synonymes et quasi-synonymes. Voir aussi infra l’opérateur (tilde).
    Exemple : bail, baux, loyer, loyers, location. Un synonyme, ça peut être aussi un numéro d’article de Code, particulièrement en droit fiscal avec le CGI. Exemple (en recherche de jurisprudence) : responsabilité civile, 1382, faute
  • si vous cherchez la version officielle d’un texte, d’un arrêt ou d’un rapport, utilisez :
    • les termes juridiques officiels, c’est-à-dire ceux utilisés dans les codes et les lois (notamment dans les titres des lois).
      Exemple : redressement et liquidation judiciaires
    • la date complète.
      Exemple : 25 janvier 1985
    • ou éventuellement le numéro.
      Exemple : 85-98 (ce qui évite de trouver aussi la loi n° 85-99 sur les administrateurs judiciaires)
  • si en revanche vous cherchez des commentaires ou de la doctrine :
    • utilisez les noms usuels.
      Exemples : procédures collectives ou redressement judiciaire ou liquidation judiciaire ou difficultés des entreprises en difficulté ou défaillances d’entreprises
    • si vous cherchez des commentaires sur une réforme ancienne, précisez l’année.
      Exemple : 1985 (réforme des procédures collectives)
  • si vous cherchez de l’actualité non juridique ou des articles de presse, utilisez les termes économiques et/ou les expressions du langage courant.
    Exemple : faillite, faillites, fermetures d’entreprises, plans sociaux
  • plus généralement, si vous êtes compétent sur le domaine juridique concerné par votre recherche, tapez les mots et expressions qui devraient se trouver dans les documents que vous recherchez, et surtout dans leur titre et leurs premiers paragraphes. En revanche, si vous n’êtes pas spécialiste de ce domaine et a fortiori si vous n’êtes juriste ou étudiant en droit, évitez d’utiliser cette dernière technique.

- 2. Utilisez le mode recherche avancée pour mieux contrôler votre recherche ou — mieux — apprenez les opérateurs et filtres de Google. Vous pouvez accéder aux options avancées soit sur la page Recherche avancée de Google — et alors pas besoin de savoir comment les écrire [44], soit sur la page d’accueil de Google mais il faut alors connaître les noms des opérateurs et des champs/filtres et leur syntaxe.
Vous pourrez alors :

  • utiliser les opérateurs logiques ET (AND ou espace), OU (OR), SAUF (-), expression (" ") et de proximité (AROUND()). Rappel : en allant sur la page Recherche avancée, vous n’aurez pas à mémoriser leur syntaxe. Toutefois, sur cette page, les opérateurs de proximité comme AROUND() ne sont pas proposés. Les opérateurs de recherche permettent de "pousser le moteur dans ses retranchements". Exemples : on veut des documents relativement simples et à jour pour créer une EURL : créer OR création eurl OR "entreprise unipersonnelle" (on peut aussi ajouter : filetype:pdf) :
    • rappel : tout espace non placé entre des guillemets est pour Google un ET logique. Mais parfois aussi une incitation à interpréter la requête comme une expression : dans ce cas, si cette tendance de Google à tout transformer en expression vous gêne, utilisez la fonction avancée "Mot à mot" sous "Tous les résultats" ou écrivez en majuscules le AND [45]
    • attention : Google ne "comprend" pas les parenthèses [46] et le OR ne joue que sur les mots immédiatement adjacents à lui. Ce qui implique de mettre les mots d’une expression entre guillemets (contrairement à ce qui est recommandé plus haut pour les cas "normaux") si la notion faut partie d’une suite de synonymes. De plus, le premier mot qui commence une suite de OR est le plus important pour l’algorithme [47]. Exemple : résultats OR "chiffres d’affaires" OR bénéfices
    • il faut toutefois bien comprendre que multiplier les synonymes n’apporte pas grand’ chose en terme de pertinence des résultats. Un synonyme voire deux (pas plus, soit trois mots ou expressions maximum) aide mais le plus efficace en général reste le choix de la bonne expression (sans guillemets sauf si ça "part dans tous les sens") [48]
    • utiliser l’opérateur - (SAUF) pour exclure des termes qui faussent les résultats/les "polluent" : le - (moins) fonctionne. La règle générale d’utilisation de l’opérateur SAUF s’applique : n’utiliser le - qu’en dernier recours
    • opérateurs de proximité :
      • signalé en 2010, probablement apparu 5 ou 6 ans auparavant, mais non documenté par Google, l’opérateur de proximité AROUND(n) (où n est un nombre de mots qu’on fixera en pratique à 2 ou 5) est efficace en anglais mais le semble moins en français [49]
      • l’opérateur * ("wildcard") est censé remplacer un (au moins) ou plusieurs mots, je constate son efficacité dans une certaine mesure mais je n’arrive pas à la prouver par A + B
      • de toute façon, la bonne expression (sans guillemets, en général) pourra être tout aussi efficace, voire plus. Disons qu’au minimum, elle obtiendra des résultats différents (donc complémentaires) [50]
    • chercher par expression rend les résultats plus précis/moins nombreux et dans certains cas, évite les résultats hors sujet. Hors de l’interface Recherche avancée, utilisez les classiques guillemets (" "). La recherche par expression est devenue plus souvent nécessaire, face à l’élargissement des recherches pratiqué par Google [51]. Toutefois, ne l’utilisez qu’après avoir testé l’expression sans guillemets, pour les raisons exposées ci-après.
      N’abusez pas des guillemets. On dit souvent dans les cours de recherche sur bases de données ou sur le web qu’encadrer une expression avec des guillemets garantit des résultats moins nombreux et pertinents. Mon expérience, c’est qu’en réalité, les guillemets sur Google n’améliorent souvent pas grand’ chose voire parfois empêchent de trouver les principaux sites web sur un sujet. D’ailleurs Google ne les recommande pas trop fort. Cela dit, c’est vrai que si on veut vraiment *tous* les sites sur une expression, alors il faut utiliser le moteur à la fois *avec* les guillemets mais *aussi sans*, car, du moins si l’on s’en tient aux 30 premiers résultats, certains sites pertinents apparaissent uniquement avec les guillemets et d’autres uniquement sans [52]. En effet, l’algorithme de Google détecte souvent tout seul l’expression et la privilégie dans le classement des résultats. De surcroît, mettre les guillemets, en pratique, réduit souvent — mais pas toujours — un peu la pertinence par rapport à sans les guillemets car ceux-ci éliminent des résultats où l’expression n’est pas totalement identique, voire certaines pages où pourtant celle-ci apparaît clairement ...
  • mettre en premier le mot le plus important de votre question : il aura alors un poids plus important que les autres dans les résultats, en faisant par exemple remonter dans les premières réponses les pages web où ce mot est dans le titre de la page.
    Ce point — non précisé dans l’aide officielle de Google et la plupart des guides de recherche en ligne — peut avoir un effet très important sur le tri des résultats par Google, en amenant dans les dix premières réponses une page web jusque là "perdue" au delà des trente premières réponses
  • choisir la langue des résultats. Peu intéressant : la langue des mots-clés utilisés conditionne celle des résultats
  • limiter les résultats à la France (sites français et non francophones) permet d’éviter à 90% les résultats provenant de sites québécois, belges et d’Afrique du Nord (Maroc, Tunisie, Algérie) et donc de se restreindre au droit français. Voilà une fonctionnalité très intéressante, à utiliser sans modération
  • choisir le format de fichier : Rich Text Format .rtf, Word .doc, Acrobat .pdf, Excel .xls, .PowerPoint .ppt, Access .mdb. Restreindre la recherche aux fichiers PDF permet de ne trouver que des documents sérieux et fiables (mais pas systématiquement pertinents, car ce n’est pas le but direct de cette fonctionnalité). En effet, très souvent, les documents officiels (textes juridiques, rapports) et les articles de revues scientifiques sont au format PDF tandis que les sites perso, ceux tournés vers le marketing et les forums utilisent uniquement le HTML. Hors de l’interface Recherche avancée (autrement dit à partir de la page d’accueil de Gogle), écrivez filetype:[type_de_fichier] à la fin de votre requête. Exemple : filetype:pdf
  • restreindre la recherche à un site : en fait à son nom de domaine (exemple : conseilconstitutionnel.fr est le nom de domaine du site web du Conseil constitutionnel). Ainsi utilisé, Google est presque toujours plus efficace que le moteur interne du site, sauf sur des documents extrêmement récents, peu connus ou "enfouis" dans le site. Ce mode de recherche est particulièrement utile sur les plus vastes sites juridiques : le site du Premier ministre, les deux sites parlementaires (Assemblée nationale, Sénat), Europa, EUR-Lex. Hors de l’interface Recherche avancée, écrivez site:[domaine]
  • restreindre la recherche au "titre" (la balise HTML title, plus précisément) des pages web avec le champ intitle:[un_seul_mot] ou — plus efficace — allintitle:[tous_les_mots_qui_suivent]
  • régler le nombre de résultats par page à 30 voire 50 (au-delà, en général, très peu de résultats sont pertinents). Ca permet de consulter plus facilement et plus rapidement les résultats pertinents. Mais cela implique d’être connecté à votre compte Google, ce qui personnalise fortement les résultats en fonction de votre historique de recherche que Google a mémorisé
  • empêcher Google d’interpréter votre requête (sauf par la langue du système d’exploitation de votre ordinateur) en choisissant dans Outils de recherche > Tous les résultats > Mot à mot [53], sous oublier de vous déconnecter de votre compte Google [54], d’indiquer à Google de ne pas non plus mémoriser votre historique de recherche lorsque vous n’êtes *pas*, cette fois-ci, connecté à votre compte Google ... et de vider vos cookies et l’historique de navigation de votre navigateur web avant de lancer une recherche, voire de lancer dans votre navigateur une session de navigation privée [55].

- 3. Restreignez si nécessaire les résultats à une période de temps. Pour utiliser à fond cette fonctionnalité, il faut passer par l’interface simple de Google (la recherche avancée n’offre pas la possibilité de spécifier l’intervalle de temps exact que l’on désire), cliquer sur Outils de recherche > Date indifférente > Période personnalisée [56] [57].

- 4. Ouvrez les résultats dans une nouvelle fenêtre ou un nouvel onglet, de manière à garder sous la main la liste des résultats. Pour cela : faites un clic droit sur le lien qui vous intéresse, puis un clic gauche sur "Ouvrir dans une nouvelle fenêtre/onglet".

- 5. S’il n’y a pas de résultat intéressant dans l’onglet Web de Google, regardez :

- 6. Toujours rien ? Voyez Pour aller plus loin à la fin de cet article.

III. Exemple d’utilisation de la Recherche avancée de Google

Ici, nous cherchons des articles en matière de cookies parus dans la revue Expertises. Voici comment interroger rapidement les sommaires de la revue Expertises sur le site de la revue :
- 1. réfléchissez aux mots à utiliser pour votre recherche : les juristes s’expriment en général en bon français. Or cookies en français se dit traceurs
- 2. optionnel : si vous avez un compte Google (désactivez alors l’historique dans votre dashboard Google) :
* connectez vous à votre compte
* sur la page Paramètres de recherche, choisissez "Ne jamais afficher les résultats de la recherche instantanée" puis en dessous de "Résultats par page", choisissez d’afficher 30 résultats
* cochez la case "Ouvrir chaque résultat sélectionné dans une nouvelle fenêtre du navigateur"
- 3. allez sur la page d’accueil de Google en français
- 4. limitez la recherche au site www.expertises.info (NB : Google ne prend en compte que des noms de domaine, pas des pages profondes)
- 5. votre recherche doit ressembler à ceci : cookies OR traceurs site:expertises.info
- 6. lancez la recherche
- 7. lisez et triez les résultats. Pour ceux qui vous intéressent : clic droit > Ouvrir le lien dans un nouvel onglet

IV. Pour aller plus loin

- 25 astuces pour la recherche sur Google / Thomas Coëffé, Le Blog du Modérateur 23 juillet 2013. A mettre à jour par une excellente "cheat sheet" encore plus opérationnelle : 30 opérateurs Google pour affiner ses recherches / Thomas Coëffé, Le Blog du Modérateur 23 juillet 2013.

- More awesome search tips from Google expert Daniel Russell, with real-world examples / John Tedesco (reporter américain), 1er juillet 2013.

- Utilisez d’autres moteurs, principalement Bing (le concurrent de chez Microsoft [58]) et Exalead (pour les sites français et francophones) [59], voire StartPage (ex-Ixquick) [60] et les métamoteurs de recherche de personnes. Pour information, DuckDuckGo, dont on parle beaucoup, respecte certes votre vie privée, mais ses performances sont très limitées sur les pages web en langue française.

- Voyez nos articles Utiliser Google à 100%, surtout la bibliographie à la fin parce qu’il commence à dater (2006), et Recherche sur Internet : une méthode (un peu) simplifiée et quelques "philosophies", notamment la méthode des "autorités". Allez (entre autres) voir ailleurs sur le Web (annuaires thématiques de sites, Legifrance, Service-public.fr, bases de données payantes, Isidore, Theses.fr, Revues.org etc.), réfléchissez une deuxième fois à vos mots-clés ou passez à un autre media (prenez votre téléphone ou votre logiciel de messagerie, par exemple, pour appeler un collègue ou demander conseil à un expert) ...

Emmanuel Barthe
documentaliste juridique, veilleur, webmestre, formateur à la recherche en ligne


 

Page parrainée par Convention.fr, le spécialiste des conventions collectives et affichages