Actualités : derniers articles

Des apps pour gérer votre bibliothèque papier

Ma Bibliothèque : cataloguez vos livres à toute vitesse. Une appli sans véritable concurrent

Un accessit pour Book Catalogue

Dimanche 24 septembre 2017

Logo de l'appli Ma Bibliothèque

Vous avez beaucoup de livres et de bandes dessinées chez vous ? Vous ne vous y retrouvez plus ? Vous ne savez plus si vous possédez ou pas l’ouvrage que vous venez de trouver chez le libraire ?

Vous êtes bibliothécaire et vous devez inventorier un fonds de 150 ouvrages en 45 mn à l’aide de votre seul smartphone ? Ou préparer de manière simple un désherbage alors que que vos ouvrages ne possèdent ni numéro ni code-barre d’exemplaire ?

Avec l’appli Android Ma Bibliothèque, développée par un Français, Julien Keith, faites rapidement et simplement le catalogue complet de votre bibliothèque papier. Cherchez dans vos livres par auteur, titre, genre ou éditeur [1].

Les avantages de Ma Bibliothèque de Julien Keith

L’application Ma Bibliothèque référence tous vos ouvrages par simple scan du code-barre (en fait le n° ISBN, qui est l’identifiant unique d’un livre) grâce à l’appareil photo intégré à votre smartphone. Une fois l’ISBN trouvé, l’application charge (presque) tout le reste, y compris la couverture et le nombre de pages. Comptez une petite vingtaine de secondes pour traiter un livre.

Points positifs :

  • ergonomie : l’appli est simple et rapide. Un livre est rentré/catalogué en trois clics, à partir d’un bouton Ajouter "+" constamment visible
  • la couverture est bien visible et on peut la voir encore mieux en cliquant dessus
  • le catalogue peut être exporté dans un fichier Excel : une fonction ultra-pratique, notamment pour les bibliothécaires, documentalistes et tout professionnel possédant une bibliothèque papier.
    Or les fichiers Excel sont souvent eux-mêmes convertibles dans un format qu’un logiciel documentaire classique ou un SIGB sait importer, comme le CSV ... Ou comment faire son inventaire/son catalogue en prenant des codes-barres en photo !
  • note pour les geeks, les bibliothécaires et les documentalistes : Ma Bibliothèque utilise les services Google, Amazon, Fnac, Open Library, Worldcat, IsbnPlus et Biblio [2] afin de trouver le livre correspondant au n° ISBN que vous recherchez. Si un ISBN n’est pas trouvé, c’est qu’il n’est pas référencé sur ces services. Vous pouvez alors saisir vous-même à la main les informations. Personnellement, sur une centaine de scans, je n’ai pas encore eu un seul échec avec Ma Bibliothèque
  • trois fonctions très utiles pour les particuliers gros lecteurs :
    • la possibilité de saisir ses souhaits dans une base séparée
    • une case à cocher "Lu" permet de savoir si on a fini l’ouvrage
    • la possibilité de créer ses propres genres, pour y classer des livres. Par exemple, roman policier italien. Par défaut, le champ Genre est rempli avec la matière dont il est affublé dans le catalogue d’où des références ont été téléchargées, ce qui nécessite souvent des corrections
  • l’application est en français
  • elle est gratuite (mais pas open source) et sans publicité. Selon le développeur :

    « Ma Bibliothèque est et restera à jamais gratuite et sans publicité. »

Deux ou trois limites toutefois selon moi (je tiens compte qu’il s’agit d’un produit gratuit, sans publicité et développé par un développeur solo) :

  • Ma Bibliothèque est développée uniquement pour Android [3]
  • il manque le champ Collection
  • et la possibilité de saisir plus d’un auteur. Ce dernier point est particulièrement gênant pour les bandes dessinées (BD), où généralement les auteurs sont deux (un scénariste et un dessinateur) et les ouvrages universitaires ou scientifiques, souvent collectifs.

Les avis sur le Play Store incluent beaucoup d’autres suggestions d’amélioration, ce qui montre l’intérêt pour cette application. Voici celles qui me semblent les plus pertinentes [4] :

  • une fonction pour partager tout ou partie de sa bibliothèque (sans devoir passer par l’export Excel puis le réimport)
  • trier par date de parution
  • trier par éditeur
  • organiser sa bibliothèque par série. Tous les Harry Potter, par exemple. Où tous les Lanfeust de Troy, pour les BD
  • avoir une case à cocher "En cours de lecture"
  • mettre des notes (de 1 à 5 sur 5, par exemple) aux ouvrages pour retrouver ses favoris
  • la synchronisation entre différents appareils équipés de l’appli. Mais ce serait sans doute un développement assez lourd.

Personnellement, j’ai utilisé — et je recommande sans réserve — Ma Bibliothèque dans un contexte professionnel pour inventorier très rapidement de petits fonds ou encore des ouvrages à pilonner. Et dans les avis sur le Play Store, un enseignant explique qu’il a fait le catalogue des ouvrages de sa classe avec Ma Bibliothèque. Ma Bibliothèque serait également utilisé pour gérer une bibliothèque associative à Paris 11e.

L’appli Ma Bibliothèque est notée 4,6/5 sur Android Market pour 2000 votes [5] : une note exceptionnelle, extrêmement rare. La plupart des "bonnes appli" sont à 4,2 ou 4,3 [6].

Elle est très, très simple à utiliser. Elle pourrait l’être encore un peu plus (avec un bouton Ajouter/"+" qui allume directement l’appareil photo) et comporter toutes les zones du pavé ISBD. Là, personnellement, je serais prêt à la payer 5 euros sans problème [7].

Interface de l'appli Ma Bibliothèque

Des concurrents, vraiment ?

D’autres applications utilisant le scan du code-barre existent. Mais il n’y a pas foule ...

J’ai vu les fiches et commentaires sur Libib (non testé), qui ne m’ont pas convaincu. Quant à LibraryThing, l’appli reste encore largement un décalque du site, n’est sortie officiellement que depuis cet été et reste décevante pour les francophones. Et BookBuddy ou ClassBook ne sont disponibles que sous iOS.

Book Catalogue : manque d’ergonomie et ouvrages non reconnus

J’ai testé Book Catalogue. L’appli d’Evan Leybourn et Philip Warner a une note de 4,4 sur 5 pour 4000 votes, et serait mon 2e choix. Pour autant, je ne l’ai pas pleinement appréciée.

Les points positifs d’abord :

  • Book Catalogue est gratuite, et sans publicité
  • elle gère plus d’un auteur, contrairement à Ma Bibliothèque
  • elle possède plus de fonctionnalités que Ma Bibliothèque, notamment la synchronisation avec le site Goodreads et peut être paramétrée. Alors que Ma Bibliothèque n’offre qu’une sauvegarde, et n’a tout simplement pas de menu Paramètres
  • Book Catalogue est open source
  • elle exporte directement au format CSV, format de facto libre, et plus pratique que le XLS de Microsoft.

Les points négatifs l’emportent néanmoins selon moi :

  • le lecteur de code-barre n’est pas intégré, il faut le télécharger séparément. Ce n’est pas grand’ chose, mais quand même
  • interface toute noire, peu esthétique
  • interface peu ergonomique, et là, c’est nettement plus gênant. Par exemple, Book Catalogue exige plus de clics qu’avec Ma Bibliothèque pour réaliser une même opération du fait de l’absence d’un bouton Ajouter. Autre exemple : pour scanner un code-barre disposé horizontalement (cas le plus fréquent), il faut tenir son smartphone en mode paysage (appareil "allongé"), ce qui est moins pratique que le mode portrait (appareil "debout") puisque cela fait une manipulation supplémentaire. Dans un cas similaire, avec Ma Bibliothèque, votre portable reste dans sa position habituelle
  • surtout, des ouvrages non trouvés, alors que Ma Bibliothèque les trouve tous dans mes tests [8].

Interface de l'appli Book Catalogue

CLZ Books : beaucoup plus riche en informations sur les livres, mais là aussi problèmes de reconnaissance d’ouvrages

J’ai aussi testé CLZ Books. L’appli a une note de 4,6 sur 5 (pour 1000 notes) [9] :

  • positif :
    • possède un bouton Ajouter
    • la prise en photo du code-barre fonctionne bien
    • riche en fonctionnalités (notamment la possibilité de faire des sélections parmi les notices) et paramètres — mais rien de transcendant dans ces derniers
    • surtout, offre toutes les zones du pavé ISBD, y compris la collection ("Series") et une très grande richesse de champs pour les notes personnelles (comme Date d’achat ou Nombre d’exemplaires, ce qui rapproche CLZ Books d’une appli professionnelle)
  • moins bon :
    • il n’est pas traduit en français :-(
    • là encore, des ouvrages non reconnus [10]
    • il est payant (15 dollars US). L’avantage dans ce dernier cas, c’est que le support est là, et il est très disponible selon les commentaires [11].

Sous Android, je n’ai donc pas vu globalement mieux pour l’instant que Ma Bibliothèque. Vu les erreurs de reconnaissance des titres que j’ai constatées chez Book Catalogue et CLZ Books, j’aurais tendance à considérer que Ma Bibliothèque n’a pas de véritable concurrent. Si on utilise de telles applis, c’est bien pour ne plus faire de saisie. Donc, si on doit refaire de la saisie, je ne vois pas trop l’intérêt de l’appli ... Mais mon avis est en partie biaisé : étant bibliothécaire professionnel, cette fonctionnalité est pour moi plus vitale que d’autres.

Sinon, si on est dans une optique professionnelle, on retrouve chez les applications Android que j’ai testées une grosse lacune : une seule base de données de livres par appli [12]. Si on veut constituer deux fonds, il faut soit avoir deux appareils mobiles, soit exporter puis supprimer la base de données initiale. La zone Notes peut en théorie permettre de distinguer artificiellement deux fonds mais c’est très peu pratique.

Emmanuel Barthe
bibliothécaire documentaliste et "librovore"


Utiliser Legifrance à 100%

Ou comment savourer chaque feuille du mille-feuilles

Vendredi 15 septembre 2017

Legifrance, une gourmandise ? Je n’irai peut-être pas jusque là ;-) mais un mille-feuilles, oui. Pourquoi un mille-feuilles ?

Des bases de données mélangées

Un mille-feuilles, d’abord, parce que Legifrance n’est pas un simple site web. C’est un produit très complexe, réalisé par un éditeur public, la DILA, et une importante SSII, Sword, avec des bases de données anciennes, dont plusieurs constituées à partir des années 60, combinées entre elles et dont le contenu et la structure diffèrent grandement [13].

Les seuls points communs entre ces bases de données :

  • c’est du juridique, pas des informations sur les entreprises (dites informations légales [14])
  • c’est de la donnée brute (à l’exception des abstracts et résumés de jurisprudence des bases CASS et JADE) et pas du commentaire.

Ces bases de données, de surcroît, sont dans plusieurs cas mélangées.

Principaux exemples de ces mélanges :

  • dans Jurisprudence judiciaire, sont en fait mélangées trois bases de données différentes :
    • CASS, autrement dit les arrêts publiés au Bulletin de la Cour de cassation
    • INCA, c’est-à-dire les arrêts INédits (non publiés au Bull. civ. et crim.) de la CAssation
    • et CAPP, une sélection importante d’arrêts de cours d’appel. CASS et CAPP sont elles mêmes extraites de la base Jurinet, un outil interne à la Cour de cassation)
  • dans Les autres textes législatifs et réglementaires se cachent en fait :
    • le Journal officiel édition Lois et décrets (texte intégral du JORF depuis 1998, mais sans les mesures nominatives)
    • le contenu des anciennes bases LEX (textes avant 1998) et REFLEX (liens entre les textes : tel décret applique telle loi, telle article de loi abroge tel autre ...)
    • la base LEGI des textes consolidés (mis à jour).

Une base non mélangée, en revanche :

  • Jurisprudence administrative est extraite d’une seule base tenue par le Conseil d’Etat appelée Ariane et devenue JADE pour Legifrance.

Non mélangée, mais quand même modifiée : les juridictions suprêmes ne fournissent pas leurs bases telles quelles : à part les descripteurs (appelés Titrage pour la Cour de cassation), la plupart des enrichissements, notamment les liens et les rapports pré-décision, sont retirés.

A ce jour, sont exclues du contenu de Legifrance, les décisions de la Cour des comptes et des chambres régionales des comptes (CRC). Elles sont toutefois accessibles par le biais du site de la Cour des Comptes.

Des trucs de recherche méconnus

Un mille-feuilles, secundo, parce que les meilleures fonctionnalités de recherche de Legifrance sont bien cachées.

Les "trucs" suivants sont méconnus. Alors même qu’ils permettent d’exploiter Legifrance à 100%.

Conseils généraux

- N’hésitez pas à passer d’abord par Google pour une recherche de texte officiel ou de jurisprudence des cours suprêmes. Legifrance étant aujourd’hui très bien indexé par Google, si le document recherché est présent dans Legifrance, il y a de fortes chances pour que Google vous le trouve. Vous pouvez même cibler uniquement Legifrance en utilisant le champ site. Il suffit d’ajouter site:legifrance.gouv.fr à la fin de vos requêtes Google (pas d’espace entre site, les deux points et le nom de domaine).

- Utilisez de préférence l’interface de recherche experte plutôt que la recherche simple. Surtout si vous êtes un juriste ou un documentaliste.
C’est une règle générale des bases de données : ici comme ailleurs, utiliser la recherche avancée vous garantit d’avoir accès à la totalité du contenu de la base de données et à la totalité des fonctionnalités de recherche. Et dans Legifrance, non seulement de nombreuses fonctionnalités de recherche ne sont disponibles qu’en recherche experte, mais certaines informations aussi, comme — nous allons le voir infra — en matière de concordance entre un nouvel article de Code et son ancienne version et pour accéder aux versions futures (non encore entrées en vigueur) d’un article de Code.

- Dans le champ Mots-clés, si vous tapez vos termes sans réglage spécial, ils seront recherchés à 10 mots l’un de l’autre. Vous êtes, sans le savoir, en train d’utiliser ce qu’on appelle un opérateur de proximité.
C’est particulièrement efficace en recherche de jurisprudence car les arrêts inédits sont non enrichis en abstracts et peu structurés. Il faut donc compenser ce manque d’information riche et pertinente par une utilisation plus fine du texte intégral des arrêts.

Jurisprudence

- Si vous êtes en jurisprudence et que vous voulez que *tous* vos résultats soient dans un sujet précis (par exemple la responsabilité civile) et ainsi les rendre plus pertinents et réduire le nombre à passer en revue, la fonctionnalité de recherche reine est le plan de classement de la jurisprudence.
En jurisprudence judiciaire, il s’appelle Titrage, il est accessible en bas de l’interface de recherche experte, il ne couvre vraiment que les arrêts de la Cour de cassation publiés au Bulletin et manque de rigueur [15]. En jurisprudence administrative, il s’appelle Plan de classement de la jurisprudence administrative (PCJA), et là, en revanche, il est très rigoureux et les publicistes l’utilisent volontiers pour cibler correctement une recherche.
Ces plans de classement ne sont repris par aucune plateforme d’éditeur (c’est bien dommage), ils constituent une exclusivité Legifrance.
Deux particularités à ne pas oublier dans le fonctionnement des plans de classement :

  • lorsque vous choisissez cette option de recherche, pour que la fonction "Recherche" soit effective, n’oubliez pas de choisir un élément dans le pavé "Décision" ou dans le pavé "Etendue de la recherche"
  • dans la recherche par le titrage, le déroulement de l’arborescence s’effectue en cliquant sur un des termes proposés ou sur la petite croix noire. La sélection de la recherche se réalise en cochant la petite case (le petit carré blanc) placée devant le terme choisi.

- En jurisprudence, les noms de personnes physiques sont anonymisés, mais seulement ceux-là :

  • il est donc impossible de chercher un arrêt par le nom de la partie personne physique
  • en revanche, il est possible de trouver la décision par la dénomination des personnes morales (nom de société) ou le patronyme d’un auxiliaire de justice, car ils sont exclus du périmètre de l’anonymisation.

- Dans l’interface de recherche de la jurisprudence judiciaire, le numéro d’affaire (dit n° de pourvoi) s’écrit sans le point : 05-20111 et non 05-20.111.

- Pour chercher un arrêt de la Cour de cassation par son numéro de Bulletin (Bull. Civ. Bull. Crim.), bien penser à cocher "Décisions de la Cour de cassation", au préalable, avant la sélection d’autres rubriques pour éviter un trop grand nombre de réponses. Là aussi, cette possibilité de chercher par la référence de publication au Bulletin des arrêts de la Cour n’a pas été reprise par les moteurs de recherche de jurisprudence des plateformes des éditeurs. C’est donc une exclusivité Legifrance.

- Si vous voulez connaître le délai de chargement des décisions de justice sur Legifrance : une fois sur l’interface de recherche, cliquez en haut à droite sur le lien Mise à jour.

Textes officiels

- Pour chercher un article de code dans les textes officiels et les Codes, il faut l’écrire sans espace (et sans l’astérisque le cas échéant) entre la lettre et les chiffres [16]. Exemples : L511-1 ou R123-18.

- La base dénommée "Autres textes législatifs et réglementaires" et celle des Codes permettent d’obtenir la version à jour (on dit "consolidée") d’un texte (loi, ordonnance ou décret) ou d’un article de Code non seulement au jour d’aujourd’hui mais aussi à une date donnée. En clair : Legifrance peut reculer dans le temps.
Pour cela, une fois un texte trouvé, il faut aller dans la colonne de gauche intitulée "Navigation" et, sous la mention "Version consolidée à la date du ...", saisir la date et cliquer sur "Consulter".
Toutefois, cette fonctionnalité ne marche pas toujours et surtout, elle ne peut pas fonctionner sur les années ’70 et antérieures. De plus, sur de longs textes de réforme comme par exemple la loi NRE de 2001 [17], la version consolidée peut ressembler à un véritable gruyère. En effet, le plus souvent, le texte affiché est littéralement troué de partout : la plupart des articles se contentant de modifier des articles de Codes déjà existant, la version consolidée ne fait donc que renvoyer à ces articles de Codes par lien hypertexte, au lieu de les afficher Si on s’intéresse à plus que quelques articles, c’est peu pratique et frustrant.

- Les tables des matières des codes sont parfois modifiées à l’issue d’une refonte ou d’une création de code. Dans ce cas, une table de concordance indique les correspondances entre l’ancienne numérotation et la nouvelle numérotation et inversement.
Ces tables de concordance sont accessibles par deux chemins différents dans Legifrance :

- La concordance d’un article de code en particulier se retrouve dans les mentions Anciens/Nouveaux articles présents sous l’article consulté en recherche experte ou après avoir cliqué sous la mention "En savoir plus sur cet article" située à côté de chaque numéro d’article en recherche experte.

- Un article nouveau de Code avec une entrée en vigueur différée dans le temps (il n’a donc pas encore d’existence juridique) est consultable uniquement par le biais de la recherche experte.

- La recherche par thème (plus précisément, par descripteur) est possible dans les textes officiels et les Codes grâce au thésaurus Sarde. Elle est accessible au centre de la page d’accueil en tapant un ou des mots-clés dans la zone de saisie sous "Recherche thématique sur la législation et la réglementation en vigueur".

- Legifrance offre la possibilité de rechercher les mesures de transposition adoptées par la France pour chaque directive européenne (la transposition est une sorte de traduction en droit national des dispositions de la directive). A partir d’un texte européen, le texte transposé en droit français se recherche par la rubrique Recherche des mesures de transposition des directives européennes. Il suffit de taper le numéro de la directive (ex. : 2000-10) ou, à défaut, sa date de signature ou de publication et/ou un ou plusieurs mots significatifs. de rechercher les références des textes législatifs et réglementaires nationaux qui ont été expressément notifiés par la France aux services de la Commission européenne comme mesure nationale d’exécution (base MNE) [18].
Hélas, la base des MNE n’est pas souvent à jour, car elle dépend justement de notifications officielles.

- Conventions collectives. Plutôt que de chercher par mot-clés dans les CCN, il vaut nettement mieux afficher directement le texte de base de la convention recherchée : il est alors moins difficile de trouver le point précis de la CCN qui vous intéresse, grâce notamment au sommaire, d’autant plus que s’affiche alors dans la colonne de gauche un filtre pour les questions usuelles les plus fréquentes (durée des congés payés, congés exceptionnels, durée de la période d’essai, préavis, indemnités de licenciement)

- Voir aussi notre article paru sur ce blog en 2009 sur le même sujet : Un "tuto" pour la recherche de textes officiels sur Legifrance.

Avertissement

Attention toutefois :

- Le moteur de recherche de Legifrance parfois donne des résultats illogiques. Ne pas hésiter alors à effacer la recherche et la reprendre à zéro. Si cette "réinitialisation" ne change rien, simplifiez votre requête ou allez carrément sur une plateforme payante d’éditeur.

- En cas de grosse réforme, la mise à jour des Codes et autres textes consolidés modifiés peut prendre plusieurs jours.

- Les échéanciers des décrets d’application (dans les dossiers législatifs, loi par loi) ne sont pas forcément mis à jour le jour même de la publication du décret. Ainsi le decret d’application sur les licences open data de la loi Lemaire a été publié le 27 avril 2017 et le 28 il n’était pas dans l’échéancier.

En savoir plus : l’Aide et les ateliers de Legifrance

Comme le rappelle ma collègue Carole Guelfucci [19] :

Emmanuel Barthe
bibliothécaire documentaliste juridique, spécialiste des données publiques juridiques
formateur à la recherche documentaire en droit


Statistiques sur le surendettement en France avant 2000

Jeudi 7 septembre 2017

Voici une synthèse des réponses (personnelles et apportées par mes collègues) à ma question sur la liste de diffusion ADBS : un étudiant recherche des statistiques sur les niveaux d’endettements des personnes en procédures de surendettement en France avant les années 2000.

Les informations les plus fiables sont les rapports de la Banque de France et les statistiques de l’INSEE. Mais sur les sites web de ces deux institutions, rien datant d’avant 2000 [21]. Or la loi Neiertz, qui a créé la lutte juridique contre le surendettement des particuliers, date de 1989 [22]. Ce qui ne facilite pas les recherches des étudiants et universitaires travaillant sur les origines de cette matière.

Voici donc des pistes :

Rapports officiels

- Voici le document où l’étudiant a trouvé les chiffres qui l’intéressaient : Rapport d’information n° 60 - Surendettement : Prévenir et Guérir, par Jean-Jacques Hyest et Paul Loridant, Sénat, Commission des lois et Commission des Finances, 1997-1998
Il a pu les trouver par Google, en restreignant sa recherche par date (dans Outils) et par type de fichier (filetype:pdf) [23]. Comme les chiffres étaient en francs, il a utilisé le convertisseur de l’INSEE qui prend en compte l’érosion de la valeur de la monnaie.

- Beaucoup de statistiques dans cet ouvrage (papier uniquement) : Rapport sur l’application de la Loi n° 89-1010 du 31 décembre 1989 relative à la prévention et au règlement des difficultés liées au surendettement des particuliers et des familles (titre de couverture : "Surendettement des particuliers"), présenté par Roger Leron, Direction des journaux officiels, 1991, 205 p., coll. Journal officiel de la République française, ISBN 2-11-073219-9 [24].
Cet ouvrage peut être localisé dans pas mal de bibliothèques universitaires grâce au catalogue collectif Sudoc. Par exemple, il est consultable (entre autres) à la BIU Cujas, à la BU de Nanterre, à la bibliothèque de Sciences-Po Paris, à la BU de l’Université Jean Monnet de Saint-Etienne, à la BU de Toulon, à celle de Lille 2 ...

- Rapport n° 856 fait au nom de la commission spéciale chargé d’examiner le projet de loi d’orientation relatif à la lutte contre les exclusions (n° 780) : Tome IV Dispositions concernant le surendettement, par Véronique Neiertz, députée, Assemblée nationale, 23 avril 1998

- Rapport du Groupe de travail sur l’endettement et le surendettement des ménages, Comité consultatif du Conseil national du crédit et du titre, 1989 [25]

Travaux de recherche

- L’application de la loi du 31 décembre 1989 par les tribunaux d’instance : l’exemple de cinq tribunaux de la région Rhône-Alpes, par Pascal Ancel, Leïla Bounechada, Valérie Jouvet, Claudine Maslak, Sylvie N’Gon, et al., rapport de recherche, Ministère de la Justice, 1993, 2 vol. (197 p. et 164 p.) (PDF image)

- La Banque d’enquêtes qualitatives en sciences humaines et sociales beQuali documente actuellement une enquête d’Anne Gotman, sociologue et chercheuse au CNRS, menée au début des années 1990, intitulée "Dilapidation et prodigalité". Au cours de sa recherche, elle s’est notamment intéressée au surendettement des ménages. Dans les archives collectées auprès de la chercheuse et en cours de traitement figurent des entretiens de familles surendettées et de professionnels (juges des tutelles, assistantes sociales) et des notes sur des dossiers de tutelle consultés, qui seront mis en ligne une fois numérisés et anonymisés sur le site bequali.fr [26].
Par ailleurs, le personnel de la beQuali est en train d’inventorier des cartons de bibliographie (notes de lecture, documents, photocopies) rassemblée par Anne Gotman, qui contiennent également des références sur le surendettement datant des années 1990. Parmi ces références, voici quelques pistes — l’inventaire (en cours) de cette bibliographie peut être consulté sur Zotero :

  • ASF (Association française des sociétés financières), « Bilan des procédures instituées par la loi Neiertz », 1991
  • Banque de France, « Enquête typologique sur le traitement du surendettement », 1991
  • Le fonctionnement d’un secrétariat de commission de surendettement  : la Banque de France de Dijon, par Banque de France et Bernard Gamel, Bulletin trimestriel de la Banque de France, septembre 1991, pp. 185-190.
  • 41 000 dossiers de surendettement ont été transmis aux commissions Neiertz, par Josée Doyère, Le Monde, 20 juin 1990, p. 25
  • etc.

Bases de données de presse

Faire une recherche dans :

  • un agrégateur de presse [27] comme :
    • Europresse
    • Pressedd
    • LexisNexis Newsdesk / Factiva
  • ou une base de données de résumés d’articles de presse comme Delphes.

Puis suivre les sources ou pistes évoquées par les articles pour retrouver les documents primaires.

Institutions et spécialistes du surendettement

Contacter des institutions et des enseignants spécialistes du surendettement des particuliers :

- institutions :

- enseignants :

Merci à toutes mes collègues bibliothécaires documentalistes pour leurs réponses très rapides et pertinentes. Comme diraient les Américains : « Long live librarian researchers ! » (ou : « Vive les bibliothécaires recherchistes ! »)

Emmanuel Barthe
bibliothécaire recherchiste juridique, veilleur, formateur


Dernières brèves

Oudropo, l’Ouvroir de droit potentiel, lance son nouveau site

Jeu, théorie du droit, humour, mathématiques et audace

Mardi 5 septembre 2017

Lire la suite »

Il y avait déjà l’Oulipo, l’Ouvroir de littérature potentielle, fondé notamment par Raymond Queneau et qui compta entre autres Italo Calvino et Marcel Duchamp parmi ses membres.

L’Oulipo est un club discret pratiquant des sortes d’exercices de style mêlant littérature, mathématiques et un humour involontaire. Involontaire car les membres de l’Oulipo pratiquent en fait des recherches très sérieuses, aussi ésotériques puissent-elles paraître au grand public.

Depuis 2013, il y a l’Oudropo, l’Ouvroir de droit potentiel créé sur les mêmes bases. Il vise à créer du droit (fictif) à l’aide de contraintes (notamment mathématiques) que les membres se fixent à eux-mêmes, ce qui mène au jeu, à l’humour mais aussi à un entraînement rigoureux à la réflexion juridique.

Fondé notamment par Emmanuel Jeuland, professeur de droit et auteur bien connu, et ayant pour membres le professeur Pierre-Yves Verkindt, Alicia Mâzouz, enseignante à la Faculté libre de droit d’Issy-les-Moulineaux et divers docteurs et doctorants, l’Oudropo est un lieu de créativité juridique et de théorie du droit. Cela vient de ses origines : né en 2013 dans un séminaire doctoral de théorie du droit de Paris I, l’Oudropo y a depuis pris ses quartiers.

Comme le disent Emmanuel Jeuland, Lisa Carayon et Viveca Mezey, l’Oudropo est une « legaltech à but non lucratif » :

« L’Ouvroir de droit potentiel crée du droit à partir de contraintes d’interprétation ou de composition. Un article de loi peut ainsi être réécrit avec des synonymes ou des antonymes ; un mot choisi au hasard dans le dictionnaire peut devenir un nouveau concept juridique (par exemple : fantôme, yaourt ou kangourou). On peut parler de Openpolaw en anglais (Opener of potential Law). » [1]

Autrement dit (voir le manifeste de l’Oudropo) :

« L’Oudropo, peut conduire assez souvent dans de vaines directions mais pour rester viable, comporte des contraintes de méthodes, d’organisation et de fonctionnement tout à fait précises (quoique toujours fondées sur une part d’humour !). »

Pour plus de détails, lisez L’Introduction à l’Oudropo,, par Emmanuel Jeuland et Pierre-Yves Verkindt, d’après une présentation de l’Oudropo,, totalement réécrite, faite au colloque sur l’Oulipo et les savoirs organisé par l’université Paris Diderot les 11-13 mai 2017.

Le nouveau site web de l’Oudropo a été lancé en juillet 2017 et même si on ne comprend pas tout, on s’y amuse beaucoup. Rien que la conception graphique de sa page d’accueil vaut le coup d’oeil (voir copie écran supra).

Une tranquille et audacieuse franchise est aussi dans les moeurs de l’Oudropo. Voir par exemple le chapitre 7 du roman Oudropo de l’été, "Les quiproquos du Cabazor de Jean Houget", qui dans un dialogue, explique la principale lacune de l’action de groupe en matière d’environnement, apparue depuis peu de temps en droit français.

On peut également en juger par ces extraits de l’Introduction précitée :

« la démarche oudropienne [...] permet une respiration et donne aux étudiants la possibilité de desserrer quelque peu le carcan positiviste (dont nul ne nie le caractère structurant mais qui poussé à l’extrême conduit à un certain dessèchement de la pensée). Bien plus, la démarche permet d’initier des méthodes permettant de sortir d’un blocage. [...]
Sur un plan plus politique, l’approche oudropienne permet de porter un discours sur la créativité en droit qui nous paraît pour l’heure outrageusement monopolisé par des praticiens de la discipline imprégnés, plus ou moins consciemment de "pensée" managériale. [...]
La méthode oudropienne est un instrument de résistance intellectuelle contre les formes nouvelles de servitude engendrées par le "prêt-à-penser" médiatico-politique. »

L’ancien site de l’Oudropo est ici, hébergé par le site du Département de recherche Justice et procès de l’Institut de recherche juridique de la Sorbonne (IRJS, Université Paris I Panthéon Sorbonne).

Emmanuel Barthe
bibliothécaire documentaliste juridique, juriste de formation (Faculté de droit de Sceaux, Paris XI)


Utiliser Google pour des recherches juridiques

Une méthode de recherche fiable sur le Web

Dimanche 3 septembre 2017

Lire la suite »

Ceci est à la fois un guide détaillé et un tutoriel (grâce aux nombreux exemples donnés) pour pousser à fond les performances en recherche de Google.

Si vous êtes pressé, allez directement à la section 3. Recherche avancée : trois exemples d'utilisation.

Sommaire

1. Comment fonctionne Google

1.1. Contenu et indexation

1.2. Les résultats de Google

2. Comment interroger Google

2.1. L'essentiel
2.2. Choisir ses mots-clés
2.3. Repérez dans les résultats les mots-clés que vous avez oubliés
2.4. Utilisez la recherche avancée pour mieux contrôler votre recherche (opérateurs booléens et filtres)
2.5. Rechercher sur une période
2.6. Ouvrir les résultats dans une nouvelle fenêtre ou un nouvel onglet
2.7. Les moteurs spécialisés de Google
2.8. Toujours rien ?

3. Recherche avancée : trois exemples d'utilisation

4. Pour aller plus loin

1. Comment fonctionne Google : quelques principes à retenir

1.1. Contenu et indexation

1.1.1. La plus grande base de données du Web

Google est un moteur de recherche sur le Web. C’est la plus grande base de données de pages web et de fichiers divers stockés sur le Web (PDF, Word, Excel etc.) [2].

En termes de taille de sa base de données, de richesse des fonctionnalités et surtout de pertinence des résultats, il n’a plus de rival global. Même Bing (Microsoft) a abandonné la compétition. En fait, ses principaux rivaux sont des moteurs spécialisés :

  • locaux/nationaux, tel Baidu en Chine
  • ou internes à un réseau social, comme le moteur de Facebook.

1.1.2. Tout n’est pas dans Google et tout n’est pas forcément bien référencé dans Google

Soyons clair : il y a infiniment plus de documents hors de Google que dans Google. N’utiliser que Google, c’est tentant. Mais c’est est un piège.

  • Google n’indexe généralement pas les bases de données payantes. Il peut toutefois indexer les titres d’articles payants, car ceux-ci sont affichés avec leur lien sur des pages gratuites (voir par exemple les titres des articles des revues de Lextenso) ou bien un site payant si celui-ci a un fil RSS. Il peut même indexer non seulement le titre mais aussi les auteurs et les mots-clés (pas le texte intégral) lorsque l’éditeur laisse ses métadonnées disponibles librement et gratuitement pour le moissonnage OAI (exemple des articles de revues de LexisNexis, voir infra)
  • Google ne couvre pas tout le Web : ni le Web payant, ni la totalité du contenu de nombreuses bases de données gratuites [3], ni les sites qui lui interdisent l’accès à tout ou partie de leurs pages (le fameux fichier robots.txt) etc. Au total, on estime que Google n’indexe (i.e. ne reproduit le contenu et ne le place dans son index [4]), au mieux, que la moitié environ des pages web librement accessibles. Les pires estimations, sous-entendant certes une définition du Web très large puisqu’incluant les darknets, donnent seulement 4% du Web comme indexé [5].
    Un exemple important de ces sites-bases de données plus ou moins difficiles à indexer pour Google sont les bases de données de Legifrance, à l’exception notable (et bien pratique ...) des textes consolidés (LEGI) et du JORF. On peut considérer que le Journal officiel Lois et décrets sur Legifrance est à 95% indexé par Google — et à 99,5% pour les textes publiés récemment. On peut également considérer que la majeure partie de la jurisprudence est également indexée — même si certaines questions fonctionneront mieux directement dans Legifrance (à fin avril 2017, Google indexait 8 800 000 documents de Legifrance, soit quasiment tout). Il faut donc selon les cas interroger Legifrance par les interfaces de recherche de chacune de ses bases de données (en savoir plus). C’est particulièrement vrai pour la jurisprudence.

1.1.3. Google et les variantes d’un mot

Google, si vous n’êtes pas en mode Mot à mot, cherche automatiquement les variantes d’un mot. Il prend sa racine et cherche :

  • son pluriel et si possible, son féminin. Exemples : bail cherchera aussi baux
  • le verbe, les adjectifs qualificatifs et les adverbes qui lui correspondent. Exemples : embauche cherchera embaucher.

C’est ce qu’on appelle une troncature automatique ou "autostem" en anglais.

1.1.4. Google et le traitement du langage naturel version machine learning

A noter que le machine learning [6] (apprentissage statistique automatique [7]) est utilisé pour toutes les requêtes [8] Google depuis juin 2016. Cet algorithme de Google est appelé RankBrain.

Comme l’explique Olivier Duffez de WebRankInfo, « RankBrain est un système basé sur le machine learning permettant à Google de mieux comprendre les requêtes des internautes. Il peut s’agir de requêtes très longues et précises (très longue traîne) ou de requêtes n’ayant jamais été faites et peu similaires à d’autres plus connues. Grâce aux nouvelles méthodes d’intelligence artificielle dont Google est devenu un des plus grands spécialistes mondiaux, RankBrain parviendrait à mieux comprendre ces requêtes difficiles » [9].

En fait, RankBrain n’est qu’une implémentation de Word2vec, l’algorithme de traitement du langage naturel (natural language processing, NLP) par machine learning non supervisé [10] développé par une équipe de Google Research (il a d’ailleurs été mis par Google en open source en 2013). En prenant en compte le contexte (les mots voisins) de chaque mot dans les documents, RankBrain/Word2vec "apprend" que certains, dans un contexte donné, sont similaires [11]. Word2vec transforme ces contextes en vecteurs, donc en chiffres, ce qui permet de les comparer facilement. C’est selon toute vraisemblance Word2vec qui permet par exemple à Google de deviner que si vous avez tapé compétition déloyale, vous vouliez en fait écrire concurrence déloyale [12].

Pour autant, le type de requête que décrit O. Duffez (longues, beaucoup de mots peu ou moyennement utilisés [13]) — et qui est le propre des recherches juridiques pointues — ne réussit pas toujours dans Google. C’est probablement autant une limite du Web gratuit [14] que celle de Word2vec.

A noter également que, comme l’explique Sylvain Peyronnet, chief scientist du moteur Qwant et co-fondateur du laboratoire de recherche privé ix-labs [15], dans une interview au Journal du Net [16], il n’y a depuis longtemps plus un (le PageRank d’origine), ni deux, ni trois algorithmes qui font fonctionner le moteur de recherche de Google mais un grand nombre (peut-être 200 !) d’algorithmes et ils s’influencent les uns les autres tout en étant pondérés par des critères ... et fréquemment modifiés pour améliorer les résultats ou lutter contre les spécialistes du SEO trop habiles [17].

1.1.5. Google et les documents très longs

Google peut aussi avoir des difficultés à faire remonter en haut du classement de ses résultats des documents très longs où l’information pertinente est noyée dans la masse. Ainsi, sur les PDF très longs (à partir de 30 à 40 pages environ), il indexera tout le document mais privilégiera très nettement dans son classement les mots-clés placés dans le titre, la balise title ou les premières pages du document. C’est particulièrement net si on ne restreint pas la recherche avec site: ou filetype:pdf Exemple : les références bibliographiques dans les fichiers PDF que constituent les trois parties des Notes de doctrine relatives aux arrêts de la CJUE et du TPI sur Curia. Contre-exemple : les références bibliographiques des revues de LexisNexis sur http://www.lexisnexis.fr/droit-document car chaque référence a sa propre page web.

1.1.6. Google est parfois en retard

Google peut être en retard sur les mises à jour des sites web les moins populaires ou mettre des jours ou des semaines à prendre en compte correctement un nouveau site web (voir infra), notamment parce que personne n’a encore fait un lien vers lui. Mais il indexe en temps réel les mises à jour des sites institutionnels, universitaires, de presse, des blogs populaires et de tout autre site populaire ou fiable [18].

1.1.7. Google Books et Google Scholar

Parce qu’il dépend du contenu d’Internet,Google ne couvre ni le papier ni la littérature grise.

Quoique ... Avec Google Books et surtout le partenariat de très grandes bibliothèques [19], Google indexe énormément d’ouvrages en anglais et un nombre certain en français.

Mais du fait de l’opposition des éditeurs français, le contenu en droit français est pour l’instant faible. Cela dit, ce n’est pas le cas en droit belge ni en droit européen ou international.

Google Scholar, de son côté, indexe les articles scientifiques (donc de nombreux articles juridiques) présents sur le Web sous forme de références bibliographiques ou, plus intéressant, en texte intégral gratuit. Cela dit, Google Scholar contient surtout des articles de droit international public, de droit public interne ou de droits de l’homme. Donc très peu d’articles en droit des affaires ou en droit privé.

1.2. Les résultats de Google

1.2.1. Ranking : le classement par pertinence

- Les résultats sont classés par pertinence. Ce classement par pertinence s’appelle "ranking" en anglais. La "pertinence selon Google" tient compte :

  • d’abord des liens pointant vers les pages web et de la qualité de ceux-ci (Google les considère comme autant de recommandations), c’est-à-dire en fait de la qualité de celles-ci (les pages vers lesquelles ils pointent) autant que de la qualité du site faisant les liens. Exemple paroxystique : un site universitaire (site de qualité quasiment par nature selon Google, voir infra) fait des liens vers des pages web du blog d’une spécialiste reconnue du sujet (site de qualité selon Google du fait des nombreux liens établis vers lui par d’autres spécialistes et par la communauté réunie autour de ce sujet, voir infra)
  • et ensuite des mots (et leurs synonymes) de la requête contenus dans la page web :
    • ceux du titre informatique de la page (balise title), du titre réel de celle-ci (balise H1 ou H2 sinon) et du nom du fichier HTML sont les plus importants
    • Google privilégie les expressions sur les termes isolés, et les termes exacts sur les synonymes
  • de la "qualité" (selon Google) de la page. Le nom de domaine est important ici : les sites universitaires (avec "univ" dans leur nom de domaine en France ou .edu aux USA) et gouvernementaux (.gouv.fr en France, .gov aux Etats-Unis) sont favorisés ; les sites personnels sont défavorisés, sauf s’ils ont leur propre nom de domaine et une forte réputation au sein de leur communauté
  • de la fraîcheur/fréquence de mise à jour de la page. Par exemple, un site personnel réputé dans une communauté, sur des requêtes Google sur lesquelles il possède des pages très pertinentes, va pourtant reculer en bas de la première page des résultats de Google s’il n’est pas mis à jour chaque semaine.

- Cette pertinence est réelle : en règle générale, il suffit de consulter les 30, voire les 50 premiers résultats pour trouver sa réponse et avoir balayé l’essentiel des sites. En général ... Ce qui veut dire qu’en cas de doute, il faut aller jusqu’au 100e résultat (c’est du vécu). C’est particulièrement net sur des sites mal structurés et mal indexés par Google comme les sites syndicaux

1.2.2. La pollution des résultats par le spamdexing

Cependant les résultats de Google sont de temps à autre — ça vient par vagues — pollués par les résultats de sites publicitaires quasiment vides de contenu juridique, comme les sites faisant de la publicité pour des livres de droit du licenciement destinés aux particuliers. C’est ce qu’on appelle du "spamdexing" [20]. Une fois les sites spammeurs identifiés, Google les "bannit" de son index, mais le problème revient de temps à autre. Le spamdexing de Google a toutefois beaucoup reculé depuis 2014 du fait de l’implémentation de l’algorithme RankBrain avec ses capacités de traitement du langage naturel (NLP) (voir A. le contenu de Google supra).

1.2.3. La fraîcheur des résultats

Les résultats sont en général très "frais" :

  • Google indexe très régulièrement les sites importants (exemples : Assemblée nationale, Sénat, etc.)
  • Google privilégie les sites à mise à jour très fréquente, tels les sites de presse (lemonde.fr, liberation.fr, etc.) et les blogs, en les réindexant de une à plusieurs fois par jour
  • néanmoins et de manière logique vu sa préférence pour les liens hypertextes et pour les sites à mise à jour fréquente, Google peut avoir quelques jours de retard sur certaines rubriques peu consultées de sites très vastes et jusqu’à une semaine de retard — en général, plutôt quelques jours — sur l’actualité des sites web les moins importants, qui eux-mêmes sont rarement mis à jour. De même, Google peut mettre jusqu’à plusieurs semaines pour indexer correctement un nouveau site web, c’est-à-dire indexer la totalité de ses pages et les faire monter en tête des résultats sur les questions pertinentes [21].

2. Comment interroger Google

2.1. L’essentiel

  • laisser un espace revient à utiliser l’opérateur logique ET implicite. Autrement dit : chaque fois que vous tapez un mot de plus, vous ajoutez un critère, une condition à votre recherche. Exemple : responsabilité pénale du dirigeant trouvera moins de résultats que responsabilité
  • cherchez à utiliser des expressions plutôt que des suites de mots. Google "accroche" mieux là dessus (voir explication détaillée infra).

2.2. Choisir ses mots-clés

Prenez 30 secondes pour réfléchir aux mots-clés que vous allez utiliser. Car, même avec Google, cela peut faire la différence entre trouver et ne pas trouver.

Voici les "trucs" essentiels pour choisir ses mots-clés :

  • ne vous laissez pas influencer par les suggestions de Google [22]
  • pensez aux synonymes et quasi-synonymes. Voir aussi infra l’opérateur (tilde).
    Exemple : bail, baux, loyer, loyers, location. Un synonyme, ça peut être aussi un numéro d’article de Code, particulièrement en droit fiscal avec le CGI. Exemple (en recherche de jurisprudence) : 1240, 1382 et faute sont des quasi-synonymes de responsabilité civile
  • si vous cherchez la version officielle d’un texte, d’un arrêt ou d’un rapport, utilisez  :
    • les termes juridiques officiels, c’est-à-dire ceux utilisés dans les codes et les lois (notamment dans les titres des lois).
      Exemple : redressement et liquidation judiciaires
    • la date complète.
      Exemple : 25 janvier 1985
    • ou éventuellement le numéro.
      Exemple : 85-98 (ce qui évite de trouver aussi la loi n° 85-99 sur les administrateurs judiciaires)
  • si en revanche vous cherchez des commentaires ou de la doctrine (pour autant qu’il y en ait gratuits sur le Web sur votre sujet) :
    • utilisez les noms juridiques usuels.
      Exemples : procédures collectives ou redressement judiciaire ou liquidation judiciaire ou difficultés des entreprises en difficulté ou défaillances d’entreprises (pas faillite, qui n’est plus le terme juridique approprié)
    • si vous cherchez des commentaires sur une réforme ancienne, précisez l’année.
      Exemple : 1985 (réforme des procédures collectives)
  • si vous cherchez de l’actualité non juridique ou des articles de presse, utilisez les termes économiques et/ou les expressions du langage courant.
    Exemple : faillite, faillites, fermetures d’entreprises, plans sociaux
  • plus généralement, si vous êtes compétent sur le(s) domaine(s) juridique(s) concerné(s) par votre recherche, tapez les mots et expressions qui devraient se trouver dans les documents que vous recherchez, et surtout dans leur titre et leurs premiers paragraphes. Autrement dit : essayez de deviner comment les titres de documents sur le sujet sont écrits.
    En revanche, si vous n’êtes pas spécialiste de ce domaine et a fortiori si vous n’êtes pas juriste ou étudiant en droit, évitez d’utiliser cette dernière technique.

2.3. Repérez dans les résultats les mots-clés que vous avez oubliés :

  • dans les extraits qui composent les résultats de Google, si des mots vous semblent pertinents, réutilisez les dans votre question
  • dans les documents qui répondent le mieux à votre question, repérez les mots qui font partie de votre sujet mais que vous avez oubliés pour modifier votre question.

C’est un "truc" capital : modifier sa question initiale, oui, mais avec des mots qui marchent.

2.4. Utilisez la recherche avancée pour mieux contrôler votre recherche (opérateurs booléens et filtres

Deux possibilités :

  • utilisez la page Recherche avancée de Google. Et alors pas besoin de savoir comment écrire les opérateurs et filtres de Google
  • ou — mieux — apprenez les opérateurs et filtres de Google et utilisez-les sur la page d’accueil du moteur. Mais il faut alors connaître les noms des opérateurs et des champs/filtres et leur syntaxe.

Vous pourrez alors :

  • utiliser les opérateurs de recherche ET (AND ou espace), OU (OR), SAUF (-), expression (" ") et de proximité (AROUND()). On les appelle opérateurs booléens ou opérateurs logiques.
    Rappel : en allant sur la page Recherche avancée, vous n’aurez pas à mémoriser leur syntaxe. Toutefois, sur cette page, les opérateurs de proximité comme AROUND() ne sont pas proposés.
    Les opérateurs de recherche permettent de "pousser le moteur dans ses retranchements". Exemples : on veut des documents relativement simples et à jour pour créer une EURL : créer OR création eurl OR "entreprise unipersonnelle" (on peut aussi ajouter : filetype:pdf).
    Voici maintenant des précisions, à propos des opérateurs logiques dans Google, qui ont leur importance :
    • rappel : tout espace non placé entre des guillemets est pour Google un ET logique. Mais parfois aussi une incitation à interpréter la requête comme une expression : dans ce cas, si cette tendance de Google à tout transformer en expression vous gêne, utilisez le mode Mot à mot (en anglais Verbatim) (Outils > Tous les résultats > Mot à mot : uniquement sur ordinateur, pas sous smartphone) [23] ou écrivez en majuscules le AND [24]
    • attention : Google ne "comprend" pas les parenthèses [25] et le OR ne joue que sur les mots immédiatement adjacents à lui. Ce qui implique de mettre les mots d’une expression entre guillemets (contrairement à ce qui est recommandé plus haut pour les cas "normaux") si la notion faut partie d’une suite de synonymes. De plus, le premier mot qui commence une suite de OR est le plus important pour l’algorithme [26]
    • il faut toutefois bien comprendre que multiplier les synonymes (reliés par OR) n’apporte pas grand’ chose en terme de pertinence des résultats. Un synonyme voire deux (pas plus, soit trois mots ou expressions maximum) aide lorsqu’on est dans du vocabulaire juridique un peu spécialisé et/ou peu présent sur le Web, mais le plus efficace en dehors de ces cas reste le choix de la bonne expression (sans guillemets sauf si ça "part dans tous les sens") et de laisser les capacités de l’algorithme RankBrain en NLP version machine learning (on en parlait supra) faire le travail de synonymie, d’autant que l’utilisation du OR stoppe très logiquement cette synonymie automatique [27].
      Voici un bon exemple à la fois du peu d’intérêt d’utiliser le OR, et en même temps de son intérêt en droit si on veut un maximum de fiabilité et creuser à fond la recherche : comparez les 100 premiers résultats de "responsabilité civile" accident automobile et "responsabilité civile" OR 1382 OR 1240 accident automobile. Seuls une petite dizaine de résultats diffèrent, la plupart (mais pas tous ...) sans intérêt majeur. Toutefois, certains résultats sortis seulement avec le OR peuvent venir de sites particulièrement fiables et avoir de la valeur si on ne veut rien rater. L’exemple utilisé ici est très net : Accident de la circulation et responsabilité civile des parents, Dalloz Etudiant est en effet le seul résultat venant d’un éditeur juridique et le seul à citer de la jurisprudence ...
    • utiliser l’opérateur - (SAUF) [28] pour exclure des termes qui faussent les résultats/les "polluent" : le - (moins) fonctionne. La règle générale d’utilisation de l’opérateur SAUF s’applique : n’utiliser le - qu’en dernier recours
    • opérateurs de proximité :
      • signalé en 2010, probablement apparu 5 ou 6 ans auparavant, mais non documenté par Google, l’opérateur de proximité AROUND(n) (où n est un nombre de mots qu’on fixera en pratique à 2 ou 5) est efficace en anglais mais le semble moins en français [29]
      • l’opérateur * ("wildcard") est censé remplacer un (au moins) ou plusieurs mots, je constate son efficacité dans une certaine mesure mais je n’arrive pas à la prouver par A + B
      • de toute façon, la bonne expression (sans guillemets, en général) pourra être tout aussi efficace, voire plus. Disons qu’au minimum, elle obtiendra des résultats différents (donc complémentaires) [30]
    • chercher par expression rend les résultats plus précis/moins nombreux et dans certains cas, évite les résultats hors sujet. Hors de l’interface Recherche avancée, utilisez les classiques guillemets (" "). Important : pour que les guillemets soient pris en compte par Google, il est nécessaire de passer en mode Mot à mot (Outils > Tous les résultats > Mot à mot), mode non disponible sur la version mobile de Google puisque le menu Outils n’apparaît pas sous smartphone.
      L’utilisation des guillemets est devenue plus souvent nécessaire, face à l’élargissement des recherches pratiqué par Google [31]. Toutefois, ne l’utilisez qu’après avoir testé l’expression sans guillemets, pour les raisons exposées ci-après.
      N’abusez pas des guillemets. On dit souvent dans les cours de recherche sur bases de données ou sur le web qu’encadrer une expression avec des guillemets garantit des résultats moins nombreux et pertinents. Mon expérience, c’est qu’en réalité, les guillemets sur Google n’améliorent souvent pas grand’ chose voire parfois empêchent de trouver les principaux sites web sur un sujet. D’ailleurs Google ne les recommande pas trop fort. Cela dit, c’est vrai que si on veut vraiment *tous* les sites sur une expression, alors il faut utiliser le moteur à la fois *avec* les guillemets mais *aussi sans*, car, du moins si l’on s’en tient aux 30 premiers résultats, certains sites pertinents apparaissent uniquement avec les guillemets et d’autres uniquement sans [32]. En effet, l’algorithme de Google détecte souvent tout seul l’expression et la privilégie dans le classement des résultats. De surcroît, mettre les guillemets, en pratique, réduit souvent — mais pas toujours — un peu la pertinence par rapport à sans les guillemets car ceux-ci éliminent des résultats où l’expression n’est pas totalement identique, voire certaines pages où pourtant celle-ci apparaît clairement ...
  • si votre requête comporte au moins 7 ou 8 mots-clés, mettre en premier le mot le plus important de votre question : il aura alors un poids plus important que les autres dans les résultats, en faisant par exemple remonter dans les premières réponses les pages web où ce mot est dans le titre de la page.
    Ce point — non précisé dans l’aide officielle de Google et la plupart des guides de recherche en ligne — peut avoir un effet sur le tri des résultats par Google, en amenant dans les 10 ou 20 premières réponses une page web jusque là "perdue" au delà des trente premières réponses
  • choisir la langue des résultats. Peu intéressant : la langue des mots-clés utilisés conditionne celle des résultats
  • limiter les résultats à la France (sites français et non francophones) permet d’éviter à 95% les résultats provenant de sites québécois, belges et d’Afrique du Nord (Maroc, Tunisie, Algérie) et donc de se restreindre au droit français. Voilà une fonctionnalité intéressante, mais devenue moins utile depuis que Google a progressé dans la reconnaissance de la nationalité de l’internaute. Elle n’est d’ailleurs plus disponible que dans l’interface Recherche avancée (champ "région"). Elle peut encore servir à trouver des résultats de droit canadien ou belge quand on interroge Google depuis la France
  • choisir le format de fichier : Rich Text Format .rtf, Word .doc, Acrobat .pdf, Excel .xls, .PowerPoint .ppt, Access .mdb. Restreindre la recherche aux fichiers PDF permet de ne trouver que des documents sérieux et fiables (mais pas systématiquement pertinents, car ce n’est pas le but direct de cette fonctionnalité). En effet, très souvent, les documents officiels (textes juridiques, rapports, livres blancs) et les articles de revues scientifiques sont au format PDF tandis que les sites perso, ceux tournés vers le marketing et les forums utilisent uniquement le HTML. Hors de l’interface Recherche avancée (autrement dit à partir de la page d’accueil de Gogle), écrivez filetype:[type_de_fichier] à la fin de votre requête. Exemple : filetype:pdf
  • restreindre la recherche à un site : en fait à son nom de domaine (exemple : conseilconstitutionnel.fr est le nom de domaine du site web du Conseil constitutionnel). Ainsi utilisé, Google est presque toujours plus efficace que le moteur interne du site, sauf sur des documents extrêmement récents, peu connus ou "enfouis" dans le site. Ce mode de recherche est particulièrement utile sur les plus vastes sites juridiques : le site du Premier ministre, les deux sites parlementaires (Assemblée nationale, Sénat), Europa, EUR-Lex. Hors de l’interface Recherche avancée, écrivez site:[domaine]
  • restreindre la recherche au "titre" (la balise HTML title, plus précisément) des pages web avec le champ intitle:[un_seul_mot] ou — plus efficace — allintitle:[tous_les_mots_qui_suivent]
  • si vous êtes connecté (non recommandé) à votre compte Google, régler le nombre de résultats par page à 30 voire 50 (au-delà, en général, très peu de résultats sont pertinents [33]). Ca permet de consulter plus facilement et plus rapidement les résultats pertinents. Mais cela implique d’être connecté à votre compte Google, ce qui personnalise (i.e. biaise) fortement les résultats en fonction de votre historique de recherche que Google a mémorisé
  • empêcher le plus possible Google d’interpréter votre requête (sauf par la langue du système d’exploitation de votre ordinateur) en choisissant dans Outils de recherche > Tous les résultats > Mot à mot [34], sans oublier de vous déconnecter de votre compte Google [35], d’indiquer à Google de ne pas non plus mémoriser votre historique de recherche lorsque vous n’êtes *pas*, cette fois-ci, connecté à votre compte Google ... et de vider vos cookies et l’historique de navigation de votre navigateur web avant de lancer une recherche, voire de lancer dans votre navigateur une session de navigation privée [36].

2.5. Rechercher sur une période

Restreignez si nécessaire les résultats à une période de temps. Pour utiliser à fond cette fonctionnalité, il faut passer par l’interface simple de Google (la recherche avancée n’offre pas la possibilité de spécifier l’intervalle de temps exact que l’on désire), cliquer sur Outils de recherche > Date indifférente > Période personnalisée [37] [38].

2.6. Ouvrir les résultats dans une nouvelle fenêtre ou un nouvel onglet

Ouvrez les résultats dans une nouvelle fenêtre ou un nouvel onglet, de manière à garder sous la main la liste des résultats. Pour cela : faites un clic droit sur le lien qui vous intéresse, puis un clic gauche sur "Ouvrir dans une nouvelle fenêtre/onglet".

2.7. Les moteurs spécialisés de Google

S’il n’y a pas de résultat intéressant dans l’onglet Web de Google, regardez :

2.8. Toujours rien ?

Voyez Pour aller plus loin à la fin de cet article.

3. Trois exemples d’utilisation de la Recherche avancée de Google

1er exemple

Ici, nous allons chercher des articles en matière de cookies parus dans la revue Expertises, une revue de droit de l’informatique et d’Internet [39].

Cette revue a un site web (expertises.info) et les sommaires y sont présents en accès gratuit. Ce qui signifie que Google indexe les titres de ces articles.

Voici comment interroger rapidement les sommaires de la revue Expertises sur le site de la revue :
- 1. réfléchissez aux mots-clés à utiliser pour votre recherche : les juristes s’expriment en général en bon français. C’est ce que j’appelle "l’étape zéro" dans une méthode de recherche
Ici, un dictionnaire de traduction peut être utile — le Larousse anglais-français par exemple — mais il faudra le compléter par le site de la CNIL. Cookie en français se dit donc mouchard ou traceur
- 2. déconnectez-vous de votre compte Google (si vous en avez un). En effet, Google biaise ses résultats en fonction de vos recherches passées
- 3. allez sur la page d’accueil de Google en français
- 4. tapez les mots-clés en reliant les synonymes par OR (en majuscules) : cookies OR mouchards OR traceurs
- 5. limitez la recherche au site www.expertises.info (NB : Google ne prend en compte que des noms de domaine, pas des pages profondes) en tapant : site:expertises.info
- 6. votre recherche doit ressembler à ceci : cookies OR traceurs OR mouchards site:expertises.info
- 7. lancez la recherche
- 8. lisez les résultats. Regardez bien les caractères verts : ils vous indiquent le site d’où vient chaque résultat. Si c’est un site universitaire (univ-) ou officiel (.gouv.fr), c’est un gage de qualité
- 9. pour ceux qui vous intéressent : clic droit > Ouvrir le lien dans un nouvel onglet. Comme ça, vous ne perdez pas votre liste de résultats et votre recherche.

2e exemple

Vous devez réunir des documents sur le travail le dimanche.

Suivez les étapes 1 à 9 supra.

Cela devrait donner ceci : "travail le dimanche" OR "travail du dimanche" OR "travail dominical" OR "dérogation au repos dominical" OR 3132

Complétez ces résultats avec des documents en PDF : "travail le dimanche" OR "travail du dimanche" OR "travail dominical" OR "dérogation au repos dominical" OR 3132 filetype:pdf

NB : l’efficacité de la synonymie automatique de Google est telle que travail le dimanche tout court suffit presque. Surtout avec filetype:pdf.

3e exemple

C’est l’employeur qui préside le comité d’entreprise. Peut-il y venir accompagné de trois collaborateurs au lieu de deux comme le prévoit le Code du travail ?

Vérifier d’abord l’article pertinent du Code. C’est le L. 2325-1. Il faut vérifier les termes qu’il emploie, qui sont très certainement ceux qu’emploieront des commentaires bien juridiques. Le truc consiste à ne pas reprendre le mot "deux" car ici c’est "trois" que l’on cherche.
Taper dans Google : comité d’entreprise employeur trois collaborateurs. Et la première réponse est la bonne. Elle vient d’une page en libre accès du Lamy Droit du comité d’entreprise disponible sur le site WK-RH.

4. Pour aller plus loin

- 25 astuces pour la recherche sur Google / Thomas Coëffé, Le Blog du Modérateur 23 juillet 2013. A compléter par une excellente "cheat sheet" encore plus opérationnelle : 30 opérateurs Google pour affiner ses recherches / Thomas Coëffé, Le Blog du Modérateur 23 juillet 2013.

- More awesome search tips from Google expert Daniel Russell, with real-world examples / John Tedesco (reporter américain), 1er juillet 2013.

- Utilisez d’autres moteurs, principalement Bing (le concurrent de chez Microsoft [40]) et Exalead (pour les sites français et francophones) [41], voire StartPage (ex-Ixquick) [42] et les métamoteurs de recherche de personnes. Pour information, DuckDuckGo, dont on parle beaucoup, respecte certes votre vie privée, mais ses performances sont très limitées sur les pages web en langue française.

- Voyez nos articles Utiliser Google à 100%, surtout la bibliographie à la fin parce qu’il commence à dater (2006), et Recherche sur Internet : une méthode (un peu) simplifiée et quelques "philosophies", notamment la méthode des "autorités". Allez (entre autres) voir ailleurs sur le Web (annuaires thématiques de sites, Legifrance, Servicepublic.fr, bases de données payantes, Isidore, Cairn, Revues.org, Theses.fr etc.), réfléchissez une deuxième fois à vos mots-clés ou passez à un autre media (prenez votre téléphone ou votre logiciel de messagerie, par exemple, pour appeler un collègue ou demander conseil à un expert) ...

Emmanuel Barthe
documentaliste juridique, veilleur, webmestre, formateur à la recherche en ligne


Veille sur la veille : ma liste de ressources

Samedi 2 septembre 2017

Lire la suite »

Récemment (fin juillet 2017), Adeline Lory (First Éco, Pôle Documentation) a publié sur son compte LinkedIn une liste sélective des blogs (ou plutôt newsletters) métiers qu’elle lit, pour maintenir à jour ses connaissances à jour en infodoc, veille, intelligence économique ... En février 2017, Christophe Deschamps avait déjà mis à jour la sienne.

Je reprend son idée et vous présente la mienne, sachant qu’elle est assez proche de celles précitées. À part Archimag, ou de nombreux articles sont à accès réservé, tous les blogs, newsletters et comptes Twitter ou Scoop.it cités infra sont entièrement gratuits :

  • Outils Froids, par Christophe Deschamps, donc. Extrêmement riche (parfois trop pour moi) avec de temps en temps des tests remarquables qui "lancent" un produit dans la communauté des veilleurs
  • Keep it simple, par Bryan Coder. Ce jeune consultant formateur est un as des fonctions avancées des applications de veille et de recherche courantes comme Google, LinkedIn, Twitter, RSS ...
  • Les Outils de la Veille, par Fidel Navamuel. Très riche et commenté
  • Recherche Eveillée, par Béatrice Foenix-Riou, ancienne de FLA Consultants, passée indépendante. Des trucs de recherche et de veille précieux, des interviews de professionnels
  • Euresis, par Pierre-Yves Debliquy. Les réflexions parfois iconoclastes mais toujours très pertinentes et orientées pratique d’un grand professionnel de la recherche et de l’intelligence économique
  • Actulligence, par Frédéric Martinet. Consultant et formateur en veille, il publie très peu, mais souvent des scoops sinon des billets très réfléchis et très "francs du collier"
  • le compte Scoop.it RSS Circus et le compte Slideshare de Serge Courrier. Consultant et formateur, il est le spécialiste incontesté des fils RSS en France
  • le compte Twitter de FLA Consultants
  • Archimag : le site web du magazine
  • EchosDoc : une sélection de liens hebdomadaire en bibliothèque et documentation
  • liste de discussion Juriconnexion : ce forum a pour sujets documentation juridique, bases de données juridiques et données publiques juridiques
  • compte Twitter de Stéphane Cottin, un des fondateurs d’une documentation juridique française fortement informatisée et raisonnée.

Emmanuel Barthe
bibliothécaire documentaliste juridique, veilleur, formateur


 

Page parrainée par Convention.fr, le spécialiste des conventions collectives et affichages