Logiciels, Internet, moteurs de recherche

Dernier ajout : 12 mars.

Derniers articles

Twitter pour le droit

Ca caquette juridique sec :-)

Des "tweets" juridiques de droit français

Lundi 15 février 2010

Lire la suite »

Ca caquette :-) juridique de plus en plus sur Twitter.

Est ce vraiment utile ?

Commençons par LA question : à quoi ça sert / est ce utile ? J’avais déjà répondu de manière très expéditive dans un de mes anciens billets, ou plutôt dans sa mise à jour : Twitter — Encore un machin pour caqueter.

Développons un peu :

  • l’idée est donc : une plateforme de micro-blogging, autrement dit des messages instantanés très brefs (140 signes maximum, espaces compris), avec un système d’abonnement, donc une veille plus rapide
  • la principale limite, c’est qu’avec cette brièveté, il est impossible de développer toute argumentation ou nuance ou de donner des détails, ce qui a pour conséquance qu’un "tweet" (message Twitter) ne peut, quand on parle de droit, que renvoyer vers une page web existante. En clair : Twiter n’est pas un outil de publication comme peut l’être — de manière modére — un blog ou — de manière pleine et entière — un site classique, un CMS ou une revue ne ligne.

Pour faire court : Twitter est un outil de signalement et de suivi extrêmement rapide. Mais un outil très envahissant.

Vous voulez tester ?

Commencez par un ou deux excellents comptes Twitter :

  • celui de Juriblogsphère (son auteur est un juriste français en droit des affaires, selon sa présentation sur son blog). Attention, il ne "tweette" pas que du droit : de l’IT pas mal aussi, des infos pratiques et pour entrepreneurs, et il "tweette" beaucoup, pratiquant beaucoup le "RT" (pratique consistant à rediffuser un "tweet" de quelqu’un d’autre en citant le compte Twitter de l’auteur). Il fait donc une assez bonne veille juridique sur les comptes Twitter français
  • ou celui de Véronique Maugeri, responsable de collections chez l’éditeur juridique Lamy. Très droit des affaires et moins prolifique dans ses "tweets", ce qui la rend plus facile à suivre
  • ou encore celui, en droit social, de David Taté (il renvoie vers son blog, c’est en fait l’équivalent de son fil RSS).

Pour aller un peu plus loin, voici quatre très bonnes listes de "tweets" juridiques français :

Comment se servir de Twitter en pratique ?

Quels sont les usages de Twitter ? Comment éviter de perdre son temps ? Pour citer un guide sur Twitter : « Souvent surmédiatisé, parfois [personnellement je dirais souvent] futile, toujours chronophage, les limites de Twitter ne doivent pas cacher le réel intérêt du service et ses utilisations possibles ». Ne pas suivre tout le monde tout le temps [1] et utiliser les bons outils, se révèle donc nécessaire. Pour en savoir plus, lisez :

Les hashtags (ou htags) sont des mots-clés spéciaux [2] pour Twitter qui permettent à la fois de mieux chercher un sujet quelconque et surtout de suivre son actualité, souvent en temps réel. Un hashtag s’écrit ainsi dans le "tweet" : #mot-clé. Les htags ici qu’il nous faut seraient #droit et #juridique.

Et un moteur de recherche : http://search.twitter.com

Merci à Frédéric Aznar de Lexity, Marlène Delhaye de la BU de droit d’Aix-Marseille et Arnaud Dumourier de Juridiconline/Doc en vrac.

Quant à votre serviteur, il caquette là : http://www.twitter.com/precisement/. Evidemment, il ne fait même pas la moitié de ce que les guides précités recommandent : il débute, manque de temps et trouve pour l’instant les newsletters plus riches que Twitter ou que les fils RSS en droit des affaires (exemple) ;-)

Emmanuel Barthe
documentaliste et veilleur juridique


La BNF et Google Books : déjà, un rapport de l’Inspection générale des finances ...

Ou de l’intérêt pour GG Books de la RGPP

Samedi 7 novembre 2009

Lire la suite »

A propos de l’éventuel accord Google Books-Bibliothèque nationale de France [3], un rapport de l’inspection des Finances daté de janvier 2008 (PDF) annonçait déjà un possible partenariat entre la BNF et Google, mais à certaines conditions.

Ce rapport de l’IGF pose des questions dérangeantes, en notant que la numérisation des collections ne fera pas mieux en terme de fond que le partenariat Google-BM Lyon.

Pour autant, le rapport de l’IGF élude les questions de la propriété des oeuvres scannées en se focalisant sur les missions de la BNF mal assurées (numérisation des collections presse) du fait de sa concentration sur la numérisation des ouvrages. On pourrait aussi dire que si la BNF doit délaisser des missions, c’est parce qu’on ne lui donne pas les moyens des missions qu’on lui a confié.

On sent dans ce texte que les contraintes budgétaires actuelles — et futures — de la BNF (RGPP) doivent, selon les auteurs, lui servir de guide.
La BNF selon eux doit compléter ce que Google Books et les éditeurs ne font pas. Sur certains points, ça peut être non seulement économe des deniers publics mais aussi être plus efficace sur la conservation du patrimoine. Mais par d’autres côtés, c’est tant pis pour le patrimoine.

C’est toute la question du statut de la BNF : est elle une bibliothèque qui doit "rendre service/se concentrer que les demandes du public" ou "sauvegarder le patrimoine et y donner l’accès le plus large" ?

A cet égard, on ne peut que regretter le peu de place accordées aux places de consultation en ligne dans le projet d’origine BNF. Moins de moyens consacrés à l’accès au papier pourraient signifier plus d’argent pour leur numérisation. Mais si on profite des départs à la retraite pour supprimer des postes ...

Extrait du rapport de l’IGF (les gras et mentions entre crochets sont de nous) :

LE DEVELOPPEMENT D’UNE BIBLIOTHEQUE NUMERIQUE DE REFERENCE SUPPOSE DE REORIENTER LA STRATEGIE DE NUMERISATION ET DE DEGAGER DES MARGES DE MANOEUVRE FINANCIERES

« A. La numérisation des collections, enjeu stratégique majeur, doit évoluer vers une dynamique plus qualitative et partenariale

1. La numérisation constitue un défi d’ampleur identifié par la BnF, qui s’est engagée résolument dans cette voie, sans toutefois que ses choix soient toujours pertinents

Longtemps cantonnée à un statut de collection isolée, simplement adossée aux collections patrimoniales de l’établissement, la bibliothèque numérique n’a connu une réelle montée en puissance et une appropriation progressive par les départements en charge de la gestion des collections que depuis 2007, année de lancement des marchés de numérisation dits « de masse ». Ceux-ci marquent en effet le passage d’un rythme moyen de numérisation de 6 000 ouvrages par an à un objectif annuel de 100 000 ouvrages numérisés.

Parallèlement, la BnF a joué un rôle majeur dans le projet de développement d’une bibliothèque numérique européenne, Europeana, dont la France fournit plus de la moitié du contenu depuis son ouverture au public en fin d’année 2008.

Le développement du numérique constitue ainsi un enjeu stratégique pour l’avenir de la bibliothèque, qui aura un impact sur l’ensemble de ses métiers. Il suppose donc de définir une structure cible d’emplois et de compétences à moyen terme et d’actualiser en conséquence la cartographie des métiers de la BnF, afin d’y intégrer son impact transversal.

Pour autant, la stratégie de numérisation de la BnF, à vocation encyclopédique par sa volumétrie et ses critères de sélection, apparaît aujourd’hui peu adaptée dans le contexte de développement très rapide de la bibliothèque numérique du moteur de recherche Google. Alors même que ce dernier a déjà numérisé 7 millions d’ouvrages et compte au moins doubler ce chiffre dans les années à venir, la BnF est entrée dans une logique de numérisation « productiviste », qui la conduit à procéder à une sélection avant tout négative fondée sur la simple élimination des ouvrages impropres à la numérisation de masse, selon des critères essentiellement physiques et non en fonction de choix raisonnés de valorisation patrimoniale. En outre, le passage à une numérisation de masse depuis l’an dernier pose d’importants problèmes d’organisation interne à la bibliothèque, qui ne parvient pas à tenir le rythme prévu, alors même qu’un nombre important d’agents (plus de 60 ETP) est mobilisé à cet effet.

Or la BnF ne pourra pas concurrencer Google par le nombre, puisque sa bibliothèque numérique atteindra au mieux la taille du seul fonds ancien de la bibliothèque municipale de Lyon, que Google s’est engagé à numériser dans les années à venir [que signifie exactement cette comparaison ?], ce qui représente 5 % du nombre d’ouvrages disponibles sur Google Book Search. De surcroît, cette politique conduit la BnF à négliger la numérisation des collections de presse (malgré un plan spécifique, qui n’aura couvert que 2 % des collections de presse de la bibliothèque sur sept ans d’ici 2012) et de l’audiovisuel, supports pourtant éminemment fragiles et dont la consultation en ligne correspond à une attente forte du public.

2. La BnF doit passer d’une logique quantitative à une logique plus qualitative et partenariale, davantage tournée vers les urgences et les attentes du public [d’où proviennent ces informations sur les attentes du public ? les suggestions de l’IGF ne sont pas du tout à écarter a priori mais on aimerait bien connaître leurs sources].

La bibliothèque devrait donc chercher à se différencier davantage par la qualité de sa bibliothèque numérique et l’accompagnement éditorial qu’elle peut proposer, à la différence de Google. La sortie d’une logique de masse permettrait en effet à la fois de renforcer la diversité documentaire de Gallica, de remédier aux dysfonctionnements induits par la logique actuelle de flux tendus et de libérer des crédits pour les réallouer à un nombre plus restreint d’ouvrages, mais mieux choisis et présentant une qualité de numérisation accrue.

Dès lors, il apparaît nécessaire de renforcer la logique de sélection qualitative, en ciblant davantage la numérisation sur les pièces les plus précieuses et distinctives de la BnF (ouvrages de la réserve, collections spécialisées), ainsi que sur les collections les plus demandées et/ou les supports les plus menacés, en particulier l’audiovisuel et la presse. Une telle évolution suppose entre autres d’étendre l’éligibilité des projets financés par les crédits du centre national du livre à l’ensemble des supports de la BnF, afin de renforcer la pertinence de la numérisation et de l’orienter en priorité vers les supports les plus fragiles et/ou les plus demandés.

La stratégie de numérisation devrait également comporter une dimension plus partenariale.

Un rapprochement est d’abord souhaitable avec les éditeurs, ce qui suppose un important effort de persuasion et de pédagogie. En pratique, il s’agirait d’accélérer le calendrier du projet « Extranet 3 », qui doit permettre aux éditeurs volontaires de remplir leur obligation de dépôt légal de toute nouvelle oeuvre en déposant les données sous format numérique. Face à la nécessité de convaincre un milieu éditorial réticent a priori, la BnF pourrait proposer comme contreparties incitatives l’élaboration d’une charte déontologique (pour rassurer les éditeurs vis-à-vis des risques de piratage des fichiers numériques), l’ouverture de comptes individuels de stockage (permettant une sauvegarde gratuite des données électroniques que l’éditeur aura accepté de transmettre), ou encore la numérisation d’ouvrages épuisés (dans une logique commerciale pouvant intéresser les éditeurs).
Parallèlement, la stratégie de numérisation pourrait être davantage partagée avec d’autres institutions qu’elle ne l’est aujourd’hui. Le partenariat en la matière devrait être renforcé auprès du réseau des pôles documentaires associés de la BnF, en leur ouvrant notamment l’accès aux crédits de la troisième et dernière tranche du marché de numérisation de masse.

B. L’ampleur des investissements informatiques nécessaires exige de dégager des marges de manoeuvre en améliorant l’efficience de la gestion

1. Les besoins financiers nécessaires pour la constitution et la préservation d’une bibliothèque numérique excèdent largement le strict coût du procédé de numérisation

La numérisation d’un document induit certes un coût direct (qui s’élève à 43,7 € par ouvrage dans le cadre du marché de masse) mais ce sont surtout le stockage et la conservation à long terme des données numériques qui représentent des charges élevées et récurrentes. Le basculement de la BnF dans une dynamique de numérisation à grande échelle de ses collections lui impose donc de piloter plus finement ses investissements informatiques, ce qui suppose de développer un tableau couplant les investissements et les amortissements en matière de systèmes d’information, mais aussi de réactiver le comité de programmation des investissements informatiques, en le faisant évoluer vers une instance de pilotage et de suivi.

La mission recommande également dans ce cadre de revoir à la baisse l’ambition du dépôt légal d’Internet, en se concentrant sur des collectes ciblées au détriment des collectes larges, potentiellement très coûteuses en espace de stockage, tout en veillant à sortir de l’actuelle fragilité juridique dans laquelle se trouve ce nouveau champ du dépôt légal, par l’adoption dans les meilleurs délais du décret autorisant la consultation des archives du Web. Il apparaît en outre opportun de conditionner le développement de l’offre de location d’espace de stockage à la conclusion effective de marchés.
Ces pistes ne suffiront toutefois pas à elles seules à garantir la soutenabilité [pas française, cette expression ...] du plan de développement des capacités de stockage de la bibliothèque. D’importants efforts de productivité sont donc indispensables pour dégager les marges de manoeuvre structurelles nécessaires pour faire face à l’enjeu [autrement dit, la RGPP appliquée à la BNF].

2. Des marges de manoeuvre substantielles peuvent être dégagées en améliorant l’efficience de l’organisation et des procédures et en tirant profit du nombre important de départs à la retraite dans les cinq années à venir

Pour dégager les marges budgétaires structurellement nécessaires au financement de ses investissements, et notamment de la préservation de ses données numériques, la BnF doit engager un effort conséquent de rationalisation de ses activités, tout en préservant voire en améliorant sa qualité de service. Cette action peut passer par plusieurs voies.

Tout d’abord, la bibliothèque doit envisager l’externalisation de tout ou partie de fonctions pouvant être effectuées à moindre coût par un prestataire extérieur. A cet égard, trois activités sont suggérées par la mission : la reproduction, activité essentiellement commerciale mais structurellement déficitaire, le catalogage des ouvrages étrangers et le courrier.

La principale source d’économies potentielles découle de la réalisation de gains d’efficience sur diverses fonctions :
- l’accueil du public, en mettant en place une structure unique dédiée et en simplifiant le parcours du lecteur ;
- le magasinage et la communication des documents, notamment en mutualisant les équipes entre les différents services de chaque département ;
- les acquisitions et le catalogage, en mettant en place une équipe transversale d’acquéreurs, en centralisant la fonction catalogage et, à moyen terme, en partageant la tâche de catalogage avec les éditeurs ;
- mais aussi la réduction du taux d’encadrement dans certains départements et une meilleure répartition des postes de secrétaires et d’assistants administratifs.

De façon plus marginale enfin, l’optimisation de certaines dépenses de fonctionnement courant, en particulier le gardiennage, ainsi que l’amélioration de la gestion de la flotte de véhicules et des magasins de fournitures permettraient de dégager des moyens supplémentaires. Les pistes d’améliorations proposées par la mission sur ces différents volets, à partir d’une analyse de l’organisation et des procédures de la bibliothèque, doivent être perçues comme un guide d’aide à la décision et une « boîte à outils » à destination de l’établissement et de ses tutelles. Leur mise en oeuvre permettrait d’améliorer la qualité du service rendu aux lecteurs, tout en conduisant à revoir à la hausse les objectifs de suppressions de postes fixés à l’établissement au cours des années à venir (au nombre de 21 par an en moyenne prévus sur la période 2009-2011 à ce stade), en tenant compte des perspectives de départs à la retraite. Le volume important de ceux-ci entre 2009 et 2014 (entre 50 et 80 départs par an sur la période) constitue en effet une opportunité à saisir pour réaliser ces réorganisations et ces améliorations de l’efficience de la bibliothèque. »


Utiliser Google pour des recherches juridiques

Une méthode de recherche rapide mais fiable sur le Web

Vendredi 6 novembre 2009

Lire la suite »

Plan
Principes de fonctionnement
Comment interroger
Recherche avancée : exemple d’utilisation

Comment fonctionne Google : quelques principes à retenir

Le contenu et la recherche :

- Google est à la fois :

  • un moteur de recherche sur le Web = la plus grande base de données de pages web
  • un moteur de recherche sur les blogs pas toujours pertinent mais qui s’est amélioré. Mieux vaut tout de même completer avec Technorati. Essayez droit des obligations sur Google Blog Search (GBS) puis Technorati et comparez. Vous remarquerez que dans la plupart des cas et quelque soit le moteur de blogs, il n’y a pas trace du meilleur blog sur le sujet, celui du Pr. Houtcieff. Dans Technorati, pareil [4]. Cela dit, si on tape blog droit des obligations dans le moteur Web de Google, on retrouve le blog de Dimitri Houtcieff en premier. Mais là, ce n’est plus une recherche de billets/posts de blogs, mais juste une recherche de blogs
  • un annuaire de sites web = le plus grand répertoire de sites web classés par sujet. Pompé en toute légalité sur l’original DMOZ
  • un moteur de recherche sur les groupes de discussion = le moyen de fouiller dans de très nombreux forums de discussion en ligne, mais non modérés et de valeur très inégale.
    Il suffit donc de cliquer sur les onglets Répertoire ou Groupes pour dupliquer votre recherche dans l’annuaire de Google ou les groupes de discussion

- mais tout n’est pas dans Google :

  • Google n’indexe généralement pas les bases de données payantes. Il peut toutefois indexer les titres d’articles payants, car ceux-ci sont affichés sur des pages gratuites ou bien ont des fils RSS. Voir par exemple les titres des articles des revues de Lextenso
  • il ne couvre pas tout le Web : ni le Web payant, ni le contenu des bases de données, ni celui des sites dits "dynamiques" (leur contenu est fourni par une base de données), ... Au total, Google n’indexe même pas un tiers des pages web gratuites existantes.
    Deux importants exemples de ces sites-bases de données difficiles à indexer pour Google sont :
    • les bases de données de Legifrance, sauf les textes consolidés (LEGI). Sauf pour les lois et décrets récents ou bien connus [5], il faut donc interroger Legifrance par les interfaces de recherche de chacune de ses bases de données (en savoir plus). C’est particulièrement vrai pour la jurisprudence
    • la base de données des arrêts de la CJCE et du TPI depuis juillet 1997 sur Curia, même si, là aussi, les arrêts récents ou célèbres sont bien indexés par Google
  • Google peut être en retard sur l’actualité/les mises à jour des sites web et mettre jusqu’à plusieurs semaines à indexer correctement un nouveau site web (voir infra)
  • parce qu’il dépend du contenu d’Internet, il ne couvre ni le papier ni la littérature grise. Quoique ... Avec Google Books et surtout le partenariat de très grandes bibliothèques [6], Google indexe énormément d’ouvrages en anglais. Mais du fait de l’opposition des éditeurs français, le contenu en droit français est pour l’instant négligeable

- laisser un espace revient à utiliser l’opérateur logique ET implicite

- le premier mot de votre question sera considéré par Google comme le plus important, il aura donc un poids plus important que les autres dans les résultats, en faisant par exemple remonter dans les premières réponses les pages web où ce mot est dans le titre de la page.
Ce point — non précisé dans l’aide officielle de Google et la plupart des guides de recherche en ligne — peut avoir un effet très important sur le tri des résultats par Google, en amenant dans les dix premières réponses une page web jusque là "perdue" au delà des trente premières réponses

- n’abusez pas des guillemets. On dit souvent dans les cours de recherche sur bases de données ou sur le web qu’encadrer une expression avec des guillemets garantit des résultats moins nombreux et pertinents. Mon expérience, c’est qu’en réalité, les guillemets sur Google n’améliorent souvent pas grand’ chose voire parfois empêchent de trouver les principaux sites web sur un sujet. D’ailleurs Google ne les recommande pas trop fort. Cela dit, c’est vrai que si on veut vraiment *tous* les sites sur une expression, alors il faut utiliser le moteur à la fois *avec* les guillemets mais *aussi sans*, car, du moins si l’on s’en tient aux 30 premiers résultats, certains sites pertinents apparaissent uniquement avec les guillemets et d’autres uniquement sans [7]

Les résultats :

- les résultats sont classés par pertinence. La "pertinence selon Google" tient compte :

  • d’abord des liens pointant vers les pages web et de la qualité de ceux-ci (Google les considère comme autant de recommandations)
  • et ensuite des mots contenus dans la page web, ceux du titre de la page et du nom du fichier étant les plus importants)

- cette pertinence est réelle : en règle générale, il suffit de consulter les 30, voire les 50, premiers résultats pour trouver sa réponse et avoir balayé l’essentiel des sites

- cependant les résultats de Google sont de temps à autre —ça vient par vagues — pollués par les résultats de sites publicitaires quasiment vides de contenu juridique, comme les sites faisant de la publicité pour des livre de droit du licenciement destinés aux particuliers [8]. Une fois ceux-ci identifiés, Google les "bannit" de son index, mais le problème revient de temps à autre

- les résultats sont en général très "frais" :

  • Google indexe très régulièrement les sites importants (exemples : Assemblée nationale, Sénat, etc.)
  • Google privilégie les sites à mise à jour très fréquente, tels les sites de presse (lemonde.fr, liberation.fr, etc.) et les weblogs, en les réindexant de une à plusieurs fois par jour
  • néanmoins et de manière logique vu sa préférence pour les liens hypertextes et pour les sites à mise à jour fréquente, Google peut avoir quelques jours de retard sur certaines rubriques peu consultées de sites très vastes et jusqu’à une semaine de retard — en général, plutôt quelques jours — sur l’actualité des sites web les moins importants, qui eux-mêmes sont rarement mis à jour. De même, Google peut mettre jusqu’à plusieurs semaines pour indexer correctement un nouveau site web, c’est-à-dire indexer la totalité de ses pages et les faire monter en tête des résultats sur les questions pertinentes [9].

Comment interroger Google

- 1. prenez deux secondes pour réfléchir aux mots-clés que vous allez utiliser. Car, même avec Google, cela peut faire la différence entre trouver et ne pas trouver :

  • pensez aux synonymes et quasi-synonymes.
    Exemple : bail, baux, loyer, loyers
  • si vous cherchez la version officielle d’un texte, d’un arrêt ou d’un rapport, utilisez :
    • les termes juridiques officiels, c’est-à-dire ceux utilisés dans les codes et les lois (notamment dans les titres des lois).
      Exemple : redressement et liquidation judiciaires
    • la date complète.
      Exemple : 25 janvier 1985
    • ou éventuellement le numéro.
      Exemple : 85-98 (ce qui évite de trouver aussi la loi n° 85-99 sur les administrateurs judiciaires)
  • si en revanche vous cherchez des commentaires ou de la doctrine :
    • utilisez les noms usuels.
      Exemples : procédures collectives ou redressement judiciaire ou liquidation judiciaire ou difficultés des entreprises en difficulté ou défaillances d’entreprises
    • si vous cherchez des commentaires sur une réforme ancienne, précisez l’année.
      Exemple : 1985 (réforme des procédures collectives)
  • si vous cherchez de l’actualité non juridique ou des articles de presse, utilisez les termes économiques et/ou les expressions du langage courant.
    Exemple : faillite, faillites, fermetures d’entreprises, plans sociaux
  • plus généralement, si vous êtes compétent sur le domaine juridique concerné par votre recherche, tapez les mots et expressions qui devraient se trouver dans les documents que vous recherchez, et surtout dans leur titre et leurs premiers paragraphes. En revanche, si vous n’êtes pas spécialiste de ce domaine et a fortiori si vous n’êtes juriste ou étudiant en droit, évitez d’utiliser cette dernière technique.

- 2. choisissez le mode recherche avancée pour mieux contrôler votre recherche. Vous pouvez accéder aux options avancées soit sur la page Recherche avancée de Google — et alors pas besoin de savoir comment les écrire [10], soit sur la page d’accueil de Google mais il faut alors connaître les noms des champs et leur syntaxe.
Vous pourrez alors :

  • utiliser les opérateurs logiques (ET, OU, SAUF, expression) (rappel : en allant sur la page Recherche avancée, vous n’aurez pas à mémoriser leur syntaxe). Les opérateurs de recherche permettent de "pousser le moteur dans ses retranchements". Exemples : on veut des documents relativement simples et à jour pour créer une EURL : créer OR création eurl OR "entreprise unipersonnelle" (on peut aussi ajouter : filetype:pdf)
    Vous noterez que Google ne "comprend" pas les parenthèses et que le OR ne joue que sur les mots immédiatement adjacents à lui. Ce qui implique de mettre les mots d’une expression entre guillemets (contrairement à ce qui est recommandé plus haut pour les cas "normaux") si la notion faut partie d’une suite de synonymes. De plus, le premier mot qui commence une suite de OR est le plus important pour l’algorythme [11]. Exemple : résultats OR "chiffres d’affaires" OR bénéfices
  • choisir la langue des résultats. Peu intéressant : la langue des mots-clés utilisés conditionne celle des résultats
  • limiter les résultats à la France (sites français et non francophones), ce qui permet d’éviter les résultats provenant de sites québécois, belges et d’Afrique du Nord (Maroc, Tunisie, Algérie) et donc de se restreindre au droit français. Voilà une fonctionnalité très intéressante utile, à utiliser sans modération
  • choisir le format de fichier : Rich Text Format .rtf, Word .doc, Acrobat .pdf, Excel .xls, .PowerPoint .ppt, Access .mdb. Restreindre la recherche aux fichiers PDF permet de ne trouver que des documents sérieux et fiables (mais pas forcément pertinents, car ce n’est pas le but direct de cette fonctionnalité). En effet, très souvent, les documents officiels (textes juridiques, rapports) et les articles sont au format PDF tandis que les sites perso, ceux tournés vers le marketing, et les forums utilisent uniquement le HTML. Hors de l’interface Recherche avancée, écrivez filetype:[type_de_fichier] à la fin de votre requête
  • restreindre la recherche à un site (nom de domaine uniquement). Ainsi utilisé, Google est presque toujours plus efficace que le moteur interne du site, sauf sur des documents extrêmement récents, peu connus ou "enfouis" dans le site. Ce mode de recherche est particulièrement utile sur les plus vastes sites juridiques : le site du Premier ministre, les deux sites parlementaires (Assemblée nationale, Sénat), Europa, EUR-Lex. Hors de l’interface Recherche avancée, écrivez site:[domaine]
  • restreindre la recherche au "titre" (la balise HTML title, plus précisément) des pages web avec le champ intitle:[un_seul_mot] ou — plus efficace — allintitle :[tous_les_mots_qui_suivent] [9]
  • chercher par expression ce qui rend les résultats plus précis/moins nombreux et dans certains cas, évite les résultats hors sujet. Hors de l’interface Recherche avancée, utilisez les classiques guillemets (" "). La recherche par expression est devenue plus souvent nécessaire, face à l’élargissement des recherches pratiqué par Google
  • régler le nombre de résultats par page à 30 voire 50 (au-delà, en général, très peu de résultats sont pertinents). Ca permet de consulter plus facilement et plus rapidement les résultats pertinents

- 3. restreignez si nécessaire les résultats à une période de temps. Pour utiliser à fond cette fonctionnalité, il faut passer par l’interface simple de Google (la recherche avancée n’offre pas la possibilité de spécifier l’intervalle de temps exact que l’on désire), cliquer sur Afficher les options puis sur Choisir une période. [12]

- 4. ouvrez les résultats dans une nouvelle fenêtre ou un nouvel onglet, de manière à garder sous la main la liste des résultats. Pour cela : faites un clic droit sur le lien qui vous intéresse, puis un clic gauche sur "Ouvrir dans une nouvelle fenêtre/onglet"

- 5. s’il n’y a pas de résultat intéressant dans l’onglet Web de Google, regardez : * dans l’onglet Actualités

  • s’il n’y a pas une piste dans les groupes de discussion (cliquez sur l’onglet Groupes)
  • et si, dans l’annuaire, il n’y aurait pas de catégorie(s) correspondant à votre recherche (onglet Répertoire, puis regardez la catégorie citée sous le nom de la plupart des pages données en résultats).

Exemple d’utilisation de la Recherche avancée de Google

Ici, nous cherchons des articles en matière de contrats informatiques parus dans la revue Expertises. Voici comment interroger rapidement les sommaires de la revue Expertises sur le site de la revue :
- 1. allez sur la page d’accueil de Google en français
- 2. cliquez sur Recherche avancée, ce qui vous emmène sur l’interface de Recherche avancée de Google
- 3. dans la liste déroulante du nombre de résultats, choisissez d’afficher 30 résultats
- 4. limitez la recherche au site celog.fr (pas à la page celog.fr/expertises/sommaires.htm, car Google ne prend en compte que des noms de domaine, pas des pages profondes) en cherchant, par exemple, par "contrat"
- 5. lancez la recherche en cliquant sur le bouton "Recherche Google"
- 6. lisez les résultats et ouvrez ceux qui vous intéressent dans un nouvelle fenêtre.

Pour aller plus loin :
- utilisez d’autres moteurs, principalement Bing (le concurrent de chez Microsoft [13]) et Exalead (pour les sites français et francophones) [14], voire Ixquick et AlltheWeb [15] et les métamoteurs de recherche de personnes
- voyez nos articles Utiliser Google à 100%, notamment la bibliographie à la fin, et Recherche sur Internet : une méthode (un peu) simplifiée et quelques "philosophies", notamment la méthode des "autorités".

Emmanuel Barthe
documentaliste juridique, formateur à la recherche en ligne


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |...

Dernières brèves