Logiciels, Internet, moteurs de recherche

Dernier ajout : 17 février.

Derniers articles

Pourquoi et comment bloguer : quelques constats et convictions personnelles

Bloguer, c’est être libre (de s’exprimer)

Vendredi 26 janvier 2018

Lire la suite »

Je blogue depuis 2004. C’est une passion et une respiration.

Quand j’en parle, on me demande parfois :

  • Je voudrais bloguer mais je n’ose pas. Est-ce que ce que je veux écrire en vaut le coup ?
  • Faut-il publier beaucoup/souvent si on blogue ?
  • Sur quoi bloguer ? Sur quel sujet ?
  • Comment s’y prendre ? Comment est-ce qu’on blogue ?
  • Est-ce que ça a encore un intérêt de bloguer ? Est-ce que ce n’est pas plus simple et plus efficace de poster sur Twitter/Facebook/(écrivez ici votre réseau social préféré) ?
  • Qui va me lire ? Pour qui écrire ?
  • Bloguer, c’est dangereux ?
  • Bloguer, ça rapporte ?
  • Comment faire pour être bien référencé dans les moteurs de recherche (Google, Bing) ?

Alors, simplement, voici les réponses que je donne. Ce sont les miennes, d’autres blogueurs en donneront d’autres. Mais si ça peut vous aider à faire des choix et éventuellement vous lancer, j’en serai heureux.

Je voudrais bloguer mais je n’ose pas. Est-ce que ce que je veux écrire en vaut le coup ?

Ne vous posez même pas la question. Quand j’ai commencé, j’ai blogué pour moi seul :-) Bloguer est, au moins au départ, un acte solitaire et qui suppose qu’on a très envie de s’exprimer.

On blogue parce qu’on a quelque chose à dire et qu’on a envie de le publier, de le dire aux autres. Bloguer, c’est une passion, une obsession, une marotte.

C’est le temps qui dira si votre sujet et votre plume en valent le coup. Ce sont vos lecteurs, par leurs tweets, leurs posts Facebook, leurs commentaires sous vos billets, qui vous confirmeront que ce que vous écrivez intéresse, est utile ou émeut.

En théorie, on dit billet ou post pour un blog, pas article. Stricto sensu, le mot "article" est réservé aux articles de presse.

Après, quand je vois le peu de détails et d’arguments de certains articles, et inversement la longueur et le nombre de liens et de notes de bas de page de certains de mes billets, je n’ai aucune gêne à les qualifier d’articles. A propos de mon billet sur l’intelligence artificielle en droit [1], un spécialiste du sujet m’a même conseillé de le passer sur l’archive de pre-prints du CNRS, HAL. Sur HAL, concrètement, ce sont des articles de revues scientifiques qu’on publie. Alors ...

Faut-il publier beaucoup/souvent si on blogue ?

Réponse simple : non. Réponse nuancée : idéalement, une fois par semaine. Disons au moins une fois par mois.

En fait, tout dépend de votre envie d’être populaire et bien classé dans les moteurs de recherche. Google a tendance à vous laisser tomber si vous ne publiez pas au moins une fois par semaine. Ce qui est exigeant, surtout si vous bloguez sans rien y gagner sur le plan financier.

L’idéal, c’est d’avoir toujours de côté un ou deux billets prêts à être publié et des les publier progressivement. Ne pas faire de feu d’artifice en publiant trop de billets d’avion un coup mais les espacer d’au moins une semaine. (Cela dit, il m’arrive de ne pas pouvoir me retenir et d’en publier trois en une semaine. Tant pis !)

L’important pour être lu, c’est d’être crédible et de tenir la distance (au moins les deux premières années). Ce qui compte, ce n’est pas de publier souvent mais de publier bien (plus de précisions infra sur ce que veut dire « bien publier »).

Sur quoi bloguer ? Sur quel sujet ?

Sur ce que vous voulez. Exactement.

Sur ce qui vous branche ou ce qui est à la mode. Sur ce qui peut rapporter (un peu) d’argent. Sur ce qui peut vous faire (un peu) de pub. Sur ce qui peut vous aider à démontrer votre compétence si vous cherchez un poste, des partenaires commerciaux ou des clients.

Trois conditions si vous voulez être lu :

  • un sujet étroit/de niche ou au minimum très bien délimité. Ne sautez pas du coq à l’âne d’un billet à l’autre. Et les algorithmes des moteurs de recherche du Web n’aiment pas trop le mélange des genres
  • accrochez-vous à votre sujet. Ne le lâchez pas. Si vous voulez en changer, lancez un autre blog, sous une autre adresse et un autre nom
  • publiez :
    • soit de vrais scoops ou des exclusivités. Vos billets peuvent alors être courts mais c’est difficile, le scoop est le domaine de la presse
    • soit de longs billets argumentés et documentés.

Autrement dit, maîtrisez votre sujet. Soit vous le connaissez déjà (très) bien et vous êtes très bien informé (vous avez très vite les derniers tuyaux), soit vous faites de solides recherches pour vous documenter et ne pas dire de bêtises. Après tout, c’est Internet : même si la majorité des sites gratuits n’a guère d’intérêt pour les professionnels et les gens sérieux [2], il y a quand même des sites en accès libre fiables et bourrés d’information, même s’ils sont parfois difficiles à trouver [3].

Comment s’y prendre ? Comment est-ce qu’on blogue ?

Tres simplement et très facilement.

On commence par écrire son premier post sur n’importe quel logiciel de traitement de texte. Même si le bon vieux Bloc-Notes a mes faveurs, même Write, Open Office, Libre Office ou Word feront l’affaire. Sur smartphone, utilisez donc Simple Notepad de Mighty Frog si vous êtes sous Android [4]. Évitez Google Docs, il a besoin d’une connexion.

Pourquoi dites-vous de commencer par écrire sur un bon vieux logiciel de texte ? Moi, je veux écrire en ligne !

Parce que vous n’avez pas envie de rater votre premier essai. Rédiger hors ligne vous enlève la pression, vous permet de réécrire autant de fois qu’il le faudra sans aucun risque.

Et parce que pour bloguer, il faut prendre sur son temps libre. Et qu’on n’en a pas beaucoup. Or, quel meilleur endroit que les transports en commun pour écrire sur son smartphone, sa tablette ou son portable ? Justement, dans les transports, le plus souvent, il n’y a pas de connexion ...

Je ne sais pas écrire. Je n’ai aucun style !

Franchement, à moins d’avoir une prétention scientifique — ce qui est, je le reconnais, le cas de ce blog — on s’en moque. Quand je vois les fautes d’orthographe et de grammaire sur les SMS et Facebook, je me dis que le niveau moyen sur Internet est tel que vos lecteurs peuvent très bien n’en avoir rien à fiche [5].

Essayez quand même de ne pas faire une faute toutes les deux phrases. Ça fatigue à la longue et ça peut vous faire perdre bêtement des lecteurs. En plus, la plupart des logiciels de blog ont un correcteur orthographique intégré ... Au pire, copiez-collez vos écrits dans Word ou Open Office et laissez son correcteur faire le travail.

Question style, on s’en fiche encore plus. Parce que si vous écrivez au moins un billet par mois, à force, vous allez apprendre à écrire. Comme un journaliste, un écrivain ou un publicitaire. C’est en forgeant qu’on devient forgeron.

Sachez simplement que quand j’ai commencé, je faisais des phrases à rallonge et que je n’aérais mes paragraphes ni par des lignes vides ni par des intertitres ni par des puces ni par des images. Bref, je faisais des gros pâtés :-) Tout ce qu’il ne faut pas faire. Puis, très lentement, j’ai appris.

Il existe plein de guides/tutoriels gratuits sur Internet pour apprendre à écrire pour le Web. Il y en a de deux sortes :

  • ceux qui vous conseillent dans le seul but d’être bien classé dans Google et au final gagner de l’argent. Bons conseils en général (je les ai lus et en ai suivi certains), mais si vous les suivez à la lettre, vous ne risquez pas de vous distinguer de la masse
  • ceux qui ne veulent pas vous formater et vous recommandent la sincérité et l’authenticité. C’est mon cas. Trop de blogs n’ont d’original que leur charte graphique (le design, les couleurs et les images de leurs pages).

Avec quelle application/logiciel bloguer ?

Le plus simple pour débuter, c’est :

  • Blogger de Google. Mais s’il est très simple à utiliser, il est devenu un peu "has been". A mon avis, il est en perte de vitesse. Notamment, il n’est pas assez soutenu par Google.

Et sinon, à peine plus compliqué :

  • WordPress (WP) en version hébergée chez ... WordPress ("hébergée" veut dire que vous n’avez rien à installer et pas à vous soucier de votre serveur). WP offre même une application Android pour bloguer directement à partir de votre smartphone. C’est un plus.
    WordPress est LE logiciel dominant pour écrire sur Internet. Sa part de marché des logiciels de gestion de contenu (CMS) a dépassé les 50% en 2016 [8].
    En échange de la gratuité de l’hébergement sur WordPress.com, des publicités apparaîtront sur vos pages. Et vous ne pouvez pas contrôler leur nature ou leur contenu. Pour l’éviter, vous pouvez payer ou choisir de gérer votre serveur et d’installer vous-même WP

  • DotClear. Bien qu’il n’offre pas de version hébergée, son installation est automatisée, il est très riche en fonctionnalités, il est français et c’est une excellente alternative à WordPress [9].

Personnellement, j’utilise Spip, dans sa version 3, la plus récente, mais le délai pour le maîtriser ("learning curve") est plus important et la communauté des sites sous Spip se réduit inéxorablement depuis 2006 [10]. Pour les problémes techniques et les mises à jour de Spip, j’ai pris un webmestre. Je n’ai plus le temps de passer un dimanche les mains dans le cambouis.

Si vous prenez autre chose, vérifiez bien que les dernières mises à jour datent de moins de six mois, que la communauté autour de ce soft est nombreuse et qu’elle est toujours active. Sinon, le jour où vous aurez un bug ou bien à transporter votre production sur un autre logiciel, ce sera très compliqué voire très cher. Pour avoir d’autres idées, vous pouvez consulter un article de ce blog datant certes de 2007, mais plusieurs des logiciels cités sont toujours bien vivants [11].

Est-ce que ça a encore un intérêt de bloguer ? Est-ce que ce n’est pas plus simple et plus efficace de poster sur un réseau social ?

Sur un réseau social, ce que vous écrivez appartient, en fait, au réseau social. Si le réseau social arrête ses activités — voyez ce qui pourrait arriver à toutes les listes de discussion Yahoo Groupes ... — il vous serait très difficile, pour ne pas dire impossible, de transférer ça ailleurs. De même, si vous voulez transférer tout ce que vous avez écrit d’un réseau social à un autre ou vers un blog, ce sera mission impossible.
Votre blog, en revanche, est votre propriété, juridiquement et surtout — la plupart du temps — techniquement. Vos écrits sont stockés dans une base de données bien faite, récupérable et transplantable ailleurs.

Si le réseau social se fâche avec Google ou a un mauvais moteur de recherche interne, vos statistiques de consultation vont se casser la figure.
Sur votre blog, le trafic qui y passe, c’est votre affaire, votre responsabilité. S’il monte ou s’il tombe, c’est de votre fait.

Sur un réseau social, vous ne pouvez pas empêcher quelqu’un d’écrire des c...ies sur votre page ou juste à côté. Si vous voulez fermer votre compte, tous les commentaires et réponses des autres resteront en ligne, eux. Ça peut être gênant.
Alors que sur votre blog, vous êtes le maître. Vous pouvez censurer les trolls, les pubs et les inintéressants (je le fais, c’est *mon* blog) [12].

Sur un réseau social, les messages longs (400 mots et plus) sont mal vus et généralement peu lus. Le format long sur un réseau social, en pratique, tourne autour de 100 à 200 mots [13]. Et renvoie au blog pour plus de détails !
Sur un blog, vous écrivez aussi long (ou aussi court, après tout) que ça vous chante. Il est établi que pour être bien référencé par Google, la longueur idéale d’un billet de blog se situe entre 1000 et 2000 mots mais varie selon le secteur [14]. De plus, long, ça fait sérieux. Et il suffit de faire un chapeau ou un résumé en début d’article et tout le monde est content.

Les posts sur les réseaux sociaux disparaissent des écrans radar en quelques jours. Tenter de les retrouver par Google ou le moteur interne du réseau est le plus souvent peine perdue.
Inversement, la popularité d’un billet bien argumenté se bonifie avec le temps. Mon billet le plus consulté, Où trouver des arrêts de cour d’appel ?, a été écrit à l’origine en octobre 2011. Je ne l’ai mis à jour que cinq fois depuis. Six ans après, il est autour de 300 000 visites au total, et demeure un des articles les plus lus récemment sur mon blog.

Et puis, un blog, c’est beaucoup plus personnel qu’un compte sur Facebook. Sur un grand réseau social, le produit c’est vous. Vous, vos données, vos liens affectifs et vos émotions. Le réseau social, c’est aujourd’hui établi, cherche à provoquer votre indignation, votre colère, votre compassion. Parce que ce sont les émotions qui créent le buzz. Et c’est le buzz qui crée le trafic. Et c’est le trafic qui crée les données et la publicité qu’on vend.
Sur votre blog, vous n’êtes pas le produit, vous êtes l’auteur du produit. Le produit, vous le contrôlez de A à Z. Vous pouvez même en faire payer une partie (voir le blog Abondance d’Olivier Andrieu, le pape français du référencement de sites web). La publicité, si vous en mettez, vous pouvez dans plusieurs cas la contrôler. Et c’est vous qui en touchez les (faibles) revenus.

Tout ça ne vous empêche pas d’annoncer vos posts sur Twitter, FB etc. et de créer le débat. Bien au contraire ! Blog et réseau social sont complémentaires et se renforcent l’un l’autre.

Qui va me lire ? Pour qui écrire ?

Ne vous tracassez pas. Votre lectorat vous trouvera — ou pas — et ce, principalement par la communauté de blogueurs, twittos et "FBers" autour de vous et pour le reste par Google. Tenez deux ans. Si au bout de deux ans, vous n’avez toujours que quelques dizaines de visiteurs uniques par jour, posez vous des questions. Et envisagez d’arrêter ou de changer de sujet.

Si vous êtes très volontaire, très pressé ou bien vous voulez bloguer pour de l’argent, il faut prévoir :

  • une formation pour vous au marketing en ligne
  • d’échanger des liens avec des sites proches du vôtre par le sujet : vous faites un lien vers eux, ils en font autant en sens inverse
  • de faire travailler un spécialiste du référencement (SEO)
  • si rien de toute cela ne marche, une campagne de publicité.

De temps en temps, proposez à vos lecteurs de vous suggérer des thèmes de billet.

Bloguer, c’est dangereux ?

Soyons clair :

  • c’est à vous de choisir ce que vous aller dire sur votre blog. Réfléchissez avant de cliquer sur Publish. Imaginez que vous êtes à une conférence, devant plus de 100 personnes, c’est vous qui intervenez : est-ce que vous pouvez vous permettre de dire ça ? Non ? Alors, ne bloguez pas là-dessus
  • bloguer n’est pas plus dangereux que d’écrire un billet d’humeur dans un journal ou un status sur Facebook. Un blog est *public*. Écrire sur un blog, c’est publier. Et publier, c’est rendre public.

Sincérité ne veut pas dire épancher son cœur ni prendre le risque d’être accusé de diffamation. Juste écrire sur un ton personnel et sur ce qui vous intéresse vous personnellement. Pas votre public. Rappelez-vous : bloguer est fondamentalement un acte solitaire et très personnel. Si vous bloguez, c’est d’abord pour vous. Mais c’est aussi un acte public : tout le monde peut vous lire. Il vaut mieux garder un équilibre entre ces deux aspects.

Bloguer, ça rapporte ?

Oui, mais en général très, très peu. Les pubs Adsense et Adwords ne rapportent pas lourd. De plus, elles peuvent être envahissantes et donc gêner vos lecteurs.

Pour du discret, vous pouvez essayer :

  • les commissions des sites de commerce électronique (Amazon ...) sur les ventes faites suite à un clic sur un lien posté sur votre blog. Mais leur rentabilité n’est pas meilleure sauf si votre blog est orienté consommation ou informatique et son trafic très élevé
  • le lien (avec ou sans image) sur la page d’accueil de votre site. C’est une partie de la popularité de votre site dans Google (Page Rank) que vous transmettez ainsi. Pour qu’on vous propose ça, il faut que votre blog soit déjà un minimum connu et reconnu.

Pour vous donner une idée : ce blog, avec un lien publicitaire en bas de la page d’accueil, sans logo ni image, me rapporte environ 100 euros par an. Il m’en coûte 150. Ce n’est pas comme ça que je vais devenir riche ...

Comment faire pour être bien référencé dans les moteurs de recherche (Google, Bing) ?

Voyez mon précédent article 10 conseils pour mieux référencer votre site dans Google ... et ailleurs.

En résumé

En résumé, ne vous laissez pas arrêter par vos doutes et lancez vous ! Ce n’est qu’ainsi que vous apprendrez et que vous saurez si vous êtes capable de tenir sur la durée.

Et, sans mépriser votre public ni les tendances n’oubliez pas : c’est *votre* blog. C’est votre originalité. Vous n’êtes pas obligé de faire comme tout le monde.

Emmanuel Barthe
blogueur depuis 2004

PS : ma collègue documentaliste juridique Carole Guelfucci donne ses raisons de bloguer et ses conseils : Tenir un blog professionnel.


Utiliser Google pour des recherches juridiques

Une méthode de recherche fiable sur le Web

Lundi 30 octobre 2017

Lire la suite »

Cet article est à la fois un guide détaillé et un tutoriel (grâce aux nombreux exemples donnés) pour pousser à fond les performances en recherche de Google, plus particulièrement dans le domaine juridique [15]. Mis en ligne en juillet 2013, il est est régulièrement mis à jour depuis.

Si vous êtes pressé, allez directement à la section 3. Recherche avancée : trois exemples d'utilisation.

Sommaire

1. Comment fonctionne Google

1.1. Contenu et indexation

1.2. Les résultats de Google

2. Comment interroger Google

2.1. L'essentiel

2.2. Choisir ses mots-clés

2.3. Repérez dans les résultats les mots-clés que vous avez oubliés

2.4. Utilisez la recherche avancée pour mieux contrôler votre recherche (opérateurs booléens et filtres)

2.5. Rechercher sur une période

2.6. Ouvrir les résultats dans une nouvelle fenêtre ou un nouvel onglet

2.7. Les moteurs spécialisés de Google

2.8. Toujours rien ?

3. Recherche avancée : quatre exemples d'utilisation

4. Pour aller plus loin

1. Comment fonctionne Google : quelques principes à retenir

1.1. Contenu et indexation

1.1.1. La plus grande base de données du Web

Google est un moteur de recherche sur le Web. C’est la plus grande base de données de pages web et de fichiers divers stockés sur le Web (PDF, Word, Excel etc.) [16].

En termes de taille de sa base de données, de richesse des fonctionnalités et surtout de pertinence des résultats, il n’a plus de rival global. Même Bing (Microsoft) a abandonné la compétition. En fait, ses principaux rivaux sont des moteurs spécialisés [17] :

  • locaux/nationaux, tel Baidu en Chine
  • spécialisés sur un secteur professionnel/une industrie, comme Amazon sur le commerce électronique
  • ou internes à un réseau social, comme le moteur de Facebook.

1.1.2. Tout n’est pas dans Google et tout n’est pas forcément bien référencé dans Google

Soyons clair : il y a infiniment plus de documents hors de Google que dans Google. N’utiliser que Google, c’est tentant. Mais c’est est un piège.

  • Google n’indexe généralement pas les bases de données payantes et totalement fermées. En revanche, il indexe les titres d’articles payants, dès que ceux-ci sont affichés avec leur lien sur des pages gratuites ou bien un site payant si celui-ci a un fil RSS. Il peut même indexer non seulement le titre mais aussi les auteurs et les mots-clés (pas le texte intégral) lorsque l’éditeur laisse ses métadonnées disponibles librement et gratuitement pour le moissonnage OAI (exemple des articles de revues de LexisNexis, voir infra). Google indexe également les pages des sites payants dès lors qu’ils en affichent une partie gratuite (titre, chapeau, début du document ...), comme par exemple celles de Lextenso.
  • Google ne couvre pas tout le Web : ni le Web payant, ni la totalité du contenu de nombreuses bases de données gratuites [18], ni les sites qui lui interdisent l’accès à tout ou partie de leurs pages (le fameux fichier robots.txt) etc. Au total, on estime que Google n’indexe (i.e. ne reproduit le contenu et ne le place dans son index [19]), au mieux, que la moitié environ des pages web librement accessibles. Les pires estimations, sous-entendant certes une définition du Web très large puisqu’incluant le "deep web" et les darknets, donnent seulement 4% du Web comme indexé [20].
    Un exemple important de ces sites-bases de données non totalement indexés par Google sont les bases de données de Legifrance, à l’exception notable (et bien pratique ...) des textes consolidés (LEGI) et du JORF. On peut considérer que le Journal officiel Lois et décrets sur Legifrance est à 95% indexé par Google — et à 99,5% pour les textes publiés récemment. On peut également considérer que la majeure partie de la jurisprudence est également indexée — même si certaines questions fonctionneront mieux directement dans Legifrance (à fin avril 2017, Google indexait 8 800 000 documents de Legifrance, soit quasiment tout). Il faut donc selon les cas interroger Legifrance par les interfaces de recherche de chacune de ses bases de données (en savoir plus). C’est particulièrement vrai pour la jurisprudence.

1.1.3. Google et les variantes d’un mot

Google, si vous n’êtes pas en mode Mot à mot, cherche automatiquement les variantes d’un mot. Il prend sa racine et cherche :

  • son pluriel et si possible, son féminin. Exemples : bail cherchera aussi baux
  • le verbe, les adjectifs qualificatifs et les adverbes qui lui correspondent. Exemples : embauche cherchera embaucher.

C’est ce qu’on appelle une troncature automatique ou "autostem" en anglais.

1.1.4. Google et le traitement du langage naturel version machine learning

A noter que le machine learning [21] (apprentissage statistique automatique [22]) est utilisé pour toutes les requêtes [23] Google depuis juin 2016. Cet algorithme de Google est appelé RankBrain.

Comme l’explique Olivier Duffez de WebRankInfo, « RankBrain est un système basé sur le machine learning permettant à Google de mieux comprendre les requêtes des internautes. Il peut s’agir de requêtes très longues et précises (très longue traîne) ou de requêtes n’ayant jamais été faites et peu similaires à d’autres plus connues. Grâce aux nouvelles méthodes d’intelligence artificielle dont Google est devenu un des plus grands spécialistes mondiaux, RankBrain parviendrait à mieux comprendre ces requêtes difficiles » [24].

En fait, RankBrain n’est qu’une implémentation de Word2vec, l’algorithme de traitement du langage naturel (natural language processing, NLP) par machine learning non supervisé [25] développé par une équipe de Google Research (il a d’ailleurs été mis par Google en open source en 2013). En prenant en compte le contexte (les mots voisins) de chaque mot dans les documents, RankBrain/Word2vec "apprend" que certains mots, dans un contexte donné, sont similaires [26]. Word2vec transforme ces contextes en vecteurs, donc en chiffres, ce qui permet de les comparer facilement. C’est selon toute vraisemblance Word2vec qui permet par exemple à Google de deviner que si vous avez tapé compétition déloyale, vous vouliez en fait écrire concurrence déloyale ou qui fait une synonymie automatique entre ouvrage et livre [27].

Pour autant, le type de requête que décrit O. Duffez (longues, beaucoup de mots peu ou moyennement utilisés [28]) — et qui est le propre des recherches juridiques pointues — ne réussit pas toujours dans Google. C’est probablement autant une limite du Web gratuit [29] que celle de Word2vec.


Word2vec : relations sémantiques dans un espace vectoriel

A noter également que, comme l’explique Sylvain Peyronnet, chief scientist du moteur Qwant et co-fondateur du laboratoire de recherche privé ix-labs [30], dans une interview au Journal du Net [31], il n’y a depuis longtemps plus un (le PageRank d’origine), ni deux, ni trois algorithmes qui font fonctionner le moteur de recherche de Google mais un grand nombre (peut-être 200 !) d’algorithmes et ils s’influencent les uns les autres tout en étant pondérés par des critères ... et fréquemment modifiés pour améliorer les résultats ou lutter contre les spécialistes du SEO trop habiles [32].

1.1.5. Google et les documents très longs

Google peut aussi avoir des difficultés à faire remonter en haut du classement de ses résultats des documents très longs où l’information pertinente est noyée dans la masse. Ainsi, sur les PDF très longs (à partir de 30 à 40 pages environ), il indexera tout le document mais privilégiera très nettement dans son classement les mots-clés placés dans le titre, la balise title ou les premières pages du document. C’est particulièrement net si on ne restreint pas la recherche avec site: ou filetype:pdf Exemple : les références bibliographiques dans les fichiers PDF que constituent les trois parties des Notes de doctrine relatives aux arrêts de la CJUE et du TPI sur Curia. Contre-exemple : les références bibliographiques des revues de LexisNexis sur http://www.lexisnexis.fr/droit-document car chaque référence a sa propre page web.

1.1.6. Google est parfois en retard

Google peut être en retard sur les mises à jour des sites web les moins populaires ou mettre des jours ou des semaines à prendre en compte correctement un nouveau site web (voir infra), notamment parce que personne n’a encore fait un lien vers lui. Mais il indexe en temps réel les mises à jour des sites institutionnels, universitaires, de presse, des blogs populaires et de tout autre site populaire ou fiable [33].

1.1.7. Google Books, Google Scholar, Google et les catalogues de bibliothèques

Parce qu’il dépend du contenu d’Internet, Google ne couvre ni le papier ni la littérature grise — qui ne sont par définition pas en ligne.

Quoique ... Avec Google Books et surtout le partenariat de très grandes bibliothèques [34], Google indexe énormément d’ouvrages en anglais et un nombre certain en français.

Mais du fait de l’opposition des éditeurs français, le contenu en droit français est pour l’instant faible. Cela dit, ce n’est pas le cas en droit belge ni en droit européen ou international.


Google Books. La requête "droit de la propriété intellectuelle" sort des titres du groupe Lextenso, un des rares éditeurs juridiques français à être rentré dans le programme.

Google Scholar, de son côté, indexe les articles scientifiques (donc de nombreux articles juridiques) présents sur le Web sous forme de références bibliographiques ou, plus intéressant, en texte intégral gratuit. Cela dit, Google Scholar contient surtout des articles de droit international public, de droit public interne ou de droits de l’homme. Donc très peu d’articles en droit des affaires ou en droit privé. À ce titre, ses grands rivaux le Legal SSRN (racheté par Elsevier) et le très récent LawArXiv sont souvent plus intéressants.

Dans un style proche, une fonctionnalité de Google intègre les catalogues de bibliothèques dans ses résultats de recherche de livres numériques (ebooks). Pour en bénéficier, il faut activer la localisation [35]. D’après un utilisateur américain, les premiers résultats ne sont pas toujours satisfaisants, mais avec certains fournisseurs d’ebooks comme Overdrive, ça marche très bien [36].

Même sans localisation, le fait d’ajouter "bibliothèque" à une recherche Google ramène un certain nombre de pages web correspondant à des notices bibliographiques (des fiches de catalogue). Sur ce type de recherche, le catalogue de bibliothèque le plus représenté — et de loin — en droit français est celui de la BU Vauban (Lille). Mais — surprise ! — cet ajout fait aussi sortir des titres en PDF de la bibliothèque numérique Gallica de la BNF.

Quant à l’ajout du mot "livre", il permet de chercher sur les catalogues de librairies en ligne les plus connues, comme la LGDJ, la Fnac, Amazon, la librairie Dalloz, celle de LexisNexis ... Mais aussi, évidemment, Google Books car le moteur américain insère dans les résultats de l’onglet Web des résultats extraits de Google Books.

1.2. Les résultats de Google

1.2.1. Ranking : le classement par pertinence

- Les résultats sont classés par pertinence. Ce classement par pertinence s’appelle "ranking" en anglais. La "pertinence selon Google" tient compte [37] :

  • d’abord des liens pointant vers les pages web et de la qualité de ceux-ci (Google les considère comme autant de recommandations), c’est-à-dire en fait de la qualité de celles-ci (les pages vers lesquelles ils pointent) autant que de la qualité du site faisant les liens. Exemple paroxystique : un site universitaire (site de qualité quasiment par nature selon Google, voir infra) fait des liens vers des pages web du blog d’une spécialiste reconnue du sujet (site de qualité selon Google du fait des nombreux liens établis vers lui par d’autres spécialistes et par la communauté réunie autour de ce sujet, voir infra)
  • et ensuite des mots (et leurs synonymes) de la requête contenus dans la page web :
    • ceux du titre informatique de la page (balise title), du titre réel de celle-ci (balise H1 ou H2 sinon) et du nom du fichier HTML sont les plus importants
    • Google privilégie les expressions sur les termes isolés, et les termes exacts sur les synonymes
  • de la "qualité" (selon Google) de la page. Le nom de domaine est important ici : les sites universitaires (avec "univ" dans leur nom de domaine en France ou .edu aux USA) et gouvernementaux (.gouv.fr en France, .gov aux Etats-Unis) sont favorisés ; les sites personnels sont défavorisés, sauf s’ils ont leur propre nom de domaine et une forte réputation au sein de leur communauté
  • de la fraîcheur/fréquence de mise à jour de la page. Par exemple, un site personnel réputé dans une communauté, sur des requêtes Google sur lesquelles il possède des pages très pertinentes, va pourtant reculer en bas de la première page des résultats de Google s’il n’est pas mis à jour chaque semaine
  • du travail des "quality raters" cités plus haut par Sylvain Peyronnet [38]. Avant la sortie d’une nouvelle version de l’algorithme, et à l’aide d’un guide fourni par Google [39], ces personnes évaluent ses erreurs ou manques de pertinence, de manière à ce qu’il soit corrigé (ou plus probablement à ce que la partie machine learning de l’algorithme "apprenne") avant sa "release" [40].

- Cette pertinence est réelle : en règle générale, il suffit de consulter les 30, voire les 50 premiers résultats pour trouver sa réponse et avoir balayé l’essentiel des sites. En général ... Ce qui veut dire qu’en cas de doute, il faut aller jusqu’au 100e résultat (c’est du vécu). C’est particulièrement net sur des sites mal structurés et mal indexés par Google comme les sites syndicaux


Les 5 premiers critères de pertinence pour Google selon l’étude SEO Factors 2016. Source image : SEO Factors

1.2.2. La pollution des résultats par le spamdexing

Cependant les résultats de Google sont de temps à autre — ça vient par vagues — pollués par les résultats de sites publicitaires quasiment vides de contenu juridique, comme les sites faisant de la publicité pour des livres de droit du licenciement destinés aux particuliers. C’est ce qu’on appelle du "spamdexing" [41]. Une fois les sites spammeurs identifiés, Google les "bannit" de son index, mais le problème revient de temps à autre. Par exemple, fin décembre 2017, sur des questions de nuisances sonores (troubles de voisinage), j’ai vu le site gralon.net, dont les articles sont très vagues, à la limite de l’insignifiant, mais bourrés de publicités, réapparaître sur mon radar.

Le spamdexing de Google a toutefois beaucoup reculé depuis 2014 du fait de l’implémentation de l’algorithme RankBrain avec ses capacités de traitement du langage naturel (NLP) (voir A. le contenu de Google supra).

Ce qu’on trouve en revanche, ce sont des sites payants du type cours-de-droit.net dont le référencement (SEO) très efficace les positionne souvent dans les cinq premiers résultats de Google, alors même que seule l’introduction des dissertations qu’ils vendent est disponible gratuitement [42].

1.2.3. La fraîcheur des résultats

Les résultats sont en général très "frais" :

  • Google indexe très régulièrement les sites importants (exemples : Assemblée nationale, Sénat, etc.)
  • Google privilégie les sites à mise à jour très fréquente, tels les sites de presse (lemonde.fr, liberation.fr, etc.) et les blogs, en les réindexant de une à une dizaine de fois par jour. Google s’adapte à la fréquence de mise à jour du site
  • néanmoins et de manière logique vu sa préférence pour les liens hypertextes et pour les sites à mise à jour fréquente, Google peut avoir quelques jours de retard sur certaines rubriques peu consultées de sites très vastes et jusqu’à une semaine de retard — en général, plutôt quelques jours — sur l’actualité des sites web les moins importants, qui eux-mêmes sont rarement mis à jour. De même, Google peut mettre jusqu’à plusieurs semaines pour indexer correctement un nouveau site web, c’est-à-dire indexer la totalité de ses pages et les faire monter en tête des résultats sur les questions pertinentes [43].

2. Comment interroger Google

2.1. L’essentiel

  • laisser un espace revient à utiliser l’opérateur logique ET implicite. Autrement dit : chaque fois que vous tapez un mot de plus, vous ajoutez un critère, une condition à votre recherche. Exemple : responsabilité pénale du dirigeant trouvera moins de résultats que responsabilité
  • cherchez à utiliser des expressions plutôt que des suites de mots. Google "accroche" mieux là dessus (voir explication détaillée infra).

2.2. Choisir ses mots-clés

Prenez 30 secondes pour réfléchir aux mots-clés que vous allez utiliser. Car, même avec Google, cela peut faire la différence entre trouver et ne pas trouver.

Voici les "trucs" essentiels pour choisir ses mots-clés :

  • ne vous laissez pas influencer par les suggestions de Google [44]
  • pensez aux synonymes et quasi-synonymes. Voir aussi infra l’opérateur (tilde).
    Exemple : bail, baux, loyer, loyers, location. Un synonyme, ça peut être aussi un numéro d’article de Code, particulièrement en droit fiscal avec le CGI. Exemple (en recherche de jurisprudence) : 1240, 1382 et faute sont des quasi-synonymes de responsabilité civile
  • si vous cherchez la version officielle d’un texte, d’un arrêt ou d’un rapport, utilisez  :
    • les termes juridiques officiels, c’est-à-dire ceux utilisés dans les codes et les lois (notamment dans les titres des lois).
      Exemple : redressement et liquidation judiciaires
    • la date complète.
      Exemple : 25 janvier 1985
    • ou éventuellement le numéro.
      Exemple : 85-98 (ce qui évite de trouver aussi la loi n° 85-99 sur les administrateurs judiciaires)
  • si en revanche vous cherchez des commentaires ou de la doctrine (pour autant qu’il y en ait gratuits sur le Web sur votre sujet) :
    • utilisez les noms juridiques usuels.
      Exemples : procédures collectives ou redressement judiciaire ou liquidation judiciaire ou difficultés des entreprises en difficulté ou défaillances d’entreprises (pas faillite, qui n’est plus le terme juridique approprié)
    • si vous cherchez des commentaires sur une réforme ancienne, précisez l’année.
      Exemple : 1985 (réforme des procédures collectives)
  • si vous cherchez de l’actualité non juridique ou des articles de presse, utilisez les termes économiques et/ou les expressions du langage courant.
    Exemple : faillite, faillites, fermetures d’entreprises, plans sociaux
  • plus généralement, si vous êtes compétent sur le(s) domaine(s) juridique(s) concerné(s) par votre recherche, tapez les mots et expressions qui devraient se trouver dans les documents que vous recherchez, et surtout dans leur titre et leurs premiers paragraphes. Autrement dit : essayez de deviner comment les titres de documents sur le sujet sont écrits.
    En revanche, si vous n’êtes pas spécialiste de ce domaine et a fortiori si vous n’êtes pas juriste ou étudiant en droit, évitez d’utiliser cette dernière technique.


Ne vous laissez pas influencer par les suggestions de Google. Par exemple, ici, l’expression "responsabilité civile contractuelle" ne fait pas partie du vocabulaire des juristes : on parle simplement de "responsabilité contractuelle"

2.3. Repérez dans les résultats les mots-clés que vous avez oubliés :

  • dans les extraits qui composent les résultats de Google, si des mots vous semblent pertinents, réutilisez les dans votre question
  • dans les documents qui répondent le mieux à votre question, repérez les mots qui font partie de votre sujet mais que vous avez oubliés pour modifier votre question.

C’est un "truc" capital : modifier sa question initiale, oui, mais avec des mots qui marchent.

2.4. Utilisez la recherche avancée pour mieux contrôler votre recherche (opérateurs booléens et filtres

Deux possibilités :

  • utilisez la page Recherche avancée de Google. Et alors pas besoin de savoir comment écrire les opérateurs et filtres de Google
  • ou — mieux — apprenez les opérateurs et filtres de Google et utilisez-les sur la page d’accueil du moteur. Mais il faut alors connaître les noms des opérateurs et des champs/filtres et leur syntaxe.

Vous pourrez alors :

  • utiliser les opérateurs de recherche ET (AND ou espace), OU (OR), SAUF (-), expression (" ") et de proximité (AROUND()). On les appelle opérateurs booléens ou opérateurs logiques.
    Rappel : en allant sur la page Recherche avancée, vous n’aurez pas à mémoriser leur syntaxe. Toutefois, sur cette page, les opérateurs de proximité comme AROUND() ne sont pas proposés.
    Les opérateurs de recherche permettent de "pousser le moteur dans ses retranchements". Exemples : on veut des documents relativement simples et à jour pour créer une EURL : créer OR création eurl OR "entreprise unipersonnelle" (on peut aussi ajouter : filetype:pdf).
    Voici maintenant des précisions, à propos des opérateurs logiques dans Google, qui ont leur importance :
    • rappel : tout espace non placé entre des guillemets est pour Google un ET logique. Mais parfois aussi une incitation à interpréter la requête comme une expression : dans ce cas, si cette tendance de Google à tout transformer en expression vous gêne, utilisez le mode Mot à mot (en anglais Verbatim) (Outils > Tous les résultats > Mot à mot : disponible par défaut sur ordinateur, sous smartphone il faut afficher la page en "version ordinateur") [45] ou écrivez en majuscules le AND [46]
      Le mode Mot à mot de Google une fois activé
    • attention : Google ne "comprend" pas les parenthèses [47] et le OR ne joue que sur les mots immédiatement adjacents à lui. Ce qui implique de mettre les mots d’une expression entre guillemets (contrairement à ce qui est recommandé plus haut pour les cas "normaux") si la notion faut partie d’une suite de synonymes. De plus, le premier mot qui commence une suite de OR est le plus important pour l’algorithme [48]
    • il faut toutefois bien comprendre que multiplier les synonymes (reliés par OR) n’apporte pas grand’ chose en terme de pertinence des résultats. Un synonyme voire deux (pas plus, soit trois mots ou expressions maximum) aide lorsqu’on est dans du vocabulaire juridique un peu spécialisé et/ou peu présent sur le Web, mais le plus efficace en dehors de ces cas reste le choix de la bonne expression (sans guillemets sauf si ça "part dans tous les sens") et de laisser les capacités de l’algorithme RankBrain en NLP version machine learning (on en parlait supra) faire le travail de synonymie, d’autant que l’utilisation du OR stoppe très logiquement cette synonymie automatique [49].
      Voici un bon exemple à la fois du peu d’intérêt d’utiliser le OR, et en même temps de son intérêt en droit si on veut un maximum de fiabilité et creuser à fond la recherche : comparez les 100 premiers résultats de "responsabilité civile" accident automobile et "responsabilité civile" OR 1382 OR 1240 accident automobile. Seuls une petite dizaine de résultats diffèrent, la plupart (mais pas tous ...) sans intérêt majeur. Toutefois, certains résultats sortis seulement avec le OR peuvent venir de sites particulièrement fiables et avoir de la valeur si on ne veut rien rater. L’exemple utilisé ici est très net : Accident de la circulation et responsabilité civile des parents, Dalloz Etudiant est en effet le seul résultat venant d’un éditeur juridique et le seul à citer de la jurisprudence ...
    • utiliser l’opérateur - (SAUF) [50] pour exclure des termes qui faussent les résultats/les "polluent" : le - (moins) fonctionne. La règle générale d’utilisation de l’opérateur SAUF s’applique : n’utiliser le - qu’en dernier recours
    • opérateurs de proximité :
      • signalé en 2010, probablement apparu 5 ou 6 ans auparavant, mais non documenté par Google, l’opérateur de proximité AROUND(n) (où n est un nombre de mots qu’on fixera en pratique à 2 ou 5) est efficace en anglais mais le semble moins en français [51]
      • l’opérateur * ("wildcard") est censé remplacer un (au moins) ou plusieurs mots, je constate son efficacité dans une certaine mesure mais je n’arrive pas à la prouver par A + B
      • de toute façon, la bonne expression (sans guillemets, en général) pourra être tout aussi efficace, voire plus. Disons qu’au minimum, elle obtiendra des résultats différents (donc complémentaires) [52]
    • chercher par expression rend les résultats plus précis/moins nombreux et dans certains cas, évite les résultats hors sujet. Hors de l’interface Recherche avancée, utilisez les classiques guillemets (" "). Important : pour que les guillemets soient pris en compte à 100% par Google, il est nécessaire de passer en mode Mot à mot (Outils > Tous les résultats > Mot à mot), mode non disponible sur la version mobile de Google puisque le menu Outils n’apparaît pas sous smartphone.
      L’utilisation des guillemets est devenue plus souvent nécessaire, face à l’élargissement des recherches pratiqué par Google [53]. Toutefois, ne l’utilisez qu’après avoir testé l’expression sans guillemets, pour les raisons exposées ci-après.
      N’abusez pas des guillemets. On dit souvent dans les cours de recherche sur bases de données ou sur le web qu’encadrer une expression avec des guillemets garantit des résultats moins nombreux et pertinents. Mon expérience, c’est qu’en réalité, les guillemets sur Google n’améliorent souvent pas grand’ chose voire parfois empêchent de trouver les principaux sites web sur un sujet. D’ailleurs Google ne les recommande pas trop fort. Cela dit, c’est vrai que si on veut vraiment *tous* les sites sur une expression, alors il faut utiliser le moteur à la fois *avec* les guillemets mais *aussi sans*, car, du moins si l’on s’en tient aux 30 premiers résultats, certains sites pertinents apparaissent uniquement avec les guillemets et d’autres uniquement sans [54]. En effet, l’algorithme de Google détecte souvent tout seul l’expression et la privilégie dans le classement des résultats. De surcroît, mettre les guillemets, en pratique, réduit souvent — mais pas toujours — un peu la pertinence par rapport à sans les guillemets car ceux-ci éliminent des résultats où l’expression n’est pas totalement identique, voire certaines pages où pourtant celle-ci apparaît clairement ...
  • si votre requête comporte au moins 7 ou 8 mots-clés, mettre en premier le mot le plus important de votre question : il aura alors un poids plus important que les autres dans les résultats, en faisant par exemple remonter dans les premières réponses les pages web où ce mot est dans le titre de la page.
    Ce point — non précisé dans l’aide officielle de Google et la plupart des guides de recherche en ligne — peut avoir un effet sur le tri des résultats par Google, en amenant dans les 10 ou 20 premières réponses une page web jusque là "perdue" au delà des trente premières réponses
  • choisir la langue des résultats. Peu intéressant : la langue des mots-clés utilisés conditionne celle des résultats
  • limiter les résultats à la France (sites français et non francophones) permet d’éviter à 95% les résultats provenant de sites québécois, belges et d’Afrique du Nord (Maroc, Tunisie, Algérie) et donc de se restreindre au droit français. Voilà une fonctionnalité intéressante, mais devenue moins utile depuis que Google a progressé dans la reconnaissance de la nationalité de l’internaute. Elle n’est d’ailleurs plus disponible que dans l’interface Recherche avancée (champ "région"). Elle peut encore servir à trouver des résultats de droit canadien ou belge quand on interroge Google depuis la France
  • choisir le format de fichier : Rich Text Format .rtf, Word .doc, Acrobat .pdf, Excel .xls, .PowerPoint .ppt, Access .mdb. Restreindre la recherche aux fichiers PDF permet de ne trouver que des documents sérieux et fiables (mais pas systématiquement pertinents, car ce n’est pas le but direct de cette fonctionnalité). En effet, très souvent, les documents officiels (textes juridiques, rapports, livres blancs) et les articles de revues scientifiques sont au format PDF tandis que les sites perso, ceux tournés vers le marketing et les forums utilisent uniquement le HTML. Hors de l’interface Recherche avancée (autrement dit à partir de la page d’accueil de Gogle), écrivez filetype:[type_de_fichier] à la fin de votre requête. Exemple : filetype:pdf
  • restreindre la recherche à un site : en fait à son nom de domaine (exemple : conseilconstitutionnel.fr est le nom de domaine du site web du Conseil constitutionnel). Ainsi utilisé, Google est presque toujours plus efficace que le moteur interne du site, sauf sur des documents extrêmement récents, peu connus ou "enfouis" dans le site. Ce mode de recherche est particulièrement utile sur les plus vastes sites juridiques : le site du Premier ministre, les deux sites parlementaires (Assemblée nationale, Sénat), Europa, EUR-Lex. Hors de l’interface Recherche avancée, écrivez site:[domaine] Le "domaine" ici peut comprendre un sous-domaine. Exemple : site:justice.gouv.fr (ici, le nom de domaine est gouv.fr)
  • exiger la présence d’un terme dans l’adresse web (URL) : dans Google (non avancé) écrivez : inurl:[chaîne_de_caractères] Précisions : derrière inurl: on ne doit mettre que la chaîne de caractère *complète* présente *entre deux barres obliques*. Exemple : si on veut chercher sur les décisions "merger" de la DG Concurrence et que leur adresse est ec.europa.eu/competition/mergers/cases/decisions/xxxxxxxx.pdf, on écrira donc : inurl:competition inurl:mergers. inurl:comp ou inurl:merg ne marcheraient pas
  • restreindre la recherche au "titre" (la balise HTML title, plus précisément) des pages web avec le champ intitle:[un_seul_mot] ou — plus efficace — allintitle:[tous_les_mots_qui_suivent]
  • si vous êtes connecté (non recommandé) à votre compte Google, régler le nombre de résultats par page à 30 voire 50 (au-delà, en général, très peu de résultats sont pertinents [55]). Ca permet de consulter plus facilement et plus rapidement les résultats pertinents. Mais cela implique d’être connecté à votre compte Google, ce qui personnalise (i.e. biaise) fortement les résultats en fonction de votre historique de recherche que Google a mémorisé
  • empêcher le plus possible Google d’interpréter votre requête (sauf par la langue du système d’exploitation de votre ordinateur) en choisissant dans Outils de recherche > Tous les résultats > Mot à mot [56], sans oublier de vous déconnecter de votre compte Google [57], d’indiquer à Google de ne pas non plus mémoriser votre historique de recherche lorsque vous n’êtes *pas*, cette fois-ci, connecté à votre compte Google ... et de vider vos cookies et l’historique de navigation de votre navigateur web avant de lancer une recherche, voire de lancer dans votre navigateur une session de navigation privée [58].

2.5. Rechercher sur une période

Restreignez si nécessaire les résultats à une période de temps. Pour utiliser à fond cette fonctionnalité, il faut passer par l’interface simple de Google (la recherche avancée n’offre pas la possibilité de spécifier l’intervalle de temps exact que l’on désire), cliquer sur Outils de recherche > Date indifférente > Période personnalisée [59] [60].

2.6. Ouvrir les résultats dans une nouvelle fenêtre ou un nouvel onglet

Ouvrez les résultats dans une nouvelle fenêtre ou un nouvel onglet, de manière à garder sous la main la liste des résultats. Pour cela : faites un clic droit sur le lien qui vous intéresse, puis un clic gauche sur "Ouvrir dans une nouvelle fenêtre/onglet".

2.7. Les moteurs spécialisés de Google

S’il n’y a pas de résultat intéressant dans l’onglet Web de Google, regardez :

2.8. Toujours rien ?

Voyez Pour aller plus loin à la fin de cet article.

3. Quatre exemples d’utilisation de la Recherche avancée de Google

1er exemple

Ici, nous allons chercher des articles en matière de cookies parus dans la revue Expertises, une revue de droit de l’informatique et d’Internet [61].

Cette revue a un site web (expertises.info) et les sommaires y sont présents en accès gratuit. Ce qui signifie que Google indexe les titres de ces articles.

Voici comment interroger rapidement les sommaires de la revue Expertises sur le site de la revue :
- 1. réfléchissez aux mots-clés à utiliser pour votre recherche : les juristes s’expriment en général en bon français. C’est ce que j’appelle "l’étape zéro" dans une méthode de recherche
Ici, un dictionnaire de traduction peut être utile — le Larousse anglais-français par exemple — mais il faudra le compléter par le site de la CNIL. Cookie en français se dit donc mouchard ou traceur
- 2. déconnectez-vous de votre compte Google (si vous en avez un). En effet, Google biaise ses résultats en fonction de vos recherches passées
- 3. allez sur la page d’accueil de Google en français
- 4. tapez les mots-clés en reliant les synonymes par OR (en majuscules) : cookies OR mouchards OR traceurs
- 5. limitez la recherche au site www.expertises.info (NB : Google ne prend en compte que des noms de domaine, pas des pages profondes) en tapant : site:expertises.info
- 6. votre recherche doit ressembler à ceci : cookies OR traceurs OR mouchards site:expertises.info
- 7. lancez la recherche
- 8. lisez les résultats. Regardez bien les caractères verts : ils vous indiquent le site d’où vient chaque résultat. Si c’est un site universitaire (univ-) ou officiel (.gouv.fr), c’est un gage de qualité
- 9. pour ceux qui vous intéressent : clic droit > Ouvrir le lien dans un nouvel onglet. Comme ça, vous ne perdez pas votre liste de résultats et votre recherche.

2e exemple

Vous devez réunir des documents sur le travail le dimanche.

Suivez les étapes 1 à 9 supra.

Cela devrait donner ceci : "travail le dimanche" OR "travail du dimanche" OR "travail dominical" OR "dérogation au repos dominical" OR 3132

Complétez ces résultats avec des documents en PDF : "travail le dimanche" OR "travail du dimanche" OR "travail dominical" OR "dérogation au repos dominical" OR 3132 filetype:pdf

NB : l’efficacité de la synonymie automatique de Google est telle que travail le dimanche tout court suffit presque. Surtout avec filetype:pdf.

3e exemple

C’est l’employeur qui préside le comité d’entreprise. Peut-il y venir accompagné de trois collaborateurs au lieu de deux comme le prévoit le Code du travail ?

Vérifier d’abord l’article pertinent du Code. C’est le L. 2325-1. Il faut vérifier les termes qu’il emploie, qui sont très certainement ceux qu’emploieront des commentaires bien juridiques. Le truc consiste à ne pas reprendre le mot "deux" car ici c’est "trois" que l’on cherche.
Taper dans Google : comité d’entreprise employeur trois collaborateurs. Et la première réponse est la bonne. Elle vient d’une page en libre accès du Lamy Droit du comité d’entreprise disponible sur le site WK-RH.

4e exemple

Chercher des documents de tout type sur la position dominante sur le site de la Commission européenne.

position dominante site:ec.europa.eu inurl:competition filetype:pdf

4. Pour aller plus loin

- 25 astuces pour la recherche sur Google / Thomas Coëffé, Le Blog du Modérateur 23 juillet 2013. A compléter par une excellente "cheat sheet" encore plus opérationnelle : 30 opérateurs Google pour affiner ses recherches / Thomas Coëffé, Le Blog du Modérateur 23 juillet 2013.

- More awesome search tips from Google expert Daniel Russell, with real-world examples / John Tedesco (reporter américain), 1er juillet 2013.

- Utilisez d’autres moteurs, principalement Bing (le concurrent de chez Microsoft [62]) et Exalead (pour les sites français et francophones) [63], voire StartPage (ex-Ixquick) [64] et les métamoteurs de recherche de personnes. Pour information, DuckDuckGo, dont on parle beaucoup, respecte certes votre vie privée, mais ses performances sont très limitées sur les pages web en langue française. Quant à Qwant, les résultats de ce moteur franco-allemand proviennent pour l’instant d’abord de Bing [65] et de Wikipedia. Toutefois, tout comme DuckDuckGo, il ne garde aucune trace de vos recherches, et ses résultats en langue française sont bien meilleurs que ceux de DuckDuckGo.

- Voyez nos articles Utiliser Google à 100%, surtout la bibliographie à la fin parce qu’il commence à dater (2006), et Recherche sur Internet : une méthode (un peu) simplifiée et quelques "philosophies", notamment la méthode des "autorités". Allez (entre autres) voir ailleurs sur le Web (annuaires thématiques de sites, Legifrance, Servicepublic.fr, bases de données payantes, Isidore, Cairn, Revues.org, Theses.fr etc.), réfléchissez une deuxième fois à vos mots-clés ou passez à un autre media (prenez votre téléphone ou votre logiciel de messagerie, par exemple, pour appeler un collègue ou demander conseil à un expert) ...

Emmanuel Barthe
documentaliste juridique, veilleur, webmestre, formateur à la recherche en ligne


La réalité virtuelle en 2D des applis de cartes n’est pas la réalité ...

Quand Google Maps et l’appli RATP sont dans les choux

... mais vise à le devenir

Jeudi 19 octobre 2017

Lire la suite »

Ce mardi 17 octobre 2017, il est 10h35 quand je consulte Google Maps sur mon smartphone pour aller de l’Etoile au 1 rue d’Astorg dans le 1er arrondissement à Paris.

GMaps et RATP peuvent vous mettre en retard si vous les prenez à la lettre

Voici les deux options principales que l’application Android de GMaps me propose :

  • prendre le RER A puis la ligne 9 : durée annoncée 17 mn
  • prendre le métro ligne 1 puis changement à Franklin Delano Roosevelt pour la 9 : durée annoncée 19 mn.

Bien que je sache qu’en règle générale le métro est plus rapide que le RER sur les courts trajets, les deux minutes d’avance du trajet par le RER m’attirent. Je choisis le trajet annoncé à 17 mn.

La durée réelle du trajet fut de ... 35 mn, soit le double du temps prévu par l’application. 95% d’erreur.

J’aurais dû méfier : en zoomant sur le trajet RER + ligne 9, je me rendrai compte que GMaps me fait sortir à Auber pour ensuite *revenir en arrière* par la 9. Ce qui est généralement absurde — et l’était dans le cas présent : il valait mieux carrément sortir à Auber et finir à pied (ça, GMaps ne le proposait pas). Cela aurait dû me mettre la puce à l’oreille.

Une cause possible de ce type d’erreur réside à mon avis dans le fait que dans le Métro, on capte très mal Internet. Google ne peut donc pas s’appuyer sur une énorme base de données de trajets réels (passés ou en cours), base qu’il a en revanche à sa disposition sur les routes [66].

Les estimations de temps de trajet de l’application RATP ne sont guère plus réalistes. Les retards fréquents des métros et bus, surtout quand on en prend trois ou quatre d’affilée pour arriver à son travail, font passer (cas vécu) une durée théorique de 1h15 du Pré-Saint-Gervais à la Faculté libre droit d’Issy-les-Moulineaux à une durée réelle de 1h30-1h45 en moyenne [67].

L’avantage de l’appli RATP, toutefois, est de signaler les perturbations de trafic. Ce que Maps ne fait pas ni ne prend en compte.

Au final, en terme d’estimation du temps de trajet, il est plus efficace d’avoir mémorisé des temps de trajet moyens réels et de consulter un plan papier ou PDF du réseau RATP. En revanche, cela peut prendre 2 à 3 minutes de plus que GMaps. Mais on regagne largement ces quelques minutes perdues par un temps de trajet effectif soit raccourci soit mieux estimé. De toute façon, même utiliser GMaps prend du temps : sortir son portable de la veille, allumer le GPS, attendre qu’il se connecte, taper l’adresse de destination, lancer la recherche consulter les résultats, faire un choix ... Tout cela représente généralement entre 1 et 3 mn.

Moralité : une marge de sécurité de 25 à 30% minimum, du bon sens et de l’expérience sont nécessaires si vous voulez correctement estimer votre temps de trajet en transports en commun sur l’Île-de-France avec ces deux applications pourtant connues de la plupart des internautes.

Autres limites

On peut par ailleurs signaler d’autres problèmes fréquents sur Google Maps :

  • sur Paris, la durée prévue par Google Maps pour effectuer un changement et prendre une correspondance est systématiquement de 2 mn. Tout habitant de l’Île-de-France sait que ce n’est pas réaliste. Les couloirs interminables des grandes stations de métro, pour ne pas parler de celles de RER, ne permettent pas de tenir ce temps. Et puis il y a le métro raté à quelques secondes prés, qui fait que là où théoriquement ça aurait dû prendre 3 mn, ça va en prendre 5. Il y a les personnes qui ne peuvent pas courir. Etc. Le temps réel mis dans le cas supra pour changer de la ligne A à la ligne 9 du Métro à la station Auber a été de 10 mn. Pas de 2 mn
  • avec le RER : quand GMaps vous pousse à prendre un RER au lieu du métro ou d’une autre solution. Il suffit de rater d’une minute le RER en question pour devoir attendre le suivant 10 mn, ce qui décale tout le reste du voyage
  • si le trajet (les petits ronds bleus) passe par une longue portion de rue, les petits ronds bleus recouvrent le nom de la rue sur l’application Maps. Résultat paradoxal : il est impossible de lire le nom de cette rue sur la carte
  • si on cherche des restaurants ou des hôtels ou tout autre type de lieu sur GMaps et qu’on se déplace sur la carte, les points rouges signalant ces lieux n’apparaissent souvent pas sur la nouvelle portion de carte. Alors, on recommence la recherche, on s’énerve ...
  • sur Maps comme chez Yelp, La fourchette.com, Resto-in, TripAdvisor et les autres annuaires d’entreprises bien connus, bien des évaluations et les notes qui vont avec laissent rêveur
  • hors des grandes agglomérations, de nombreux erreurs et problèmes existent sur Maps :
    • un chemin censé permettre de traverser une voie ferrée est en réalité barré par une grille et la porte dans la grille est fermée à clé
    • en forêt et en montagne, des chemins marqués sur la carte GMaps n’existent pas. D’autres, non marqués sur GMaps, existent. Les cartes IGN sont cent fois plus riches et plus précises ... Mais hélas chères dès qu’on commence à s’équiper sérieusement et peu ergonomiques en version numérique. Google aurait intérêt à prendre à nouveau une licence IGN et à la garder cette fois, pour les mises à jour
    • des territoires revendiqués par deux structures étatiques concurrentes mais dont les revendications sont toutes deux légitimes, sont attribuées à une seule de ces deux structures
    • les cartes interactives dans les zones de campagne, forêt et montagne exigent que le GPS soit allumé la plupart du temps. La consommation d’électricité est alors telle que la batterie de mon OnePlus 3T, pourtant connu pour son excellente autonomie, s’épuise en trois heures d’utilisation continue.

La carte n’est pas le territoire ... mais pourrait le devenir

Plus fondamentalement, particulièrement quand je me promène en touriste, je ne peux pas apprécier une ville si je passe la moitié de mon temps à la regarder à travers un plan interactif. Je tiens à continuer à y déambuler à pied ou à vélo. Pourtant, chacun constate le nombre croissant de gens qui marchent en ne regardant rien d’autre que leur écran et n’entendent rien de leur environnement sonore, les oreilles bouchées par leurs écouteurs. Tiens ! Votre serviteur aussi, quand il écrit ce billet, marche les yeux sur son écran ...

Google Maps, YouTube, Facebook, Snapchat et autres interfaces numériques sont en train de redéfinir non seulement l’information que nous recevons (Maps est de fait, entre autres, un moteur de recherche local) mais aussi ce que nous voyons et faisons de la réalité physique et humaine qui nous entoure. Et je ne parle même pas de la réalité virtuelle (VR).

Et ni les particuliers ni les responsables politiques n’ont grande prise là-dessus.

Seules peut-être les entreprises. Si leur budget communication, marketing et publicité le leur permet. Voyez par exemple la recherche d’un restaurant sans autre précision dans le 17e puis dans le 8e à Paris sur Google Maps : toujours en tête de la liste, quelque soit l’arrondissement et quelque soit sa note, Hippopotamus. Tiens donc !

Emmanuel Barthe
usager des transports parisiens et des services Google


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 31

Dernières brèves