Avantage Gallica en juridique

Gallica 2 contre Google Books : le match !

La base d’ouvrages numérisés de la BNF s’en tire très bien en juridique

Dimanche 1er février 2009, par Emmanuel Barthe // Logiciels, Internet, moteurs de recherche

Le match

Je reproduis ci-dessous, avec son accord, un message de Rémy Nerrière [1] publié sur la liste Juriconnexion, comparant les fonctionnalités de Gallica, la base de livres numérisés de la BNF, dans sa version 2, et Google Books :

« Expérience : un même ouvrage numérisé par la Bibliothèque nationale de France (BNF) et par Google :
Le droit civil français. vol. 7, suivant l’ordre du Code / Charles-Bonaventure-Marie Toullier, Warée oncle et Warée fils aîné (Paris), 1824-1828 :
http://gallica2.bnf.fr/ark:/12148/b...
http://www.google.com/books?id=Jk8U...

La comparaison est assez utile.

On peut constater :

  • que la notice de Gallica est plus complète (avec lien vers la bibliothèque possédant l’ouvrage) que celle de Google Books
  • Gallica a une plus belle ergonomie. [avis personnel : celle de Google est peut-être légèrement plus simple, plus facile à comprendre, mais de peu]
  • Gallica propose un téléchargement en mode PDF, TIFF ou mode texte (TXT). Google ne propose que le téléchargement en mode PDF
  • Gallica propose un mode "écoute" pour les non voyants. Pas Google
  • Gallica annonce le taux de reconnaissance de l’OCR pour chaque ouvrage (87% ici). C’est à peu près identique à celui de Google (qui a du mal à gérer les accents parfois)
  • [personnellement, j’ajouterai que la qualité de la copie image de Gallica est supérieure à celle de Google. C’est plus propre, il y a moins de ces petits points noirs, de ces traits gênant et parfois même empêchant la lecture]
  • Google propose un accès par chapitre avec une vue du sommaire (en cliquant sur "A propos de ce livre"), ce qui peut être utile pour consulter un ouvrage. Pas Gallica [il faut se déplacer au début ou à la fin de l’ouvrage et chercher "à la main" la table des matières puis y chercher les numéros de pages des chapitres]
  • Gallica a indexé les ouvrages par matière ce que n’a semble t’il pas fait Google (classement par tags ou mot clé uniquemement - pas de rubrique "droit"). Pas de tags pour Gallica (sauf ceux que l’on peut rajouter soi même)
  • la recherche avancée est plus complète sur Gallica (notamment interrogation et possibilité d’affiner sa recherche par thématique, notamment en droit)
  • [oui, mais il faut ajouter que Google Books a une base d’ouvrages scannés plus large (pas forcément en juridique) et que son moteur est plus rapide et son fameux classement des résultats souvent plus pertinent (sauf si on utilise la recherche avancée et que l’on travaille par expression, mais cela ralentit alors considérablement le moteur de Gallica voire pose un problème de charge au serveur). En revanche, Gallica propose de télécharger au format PDF l’ouvrage : une fois cela fait, il est plus facile d’y rechercher la chaîne de caractères désirée]
  • [ajouter aussi que Gallica n’amène pas à la page concernée et n’offre pas pour autant de recherche *dans* l’ouvrage]
  • Google propose l’accès aux différentes éditions de l’ouvrage (toujours en cliquant sur "A propos de ce livre")assez utile — Gallica va-t-elle numériser les différentes éditions d’un même ouvrage ?
  • Gallica propose des fils RSS, pas Google.

La concurrence crée donc de l’émulation. Il faudrait ensuite essayer de comparer le nombre d’ouvrages accessible en droit par les deux institutions, Google dépendant d’abord (mais pas seulement) des fonds présents dans les bibliothèques universitaires (le plus souvent étrangères). »

En résumé :

Point de comparaisonGallica 2Google Books
Notice de l’ouvrage ++ - [2]
Ergonomie ++ +++
Formats de téléchargement +++ +
Mode audio oui non
Taux de reconnaissance OCR + +
Qualité copie image ++ +
Accès direct aux chapitres non oui
Classement matière oui non
Tags non oui
Richesse des fonctionnalités de recherche ++ ++
Puissance du moteur de recherche + +++
Accès aux autres éditions de l’ouvrage non oui
Fils RSS oui non
Total 3 oui/6, 13 + 3 oui/6, 10+

Le contenu juridique de Gallica

Rémy précise qu’« on trouve en fait [sur Gallica] une collection impressionnante d’ouvrages de droit [français] de la fin XIXe début XXe siècle qui ont été scannés, dont des collections de revues Dalloz.

Mais on trouve également [sur Gallica] des livres de droit récents consultables sur les sites partenaires (pôles associés). Ils sont indexés et apparaissent dans les listes de résultats. Ils restent consultables sur le site du partenaire. Les livres ne sont alors consultables qu’en mode image et sur une partie seulement de l’ouvrage (comme avec Numilog — par exemple http://readerv3.numilog.com/numilog... »

A Jean, ensuite, de nous donner les liens vers les collections anciennes de Dalloz dans Gallica 2 :

Conclusion : Gallica meilleure que Google sur les livres français, reste les limites de son moteur

Il est intéressant de comparer cette analyse de Gallica 2 contre Google Book Search (GBS) avec celle que je faisais de la version 1 en 2005, toujours comparée à GBS [3]. L’amélioration de Gallica est manifeste. Au niveau des fonctionnalités, Google a peu progressé. Sur le contenu français, on peut dire que Gallica est devenue très "concurrentielle".

Notes de bas de page

[1] Merci aussi à Hughes-Jehan Vibert pour sa contribution à la discussion.

[2] Là, je met carrément un "-" à Google Books car sa notice est d’une indigence ...

[3] Lire notre article Réaliser une veille législative gratuite.

Répondre à cet article

3 Messages de forum

  • Cette étude n’est pas très sérieuse d’autant que la supériorité de Google Livres saute malheureusement aux yeux. Snif :-( Prenez le temps de comparer avant de pousser ce cocorico qui paraît franchement un peu trop optimiste.

    Répondre à ce message

    • Gallica 2 contre Google Books : le match ! 8 avril 2009 19:13, par Emmanuel Barthe

      Bonjour,

      1. L’évaluation est largement celle de Rémy (il est cité, d’ailleurs). Je vous conseille de prendre son mail sur la liste Juriconnexion et lui faire part de votre avis. D’autant qu’il apprécie aussi Google Books (GB)
      2. Ce billet se restreint à la valeur de GB en *juridique*.
      3. Cette étude *est* une comparaison. Peut-être étiez vous pressé quand vous avez lu ce billet.
      4. Quels sont vos arguments ? Que ça "saute aux yeux" —c’est tout ?

      Répondre à ce message

    • Gallica 2 contre Google Books : le match ! 8 avril 2009 19:25, par Emmanuel Barthe

      Et ...

      5. Vous noterez que j’apprécie l’ergonomie de GB. 6. Bien évidemment, la puissance (nombre d’ouvrages scannés, rapidité) du moteur de recherche de GB est supérieure à celle de Gallica 2. Je vous l’accorde sans discussion.

      Je corrige donc le billet et le tableau d’évaluation en ce sens.

      Mais encore une fois, les besoins des juristes (exemple : netteté des impressions) et des documentalistes et autres spécialistes de l’information (exemple : notice plus riche pour Gallica 2) ne sont pas les mêmes que ceux du grand public.

      Répondre à ce message