Avantage Gallica en juridique
Gallica 2 contre Google Books : le match !
La base d’ouvrages numérisés de la BNF s’en tire très bien en juridique
Dimanche 1er février 2009, par // Logiciels, Internet, moteurs de recherche

Le match
Je reproduis ci-dessous, avec son accord, un message de Rémy Nerrière [1] publié sur la liste Juriconnexion, comparant les fonctionnalités de Gallica, la base de livres numérisés de la BNF, dans sa version 2, et Google Books :
« Expérience : un même ouvrage numérisé par la Bibliothèque nationale de France (BNF) et par Google :
Le droit civil français. vol. 7, suivant l’ordre du Code / Charles-Bonaventure-Marie Toullier, Warée oncle et Warée fils aîné (Paris), 1824-1828 :
http://gallica2.bnf.fr/ark:/12148/b...
http://www.google.com/books?id=Jk8U...
La comparaison est assez utile.
On peut constater :
- que la notice de Gallica est plus complète (avec lien vers la bibliothèque possédant l’ouvrage) que celle de Google Books
- Gallica a une plus belle ergonomie. [avis personnel : celle de Google est peut-être légèrement plus simple, plus facile à comprendre, mais de peu]
- Gallica propose un téléchargement en mode PDF, TIFF ou mode texte (TXT). Google ne propose que le téléchargement en mode PDF
- Gallica propose un mode "écoute" pour les non voyants. Pas Google
- Gallica annonce le taux de reconnaissance de l’OCR pour chaque ouvrage (87% ici). C’est à peu près identique à celui de Google (qui a du mal à gérer les accents parfois)
- [personnellement, j’ajouterai que la qualité de la copie image de Gallica est supérieure à celle de Google. C’est plus propre, il y a moins de ces petits points noirs, de ces traits gênant et parfois même empêchant la lecture]
- Google propose un accès par chapitre avec une vue du sommaire (en cliquant sur "A propos de ce livre"), ce qui peut être utile pour consulter un ouvrage. Pas Gallica [il faut se déplacer au début ou à la fin de l’ouvrage et chercher "à la main" la table des matières puis y chercher les numéros de pages des chapitres]
- Gallica a indexé les ouvrages par matière ce que n’a semble t’il pas fait Google (classement par tags ou mot clé uniquemement - pas de rubrique "droit"). Pas de tags pour Gallica (sauf ceux que l’on peut rajouter soi même)
- la recherche avancée est plus complète sur Gallica (notamment interrogation et possibilité d’affiner sa recherche par thématique, notamment en droit)
- [oui, mais il faut ajouter que Google Books a une base d’ouvrages scannés plus large (pas forcément en juridique) et que son moteur est plus rapide et son fameux classement des résultats souvent plus pertinent (sauf si on utilise la recherche avancée et que l’on travaille par expression, mais cela ralentit alors considérablement le moteur de Gallica voire pose un problème de charge au serveur). En revanche, Gallica propose de télécharger au format PDF l’ouvrage : une fois cela fait, il est plus facile d’y rechercher la chaîne de caractères désirée]
- [ajouter aussi que Gallica n’amène pas à la page concernée et n’offre pas pour autant de recherche *dans* l’ouvrage]
- Google propose l’accès aux différentes éditions de l’ouvrage (toujours en cliquant sur "A propos de ce livre")assez utile — Gallica va-t-elle numériser les différentes éditions d’un même ouvrage ?
- Gallica propose des fils RSS, pas Google.
La concurrence crée donc de l’émulation. Il faudrait ensuite essayer de comparer le nombre d’ouvrages accessible en droit par les deux institutions, Google dépendant d’abord (mais pas seulement) des fonds présents dans les bibliothèques universitaires (le plus souvent étrangères). »
En résumé :
| Point de comparaison | Gallica 2 | Google Books |
|---|---|---|
| Notice de l’ouvrage | ++ | - [2] |
| Ergonomie | ++ | +++ |
| Formats de téléchargement | +++ | + |
| Mode audio | oui | non |
| Taux de reconnaissance OCR | + | + |
| Qualité copie image | ++ | + |
| Accès direct aux chapitres | non | oui |
| Classement matière | oui | non |
| Tags | non | oui |
| Richesse des fonctionnalités de recherche | ++ | ++ |
| Puissance du moteur de recherche | + | +++ |
| Accès aux autres éditions de l’ouvrage | non | oui |
| Fils RSS | oui | non |
| Total | 3 oui/6, 13 + | 3 oui/6, 10+ |
Le contenu juridique de Gallica
Rémy précise qu’« on trouve en fait [sur Gallica] une collection impressionnante d’ouvrages de droit [français] de la fin XIXe début XXe siècle qui ont été scannés, dont des collections de revues Dalloz.
Mais on trouve également [sur Gallica] des livres de droit récents consultables sur les sites partenaires (pôles associés). Ils sont indexés et apparaissent dans les listes de résultats. Ils restent consultables sur le site du partenaire. Les livres ne sont alors consultables qu’en mode image et sur une partie seulement de l’ouvrage (comme avec Numilog — par exemple http://readerv3.numilog.com/numilog... »
A Jean, ensuite, de nous donner les liens vers les collections anciennes de Dalloz dans Gallica 2 :
- Dalloz Jurisprudence générale
- Recueil Dalloz Sirey de doctrine de jurisprudence et de législation - 1865
- Dalloz. Recueil hebdomadaire de jurisprudence en matière civile, commerciale, administrative et de droit public
- Jurisprudence générale du royaume en matière civile, commerciale et criminelle : ou Journal des audiences de la Cour de cassation et des Cours royales. T. 2 / par M. Dalloz,... et par M. Tournemine,...
- Journal des audiences de la Cour de cassation, ou Recueil des arrêts de cette cour en matière civile et mixte - 1809-1824.
Conclusion : Gallica meilleure que Google sur les livres français, reste les limites de son moteur
Il est intéressant de comparer cette analyse de Gallica 2 contre Google Book Search (GBS) avec celle que je faisais de la version 1 en 2005, toujours comparée à GBS [3]. L’amélioration de Gallica est manifeste. Au niveau des fonctionnalités, Google a peu progressé. Sur le contenu français, on peut dire que Gallica est devenue très "concurrentielle".

Notes de bas de page
[1] Merci aussi à Hughes-Jehan Vibert pour sa contribution à la discussion.
[2] Là, je met carrément un "-" à Google Books car sa notice est d’une indigence ...
[3] Lire notre article Réaliser une veille législative gratuite.