Logiciels, Internet, moteurs de recherche

Dernier ajout : 10 juillet.

Derniers articles

"Content is king ..." (Le contenu est roi ...)

Les limites de Google Print/Google Book Search en matière d’ouvrages de droit français

... Mais Google Print ne laisse pas voir le contenu des ouvrages français

Vendredi 2 décembre 2005

Lire la suite »

[mise à jour au 3 mars 2009 : la version 2 de Gallica semble cette fois d’une facilité de maniement proche de celle de Google et beaucoup plus riche en fonctionnalités. Et d’un contenu encore meilleur que sa version 1 décrite ici, notamment en juridique. Lisez l’analyse de Rémy sur ce blog : Gallica contre Google Books : le match !. ]

Google a lancé depuis la rentrée de septembre 2004 son site permettant d’accéder à des fonds documentaires numérisés, Google Print, rebaptisé [1] en novembre 2005 Google Book Search [2] (en français : Google Recherche de livres). Un nom qui désigne plus clairement la fonction de ce service : indexer le contenu de livres et faciliter leur achat sur une librairie en ligne. Cette indexation est accompagnée d’une reproduction (scan image) de la totalité (ouvrage tombé dans le domaine public), quelques pages (ouvrage envoyé par un éditeur, qui collabore volontairement au programme Google Book Search [3]) ou seulement de très courts extraits (ouvrage protégé par le droit d’auteur, scanné dans le cadre du programme Google Library et accessible par le moteur Google Book Search). Pour mieux comprendre les différentes étendues des reproductions, regardez ces captures d’écran.

Google Print/Book Search plus performant que la base Gallica de la BNF

Comme le faisait remarquer sur la liste Juriconnexion
François-Xavier Mérigard, responsable Documentation & Réseaux au cabinet Alerion, une requête droit français trouve un grand nombre de résultats.

Il note :

« Ce qui est étonnant, et qui montre à première vue la supériorité de Google print sur la base Gallica est que l’on tombe sur des résultats directement dans le texte des ouvrages. Sur la base Gallica, les ouvrages numérisés sont indexés uniquement par leur titre. »

Google a pris de l’avance quant aux fonctionnalités. Notamment, Google Print offre un accès en plein texte plus précis, plus rapide et plus ergonomique que Gallica, la base d’ouvrages numérisés de la Bibliothèque nationale de France (BNF). Certes.

Mais Gallica est le résultat du travail d’une bibliothèque de conservation, pas celui d’un centre de documentation branché sur les besoins des utilisateurs professionnels ... Et les fonctionnalités ne sont pas tout. Il y a le contenu, aussi.

Très peu de contenu juridique français (droit français) sur Google Print/Book Search

Sur ce qui est à mes yeux l’essentiel — le contenu —, très peu de choses utiles, pour nous juristes et documentalistes, sont sur Google Book Search. Sur la requête citée "droit français", certes, de nombreux ouvrages sont récents, mais ce ne sont pratiquement que des ouvrages de droit belge ou éventuellement en anglais et qui plus est très universitaires voire théoriques. Gallica ne fait pas mieux cependant, puisque tous ses ouvrages sont très anciens.

De plus, les ouvrages fournis par des éditeurs ne laissent voir en libre accès que quelques pages. Si on veut en voir plus, il faut un compte Google [4] et s’identifier.

Vu la position de Jean-Noël Jeanneney, directeur de la BNF [5] et le refus des éditeurs français par la voix du Syndicat national de l’édition (SNE) [6], et en dépit de l’offensive de séduction menée par Google en direction des acteurs français [7], je ne suis pas très optimiste quant à l’arrivée d’un contenu juridique intéressant — que son texte intégral soit d’accès réservé ou pas — sur Google Print.

A moins que les bibliothèques universitaires françaises ne fassent bande à part ...

Question contenu : des initiatives locales et nationales, les projets concurrents de Bibliothèque nationale européenne, et d’Amazon, Yahoo et Microsoft, et des travaux universitaires

Du contenu d’ouvrages français aisément accessibles en ligne, il y en a ailleurs.

Il y a bien sûr la riposte de la BNF à Google Library (le projet de Bibliothèque numérique européenne, en cours de préparation) [8] et celles de Yahoo (Open Content Alliance) (en projet) et Microsoft [9] (MSN Book Search, annoncé pour 2006).

Il y a déjà et surtout des initiatives bien avancées, elles, et plus pragmatiques, citées par l’Atelier [10] — sans contenu juridique certes :

Enfin, question contenu juridique, parlons aussi :

A ce sujet, il serait utile, d’ailleurs, que les Universités publient sur Internet sans trop de limite les thèses et mémoires (leurs auteurs ne demandent que ça et les juristes sont assez grands pour évaluer la qualité du travail) : cf mon article sur la diffusion des thèses.

Emmanuel Barthe
documentaliste juridique


Auteurs + moteurs = à chaque site web sa chance

L’interaction entre moteurs de recherche et auteurs sur Internet aide à faire sortir du rang les sites mal référencés mais intéressants pour une communauté

Lundi 21 novembre 2005

Lire la suite »

Olivier Ertzscheid, un des meilleurs analystes de la scène de la recherche documentaire numérique (et notamment du futur des moteurs de recherche [14]), se demande sur son blog affordance.info si « les moteurs de recherche [favorisent] les sites déjà bien "référencés" (idée habituellement répandue) » ou si « contre toute attente les moteurs de recherche ont un effet égalitaire, favorisant les sites les moins "vus" » [15].

Mon point de vue de praticien de la recherche documentaire et de la veille : les moteurs à la fois confirment les sites bien référencés dans leur statut et permettent à d’autres d’être découverts et de sortir du rang.

Dans mes recherches, les moteurs favorisent plus souvent les sites déjà populaires, mais ils me sortent également de temps à autre des sites très peu connus *et* de qualité et ce dans les trente premiers résultats. Il suffit dès lors que je parle de certains d’entre eux sur mon annuaire ou sur mon blog et du fait que mon site est bien référencé, ils grimpent dans le "ranking" [16].

Voilà comment j’interprète la chose : un membre d’une communauté virtuelle, même portant sur un sujet peu vaste ou très pointu, repère un site intéressant pour cette communauté et aussitôt, il va le sortir des résultats, ce site inintéressant pour les autres communautés, pour en parler, le référencer, le citer ou le bloguer. Ce site web sort alors de l’anonymat.

Tout est dans l’interaction entre les moteurs et les auteurs présents sur le Web, qui créent les liens que les moteurs indexeront ensuite. Mais les moteurs ne sont plus les seuls moyens de trouver de l’information. Certains spécialistes de l’information ne cherchent déjà plus, ils trouvent, toujours grâce aux auteurs de blogs (RSS, blogrolls, techniques de visualisation) mais aussi parce qu’ils sont eux-mêmes auteurs (commentaires laissés sur leur blog, referers) [17]

Pour trouver, il ne suffit plus de chercher, il faut aussi participer.

Emmanuel Barthe


Tutoriels, KB, sites d’astuces, forums et formateurs

Résoudre ses problèmes d’utilisation en bureautique

Word, Excel et les autres : tout pour faire marcher nos logiciels de tous les jours

Mardi 18 octobre 2005

Lire la suite »

Nous travaillons tous les jours avec la gamme de logiciels Office de Microsoft (principalement Outlook, Word , Excel et PowerPoint, certains d’entre nous Access). Certains travaillent, notamment chez eux, sous OpenOffice, voire StarOffice [18], les principales suites bureautiques open source [19].

Si nous avons fini par nous habituer à la difficulté de trouver dans les menus ce dont nous avons besoin, il reste que ce n’est pas si ergonomique que ça. Microsoft a d’ailleurs présenté dans la prochaine version de Windows (Windows Vista [20]) une refonte du système de menus et commandes. Reste à voir si ce sera réellement mieux.

C’est donc l’occasion de notre part d’un grand merci :

  • aux formatrices/teurs [21]. Peu de gens font de grands progrès dans l’utilisation de la bureautique sans formation et formateurs. Personnellement, je me débrouille pour apprendre pas mal de choses par moi-même, mais il me faut parfois m’acharner et prendre du temps
  • aux sites web de type tutoriels, notamment Comment ça marche ? (l’informatique) (CCM) et ses forums [22] et côté logiciels libres les tutoriels de Framasoft, et aussi, voire surtout aux sites web d’astuces informatiques, comme PC Astuces et aux forums de discussion [23] et à leurs membres, qui permettent, beaucoup plus facilement que l’Aide d’Office [24], de trouver une réponse pertinente
  • et, quand même, à la Knowledge Base de Microsoft (KB, base de connaissances), qui fait partie de la rubrique Support du site de Microsoft). C’est de loin la meilleure et la plus complète des ressources disponible gratuitement sur Office, mais son contenu est très technique et son interrogation reste difficile pour les non informaticiens et non spécialistes de la recherche. De plus, certaines fiches en sont pas traduites en français. Je recommande de la privilégier quand même, ou au moins de vérifier dans les résultats du moteur de recherche si une page de la KB y figure bien et le cas échéant de ne pas négliger de la consulter. Elle est hélas rarement citée sur les forums, car seuls les informaticiens et développeurs la connaissent bien
  • au fait, si vous les avez, n’oubliez pas les manuels papier de Microsoft (ils ne sont en général hélas plus livrés gratuitement avec les logiciels et sont payants). Même si la qualité des manuels a baissé et que de moins en moins de personnes les utilisent [25], le feuilletage d’un ouvrage papier permet souvent de balayer rapidement son contenu et ainsi de trouver l’information recherchée.

Les tutoriels en lignes et forums ne valent pas un formateur mais pour des problèmes précis et limités, ils peuvent dépanner efficacement. D’autant qu’ils sont relativement faciles à fouiller avec les moteurs de recherche.

Si facile que ça ? Oui, mais à deux conditions :

  • poser une question détaillée et avec les termes corrects, de préférence ceux employés dans les menus des logiciels
  • traduire vos termes de recherche en anglais si ça ne donne rien en français. C’est souvent nécessaire.

Prenons deux exemples :

  • la présence permanente du volet Office à droite de l’écran peut gêner. Elle fait perdre de l’espace à l’écran et les liens et informations que le volet Office propose ne servent pratiquement jamais à rien. Tapez dans un moteur : volet Office désactiver. Sur Google, la premier résultat est le bon et c’est une page de la rubrique Assistance du site web de Microsoft. Une page du forum de 01net donnant la réponse est également en 3e position. Cette page de forum apparaît même si vous tapez : affichage volet Office, une requête pourtant un peu moins pertinente, alors que là, les résultats du site de Microsoft, pourtant donnés par Google en première et deuxième place, ne sont pas pertinents. Conclusion : soit les forums sont plus pratiques, soit ils sont mieux indexés par les moteurs. Peut-être un peu des deux ...
  • pour se débarasser du Compagnon Office [26], tapez : compagnon office désactiver dans un moteur de recherche. L’important, ici comme dans l’exemple précédent, c’est le mot "désactiver" [27], car c’est le terme exact utilisé par Microsoft. Avec ce terme, le premier résultat de Google (3e chez Yahoo Search) est le bon, c’est une fiche de la rubrique Accessibilité du site de Microsoft pour l’Afrique du Nord.

Emmanuel Barthe
(qui a été responsable informatique en petite structure ...)


1 | ... | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33

Dernières brèves