Logiciels, Internet, moteurs de recherche

Dernier ajout : 18 octobre.

Derniers articles

Tutoriels, KB, sites d’astuces, forums et formateurs

Résoudre ses problèmes d’utilisation en bureautique

Word, Excel et les autres : tout pour faire marcher nos logiciels de tous les jours

Mardi 18 octobre 2005

Lire la suite »

Nous travaillons tous les jours avec la gamme de logiciels Office de Microsoft (principalement Outlook, Word , Excel et PowerPoint, certains d’entre nous Access). Certains travaillent, notamment chez eux, sous OpenOffice, voire StarOffice [1], les principales suites bureautiques open source [2].

Si nous avons fini par nous habituer à la difficulté de trouver dans les menus ce dont nous avons besoin, il reste que ce n’est pas si ergonomique que ça. Microsoft a d’ailleurs présenté dans la prochaine version de Windows (Windows Vista [3]) une refonte du système de menus et commandes. Reste à voir si ce sera réellement mieux.

C’est donc l’occasion de notre part d’un grand merci :

  • aux formatrices/teurs [4]. Peu de gens font de grands progrès dans l’utilisation de la bureautique sans formation et formateurs. Personnellement, je me débrouille pour apprendre pas mal de choses par moi-même, mais il me faut parfois m’acharner et prendre du temps
  • aux sites web de type tutoriels, notamment Comment ça marche ? (l’informatique) (CCM) et ses forums [5] et côté logiciels libres les tutoriels de Framasoft, et aussi, voire surtout aux sites web d’astuces informatiques, comme PC Astuces et aux forums de discussion [6] et à leurs membres, qui permettent, beaucoup plus facilement que l’Aide d’Office [7], de trouver une réponse pertinente
  • et, quand même, à la Knowledge Base de Microsoft (KB, base de connaissances), qui fait partie de la rubrique Support du site de Microsoft). C’est de loin la meilleure et la plus complète des ressources disponible gratuitement sur Office, mais son contenu est très technique et son interrogation reste difficile pour les non informaticiens et non spécialistes de la recherche. De plus, certaines fiches en sont pas traduites en français. Je recommande de la privilégier quand même, ou au moins de vérifier dans les résultats du moteur de recherche si une page de la KB y figure bien et le cas échéant de ne pas négliger de la consulter. Elle est hélas rarement citée sur les forums, car seuls les informaticiens et développeurs la connaissent bien
  • au fait, si vous les avez, n’oubliez pas les manuels papier de Microsoft (ils ne sont en général hélas plus livrés gratuitement avec les logiciels et sont payants). Même si la qualité des manuels a baissé et que de moins en moins de personnes les utilisent [8], le feuilletage d’un ouvrage papier permet souvent de balayer rapidement son contenu et ainsi de trouver l’information recherchée.

Les tutoriels en lignes et forums ne valent pas un formateur mais pour des problèmes précis et limités, ils peuvent dépanner efficacement. D’autant qu’ils sont relativement faciles à fouiller avec les moteurs de recherche.

Si facile que ça ? Oui, mais à deux conditions :

  • poser une question détaillée et avec les termes corrects, de préférence ceux employés dans les menus des logiciels
  • traduire vos termes de recherche en anglais si ça ne donne rien en français. C’est souvent nécessaire.

Prenons deux exemples :

  • la présence permanente du volet Office à droite de l’écran peut gêner. Elle fait perdre de l’espace à l’écran et les liens et informations que le volet Office propose ne servent pratiquement jamais à rien. Tapez dans un moteur : volet Office désactiver. Sur Google, la premier résultat est le bon et c’est une page de la rubrique Assistance du site web de Microsoft. Une page du forum de 01net donnant la réponse est également en 3e position. Cette page de forum apparaît même si vous tapez : affichage volet Office, une requête pourtant un peu moins pertinente, alors que là, les résultats du site de Microsoft, pourtant donnés par Google en première et deuxième place, ne sont pas pertinents. Conclusion : soit les forums sont plus pratiques, soit ils sont mieux indexés par les moteurs. Peut-être un peu des deux ...
  • pour se débarasser du Compagnon Office [9], tapez : compagnon office désactiver dans un moteur de recherche. L’important, ici comme dans l’exemple précédent, c’est le mot "désactiver" [10], car c’est le terme exact utilisé par Microsoft. Avec ce terme, le premier résultat de Google (3e chez Yahoo Search) est le bon, c’est une fiche de la rubrique Accessibilité du site de Microsoft pour l’Afrique du Nord.

Emmanuel Barthe
(qui a été responsable informatique en petite structure ...)


Les moteurs de blogs sont encore en enfance

Google Blog Search : la version bêta n’est pas au point ...

... du moins en matière de droit français

Mercredi 21 septembre 2005

Lire la suite »

Encore Google ... Cette fois (15 septembre 2005), c’est l’ouverture en version bêta de Google Blog Search, la version du moteur de recherche dédiée aux blogs, ces "carnets du Web" qui pour les professionnels du droit sont à mi-chemin entre la pensée du jour et la réflexion de fond.

Dans sa brève sur ce lancement, Stéphane Cottin liste utilement plusieurs billets et sources sur Google Blog Search. Parmi les plus utiles, citons la FAQ de BlogSearch. On peut ajouter à cette liste le billet détaillé de Marc Duval, documentaliste québécois indépendant [11].

A noter que Google Blog Search est un résultat direct de la technique RSS : son index/sa base de données est s’alimente aux flux RSS des blogs et il produit lui-même un fil RSS auquel on peut s’abonner.

Quelques tests menés les 20 et 21 septembre m’ont montré que cette variante du célèbre moteur est pour l’instant peu pertinente dans ses résultats. Exemples :

Par ailleurs, comme le note Christian Vanden Berghen sur le blog de sa société Totem Consult, « le choix des dates sur la page des fonctions avancées montre qu’il n’est pas possible de chercher dans les publications d’avant le 1er mars 2005 ».

Conclusion : pour l’instant, mieux vaut :

Google Blog Search est pour l’instant en version bêta, ça pourrait donc s’améliorer dans le futur. Mais de toute façon, le moteur "Web" de Google offre l’avantage de balayer *tous* les types de sites web, y compris les blogs. Certes, il ne les met peut-être pas assez en avant. A vous de voir [19].

Emmanuel Barthe
documentaliste juridique


MSN Search [moteur remplacé depuis par Live Search] : que vaut le nouveau moteur de recherche de Microsoft ?

Un concurrent sérieux pour Google pour les particuliers, nettement moins pour les professionnels — notamment les juristes

Dimanche 1er mai 2005

Lire la suite »

[Mise à jour au 26 juin 2007 : le "nouveau MSN Search" a été remplacé fin 2006 par Live Search, notamment disponible sur Live.com. En voici une présentation vidéo assez nunuche. Dans les grandes lignes, l’appréciation que je porte sur Live Search est assez proche de celle infra. La pertinence a certes augmenté, mais Microsoft reste derrière Yahoo et surtout Google.]

En deux mots : le nouveau moteur de recherche (search.msn.fr) [20] de Microsoft, appelé "MSN Search" [mise à jour au 26 juin 2007 : il est maintenant remplacé par Live Search] fait beaucoup mieux que le vieux moteur de MSN, et s’approche de Google sur des recherches juridiques thématiques très classiques. Mais sa base manque encore de profondeur et sur des questions pointues, il est inférieur, voire parfois très inférieur, à son rival n° 1 [21]. Il était depuis l’été 2004 en version de développement/test (version alpha puis bêta). La version de production vient de sortir le 1er février 2005.

Recherche juridique sur le Web : le nouveau MSN Search fait presqu’aussi — mais pas aussi bien — bien que Google sur des recherches thématiques classiques et larges ...

En terme de pertinence, passé les trois premiers résultats, les résultats de MSN Search sur la requête droit français sont, pour l’instant et à mon sens, un petit peu en retrait de ceux de Google. Ils me semblent en revanche aussi pertinents que ceux de Yahoo Search à la même question test. Notez au passage que même Google n’est pas très pertinent sur cette requête. L’intérêt de MSN Search ici, c’est que ses 30 premiers résultats peuvent parfois compléter ceux de Google.

Deux requêtes sur des sujets un peu plus étroits que la précédente requête test (droit social et droit des obligations) montrent que sur les recherches thématiques classiques, Google garde une légère, voire très légère avance en termes de pertinence. Pourquoi ? Parce que, si mon analyse des réponses de MSN Search est correcte, ce moteur s’appuie pour l’instant surtout sur une analyse du texte des pages, de son poids et de sa disposition (les mots demandés se trouvent quasi-systématiquement dans la balise title des pages en réponse chez MSN) alors que Google sait échapper à ce biais.

Une recherche assez classique d’un texte officiel et de commentaires sur celui-ci à partir des mots-clés de son titre (directive sur le droit d’auteur dans la société de l’information [22]) donne des résultats très différents. Si on compare les dix premiers résultats de chacun des deux moteurs, on constate que :

  • chacune des 10 premières réponses de Google contient un document en texte intégral, alors que la première réponse chez MSN Search est une annonce d’un colloque de l’AFDIT en septembre 2001 sur la directive, mais sans aucun compte-rendu ni texte d’une communication
  • les réponses de Google sont globalement beaucoup plus pertinentes que celles de MSN. Ainsi, les deux premiers résultats de Google mènent directement vers les deux pages essentielles du site Europa (SCAD Plus sur la directive et la page Documents du site thématique Droit d’auteur et droits voisins de la Commission)
  • si quatre des pages trouvées par MSN Search pourraient certes compléter les dix de Google, les résultats de MSN Search, sont dans l’ensemble moins pertinents : ils contiennent presqu’autant de pages sur la transposition en droit français que de pages sur la directive elle-même, et la deuxième réponse est hors sujet (il s’agit du compte-rendu de la Consultation publique sur l’adaptation du cadre législatif de la société de l’information voulue par Lionel Jospin fin 1999, donc avant l’adoption finale de la directive) ainsi que la quatrième (un paragraphe de cette page aborde le projet de LSI, c’est tout).

... mais MSN Search reste nettement inférieur à Google sur des questions plus pointues ou moins habituelles

Mais si on sort de ces recherches thématiques classiques, la supériorité de l’algorythme de tri de Google, fondé sur l’analyse des recommandations implicites que fournissent les liens hypertextes, fait alors une grosse différence. Quand on aborde des recherches portant sur des sujets plus étroits, rares ou quand on pose des questions très pointues, la différence est nette, voire très nette.

Si on prend par exemple une recherche toujours thématique, mais plus étroite cette fois (référé administratif), l’avance de Google est plus nette. MSN Search ne peut gère prétendre compléter, cette fois, les résultats de Google. Comparons les 10 premiers résultats de chaque moteur :

  • référé administratif sur MSN Search : MSN Search fournit en premier résultat une étude de droit comparé du Sénat de 1998 sur le référé administratif qui ne dit rien du droit français (donc peu intéressante pour les praticiens). Suivent essentiellement des pages de décisions de juridictions administratives statuant en référé
  • référé administratif sur Google : Google donne certes l’étude du Conseil d’Etat, mais en 2e position. Surtout, il fournit des pages web qui définissent le référé administratif et en décrivent les conditions et le fonctionnement. Et il place en première position la page de référence : la synthèse du ministère de la Justice, qui de plus contient les liens vers la loi, le projet de loi initial et ses versions successives. En fait, Google fournit l’essentiel des pages web qui comptent sur le sujet, notamment des pépites bien cachées, par exemple une étude de cinq pages sur le référé administratif rédigée par la délégation régionale Aquitaine-Limousin du CNRS.

Sans compter que dès les résultats 11 à 20, ça se dégrade chez MSN alors que la qualité et la pertinence se maintiennent chez Google.

Ainsi également, la requête droit blogs sur Google.fr trouve en première position la liste de discussion du même nom et ensuite des pages très pertinentes, en plein sur le sujet. En revanche, MSN Search, même en précisant qu’on cherche en français, se prend les pieds dans le tapis : non seulement il ne trouve pas la page d’accueil de la liste Droit blogs mais également il ne liste aucune page pertinente avant le 11e résultat. Même en précisant clairement la question à MSN (droit blogs liste yahoogroupes), il est incapable de trouver le site de cette liste.

Autre exemple : sur un prénom+nom+titre d’une personnalité peu connue comme un ancien ambassadeur britannique, je ne retrouve absolument pas sur MSN Search les quelques pages pertinentes que Google m’a renvoyées.

Le nouveau MSN Search : théoriquement plus puissant que Google et pourtant ...

Au vu des deux exemples supra, on se demande si MSN Search n’a pas oublié de "crawler" certaines zones du web. Ce qui semble pourtant en contradiction avec la boulimie du "spider" MSNbot (le logiciel d’indexation de Microsoft) ...

Sur la puissance (nombre de pages web indexées), les spécialistes du référencement notent pourtant que MSNbot indexe plus de pages que Google. En clair : l’index du nouveau moteur de Microsoft pourrait dépasser en taille celui de Google. D’ailleurs, quasiment le même jour que celui du lancement de la version beta de MSN Search et de l’annonce par Microsoft qu’il indexait 4 millions de pages, Google annonçait qu’il passait son index de 4 à 8 millions de pages. [23]

Des fonctionnalités certes originales, mais sans utilité pour les juristes ...

MSN Search offre comme Google et Yahoo Search une interface expert appelée Search Builder (en français : "affiner votre recherche"). Deux fonctionnalités la distingue de ses concurrents :

  • la possibilité de pondérer (avec des curseurs) les trois critères de tri des résultats : popularité, mise à jour récente, correspondance exacte avec la requête. Toutefois, d’après mes tests rapides et des commentaires de spécialistes américains du référencement sur WebmasterWorld, agir sur ces trois crans n’offre, pour l’instant en tout cas, aucune pertinence supplémentaire
  • sur la version américaine (search.msn.com), une fonction de recherche "near me" permet de restreindre la recherche au voisinage géographique de l’internaute, mieux donc que la recherche de pages d’un pays donné (également offerte par ailleurs sur MSN Search). Cette recherche "localisée" est un grand argument commercial, non seulement pour les internautes, mais aussi pour les publicitaires. Mais, comme la recherche d’images, elle n’est d’aucun intérêt pour des juristes français.

Car le but final de Microsoft, avec sa nouvelle technologie de recherche Web, est bien sûr de concurrencer Google sur son "business model" : les revenus publicitaires assurent en effet l’essentiel des revenus du célèbre moteur de recherche et ils sont substantiels.

... sauf une : le RSS

De mon point de vue, une seule des fonctionnalités réellement originales de MSN Search est utile aux juristes. Enfin, disons : aux juristes branchés informatique/Internet. Le RSS est un simple fichier, écrit dans un format XML, qui contient les références et l’adresse web des nouveaux articles publiés sur un site web dynamique (autrement dit : un site web dont le contenu est stocké dans/géré par une base de données). Si un site est dynamique, et tout particulièrement les sites d’éditeurs, les blogs et autres sites gérés par CMS, il peut produire automatiquement ou avec un petit peu de programmation ce qu’on appelle un "fil RSS", dénoté par le même petit rectangle orange "XML" ou "RSS" que l’on voit en bas des pages de ce site web.

Les liens dans les fils RSS renvoient vers l’article sur son site d’origine. Le fil RSS peut être inclus sur les pages d’autres sites (ce qu’on appelle "syndiquer") ou lu dans un logiciel nommé lecteur ou aggrégateur de fils RSS. Cela permet notamment de consulter plus vite plus d’informations.

Mais qu’a à voir MSN Search avec le RSS ? Eh bien, le nouveau MSN Search permet d’enregistrer les résultats de la première page (les 10 premiers résultats seulement, donc, sauf si vous modifiez vos paramètres pour augmenter ce nombre) de votre recherche dans un fil RSS et d’être ainsi prévenu des nouveaux résultats grâce à votre lecteur RSS. Ca peut évoluer très souvent et faire pas mal de "bruit", vous avez donc intérêt à ne le faire que sur des questions très étroites, ne donnant que quelques dizaines de réponses maximum.

Le nouveau MSN Search plus favorable que Google aux sites commerciaux ?

Autre chose, un point non négligeable : MSN Search semble faire un peu plus de place au contenu payant et aux sites de sociétés (voir les éditions Francis Lefebvre bien placées dans les réponses à la requête droit social, ce qui est somme toute logique) alors que Google favorise clairement les sites à contenu gratuit, car il est librement indexable et reproduisible (par le cache de Google) par Google.

Il y a là deux conceptions de la pertinence et celle qui oublie moins les sites payants, si elle n’est pas abusive, peut avoir ses mérites. Toutefois, il faudra a priori rester vigilant.

Le nouveau MSN Search a pour lui la puissance de Microsoft et des fonctionnalités très tournées vers les particuliers

L’avance de Google durera t-elle ? Même si cela n’est pas pertinent en matière de recherche juridique, MSN Search offre une preuve de la capacité de l’équipe de Microsoft à atteindre la pertinence de Google : la recherche d’images de MSN Search, ici testée sur "droit social", est plus pertinente que celle de Google, même si elle est créée moins de réponses ...

En termes de pertinence, le nouveau MSN Search s’est énormément amélioré depuis la version alpha (dite MSN Search TechPreview). Mais depuis décembre, la pertinence de ses résultats ne me semble plus progresser. La firme de Redmond a toutefois assez de trésorerie pour financer la recherche et les fermes de serveurs nécessaires [24] pour aller plus loin et c’est Bill Gates lui-même qui supervise ces efforts.

Vu les succès passés de Microsoft dans des stratégies similaires (par exemple, la disparition de Netscape du marché des navigateurs, supplanté par Internet Explorer), Google risque à terme d’être marginalisé par ce nouveau concurrent. C’est ce que pensent de nombreux spécialistes de la recherche sur Internet, notamment certains spécialistes américains du référencement de sites web sur le site de référence en la matière, WebmasterWorld [25]. D’autant que, comme le relève Christophe Asselin, spécialiste de la veille et de l’intelligence économique, le futur moteur de recherche de Microsoft permettra à terme de chercher à la fois sur le réseau interne de l’entreprise et sur Internet [26] et qu’il sera de toute évidence intégré au futur système d’exploitation de Microsoft, Longhorn
 [27].

Dans le même sens, l’accent mis par MSN Search sur le multimédia (fichiers audio (onglet music de MSN Search USA, vidéo, ...), l’accès gratuit à son enyclopédie Encarta (la version Premium, c’est-à-dire complète) à travers MSN Search et l’accès aux réponses directement dans les résultats du moteur [28] illustrent bien la voie que Microsoft veut emprunter. C’est ce que souligne Marc Duval, bibliothécaire canadien, spécialiste des moteurs de recherche et auteur d’un blog sur le sujet [29]. Or, comme le montre l’exemple de la recherche d’images citée plus haut, MSN Search semble déjà plus pertinent sur ce segment que Google, ce qui pourrait à terme lui apporter une part importante du trafic des particuliers.

MSN c/ Google : la partie n’est pas finie mais la première manche est pour Google ... et Yahoo

Toutefois, pour détrôner Google et plus encore, pour convaincre les spécialistes de la recherche d’informations sur le Web (notamment l’information juridique), il faudra d’abord que l’équipe de Microsoft maîtrise l’analyse des liens hypertextes pour arriver à la même pertinence que Google sur les recherches thématiques et plus encore sur les questions pointues et les sujets rares. Fin avril 2005, soit trois mois après le lancement officiel de MSN Search, le Journal du Net constatait que « malgré les efforts de Yahoo et MSN, Google conserve nettement sa suprématie dans le domaine de la recherche » [30].

Olivier Andrieu, webmestre du site Abondance et spécialiste français des moteurs de recherche voit, lui, les choses ainsi [31] : « Bien sûr, on peut être un peu déçu du fait que, à l’instar de Yahoo !, le moteur de recherche de MSN soit un clone de Google. Si vous utilisez Google et que vous en êtes globalement satisfait, pourquoi iriez-vous à la concurrence si elle propose la même chose ? En fait, dans un premier temps, MSN veut faire en sorte de ne pas perdre d’utilisateurs sur son portail. Le premier objectif est certainement aussi de "roder" la technologie avant d’espérer aller plus loin. Dans un deuxième temps, MSN s’efforcera de rallier les internautes qui utilisent plusieurs moteurs en tablant sur leur curiosité pour que ces derniers mettent MSN dans leur "short list" de moteur. La troisième étape conduira MSN à apporter des innovations pour détrôner Google (on parle déjà de clustering - rangement en dossiers thématiques) et de personnalisation. Cela ne va pas être aisé, d’une part parce que Google dispose d’un capital de sympathie énorme, et je pense aussi qu’il faudrait une rupture technologique importante pour les mettre en danger. »

[Mise à jour au 10 juillet 2005 : Cinq mois après le lancement de MSN Search, Marc Duval, le webmestre canadien du site DSI, est plus élogieux que nous mais son évaluation est sans relation avec le juridique (voir la fiche technique très détaillée rédigée par M. Duval sur MSN Search.). Marc Duval : « Aux États-Unis, MSN devient un complément indispensable à ses rivaux. Pour ses versions nationales, notamment la France, il est devenu un concurrent sérieux grâce à son encyclopédie Encarta et à son service de Réponses rapides. » A contrario, il confirme mon appréciation : les résultats de MSN sont surtout pertinents aux Etats-Unis — pas en France — et aucun des deux services cités n’est utile aux juristes français (Encarta est une encyclopédie grand public ;d’ailleurs, sur de nombreux sujets, l’encyclopédie libre et gratuite Wikipedia, très bien indexée par Google, fait jeu égal avec Encarta), surtout les professionnels du droit. Les résultats comparés aux questions ci-dessus, à nouveau testées ce jour, donnent toujours les mêmes conclusions : Google puis Yahoo sont bien meilleurs que MSN Search pour la recherche en droit sur Internet.

Mise à jour au 22 novembre 2005 : Un site web américain dédié au référencement [32] publie les résultats de tests (près de 9500 à cette date) réalisés en aveugle sur la pertinence de Yahoo Search, Google et MSN Search. La fiabilité de ces tests n’est toutefois pas parfaite, la pertinence ici étant « toute subjective et relative » comme le dit Olivier Ertszcheid [33], puisqu’aucun critère de pertinence n’est défini. Et toujours pareil : Google puis Yahoo sont considérés comme plus pertinents que MSN Search.]

Emmanuel Barthe
documentaliste juridique

Recherche juridique : les bases du test

Les tests comparatifs ont été réalisés à la mi-novembre, donc sur la version beta de MSN Search, puis revérifiés et élargis un peu début février 2005 — sur la version de production de MSN Search alors. Pour MSN tant que pour Google, les 20 premiers résultats n’ont guère changés entretemps.

Pour tester rapidement les moteurs, j’utilise toujours la même requête (droit français [34]). Je l’exécute en utilisant — presque — toujours l’option "pages : France" du moteur.

A titre d’étalon de référence, voici *à peu près* le classement idéal qui devrait s’afficher en réponse à une telle question : 1 Legifrance, 2 Juripro, 3 LexisNexis France (les JurisClasseurs et leurs revues en ligne, avec Juris-Data), 4 Lamyline Reflex, 5 Lextenso, 6 Lexinter, 7 droit.org. Ou bien, si on privilégie les sites gratuits : 1 Legifrance, 2 Lexinter, 3 droit.org, 4 Juriguide, 5 Droit francophone, 6 Bibliothèque Cujas Ressources Internet, 7 DMOZ Droit français (remarquable travail fait par Stéphane Cottin) 8 votre serviteur 9 La porte du droit.
Gardez en tête ces classements idéaux pour évaluer les résultats des trois meilleurs moteurs.


1 | ... | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30

Dernières brèves