MSN Search [moteur remplacé depuis par Live Search] : que vaut le nouveau moteur de recherche de Microsoft ?

Un concurrent sérieux pour Google pour les particuliers, nettement moins pour les professionnels — notamment les juristes

Dimanche 1er mai 2005, par Emmanuel Barthe // Logiciels, Internet, moteurs de recherche

[Mise à jour au 26 juin 2007 : le "nouveau MSN Search" a été remplacé fin 2006 par Live Search, notamment disponible sur Live.com. En voici une présentation vidéo assez nunuche. Dans les grandes lignes, l’appréciation que je porte sur Live Search est assez proche de celle infra. La pertinence a certes augmenté, mais Microsoft reste derrière Yahoo et surtout Google.]

En deux mots : le nouveau moteur de recherche (search.msn.fr) [1] de Microsoft, appelé "MSN Search" [mise à jour au 26 juin 2007 : il est maintenant remplacé par Live Search] fait beaucoup mieux que le vieux moteur de MSN, et s’approche de Google sur des recherches juridiques thématiques très classiques. Mais sa base manque encore de profondeur et sur des questions pointues, il est inférieur, voire parfois très inférieur, à son rival n° 1 [2]. Il était depuis l’été 2004 en version de développement/test (version alpha puis bêta). La version de production vient de sortir le 1er février 2005.

Recherche juridique sur le Web : le nouveau MSN Search fait presqu’aussi — mais pas aussi bien — bien que Google sur des recherches thématiques classiques et larges ...

En terme de pertinence, passé les trois premiers résultats, les résultats de MSN Search sur la requête droit français sont, pour l’instant et à mon sens, un petit peu en retrait de ceux de Google. Ils me semblent en revanche aussi pertinents que ceux de Yahoo Search à la même question test. Notez au passage que même Google n’est pas très pertinent sur cette requête. L’intérêt de MSN Search ici, c’est que ses 30 premiers résultats peuvent parfois compléter ceux de Google.

Deux requêtes sur des sujets un peu plus étroits que la précédente requête test (droit social et droit des obligations) montrent que sur les recherches thématiques classiques, Google garde une légère, voire très légère avance en termes de pertinence. Pourquoi ? Parce que, si mon analyse des réponses de MSN Search est correcte, ce moteur s’appuie pour l’instant surtout sur une analyse du texte des pages, de son poids et de sa disposition (les mots demandés se trouvent quasi-systématiquement dans la balise title des pages en réponse chez MSN) alors que Google sait échapper à ce biais.

Une recherche assez classique d’un texte officiel et de commentaires sur celui-ci à partir des mots-clés de son titre (directive sur le droit d’auteur dans la société de l’information [3]) donne des résultats très différents. Si on compare les dix premiers résultats de chacun des deux moteurs, on constate que :

  • chacune des 10 premières réponses de Google contient un document en texte intégral, alors que la première réponse chez MSN Search est une annonce d’un colloque de l’AFDIT en septembre 2001 sur la directive, mais sans aucun compte-rendu ni texte d’une communication
  • les réponses de Google sont globalement beaucoup plus pertinentes que celles de MSN. Ainsi, les deux premiers résultats de Google mènent directement vers les deux pages essentielles du site Europa (SCAD Plus sur la directive et la page Documents du site thématique Droit d’auteur et droits voisins de la Commission)
  • si quatre des pages trouvées par MSN Search pourraient certes compléter les dix de Google, les résultats de MSN Search, sont dans l’ensemble moins pertinents : ils contiennent presqu’autant de pages sur la transposition en droit français que de pages sur la directive elle-même, et la deuxième réponse est hors sujet (il s’agit du compte-rendu de la Consultation publique sur l’adaptation du cadre législatif de la société de l’information voulue par Lionel Jospin fin 1999, donc avant l’adoption finale de la directive) ainsi que la quatrième (un paragraphe de cette page aborde le projet de LSI, c’est tout).

... mais MSN Search reste nettement inférieur à Google sur des questions plus pointues ou moins habituelles

Mais si on sort de ces recherches thématiques classiques, la supériorité de l’algorythme de tri de Google, fondé sur l’analyse des recommandations implicites que fournissent les liens hypertextes, fait alors une grosse différence. Quand on aborde des recherches portant sur des sujets plus étroits, rares ou quand on pose des questions très pointues, la différence est nette, voire très nette.

Si on prend par exemple une recherche toujours thématique, mais plus étroite cette fois (référé administratif), l’avance de Google est plus nette. MSN Search ne peut gère prétendre compléter, cette fois, les résultats de Google. Comparons les 10 premiers résultats de chaque moteur :

  • référé administratif sur MSN Search : MSN Search fournit en premier résultat une étude de droit comparé du Sénat de 1998 sur le référé administratif qui ne dit rien du droit français (donc peu intéressante pour les praticiens). Suivent essentiellement des pages de décisions de juridictions administratives statuant en référé
  • référé administratif sur Google : Google donne certes l’étude du Conseil d’Etat, mais en 2e position. Surtout, il fournit des pages web qui définissent le référé administratif et en décrivent les conditions et le fonctionnement. Et il place en première position la page de référence : la synthèse du ministère de la Justice, qui de plus contient les liens vers la loi, le projet de loi initial et ses versions successives. En fait, Google fournit l’essentiel des pages web qui comptent sur le sujet, notamment des pépites bien cachées, par exemple une étude de cinq pages sur le référé administratif rédigée par la délégation régionale Aquitaine-Limousin du CNRS.

Sans compter que dès les résultats 11 à 20, ça se dégrade chez MSN alors que la qualité et la pertinence se maintiennent chez Google.

Ainsi également, la requête droit blogs sur Google.fr trouve en première position la liste de discussion du même nom et ensuite des pages très pertinentes, en plein sur le sujet. En revanche, MSN Search, même en précisant qu’on cherche en français, se prend les pieds dans le tapis : non seulement il ne trouve pas la page d’accueil de la liste Droit blogs mais également il ne liste aucune page pertinente avant le 11e résultat. Même en précisant clairement la question à MSN (droit blogs liste yahoogroupes), il est incapable de trouver le site de cette liste.

Autre exemple : sur un prénom+nom+titre d’une personnalité peu connue comme un ancien ambassadeur britannique, je ne retrouve absolument pas sur MSN Search les quelques pages pertinentes que Google m’a renvoyées.

Le nouveau MSN Search : théoriquement plus puissant que Google et pourtant ...

Au vu des deux exemples supra, on se demande si MSN Search n’a pas oublié de "crawler" certaines zones du web. Ce qui semble pourtant en contradiction avec la boulimie du "spider" MSNbot (le logiciel d’indexation de Microsoft) ...

Sur la puissance (nombre de pages web indexées), les spécialistes du référencement notent pourtant que MSNbot indexe plus de pages que Google. En clair : l’index du nouveau moteur de Microsoft pourrait dépasser en taille celui de Google. D’ailleurs, quasiment le même jour que celui du lancement de la version beta de MSN Search et de l’annonce par Microsoft qu’il indexait 4 millions de pages, Google annonçait qu’il passait son index de 4 à 8 millions de pages. [4]

Des fonctionnalités certes originales, mais sans utilité pour les juristes ...

MSN Search offre comme Google et Yahoo Search une interface expert appelée Search Builder (en français : "affiner votre recherche"). Deux fonctionnalités la distingue de ses concurrents :

  • la possibilité de pondérer (avec des curseurs) les trois critères de tri des résultats : popularité, mise à jour récente, correspondance exacte avec la requête. Toutefois, d’après mes tests rapides et des commentaires de spécialistes américains du référencement sur WebmasterWorld, agir sur ces trois crans n’offre, pour l’instant en tout cas, aucune pertinence supplémentaire
  • sur la version américaine (search.msn.com), une fonction de recherche "near me" permet de restreindre la recherche au voisinage géographique de l’internaute, mieux donc que la recherche de pages d’un pays donné (également offerte par ailleurs sur MSN Search). Cette recherche "localisée" est un grand argument commercial, non seulement pour les internautes, mais aussi pour les publicitaires. Mais, comme la recherche d’images, elle n’est d’aucun intérêt pour des juristes français.

Car le but final de Microsoft, avec sa nouvelle technologie de recherche Web, est bien sûr de concurrencer Google sur son "business model" : les revenus publicitaires assurent en effet l’essentiel des revenus du célèbre moteur de recherche et ils sont substantiels.

... sauf une : le RSS

De mon point de vue, une seule des fonctionnalités réellement originales de MSN Search est utile aux juristes. Enfin, disons : aux juristes branchés informatique/Internet. Le RSS est un simple fichier, écrit dans un format XML, qui contient les références et l’adresse web des nouveaux articles publiés sur un site web dynamique (autrement dit : un site web dont le contenu est stocké dans/géré par une base de données). Si un site est dynamique, et tout particulièrement les sites d’éditeurs, les blogs et autres sites gérés par CMS, il peut produire automatiquement ou avec un petit peu de programmation ce qu’on appelle un "fil RSS", dénoté par le même petit rectangle orange "XML" ou "RSS" que l’on voit en bas des pages de ce site web.

Les liens dans les fils RSS renvoient vers l’article sur son site d’origine. Le fil RSS peut être inclus sur les pages d’autres sites (ce qu’on appelle "syndiquer") ou lu dans un logiciel nommé lecteur ou aggrégateur de fils RSS. Cela permet notamment de consulter plus vite plus d’informations.

Mais qu’a à voir MSN Search avec le RSS ? Eh bien, le nouveau MSN Search permet d’enregistrer les résultats de la première page (les 10 premiers résultats seulement, donc, sauf si vous modifiez vos paramètres pour augmenter ce nombre) de votre recherche dans un fil RSS et d’être ainsi prévenu des nouveaux résultats grâce à votre lecteur RSS. Ca peut évoluer très souvent et faire pas mal de "bruit", vous avez donc intérêt à ne le faire que sur des questions très étroites, ne donnant que quelques dizaines de réponses maximum.

Le nouveau MSN Search plus favorable que Google aux sites commerciaux ?

Autre chose, un point non négligeable : MSN Search semble faire un peu plus de place au contenu payant et aux sites de sociétés (voir les éditions Francis Lefebvre bien placées dans les réponses à la requête droit social, ce qui est somme toute logique) alors que Google favorise clairement les sites à contenu gratuit, car il est librement indexable et reproduisible (par le cache de Google) par Google.

Il y a là deux conceptions de la pertinence et celle qui oublie moins les sites payants, si elle n’est pas abusive, peut avoir ses mérites. Toutefois, il faudra a priori rester vigilant.

Le nouveau MSN Search a pour lui la puissance de Microsoft et des fonctionnalités très tournées vers les particuliers

L’avance de Google durera t-elle ? Même si cela n’est pas pertinent en matière de recherche juridique, MSN Search offre une preuve de la capacité de l’équipe de Microsoft à atteindre la pertinence de Google : la recherche d’images de MSN Search, ici testée sur "droit social", est plus pertinente que celle de Google, même si elle est créée moins de réponses ...

En termes de pertinence, le nouveau MSN Search s’est énormément amélioré depuis la version alpha (dite MSN Search TechPreview). Mais depuis décembre, la pertinence de ses résultats ne me semble plus progresser. La firme de Redmond a toutefois assez de trésorerie pour financer la recherche et les fermes de serveurs nécessaires [5] pour aller plus loin et c’est Bill Gates lui-même qui supervise ces efforts.

Vu les succès passés de Microsoft dans des stratégies similaires (par exemple, la disparition de Netscape du marché des navigateurs, supplanté par Internet Explorer), Google risque à terme d’être marginalisé par ce nouveau concurrent. C’est ce que pensent de nombreux spécialistes de la recherche sur Internet, notamment certains spécialistes américains du référencement de sites web sur le site de référence en la matière, WebmasterWorld [6]. D’autant que, comme le relève Christophe Asselin, spécialiste de la veille et de l’intelligence économique, le futur moteur de recherche de Microsoft permettra à terme de chercher à la fois sur le réseau interne de l’entreprise et sur Internet [7] et qu’il sera de toute évidence intégré au futur système d’exploitation de Microsoft, Longhorn
 [8].

Dans le même sens, l’accent mis par MSN Search sur le multimédia (fichiers audio (onglet music de MSN Search USA, vidéo, ...), l’accès gratuit à son enyclopédie Encarta (la version Premium, c’est-à-dire complète) à travers MSN Search et l’accès aux réponses directement dans les résultats du moteur [9] illustrent bien la voie que Microsoft veut emprunter. C’est ce que souligne Marc Duval, bibliothécaire canadien, spécialiste des moteurs de recherche et auteur d’un blog sur le sujet [10]. Or, comme le montre l’exemple de la recherche d’images citée plus haut, MSN Search semble déjà plus pertinent sur ce segment que Google, ce qui pourrait à terme lui apporter une part importante du trafic des particuliers.

MSN c/ Google : la partie n’est pas finie mais la première manche est pour Google ... et Yahoo

Toutefois, pour détrôner Google et plus encore, pour convaincre les spécialistes de la recherche d’informations sur le Web (notamment l’information juridique), il faudra d’abord que l’équipe de Microsoft maîtrise l’analyse des liens hypertextes pour arriver à la même pertinence que Google sur les recherches thématiques et plus encore sur les questions pointues et les sujets rares. Fin avril 2005, soit trois mois après le lancement officiel de MSN Search, le Journal du Net constatait que « malgré les efforts de Yahoo et MSN, Google conserve nettement sa suprématie dans le domaine de la recherche » [11].

Olivier Andrieu, webmestre du site Abondance et spécialiste français des moteurs de recherche voit, lui, les choses ainsi [12] : « Bien sûr, on peut être un peu déçu du fait que, à l’instar de Yahoo !, le moteur de recherche de MSN soit un clone de Google. Si vous utilisez Google et que vous en êtes globalement satisfait, pourquoi iriez-vous à la concurrence si elle propose la même chose ? En fait, dans un premier temps, MSN veut faire en sorte de ne pas perdre d’utilisateurs sur son portail. Le premier objectif est certainement aussi de "roder" la technologie avant d’espérer aller plus loin. Dans un deuxième temps, MSN s’efforcera de rallier les internautes qui utilisent plusieurs moteurs en tablant sur leur curiosité pour que ces derniers mettent MSN dans leur "short list" de moteur. La troisième étape conduira MSN à apporter des innovations pour détrôner Google (on parle déjà de clustering - rangement en dossiers thématiques) et de personnalisation. Cela ne va pas être aisé, d’une part parce que Google dispose d’un capital de sympathie énorme, et je pense aussi qu’il faudrait une rupture technologique importante pour les mettre en danger. »

[Mise à jour au 10 juillet 2005 : Cinq mois après le lancement de MSN Search, Marc Duval, le webmestre canadien du site DSI, est plus élogieux que nous mais son évaluation est sans relation avec le juridique (voir la fiche technique très détaillée rédigée par M. Duval sur MSN Search.). Marc Duval : « Aux États-Unis, MSN devient un complément indispensable à ses rivaux. Pour ses versions nationales, notamment la France, il est devenu un concurrent sérieux grâce à son encyclopédie Encarta et à son service de Réponses rapides. » A contrario, il confirme mon appréciation : les résultats de MSN sont surtout pertinents aux Etats-Unis — pas en France — et aucun des deux services cités n’est utile aux juristes français (Encarta est une encyclopédie grand public ;d’ailleurs, sur de nombreux sujets, l’encyclopédie libre et gratuite Wikipedia, très bien indexée par Google, fait jeu égal avec Encarta), surtout les professionnels du droit. Les résultats comparés aux questions ci-dessus, à nouveau testées ce jour, donnent toujours les mêmes conclusions : Google puis Yahoo sont bien meilleurs que MSN Search pour la recherche en droit sur Internet.

Mise à jour au 22 novembre 2005 : Un site web américain dédié au référencement [13] publie les résultats de tests (près de 9500 à cette date) réalisés en aveugle sur la pertinence de Yahoo Search, Google et MSN Search. La fiabilité de ces tests n’est toutefois pas parfaite, la pertinence ici étant « toute subjective et relative » comme le dit Olivier Ertszcheid [14], puisqu’aucun critère de pertinence n’est défini. Et toujours pareil : Google puis Yahoo sont considérés comme plus pertinents que MSN Search.]

Emmanuel Barthe
documentaliste juridique

Recherche juridique : les bases du test

Les tests comparatifs ont été réalisés à la mi-novembre, donc sur la version beta de MSN Search, puis revérifiés et élargis un peu début février 2005 — sur la version de production de MSN Search alors. Pour MSN tant que pour Google, les 20 premiers résultats n’ont guère changés entretemps.

Pour tester rapidement les moteurs, j’utilise toujours la même requête (droit français [15]). Je l’exécute en utilisant — presque — toujours l’option "pages : France" du moteur.

A titre d’étalon de référence, voici *à peu près* le classement idéal qui devrait s’afficher en réponse à une telle question : 1 Legifrance, 2 Juripro, 3 LexisNexis France (les JurisClasseurs et leurs revues en ligne, avec Juris-Data), 4 Lamyline Reflex, 5 Lextenso, 6 Lexinter, 7 droit.org. Ou bien, si on privilégie les sites gratuits : 1 Legifrance, 2 Lexinter, 3 droit.org, 4 Juriguide, 5 Droit francophone, 6 Bibliothèque Cujas Ressources Internet, 7 DMOZ Droit français (remarquable travail fait par Stéphane Cottin) 8 votre serviteur 9 La porte du droit.
Gardez en tête ces classements idéaux pour évaluer les résultats des trois meilleurs moteurs.

Notes de bas de page

[1La version alpha était à cette adresse : http://techpreview.search.msn.fr

[2Pour les bases techniques de ces tests, lire le paragraphe idoine en fin d’article.

[3Son titre exact est : directive 2001/29/CE du Parlement européen et du Conseil, du 22 mai 2001, sur l’harmonisation de certains aspects du droit d’auteur et des droits voisins dans la société de l’information.

[4Pour plus de détails, lire MSN Search disponible en version bêta / Olivier Andrieu, Abondance.

[5D’après Les Echos des 12-13 novembre 2004 p. 22, ce nouveau moteur aurait déjà coûté à Microsoft 100 millions de dollars.

[6Lire par exemple, sur le forum Microsoft Search de WebmasterWorld, dans le fil "Microsoft Launches New Era in MS Search", le message du 12 novembre de bears5122.

[7Comme par hasard, Google a lancé en octobre 2004 son Google Desktop Search. Lire : Google affronte Microsoft avec le Google Desktop Search / Oliver Duffez, Web Rank Info, 26 octobre 2004 (rapide) et, plus détaillé, Google Desktop Search Launched
/ Danny Sullivan, SearchEngineWatch, 14 octobre 2004.

[8Le futur a déjà ses moteurs / Christophe Asselin (Intelligence Center), Abondance.

[9Selon Olivier Andrieu (Abondance) : « Seule la version américaine du moteur aura pour l’instant accès aux "réponses directes" (réponse à des interrogations en langage naturel directement dans la page de résultats), mais cette fonction est bientôt prévue sur le portail français. »

[10DSI. Le carnet des sites de recherche / Marc Duval, bibliothécaire, Québec.

[11La recherche, chasse gardée de Google / Florence Santrot, dans le dossier Google, MSN, Yahoo : le grand combat, Journal du Net 28 avril 2005.

[12Cité par Christian Hougardy : MSN déploie discrètement son nouveau moteur de recherche en France, l’XPditif 24 janvier 2005.

[13Traduction de "référencement" : en anglais : search engine optimisation (SEO).

[14Les voies de la pertinence sont impénétrables / Olivier Ertszcheid, affordance.info 22 novembre 2005.

[15Cette requête n’est pas aussi facile qu’elle peut le sembler, elle suppose de la part du moteur une bonne maîtrise de l’analyse du sens de l’expression, que cette analyse soit faite sur les mots ou le résultat de l’analyse des liens "à la Google".

Répondre à cet article