Google et Yahoo ex aequo ? Débat ...

Jeudi 23 février 2006

Chapeau bas à Jean Véronis, professeur en lingustique et informatique et spécialisé dans les technologies du langage à l’Université Aix-Marseille I [1], pour son Etude comparative de six moteurs de recherche (22 février 2006) [2]. Mes tests limités [3] sont évidemment un cran en dessous. Pour résumer, Jean Véronis considère que Yahoo fait jeu égal avec Google en matière de pertinence des dix premiers résultats.

Et pourtant ... Je fais chaque jour des recherches en droit français sur Google et parfois je repose ma question sur Yahoo [4]. Et dans ces cas là — un pratique limitée, donc, au domaine juridique —, même très récemment, je constate que Google.fr reste in fine légèrement plus pertinent que Yahoo.fr — disons de 5 à 10% plus pertinent selon moi si on se base sur les 10 premiers résultats.

Mais si on utilise une ferme de serveurs Google (dite "data center") qui est déjà passée sur BigDaddy (http://66.249.93.104/ par exemple) [5], la différence est plus nette : dans mes tests dans le domaine du droit français, toujours sur les 10 premiers résultats, on peut aller jusqu’à 40% plus pertinent pour Google. Exemple avec la requête "télévision abus de position dominante" (sans les guillemets) testée ce jeudi 23 février 2006 :

NB : Parfois, Google.fr standard sort les mêmes résultats que BigDaddy. Des webmestres ont déjà signalé ce phénomène. A court terme (mars 2006 d’après Matt Cuts, ingénieur chez Google), ils seront identiques ou très proches.

C’est un avis personnel de praticien de la recherche, cependant. Mes questions sont souvent plus complexes et mes requêtes sont souvent — mais pas toujours — plus travaillées que celles que l’étude de Jean Véronis cite.

Alors ? Est ce que mes constatations me trompent parce que partielles ou bien sont elles justes justement parce que (et uniquement parce que) partielles ? En clair, la pertinence de Google serait elle légèrement meilleure que celle de Yahoo sur les sujets techniques/scientifiques/professionnels et égale sur les sujets plus grand public ? Ou est-ce une simple impression de ma part ? C’est la question que je me pose et c’est là qu’une batterie de résultats comme celle de Jean Véronis me manque.

Ce qui n’empêche pas que sur des recherches difficiles, j’utilise aussi Yahoo (d’où ma comparaison supra). Car une chose me semble certaine : vu la pertinence de Yahoo, et vu que, comme l’étude de Jean Véronis le montre, les résultats de ces deux poids lourds ne se recoupent que pour 25% [6], on pourrait interroger Google et Yahoo ensemble plus souvent. Exemple avec la requête "droit foncier" (sans les guillements) : Yahoo complète en effet Google BigDaddy (qui fait ici jeu égal avec Yahoo et se fait quasiment "spammer" par un site de géomètre expert).

Tiens, d’ailleurs, il existe Twingine qui interroge justement les deux moteurs en même temps et donne les résultats comparés sur une même page, certes en utilisant des frames, ce qui rend peu pratique l’affichage des pages web, mais bon ... Quelques lignes de code permettent de l’ajouter sur son site ou son intranet ou à sa barre de moteurs Firefox.

Quel est le sentiment des lecteurs de ce blog ? Mon adresse e-mail est en bas de cette page.

[Mise à jour au 18 mai 2006 : selon le comparatif annuel des moteurs réalisé du 4 au 27 avril 2006 par le Journal du Net (JDN), Yahoo a quasiment rattrappé Google en termes de pertinence des résultats.

Le test de pertinence des 3 premiers résultats donne en effet :
Google 5,76/10
Yahoo 5,46
MSN 4,44.

Mais les deux testeurs du JDN voient Yahoo passer devant Google sur des scénarios de recherche complexes (7,14/10 contre 6,93/10) et de recherche de contenu (7,49/10 contre 7,19/10).]

Notes de bas de page

[1Le genre de compétences qui peuvent être très utiles pour travailler sur les moteurs de recherche ...

[2Format PDF, 10 pages claires et faciles à lire. Lire également sur Technologies du langage (TAL), le le blog de Jean Véronis, son commentaire des résultats de l’étude et les commentaires : Moteurs : Et le gagnant est ....

[4On parle bien ici de Yahoo Search et non de l’annuaire, que le moteur de Yahoo a relégué un peu à tort aux oubliettes du site Yahoo.

[5Voir sur ce blog la brève Google BigDaddy : kesako ?.

[6Mais ils peuvent se recouper très largement aussi. Exemple avec la requête "référé administratif" où seuls 2 résultats sur 10 divergent : Yahoo, Google BidDaddy.

Répondre à cette brève