Google Custom Search Engine : créez votre propre moteur de recherche !

Enfin une recherche personnalisée et ciblée

Mardi 3 juillet 2007, par Emmanuel Barthe // L’édition juridique

Google a développé une version personnalisable de son moteur : Google Custom Search, qui fait partie des applications "Google Co-op" [1].

Le principe est simple : vous listez les sites ou adresses web à mettre dans l’index de "votre" moteur et Google limitera sa recherche à ceux-ci. Cette restriction sélective et "matière" du champ de recherche rend les résultats plus pertinents. Le danger, toutefois, réside dans l’absence d’exhaustivité ou de mise à jour de votre sélection. Il vaut mieux être un (ou plusieurs) spécialiste(s) de son secteur sur Internet pour monter un CSE (Custom Search Engine) valable.

Un exemple de CSE au point dans le secteur juridique : le moteur de recherche sur les blogs juridiques francophones créé par Arnaud Dumourier. Il indexe tous les blogs listés par Arnaud dans son annuaire JuriBlogs. Pas à 100% au point à mon avis, mais assez efficace, le CSE de Jurispedia Droit français offre sur ses "concurrents" l’avantage de donner la liste complète des sites qu’il indexe [2]. Toujours chez Jurispedia et plus efficace que celui Droit français, leur CSE Droit communautaire, lui aussi doté de la liste des sites indexés.

Pour une liste de l’ensemble des CSE et autres moteurs verticaux montés en droit français, lisez l’article de David Taté : Trouver de l’information juridique avec les moteurs de recherche (14 juin 2007). Il signale notamment Lex, un moteur Google CSE monté par Arnaud Dumourier sur sa sélection de sites en droit français, blogs compris.

Le CSE est bien documenté par Google et possède une liste de questions-réponses (FAQ) (en anglais uniquement hélas).

Le Google Custom Search Blog permet de se tenir au courant des améliorations apportées par Google à son application de moteur de recherche personnalisé.

Justement, en voici une de taille et extrêmement pratique : plus besoin d’importer un par un et à la main les adresses à retenir pour l’index du CSE. Il suffit de créer ou utiliser une liste de liens (voire un annuaire de sites, mais il faut alors recopier les adresses sur une seule page web), d’insérer un peu de code et on obtient un moteur personnalisé et surtout, qui se met à jour au fur et à mesure qu’on met à jour sa liste de liens. Son petit nom ? — en fait assez long : Google Custom Search Engine On the fly.

"On the fly" est un dérivé d’une nouvelle technique de stockage des adresses à indexer, Linked CSE, où la liste des adresses web n’est plus stockée chez Google mais sur le serveur de l’auteur du CSE. On the fly crée en fait un index de type Linked CSE à la volée (en anglais : on the fly), à partir des liens trouvés à l’adresse qu’on lui a indiquée.

Et évidemment, ça suppose de réunir, sur une seule page, toutes les adresses à indexer, et ça ne marche pas à partir d’un intranet — hélas !

Voilà, vous savez tout. Au travail, maintenant ! :-)

Emmanuel Barthe
documentaliste juridique et co-auteur du CSE Données juridiques publiques (France)

Notes de bas de page

[1On confond souvent l’application Google Custom Search Engine et le programme Google Co-op, Custom Search Engine étant la première en date et la plus importante des applications de "moteurs personnalisés" développés par Google en "coopération" avec les webmestres.

[2Google ne favorise pas l’affichage de la liste des sites indexés, sauf si justement on utilise la nouvelle technique On the fly de Google CSE (voir la suite de cet article).

Répondre à cet article