Moteurs de recherche internes gratuits ou pas chers pour PC (desktop search)

Voire pour réseau local (LAN)

Lundi 26 octobre 2020, par Emmanuel Barthe // Logiciels, Internet, moteurs de recherche

Autrefois (avant Internet), il y avait un grand nombre de moteurs de recherche interne pour faire mieux que le moteur incorporé dans l’Explorateur Windows (File Explorer). Le moteur de recherche de l’Explorateur Windows est notoirement lent et ne permet pas la recherche sur plus d’un disque dur à la fois. Sur un réseau d’entreprise, où classiquement on trouve au moins une petite dizaine de HD (hard drive), c’est très gênant.

Même Google s’était attaqué (avec plus ou moins de bonheur [1] au marché des moteurs de recherche d’entreprise avec la Google Mini et la Google Search Appliance (GSA), livrées sous forme d’un boîtier jaune (abandonnées respectivement en 2012 et 2016).

Ce type de moteur est moins répandu maintenant car, avec la domination des solutions de type Internet on a maintenant soit du cloud soit des serveurs web à installer en interne ... Ces derniers sont des usines à gaz, comparés aux besoins de la plupart des particuliers et indépendants.

NB : si c’est d’un logiciel pour constituer une base de données juridiques professionnelle que vous avez besoin, et non d’une simple moteur de recherche, lisez notre article sur le sujet [2].

Faire mieux que la recherche de l’Explorateur Windows

Il reste toutefois [3] plusieurs moteurs de recherche sur les fichiers et répertoires des ordinateurs Windows assez simples à mettre en place, et gratuits ou peu chers (moins de 200 euros la licence individuelle illimitée). NB : je n’ai pas testé ces logiciels.

- dtSearch, un des pionniers (depuis 1991). Look and feel désuet mais performant et toujours maintenu. Son installation et paramétrage nécessitent des compétences.
Cette solution est, selon le traducteur Jean-Marie Le Ray, « la Rolls-Royce des moteurs de ce genre ». Disponible en plusieurs déclinaisons, la version de base (dtSearch Desktop with Spider – single user) est à 199 USD. Après on passe à 1000, 2500 USD et plus. Il est possible avec dtSearch desktop with Spider d’indexer tout le contenu de son ordinateur local et/ou d’un site web, et d’effectuer des recherches à distance. Une version de dtSearch peut même fonctionner sur les très puissants hébergements cloud AWS (Amazon Web Services) et Microsoft Azure.
Leur slogan ("Find anything, anywhere, instantly !") n’est pas usurpé : J.M. Le Ray dit utiliser ce produit depuis des années et avoir indexé avec 20 tera-octest de données texte (des centaines de millions de termes indexés). De plus, selon lui, le processus d’indexation est extrêmement rapide.
Un des spécialistes français de dtSearch est le traducteur Dominique Pivard.

- Xapian, moteur de recherche de bureau, indexe le contenu de l’ordinateur et peut être utilisé avec l’interface graphique Recoll. Xapian et Recoll, tous deux open source, peuvent s’installer par ligne de commande depuis un terminal. Xapian offre un classement des résultats par pertinence et l’affinage des résultats par facettes. Le "combo" Xapian Recoll a été utilisé par le journaliste d’investigation Théo Englebert pour fouiller plusieurs dizaines de gigaoctects.

- Wuha est une solution française récente qui affiche les documents internes dans l’interface de Google (mais sans les lui transmettre), ce qui permet de chercher à la fois en interne et en externe. Un de mes collègues a été bluffé par sa puissance et la rapidité de prise en main. Le souci est que cela nécessite de donner accès aux données à Wuha pour qu’ils les indexent, donc la case confidentialité totale n’est pas cochée.

- SearchMyFiles de Nirsoft (freeware). Mis à jour pour Windows 10, malgré le design daté de son interface.

- X1 Search. Indexe aussi les emails de certaines messageries (Outlook, GMail, Yahoo Mail), certains clouds et SharePoint.

- Copernic Desktop Search. Recommandé par Christophe Deschamps (Outils Froids).

- Everything (freeware). N’indexe que les noms des fichiers et répertoires, pas le contenu des fichiers. En fait, la recherche sur le contenu est possible mais très lente du fait de l’absence d’index.

- Listary. Idem, cherche à toute vitesse dans les noms de fichiers et répertoires. Recommandé par Christophe Deschamps (Outils Froids) et Ballajack.

- FreeCommander. C’est un explorateur de fichiers gratuit pour Windows. Il offre une interface plus chargée que l’explorateur intégré de base dans Windows, mais propose bien plus de fonctionnalités. Il indexe le texte contenu dans les fichiers.

Il y en a d’autres. Voir :

Un seul PC ? Après tout, l’Explorateur Windows peut le faire

Pour finir, si on parle d’un seul PC (qui n’a en général qu’on voire deux disques durs), et si on sait précisément ce qu’on cherche (notamment le format de fichier et la date approximative de dernière modification), la recherche par l’Explorateur Windows (File Explorer) garde tout son intérêt. Regardez donc cette vidéo (en anglais).

D’autant que :

  • File Explorer sait utiliser les opérateurs logiques ET (écrit AND), OU (OR), SAUF (NOT) et expression (" "), pour la recherche tant dans les noms de fichiers que dans leur contenu
  • et que cette recherche peut être nettement accélérée en choisissant l’option de lui créer un index. Cette fonctionnalité existe toujours dans Windows 10. L’opération d’indexation elle-même prend évidemment un certain temps et lorsqu’on crée un nouveau fichier, l’ordinateur peut se trouver brièvement ralenti par le processus d’indexation.

Emmanuel Barthe

Notes de bas de page

[1Lessons from the Death of Google Search Appliance, Real Story Group, 21 juin 2018.

[3Trouvés par des requêtes Google de type "how to index OR search files Windows -explorer" ou "desktop search PC -"Windows explorer", sur ce blog et sur les deux pages web citées.

Répondre à cet article

1 Message