Logiciels, Internet, moteurs de recherche

Dernier ajout : 20 septembre.

Derniers articles

Moteurs de recherche internes gratuits ou pas chers pour PC (desktop search)

Voire pour réseau local (LAN)

Mercredi 23 septembre 2020

Lire la suite »

Autrefois (avant Internet), il y avait un grand nombre de moteurs de recherche interne pour faire mieux que le moteur incorporé dans l’Explorateur Windows (File Explorer). Le moteur de recherche de l’Explorateur Windows est notoirement lent et ne permet pas la recherche sur plus d’un disque dur à la fois. Sur un réseau d’entreprise, où classiquement on trouve au moins une petite dizaine de HD (hard drive), c’est très gênant.

Même Google s’était attaqué (avec plus ou moins de bonheur [1] au marché des moteurs de recherche d’entreprise avec la Google Mini et la Google Search Appliance (GSA), livrées sous forme d’un boîtier jaune (abandonnées respectivement en 2012 et 2016).

Ce type de moteur est moins répandu maintenant car, avec la domination des solutions de type Internet on a maintenant soit du cloud soit des serveurs web à installer en interne ... Ces derniers sont des usines à gaz, comparés aux besoins de la plupart des particuliers et indépendants.

NB : si c’est d’un logiciel pour constituer une base de données juridiques professionnelle que vous avez besoin, et non d’une simple moteur de recherche, lisez notre article sur le sujet [2].

Faire mieux que la recherche de l’Explorateur Windows

Il reste toutefois [3] plusieurs moteurs de recherche sur les fichiers et répertoires des ordinateurs Windows assez simples à mettre en place, et gratuits ou peu chers (moins de 200 euros la licence individuelle illimitée). NB : je n’ai pas testé ces logiciels.

- dtSearch, un des pionniers (depuis 1991). Look and feel désuet mais performant et toujours maintenu. Son installation et paramétrage nécessitent des compétences.
Cette solution est, selon le traducteur Jean-Marie Le Ray, « la Rolls-Royce des moteurs de ce genre ». Disponible en plusieurs déclinaisons, la version de base (dtSearch Desktop with Spider – single user) est à 199 USD. Après on passe à 1000, 2500 USD et plus. Il est possible avec dtSearch desktop with Spider d’indexer tout le contenu de son ordinateur local et/ou d’un site web, et d’effectuer des recherches à distance. Une version de dtSearch peut même fonctionner sur les très puissants hébergements cloud AWS (Amazon Web Services) et Microsoft Azure.
Leur slogan ("Find anything, anywhere, instantly !") n’est pas usurpé : J.M. Le Ray dit utiliser ce produit depuis des années et avoir indexé avec 20 tera-octest de données texte (des centaines de millions de termes indexés). De plus, selon lui, le processus d’indexation est extrêmement rapide.
Un des spécialistes français de dtSearch est le traducteur Dominique Pivard.

- Wuha est une solution française récente qui affiche les documents internes dans l’interface de Google (mais sans les lui transmettre), ce qui permet de chercher à la fois en interne et en externe. Un de mes collègues a été bluffé par sa puissance et la rapidité de prise en main. Le souci est que cela nécessite de donner accès aux données à Wuha pour qu’ils les indexent, donc la case confidentialité totale n’est pas cochée.

- SearchMyFiles de Nirsoft (freeware). Mis à jour pour Windows 10, malgré le design daté de son interface.

- X1 Search. Indexe aussi les emails de certaines messageries (Outlook, GMail, Yahoo Mail), certains clouds et SharePoint.

- Copernic Desktop Search. Recommandé par Christophe Deschamps (Outils Froids).

- Everything (freeware). N’indexe que les noms des fichiers et répertoires, pas le contenu des fichiers. En fait, la recherche sur le contenu est possible mais très lente du fait de l’absence d’index.

- Listary. Idem, cherche à toute vitesse dans les noms de fichiers et répertoires. Recommandé par Christophe Deschamps (Outils Froids).

- FreeCommander. C’est un explorateur de fichiers gratuit pour Windows. Il offre une interface plus chargée que l’explorateur intégré de base dans Windows, mais propose bien plus de fonctionnalités. Il indexe le texte contenu dans les fichiers.

Il y en a d’autres. Voir :

Un seul PC ? Après tout, l’Explorateur Windows peut le faire

Pour finir, si on parle d’un seul PC (qui n’a en général qu’on voire deux disques durs), et si on sait précisément ce qu’on cherche (notamment le format de fichier et la date approximative de dernière modification), la recherche par l’Explorateur Windows (File Explorer) garde tout son intérêt. Regardez donc cette vidéo (en anglais).

D’autant que :

  • File Explorer sait utiliser les opérateurs logiques ET (écrit AND), OU (OR), SAUF (NOT) et expression (" "), pour la recherche tant dans les noms de fichiers que dans leur contenu
  • et que cette recherche peut être nettement accélérée en choisissant l’option de lui créer un index. Cette fonctionnalité existe toujours dans Windows 10. L’opération d’indexation elle-même prend évidemment un certain temps et lorsqu’on crée un nouveau fichier, l’ordinateur peut se trouver brièvement ralenti par le processus d’indexation.

Emmanuel Barthe


Solutions pour se constituer ou partager une base de données juridique professionnelle

Moteurs de recherche, CMS, GED ...

Mercredi 23 septembre 2020

Lire la suite »

Tout est parti d’une question posée sur la liste de discussion Juriconnexion par un avocat solo sur les outils à la disposition des cabinets pour créer leur propre base de données juridique (jurisprudence, articles, etc...). En clair, y a-t-il des produits ou solutions à recommander qui permettent le la recherche et le partage avec d’autres collègues/confrères, voire l’exportation/importation automatique de données ?

De manière générale, il n’existe pas à ma connaissance de produit sur étagère ni a fortiori d’application gratuite qui ferait tout cela et marcherait tout seul. Mais qui en fassent une partie assez facilement, oui.

Si plus de 300 documents ou que vous ne partagez pas de réseau local, il faut envisager du cloud, un (gros) logiciel de gestion électronique de documents (GED) ou un site web partagé doté d’un CMS et/ou d’un moteur de recherche.

Simple, facile et rapide

- Moins de 300 à 500 documents ? Si vous êtes en réseau local Windows ou Apple et que le nombre de documents est faible (moins de quelques centaines), les bons vieux répertoires suffisent.
Pour moteur de recherche, prenez celui de l’Explorateur Windows. Si File Explorer ne vous suffit pas, ce blog recense d’autres moteurs de recherche internes pour PCs [4].

- Mettre les documents sur un Google Drive ou autre cloud (testez Cozy Cloud par exemple, il est français et ne vend pas vos données) et partager les codes d’accès.
L’avis de Beatriz Chatain, knowledge manager du cabinet d’avocats CMS-BFL [5] : « Les solutions de type Google Drive [6] ont l’intérêt de pouvoir être collaboratives mais au bout d’un moment, le problème de volume peut [personnellement, je dirais : va] se poser aussi et donc il faudra payer. Le montant devrait toutefois être moins important qu’un outil ad hoc de type GED. Attention quand même aux accès et à la sécurité ... »

Difficulté moyenne, nettement plus personnalisé

- Le logiciel MediaWiki qui "propulse" Wikipedia a été plusieurs fois utilisé pour de telles bases. Par exemple pour la base de doctrine du Barreau, dite la Grande Bibliothèque du Droit (GBD) ou bien le wiki de La Loi des Ours (Jean Gasnault). MediaWiki n’est pas forcément simple à installer [7], mais après, il suffit de créer une nouvelle page puis de copier coller le document dedans.

- Le portail et logiciel documentaire PMB de la société PMB Services. Selon la description de ma collègue Carole Guelfucci, « plusieurs cabinets d’avocats utilisent ce logiciel libre. A l’origine, PMB est un logiciel plutôt dédié aux bibliothèques (publiques) mais avec de la personnalisation, il peut tout à fait s’adapter à la gestion d’unités documentaires de toutes sortes comme la jurisprudence ou la doctrine.
PMB est un logiciel libre donc gratuit dans l’absolu. Néanmoins, pour son paramétrage et sa personnalisation et pour obtenir un portail qui corresponde aux attentes, il est conseillé de se faire aider, en l’occurrence par le prestataire PMB Services.
On ne paye pas de licence mais du service. Le coût de la solution dépend du degré de personnalisation. Plus qu’une base de données de connaissances, on obtient dans ce cas un véritable portail documentaire. Tout dépend alors de la nature du projet. »
Un point important : il existe un club bien actif des utilisateurs juridiques de PMB. Les comptes-rendus de ses réunions sont disponibles sur le blog de Carole.

- SharePoint de Microsoft est un logiciel de gestion de contenu ("content management System"", CMS) pour intranets. Comme le rappelle Beatriz Chatain, il permet de réaliser des arborescences, est collaboratif et peut être utilisé assez "rapidement" sans développement particulier. L’avantage de SharePoint en entreprise, c’est que la licence SharePoint est souvent déjà incluse dans la licence Office globale négociée par la firme.

- Le moteur de recherche et d’indexation dtSearch. Voir notre article Moteurs de recherche internes gratuits ou pas chers pour PC (desktop search). Selon le traducteur Jean-Marie Le Ray, c’est « la Rolls-Royce des moteurs de ce genre ».
Le stockage et la gestion des documents reste en revanche à confier à une application comme l’Explorateur Windows avec une structure en répertoires. Une version de dtSearch peut même fonctionner sur des clouds professionnels très puissants comme Azure de Microsoft ou AWS d’Amazon.

Ambitieux et très puissant

- Pour un professionnel solo ou une petite équipe, la base de données Open Avocat montée par l’avocat spécialiste du contentieux des accidents médicaux Dimitri Philopoulos, et qui réutilise Legifrance, est un bon exemple de ce qui est possible pour un coût très faible.
Mais attention : pour les données Legifrance, elles sont en XML. Leur traitement optimal demande des compétences informatiques

- Pour une grosse structure, rappelle Beatriz Chastain, « les systèmes de GED de type iManage (ex-MailSite, ex-FileSite) permettent de gérer des arborescences assez finement construites avec des fonctionnalités très développées. C’est ce que les cabinets de grande taille ont en général, mais c’est cher ».

Une remarque personnelle : l’absence de produit simple à part les "drives" des "clouds" — que d’anglicismes ! — laisse un peu de place pour un produit web centré autour d’un moteur de recherche efficace, rapide et sécurisé par code d’accès. Cela dit, le moteur, c’est toute la difficulté : des qu’on veut de l’optimisé, sauf exception à la dtSearch, ça a tendance à chiffrer.

NB 1 : si vous voulez garder les décisions au format PDF, c’est possible, mais les moteurs de recherche sont moins bons ou plus chers.

NB 2 : évitez d’utiliser le module de gestion de documents de votre logiciel/application de gestion de cabinet d’avocats (Kleos, PolyOffice ...). Ce n’est pas conçu pour.

Des contacts et des SSII

- Aller faire un tour un soir à une réunion Open Law. Il y a dans ce forum beaucoup de contacts à prendre et de trucs à échanger.

- Plusieurs legal tech ont des compétences dans ces domaines mais celles-ci ne sont pas gratuites. Des sociétés connues ? Luxia, Lexbase, Doctrine.fr ... (liste non exhaustive, merci aux membres de la liste de compléter).

- Faire appel à un documentaliste indépendant pour élaborer une solution peut permettre de mettre en place quelque chose de pratique et pas très cher. Pour une liste des documentalistes indépendants, voir sur ce blog notre billet Documentalistes juridiques free lance et autres indépendants du secteur de l’information juridique. Et là, comme le souligne ma collègue Carole Guelfucci, PMB peut être un choix de logiciel, l’importance de la prestation de service de la société PMB pouvant étre réduite par les connaissances du documentaliste. La société PMB a d’ailleurs l’habitude de travailler avec des bibliothécaires documentalistes.

D’autres pistes ? Les commentaires sont ouverts.

Emmanuel Barthe
documentaliste juridique


Pourquoi continuer à bloguer pour si peu d’audience ?

Pourquoi continuer à poster sur Internet ?

Pourquoi continuer à échanger sur les réseaux sociaux face à tant de "café du commerce" et de polémique ?

Mercredi 16 septembre 2020

Lire la suite »


Publier sur Internet, sans illusion

Ça fait un moment que je m’interroge sur l’intérêt de participer au débat public à travers mon blog et Twitter.

Et voilà que je tombe sur une interview de la professeure de philosophie Marylin Maeso qui apporte de l’eau à mon moulin [8] (voir son ouvrage au titre hélas peu compréhensible pour les développements complets).

Selon son ouvrage (et je la rejoins) : « Il y a une différence fondamentale entre s’emporter dans un débat télévisé, par exemple, face à quelqu’un, et insulter un écran. La différence, justement, c’est de ne pas voir l’autre, mais surtout de ne pas voir la conséquence de ses propres mots sur l’autre, et cela a un pouvoir de désinhibition qui est assez fondamental. » Elle parle aussi d’une « économie de la colère ou plus spécifiquement concernant les réseaux sociaux, d’une économie de l’indignation ». Je ne souscris pas à tout ce qu’elle dit mais elle décrit bien une part importante du problème.

Les débats sur Internet : café du commerce, invective et violence, trop souvent

Comme elle, j’apprécie la nuance et les arguments, pas l’invective ni la polémique. Les rares fois où un troll/militant aveugle arrive dans mes échanges, je cesse très vite de lui répondre. Je ne suis pas le seul : regardez par exemple ce tweet épinglé d’une professeur de droit public [9].

Une façon de dire que malgré la bonne tenue de la très grande majorité des threads auxquels je participe, la bêtise, l’inintérêt et la violence [10] de la très grande majorité des échanges sur les réseaux sociaux me désole. C’est notre ancien café du commerce devenu une agora nationale et parfois mondiale.

Après, il y a un vif débat sur les solutions [11], mais je n’ai pas d’avis tranché là-dessus.

Les blogs : baisse d’audience et d’influence

Quant à mon blog, son audience, comme celle de tous les blogs, baisse lentement mais régulièrement. La mode est aux vidéos — y compris en droit [12] — et aux photos "filtrées". Certains de mes billets pourtant très travaillés (plusieurs heures de boulot) font moins de 100 vues au total (exemple : mon post sur Datajust, certes arrivé après les premiers commentaires, n’a fait que 73 vues selon mes statistiques Spip).

Google met d’abord en valeur ses propres réponses et produits dans les résultats de son moteur de recherche. Le SEO (optimisation d’un site pour améliorer son positionnement — "ranking" — dans les résultats des moteurs de recherche) sur Google a de moins en moins d’effets. Le SEO n’est pas exactement mort mais pour les petits sites, il est devenu beaucoup plus difficile de faire la différence.

Il faudrait certainement que j’équipe mon blog d’un outil de mailing (newsletter automatique). C’est ce que recommandent de nos jours les spécialistes du web marketing.

Enfin, un blogueur n’a quasiment aucune prise sur les mouvements de fond d’une industrie, quand bien même il en serait un acteur industriel majeur [13].

Alors, pourquoi continuer ?

Dès lors, quel est l’intérêt de continuer à poster sur les réseaux sociaux et à bloguer ? Je vois quatre raisons principales de continuer.

1. Primo, twitter pour le plaisir et l’extrême intérêt de ces hélas trop rares vraies discussions par exemple ce fil sur les thèses.

2. Deuxio, bloguer pour pouvoir développer et argumenter sans limite.

3. Bloguer encore pour pouvoir publier (rendre public) une somme de savoir ou une réflexion et y faire référence plus tard. Pour ne pas la perdre et la faire peut-être fructifier. Comme mon post sur l’IA en droit.

L’avantage (qui est aussi un inconvénient) des billets de blogs est que cela "reste", contrairement aux messages des réseaux sociaux qui n’ont qu’une durée de vie et une "découvrabilité" très limitée (à moins qu’ils ne soient repris dans un blog justement, ou un outil de curation). Du coup, on peut au moins faire d’un billet de blog une référence ou une trace (et démontrer au besoin un plagiat ou la primeur d’une idée). Le billet de blog devient alors une référence, l’endroit public et facile à trouver où une idée est démontrée.

Un peu comme un article de revue scientifique ou plutôt de journal. Ce qui s’approche parfois de la publication scientifique sans en avoir les processus ni demander autant d’efforts ; plus souvent, on est proche d’une actualité journalistique mais sans sa déontologie ni son lectorat.

Pour l’indépendant, le consultant, cette accumulation de savoir a un autre avantage. Elle développe sa publicité et sa réputation, par la démonstration d’une compétence dans son domaine et par la très nette amélioration du référencement de son site que procure le contenu amassé [14].


Internet et les réseaux sociaux ou le café du commerce doté d’une caisse de résonance mondiale :-(

Quand j’écris que ça "reste", je veux dire que la "cherchabilité" des posts de réseaux sociaux est catastrophique. Que ce soit par Google ou par leur moteur interne.

Pour Twitter, j’en ai une expérience directe et quotidienne : il arrive qu’en utilisant les fonctions avancées du moteur, on trouve quelque chose d’intéressant, mais c’est rare.

Sur le moteur de recherche interne de Facebook, un collègue m’a donné son témoignage : « professionnellement, les rares fois où j’ai eu besoin de chercher quelque chose dedans, je n’ai rien trouvé, alors que je savais que cela existait et quelle était la provenance. On peut penser que Facebook a mis des filtres et plusieurs fois j’ai eu l’occasion de constater les méfaits des présélections soi-disant heuristiques qui condamnent à ne voir que ce que FB a décidé pour soi. »

Les réseaux sociaux peuvent alors servir de moyen de diffusion des billets de blogs. Comme autrefois les listes de diffusion ou de discussion par email.

La nullité de 95% des échanges sur les réseaux sociaux n’a rien d’étonnante. Entre la tendance bien humaine à critiquer plutôt qu’à encourager et l’intérêt des GAFAM à favoriser le "buzz" ... La polémique fait venir les internautes comme des mouches sur le miel. Donc elle fait monter les revenus publicitaires dans un Internet qui refuse globalement d’être financé autrement.

4. Enfin, bloguer aide à mettre en ordre ses pensées et à vérifier qu’elles tiennent debout en devant chercher ses arguments. Ce qui évite l’effet "café du commerce" et l’appel aux émotions.

Sur le long terme, j’apprécie ma raison n° 3. Elle a sa logique.

En conclusion, je rappellerai que si mon inspirateur (éloigné) Dave Winer a écrit qu’il arrêterait un jour de bloguer ... il ne l’a pas fait ;-) Et il n’est pas prêt de le faire.

Emmanuel Barthe

Si vous voulez partager vos raisons à vous de continuer à écrire sur Internet, les commentaires sont ouverts.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 36

Dernières brèves