Logiciels, Internet, moteurs de recherche

Dernier ajout : 30 mai.

Derniers articles

Moteurs de recherche internes gratuits ou pas chers pour PC (desktop search)

Voire pour réseau local (LAN)

Lundi 26 octobre 2020

Lire la suite »

Autrefois (avant Internet), il y avait un grand nombre de moteurs de recherche interne pour faire mieux que le moteur incorporé dans l’Explorateur Windows (File Explorer). Le moteur de recherche de l’Explorateur Windows est notoirement lent et ne permet pas la recherche sur plus d’un disque dur à la fois. Sur un réseau d’entreprise, où classiquement on trouve au moins une petite dizaine de HD (hard drive), c’est très gênant.

Même Google s’était attaqué (avec plus ou moins de bonheur [1] au marché des moteurs de recherche d’entreprise avec la Google Mini et la Google Search Appliance (GSA), livrées sous forme d’un boîtier jaune (abandonnées respectivement en 2012 et 2016).

Ce type de moteur est moins répandu maintenant car, avec la domination des solutions de type Internet on a maintenant soit du cloud soit des serveurs web à installer en interne ... Ces derniers sont des usines à gaz, comparés aux besoins de la plupart des particuliers et indépendants.

NB : si c’est d’un logiciel pour constituer une base de données juridiques professionnelle que vous avez besoin, et non d’une simple moteur de recherche, lisez notre article sur le sujet [2].

Faire mieux que la recherche de l’Explorateur Windows

Il reste toutefois [3] plusieurs moteurs de recherche sur les fichiers et répertoires des ordinateurs Windows assez simples à mettre en place, et gratuits ou peu chers (moins de 200 euros la licence individuelle illimitée). NB : je n’ai pas testé ces logiciels.

- dtSearch, un des pionniers (depuis 1991). Look and feel désuet mais performant et toujours maintenu. Son installation et paramétrage nécessitent des compétences.
Cette solution est, selon le traducteur Jean-Marie Le Ray, « la Rolls-Royce des moteurs de ce genre ». Disponible en plusieurs déclinaisons, la version de base (dtSearch Desktop with Spider – single user) est à 199 USD. Après on passe à 1000, 2500 USD et plus. Il est possible avec dtSearch desktop with Spider d’indexer tout le contenu de son ordinateur local et/ou d’un site web, et d’effectuer des recherches à distance. Une version de dtSearch peut même fonctionner sur les très puissants hébergements cloud AWS (Amazon Web Services) et Microsoft Azure.
Leur slogan ("Find anything, anywhere, instantly !") n’est pas usurpé : J.M. Le Ray dit utiliser ce produit depuis des années et avoir indexé avec 20 tera-octest de données texte (des centaines de millions de termes indexés). De plus, selon lui, le processus d’indexation est extrêmement rapide.
Un des spécialistes français de dtSearch est le traducteur Dominique Pivard.

- Xapian, moteur de recherche de bureau, indexe le contenu de l’ordinateur et peut être utilisé avec l’interface graphique Recoll. Xapian et Recoll, tous deux open source, peuvent s’installer par ligne de commande depuis un terminal. Xapian offre un classement des résultats par pertinence et l’affinage des résultats par facettes. Le "combo" Xapian Recoll a été utilisé par le journaliste d’investigation Théo Englebert pour fouiller plusieurs dizaines de gigaoctects.

- Wuha est une solution française récente qui affiche les documents internes dans l’interface de Google (mais sans les lui transmettre), ce qui permet de chercher à la fois en interne et en externe. Un de mes collègues a été bluffé par sa puissance et la rapidité de prise en main. Le souci est que cela nécessite de donner accès aux données à Wuha pour qu’ils les indexent, donc la case confidentialité totale n’est pas cochée.

- SearchMyFiles de Nirsoft (freeware). Mis à jour pour Windows 10, malgré le design daté de son interface.

- X1 Search. Indexe aussi les emails de certaines messageries (Outlook, GMail, Yahoo Mail), certains clouds et SharePoint.

- Copernic Desktop Search. Recommandé par Christophe Deschamps (Outils Froids).

- Everything (freeware). N’indexe que les noms des fichiers et répertoires, pas le contenu des fichiers. En fait, la recherche sur le contenu est possible mais très lente du fait de l’absence d’index.

- Listary. Idem, cherche à toute vitesse dans les noms de fichiers et répertoires. Recommandé par Christophe Deschamps (Outils Froids) et Ballajack.

- FreeCommander. C’est un explorateur de fichiers gratuit pour Windows. Il offre une interface plus chargée que l’explorateur intégré de base dans Windows, mais propose bien plus de fonctionnalités. Il indexe le texte contenu dans les fichiers.

Il y en a d’autres. Voir :

Un seul PC ? Après tout, l’Explorateur Windows peut le faire

Pour finir, si on parle d’un seul PC (qui n’a en général qu’on voire deux disques durs), et si on sait précisément ce qu’on cherche (notamment le format de fichier et la date approximative de dernière modification), la recherche par l’Explorateur Windows (File Explorer) garde tout son intérêt. Regardez donc cette vidéo (en anglais).

D’autant que :

  • File Explorer sait utiliser les opérateurs logiques ET (écrit AND), OU (OR), SAUF (NOT) et expression (" "), pour la recherche tant dans les noms de fichiers que dans leur contenu
  • et que cette recherche peut être nettement accélérée en choisissant l’option de lui créer un index. Cette fonctionnalité existe toujours dans Windows 10. L’opération d’indexation elle-même prend évidemment un certain temps et lorsqu’on crée un nouveau fichier, l’ordinateur peut se trouver brièvement ralenti par le processus d’indexation.

Emmanuel Barthe


Solutions pour se constituer ou partager une base de données juridique professionnelle

Moteurs de recherche, CMS, GED ...

Lundi 12 octobre 2020

Lire la suite »

Tout est parti d’une question posée sur la liste de discussion Juriconnexion par un avocat solo sur les outils à la disposition des cabinets pour créer leur propre base de données juridique (jurisprudence, articles, modèles/précédents, consultations etc...). En clair, y a-t-il des produits ou solutions à recommander qui permettent le la recherche et le partage avec d’autres collègues/confrères, voire l’exportation/importation automatique de données ?
De manière générale, il n’existe pas à ma connaissance de produit sur étagère ni a fortiori d’application gratuite qui ferait tout cela et marcherait tout seul. Mais qui en fassent une partie assez facilement, oui.

Attention : comme le note Rémy Lérignier, chargé d’assister les doctorants de la faculté de droit de Poitiers, « la "bonne" solution pour répondre à un(des) besoin(s) documentaire(s) reste de toute façon un (ou des) outil(s) dédié(s). Dès que l’on détourne trop un outil de sa fonction initiale, c’est le syndrome (très répandu) du "Excel gestionnaire de base de données" ». En clair : si vous voulez à tout prix utiliser un outil de la suite Microsoft Office autre que SharePoint, ou votre application de gestion de cabinet d’avocats, vous vous exposez à de grosses déconvenues.

S’il faut gérer plus de 300 documents ou si vous ne partagez pas de réseau local, il faut envisager du cloud, un (gros) logiciel de gestion électronique de documents (GED) ou un site web partagé doté d’un CMS et/ou d’un moteur de recherche.

NB : les bases de contrats sont un cas à part, pour lequel il existe des produits dédiés, souvent appelés contrathèques. Voyez notamment ce post de Leeway ou celui-ci d’Avanteam.

Simple, facile et rapide

- Moins de 300 à 500 documents ? Si vous êtes en réseau local Windows ou Apple et que le nombre de documents est faible (moins de quelques centaines), les bons vieux répertoires suffisent.
Pour moteur de recherche, prenez celui de l’Explorateur Windows. Si File Explorer ne vous suffit pas, ce blog recense d’autres moteurs de recherche internes pour PCs [4].

- Mettre les documents sur un Google Drive ou autre cloud (testez Cozy Cloud par exemple, il est français et ne vend pas vos données) et partager les codes d’accès.
L’avis de Beatriz Chatain, knowledge manager du cabinet d’avocats CMS-BFL [5] : « Les solutions de type Google Drive [6] ont l’intérêt de pouvoir être collaboratives mais au bout d’un moment, le problème de volume peut [personnellement, je dirais : va] se poser aussi et donc il faudra payer. Le montant devrait toutefois être moins important qu’un outil ad hoc de type GED. Attention quand même aux accès et à la sécurité ... »

Difficulté moyenne, nettement plus personnalisé

- Le logiciel MediaWiki qui "propulse" Wikipedia a été plusieurs fois utilisé pour de telles bases. Par exemple pour la base de doctrine du Barreau, dite la Grande Bibliothèque du Droit (GBD) ou bien le wiki de La Loi des Ours (Jean Gasnault). MediaWiki n’est pas forcément simple à installer [7], mais après, il suffit de créer une nouvelle page puis de copier coller le document dedans.

- Le portail et logiciel documentaire PMB de la société PMB Services. Selon la description de ma collègue Carole Guelfucci, « plusieurs cabinets d’avocats utilisent ce logiciel libre. A l’origine, PMB est un logiciel plutôt dédié aux bibliothèques (publiques) mais avec de la personnalisation, il peut tout à fait s’adapter à la gestion d’unités documentaires de toutes sortes comme la jurisprudence ou la doctrine.
PMB est un logiciel libre donc gratuit dans l’absolu. Néanmoins, pour son paramétrage et sa personnalisation et pour obtenir un portail qui corresponde aux attentes, il est conseillé de se faire aider, en l’occurrence par le prestataire PMB Services.
On ne paye pas de licence mais du service. Le coût de la solution dépend du degré de personnalisation. Plus qu’une base de données de connaissances, on obtient dans ce cas un véritable portail documentaire. Tout dépend alors de la nature du projet. »
Un point important : il existe un club bien actif des utilisateurs juridiques de PMB. Les comptes-rendus de ses réunions sont disponibles sur le blog de Carole.

- SharePoint de Microsoft est un logiciel de gestion de contenu ("content management System"", CMS) pour intranets. Comme le rappelle Beatriz Chatain, il permet de réaliser des arborescences, est collaboratif et peut être utilisé assez "rapidement" sans développement particulier. L’avantage de SharePoint en entreprise, c’est que la licence SharePoint est souvent déjà incluse dans la licence Office globale négociée par la firme.

- Le moteur de recherche et d’indexation dtSearch. Voir notre article Moteurs de recherche internes gratuits ou pas chers pour PC (desktop search). Selon le traducteur Jean-Marie Le Ray, c’est « la Rolls-Royce des moteurs de ce genre ».
Le stockage et la gestion des documents reste en revanche à confier à une application comme l’Explorateur Windows avec une structure en répertoires. Une version de dtSearch peut même fonctionner sur des clouds professionnels très puissants comme Azure de Microsoft ou AWS d’Amazon.

Ambitieux et très puissant

- Pour un professionnel solo ou une petite équipe, la base de données Open Avocat montée par l’avocat spécialiste du contentieux des accidents médicaux Dimitri Philopoulos, et qui réutilise Legifrance, est un bon exemple de ce qui est possible pour un coût très faible.
Mais attention : pour les données Legifrance, elles sont en XML. Leur traitement optimal demande des compétences informatiques

- Pour une grosse structure, rappelle Beatriz Chastain, « les systèmes de GED de type iManage (ex-MailSite, ex-FileSite) permettent de gérer des arborescences assez finement construites avec des fonctionnalités très développées. C’est ce que les cabinets de grande taille ont en général, mais c’est cher ».

Une remarque personnelle : l’absence de produit simple à part les "drives" des "clouds" — que d’anglicismes ! — laisse un peu de place pour un produit web centré autour d’un moteur de recherche efficace, rapide et sécurisé par code d’accès. Cela dit, le moteur, c’est toute la difficulté : des qu’on veut de l’optimisé, sauf exception à la dtSearch, ça a tendance à chiffrer.

NB 1 : si vous voulez garder les décisions au format PDF, c’est possible, mais les moteurs de recherche sont moins bons ou plus chers.

NB 2 : évitez d’utiliser le module de gestion de documents de votre logiciel/application de gestion de cabinet d’avocats (Kleos, PolyOffice ...). Ce n’est pas conçu pour.

Des contacts et des SSII

- Aller faire un tour un soir à une réunion Open Law. Il y a dans ce forum beaucoup de contacts à prendre et de trucs à échanger.

- Plusieurs legal tech ont des compétences dans ces domaines mais celles-ci ne sont pas gratuites. Des sociétés connues ? Luxia, Lexbase, Doctrine.fr ... (liste non exhaustive, merci aux membres de la liste de compléter).

- Faire appel à un documentaliste indépendant pour élaborer une solution peut permettre de mettre en place quelque chose de pratique et pas très cher. Pour une liste des documentalistes indépendants, voir sur ce blog notre billet Documentalistes juridiques free lance et autres indépendants du secteur de l’information juridique. Et là, comme le souligne ma collègue Carole Guelfucci, PMB peut être un choix de logiciel, l’importance de la prestation de service de la société PMB pouvant étre réduite par les connaissances du documentaliste. La société PMB a d’ailleurs l’habitude de travailler avec des bibliothécaires documentalistes.

D’autres pistes ? Les commentaires sont ouverts.

Emmanuel Barthe
documentaliste juridique


Le phénomène Instagram : pourquoi ?

Vendredi 22 mai 2020

Lire la suite »

Il a dépassé le milliard d’utilisateurs. Il mord même sur le terrain de YouTube. Des centaines d’ouvrages sur comment l’utiliser au mieux lui sont consacrés.

C’est Instagram. Lancé en 2010, ce réseau social a été acheté en 2012 par Facebook pour environ 1 milliard de dollars. Ses fondateurs l’ont quitté en septembre 2018. Il faisait alors 5,5 milliards de dollars US de recettes publicitaires anuelles et celles-ci ne cessent de croître.

Pour les entreprises, ok ...

Selon le site du magazine féminin, Marie-Claire, « la mode ne naît plus dans la rue, sur les podiums ou dans les ateliers artisanaux des grandes maisons de luxe. Aujourd’hui, c’est sur Instagram que les tendances se font et se défont. » « L’industrie de la mode restait inaccessible au public, et pour la première fois dans l’histoire de la mode, Instagram a fourni au spectateur un accès privilégié à une industrie qui lui était auparavant fermée. » explique Nicole Barclay, en charge des réseaux sociaux chez Net à Porter. Au point que Marie-Claire posait la question dès 2016 : Eva Chen, responsable de la mode chez Instagram, est-elle la nouvelle Anna Wintour ?

Il n’y a pas que pour la mode qu’Instagram est devenu incontournable : il est également devenu ultra-important pour les professionnels de la communication et du marketing et plus largement pour la communication des marques, même pour, par exemple, un croisiériste.

... mais pour les particuliers, qu’est-ce qui les motive à poster sur Insta ?

Un épisode avec Philippe Mangeot de l’émission Le Code a changé sur France Inter le dit très bien : Instagram, c’est la mise en scène de soi, auxquelles poussent les nouvelles technologies et réseaux sociaux [8]. C’est même dans l’ADN d’Instagram. C’est ce qui plaît à ses utilisateurs (hors stars et marques, car pour ces derniers c’est une obligation professionnelle) : ils sont plus beaux, plus fun, meilleurs communicants, meilleurs dragueurs que IRL (dans la vie réelle [9]) [10]. A propos d’Instagram et de ses concurrents réseaux sociaux, on parle souvent de narcissisme [11].

Les utilisateurs d’Instagram sont également attirés par le "glamour" de ceux qui mettent le mieux en scène leur vie : « Les utilisateurs aspirent à avoir la vie parfaite en image qu’ils voient les autres avoir sur Instagram ».

Les formats et filtres des photos sur Instagram sont limités mais sont *esthétiques* insiste l’émission de France Inter. De l’esthétique simple mais facile à s’approprier.

Pour être célèb’ sur Insta selon Philippe Mangeot, il faut « publier tous les jours la même photo », faire « une variation sur un dispositif stable ». « Vérité fondamentale de tous les réseaux sociaux » : ceux qui gagnent des followers « ne sortent pas de leur cadre » et écrivent toujours de la façon dont c’est attendu.

Plus positif selon moi, pour Philippe Mangeot :

  • Instagram donne lieu à une véritable sympathie (empathie), surtout à travers les messages privés (MP). Selon moi, idem pour Twitter
  • Instagram abrite des artistes, souvent des oeuvres mineures mais de l’art quand même.

Des guides pour se lancer sur Instagram

Quelques guides bien faits si vous voulez vous lancer :

Emmanuel Barthe
twittos, ex-modérateur de liste de discussion, veilleur


1 | ... | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | ... | 41

Dernières brèves