Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Surveillez automatiquement les modifications des pages web

Logiciels et autres outils de veille

NB : cet article est une mise à jour rapide d’un très ancien billet. Il n’est donc que partiellement à jour. Mais comme il n’existe pas beaucoup de listes commentées de ce genre et que j’ai parfois besoin de le citer à des collègues, je l’ai remis en ligne.
Si vous y trouvez des erreurs, merci de les signaler dans les commentaires.

Les logiciels de veille automatique sur le Web [1] vous préviennent quand une page web que vous surveillez est modifiée ou lorsqu’une page web correspondant à vos mots-clés est publiée. [2] Vous pouvez ainsi surveiller les mises à jour de vos sites préférés. Mais aussi, quand la page surveillée est le résultat d’une interrogation d’une base de données telle celle de la Cour de Justice de l’Union européenne (CJUE), cela permet d’être prévenu de la publication d’un arrêt.

Mes préférés

 Modernes, légers, pratiques mais limités : les extensions pour Firefox et Chrome :

  • Mozilla Update Scanner pour Firefox.
    Avantages : gratuit ; simple : un clic droit sur page à suivre, un ou deux réglages (périodicité de la surveillance + nombre de caractères devant être modifié) et un clic sur OK : le tour est joué ; affiche en couleur les changements dans la page ; aide bien faite (en anglais).
    Limites : pas d’alerte sur mot-clé ; pas de partage/pas de version réseau/pas de version en ligne
  • Distill Web Monitor (ex-AlertBox) pour Firefox. Permet de spécifier des règles précises et de ne surveiller qu’une (ou des) zone(s) de la page web. Il accepte même les expressions régulières (Regex). Une documentation sérieuse existe pour bien l’utiliser et le développeur s’occupe bien de son produit et de l’assistance. Gratuit jusqu’à 3 veilles, payant (peu cher) au-delà ou si on veut la version avec accès à distance mais semble bien le valoir d’après les commentaires. Voici un tutoriel vidéo correct de 2016
  • visualping.io (ex-Page Monitor) pour Chrome ou en version SaaS. Avantage depuis son arrivée en 2015 : pas mal de paramétrages sont apparus, comme la zone de la page à surveiller. Christophe Deschamps (Outils froids) l’appréciait à sa sortie [3]

 Wachete :

  • accès à distance/cloud
  • pour des besoins limités
  • pas cher.

 WebSite-Watcher :

  • avantages :
    • apprécié par Armelle Thomas, documentaliste devenue veilleure et consultante (Inforizon) et les spécialistes de la veille Frédéric Martinet (Actulligence) et Aref Jdey (Demain la Veille) [4]
    • doté d’une base installée importante en France
    • pas cher du tout (prix Business edition : 299 euros TTC avec mises à jour la première année puis 50% de remise pour avoir les mises à jour les années suivantes) et d’un rapport qualité prix défiant toute concurrence
  • limites : de mon point de vue, WSW n’est plus en phase avec les besoins actuels :
    • paramétrage peu évident
    • pas d’accès à distance/cloud (s’installe sur un PC)
    • pas de partage en réseau privé
    • surveiller l’entièreté d’un site web est possible mais très compliqué.

 Lecteurs RSS adaptés pour la veille :

  • le lecteur de fils RSS dominant et recommandé dans un contexte de veille professionnel est Inoreader (SaaS, payant) d’Innologica (une app Android existe). Inoreader possède une gamme de filtres élaborés et est maintenu par une solide équipe (bulgare)
  • il y en a d’autres : voir l’étude comparative et quasi-exhaustive publiée par Serge Courrier en 2014 (NB : l’offre s’est réduite depuis)
  • NB 1 : si la page web que vous voulez suivre est sur un site qui n’offre pas de RSS, il faut utiliser des outils du type "HTML to RSS". J’ai listés les meilleurs, ainsi que des tutoriels sur le sujet, dans ce billet : Créer un flux RSS pour un site web qui n’en possède pas
  • NB 2 : le RSS est une technologie de veille maligne et légère. Mais vu l’emprise aujourd’hui encore du mail, il est souvent nécessaire de convertir ses flux RSS en mails. Pour faire cela automatiquement et gratuitement (avec un peu de publicité dedans évidemment), j’utilise BlogTrottr. Cette application en ligne est riche en fonctionnalités futées. Le délai avant envoi est d’au minimum deux heures. Pour recevoir les mails plus vite, une version payante mais très économique existe.

 Google Alert :

  • avantages :
    • il bénéficie du moteur de recherche de Google : richesse de l’index et pertinence des résultats
    • on peut le restreindre à l’onglet News (presse gratuite en ligne)
    • il envoie directement des emails
    • en se connectant à son compte Google *avant* de créer son alerte, on peut enregistrer et surtout gérer autant de veilles que désiré. Notamment les modifier et les supprimer. C’est un point clé d’un bon usage de Google Alert
  • inconvénients :
    • le retard important (j’ai constaté environ 6 heures) entre la mise en ligne de l’information et l’arrivée du mail. Selon nous, l’explication en est simple : gérer une messagerie implique des ressources informatiques extrêmement lourdes. La plupart des prestataires de veille automatisée de masse font payer l’envoi des mails en temps réel. Ici, c’est gratuit, et de plus Alert n’est pas un produit prioritaire pour Google, donc ...
    • la liste de résultats affichée dans le mail est partielle. Il faut aller sur son navigateur web pour la voir en entier
    • il existe des doutes dans la communauté des veilleurs sur sa pérennité à long terme. L’abandon de Google Reader et un certain manque de mise en avant et d’amélioration de Google Alert par la firme de Mountain View justifient ce doute. Pour autant, en 2020, il est toujours là
    • il n’est évidemment pas connectable — à des sources payantes ou sur mot de passe.

Le spécialiste de la veille Frédéric Martinet, sur son blog Actulligence, a publié en avril 2020 un excellent billet, complet et détaillé, sur Google Alert. Il reste selon lui un outil de veille très intéressant [5]. En juridique, selon moi, il l’est peu du fait du peu de contenu de qualité professionnelle, les éditeurs juridiques maintenant leurs barrières face à Google, sauf quelques uns (principalement Lextenso, Revue Banque et la Revue Fiduciaire).

D’autres logiciels

Des logiciels en anglais : voir un outil cité en 2005 par le consultant Aref Jdey sur son blog de l’époque Vtech [6] et existant toujours [7] :

  • InfoMinder. Possède des fonctionnalités plus larges, puisqu’il surveille non seulement des pages web, mais aussi des blogs, des fils RSS et des wiki (payant, 30 jours d’essai gratuit)

Voir aussi :

  • OnWebChange. Un service de surveillance de pages web avancé (dixit C. Deschamps) et peu cher
  • TrackEngine. Gratuit jusqu’à 5 adresses ou 100 Ko, payant au-delà, c’est-à-dire en pratique pour toute utilisation professionnelle. A peu évolué depuis les années 2000 ... [8]

Des produits plus professionnels et plus complets ... et chers

  • Tadaweb : interface graphique (schémas ...) très pratique, inclus analyse de sentiments donc plutôt orienté veille produits et compétitive, apparu en 2013, et très apprécié par la communauté à sa sortie [9]. Les veilleurs clients regrettent une évolution intervenue en 2015 qui a retiré une bonne part de la possibilité de faire eux-mêmes le paramétrage de l’application et en a nettement augmenté le prix. Prix de départ à plusieurs milliers d’euros par an
  • KB Crawl est un métamoteur de veille très amélioré, basé sur la recherche texte intégral sur des pages web, avec délimiteur. Il est développé par BEA Conseil. Prix de départ aux alentours de 5000 euros HT par an
  • plus puissants, les produits de Digimind vont plus loin dans l’automatisation et savent aussi poser des questions à des bases de données de tout type [10]. En somme, une des Rolls du secteur. A partir de 7000 euros HT annuels
  • autres acteurs de la taille de Digimind et KBCrawl :

Ces outils et quelques autres sont traités dans la rubrique Agents d’alerte du blog Outils de veille d’Armelle Thomas et dans l’article Veille sur le Net : des besoins variés de Christine Brancier (Décision Micro 3 mai 2004). Certes anciens, ces documents ont l’avantage d’être quasi-exhaustifs (la plupart des acteurs de l’époque existent toujours, à l’exception d’Arisem [11]) et critiques.

NB : j’apprécie personnellement peu les applications dites de social listening (veille sur les réseaux sociaux focalisée sur la veille concurrentielle et réputationnelle), comme Mention, Talkwalker et Linkfluence (sur ce secteur, voir le comparatif rapide publié par Geneva Intelligence) en août 2020 et la dissussion sur LinkedIn). Cette appréciation est liée aux besoins de mes "clients internes", les avocats, et à mon métier de documentaliste. J’ai donc choisi de ne pas traiter ce segment des applications de veille ici.

D’autres produits

Pour compléter et mettre à jour cette liste, je vois deux sources de référence :

  • le site Plateformes-de-veille.org (avec une une étude dedans) mis en ligne à l’été en 2021 par plusieurs des principaux consultants français spécialistes de la veille [12] permet d’avoir une vue quasi-exhaustive et comparative des plateformes de veille actuelles sur le marché français. C’est un énorme travail en accès libre et gratuit, correspondant aux ouvrages *payants* de l’ADBS d’il y a 20 ans.
    Au titre des réserves (très limitées) :
    • je pense que les agrégateurs de presse devraient y figurer. D’autant que Meltwater, largement basé sur la presse en ligne, y figure. Sans compter que la presse est plus fiable en moyenne que le site web ou le réseau social de base
    • ce n’est pas une étude commentée, mais un comparatif extrêmement détaillé. Mais c’est normal : l’expertise d’un consultant a un prix
  • et le site Outils froids de Christophe Deschamps. Il a notamment signalé un tableau assez complet [13] réalisé par le groupe Webtechno de l’association des anciens de l’Ecole de Guerre Economique (AEGE) : Comparatif de logiciels de veille (janvier 2017).

 [14]

Emmanuel Barthe
documentaliste, veilleur

Notes

[1Sur les bases de données de presse, voir sur ce blog Presse française : les agrégateurs/banques de données. Nous ne traitons pas non plus dans ce billet des logiciels de veille marketing/com’ comme Mention ou Talkwalker ni de la veille sur les réseaux sociaux ("social listening").

[2A proprement parler d’ailleurs, on devrait plutôt parler d’agents d’alerte, puisque la véritable veille est faite par des êtres humains.

[3Mon ex-préféré : Webmon, développé par Colin Markwell, n’est plus maintenu. Une brève critique élogieuse de Webmon sur Clubic.com. Gratuit, simple et tout petit/léger. On pouvait spécifier la zone de la page web à surveiller. Seul reproche : il lui manquait une fonction — et uniquement celle-là — : celle d’indiquer les mots qui ont changé dans l’ensemble de la page web surveillée. Fonction que C4U remplissait très bien ... Il était plus simple et un peu plus ergonomique que C4U.
Autre ex-préféré donc : antédiluvien, "dinosauresque", certes, mais extrêmement simple et diablement efficace : le préféré de plusieurs de mes connaissances, devenu également le mien ... jusqu’à ce que je découvre le HTML to RSS et le RSS to Mail et que je passe sous Windows 7 : C4U. La société israélienne qui l’a développé (C4U Ltd) a disparu et C4U n’est plus mis à jour depuis 1999, semble n’être plus téléchargeable nulle part et de toute façon ne fonctionne pas sous Windows 7 et versions suivantes.
Enfin, Diphur, pour lequel j’avais oeuvré comme testeur et "évangélisateur" bénévole, semble avoir hélas disparu en 2017. Pour mémoire, sur Diphur :

  • avantages :
    • payant mais peu cher : débute à 98 USD par an
    • disponible en ligne contrairement aux addons Firefox et Chrome supra
    • mélange de métamoteur de veille et de "social bookmarking" (on importe ses favoris/ bookmark et les signets peuvent être publics)
    • le développeur américain est très actif et très à l’écoute de ses utilisateurs
    • forte communauté d’utilisateurs français
    • la FAQ de Diphur est publique, une transparence rare pour une application de veille
    • simple à utiliser : on importe un bookmark et on peut commencer
    • fonctionnalité délimiteur
  • limites :
    • Diphur est basé sur la surveillance de pages web et non de sites ou de l’ensemble du Web. Toutefois, la fonctionnalité "Intel" permet de surveiller l’ensemble des pages individuelles surveillées par l’ensemble des utilisateurs de Diphur (pas l’ensemble du Web donc). Lorsque vous utilisez la fonction Intel, afin de ne pas ramener de "bruit" informationnel, Diphur vous permet d’utiliser les opérateurs booléens, l’opérateur de proximité et la troncature
    • pas de partage en réseau privé.

[4Voir aussi la fiche de Techniques de l’ingénieur.

[5Votre veille avec Google Alerts  : le guide indispensable, par Frédéric Martinet, Actulligence, 21 avril 2020.

[6Outils de veille Internet / Aref Jdey, Vtech 4 août 2005.

[7ChangeDetect avait l’air assez riche en fonctionnalités, comme par exemple la possibilité de spécifier non seulement des mots-clés mais également une requête booléenne (gratuit) et avait des clients de référence comme Wolters Kluwer. Le site sert de la publicité pour de l’hébergement et le produit n’existe plus.

[8Un ex-français : Wysigot. Assez complet (beaucoup plus riche en fonctionnalités que Webmon, mais les fonctionnalités essentielles restent les mêmes. L’avantage d’un logiciel de veille plus évolué est de pouvoir exclure de la veille des types de fichiers inintéressants comme les images) pour son prix peu élevé de 31,77 euros HT (pour une critique/évaluation complète, lire Décision Micro et Réseaux n° 569 du 10 novembre 2003 p. 28). Semble abandonné depuis 2010.

[9Critique appréciative du spécialiste Christophe Deschamps sur son blog Outils Froids en 2013.

[10On appelle cela des connecteurs.

[11Go Albert est devenu AMI Software et Datops a été racheté par LexisNexis en 2008.

[12Mathieu Andro, Jérôme Bondu, Corinne Dupin, Christophe Deschamps. Note personnelle : dommage que Serge Courrier n’y ait pas participé.

[13A mon avis, il y manque certains agrégateurs de flux RSS, notamment le très évolué Inoreader.

[14OLD (liste établie en 2011, mise à jour en 2015) Pour découvrir et tester (toujours tester, ne jamais croire sur parole ni penser qu’un outil est adapté à tout le monde et tous les besoins) plus d’outils et de conseil, voici quelques unes des meilleures listes commentées et critiques, essentiellement rédigées par Camille Alloing, spécialiste de la veille et de l’e-réputation, sur son (ancien) blog CaddEreputation :