Surveillez automatiquement les modifications des pages web

Logiciels et autres outils de veille

Dimanche 25 février 2018, par Emmanuel Barthe // Logiciels, Internet, moteurs de recherche

NB : cet article est une mise à jour rapide d’un très ancien billet. Il n’est donc que partiellement à jour. Mais comme il n’existe pas beaucoup de listes commentées de ce genre et que j’ai parfois besoin de le citer à des collègues, je l’ai remis en ligne.
Si vous y trouvez des erreurs, merci de les signaler dans les commentaires.

Les logiciels de veille automatique sur le Web [1] vous préviennent quand une page web que vous surveillez est modifiée ou lorsqu’une page web correspondant à vos mots-clés est publiée. [2] Vous pouvez ainsi surveiller les mises à jour de vos sites préférés. Mais aussi, quand la page surveillée est le résultat d’une interrogation d’une base de données telle celle de la Cour de Justice de l’Union européenne (CJUE), cela permet d’être prévenu de la publication d’un arrêt.

Mes préférés

- Modernes, légers, pratiques mais limités : les extensions pour Firefox et Chrome :

  • Mozilla Update Scanner pour Firefox.
    Avantages : gratuit ; simple : un clic droit sur page à suivre, un ou deux réglages (périodicité de la surveillance + nombre de caractères devant être modifié) et un clic sur OK : le tour est joué ; affiche en couleur les changements dans la page ; aide bien faite (en anglais).
    Limites : pas d’alerte sur mot-clé ; pas de partage/pas de version réseau/pas de version en ligne
  • Distill Web Monitor (ex-AlertBox) pour Firefox. Permet de spécifier des règles précises et de ne surveiller qu’une (ou des) zone(s) de la page web. Il accepte même les expressions régulières (Regex). Une documentation sérieuse existe pour bien l’utiliser et le développeur s’occupe bien de son produit et de l’assistance. Gratuit jusqu’à 3 veilles, payant (peu cher) au-delà ou si on veut la version avec accès à distance mais semble bien le valoir d’après les commentaires. Voici un tutoriel vidéo correct de 2016
  • visualping.io (ex-Page Monitor) pour Chrome ou en version SaaS. Avantage et (gros) inconvénient à la fois : peu de paramétrages sont possibles. Tout changement, quelque que soit son importance, est donc signalé. Pas mal de bruit à attendre donc, a priori. Christophe Deschamps (Outils froids) l’apprécie [3]

- WebSite-Watcher :

  • avantages :
    • apprécié par Armelle Thomas, documentaliste devenue veilleure et consultante (Inforizon) et les spécialistes de la veille Frédéric Martinet (Actulligence) et Aref Jdey (Demain la Veille) [4]
    • doté d’une base installée importante en France
    • pas cher du tout (prix Business edition : 99 euros TTC avec mises à jour la première année puis 50% de remise pour avoir les mises à jour les années suivantes) et d’un rapport qualité prix défiant toute concurrence
  • limites : de mon point de vue, WSW commence à ne plus être totalement en phase avec les besoins actuels :
    • pas d’accès à distance/cloud (s’installe sur un PC)
    • pas de partage en réseau privé
    • surveiller l’entièreté d’un site web est possible mais compliqué.

- Lecteurs RSS adaptés pour la veille :

  • le lecteur de fils RSS dominant et recommandé dans un contexte de veille professionnel est Inoreader (SaaS, payant) d’Innologica (une app Android existe). Inoreader possède une gamme de filtres élaborés et est maintenu par une solide équipe (bulgare)
  • il y en a d’autres : voir l’étude comparative et quasi-exhaustive publiée par Serge Courrier en 2014 (NB : l’offre s’est réduite depuis)
  • NB : le RSS est une technologie de veille maligne et légère. Mais vu l’emprise aujourd’hui encore du mail, il est souvent nécessaire de convertir ses flux RSS en mails. Pour faire cela automatiquement et gratuitement (avec un peu de publicité dedans évidemment), j’utilise BlogTrottr. Cette application en ligne est riche en fonctionnalités futées. Le délai avant envoi est d’au minimum deux heures. Pour recevoir les mails plus vite, une version payante mais très économique existe.

- Google Alert :

  • avantages :
    • il bénéficie du moteur de recherche de Google : richesse de l’index et pertinence des résultats
    • on peut le restreindre à l’onglet News (presse gratuite en ligne)
    • il envoie directement des emails
    • en se connectant à son compte Google *avant* de créer son alerte, on peut enregistrer et surtout gérer autant de veilles que désiré. Notamment les modifier et les supprimer. C’est un point clé d’un bon usage de Google Alert
  • inconvénients :
    • décalage entre la mise en ligne de l’information et l’arrivée du mail
    • la liste de résultats affichée dans le mail est partielle. Il faut aller sur son navigateur web pour la voir en entier
    • il existe des doutes dans la communauté des veilleurs sur sa pérennité à long terme. L’abandon de Google Reader et un certain manque de mise en avant et d’amélioration de Google Alert par la firme de Mountain View justifient ce doute
    • il n’est évidemment pas connectable — à des sources payantes ou sur mot de passe.

D’autres logiciels

Des logiciels en anglais : voir deux outils cités en 2005 par le consultant Aref Jdey sur son blog de l’époque Vtech [5] et existant toujours :

  • InfoMinder. Possède des fonctionnalités plus larges, puisqu’il surveille non seulement des pages web, mais aussi des blogs, des fils RSS et des wiki (payant, 30 jours d’essai gratuit)
  • ChangeDetect. Il a l’air assez riche en fonctionnalités, comme par exemple la possibilité de spécifier non seulement des mots-clés mais également une requête booléenne (gratuit). Des clients de référence comme Wolters Kluwer. Aucune news ni billet sur leur blog depuis 2012.

Voir aussi :

  • OnWebChange. Un service de surveillance de pages web avancé (dixit C. Deschamps)
  • TrackEngine. Gratuit jusqu’à 5 adresses ou 100 Ko, payant au-delà, c’est-à-dire en pratique pour toute utilisation professionnelle. A peu évolué depuis les années 2000 ... [6]

Des produits plus professionnels et plus complets ... et chers

  • Tadaweb : interface graphique (schémas ...) très pratique, inclus analyse de sentiments donc plutôt orienté veille produits et compétitive, apparu en 2013, et très apprécié par la communauté à sa sortie [7]. Les veilleurs clients regrettent une évolution intervenue en 2015 qui a retiré une bonne part de la possibilité de faire eux-mêmes le paramétrage de l’application et en a nettement augmenté le prix. Prix de départ à plusieurs milliers d’euros par an
  • KB Crawl est un métamoteur de veille très amélioré, basé sur la recherche texte intégral sur des pages web, avec délimiteur. Il est développé par BEA Conseil. Prix de départ aux alentours de 5000 euros HT par an
  • Ask’n’Read de Qwam. Comme KB Crawl, Qwam est dans une gamme de coût intermédiaire : une grosse structure peut en avoir pour 10 000 euros par an en SaaS seulement
  • plus puissants, les produits de Digimind vont plus loin dans l’automatisation et savent aussi poser des questions à des bases de données de tout type [8]. En somme, une des Rolls du secteur. A partir de 7000 euros HT annuels
  • autres acteurs de la taille de Digimind et KBCrawl :

Ces outils et quelques autres sont traités dans la rubrique Agents d’alerte du blog Outils de veille d’Armelle Thomas et dans l’article Veille sur le Net : des besoins variés de Christine Brancier (Décision Micro 3 mai 2004). Certes anciens, ces documents ont l’avantage d’être quasi-exhaustifs (la plupart des acteurs de l’époque existent toujours, à l’exception d’Arisem [10]) et critiques.

D’autres produits

Pour compléter et mettre a jour cette liste, la source de référence est le site Outils froids de Christophe Deschamps.

Pour découvrir et tester (toujours tester, ne jamais croire sur parole ni penser qu’un outil est adapté à tout le monde et tous les besoins) plus d’outils et de conseil, voici quelques unes des meilleures listes commentées et critiques, essentiellement rédigées par Camille Alloing, spécialiste de la veille et de l’e-réputation, sur son (ancien) blog CaddEreputation (liste établie en 2011, mise à jour en 2015) :

Emmanuel Barthe
documentaliste, veilleur

Notes de bas de page

[1Sur les bases de données de presse, voir sur ce blog Presse française : les agrégateurs/banques de données. Nous ne traitons pas non plus dans ce billet des logiciels de veille marketing/com’ comme Mention ou Talkwalker ni de la veille sur les réseaux sociaux ("social listening").

[2A proprement parler d’ailleurs, on devrait plutôt parler d’agents d’alerte, puisque la véritable veille est faite par des êtres humains.

[3Mon ex-préféré : Webmon, développé par Colin Markwell, n’est plus maintenu.
Une brève critique élogieuse sur Clubic.com.
Gratuit, simple et tout petit/léger. On peut spécifier la zone de la page web à surveiller. Seul reproche : il lui manque une fonction — et uniquement celle-là — : celle d’indiquer les mots qui ont changé dans l’ensemble de la page web surveillée. Fonction que C4U remplissait très bien ... Il reste plus simple et un peu plus ergonomique que C4U.
Autre ex-préféré : antédiluvien, "dinosauresque", certes, mais extrêmement simple et diablement efficace : le préféré de plusieurs de mes connaissances, devenu également le mien ... jusqu’à ce que je découvre le HTML to RSS et le RSS to Mail et que je passe sous Windows 7 : C4U. La société israélienne qui l’a développé (C4U Ltd) a disparu et C4U n’est plus mis à jour depuis 1999, semble n’être plus téléchargeable nulle part et de toute façon ne fonctionne pas sous Windows 7 et versions suivantes.
Enfin, Diphur, pour lequel j’avais oeuvré comme testeur et "évangélisateur" bénévole, semble avoir hélas disparu en 2017. Pour mémoire, sur Diphur :

  • avantages :
    • payant mais peu cher : débute à 98 USD par an
    • disponible en ligne contrairement aux addons Firefox et Chrome supra
    • mélange de métamoteur de veille et de "social bookmarking" (on importe ses favoris/ bookmark et les signets peuvent être publics)
    • le développeur américain est très actif et très à l’écoute de ses utilisateurs
    • forte communauté d’utilisateurs français
    • la FAQ de Diphur est publique, une transparence rare pour une application de veille
    • simple à utiliser : on importe un bookmark et on peut commencer
    • fonctionnalité délimiteur
  • limites :
    • Diphur est basé sur la surveillance de pages web et non de sites ou de l’ensemble du Web. Toutefois, la fonctionnalité "Intel" permet de surveiller l’ensemble des pages individuelles surveillées par l’ensemble des utilisateurs de Diphur (pas l’ensemble du Web donc). Lorsque vous utilisez la fonction Intel, afin de ne pas ramener de "bruit" informationnel, Diphur vous permet d’utiliser les opérateurs booléens, l’opérateur de proximité et la troncature
    • pas de partage en réseau privé.

[4Voir aussi la fiche de Techniques de l’ingénieur.

[5Outils de veille Internet / Aref Jdey, Vtech 4 août 2005.

[6Un ex-français : Wysigot. Assez complet (beaucoup plus riche en fonctionnalités que Webmon, mais les fonctionnalités essentielles restent les mêmes. L’avantage d’un logiciel de veille plus évolué est de pouvoir exclure de la veille des types de fichiers inintéressants comme les images) pour son prix peu élevé de 31,77 euros HT (pour une critique/évaluation complète, lire Décision Micro et Réseaux n° 569 du 10 novembre 2003 p. 28). Semble abandonné depuis 2010.

[7Critique appréciative du spécialiste Christophe Deschamps sur son blog Outils Froids en 2013.

[8On appelle cela des connecteurs.

[9Ex-Datops, racheté en 2006.

[10Go Albert est devenu AMI Software et Datops a été racheté par LexisNexis en 2008.

[11A lire aussi, même si ça concerne la méthodologie et non les logiciels : Définir ses objectifs de veille image en 14 questions, CaddEreputation 29 avril 2010.

Répondre à cet article

2 Messages

  • Logiciels de veille 28 août 2009 15:26, par Fabrice

    Il existe également comme solution pour les professionnels le serveur de veille collaboratif de la société KnowMade (http://www.knowmade.fr).
    Dans ce cas, ce n’est pas un logiciel de veille automatique que l’on doit configurer, mais ce sont des chargés de veille qui sélectionnent les informations pertinentes et qui les mettent à disposition sur un serveur pour le compte de clients.
    Ce serveur permet par la suite de diffuser et de partager ces informations sélectionnées. Il possède également des fonctions de recherches et d’analyses avancées.
    Il suffit donc de demander l’ouverture d’un compte et d’indiquer aux chargés de veille la thématique recherchée, et les informations sont transférées sur le serveur. Il n’y a pas besoin de rechercher des sources, de configurer des logiciels ou de trouver des mots clés. Les chargés de veilles s’en occupent. On est averti par mail tout les jours des nouveaux ajouts dans le serveur et on a plus qu’à les consulter.

    repondre message

  • Logiciels et autres outils de veille 26 septembre 14:15, par Guy

    Je travaille pour une revue d’information juridique et la veille représente une part importante de mon travail. Un très grand merci pour cet article qui est une véritable mine d’or !

    NB : certains articles mentionnent Google Reader qui hélas n’existe plus. A titre personnel, je recommande Miniflux, appli web libre minimaliste (que du texte) qui existe en version auto-hébergée ou, pour 15 dollars par an, hébergée.

    https://miniflux.app/

    https://miniflux.app/hosting.html

    repondre message