Logiciels, Internet, moteurs de recherche

Dernier ajout : 10 juin.

Derniers articles

Any Yahoo Pipes true substitute out there ?

Focusing on RSS feed merging and filtering

Mercredi 24 juin 2015

Lire la suite »

Pipe dreams by darwin Bell

The future loss of Yahoo Pipes in August this year [1] will be a major blow to the monitoring/research community and also web site authors looking for selected content. Its ability to combine and filter multiple RSS feeds into one feed remains unique among free hosted services. This post will focus on how we could replace Yahoo Pipes for these functions [2]. We will not deal here with the web page scraping Pipes was able to do too [3].

So I went looking for substitutes which could merge and filter feeds. I mean, real ones : as simple as Pipes. For instance, they shall have a graphic user interface (GUI) ; coding shouldn’t be necessary. The only difficulty allowed should be the use of regular expressions (Regex).

Free hosted substitutes

  • FeedCombine, RSSMix, FeedRinse or ChimpFeedr (to merge feeds into one feed) then FeedSifter or FeedRinse (to filter the mega-feed) can answer simple needs.
    FeedRinse can do more, as it accepts Regex but it can’t merge more than 5 feeds, is slow and bugs according to La Bibliothèque du CHUM’s test.
    FeedCombine cannot combine more than 5 feeds, say Anik Dumont-Bissonnette.
    ChimpFeedr is very simple at "chomping" (as their web site says) feeds.
    RSSMix, according to the same test, works perfectly, merging up to 100 feeds
  • IF (ex-IFTTT) doesn’t seem to do exactly that : merging and filtering RSS feeds into one feed. Which is not to say it does not have its (numerous) advantages in the field of monitoring services.

Paid hosted substitutes

  • FeedsAPI does not seem to merge RSS feeds but can filter them. Afterwards you can use an IFTTT recipe such as Feedly Category to Twitter. FeedsAPI and Inoreader seem the easiest to use solutions among the paid ones
  • Tadaweb from Luxembourg, according to some blog posts, is able to create from web pages, filter and organize RSS feeds. The ouput is in RSS format only if the input is RSS too
  • We Wired Web offers an IFTTT-like interface, RSS in and out and is able to filter it. But it does not merge different RSS feeds
  • the VIP and Premium versions of the Netvibes RSS portal are able to merge and filter RSS feeds by keywords, using Universal Search (which allows to query only certain groups of feeds — they’re called "tabs") and then Tracked Topics with RSS export
  • the Plus and Pro version of the RSS reader Inoreader allow merging and filter features : create a folder of feeds then an "active search" (an automated keyword search) on it and finally right click on the active search and click "Get RSS feed" [4]. It’s a pity Inoreader filter rules does not seem to have feeds as an outcome ; it would be interesting because they are much more precise than searches since they accept complex boolean queries and Regex [5] [6].

Self-hosted solutions (need coding skills)

In the sources listed below, I found other free or paid total or partial replacements — but you have to host them on your own server and/or they’re far too complicated for the average information professional :

  • Tiny Tiny RSS (TT-RSS) is an RSS reader with very interesting RSS feeds filtering features (open source)
  • Huginn by cantino (open source on GitHub). According to a MakeUseOf article, « this is the most popular of all the GitHub solutions mentioned, and has a huge, active support community behind it. It’s well documented and easy to use »
  • RssPercolator (open source on GitHub). Downloads, aggregates and filters RSS feeds
  • Bipio (open source). See the Getting started page (developer documentation) for a quick presentation. Bipio is a graph pipelining API talking RESTful JSON
  • Neddick (open source on GitHub).
  • Pypes (open source on GitHub)
  • pipe2py (open source on GitHub). You need to backup your YP pipes before. It uses JSON and the Google App Engine
  • Pipes2js (open source on GitHub)
  • Superpipes (open source)
  • WebHookIt Editor (paid for)
  • open source edition of MuleSoft’s Anypoint Studio
  • Quadrigram seems too graphics-oriented to me (apparently free).

Walled gardens

It has to be noted that the RSS implementation will once gain recede with this. If you look into the list of applications which can be connected by CloudWork or IFTTT, you will find that RSS is just one among more than a hundred of mostly proprietary ones ... Walled gardens again.

Did I miss something ? Do you know about any simple tool that could replace the "RSS mashup" function of Yahoo Pipes ? I’m interested in free as well as paid for services.

Emmanuel Barthe
independant law librarian researcher
open law specialist
monitoring solutions specialist


Sources for this article

Here are the links I found to some articles/blog posts and a number of forum discussions about Yahoo Pipes substitutes :

This article was written with the the help of Serge Courrier, a French consultant specialising in RSS readers and the use of RSS feeds for monitoring web sites [7].


Facilité d’utilisation, sécurité, cryptage des données, suite complète ...

Mettre ses fichiers ou ceux d’un groupe dans le cloud : quelle application choisir ?

Google Drive, Box, OneDrive, Dropbox. Mais aussi les outsiders : Mega, SpiderOak, TeamDrive, Tresorit ...

Mardi 16 juin 2015

Lire la suite »

Cet article est le premier d’une série de trois sur les solutions de Cloud. Les deux suivants :

J’ai dû choisir en 2014-2015 la solution de cloud et de travail en ligne à retenir pour un groupe de 15 personnes devant travailler activement ensemble. Il ne s’agissait donc pas seulement de passer en revue les solutions de stockage en ligne mais aussi celles de partage de fichiers et de communication.

La sélection

Ne vous faisons pas languir. Voici les solutions que l’on peut recommander quand on privilégie l’aspect travail en groupe, la gratuité, la richesse des fonctionnalités et le côté pratique (*pas* la sécurité) — pour les arguments détaillés, voir infra :

  • Dropbox pour la facilité d’utilisation
  • Google Drive pour la richesse des outils associés (GMail, Google Groups et la suite bureautique de Google) et pour le prix si on passe en version payante. C’a été notre choix
  • Box pour les fonctions dédiées aux professionnels et l’intégration de Microsoft Office Online
  • OneDrive de Microsoft (ex-SkyDrive), uniquement si on possède déjà la suite Office sur son PC et qu’on est un aficionado MS
  • SpiderOak, Wuala, TeamDrive et tresorit pour la sécurité des données
  • Mega principalement sur le critère du volume de stockage gratuit.

NB : à l’exception de Mega, les solutions supra ne sont pas sécurisées à 100%, c’est-à-dire de bout en bout — du serveur au terminal en passant par la connexion.

Les arguments

Pour m’aider, j’ai commencé par lire la presse et autres ressources Internet, plus ou moins bien référencées par ... Google (voir la webliographie en fin d’article).

Puis avec l’aide d’un informaticien de SSII — pas plus spécialiste du sujet au départ que votre serviteur — je me suis lancé dans des tests. Nous sommes ainsi devenus des quasi-spécialistes du sujet !

Pour résumer ces articles et leurs commentaires y compris :

  • Dropbox est le plus facile à installer et à utiliser, le plus intuitif. Il garde les anciennes versions de vos documents et permet aussi de récupérer ceux supprimés (comme la Corbeille de Windows). De plus, Dropbox et la suite bureautique (version web) Office Online de Microsoft sont devenus interopérables fin avril 2015 (il faut toutefois avoir un compte Office Online d’un côté et de l’autre un compte Dropbox).
    Mais il est moins adapté à un fonctionnement collaboratif
  • Google, Box et OneDrive (Microsoft) sont bien plus complets que Dropbox (et autres concurrents). Pour reprendre la formule d’un article du JDN de février 2014 : « Google et Microsoft ont placé la bureautique et le collaboratif autour du document au centre de leur stratégie, ce n’est pas le cas de Dropbox, un pure player du stockage cloud »
  • A cet égard, la solution de Google offre une suite longue comme le bras de produits, qui plus est gratuits tant qu’on reste en dessous de 15 Go de stockage : messagerie (GMail), liste de diffusion/groupe de discussion (Google Groups), stockage de fichiers en ligne avec possibilité de partage (Google Drive), suite bureautique — avec Google Docs (traitement de texte), Google Sheets (tableur) et Google Slides (présentations, compatibles avec Powerpoint) — mais aussi Agenda, blog (Blogger), photos (Picasa), cartes (Google Maps), réseau social (G+, justement) ...
    Sans oublier que que Drive est en général considéré comme « médaille d’or de la vitesse de transfert [upload] de fichier ».
    Et que l’on peut modifier un document à plusieurs en même temps dans la suite bureautique de Google, mais pas dans Dropbox par exemple
  • Box : 10 Go gratuits, très orienté besoins professionnels et travail collaboratif (possibilité de publier des commentaires et attribuer des tâches sur les fichiers), il offre appli mobiles iOS et Android disponibles. Box est un outsider si on se réfère au nombre d’utilisateurs mais pas si on se situe dans le milieu des services cloud pour professionnels.
    Le seul grand manque qui existait dans cette offre, selon le JDN, pour une solution qui s’adresse aux professionnels, était l’absence d’outils d’édition des documents en ligne, autrement dit de logiciels bureautiques en ligne accessibles directement dans le navigateur web [8] est comblé mi-juin 2015 grâce à un accord entre Box et Microsoft : Office Online (version Web) est désormais intégré dans Box (Office était déjà intégré dans la version PC)
  • OneDrive est recommandé pour les aficionados de Microsoft et ceux qui possèdent déjà la suite bureautique Office sur leur ordinateur. Toutefois, les commentaires mettent en cause sa vitesse de synchronisation sur les divers appareils et sa gestion des noms de fichiers longs ou comportant des espaces. Sur certains aspects fonctionnels et si on considère les offres payantes, l’offre OneDrive Pro de Microsoft est plus évoluée que celle de Google
  • Les outsiders vraiment intéressants :
    • pas sécurisés de bout en bout :
      • Copy : aussi simple que Dropbox, en légèrement mieux mais quelques bugs [9]. Appli Android et iOS
      • Bitcasa : 20 Go gratuits, très cité et apprécié par les particuliers outre Manche même si les journalistes et évaluateurs professionnels ne l’apprécient pas autant. Apps iPhone ou iPad et Android
    • sécurisés de bout en bout :

Tresorit : bientôt une interface pur web selon le service support

Sécurité : chiffrement, mot de passe ... Déterminante ?

Comme l’explique le site de l’éditeur Techniques de l’Ingénieur, « les données stockées sur Google Drive et OneDrive sont chiffrées lors de leur transfert vers les serveurs. Mais une fois dans le Cloud, ces données sont stockées en clair — sauf pour la version professionnelle de OneDrive. Dropbox, Box [et Mega] chiffrent les données stockées, mais détiennent les clés de chiffrement, ce qui leur permet d’accéder aux données des utilisateurs, même chiffrées. » [13]

Seuls SpiderOak, TeamDrive, Wuala et Tresorit, donc, pratiquent le "zero-knowledge data storage" : la clé de chiffrement, le mot de passe n’est pas stocké sur leurs serveurs, ils ne le connaissent pas, celui-ci ne peut donc a priori pas être compromis par des pressions des services des Etats [14] ou par une faille de sécurité de leur côté. La seule chose qui peut empêcher de leur faire confiance les yeux fermés est que le code de leur application n’est pas open source, donc non vérifiable.

Bon, une fois cela dit, le problème de la sécurité, pour diminué qu’il est, demeure : quid de l’ordinateur mal sécurisé et donc hacké ou de l’utilisateur qui utilise un mot de passe faible [15] ?

Et la valeur d’une solution de cloud aux yeux du grand public et des utilisateurs professionnels ne dépend pas que de son degré de sécurité. Loin de là : le critère de choix principal semble être l’ergonomie — on l’a bien vu plus haut — et son écosystème (applications, communauté, développeurs) [16]. C’est dans ce dernier domaine
plus qu’ailleurs, que Google et Microsoft marquent des points.

Les raisons du choix de Google Drive

Pour ce groupe de travail, nous avons donc choisi Google Drive + GMail + Google Groups + sa suite bureautique (Docs, Sheets).

Malgré certaines limites ergonomiques — décrites dans le deuxième article de la série [17] — et son manque relatif de confidentialité, la solution Google a été retenue parce que :

  • "mainstream". Donc une solution établie, ne risquant pas de capoter en cours d’utilisation, et comportant une très importante communauté d’utilisateurs, donc de personnes susceptibles de nous dépanner dans les forums
  • complète  : tout en un ou presque
  • Drive permet le partage de dossiers
  • et mon "collègue" m’a fait remarquer les nombreux problèmes de sécurité de Dropbox (voir Clouds : le diable est dans les détails).

Mais la difficulté au début de nos utilisateurs non informaticiens ni "geeks" à se débrouiller seuls a bien failli nous ramener à Dropbox ... Il leur a fallu 20 mn de formation, un bon mois de pratique et pas mal de conseils par oral pour être tous rodés. Et encore ...

Enfin, si nous avions eu de gros risques de sécurité, nous aurions envisagé Box (version payante), SpiderOak ou Wuala. Cela dit, le code de Wuala, SpiderOak ou TeamDrive n’est pas open source et ne peut donc pas être vérifié. Idem pour Box.

Après les tests et le choix de notre solution, il s’est avéré que parmi les ressources consultées (voir webliographie infra), le tutoriel de Sciences Po a été réellement le plus pragmatique (mais pas tout à fait à jour). En effet, il est le seul à aborder concrètement les possibilités de partage des dossiers entre plusieurs utilisateurs. Le "truc" le plus important qu’il explique est l’utilisation de l’adresse mail d’un Google Group pour partager d’un coup un dossier avec un (gros) ensemble d’utilisateurs Google. L’avantage de partager avec un Google Group est qu’il suffit à l’administrateur du Google Group d’ajouter ou supprimer une adresse GMail pour donner ou interrompre l’accès aux dossiers partagés.

Quelques conseils

- Ne pensez pas que "gratuit", pensez aussi "besoins". Listez vos besoins, notamment sur le partage des fichiers et les solutions de communication au sein du groupe.

- Renseignez vous sur les solutions envisagées. La littérature Internet peut s’avérer suffisante, à condition de mener une recherche approfondie et de beaucoup lire. Quelques discussions en ligne (par mail ou sur un forum) ou IRL [18] vous aideront souvent à trancher à condition de détailler votre question.

- Testez la solution que vous pensez retenir *avant* de travailler dessus. Au moins pendant deux semaines et sur toutes ses fonctionnalités. Surtout si c’est pour un travail en groupe, car dans ce cas vous aurez énormément de mal à revenir en arrière.

- Quelque soit la solution choisie, formez-vous et formez vos utilisateurs. Ce qui peut vous sembler évident semblera invisible ou très compliqué à quelqu’un d’autre. Exemple avec les applications de Google : Drive, GMail ... [19]

Solutions non prises en compte

Note importante : j’ai choisi de ne pas prendre en compte les services suivants :

  • iCloud (ex-mobile.me), exclu tout simplement parce qu’il n’est accessible qu’aux détenteurs d’un matériel Apple (iPhone, iPad, Mac) et que c’est une application de cloud incomplète. Comme le dit un commentaire : « Le but d’Apple est de permettre l’échange de fichiers entre applications iOS ou ordinateurs, pas de vraiment de remplacer ou concurrencer Dropbox » [24]. Pour finir, comme Dropbox hélas, il est la cible d’attaques répétées [25]
  • Amazon Cloud Drive, exclu car incomplet lui aussi. Il ne propose que deux solutions de cloud : une pour les documents et photos et une réservée aux fichiers MP3 des clients d’Amazon. Mais dans le stockage pur, c’est un acteur à considérer. Ceci dit, au vu de certains signes [26], cette situation pourrait bien évoluer à l’avenir.

Webliographie

Pour d’autres solutions de stockage dans le cloud, voyez :


Un Palais de justice sans Internet ?

Accès à Internet dans le futur tribunal de Paris : le débat, les solutions

Mardi 12 mai 2015

Lire la suite »

Cet article a été contribué par Jean Gasnault, que je remercie pour sa participation à ce blog.


Tout a commencé samedi dernier en fin de soirée lorsque un tweet a signalé la mise en ligne de cet article du blog « Crocs de Boucher » de M. Thierry Lévêque (journaliste à l’agence Reuters, accrédité au Palais de Justice, ayant suivi les grands procès de ces 20 dernières années) ayant pour titre « France, 2015 : le tribunal le plus cher et le plus "hype" du monde interdit… l’internet ». La lecture de cet article est édifiante. On y apprend qu’il n’y aura pas d’accès internet dans les salles d’audience. Mauvaise réception de 4G anticipée ? Wifi refusé par le personnel judiciaire au nom du principe de précaution ? Plus efficace : mise en place de système de brouillage.

Pourquoi ? Il semble que la cause en soit le cyberterrorisme. L’attaque dont TV5 a été dernièrement victime et le cyberdihadisme qui a frappé divers sites publics juste après le 11 janvier, prouverait la gravité du danger auquel les réseaux de la Tour-Palais seraient exposés. Donc personne en salle d’audience du futur Palais, y compris les magistrats, ne se servirait plus d’Internet.

Débat

La nouvelle a flambé sur Twitter en moins de six heures, quelques grands noms rencontrés sur le Web juridique : Maître Eolas, Bernard Lamon, Kami Haeri, et d’autres ont multiplié les commentaires critiques et ironiques (pour en lire quelques uns). On doit l’un des plus spirituels à Me Eolas :


D’autres avocats sont venus demander si l’Ordre des avocats de Paris avait été averti de ce choix technologique. Pour l’instant, du côté de la place Dauphine, on ne note pas de réaction. Pas encore.

Préjudices

Pourquoi une réaction aussi vive des journalistes judiciaires et des avocats dit « de Palais » (ou avocats plaidant) ? Pour les comprendre, il faudrait vivre leur vie.

Les journalistes judiciaires, qui connurent leurs heures de gloire au temps de Joseph Kessel puis aux premières heures de la télévision, ont mis à profit les réseaux sociaux pour faire vivre le suivi haletant des procès médiatiques avec des live tweets. Premiers touchés par cette annonce, ils ont réagi plus que vivement par un communiqué officiel : « Fini les live-tweet ou live-blogging qui, rappelons-le, ne sont pas interdits par les textes. Et aucun de nos interlocuteurs n’a été en mesure de nous dire qui était à l’origine de cette demande. » Il est vrai qu’Outre Atlantique la tendance à twitter pendant les procès n’est pas forcément bien accueillie comme on en peut juger par cet article du site américain en e-journalisme Poynter : « Many judges do not agree that courtroom tweets should be permitted ». Que la pratique du tweet en audience puisse avoir besoin d’être canalisée, on n’en disconvient pas, pour autant faut-il la bannir ?

Quant aux avocats, habitués à passer de longues heures en audience, ils avaient progressivement accueilli l’arrivée des portables, mobiles, tablettes comme un miracle technologique : enfin de quoi pouvoir rester relié au bureau, répondre en temps réels à d’autres clients ou bien parfaire ses recherches sur Legifrance en attendant son tour. Et maintenant qu’ils ont intégré cet usage, on voudrait les en priver à partir de 2017 ? Si un magistrat a pu être légitimement condamné pour avoir twitté pendant une audience où il siégeait, doit-on pour autant considérer qu’un avocat n’aurait pas le droit de se servir d’Internet pendant la partie de l’audience qui ne concerne pas son client. L’amalgame semble un peu rapide.

De plus faudra-t-il étendre cette mesure technique à tous les tribunaux de France ? Par mesure d’équité et d’égalité de traitement de tous devant la pratique de la justice ? La plus infime des failles dans l’application strictement égalitaire de ce dispositif dégagerait un fumet d’article 6 (atteintes aux droits de la défense) qui mettrait la CEDH sur la piste des tribunaux français. Personne ne souhaite voir la France inaugurer cette grande réalisation avec une publicité de ce type.

Solutions

Depuis ce matin la presse à son tour y est allé de ses commentaires : Libération, Numérama. Chacun s’interroge. Comment cette mesure a-t-elle être prise avec aussi peu de concertation ? N’y avait-il pas moyen de régler ces questions de sécurité d’une autre manière ?

Pour l’accès à la documentation juridique, il est vrai que d’autres solutions pourraient suppléer cette absence de réseau en embarquant les fonds législatifs et jurisprudentiels en les stockant sur les supports mobiles des avocats. Mais les avocats plaidants ne comptent pas parmi les avocats les plus riches de la profession. Quel financement envisager pour les soutenir ? Et quand bien même, les avocats resteraient privés de l’accès à leur messagerie. Dans l’emballement des moyens de communication moderne, comment parvenir à expliquer aux clients qu’il faut revenir aux pratiques du XIXème siècle ? Dans une Tour-Palais, symbole plus que visible de la justice du XXIème siècle ?

Les grands Cabinets d’avocats vivent dans un contexte technologique tout aussi exigeant : leur réseau, même dans le Cloud, doit être toujours plus impénétrable. Et pourtant, ils doivent fournir à leurs clients un accès internet dans leurs bureaux. La solution la plus pratiquée revient à gérer deux réseaux : un réseau très protégé pour les professionnels au sein de la structure et hermétiquement séparé de ce premier, un deuxième réseau, protégé lui aussi, mais temporairement « sacrifiable ». En cas d’attaque, il est arrêté, nettoyé, remis en état, patché de divers compléments de protection et redémarré.

Une solution de ce type n’était-elle pas envisageable ?

Jean Gasnault
Président de Juriconnexion, association d’utilisateurs de l’information juridique sur supports électroniques.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 25

Dernières brèves