Logiciels, Internet, moteurs de recherche

Dernier ajout : 4 août.

Derniers articles

La réalité virtuelle en 2D des applis de cartes n’est pas la réalité ...

Quand Google Maps et l’appli RATP sont dans les choux

... mais vise à le devenir

Vendredi 20 octobre 2017

Lire la suite »

Ce mardi 17 octobre 2017, il est 10h35 quand je consulte Google Maps sur mon smartphone pour aller de l’Etoile au 1 rue d’Astorg dans le 1er arrondissement à Paris.

GMaps et RATP peuvent vous mettre en retard si vous les prenez à la lettre

Voici les deux options principales que l’application Android de GMaps me propose :

  • prendre le RER A puis la ligne 9 : durée annoncée 17 mn
  • prendre le métro ligne 1 puis changement à Franklin Delano Roosevelt pour la 9 : durée annoncée 19 mn.

Bien que je sache qu’en règle générale le métro est plus rapide que le RER sur les courts trajets, les deux minutes d’avance du trajet par le RER m’attirent. Je choisis le trajet annoncé à 17 mn.

La durée réelle du trajet fut de ... 35 mn, soit le double du temps prévu par l’application. 95% d’erreur.

J’aurais dû méfier : en zoomant sur le trajet RER + ligne 9, je me rendrai compte que GMaps me fait sortir à Auber pour ensuite *revenir en arrière* par la 9. Ce qui est généralement absurde — et l’était dans le cas présent : il valait mieux carrément sortir à Auber et finir à pied (ça, GMaps ne le proposait pas). Cela aurait dû me mettre la puce à l’oreille.

Autre cas : le 20 novembre 2018 à 17h31, je pars de la rue de Tillsit près de l’Etoile pour me rendre rue d’Astorg dans le 8e arrondissement. GMap me donne 16 mn par le RER A et 25 mn à pied. Eh bien, il me faudra 30 mn par le RER A. J’aurais probablement mis le même temps à pied !

Une cause possible de ce type d’erreur réside à mon avis dans le fait que dans le Métro, on capte très mal Internet. Google ne peut donc pas s’appuyer sur une énorme base de données de trajets réels (passés ou en cours), base qu’il a en revanche à sa disposition sur les routes [1].

Les estimations de temps de trajet de l’application RATP ne sont guère plus réalistes. Les retards fréquents des métros et bus, surtout quand on en prend trois ou quatre d’affilée pour arriver à son travail, font passer (cas vécu) une durée théorique de 1h15 du Pré-Saint-Gervais à la Faculté libre droit d’Issy-les-Moulineaux à une durée réelle de 1h30-1h45 en moyenne [2].

L’avantage de l’appli RATP, toutefois, est de signaler les perturbations de trafic. Ce que Maps ne fait pas ni ne prend en compte.

Au final, en terme d’estimation du temps de trajet, il est plus efficace d’avoir mémorisé des temps de trajet moyens réels et de consulter un plan papier ou PDF du réseau RATP. En revanche, cela peut prendre 2 à 3 minutes de plus que GMaps. Mais on regagne largement ces quelques minutes perdues par un temps de trajet effectif soit raccourci soit mieux estimé. De toute façon, même utiliser GMaps prend du temps : sortir son portable de la veille, allumer le GPS, attendre qu’il se connecte, taper l’adresse de destination, lancer la recherche consulter les résultats, faire un choix ... Tout cela représente généralement entre 1 et 3 mn.

Moralité : une marge de sécurité de 25 à 30% minimum, du bon sens et de l’expérience sont nécessaires si vous voulez correctement estimer votre temps de trajet en transports en commun sur l’Île-de-France avec ces deux applications pourtant connues de la plupart des internautes.

Autres limites

On peut par ailleurs signaler d’autres problèmes fréquents sur Google Maps :

  • sur Paris, la durée prévue par Google Maps pour effectuer un changement et prendre une correspondance est systématiquement de 2 mn. Tout habitant de l’Île-de-France sait que ce n’est pas réaliste. Les couloirs interminables des grandes stations de métro, pour ne pas parler de celles de RER, ne permettent pas de tenir ce temps. Et puis il y a le métro raté à quelques secondes prés, qui fait que là où théoriquement ça aurait dû prendre 3 mn, ça va en prendre 5. Il y a les personnes qui ne peuvent pas courir. Etc. Le temps réel mis dans le cas supra pour changer de la ligne A à la ligne 9 du Métro à la station Auber a été de 10 mn. Pas de 2 mn
  • avec le RER : quand GMaps vous pousse à prendre un RER au lieu du métro ou d’une autre solution. Il suffit de rater d’une minute le RER en question pour devoir attendre le suivant 10 mn, ce qui décale tout le reste du voyage
  • avec le bus : GMaps ne connaît pas les horaires des bus de banlieue. L’appli RATP, elle, les connaît
  • si le trajet (les petits ronds bleus) passe par une longue portion de rue, les petits ronds bleus recouvrent le nom de la rue sur l’application Maps. Résultat paradoxal : il est impossible de lire le nom de cette rue sur la carte
  • si on cherche des restaurants ou des hôtels ou tout autre type de lieu sur GMaps et qu’on se déplace sur la carte, les points rouges signalant ces lieux n’apparaissent souvent pas sur la nouvelle portion de carte. Alors, on recommence la recherche, on s’énerve ...
  • sur Maps comme chez Yelp, La fourchette.com, Resto-in, TripAdvisor et les autres annuaires d’entreprises bien connus, bien des évaluations et les notes qui vont avec laissent rêveur
  • hors des grandes agglomérations, de nombreux erreurs et problèmes existent sur Maps :
    • un chemin censé permettre de traverser une voie ferrée est en réalité barré par une grille et la porte dans la grille est fermée à clé
    • en forêt et en montagne, des chemins marqués sur la carte GMaps n’existent pas. D’autres, non marqués sur GMaps, existent. Les cartes IGN sont cent fois plus riches et plus précises ... Mais hélas chères dès qu’on commence à s’équiper sérieusement et peu ergonomiques en version numérique. Google aurait intérêt à prendre à nouveau une licence IGN et à la garder cette fois, pour les mises à jour
    • des territoires revendiqués par deux structures étatiques concurrentes mais dont les revendications sont toutes deux légitimes, sont attribuées à une seule de ces deux structures
    • les cartes interactives dans les zones de campagne, forêt et montagne exigent que le GPS soit allumé la plupart du temps. La consommation d’électricité est alors telle que la batterie de mon OnePlus 3T, pourtant connu pour son excellente autonomie, s’épuise en trois heures d’utilisation continue.

La carte n’est pas le territoire ... mais pourrait le devenir

Plus fondamentalement, particulièrement quand je me promène en touriste, je ne peux pas apprécier une ville si je passe la moitié de mon temps à la regarder à travers un plan interactif. Je tiens à continuer à y déambuler à pied ou à vélo. Pourtant, chacun constate le nombre croissant de gens qui marchent en ne regardant rien d’autre que leur écran et n’entendent rien de leur environnement sonore, les oreilles bouchées par leurs écouteurs. Tiens ! Votre serviteur aussi, quand il écrit ce billet, marche les yeux sur son écran ...

Google Maps, YouTube, Facebook, Snapchat et autres interfaces numériques sont en train de redéfinir non seulement l’information que nous recevons (Maps est de fait, entre autres, un moteur de recherche local) mais aussi ce que nous voyons et faisons de la réalité physique et humaine qui nous entoure. Et je ne parle même pas de la réalité virtuelle (VR).

Et ni les particuliers ni les responsables politiques n’ont grande prise là-dessus.

Seules peut-être les entreprises. Si leur budget communication, marketing et publicité le leur permet. Voyez par exemple la recherche d’un restaurant sans autre précision dans le 17e puis dans le 8e à Paris sur Google Maps : toujours en tête de la liste, quelque soit l’arrondissement et quelque soit sa note, Hippopotamus. Tiens donc !

Emmanuel Barthe
usager des transports parisiens et des services Google


Supra Legem, un exemple de machine learning appliqué au droit

Entretien avec Michael Benesty, 8 mars 2017

Dimanche 18 juin 2017

Lire la suite »

Le site Supra Legem, tenu par le juriste et ingénieur machine learning Michael Benesty [3] [4], nous en apprend beaucoup sur la (soi disant) "intelligence artificielle" en droit. En le testant, on comprend que les fameuses "IA" en droit sont en réalité des moteurs de recherche évolués, dopés à l’apprentissage statistique automatique, dit "machine learning" (ML) [5].

Pour rédiger mon article sur l’IA en droit, j’ai eu besoin de mieux comprendre le machine learning et le fonctionnement de Supra Legem. Michael Benesty a accepté de me l’expliquer. Le billet infra résulte des notes prises pendant cet entretien.

La recherche dans Supra Legem : ce qu’apporte le ML

Jetez un coup d’oeil sur l’interface de recherche de ce moteur de recherche et d’aide à la décision [6].

Le principal intérêt de Supra Legem pour un utilisateur juriste sont les deux filtres suivant, disponibles dès la page d’accueil dans la colonne de gauche :

  • filtre défendeur demandeur : l’intérêt majeur de ce filtre en droit administratif : il permet de cibler les affaires où une décision de l’administration est mise en cause. Si on ajoute que lorsque l’administration a pris la décision initiale, elle défend toujours le statu quo, ce filtre permet de connaître d’office le sens de la question, quelque soit le niveau de l’instance [7] : c’est pour ou contre l’administration/sa décision
  • filtre sur le dispositif : permet de cibler, parmi les décisions où l’administration est demandeur (on a paramétré ça dans le filtre précédent), celles où l’administration perd. Si par contre, l’administration est en défense, un avocat n’aimera pas ça car ça ne va pas dans son sens. Il préférera les cas où l’administration est en demande et perd. Pourquoi ce réglage ? Parce que cela signifie que tous les moyens [8] qu’elle a soulevés ont été vains et donc que l’avocat, qui défend en général une société privée ou un particulier, a intérêt à éplucher les arrêts trouvés ainsi à la recherche des situations correspondantes et des arguments utilisés par le défendeur. Ce type d’arrêt est rare [9] et difficile à faire remonter, d’où l’intérêt de ces deux filtres de SupraLegem.

Entre parenthèses, ce serait la même logique en droit privé du travail (on serait hors droit public, donc sur une IA autre que Supra Legem) : employeur c/ employé, le licenciement est toujours du fait de l’employeur

M. Benesty précise qu’en droit judiciaire, notamment en droit civil, ce type d’approche est plus compliqué.

Pour aller plus loin, voir le billet 6 façons d’utiliser les algorithmes prédictifs pour améliorer vos recherches de jurisprudence, par Michael Benesty, Blog de Supra Legem 6 mai 2016.

Précisions importantes sur les apports du ML

En machine learning, les points de départ suivant sont très importants :

  • la jurisprudence en droit administratif est "propre". Tout est rédigé de la même façon : le vocabulaire, et surtout le plan de la décision très systématique. Par exemple : en droit administratif, les faits ne viennent jamais au milieu de la décision, contrairement au droit judiciaire où des rappels peuvent apparaître dans tout le corps de la décision ; de la même façon, le droit administratif ignore le problème des moyens supplétifs
  • en matière de reconnaissance d’image [10], les réseaux neuronaux ont permis en quelques années de passer de 40 à 5% de taux d’erreur (certains en sont à 3%).

En ML en droit on est plus dans le NLP (traitement du langage naturel) [11]. Les réseaux neuronaux du deep learning, qui font souvent la une dans la presse spécialisée, réduisent le traitement des données en amont [12] et on peut faire avec eux des choses plus génériques mais leur apport en droit est très inférieur à ce qu’ils ont fait pour la reconnaissance d’image. De plus, ils coûtent très cher en temps (parfois plusieurs semaines de calculs sont nécessaires, cela a été le cas avec le nouveau service de traduction mis en place en 2016 sur Google Translate [13]) et puissance de traitement [14].

NLP : le ML appliqué au langage

Le NLP d’aujourd’hui, c’est l’application du ML au langage (ce n’est pas, malgré son nom, la compréhension par la machine du langage naturel) : Depuis quelques temps l’algorithme non supervisé Word2vec a changé la façon d’approcher les apprentissages :

  • créé par Google puis mis par lui en open source ; il y a deux ans Google l’a utilisé dans les algorithmes de son moteur de recherche web sous le nom de RankBrain, qui est maintenant le 3e signal en importance dans le ranking du moteur de recherche web de Google et facilite la lutte contre le spamdexing
  • on lui donne du texte brut il remplace chaque mot par un vecteur/représentation, formalisée par une suite de chiffres sans signification pour un humain. L’idée derrière : retrouver le sens d’un mot en observant la distribution des contextes : le mot chien sera souvent accompagné de poil, chat, museau ... Il trouve ainsi tout seul les mots similaires parce que leurs vecteurs sont similaires. On peut aussi demander des syllogismes à l’algorithme : roi -> reine, homme -> il va trouver femme
  • Michael Benesty utilise la variation de Word2vec développée par Facebook
  • selon lui, Word2vec est :
    • très bon en sémantique. Word2vec est super bon pour trouver les cohyponymes (frères et soeurs de la racine sémantique de termes)
    • mais n’inclut pas d’informations de nature logique (ex. beau et moche ont des vecteurs similaires ... !).

La recherche en ML essaie cependant de faire de la logique : le taux moyen d’erreur est de 40% actuellement sur une tâche de role labelling, c’est à dire trouver dans un texte qui fait quoi. En pratique, ça se termine donc souvent en regex (il est très fréquent que les performances annoncées soient en fait le résultat de ML amélioré par des règles plus ou moins simples mises au point par un humain).

ML et droit des données personnelles

Le règlement général européen sur la protection des données personnelles (RGPD) [15] entre en application en 2018 [16]. Il donne à une personne physique le droit de demander à quelqu’un qui pris une décision ayant un effet légal fondé sur un algorithme d’expliquer et justifier sa décision. Vu la difficulté, même pour les développeurs ML, de comprendre comment l’algorithmes aboutit au résultat, cela va poser de sacrés problèmes si les juges et les forces de l’ordre se reposaient lourdement sur l’IA. Certains juges et avocats redoutent que des magistrats, par peur de rendre une décision qui sera cassée, pourraient se conformer à la tendance qu’une IA aurait révélée.

ML et discrimination

Comment expliquer la discrimination policière (surveillance policière, arrestations) et judiciaire (application des peines) causée au Etats-Unis par le machine learning ? En fait, les algorithmes ML renforcent la discrimination parce que le machine learning optimise — dans le bon comme dans le mauvais sens — les biais des humains [17]. Le ML a tendance à reprendre et aggraver ces biais parce que c’est une technologie ultra dépendante des données qu’on lui fournit.

Au point que Michael Benesty recommande de faire travailler l’algorithme dans cet ordre : d’abord lui donner des bases de données de textes éloignées du sujet sur lequel on veut le spécialiser puis se rapprocher progressivement et terminer avec des textes pile sur le sujet (ex. ici en droit commencer par la base Gutenberg puis terminer par Legifrance). Il sera ainsi meilleur sur le sujet que si on lui avait fait "manger" les bases de textes dans le désordre.

Emmanuel Barthe
bibliothécaire documentaliste juridique
testeur de bases de données


Simple Notepad de Mighty Frog - Une app pour écrire partout, tout le temps, tout simplement

Efficace, sans fioritures, malin : une véritable application de productivité

Jeudi 15 juin 2017

Lire la suite »

Mighty Frog : Puissante Grenouille. Non, ce n’est pas totem scout :-) Ce français-là ("frog") [18], le développeur de l’application Android Simple Notepad, n’est peut-être pas exactement puissant ("mighty"), mais son appli est extrêmement efficace ("powerful").

Simple Notepad : l’interface d’accueil : la liste des documents

Simple Notepad est une application de prise de note et de rédaction à la fois simple et puissante. Elle combine des fonctionnalités et des qualités habituellement incompatibles :

  • facilité d’utilisation : on ouvre l’appli, on touche l’icône crayon et on peut écrire. L’enregistrement est automatique, l’attribution du nom de fichier aussi. Même si vous sortez du logiciel, même si vous passez sur une autre app, Simple Notepad n’oubliera jamais d’enregistrer vos notes
  • lisibilité : ce n’est pas un détail : la mise en page est sommaire (par défaut : police Arial noir sur fond blanc) mais parfaitement lisible. Le geek que je suis, travaillant sur écran les trois quarts du temps et parfois obligé de porter ses lunettes, ne se fatigue jamais avec Simple Notepad
  • richesse des fonctionnalités. Si on veut juste taper son texte, on tape son texte. Facile. Mais si on veut plus de fonctionnalités (sans aller jusqu’à la mise en page ni toutes les nuances des polices de caractère), on peut :
    • protéger un fichier en le mettant en lecture seule, en masquant son titre dans la liste des fichiers, par un mot de passe ou encore par le modèle de verrouillage du smartphone
    • se mettre un rappel qu’on doit reprendre un document pour le finir
    • ajouter des images au document
    • créer un raccourci (avec une icône) sur le bureau de son smartphone
    • ajouter tout le texte dans un rendez-vous dans son agenda
    • exporter ses documents au format TXT (le format texte le plus basique, celui du Bloc-Notes de Windows, celui que tous les traitements de texte savent lire).

Les fonctionnalités de tri et de recherche

Simple Notepad possède bien d’autres fonctionnalités : par exemple, on peut aussi colorier les titres des documents pour mieux les repérer. Etc. Pour en savoir plus, lisez cet article (en anglais) publié en 2012 déjà sur le célèbre site américain Makeuseof : Secure and really simple note taking with Simple Notepad, par Saikat Basu.

Côté défauts, il n’y en a que trois :

  • pas de sauvegarde automatique dans le cloud. Il faut donc penser à exporter régulièrement ses notes (ça prend quelques secondes) puis à les transférer sur son cloud (Google Drive etc.).
  • la recherche de mots-clés dans les notes ne fonctionne pas
  • dans les listes, quand on veut cocher une case à cocher, on n’y arrive pas, on se déplace verticalement (en fait, il faut taper sur le titre, mais c’est contre-intuitif).

Je n’ai pas l’habitude de faire de la publicité (dans le bon sens du terme : rendre public) pour une appli pour smartphone. De même que le Web gratuit est selon moi essentiellement vide [19], 90% des apps ne sont pas des logiciels rendant un véritable service, des "outils de productivité" comme on dit. A part les apps de gestion d’agenda et de tâches (Trello etc.), les apps de messagerie (Gmail etc.) et quelques rarissimes apps de bureautique et SGBD, voire de retraitement d’image (PhotoCompress etc.), on est dans le gadget et le passe-temps à fond la caisse.

Eh bien pas là. Pas Simple Notepad. C’est une app extrêmement utile. Qui fait réellement gagner du temps. Qui simplifie la vie. Pour tout vous dire : non seulement je gère mes listes de courses sur Simple Notepad :-) mais ce billet et bien d’autres ont été écrits avec. J’allais oublier : elle est gratuite et sans publicité.

Emmanuel Barthe
geek et rédacteur sur Internet depuis 1997 [20]

Simple Notepad : le menu Paramètres

Le menu Outils de Simple Notepad

Le menu Outils


1 | ... | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | ... | 36

Dernières brèves