Logiciels, Internet, moteurs de recherche

Dernier ajout : 18 octobre.

Derniers articles

Google Sidewiki

A propos de l’accès libre aux commentaires

Lundi 5 octobre 2009

Lire la suite »

Albert Grego sur la liste Documentation juridique de l’ADBS signale le lancement de Google Sidewiki :

>> Le géant d’internet Google a dévoilé mercredi un nouvel outil, le "Google Sidewiki", qui permet de poster des commentaires sur les sites internet que seuls les autres utilisateurs de ce nouveau service peuvent lire.
Google Sidewiki est une petite fenêtre dans le navigateur qui apparaît sur le côté gauche des sites web et affiche les commentaires laissés par les autres utilisateurs à propos du contenu de la page visitée.
Les messages sont visibles des autres utilisateurs de Sidewiki qui visitent le site. Ces utilisateurs peuvent poster leur propres commentaires à leur tour mais ne peuvent pas modifier les commentaires déjà laissés. <<

Quelques remarques personnelles :

- Google a toujours tenter de capter les avis des internautes à son profit, son algorythme de tri des résultats analyse les liens hypertextes comme autant de recommandations implicites des internautes. Cela depuis 1997.
Deux autres exemples :

  • si vous avez un compte Google (par exemple si vous avez une messagerie Gmail) et que vous êtes connecté à votre compte lorsque vous interrogez Google, vous pouvez "pousser" un site vers le haut de la liste des résultats ou l’en retirer carrément (juste pour vous)
  • Google Map collecte toutes les critiques sur les hôtels et restaurants et en présente de gros extraits sur son interface. C’est de l’extraction substantielle de base de données et c’est limite du côté du droit communautaire et français — mais GG est connu pour ne pas avoir une bonne opinion du droit de la propriété intellectuelle sauf quand elle le protège lui (cf les accords Google Books signés avec les bibliothèques, le projet de transaction GBooks avec les éditeurs et auteurs US et le procès d’Hervé de La Martinière contre Google qui s’ouvre aujourd’hui devant la 3e chambre du TGI de Paris [1]).

- Ne pas mettre en accès libre des commentaires sur un site lui-même en accès libre ... Il y a comme une contradiction pour une firme qui défend l’accès libre aux ressources de l’Internet — pour mieux les indexer et les mettre en cache. Contradiction d’autant plus nette si le site en question permet les commentaires et ils sont nombreux aujourd’hui (cf tous les blogs). A noter que GG lui-même interdit aux autres moteurs et robots/crawlers l’accès à pas mal de ses propres pages : voir la page robots.txt de GG

- J’ai remarqué que souvent, le niveau des comm’ en bas de page des blogs ne vole pas très haut. Comme le faisait remarquer un spécialiste de ce genre de logiciels — Stéphane Cottin, pour ne pas le nommer — sur la même liste, « cela ressemble beaucoup aux procédés "Sticky note" ou "Highlight the Web" déjà proposé par plusieurs services collaboratifs, comme par exemple Diigo. » Pour lui, « [on] ne [peut] pas imaginer combien il est surprenant, quand on a laissé les réglages par défaut de Diigo qui offrent la possibilité de voir toutes les notes publiques, d’aller sur un site ou une page populaires et de les voir ainsi constellés de "bulles" de couleur qui sont autant de notes, généralement sans intérêt ».

Emmanuel Barthe
grand utilisateur de moteurs — on n’est pas à une contradiction près, hein :-)


Google Squared : test rapide

Peu concluant et peu intéressant en droit a priori

Jeudi 17 septembre 2009

Lire la suite »

Je viens de tester Google Squared avec les requêtes "law" (cf image infra, une requête pourtant facile) et "american law", après avoir lu il y a quelques mois un article des Echos sur les nouveautés préparées dans les GG labs. L’article indiquait :

« [Google Squared] vise à rendre exploitable la myriade de données dispersées sur le Web en l’organisant sous forme de tableau. Par exemple, une recherche sur « petits chiens » affiche une liste de noms de races, images à l’appui, avec des indications correspondantes comme la taille des animaux. »

La tentative de classement est extrêmement maladroite dans notre domaine :

  • pas d’exhaustivité des matières du droit américain. Oubli notamment du secteur du droit des affaires, sur-représentation du droit "populaire" (environnemental law)
  • on y retrouve la philosophie habituelle de la plupart des bases de données : tout est à plat, ça donne l’impression que tout se vaut, on mélange les sites web (les sources donc), et les matières, pas de hiérarchie matière ni de valeur.

En fait, il faut *indiquer* à Google des exemples de terme représentatif du domaine — donc faire le boulot à la place de la firme de Moutain View ... — pour obtenir de meilleurs résultats. Voici par exemple ce que j’ai obtenu en décrivant "droit français" avec 5 matières (procédure civile, droit des affaires, etc.).

Wikipedia est massivement utilisé par GG Squared.

Certes, GG Squared est une version expérimentale. Mais bon, je ne vois pas trop sa pertinence ni ce qu’on peut en faire en droit. Enfin ... si des lecteurs ont des idées, merci d’avance pour leurs commentaires.

Emmanuel Barthe
documentaliste


Google Books : la BNF confierait à Google la numérisation d’une partie de son fonds

Mercredi 26 août 2009

Lire la suite »

Selon la Tribune du 18 août 2008, la BNF confierait à Google la numérisation d’une partie de son fonds. Comme diraient les juristes, ce serait là un revirement de jurisprudence ...

L’argent, comme toujours, est le nerf de la guerre et la programme Gallica en manque cruellement, comme le rapportent tant la Tribune précitée que le Canard du 26 août : 6 millions d’euros par an contre un besoin de 75. Sans commentaire.

Jean, sur la liste Juriconnexion, cite la Croix :

« L’ancien président de la Bibliothèque nationale de France Jean-Noël Jeanneney juge "dérisoire" l’argument financier avancé pour justifier les discussions en cours avec le moteur de recherche américain Google pour la numérisation des fonds de la BNF. [...]
Dans un communiqué, le ministre a souligné le 19 août qu’"aucune option ne saurait être privilégiée en l’état actuel des réflexions en cours" et réaffirmé sa volonté "d’inscrire la numérisation du patrimoine culturel de l’Etat dans une stratégie globale". »

Le communiqué du Ministre de la Culture :

« Pleinement conscient de l’importance des crédits qui doivent être mobilisés pour poursuivre et amplifier cette politique culturelle, le Ministre rappelle qu’aucune option ne saurait être privilégiée en l’état actuel des réflexions en cours. »

A mon humble avis, vu que les crédits de Gallica ne sont pas à la hauteur depuis des années — et pas plus ceux d’Europeana — ces précisions ministérielles ne changeront pas grand’ chose. La Bibliothèque municipale de Lyon, une des plus importantes bibliothèques françaises de par son fonds ancien, a déjà choisi, elle.

Et pendant ce temps, pas grand’ chose en e-books du côté des éditeurs français. Quelques plateformes globales peu recherchées, c’est tout. Pas d’initiative à la Amazon/Kindle.

Emmanuel Barthe
documentaliste


1 | ... | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | ... | 30

Dernières brèves