Appuyez sur Entrée pour voir vos résultats ou Echap pour annuler.

Data.gouv.fr : premières impressions

Suite au lancement ce matin du site Data.gouv.fr, les Echos ont regroupé des réactions sur Twitter.

Voici les tweets que j’ai retenus — dans le billet des Echos et ailleurs :

@btabaka : Deux entreprises publiques ouvrent des données : RFF et la SNCF (localisation des gares, passages a niveau, etc.) #opendata

Deux seulement. Les autres données étaient déjà disponibles, donc.

@btabaka : S. Naudet espère doubler le nombre de jeux de données disponible sur Data.Gouv.Fr d’ici l’année prochaine #opendata

Mais ça devrait augmenter, donc.

@logisima : #opendata, #etalab vient de sortir : pas de dataviz, pas d’API, pas de fonctionnalités web 2, une recherche pauvre. Bref rien qu’un CMS.

En effet, des opérateurs booléens (OU, SAUF, parenthèses) ne feraient pas de mal dans l’interface de recherche avancée. Ah oui, c’est vrai, seuls 1% des gens s’en servent. Eh oui, mais ce seront des "data analysts", des chercheurs et des documentalistes ... Autrement dit, ceux qui vont en faire l’utilisation la plus poussée.

Beaucoup de données au format CSV (tableur). Sans formation avancée à Excel, ça ne va pas être facile (bon, personnellement je sais faire un tableau croisé dynamique).

@dataveyes : #opendata 350 000 jeux de données, 817 jours de dev, 691 624 lignes de codes et 25 serveurs pour data.gouv.fr by @Etalab

@logisima : #opendata, #etalab : petit rappel du budget pour le portail -> 1,65 millions d’euros pour le site (src : http://bit.ly/ug3bxy)

@btabaka : S.Naudet : de la logique de demande, on passe a une logique d’offre, importante et ambitieuse #opendata

Bref, du pain béni pour les éditeurs, les producteurs de bases de données, les analystes et les gens bien formés à Excel, qui sauront, eux, comment intégrer, reformater et valoriser ces données presque toutes gratuites [1]. Pour les autres, ce sera moins évident. D’autant qu’une connaissance préalable, une certaine familiarité avec ces données est le plus souvent nécessaire.

Au fait, un des "data sets" les plus recherchés d’après le site est le catalogue de la BNF en format sémantique (très précisément, il s’agit des données RDF de data.bnf.fr). Il est en Licence Ouverte/Open Licence (obligation, notamment, de mentionner la source). 25 Mo à télécharger au format compressé ZIP.

Rappelons que ce site est une application (avancée) de la directive sur la réutilisation des informations du secteur public de 2003.

Au plan des buts, il est question de création d’activité et d’emplois [2]. Comme pour la directive base de données [3], j’ai peur que le bilan dans 10 ans soit beaucoup moins optimiste, en partie parce qu’une révolution culturelle ne se décrète pas. Et en partie parce que les producteurs franco-français et aussi européens de bases de données sont une minorité.

Espérons tout de même une heureuse surprise. L’industrie européano-européenne des bases de données en aurait besoin.

Emmanuel Barthe
documentaliste juridique, "data analyst" quand il le faut

Notes

[1Sauf les établissements ayant besoin de vendre leurs données pour financer leur activité, comme la Réunion des Musées Nationaux, l’IGN ...

[2Voir la fin de cette interview de Séverin Naudet.

[3Extrait clé de l’évaluation de la directive bases de données de 1996, rédigée en 2005 : « There has been a considerable growth in database production in the US, whereas, in the EU, the introduction of "sui generis" protection appears to have had the opposite effect. »