Le crowdsourcing pour indexer les vieux journaux finlandais : un projet de la Bibliothèque nationale de Finlande

Mercredi 23 mars 2011

Digitalkoot est un site finlandais - - qui propose aux internautes de les aider à corriger manuellement le résultat de l’OCRisation des vieux journaux finlandais en...jouant !

Je n’ai pas pu tester, faute de compte Facebook pour me connecter aux deux jeux : Mole Bridge et Mole Hunt [1] (voir les tutoriels vidéos en liens). Ce type d’initiative "indexation pour bibliothèque à la crowdsourcing" a été initié par la Library of Congress américaine, pour indexer des fonds photographiques anciens. C’est la première fois que j’en entend parler en Europe. Cela donnera t-il des idées aux bibliothèques françaises ?

Digitalkoot est un projet commun de la Bibliothèque nationale de Finlande et Microtask. Comme l’explique un article/billet du blog VentureBeat publié au NY Times [2] ainsi que le site de la société finlandaise, Microtask est une plateforme de travail distribué : elle gère des tâches à faire réaliser par une masse d’humains en divisant ce travail en toutes petites tâches (d’où sa raison sociale de Microtask : microtâches). Une fois reçu et vérifié par ses soins, elle renvoie le travail fini à ses clients.

Par exemple, pour le projet
Digitalkoot (en finlandais : Volontaires numériques), Microtask a réuni 25000 voluntaires. La plupart des archives de journaux de la Bibliothèque a déjà été scanné et OCRisé. Le problème est que les ordinateurs ne reconnaissant pas tous les mots. Quand le document initial est de mauvaise qualité, les résultats doivent être corrigés "à la main". Ce qui requiert beaucoup de travail humain.

Pour le moment, en jouant aux jeux de Digitalkoot, on corrige le texte. Plus tard dans l’année, les joueurs pourront aider à structurer les documents et indexer/taguer les images.

Comme l’explique l’article/billet du NY Times, le prix d’une tâche pour Microtask est d’environ 0,0005 dollar US, soit 1 USD par heure. « Chaque tâche prend environ deux secondes », selon le dirigeant de Microtask. Ce prix est un prix de marché pour centres d’appels externalisés. Ils travaillent pendant leurs moments moins mouvementés. Un autre groupe possible de travailleurs peut être trouvé dans les jeux de type "social games". Les "joueurs sociaux" sont souvent heureux de faire de petites tâches en échange de monnaie virtuelle — un travail réel pour de l’argent virtuel. Toutes les tâches sont effectuées par au moins deux personnes différentes, afin de garantir la qualité.

Les critiques de ce type de travail sous-traité font remarquer [3], après tests et études, qu’il ne s’agit que d’une version numérique et en ligne de la chaîne/organisation du travail fordienne.

Autres articles sur Digitalkoot :

Emmanuel Barthe
bibliothécaire documentaliste "geek"

Notes de bas de page

[1Littéralement : Un pont pour les taupes et Chasse aux taupes.

[2Crowdsourcing Startup Microtask Gets Gamers to Do Some Real Work / Mikko Torikka du blog VentureBeat, New York Times, 23 mars 2011.

[3When the Assembly Line Moves Online / Randall Stross, NY Times, 30 octobre 2010.

Répondre à cette brève