Crowdsourcing

La Bibliothèque nationale de France (Bnf) et Orange ont ouvert le 1er décembre au public une plateforme, www.reseau-correct.fr, pour corriger et enrichir les documents numérisés de Gallica, la bibliothèque numérique de la Bnf, annonce un communiqué du même jour.
 
La numérisation de documents laisse encore trop d’imperfections pour obtenir un document conforme à l’original. Il faut donc passer par une étape de correction manuelle, qui apparaît fastidieuse. Cette plateforme expérimentale, baptisée Correct, est collaborative : différents utilisateurs peuvent désormais détecter, analyser et corriger les erreurs restantes dans les plus de 3 millions de documents que compte Gallica. Dès la mi-2015, lorsqu'un internaute demandera une correction sur un document, celui-ci sera chargé sur la plateforme Correct afin de permettre cette correction.
 
“Nous voulons fédérer les énergies de gens qui ont un intérêt commun pour un document, créer une émulation”, explique Arnaud Beaufort, directeur des réseaux et des services à la Bnf.

Un projet de chercheurs
 
L’enjeu est double: mettre à la disposition des utilisateurs – chercheurs, étudiants, universitaires – des outils intuitifs pour corriger ces documents et déployer des outils automatiques pour superviser la fusion des corrections et vérifier leur qualité.
 
Ce projet de production participative (crowdsourcing), initié au sein du programme d’innovation d’Orange, les “Labs”, a mobilisé sept partenaires: des universités et écoles (l’Institut national des sciences appliquées de Lyon, l’Institut supérieur d’électronique de Paris, les universités Lyon 1 et Paris 8), un réseau social dédié aux entreprises, Jamespot, une société conceptrice d’interfaces pour rendre Internet accessible aux aveugles et aux malvoyants, Urbilog, et une entreprise spécialiste de la numérisation, i2S.
 
Cette initiative prolonge une première expérience de production collaborative entreprise par la BnF et Wikimédia France. Ces derniers avaient signé en 2010 un accord qui permet à tout internaute de participer à la correction de 1400 textes de Gallica tombés dans le domaine public, via Wikisource. Le fait que les corrections faites sur Wikisource ne remontaient pas sur Gallica a montré la nécessité d’inventer une passerelle entre deux entités. Il s’agit d'un des enjeux principaux du nouveau réseau Correct.

Les dernières
actualités