Anonymisation des décisions de justice et consolidation sur Legifrance : Temis, des softs et des hommes
Pour anonymiser la jurisprudence, Legifrance utilise le logiciel Insight Discoverer Extractor de Temis, associé à une "cartouche" (un module supplémentaire de vocabulaire organisé). Temis est un éditeur de logiciels spécialisé dans l’indexation du langage naturel ("text mining") et également fournisseur de Thomson pour son ISI Web of Knowledge, des Editions Francis Lefebvre ou de Press Index.
Ce que la présentation sur le site de Temis ne dit pas, c’est qu’il faut aussi des êtres humains à la Direction des Journaux officiels (DJO) pour traiter ces informations et améliorer la "cartouche". Cet important traitement humain ne suffit pas toujours pour éviter tout problème, on l’a vu, même si les cas sont rares [1].
C’est aussi ce logiciel qui fait une partie du balisage des textes officiels publiés au Journal officiel pour assister la consolidation (base LEGI). Là aussi, il faut aussi des êtres humains. Et ça doit être fait, évidemment, en 48 heures, puisqu’il y a un JO par jour, sauf le week-end.
Emmanuel Barthe
documentaliste juridique