Logiciels ou XML ?

Anonymiser automatiquement les décisions de justice : des solutions

Anonymiser à la source est plus facile et moins cher

Mardi 1er octobre 2013, par Emmanuel Barthe // Portails juridiques officiels - Diffusion des données juridiques publiques

Vous êtes une association, un particulier, un organisme, une institution juridique dans un pays en voie de développement. Vous voulez mettre sur votre site les décisions de justice mais sans courir le risque de publier les noms des personnes physiques — ce qui peut être interdit [1] ou préjudiciable. Vous voulez les anonymiser. Pour cela, vous cherchez un logiciel permettant de les anonymiser automatiquement.

Voici une tentative de réponse, après quelques consultations.

En résumé, et contrairement à ce qu’on pourrait penser, si on se donne la peine de "XMLiser" la chaîne de production numérique, anonymiser à la source est plus facile et moins cher.

Anomymiser ex-post

Pour anonymiser a posteriori, on me redonne les solutions payantes Luxid de Temis et Nome déjà citées sur ce blog. [mise à jour au 10 octobre : ajouter aussi la solution développée par Alter Systems pour le stock des arrêts du Conseil d’Etat (voir commentaire infra).]

Voyez aussi :

Peut-être pouvez vous aussi voir si l’Institut de Veille Sanitaire français vous autoriserait à utiliser leur logiciel d’anonymisation et s’il pourrait être adaptable à votre cas.

Anomymiser ex-ante

S’il vous est possible d’encadrer dès la rédaction des décisions les noms des personnes physiques, vous pouvez anonymiser à la source :

  • par des balises XML (invisibles à l’impression / visualisation) définies dans la DTD. Une modification de la feuille de style XSL permettrait alors de ne diffuser que des arrêts anonymisés [2]. C’est la solution du Conseil d’Etat français, la plus rapide et la moins chère in fine
  • voire très éventuellement par des (ou une chaîne de) caractères spéciaux visibles uniques dans le document (exemples : ^ ou ¤ ou %µ*), caractères qu’une macro Word avec des Rechercher et des Remplacer (ou un programme similaire sur tous les docts) pourra utiliser pour nettoyer les documents. Mais l’automatisation par macro ne suffit pas et laisse encore plein de travail humain. Tant et si bien que généralement il vaut mieux tout refaire à la main ...

En effet :

  • il ne suffit pas de caviarder (supprimer les noms), encore faut-il que la décision continue d’être lisible (donc ne pas mettre Monsieur X à toutes les parties, surtout quand il y en a plusieurs avec le même nom)
  • il ne faut pas anonymiser les personnes morales ni les professionnels du droit (sauf quand ils deviennent des parties, ce qui arrive parfois)
  • enfin, l’anonymisation ne suffit pas, il faut dépersonnaliser (retirer adresse, profession rare, fait célèbre ou médiatique, etc.). Cela, aucun rechercher/remplacer ne permet de le faire ...

La solution XML/XSL serait donc clairement à privilégier. Toutefois, l’"XMLisation" de la chaîne de production numérique, quand on part de simples documents Word diversement structurés et de fichiers PDF, est un chantier lourd, long et initialement coûteux.

Merci d’avance de vos retours d’expérience (les commentaires sont ouverts ou par mail), qui permettront d’enrichir ce billet.

Emmanuel Barthe
documentaliste juridique, veilleur, formateur

Notes de bas de page

[1C’est le cas en France.

[2Disclaimer : je ne suis pas un spécialiste du XML. J’en connais les principes.

Répondre à cet article

1 Message

  • Aonnymiser automatiquement les décisions de justice : des solutions 4 octobre 2013 13:28, par Mihai Tanasoiu, Fondateur et Directeur Général d’Alter (...)

    Bonjour,

    Je trouve l’article très intéressant mais je trouve dommage qu’il ne cite pas une solution française qui a été déjà mise en place avec succès par le Conseil d’Etat depuis plus de 9 mois et qui donne d’excellents résultats avec une anonymisation des documents non-structurés. Cette solution a été mise en place par notre société Alter Systems basée à Lyon.

    En voici un court descriptif : http://goo.gl/faeMcJ

    Je reste à votre disposition pour toute information complémentaire.

    Cordialement,
    Mihai

    repondre message