La documentation juridique

Dernier ajout : 2 septembre.

Derniers articles

Droit du producteur de base de données : une deuxième limite

Pour que la protection s’applique, l’extraction doit être préalablement et clairement interdite

Mardi 29 mars 2005

Lire la suite »

Un arrêt de la Cour d’appel de Versailles du 18 novembre 2004 [1] soumet à mention préalable le droit d’interdire l’extraction d’une base de données. Concrètement, ici, une "base de données" correspond à tout ensemble organisé de fichiers, y compris un site web. Et ce que signale cet arrêt, c’est que si le producteur de la base de données (pour un site web, il s’agit de son auteur/webmestre ou de la société qui possède le site) ne manifeste pas sa volonté d’interdire les extractions, il ne sera ensuite pas fondé à agir en cas d’extraction — fût-t-elle substantielle, comme par exemple la totalité d’un site — du contenu de sa base de données par un tiers.

Les textes communautaires et français sur le droit du producteur de base de données sont ainsi rédigés qu’on pouvait s’attendre à un tel arrêt — qui met comme condition à l’application du droit sui generis l’expression prélable d’un refus des extractions substantielles — depuis longtemps. On pouvait même s’étonner qu’aucune décision n’avait été encore publiée sur ce point.

Le passage-clé de la décision est le suivant : « Ce droit consiste en la possibilité reconnue au producteur d’une base de données d’interdire qu’il soit procédé par autrui à l’extraction par transfert du contenu de ladite base de données sur un autre support ou par la réutilisation par la mise à la disposition du public de la totalité ou d’une partie qualitativement ou quantitativement substantielle du contenu de la base, quelle qu’en soit la forme. L’incrimination pénale visée par la citation directe de Rojo R. suppose donc que le producteur qui se dit lésé ait préalablement interdit l’extraction du contenu de sa base de données, faute de quoi cette dernière ne disposera pas de la protection instaurée par la disposition pénale citée plus haut. »

La mention préalable, condition imposée par le droit français

Si on suit la Cour, cela résulte donc d’une interprétation par raisonnement a contrario des art. L 342-1 et L 342-2 du Code de la propriété intellectuelle (CPI). Le premier de ces deux articles commence en effet par : « Le producteur de bases de données a le droit d’interdire [...] ». Et le second par : « Le producteur peut également interdire [...] ». Si le producteur a le "droit d’interdire" ou "peut interdire", c’est qu’il peut aussi *ne pas* interdire. S’il peut soit interdire, soit ne pas interdire, l’application de son droit sui generis n’est donc pas automatique mais dépend — notamment — de sa volonté. Le producteur est donc censé avoir préalablement et de manière relativement claire "interdit" les extractions substantielles et/ou systématiques et anormales pour que son droit sui generis s’applique.

Certains répliqueront que l’art. L 341-1 CPI dit, lui, que « Le producteur d’une base de données [...] bénéficie d’une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d’un investissement financier, matériel ou humain substantiel ». Ici, pas de condition consistant à positivement interdire, à exprimer l’interdiction (voire à interdire implicitement ?). La protection, vue à travers cet article L 341-1, pourrait donc sembler préexister à toute interdiction exprimée et ne découler que du critère de l’investissement.

Oui, mais justement, les art. suivants L 342-1 et L 342-2 posent à la fois la condition de l’acte d’interdire (« peut interdire », « a le droit d’interdire ») *et* les conditions de substantialité ou d’anormalité associée au caractère systématique. Ce qui indique que l’art. L 341-1 ne fait donc que poser une première condition, il ne les donne pas toutes. On peut donc soutenir qu’il faut explicitement — voire implicitement, mais en tout cas pas a posteriori — interdire les actes d’extraction massive pour que la protection s’applique.

Il reste un argument, défendu par Tatiana Sinodinou [2], qui cite Frédéric Pollaud-Dullian : le droit sui generis est un droit d’auteur, or un des principes généraux des contrats en droit d’auteur est que « tout ce que l’auteur n’a pas expressément cédé, il l’a conservé. »

La mention préalable, condition imposée par le droit communautaire

Il semble qu’on ne puisse pas non plus prétendre que la directive 96/9 du 11 mars 1996 concernant la protection juridique des bases de données a été mal transposée. En effet, voici ce qu’elle dit :

  • considérant 56 : « droit d’empêcher l’extraction et/ou la réutilisation [...] »
  • « Chapitre III Droit "sui generis"
    Article 7 Objet de la protection
    1. Les États membres prévoient pour le fabricant d’une base de données le droit d’interdire l’extraction et/ou la réutilisation de la totalité ou d’une partie substantielle, évaluée de façon qualitative ou quantitative, du contenu de celle-ci, lorsque l’obtention, la vérification ou la présentation de ce contenu attestent un investissement substantiel du point de vue qualitatif ou quantitatif. »
    C’est moins net que dans la transposition française, mais la notion de "droit d’interdire" suppose aussi le droit de tolérer.

En résumé, la directive et le Code ne disent pas : « Il est interdit de » mais « Le producteur peut interdire ». Par suite, il peut tolérer, et par conséquent il doit préalablement et clairement interdire.

On peut encore discuter si cette interdiction peut être implicite et jusqu’à quel point. La cour d’appel, en tout cas, semble estimer qu’elle doit être relativement claire voire expresse, puisqu’elle écrit : « Il n’est, en l’espèce, aucunement allégué par la partie civile qu’une telle interdiction ait été *émise* [je souligne] par Rojo R. »

Pour plus de détails sur les conditions de mise en oeuvre du droit sui generis, lire les paragraphes que j’ai écrits sur les extractions à propos des panoramas de presse à base de liens hypertextes et cet article pour la mise à jour avec l’arrêt BHB de la CJCE.

Emmanuel Barthe


Intérêt et limites des annuaires et portails juridiques

Dépassés par les moteurs de recherche, les annuaires en restent le soubassement indispensable

Lundi 7 février 2005

Lire la suite »

Beaucoup de bibliothèques, de documentalistes et d’organismes ont développé des annuaires de sites web juridiques pour guider leurs lecteurs et utilisateurs vers les meilleurs pages et sites web.

Aux débuts du Web, les résultats des moteurs n’étaient pas pertinents, car uniquement basés sur le texte intégral des pages web. Google et son classement par pertinence basé sur les liens hypertextes (le "PageRank") n’existaient pas. Les annuaires étaient lors incontournables et très utiles. Toute recherche
sur un des meilleurs moteurs de l’époque (AltaVista, Hotbot) devait être complétée par la consultation d’un annuaire.

Les défauts des annuaires juridiques français

Aujourd’hui, les annuaires de liens ont perdu beaucoup de leur intérêt. Pourquoi alors en ai-je commis un moi-même ? Parce que, s’ils sont réalisés dans une optique différente de celle de leurs débuts, ils peuvent encore aider à la recherche sur le Web. Cette optique, c’est sélectionner et enseigner, au lieu de chercher seulement à être exhaustif.

Mais restons dans notre spécialité : les sites juridiques français. Ce qu’on peut reprocher aujourd’hui aux annuaires de liens juridiques français, c’est :
- le manque de sélection des ressources : des annuaires comme [la Porte du droit-http://www.laportedudroit.com], Droit francophone ou le Juriguide listent entre 2000 et 3500 sites, dont certains plus ou moins juridiques. Alors qu’on peut estimer qu’il n’y a guère qu’environ 500, peut-être 600 sites juridiques français fiables et doté d’un contenu de qualité, des sites de spécialistes du droit (avocats notamment), d’institutions (Conseil de la concurrence, ...), des éditeurs (payants) et de e-zines (Juriscom, ...)
- le nombre important de liens en erreur 404 et les descriptions souvent un peu dépassées, le tout venant de la faible fréquence des mises à jour, découlant elle-même du nombre très (trop ?) important de liens
- pour des annuaires qui tiennent à tout référencer, les défauts des classifications utilisées :

  • manque de sous-catégories et/ou de tri. Avec quelques milliers de sites, ces manques deviennent criants : chez la Porte du droit ou Droit francophone, une même catégorie peut contenir plus de 200 liens en vrac, pas même triés. Exemples :
    Droit francophone > Doctrine > Vulgarisation du droit : 227 sites
    La Porte du droit > Social et Prud’Hommes : 170 sites
    Je tombe moi-même parfois un peu dans le piège : Internet juridique > Droit français > Propriété intellectuelle, communication, informatique, Internet et commerce électronique : 31 sites seulement mais je pourrais sans problème subdiviser en Communication, Informatique et NTIC et enfin Propriété intellectuelle
  • le manque de pertinence/caractère trop universitaire des catégories.

Le Juriguide, lui, échappe au manque de sous-catégories et son classement me semble pertinent, mais il est matériellement impossible à la petite équipe du Village de la Justice de passer leur temps à vérifier les liens. Heureusement, le webmestre du Juriguide précise pour chaque lien la date de son ajout à la base. Ceci compense cela et au total, le compromis retenu pour la réalisation et la mise à jour du Juriguide me semble relativement efficace.

Le recul général des annuaires

En plus de ces défauts, les annuaires et portails ont perdu la compétition qui les opposait aux moteurs de recherche. Le combat ne laisse que trois survivants : Google, Yahoo Search et le nouveau moteur en version bêta (test) de Microsoft (version de production prévue pour début 2005). Comme le notaient deux articles publiés fin 2003 dans l’excellente revue américaine Searcher [3], les internautes ont voté avec les pieds et ils ont choisi Google contre les annuaires, notamment ceux construits par les bibliothécaires pour guider leurs lecteurs et ce, quelle que soit la qualité de leur sélection. Depuis les premiers mois de 2004, les versions américaines de Google et Yahoo ont même retiré de la page d’accueil le lien vers l’annuaire (Google.com in English), soit relégué celui-ci en bas de la page d’accueil (yahoo.com). [Mise à jour au 27 août 20006 : cet été 2006, Yahoo.fr a carrément supprimé son annuaire (heureusement, la version US a gardé le sien, mais pour combien de temps ?) et Google.fr a, suivant l’exemple US avec deux ans de retard, relégué son (enfin, sa version de l’Open Directory) annuaire derrière le lien "plus >>".]

Les défauts de Google, les limites de Juritel.info

Mais Google a un inconvénient majeur pour un juriste et plus encore pour un non juriste qui cherche du droit : il ne trie que par pertinence, pas par la qualité, la fiabilité ou le caractère officiel de l’information, ce qui est important en général et vital/quasi-obligatoire en droit. Ce n’est pas parce que beaucoup de liens pointent vers une page web ou que ses mots correspondent exactement à ceux de votre recherche que, pour autant, elle a été rédigée par un auteur fiable ou qu’elle a été validée par un comité éditorial. Ainsi, il arrive que Google renvoie vers des articles de la presse informatique un peu approximatifs sur les réformes du droit de la propriété intellectuelle et de l’Internet.

La voie de l’avenir, pour guider efficacement les internautes, c’est alors peut-être celle montrée par les moteurs de recherche juridique Légicité (qui n’intègre plus de nouveau document depuis 2003) puis Juritel.info, un projet plus récent : créer des moteurs thématiques et n’indexant que des sites sélectionnés (voir par exemple la sélection d’environ 300 sites qu’indexait Légicité ; Juritel.info en indexe lui plus de 2000). Mais alors, comment atteindre l’expertise technique et la puissance d’indexation de Google ? Mission impossible ?

Pourtant, pas de moteur pertinent sans annuaires

Reconnaissons en revanche une utilité formidable aux annuaires de sites web juridiques : sans eux, la pertinence de Google serait bien moindre. En effet, d’une part, Google utilise doublement l’annuaire Open Directory (ODP) : il le copie pour en faire son "Directory" et il l’utilise en partie (en partie, oui, mais en partie seulement, voir les discussions à ce propos sur les forums du site WebmasterWorld, notamment ce fil-ci et celui-là) — comme tous les autres grands annuaires — pour établir la pertinence de ses résultats (le PageRank cité plus haut). En clair : entrer dans l’ODP fait monter le rang d’un site aux yeux de Google. D’autre part, Google répertorie les liens que tissent les autres annuaires et les analyse comme autant de recommandations.

Le maître mot : sélectionner

Ce qui entre parenthèses renforce ma suggestion implicite précédente : les annuaires devraient ne pas hésiter à afficher leurs préférences et leurs évaluations en sélectionnant plus. Mais cela peut entrer en contradiction avec l’objectif commercial de plusieurs d’entre eux, qui travaillent souvent sur la base du partenariat et de l’échange de liens, donc au mieux sur la base de l’exhaustivité, non pas d’une sélection fondée sur la valeur du contenu des sites.

Emmanuel Barthe
documentaliste juridique, auteur d’un annuaire juridique sélectif


Dépôt légal des pages web : bientôt !

Les archives des sites web français seront consultables au rez-de-jardin de la BNF

Samedi 22 janvier 2005

Lire la suite »

Le dépôt légal des sites web français (essentiellement le domaine .fr) n’est pas encore une réalité, mais ça approche.

Il n’est pas question de tout archiver, c’est techniquement — et financièrement surtout, peut-être ... — impossible. Il n’est pas non plus question de laisser cet archivage en consultation libre sur Internet. Pour des raisons de droit d’auteur [4], seuls les postes de consultation du rez-de-jardin de la Bibliothèque nationale de France (BNF) (pour les chercheurs, pas le grand public) y accèderont.

L’idée du projet de la BNF est de se limiter à l’archivage d’un échantillon représentatif des sites web français [5]. La représentativité d’un site, ici, est fondée sur sa notoriété en termes du nombre de liens hypertextes poitant vers ses pages. Le site repéré sera "aspiré" à distance par un logiciel robot spécialisé [6]), amélioré notamment par la concertation au sein du Consortium International pour la Préservation d’Internet (IIPC) [7]. Si le robot ne peut techniquement pas aspirer un site, il sera demandé à son éditeur de fournir son contenu par dépôt volontaire.
Sur le site de la BNF, la page Expérimentations sur le dépôt légal Internet à la BnF présente le cadre juridique et les méthodes testées et retenues, et on trouve une approche critique du projet de la BNF dans un article de Mehdi Gharsallah : Dépôt légal des publications électroniques et préservation patrimoniale du web français, 24 décembre 2004.

En aval de l’archivage de ces sites, la BNF étant une bibliothèque, il est aussi question d’indexer leur contenu archivé. Selon 01 Informatique (juillet 2004) [8], le travail de classement et d’indexation d’un telle masse numérique devrait résulter du projet WATSON (Web : Analyse des Textes, Sélection, et Outils Nouveaux), dirigé par la société Lingway et auquel participent aussi la BNF et deux laboratoires de recherches de linguistique du CNRS [9]. Soit : un éditeur de logiciels de traitement documentaire du français (moteurs de recherche en langage naturel, catégorisation et structuration des documents), un gros utilisateur (la BNF [10]) et deux groupes de chercheurs en sciences du langage. [11].
Le projet WATSON se situe dans la continuité des travaux de l’équipe de linguistes et informaticiens de Lingway (ex-ERLI, ex-Lexiquest) dirigée par Bernard Normier, fondateur d’ERLI en 1977 et donc chercheur en traitement automatique du langage depuis quelques 25 ans. Lingway espère en tirer une amélioration du "web mining" [12].
Dans le domaine juridique, Lingway a travaillé avec Jouve et les principaux offices de brevets européens sur ePatent, une sorte de moteur de recherche de brevets en langage naturel [13] utilisé sur le site Plutarque, la nouvelle banque de données de l’INPI. Lingway a aussi travaillé avec Questel-Orbit pour améliorer la lecture des brevets en texte intégral avec sa technologie LPS (Lingway Patent Suite).

Sur Libération.fr un entretien avec Jean-Noël Jeanneney, le président de la BNF (Le web français face au défi de l’archivage / Frédérique Roussel, Libération.fr, 22/06/2004), sur l’archivage et le dépôt légal de sites internet par la BNF :

  • pour l’instant (juin 2004), la BN n’a mené que des tests [14]. En effet, pour l’instant, le dépôt légal des sites web n’est pas prévu dans la loi française. Ce sera chose faite une fois voté le projet de loi Aillagon relatif au droit d’auteur et aux droits voisins dans la société de l’information. Selon l’article, la discussion parlementaire aura vraisemblablement lieu à l’automne 2004
  • un point qui devrait intéresser ceux qui utilisent le site archive.org, le grand site actuel de conservation des pages web anciennes : M. Jeanneney explique que pour les sites français les plus anciens, aujourd’hui disparus, « un accord est en cours de négociation avec Internet Archive, une fondation américaine qui enregistre depuis 1996 une grosse partie de l’Internet mondial mais qui n’a *pas* vocation à le conserver durablement ».

D’autres informations également dans un article paru dans Archimag fin 2003 (Projet de loi : dépôt légal des sites web / Mehdi Gharsallah, Archimag, décembre 2003-janvier 2004). Mehdi Gharsallah a également décrit de manière critique dans un autre article (précité) les difficultés techniques et les diverses réalisations et projets existant en matière d’archivage des sites web, notamment l’Internet Archive et les versions antérieures du site du Premier ministre français. BlogOKat signale [15] un article de Magali Haettiger, tiré de son mémoire soutenu en 2003 : Vers la conservation des sites web régionaux, Bulletin des bibliothèques de France 2003, tome 48 n° 4 p. 77. Enfin, on trouvera des communications techniques parfois de haut niveau mais toutes très intéressantes, sur le site bibnum.bnf.fr [16], notamment les supports des interventions effectuées lors du séminaire Aristote du 22 avril 2004 Internet : la mémoire courte ? sous la responsabilité scientifique de Julien Masanès (BNF) et Conservation des sites web, présentation de J. Masanès aux 4èmes journées internationales d’études de l’Arsag, 2002.

En clair, alors que l’Internet Archive n’archive finalement que peu de sites français et le plus souvent de manière très parcellaire, on pourrait avoir la possibilité, peut-être début 2006 et uniquement sur place à la BNF, de chercher et consulter des pages web françaises disparues. Tout comme aujourd’hui on peut y consulter un ouvrage épuisé et introuvable ailleurs.

Emmanuel Barthe
documentaliste juridique


1 | ... | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42

Dernières brèves