L’édition juridique

Dernier ajout : 4 novembre.

Derniers articles

La data et les réseaux, nouvel or noir des éditeurs juridiques

Dixit le patron du Groupe Revue Fiduciaire

Dimanche 4 novembre 2018

Lire la suite »

Une interview aux Echos d’Yves de la Villeguérin et Christophe Bossut, respectivement fondateur et DGD du Groupe RF [1] a attiré mon oeil. L’extrait clé [2] :
« Nous estimons que d’ici quelques années, la valeur ajoutée se fera dans l’analyse de l’audience. Il faut que l’on connaisse nos clients, leurs usages, etc. D’où l’intérêt d’éviter [...] que nos lecteurs clients passent par Google, avec la perte de data que cela entraîne. » [3]

L’analyse de l’audience

La tendance est la suivante : les éditeurs, y compris juridiques, se déplacent vers les réseaux sociaux, notamment académiques, et vers la data et son analyse ("business analytics"), comme l’écrivent les meilleurs spécialistes français du business model de l’édition scientifique Michel Vajou, Pierre-Carl Langlais ou Hubert Gruttenmeier. Rachats par le géant de l’édition scientifique Elsevier du logiciel de gestion de références bibliographiques Mendeley en 2013, du SSRN en 2016 puis de Bepress, éditeur de Digital Commons, une archive ouverte utilisée par 500 institutions scientifiques et universitaires. On peut aussi citer la prise de contrôle du logiciel de gestion de références bibliographiques Papers par Springer, éditeur de Nature, même si son concurrent ReadCube le rachète en 2016 [4].

Pourquoi un tel intérêt des éditeurs pour les réseaux sociaux scientifiques ? Comme l’écrit UrfistInfo, le blog du réseau des URFIS :
« Les réseaux sociaux académiques sont des "reputation metrics startups". On sait que ces services envisagent de monétiser les informations métriques recueillies, notamment à des compagnies de R&D, par exemple pour identifier les tendances ou les chercheurs qui émergent. D’où la mise en place d’une page Trending en temps réel sur ResearchGate » [5].

Deuxième raison, comme l’écrit Pierre-Carl Langlais, les incertitudes sur le business model d’Elsevier à long terme — incertitude que les analystes boursiers ne peuvent que développer, Elsevier étant un groupe coté. P.-C. Langlais note ainsi que « la position de force [d’Elsevier] tend à s’émousser et les négociations traînent en longueur » et que les « incertitudes d’Elsevier s’inscrivent dans un contexte plus large : la conversion de l’édition scientifique au libre accès ».

La veille EPRIST, une veille stratégique sur l’évolution du milieu éditorial

Pour suivre les évolutions cachées de ce secteur, vous pouvez suivre la veille du réseau EPRIST, assurée jusqu’en avril 2017 par Michel Vajou (consultant au sein de la société unipersonnelle M.V. Etudes et Conseil) puis par Pierre-Carl Langlais. Intitulée Notes d’analyse, cette veille est l’inverse de la douche froide habituelle de tweets et mails. C’est une analyse de plusieurs pages, publiée environ trois fois par an, et centrée à chaque fois sur un seul événement.

Pour vous donner un exemple de la vision à long terme — la vraie veille, la stratégique en tout cas, c’est ça : une vision à long terme — des Notes d’analyse EPRIST : la dernière note (septembre 2018) [6] dévoile le rôle capital que jouent 1. OpenCitations, devenu un véritable concurrent de Web of Science (Thomson Reuters) [7] et Scopus (Elsevier), et 2. Wikidata dans l’écosystème de la citation ouverte, en « émergence très rapide » [8].

Conclusion

Conclusion pour les documentalistes juridiques ? Prenez l’habitude de demander les statistiques de consultation de vos abonnements en ligne et de les analyser [9]. Face à cette évolution, c’est vraiment un strict minimum.

Après tout, ces stat’ appartiennent légitimement, me semble-t-il, autant à l’éditeur qu’à ses clients. Pourtant, avec l’évolution vers la data, elles vont prendre encore plus de valeur ... pour les seuls éditeurs.

Emmanuel Barthe
recherchiste, veilleur


Pour la recherche avancée et les opérateurs booléens dans les bases de données et moteurs de recherche

Users to publishers : "Don’t kill boolean operators !"

Vendredi 31 août 2018

Lire la suite »

Les éditeurs de bases de données, plateformes en ligne et moteurs de recherche sont régulièrement tentés de supprimer les opérateurs booléens (ET, OU, SAUF, * ...) et la recherche avancée (champ Titre, champ Mots-clés etc.).

Certains ont déjà succombé à cette tentation. Un oubli plus que gênant puisque la qualité et la rapidité des recherches en sont dégradées.

En effet, l’expérience montre que c’est le classement par pertinence ET les opérateurs booléens qui font les meilleures recherches et les meilleures veilles.

Leurs utilisateurs et clients professionnels de haut niveau — et même certains de niveau basique — en font les frais et s’en plaignent [10].

Et ce n’est pas le traitement du langage naturel (NLP) version machine learning (ML), aussi efficace soit-il (et il l’est), qui changera ça. Quant à la personnalisation des résultats, sa version actuelle me laisse rêveur et celle promise par le ML ne prévoit ni la connexion IP [11] ni le cas fréquent où on cherche quelque chose d’inhabituel. La possibilité de tweaker à fond une requête en texte intégral pur TOUT en bénéficiant des dernières technologies de synonymie automatique et de ranking (classement des résultats) est LA clé de la recherche.

Trop de boîte noire, de personnalisation des résultats et de simplicité tue la recherche, la vraie.

Les professionnels et les universitaires ne sont PAS des consommateurs qui cherchent un voyage en solde pour Acapulco ou la brosse à dent la moins chère. Leurs besoins sont nettement plus complexes.

Même des particuliers peuvent avoir besoin de tweaker une recherche de temps à autre. C’est ce que je viens de faire pour trouver un fauteuil/chaise design orange à dos droit d’un style bien précis. La fonction recherche par image de Google "is my friend". Et c’est aussi de la recherche avancée [12].

Emmanuel Barthe
geek et testeur de moteurs since 1991


English summary :

I am an information and monitoring professional with more than 25 years of experience behind me.

I am a big supporter of Boolean operators and other advanced search engine features. Because all my past experience proves that the alliance of machine learning and NPL doesn’t do better than my human knowledge of how to choose words and combine them.

And because Google and the like are available to everyone — while our employers are ready to pay for something that can do better than Google and the like.

That alone should be enough to convince publishers and all the professional databases sector to maintain operators and to allow their customers to use as freely as possible those operators.


Editeurs et legal tech

Vendredi 13 juillet 2018

Lire la suite »

On parle beaucoup des effets disruptifs des startups de la tech. Qu’en est-il dans le secteur des médias juridiques ?

Comme souvent, beaucoup de com’, beaucoup d’exagérations : les legal tech font parler d’elles mais n’ont pas disrupté grand’ chose — pour l’instant. C’est même l’inverse aux Etats-Unis, où nombre de legal tech se sont fait racheter par les grands groupes d’édition juridique. Les grands groupes, Thomson Reuters et plus particulièrement Lexis, ont racheté la plupart des legal tech importantes [13] et, progressivement, ont intégré des technologies de recherche de type intelligence artificielle (IA) et des fonctionnalités (comme les timelines sur une affaire) développées à l’origine par ces startups.

En France, en dehors des applis "simples" comme DemanderJustice.com ou focalisées sur l’audit des contrats comme Softlaw, les regards des observateurs du milieu tech et droit / édition juridique sont tournées vers les legal tech de la justice prédictive, d’où ils supputent que pourraient venir les grandes évolutions d’un secteur très conservateur et à effets de seuil très importants.

De quels acteurs parle-t-on ?

D’abord, des legal tech de soi disant" justice prédictive" — en fait des outils de recherche améliorée de jurisprudence et d’aide à la décision en matière de contentieux. Le cercle est restreint : Predictice, Case Law Analytics (CLA), Doctrine et Luxia [14].

Seul Predictice, le premier de ces trois acteurs, fait du prêt-à-porter en statistiques et en traitement automatique du langage naturel (NLP non machine learning).

Le second, Case Law Analytics, ne fait que de la haute couture — et sur un nombre encore limité de domaines du droit (rupture brutale des relations commerciales, par exemple). Il tient par ailleurs un discours très intéressant sur l’IA en droit, reconnaissant une nette intervention humaine, notamment lors de la recherche initiale du stock de décisions sur lesquelles le travail va ensuite de faire. Plus réaliste que beaucoup.

Le troisième, Doctrine, ne montre publiquement pour l’instant que peu d’implémentations du traitement du langage naturel (en anglais NLP) version machine learning (ML, en français apprentissage statistique automatique), une des rares technologies se rapportant à l’intelligence artificielle en droit [15]. Alors qu’il en est capable : voir le CV de son co-fondateur et directeur technique (CTO) Raphaël Champeimont et le classement automatique de la jurisprudence par domaine du droit que réalise Doctrine.fr.

Le quatrième, Luxia, publie la base de données de textes officiels et jurisprudence Alinea, est nettement moins récent que les trois autres et est à mi-chemin entre la legal tech et la SSII.

Examinons plus en détails Doctrine, qui vient de faire sa deuxième levée de fonds, après un "seed" de 2 millions, avec cette fois 10 millions d’euros. Son business model ne peut que rendre curieux : une base de jurisprudence et de justice prédictive, vraiment ? Pas si sûr : moins de NLP à la sauce ML que la concurrence, des statistiques judiciaires moins détaillées que Case Law Analytics et Predictice (alors que, encore une fois, Doctrine en est capable), et surtout une base de "legal et business intelligence" à la fois cachée au fin fond du site Doctrine.fr et en même temps vantée par leurs commerciaux. Selon toute probabilité, vu les effectifs et en même temps le nombre d’abonnements annoncés par Nicolas Bustamante sur BFMTV dernièrement, la legal tech a déjà brûlé les 2 millions d’euros de cash initiaux. Ils se positionnent peu comme outil d’aide à la décision judiciaire, dans le discours comme dans les faits, mais communiquent beaucoup sur leur volonté de devenir le Google du droit.

Mais sans doctrine à eux [16], ils ne pourront pas aller beaucoup plus loin. Il suffirait aux éditeurs de bloquer le robot d’indexation de Doctrine.fr dans le fichier robots.txt et le legal tech perdrait l’accès à cette "doctrine".

Predictice, en revanche, de par son partenariat avec Lamy, peut aller plus loin en utilisant la doctrine Lamy pour améliorer sa recherche de jurisprudence, quand bien même le groupe Wolters Kluwer France (la raison sociale de Lamy) ne couvre pas tous les domaines du droit avec la même qualité de doctrine.

En fait, on pourrait se demander si le vrai business model de Doctrine n’est pas un retour au societe.com de l’époque où celui-ci était détenu par le groupe Iliad de Xavier Niel (Free) [17]. Autrement dit : Doctrine ne chercherait-il pas plutôt à faire du credit rating sur les entreprises, en combinant les décisions de justice les plus nombreuses possibles, surtout de première instance et si possible de tribunaux de commerce (Tcom), avec les informations extraites du registre du commerce et des sociétés (RCS), plutôt que devenir un outil de justice dite prédictive ou un éditeur ? D’où le partenariat avec Infogreffe, et probablement, à terme, pas que pour obtenir leur base de Tcom.

Un business model fondé sur le credit rating, pour Doctrine, se justifierait d’autant plus que les réformes Macron ont permis aux PME de rendre leurs comptes confidentiels, ce qui a enlevé aux bases de données d’informations sur les entreprises "traditionnelles" une partie de leurs atouts. Et sur la page d’accueil du site doctrine.fr, le 3e bloc met depuis peu en avant ce qui n’était jusqu’ici pas mis en avant mais néanmoins vendu par les commerciaux : la « legal intelligence ».

En matière d’IA, LexisNexis a probablement une carte dans sa manche. Il n’est pas dans les habitudes de l’éditeur qui construisit la base précurseur Juris-Data de stagner sur le plan technologique.

Mais les investissements dans les technologies de Lexis 360 (nouveau moteur avec classement des résultats par "pertinence", thésaurus juridique avec deux juristes terminologues à temps plein, nouvelle interface et présentation refaite à 100% de la base de données Contentieux de l’indemnisation renommée Données quantifiées Juris-Data ...) et le lancement d’autres nouveaux produits (Lexis Actu, Juris-Data Jurisprudence quantifiée) ont vraisemblablement coûté cher et du fait de l’organisation des grandes multinationales par centre de coûts, ces dépenses retombent sur la filiale française.

Enfin, on trouve dans les acteurs une ex-startup devenue un acteur établi de l’édition juridique : Lexbase. Et depuis 2016, l’éditeur low cost [18] est redevenu la startup qu’elle était à ses débuts. La prochaine sortie en septembre prochain de leur outil d’aide à la décision Legalmetrics, concurrent de Predictice, et l’ajout d’un moteur de rendu des pages et de recherche ultra-rapide de style search-as-you-type [19], le montrent bien. D’autant plus que la jurisprudence est son point fort (grâce notamment à la connaissance intime qu’a Lexbase des barreaux et donc grâce aux "deals" avec les CARPA, bras financiers des barreaux d’avocats).

Lexbase est donc en train de redevenir une legal tech tout en restant l’éditeur juridique qu’il est devenu.

Une prochaine recomposition du secteur ?

Un acteur avec 10 millions d’euros fait immanquablement penser à une possibilité d’acquisitions. Et s’il y a des acteurs dans le secteur qui pourraient intéresser quelqu’un ... Si pas maintenant, disons d’ici peu. Pourraient aussi prétendre faire des acquisitions Lexbase, Thomson Reuters (Transactive), le groupe ELS (Editions Lefebvre Sarrut), LexisNexis, Wolters Kluwer France (WKF, marque Lamy) et le groupe Jouve (Lextenso, Petites affiches, Gazette du Palais ...).

En pratique, WKF est sorti il y a peu de longues difficultés : des acquisitions sont donc très peu probables.

La famille propriétaire du groupe ELS (Francis Lefebvre, Dalloz, Editions Législatives) et sa direction semblent avoir une seule stratégie : une expansion systématique à l’étranger depuis les années 2000 (notamment rachat des éditeurs juridiques Larcier, de Boeck et Bruylant en Belgique et au Luxembourg).

Thomson Reuters Transactive (Le Doctrinal, RDAI/IBLJ, Revue trimestrielle de droit financier) a beaucoup d’argent mais pas de stratégie claire non plus.

Lextenso (groupe Jouve), a eu fort à faire pour intégrer les nombreuses revues, rédactions et services abonnements de ses diverses ex-filiales et se focalise sur la nouvelle version de son portail et l’enrichissement de son offre (OHADA récemment).

Seuls LexisNexis et Lexbase ont une véritable stratégie. Celle de Doctrine reste à distinguer.

LexisNexis pourrait théoriquement obtenir de son groupe le financement nécessaire mais vu son statut de centre de coût, comme expliqué supra, elle devrait "l’emprunter" à sa holding qui de plus, au vu de ses implantations récentes (notamment au Maroc) risque de considérer que l’Afrique et plus encore l’Asie sont des marchés plus prometteurs et plus rentables que la France. Si on ajoute la crise de 2008 aux conséquences de laquelle les éditeurs traditionnels n’ont commencé à échapper qu’en 2016 [20] et le manque de complémentarité entre les publications de Lexis et celles des autres acteurs (Lexis couvre tous les domaines du droit), il est possible que la filiale française de RELX ne puisse pas ou ne veuille pas se lancer.

Ni Predictice ni Case Law Analytics n’ont des investisseurs aussi riches et rien dans leurs produits respectifs ne laisse penser qu’ils peuvent ou prévoient de publier de la doctrine. Alinea s’est, de fait, retiré de la course, notamment du fait de sa taille. Ce qui ne l’empêche pas, aux dernières nouvelles, de travailler en B to B, plutôt en mode SSII.

Si Doctrine est bien sur un modèle d’affaires non éditeur, Lexbase bénéficierait donc d’une occasion exceptionnelle pour accentuer son côté éditeur. Mais pour cela, il devrait résoudre plusieurs questions :

  • trouver l’argent pour racheter un acteur. C’est faisable : l’entreprise va bien, elle a un modèle adapté à notre époque (le low cost), et c’est le seul éditeur juridique français à avoir vu sa rentabilité et son chiffre d’affaires progresser tous les deux, et qui plus est nettement, entre 2008 et 2015. La véritable inconnue est plutôt : les propriétaires de Lexbase suivraient-ils ? À défaut, trouveraient-ils des associés pour boucler un tour de table ?
  • l’entreprise, qui a toujours crû par croissance interne, peut-elle changer ses habitudes et intégrer un recrutement latéral ?
  • Lexbase accepterait-il de changer sa façon de faire de la "doctrine" (la doctrine de Lexbase est plutôt soit de la veille jurisprudentielle — revues Lexbase — soit des encyclopédies qui citent beaucoup de choses mais rentrent peu dans le détail et n’offrent que peu de commentaire propre) ?

Toutefois, l’offre de jugements de tribunaux de commerce de Doctrine vient de disparaître de leur site et ils font des liens vers les pages de societe.com. Ils viennent de créer une base de textes officiels — type de documents qui ne faisaient pas encore partie de leur offre il y a une semaine. Manque la doctrine. Doctrine va-t-il renoncer au business intelligence et verser vers le métier d’éditeur ? La startup a déjà fait plusieurs fois preuve d’adaptabilité et de rapidité et ils ont quand même 10 millions d’euros à leur disposition — si leurs investisseurs sont d’accord car ce genre d’investissement se débloque en général par tranche. Tout est possible [21].

Toutes ces supputations, bien sûr, supposent qu’en hauts lieux on se garde d’intervenir. L’hypothèse n’est pas sans fondement : on se souviendra qu’en 2005 la vente des éditions Dalloz avait été orientée de manière appuyée vers le groupe ELS [22].

Emmanuel Barthe
bibliothécaire documentaliste juridique


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 48

Dernières brèves