Actualités : derniers articles

Archiver et signaler une thèse : circuit et délais

Vendredi 31 juillet 2020

A la faveur de l’affaire de l’annulation pour plagiat de la thèse d’Arash Derambarsh [1], sur un fil de discussion sur Twitter débuté par le compte Twitter anti-plagiat Thèse et Synthèse, et suite à des questions de Damien Petermann, doctorant en géographie (son blog de recherches sur Hypotheses), Maïté Roux, responsable du service des thèses de l’ABES vient de donner une vue exceptionnellement précise de la chaîne de traitement des thèses une fois la thèse rédigée.

Il est aussi question dans ce thread (vers le début et la fin) de détection et de détecteurs de plagiat et de qui est le mieux placé pour le détecter parmi les directeur de thèse, rapporteur et al.

NB : pour le meilleur de nos billets sur les thèses, voir sur ce blog Tout sur les thèses de droit.

Je copie-colle l’essentiel :

Quel est le temps de traitement de l’archivage électronique de la thèse par l’école doctorale (ED) après soutenance ?

« La moyenne nationale est d’un peu moins d’un an pour archiver et signaler une thèse. Donc, malheureusement, ça n’a rien d’étonnant. Certains établissements sont très en retard.

Oui. Le fichier validé par le jury (version avant soutenance OU version corrigée à la demande du jury) doit être traité par l’établissement de soutenance. Le fichier est envoyée pour archivage pérenne au CINES et signalé dans http://theses.fr et le Sudoc. En soi, ce n’est pas une opération longue.

Ce qui peut prendre du temps, c’est :

1/ la récupération du fichier de thèse si l’établissement ne l’a pas récupéré avant la soutenance (ce qui arrive), ou si le docteur tarde à faire les corrections.

2/ la réception de tous les documents administratifs : PV de soutenance, avis du jury, avis de confidentialité, autorisation de diffusion, etc.

3/ les moyens humains alloués au traitement des thèses par l’établissement de soutenance. L’archivage et le catalogage des thèses sont confiés au SCD/BU de l’établissement. Souvent, cette activité vient en plus d’autres activités, d’où des délais.

Certains SCD traitent les thèses au fur et à mesure de leur réception, d’autres les traitent par lot, une, deux ou trois fois par an, ce qui peut allonger les délais.

J’ajoute un 4/ un peu technique : l’indexation contrôlée de la thèse. Pour indexer une thèse, les catalogueurs utilisent le référentiel Rameau principalement. Ce référentiel est géré par la BnF. Si certains termes techniques sont absents de Rameau, il faut faire une demande d’ajout. Le traitement de la demande peut être long. Or, dans les thèses, il y a souvent des termes très techniques, mais importants, qui ne sont pas forcément présents dans Rameau. Cela peut retarder le catalogage. »

Et la mise en ligne de la thèse par l’université (sur son propre site ou dans TEL) a lieu à la fin de cette procédure ? (Sachant que le/la docteur.e peut déposer aussi lui/elle-même dans TEL)

« Tout dépend. En fait, tout ce travail d’archivage et de signalement est effectué dans une application : STAR.

Si l’établissement a choisi de diffuser sa thèse sur TEL : STAR effectue lui-même l’envoi de la thèse dans TEL une fois que l’établissement a validé l’archivage et le signalement.

Si l’établissement a choisi de diffuser les thèses sur http://theses.fr : idem, la diffusion se fait une fois l’archivage validé.

Si l’établissement a choisi de diffuser ses thèses sur sa propre archive ouverte (AO) : il saisit l’URL de diffusion dans STAR, mais fait lui-même le dépôt du fichier sur son AO (nous ne pouvons pas établir de pont entre STAR et chaque AO). En, revanche, l’établissement récupère les métadonnées de STAR pour alimenter son AO : donc il n’a qu’à ajouter le fichier.

Pour récapituler :
1/ dans STAR, le catalogueur dépose le fichier de la thèse, avec ses annexes, puis saisit toute les métadonnées descriptives
2/ quand il a fini son travail, il valide
3/ le fichier est envoyé pour archivage au CINES.
4/ si l’archivage est OK => le fichier est ensuite envoyé vers TEL pour diffusion. 5/ si TEL reçoit bien le fichier (c’est OK), l’URL de diffusion est retournée à STAR. 6/ STAR envoie alors les métadonnées complètes au Sudoc et à http://theses.fr

Petit bonus : la thèse arrive dans le Sudoc => chaque nuit, un petit programme tourne pour savoir s’il existe, dans le Sudoc, d’autres versions de la thèse (une reproduction sur microfiche, un tirage imprimé, une version publiée chez un éditeur)

Si oui : le programme crée une "famille" et envoie l’information à http://theses.fr => c’est pour cela que, sur http://theses.fr, toutes les versions d’une même thèse sont groupées sous une même page.

Ce ne sont pas les catalogueurs qui regroupent les informations, mais un algorithme. En fait, personne n’alimente http://theses.fr. http://theses.fr est alimenté automatiquement par STAR, par le Sudoc, et par l’application STEP pour les projets de thèses. »


bofip.impots.gouv.fr : la nouvelle version du site de la documentation fiscale est en ligne

Vendredi 31 juillet 2020

En 2012, la Direction générale des finances publiques (DGFiP), ex-Direction générale des impôts (DGI), lançait sa nouvelle documentation administrative fiscale, le BOFiP [2]. Ce nouveau site, aboutissement du projet Pergam, faisait d’une pierre deux coups, remplaçant tant la Documentation de base que sa mise à jour par le Bulletin officiel des impôts (BOI).

Ce tout premier Bofip aura duré neuf ans. Une nouvelle version a été mise en ligne le 15 juillet 2020. Des vidéos présentent cette version, mais on peut regretter que la DGFiP n’y ait pas consacré un post écrit. Pour le grand public, d’accord. Et puis la vidéo est tellement à la mode actuellement. Mais pour un professionnel ou un utilisateur expérimenté [3], ce genre de présentations vidéos est peu instructif.

Si vous devez regarder une vidéo de présentation — il y en quatre de plus de 3 mn chacune — regardez celle sur la navigation.

En vrac, on note :

  • une nouvelle mise en page/design graphique, plus sobre et adapté aux appareils mobiles (smartphones et tablettes). On peut par exemple masquer le plan du document. C’est le grand changement des sites des administrations depuis 2015 : passer au "responsive web design" (RWD). Le nouveau Legifrance s’y est mis lui aussi
  • le "versioning" est amélioré : on peut désormais comparer différentes versions d’un même texte dans la même page web, en cochant les dates voulues
  • de nouveaux flux RSS : pensez à modifier les URLs de ceux que vous suiviez pour votre veille. Toujours un fil par série et un fil global : très bien pour la veille
  • dans le plan de classement de la documentation administrative fiscale de nouvelles séries par rapport à 2012 :
    • DAE - Droit à l’erreur (création de la fameuse loi ESSOC, toutefois bordée par des décrets : voir nos posts)
    • RES - Rescrits : cette nouvelle rubrique rend la page Les derniers rescrits publiés du site impots.gouv.fr, connue de longue date des veilleurs juridiques, inutile désormais
    • Annexes
  • sinon, on a toujours deux moyens d’accès au contenu :
  • a noter l’apparition de nouvelles fonctionnalités sur Bofip :
    • le panier. On met des documents de côté pour les télécharger en un unique fichier PDF une fois sa recherche/navigation terminée. Très pratique. Une excellente initiative
    • les permaliens (URLs permanentes)
    • le plan est désormais dépliable/repliable.


Les rescrits et la fonctionnalité "panier"

Question contenu, on a définitivement perdu l’archive Bofip (les BOI et la Documentation administrative d’avant le 12 septembre 2012). Enfin, pas totalement puisqu’Archive.org a fait son (remarquable) travail.

Et, oh bonheur — surtout après l’épisode du nouveau site AMF — les anciennes URL fonctionnent. Même pas besoin de redirections :-)

Le voilà fait, ce post. Ce n’était pas difficile (temps de rédaction, tests et copies écran comprise : 2h).

Emmanuel Barthe
documentaliste juridique, veilleur


Pappers v. Ninja ou rediffuseurs v. sociétés ?

Les informations sur les sociétés republiées (en mieux) par Pappers et RCS Ninja

Les rediffuseurs du registre du commerce et des sociétés (RNCS) et de la base SIRENE font débat

Vendredi 31 juillet 2020

La diffusion en ligne avec autorisation de rediffusion gratuite (dite open data) des données du registre national du commerce et des sociétés (RNCS, fourni par l’INPI) et du fichier SIRENE (fourni par l’INSEE) sur le site Data Inpi, lancé en décembre 2019 et dont le principe a été voté dans la loi Macron du 6 août 2015 [4], est arrivée à son terme. L’INPI propose désormais une API, un moyen simple de récupérer les donnés, en plus du FTP.

Les comptes annuels ont été le dernier type de données chargé. Les nouveaux rediffuseurs — autres que le précurseur societe.com [5] — se lancent donc.

Pappers v. Ninja : comparatif

Pappers est un site ergonomique et rapide sous smartphone Android sous Firefox (le site Data Inpi l’est tout autant). Graphiquement moins travaillé, son concurrent RCS Ninja reste très lisible et aussi rapide.

Leurs chartes graphiques respectives peuvent donner une impression de grande différence, mais les points communs entre RCS Ninja et Pappers sont nombreux. Toutefois, des différences apparaissent dans la mise à jour des données et le moteur de recherche.

Derrière ces deux initiatives datant toutes deux de juillet 2020, on retrouve (classiquement) des fondateurs entrepreneurs de type informatique et start-up. L’un travaille dans le secteur des assurances, l’autre comme avocat :

  • RCS Ninja a été créé vers le 9 juillet par Lionel Vest, avocat associé du cabinet Adaris. Lionel Vest est aussi le créateur d’Optimus Avocats, un logiciel de gestion de cabinet d’avocats open source doté de fonctionnalités avancées comme dictée vocale via smartphone et synchronisation Iphone / Android. La première version a été lancée chez Adaris en 2006. Optimus sera ouvert en septembre à un premier groupe de beta testeurs
  • Pappers a été lancé le 13 juillet [6] par Pierre Fruchard, fondateur de la start-up Coover, courtier en assurance destiné aux indépendants.

Pappers renvoie vers le site Monidenum pour permettre facilement aux entrepreneurs de télécharger leur Kbis (mais personne d’autre ne peut le faire, c’est donc un peu trompeur). Ca, Ninja ne le fait pas.

Les deux rediffuseurs offrent une présentation des données par société mieux faite et surtout plus pratique que le site (déjà pas mal) que celle de Data INPI. Exemple avec la Cie de Saint-Gobain :

Comparez :


Charte graphique de Data Inpi


Charte graphique de Pappers


Charte graphique de RCS Ninja

Gros avantage offert par les deux nouveaux, aucun enregistrement sur RCS Ninja ni Pappers n’est nécessaire pour télécharger les actes — un gros plus par rapport à Data Inpi.

Chaque acte est identifié chez Pappers au lieu d’être simplement uniformément appelé "Dépôt Du jj/mm/aaaa" comme c’est hélas le cas chez le site de l’INPI. Cela permet aussi à Pappers d’identifier et de mettre en haut de la fiche de l’entreprise ses statuts et ses comptes — un très gros plus.

RCS Ninja fait de même, mais son titrage des actes est légèrement moins performant que celui de Pappers. En revanche, Ninja offre non seulement la date de dépôt mais aussi celle de l’acte lui-même.

Pappers et Ninja mettent les liens vers les annonces BODACC (ce que ne fait pas Data Inpi) mais pas, contrairement au site INPI, vers les marques, brevets, dessins et modèles (c’est là un gros avantage du site de l’INPI).

Pappers identifie également automatiquement la référence de la CCN de l’entreprise. Pas Ninja. Mais c’est là une information d’une catégorie différente (droit social), moins intéressante.

Attention : qui dit RNCS (dont le champ est moins large que celui de la base Infogreffe) dit pas d’extrait K-bis, pas d’état d’endettement (privilèges et nantissements), pas de certificat attestant de l’existence ou de l’absence de procédures collectives en cours ni de copies des décisions qui en découlent, pas d’historique des modifications, etc. Là, c’est avantage Infogreffe.

Délai de mise à jour des données

Le gros problème de ces rediffuseurs gratuits va être le délai de réception (et donc de mise en ligne) des données, autrement dit leur retard par rapport à Data Inpi et a fortiori par rapport à Infogreffe.

Par exemple, au 30 juilet 18h30, une société lancée le 1er juillet est dans Infogreffe et INPI Data et même dans Ninja. Mais toujours pas dans Pappers [7].

On pouvait s’y attendre vu le circuit des données :

  • d’abord dépôt des informations au greffe de commerce
  • qui transmet à Infogreffe
  • qui transmet à l’INPI (depuis la loi Macron : voir notre billet INPI c/ Infogreffe : du nouveau)
  • enfin l’INPI transmet aux rediffuseurs gratuits.

Moteur de recherche

Un autre problème est l’efficacité du moteur de certains nouveaux entrants. Par exemple, si on cherche par Compagnie de Saint-Gobain, le nombre de résultats est de :

  • Infogreffe (la référence, donc) : 1 résultat
  • Societe.com, le premier rediffuseur historique : 3 résultats, dont le "bon"
  • Data Inpi : 2 résultats, dont le "bon"
  • RCS Ninja : 2 résultats : le "bon" et 1 établissement au Mans fermé depuis 1984
  • Pappers : 9 résultats, dont le "bon" et 5 autres correspondants à la recherche mais qui semblent plutôt correspondre, vu leurs adresses, à des établissements. Pour le reste, ces enregistrements ressemblent à des doublons (mêmes liste d’actes, notamment, que le "bon"). Ces doublons ne viennent pourtant pas de l’INPI (cf supra). Sur les quatre autres enregistrements, trois ont pour adresse la ville de Saint-Gobain, ce qui signifie que le moteur de Pappers interroge tous les champs et non seulement celui de la raison sociale. Ca peut parfois avoir des avantages, mais en général, ça multiplie les résultats non pertinents.

On dira donc : moteur : avantage Infogreffe et Ninja.


Infogreffe : 1 résultat


Societe.com : 3 résultats


Data Inpi : 2 résultats


RCS Ninja : 2 résultats


Pappers : 9 résultats

Mentions légales

Une clause des mentions légales de Pappers pourrait amener quelques remarques. Je cite :
« l’Internaute s’interdit de reproduire et/ou communiquer au public tout ou partie des contenus publiés sur le Site » Ca ressemble à du "boiler plate", comme on dit en anglais (des formules copiées-collées sans personnalisation). Parce que, si l’essentiel du contenu du site est constitué de données publiques, je ne vois pas très bien comment justifier une interdiction aussi générale.

Chez Ninja, là aussi, une clause des mentions légales chatouille clairement : « L’éditeur interdit les liens hypertextes vers l’une des pages du site, à l’exception de la page d’accueil ». Selon l’avocat Guillaume Sauvage, du cabinet Pierrat, spécialisé dans la propriété intellectuelle, « dans l’absolu, interdire de faire un lien vers un site Internet n’a pas de véritable valeur légale et ne constitue pas une contrefaçon, qui suppose la reproduction d’un contenu ou sa représentation » [8].

Peut-être cette clause vient-elle d’une clause très similaire présente dans les mentions légales du site Data Inpi : « Les utilisateurs visiteurs du portail data Inpi ne peuvent mettre en place un hyperlien en direction de ce site sans l’autorisation expresse et préalable de l’INPI ». Même remarque que supra à propos de cette clause INPI.

RCS Ninja et Pappers feraient peut-être mieux d’utiliser le droit anti-extraction substantielle du producteur de base de données. Ce que fait le site de l’INPI : « Les bases de données figurant sur le portail sont protégées par les dispositions de la loi du 11 juillet 1998 portant transposition dans le Code de la propriété intellectuelle (CPI) de la directive européenne du 11 mars 1996 relative à la protection juridique des bases de données. Sont notamment interdites l’extraction et la réutilisation, quantitativement ou qualitativement substantielles, du contenu des bases de données contenues sur ce site Internet. Tout contrevenant s’expose aux sanctions visées aux articles L 343-1 et suivants du Code de la propriété intellectuelle. »

Conclusion sur le comparatif

Le match RCS Ninja v. Pappers doit, on le voit, être élargi à Infogreffe et Data Inpi, en prenant en compte d’abord la mise à jour du contenu et la pertinence du moteur de recherche et en laissant de côté l’esthétique et la com’. La qualité d’un outil d’information/bases de données, c’est d’abord et avant tout le résultat de l’équation contenu + fraîcheur + moteur.

Évidemment, mon appréciation comme mon équation sont celles d’un professionnel de l’information. Un entrepreneur solo ou un particulier aura une vision orientée prix (gratuité) d’abord. Mais même dans ce cas, la mise à jour doit rester un critère essentiel, surtout en matière de procédures collectives.

Une polémique rediffuseurs v. PMEs difficile à comprendre

Selon la Lettre A [9], « les sites commercialisant les statuts et extraits de comptes des sociétés sont sur le qui-vive depuis le lancement de Pappers.fr. Portée par la loi Macron de 2015, cette ouverture totale du registre du commerce, en accès libre, interpelle plusieurs syndicats patronaux, qui réfléchissent à une action de groupe. »

La Lettre A explique que « les syndicats professionnels dans l’ensemble, redoutent cette opération transparence, en particulier pour les PME ». Selon la newsletter, « la Fédération française du bâtiment (FFB) envisage de s’associer à d’autres instance pour lancer une action de groupe contre l’INPI. Le site de Pierre Fruchard pourrait être mis dans la procédure dans un second temps. »

Les deux acteurs visés semblent pourtant être restés dans la légalité, il ne s’agit là que de la mise en oeuvre d’une directive européenne et d’une loi française. Par ailleurs, on se demande comment l’INPI, qui a mis plus de deux ans à monter le projet Data Inpi, aurait pu violer la loi au vu et au su des autorités.

On notera enfin que les PME ont beaucoup de moyens — légaux et illégaux — pour ne pas publier les données qui les gêneraient [10].

Depuis 2014, les TPE (moins de 10 salariés, grosso modo) peuvent demander la confidentialité de leurs comptes annuels (compte de résultat et bilan). Et depuis août 2016, les petites entreprises de moins de 50 salariés ou avec un bilan de moins de 4 millions d’euros ou un chiffre d’affaire de moins de 8 millions d’euros peuvent aussi le faire (article 213 de la loi Macron précitée). Et elles ne s’en privent pas [11]. Les sociétés appartenant à un groupe (fausses PME) ne peuvent pas bénéficier de cette faculté.

Par dessus le marché — si je puis m’exprimer ainsi — beaucoup de PME et certaines grosses sociétés font le choix de ne pas publier leurs comptes, espérant cacher leurs "secrets" financiers. D’après la société de comptabilité en ligne ECL Direct, 50% des dirigeants de SARL, EURL, SAS et SASU ne déposent pas leurs comptes [12].

Ce choix de rester dans l’illégalité n’a qu’un faible prix, celui d’une amende de 3000 euros au plus [13], si tant est qu’un intéressé demande au président du tribunal de commerce de les y obliger sous astreinte et que celui-ci prenne bien cette décision, ou qu’il diligente une enquête sur la société [14]. En pratique, ces enquêtes et les condamnations à publier ses comptes sont très rares.

Emmanuel Barthe
documentaliste juridique, veilleur


Dernières brèves

Archiver et signaler une thèse : circuit et délais

Vendredi 31 juillet 2020

Lire la suite »

A la faveur de l’affaire de l’annulation pour plagiat de la thèse d’Arash Derambarsh [1], sur un fil de discussion sur Twitter débuté par le compte Twitter anti-plagiat Thèse et Synthèse, et suite à des questions de Damien Petermann, doctorant en géographie (son blog de recherches sur Hypotheses), Maïté Roux, responsable du service des thèses de l’ABES vient de donner une vue exceptionnellement précise de la chaîne de traitement des thèses une fois la thèse rédigée.

Il est aussi question dans ce thread (vers le début et la fin) de détection et de détecteurs de plagiat et de qui est le mieux placé pour le détecter parmi les directeur de thèse, rapporteur et al.

NB : pour le meilleur de nos billets sur les thèses, voir sur ce blog Tout sur les thèses de droit.

Je copie-colle l’essentiel :

Quel est le temps de traitement de l’archivage électronique de la thèse par l’école doctorale (ED) après soutenance ?

« La moyenne nationale est d’un peu moins d’un an pour archiver et signaler une thèse. Donc, malheureusement, ça n’a rien d’étonnant. Certains établissements sont très en retard.

Oui. Le fichier validé par le jury (version avant soutenance OU version corrigée à la demande du jury) doit être traité par l’établissement de soutenance. Le fichier est envoyée pour archivage pérenne au CINES et signalé dans http://theses.fr et le Sudoc. En soi, ce n’est pas une opération longue.

Ce qui peut prendre du temps, c’est :

1/ la récupération du fichier de thèse si l’établissement ne l’a pas récupéré avant la soutenance (ce qui arrive), ou si le docteur tarde à faire les corrections.

2/ la réception de tous les documents administratifs : PV de soutenance, avis du jury, avis de confidentialité, autorisation de diffusion, etc.

3/ les moyens humains alloués au traitement des thèses par l’établissement de soutenance. L’archivage et le catalogage des thèses sont confiés au SCD/BU de l’établissement. Souvent, cette activité vient en plus d’autres activités, d’où des délais.

Certains SCD traitent les thèses au fur et à mesure de leur réception, d’autres les traitent par lot, une, deux ou trois fois par an, ce qui peut allonger les délais.

J’ajoute un 4/ un peu technique : l’indexation contrôlée de la thèse. Pour indexer une thèse, les catalogueurs utilisent le référentiel Rameau principalement. Ce référentiel est géré par la BnF. Si certains termes techniques sont absents de Rameau, il faut faire une demande d’ajout. Le traitement de la demande peut être long. Or, dans les thèses, il y a souvent des termes très techniques, mais importants, qui ne sont pas forcément présents dans Rameau. Cela peut retarder le catalogage. »

Et la mise en ligne de la thèse par l’université (sur son propre site ou dans TEL) a lieu à la fin de cette procédure ? (Sachant que le/la docteur.e peut déposer aussi lui/elle-même dans TEL)

« Tout dépend. En fait, tout ce travail d’archivage et de signalement est effectué dans une application : STAR.

Si l’établissement a choisi de diffuser sa thèse sur TEL : STAR effectue lui-même l’envoi de la thèse dans TEL une fois que l’établissement a validé l’archivage et le signalement.

Si l’établissement a choisi de diffuser les thèses sur http://theses.fr : idem, la diffusion se fait une fois l’archivage validé.

Si l’établissement a choisi de diffuser ses thèses sur sa propre archive ouverte (AO) : il saisit l’URL de diffusion dans STAR, mais fait lui-même le dépôt du fichier sur son AO (nous ne pouvons pas établir de pont entre STAR et chaque AO). En, revanche, l’établissement récupère les métadonnées de STAR pour alimenter son AO : donc il n’a qu’à ajouter le fichier.

Pour récapituler :
1/ dans STAR, le catalogueur dépose le fichier de la thèse, avec ses annexes, puis saisit toute les métadonnées descriptives
2/ quand il a fini son travail, il valide
3/ le fichier est envoyé pour archivage au CINES.
4/ si l’archivage est OK => le fichier est ensuite envoyé vers TEL pour diffusion. 5/ si TEL reçoit bien le fichier (c’est OK), l’URL de diffusion est retournée à STAR. 6/ STAR envoie alors les métadonnées complètes au Sudoc et à http://theses.fr

Petit bonus : la thèse arrive dans le Sudoc => chaque nuit, un petit programme tourne pour savoir s’il existe, dans le Sudoc, d’autres versions de la thèse (une reproduction sur microfiche, un tirage imprimé, une version publiée chez un éditeur)

Si oui : le programme crée une "famille" et envoie l’information à http://theses.fr => c’est pour cela que, sur http://theses.fr, toutes les versions d’une même thèse sont groupées sous une même page.

Ce ne sont pas les catalogueurs qui regroupent les informations, mais un algorithme. En fait, personne n’alimente http://theses.fr. http://theses.fr est alimenté automatiquement par STAR, par le Sudoc, et par l’application STEP pour les projets de thèses. »


bofip.impots.gouv.fr : la nouvelle version du site de la documentation fiscale est en ligne

Vendredi 31 juillet 2020

Lire la suite »

En 2012, la Direction générale des finances publiques (DGFiP), ex-Direction générale des impôts (DGI), lançait sa nouvelle documentation administrative fiscale, le BOFiP [2]. Ce nouveau site, aboutissement du projet Pergam, faisait d’une pierre deux coups, remplaçant tant la Documentation de base que sa mise à jour par le Bulletin officiel des impôts (BOI).

Ce tout premier Bofip aura duré neuf ans. Une nouvelle version a été mise en ligne le 15 juillet 2020. Des vidéos présentent cette version, mais on peut regretter que la DGFiP n’y ait pas consacré un post écrit. Pour le grand public, d’accord. Et puis la vidéo est tellement à la mode actuellement. Mais pour un professionnel ou un utilisateur expérimenté [3], ce genre de présentations vidéos est peu instructif.

Si vous devez regarder une vidéo de présentation — il y en quatre de plus de 3 mn chacune — regardez celle sur la navigation.

En vrac, on note :

  • une nouvelle mise en page/design graphique, plus sobre et adapté aux appareils mobiles (smartphones et tablettes). On peut par exemple masquer le plan du document. C’est le grand changement des sites des administrations depuis 2015 : passer au "responsive web design" (RWD). Le nouveau Legifrance s’y est mis lui aussi
  • le "versioning" est amélioré : on peut désormais comparer différentes versions d’un même texte dans la même page web, en cochant les dates voulues
  • de nouveaux flux RSS : pensez à modifier les URLs de ceux que vous suiviez pour votre veille. Toujours un fil par série et un fil global : très bien pour la veille
  • dans le plan de classement de la documentation administrative fiscale de nouvelles séries par rapport à 2012 :
    • DAE - Droit à l’erreur (création de la fameuse loi ESSOC, toutefois bordée par des décrets : voir nos posts)
    • RES - Rescrits : cette nouvelle rubrique rend la page Les derniers rescrits publiés du site impots.gouv.fr, connue de longue date des veilleurs juridiques, inutile désormais
    • Annexes
  • sinon, on a toujours deux moyens d’accès au contenu :
  • a noter l’apparition de nouvelles fonctionnalités sur Bofip :
    • le panier. On met des documents de côté pour les télécharger en un unique fichier PDF une fois sa recherche/navigation terminée. Très pratique. Une excellente initiative
    • les permaliens (URLs permanentes)
    • le plan est désormais dépliable/repliable.


Les rescrits et la fonctionnalité "panier"

Question contenu, on a définitivement perdu l’archive Bofip (les BOI et la Documentation administrative d’avant le 12 septembre 2012). Enfin, pas totalement puisqu’Archive.org a fait son (remarquable) travail.

Et, oh bonheur — surtout après l’épisode du nouveau site AMF — les anciennes URL fonctionnent. Même pas besoin de redirections :-)

Le voilà fait, ce post. Ce n’était pas difficile (temps de rédaction, tests et copies écran comprise : 2h).

Emmanuel Barthe
documentaliste juridique, veilleur


Pappers v. Ninja ou rediffuseurs v. sociétés ?

Les informations sur les sociétés republiées (en mieux) par Pappers et RCS Ninja

Les rediffuseurs du registre du commerce et des sociétés (RNCS) et de la base SIRENE font débat

Vendredi 31 juillet 2020

Lire la suite »

La diffusion en ligne avec autorisation de rediffusion gratuite (dite open data) des données du registre national du commerce et des sociétés (RNCS, fourni par l’INPI) et du fichier SIRENE (fourni par l’INSEE) sur le site Data Inpi, lancé en décembre 2019 et dont le principe a été voté dans la loi Macron du 6 août 2015 [4], est arrivée à son terme. L’INPI propose désormais une API, un moyen simple de récupérer les donnés, en plus du FTP.

Les comptes annuels ont été le dernier type de données chargé. Les nouveaux rediffuseurs — autres que le précurseur societe.com [5] — se lancent donc.

Pappers v. Ninja : comparatif

Pappers est un site ergonomique et rapide sous smartphone Android sous Firefox (le site Data Inpi l’est tout autant). Graphiquement moins travaillé, son concurrent RCS Ninja reste très lisible et aussi rapide.

Leurs chartes graphiques respectives peuvent donner une impression de grande différence, mais les points communs entre RCS Ninja et Pappers sont nombreux. Toutefois, des différences apparaissent dans la mise à jour des données et le moteur de recherche.

Derrière ces deux initiatives datant toutes deux de juillet 2020, on retrouve (classiquement) des fondateurs entrepreneurs de type informatique et start-up. L’un travaille dans le secteur des assurances, l’autre comme avocat :

  • RCS Ninja a été créé vers le 9 juillet par Lionel Vest, avocat associé du cabinet Adaris. Lionel Vest est aussi le créateur d’Optimus Avocats, un logiciel de gestion de cabinet d’avocats open source doté de fonctionnalités avancées comme dictée vocale via smartphone et synchronisation Iphone / Android. La première version a été lancée chez Adaris en 2006. Optimus sera ouvert en septembre à un premier groupe de beta testeurs
  • Pappers a été lancé le 13 juillet [6] par Pierre Fruchard, fondateur de la start-up Coover, courtier en assurance destiné aux indépendants.

Pappers renvoie vers le site Monidenum pour permettre facilement aux entrepreneurs de télécharger leur Kbis (mais personne d’autre ne peut le faire, c’est donc un peu trompeur). Ca, Ninja ne le fait pas.

Les deux rediffuseurs offrent une présentation des données par société mieux faite et surtout plus pratique que le site (déjà pas mal) que celle de Data INPI. Exemple avec la Cie de Saint-Gobain :

Comparez :


Charte graphique de Data Inpi


Charte graphique de Pappers


Charte graphique de RCS Ninja

Gros avantage offert par les deux nouveaux, aucun enregistrement sur RCS Ninja ni Pappers n’est nécessaire pour télécharger les actes — un gros plus par rapport à Data Inpi.

Chaque acte est identifié chez Pappers au lieu d’être simplement uniformément appelé "Dépôt Du jj/mm/aaaa" comme c’est hélas le cas chez le site de l’INPI. Cela permet aussi à Pappers d’identifier et de mettre en haut de la fiche de l’entreprise ses statuts et ses comptes — un très gros plus.

RCS Ninja fait de même, mais son titrage des actes est légèrement moins performant que celui de Pappers. En revanche, Ninja offre non seulement la date de dépôt mais aussi celle de l’acte lui-même.

Pappers et Ninja mettent les liens vers les annonces BODACC (ce que ne fait pas Data Inpi) mais pas, contrairement au site INPI, vers les marques, brevets, dessins et modèles (c’est là un gros avantage du site de l’INPI).

Pappers identifie également automatiquement la référence de la CCN de l’entreprise. Pas Ninja. Mais c’est là une information d’une catégorie différente (droit social), moins intéressante.

Attention : qui dit RNCS (dont le champ est moins large que celui de la base Infogreffe) dit pas d’extrait K-bis, pas d’état d’endettement (privilèges et nantissements), pas de certificat attestant de l’existence ou de l’absence de procédures collectives en cours ni de copies des décisions qui en découlent, pas d’historique des modifications, etc. Là, c’est avantage Infogreffe.

Délai de mise à jour des données

Le gros problème de ces rediffuseurs gratuits va être le délai de réception (et donc de mise en ligne) des données, autrement dit leur retard par rapport à Data Inpi et a fortiori par rapport à Infogreffe.

Par exemple, au 30 juilet 18h30, une société lancée le 1er juillet est dans Infogreffe et INPI Data et même dans Ninja. Mais toujours pas dans Pappers [7].

On pouvait s’y attendre vu le circuit des données :

  • d’abord dépôt des informations au greffe de commerce
  • qui transmet à Infogreffe
  • qui transmet à l’INPI (depuis la loi Macron : voir notre billet INPI c/ Infogreffe : du nouveau)
  • enfin l’INPI transmet aux rediffuseurs gratuits.

Moteur de recherche

Un autre problème est l’efficacité du moteur de certains nouveaux entrants. Par exemple, si on cherche par Compagnie de Saint-Gobain, le nombre de résultats est de :

  • Infogreffe (la référence, donc) : 1 résultat
  • Societe.com, le premier rediffuseur historique : 3 résultats, dont le "bon"
  • Data Inpi : 2 résultats, dont le "bon"
  • RCS Ninja : 2 résultats : le "bon" et 1 établissement au Mans fermé depuis 1984
  • Pappers : 9 résultats, dont le "bon" et 5 autres correspondants à la recherche mais qui semblent plutôt correspondre, vu leurs adresses, à des établissements. Pour le reste, ces enregistrements ressemblent à des doublons (mêmes liste d’actes, notamment, que le "bon"). Ces doublons ne viennent pourtant pas de l’INPI (cf supra). Sur les quatre autres enregistrements, trois ont pour adresse la ville de Saint-Gobain, ce qui signifie que le moteur de Pappers interroge tous les champs et non seulement celui de la raison sociale. Ca peut parfois avoir des avantages, mais en général, ça multiplie les résultats non pertinents.

On dira donc : moteur : avantage Infogreffe et Ninja.


Infogreffe : 1 résultat


Societe.com : 3 résultats


Data Inpi : 2 résultats


RCS Ninja : 2 résultats


Pappers : 9 résultats

Mentions légales

Une clause des mentions légales de Pappers pourrait amener quelques remarques. Je cite :
« l’Internaute s’interdit de reproduire et/ou communiquer au public tout ou partie des contenus publiés sur le Site » Ca ressemble à du "boiler plate", comme on dit en anglais (des formules copiées-collées sans personnalisation). Parce que, si l’essentiel du contenu du site est constitué de données publiques, je ne vois pas très bien comment justifier une interdiction aussi générale.

Chez Ninja, là aussi, une clause des mentions légales chatouille clairement : « L’éditeur interdit les liens hypertextes vers l’une des pages du site, à l’exception de la page d’accueil ». Selon l’avocat Guillaume Sauvage, du cabinet Pierrat, spécialisé dans la propriété intellectuelle, « dans l’absolu, interdire de faire un lien vers un site Internet n’a pas de véritable valeur légale et ne constitue pas une contrefaçon, qui suppose la reproduction d’un contenu ou sa représentation » [8].

Peut-être cette clause vient-elle d’une clause très similaire présente dans les mentions légales du site Data Inpi : « Les utilisateurs visiteurs du portail data Inpi ne peuvent mettre en place un hyperlien en direction de ce site sans l’autorisation expresse et préalable de l’INPI ». Même remarque que supra à propos de cette clause INPI.

RCS Ninja et Pappers feraient peut-être mieux d’utiliser le droit anti-extraction substantielle du producteur de base de données. Ce que fait le site de l’INPI : « Les bases de données figurant sur le portail sont protégées par les dispositions de la loi du 11 juillet 1998 portant transposition dans le Code de la propriété intellectuelle (CPI) de la directive européenne du 11 mars 1996 relative à la protection juridique des bases de données. Sont notamment interdites l’extraction et la réutilisation, quantitativement ou qualitativement substantielles, du contenu des bases de données contenues sur ce site Internet. Tout contrevenant s’expose aux sanctions visées aux articles L 343-1 et suivants du Code de la propriété intellectuelle. »

Conclusion sur le comparatif

Le match RCS Ninja v. Pappers doit, on le voit, être élargi à Infogreffe et Data Inpi, en prenant en compte d’abord la mise à jour du contenu et la pertinence du moteur de recherche et en laissant de côté l’esthétique et la com’. La qualité d’un outil d’information/bases de données, c’est d’abord et avant tout le résultat de l’équation contenu + fraîcheur + moteur.

Évidemment, mon appréciation comme mon équation sont celles d’un professionnel de l’information. Un entrepreneur solo ou un particulier aura une vision orientée prix (gratuité) d’abord. Mais même dans ce cas, la mise à jour doit rester un critère essentiel, surtout en matière de procédures collectives.

Une polémique rediffuseurs v. PMEs difficile à comprendre

Selon la Lettre A [9], « les sites commercialisant les statuts et extraits de comptes des sociétés sont sur le qui-vive depuis le lancement de Pappers.fr. Portée par la loi Macron de 2015, cette ouverture totale du registre du commerce, en accès libre, interpelle plusieurs syndicats patronaux, qui réfléchissent à une action de groupe. »

La Lettre A explique que « les syndicats professionnels dans l’ensemble, redoutent cette opération transparence, en particulier pour les PME ». Selon la newsletter, « la Fédération française du bâtiment (FFB) envisage de s’associer à d’autres instance pour lancer une action de groupe contre l’INPI. Le site de Pierre Fruchard pourrait être mis dans la procédure dans un second temps. »

Les deux acteurs visés semblent pourtant être restés dans la légalité, il ne s’agit là que de la mise en oeuvre d’une directive européenne et d’une loi française. Par ailleurs, on se demande comment l’INPI, qui a mis plus de deux ans à monter le projet Data Inpi, aurait pu violer la loi au vu et au su des autorités.

On notera enfin que les PME ont beaucoup de moyens — légaux et illégaux — pour ne pas publier les données qui les gêneraient [10].

Depuis 2014, les TPE (moins de 10 salariés, grosso modo) peuvent demander la confidentialité de leurs comptes annuels (compte de résultat et bilan). Et depuis août 2016, les petites entreprises de moins de 50 salariés ou avec un bilan de moins de 4 millions d’euros ou un chiffre d’affaire de moins de 8 millions d’euros peuvent aussi le faire (article 213 de la loi Macron précitée). Et elles ne s’en privent pas [11]. Les sociétés appartenant à un groupe (fausses PME) ne peuvent pas bénéficier de cette faculté.

Par dessus le marché — si je puis m’exprimer ainsi — beaucoup de PME et certaines grosses sociétés font le choix de ne pas publier leurs comptes, espérant cacher leurs "secrets" financiers. D’après la société de comptabilité en ligne ECL Direct, 50% des dirigeants de SARL, EURL, SAS et SASU ne déposent pas leurs comptes [12].

Ce choix de rester dans l’illégalité n’a qu’un faible prix, celui d’une amende de 3000 euros au plus [13], si tant est qu’un intéressé demande au président du tribunal de commerce de les y obliger sous astreinte et que celui-ci prenne bien cette décision, ou qu’il diligente une enquête sur la société [14]. En pratique, ces enquêtes et les condamnations à publier ses comptes sont très rares.

Emmanuel Barthe
documentaliste juridique, veilleur


 

Page parrainée par Convention.fr, le spécialiste des conventions collectives et affichages obligatoires.