+ All Categories
Home > Documents > CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes...

CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes...

Date post: 14-Sep-2018
Category:
Upload: vanthien
View: 214 times
Download: 0 times
Share this document with a friend
125
CNRS – Direction de l’Information Scientifique et Technique 1
Transcript
Page 1: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

1

Page 2: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

2

« MIEUX PARTAGER LES CONNAISSANCES »

Pour une information scientifique et technique claire, interopérable, pérenne

Bilan d’étape (2014-2017)

Rapport de stage de Louki-Géronimo Richou, SciencesPo Sous la direction de Renaud Fabre, DIST du CNRS

Juillet 2017

Page 3: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

3

Table des matières

Préface ............................................................................................................................ 6

0. PREAMBULE : Quelle vision de l’IST ? ..................................................................... 8

0.1. À l’heure numérique : Que transforme l’IST ? ..................................................... 8

0.2. Définition : La nature de l’IST ........................................................................... 10

0.3. Mutations en cours ........................................................................................... 12

0.3.1. De nouveaux volumes ............................................................................... 13

0.3.2. De nouveaux supports et démarches : plateformes ................................... 14

0.3.3. De nouvelles formes : métaconnaissances… ............................................ 16

0.3.4. De nouveaux usages : recommandation, captation contrôlée .................... 18

0.4. Contexte et objectif du présent document ........................................................ 19

0.5. Une vision d’ensemble fournie par le CNRS aux acteurs de l’IST .................... 24

1. CONSTAT : Des attentes partagées entre les nouveaux acteurs de l’IST : Une dynamique pour la science............................................................................................. 27

1.1. Une nécessité commune : Ouvrir et simplifier les conditions d’accès ............... 27

1.1.1. Le besoin d’être formés à l’interaction avec l’IST, et informés de ses évolutions ................................................................................................................ 28

1.1.2. Accéder de façon sûre à de larges fonds documentaires et outils d’analyse au meilleur coût ....................................................................................................... 35

1.1.3. Le paysage de l’IST française : un territoire en interaction forte mais morcelé, proposant des solutions inégalement ouvertes ......................................... 38

1.2. Des besoins d’IST spécifiques à certains acteurs ............................................. 48

1.2.1. Les spécificités des Unités de Recherche et Instituts ................................ 48

1.2.2. Les besoins différenciés des Universités, Organismes et Grandes Ecoles 53

1.2.3. L’action de l’Etat au service du citoyen (agences, APUL, ODAC, mission Etalab) .................................................................................................................. 54

1.2.4. Les besoins des entreprises ...................................................................... 61

Page 4: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

4

2. VISION : Faire évoluer les services d’IST vers l’interopérabilité .............................. 64

2.1. Développer une politique nationale de formation de soutien pour la recherche et l’éducation .................................................................................................................. 66

2.1.1. Fluidifier l’utilisation des outils en répondant aux difficultés rencontrées .... 67

2.1.2. Optimiser les savoirs et compétences pour la transition numérique........... 68

2.1.3. Connecter les chercheurs de l’IST française entre eux .............................. 73

2.2. Développer de nouveaux circuits économiques ................................................ 76

2.2.1. Poursuivre la coordination les efforts de négociation et d’acquisition des établissements au sein de partenariats européens pour les stratégies d’achat ....... 77

2.2.2. Concevoir une offre soutenable pour les établissements, en repenser les périmètres d’accès .................................................................................................. 79

2.2.3. Etablir un nouveau modèle économique de valorisation (recommandation, etc.) au cœur d’une Science Ouverte fonctionnant sur le principe de Libre Accès .. 84

2.2.4. Mettre en place les structures (agences, charte éthique) à même d’assurer l’application des principes juridiques contenus dans la LPRN (loyauté des plateformes, lisibilité, exhaustivité) .......................................................................... 88

2.3. Proposer un point d’entrée unique, tenant compte de la grande diversité de ressources et de plateformes ...................................................................................... 94

2.3.1. Faire appliquer les principes juridiques de protection des données (secret dans la recherche, confidentialité, anonymat simple ou coordonné) ....................... 95

2.3.2. Tenir compte des évolutions vers l’interopérabilité des outils de l’industrie et des voisins européens ............................................................................................. 99

2.3.3. Permettre l’adoption de référentiels et standards normés communs ....... 101

2.3.4. Rendre le dispositif modulable pour s’adapter aux différents besoins ...... 106

2.3.5. Bibliométrie et outils assimilés : vers la curation et la facilitation de l’exploitation des données de la recherche ............................................................ 107

2.4. Sauvegarder la pérennité et la compétitivité de l’IST française ....................... 110

2.4.1. Construire un programme national cohérent et interdisciplinaire de préservation du patrimoine scientifique incluant un archivage pérenne (HAL, ISTEX) ................................................................................................................ 110

Page 5: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

5

2.4.2. Apporter un appui logistique et linguistique à la visibilité internationale des publications (notamment en OA) du CNRS et de ses partenaires, en assistant la rédaction et la traduction ....................................................................................... 114

2.4.3. Anticiper les partenariats pour réguler les relations entre les producteurs, les intermédiaires et les usagers finaux d’IST ....................................................... 119

3. SYNTHESE ET ACTUALISATION STRATEGIQUE : Vers l’interopérabilité des outils et des usages ............................................................................................................... 121

4. ANNEXE BIBLIOGRAPHIQUE .............................................................................. 125

Page 6: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

6

Préface

La Stratégie "Mieux partager les connaissances" proposée par Alain FUCHS, Président du CNRS, est désormais un objet familier de l'IST nationale, puisqu'elle a effectivement conduit à un ensemble de résultats concrétisant son intitulé et ses axes moteurs : faire le bilan d'étape de cette démarche nationale s'imposait d'autant plus qu'une nouvelle étape, tout aussi importante pour le travail de la science à l'heure numérique, est devant nous pour utiliser ce "fluide" numérique qu'est l'IST.

Grâce à l'investissement personnel exceptionnel de Louki-Géronimo RICHOU, Stagiaire à la DIST de SciencesPo Paris et auteur de ce rapport, une vue d'ensemble, élaborée sous ma responsabilité, est désormais accessible tant sur les éléments essentiels du travail accompli que sur les priorités de l'étape qui s'ouvre.

Qu'a-t-on accompli depuis 2014 et quels sont les thèmes porteurs des évolutions en cours ? Nous avons pris le parti dans ce rapport, d'une approche strictement pragmatique et "documentaire" : quels sont les changements dans les faits, les pratiques, les règles et ceci quels que soient par ailleurs les indispensables adaptations de l'éthique et des comportements, sur lesquels, à mes yeux, seule une réflexion collective s'impose, et qui a été initiée pour cet automne entre le Conseil scientifique du CNRS et des Instituts, d'une part, et la DIST, d'autre part.

La période 2014-2017

Elle a permis de construire un certain nombre de convergences inédites des usages et des règles visant à "Mieux partager les connaissances" et à penser ces mutations en partageant les pratiques professionnelles des acteurs nationaux ( CNRS, CPU, ADBU, Couperin, ABES, EPRIST): l'exigence d'interopérabilité est la primordiale tant pour le CNRS lui-même, où sont représentées toutes les approches disciplinaires, que pour tous les travaux de recherche conduits à l'heure numérique quels qu'en soient les disciplines et les laboratoires d'origine, dans la recherche publique nationale et en dehors. L'optique de Science Ouverte a ainsi été recherchée par un ensemble cohérent de démarches et de projets visant ;

- le repérage des atouts et handicaps des pratiques existantes : documents stratégiques de la DIST, de l'INIST, de PERSEE, du CCSD ;

- la connaissance fine des pratiques nationales des laboratoires et des Etablissements de recherche : enquêtes en 2014, puis en 2015 et 2016 avec le COPIST ;

Page 7: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

7

- l'adaptation des règles garantissant l'optimisation du partage des connaissances : refontes réglementaires et législatives sur les données, et bien sûr, loi "Pour une République numérique".

La période 2017-2020

Pour reprendre un découpage temporel européen, la période qui s'ouvre est au moins aussi porteuse d'acquis et de défis et ouvre à la fois :

- à la stabilisation des pratiques numériques nouvelles de la recherche sous la forme de services à la science et à ses usagers,

- au développement d'applications nouvelles des résultats scientifiques aux besoins de la société ;

- à l'articulation dans les deux cas entre les projets développés en France et les projets internationaux.

Un tableau synthétique et comparatif à la fin du rapport présente l'essentiel des évolutions détectées par le rapport, enregistrées et attendues dans ces deux phases, passée et à venir.

La phase à venir repose sur une série très dense de chantiers d'organisation et de construction de services : création et homogénéisation de réseaux de plateformes dotées de règles et langages interopérables, normalisation des "grammaires "et "vocabulaires" de l'IST à grande échelle et dans des formes stabilisées, développements des échanges et interactions de données à très grande échelle, mise en place de nouvelles formes contractuelles pour accompagner des formes inédites de création de valeur, pour ne citer qu'un échantillon des changements en cours de préparation.

Bien entendu, ces changements seront accompagnés de nouveaux modèles de création de valeur, de nouveaux services à la recherche, et d'une structuration nationale du potentiel de l'INIST enfin stabilisée, et accompagnée d'un développement dynamique.

Comme cela fut le cas ces dernières années, ces changements vont s'accompagner d'une intense activité de discussion et de débats entre les parties prenantes de l'IST nationale, de sa construction et de ses usages : je forme le vœu que ce court rapport permette d'esquisser un balisage et un éclairage sur les choix futurs dont l'IST a besoin dans cette période d'intense transformation.

Renaud FABRE, juillet 2017

Page 8: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

8

0. PREAMBULE : Quelle vision de l’IST ? 0.1. À l’heure numérique : Que transforme l’IST ?

De nouveaux supports ont donc émergé pour héberger l’IST. Il s’agit notamment de vastes plateformes, mettant en relation une (ou plusieurs) offre(s) avec une (ou plusieurs) demande(s), dans des systèmes multifaces qui fonctionnent essentiellement comme des organes de référencement produisant à partir de larges listings des résultats selon les filtres appliqués par l’utilisateur. Ces plateformes font l’objet de démarches nouvelles s’inscrivant dans la digitalisation de la science, qui fonctionnent en « couches de cycle » interactives entre des users et des items. Cette digitalisation s’appuie sur deux grands objectifs indissociables ; l’interopérabilité et la réduction des déformations induites par les nécessaires opérations de traduction entre le langage humain verbal et les langages machine.

Plateformes et régulation dynamique des contenus

Page 9: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

9

Les plateformes proposent des services IST qui sont des outils de documentation, de recherche, d’analyse et de mise en relation. Ces services sont construits à l’amont par différents acteurs privés et publics, et encadrés par les règles issues de la Loi pour une République Numérique et les lignes de conduite adoptées par les organismes et agences d’Etat tels que la mission Etalab. L’Etat et les différents acteurs situés dans les organismes mûrissent de façon partagée les grandes orientations financières et réglementaires en vue d’établir des principes qui ouvrent et sécurisent les possibilités d’usage des outils par les chercheurs. Les principes viennent à l’amont, et conditionnent les usages des services par les chercheurs, tandis que les règles forment un cadre rigide mais en constante adaptation, dans lequel les usages peuvent s’épanouir sans danger. Le CNRS et les études COPIST jouent un rôle prépondérant dans la définition des conditions d’accès des chercheurs aux services IST, et l’expression de leurs besoins influe à son tour sur le développement de ces services, de la programmation informatique à l’ergonomie en passant par les ressources inclues. Il s’agit donc d’une interaction tripartite à variables multiples, où chaque action d’un acteur rétroagit sur celles des autres.

Une approche systémique : vers l’interopérabilité

Page 10: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

10

0.2. Définition : La nature de l’IST

L’information scientifique et technique (IST) désigne l'ensemble des informations nécessaires à l'activité scientifique comme à l'industrie. Bien qu’elle fût originellement principalement représentée par des formats papier, elle recoupe aujourd’hui grandement l’information produite par les recherches simples faites par les citoyens, c’est-à-dire les données sur les utilisateurs et les usages, harmonisées dans de grands fichiers par les moteurs de recherche et les plateformes. En ce sens, l’IST se définit plutôt par ses modalités de partage et ses destinataires que par ses producteurs ; son champ étendu couvre donc toute information dont le contenu spécialisé permet de développer des modèles scientifiques ou d’élaborer des applications commerciales ayant trait à un domaine scientifique à terme. L’IST peut se lire comme une matière ayant plusieurs dénominateurs communs ;

Une caractérisation de la nature et du périmètre de l’IST ■ Au premier abord, l’IST est pareille à un fluide en ce qu’elle se constitue par les apports infimes et constants de diverses sources, qui se déversent dans de petits affluents (les matériels informatiques particuliers et locaux), confluant vers de grands bassins (les serveurs et centres de stockage), puis qui communiquent tous entre eux à la manière des océans. Ces sources sont notamment des chercheurs, des universités, des citoyens, et des entreprises.

Page 11: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

11

■ Ce fluide connaît aussi ses cycles et protocoles, et à l’image des nuages qui se forment de minuscules gouttelettes et redeviennent à leur tour pluie, celui qui émet des données personnelles par ses recherches et activités (cookies, historique) reçoit à son tour, et absorbe, des données organisées, suggérées et adaptées en provenance des plateformes. La catégorie de ceux qui ont besoin d’IST recouvre une réalité très large ; il peut s’agir de chercheurs, d’institutions, d’entreprises, mais encore d’associations, et plus globalement la société civile en général. ■ Sont-ce les données qui « font » la science, comme le suggère le mouvement pour un « Quatrième Pilier » de la science ou bien, comme l’avance la Contribution du CNRS à la Stratégie nationale de la Recherche, la science possède-t-elle des fondements numériques complexes ? 1er fil rouge : Adapter les compétences et usages à l’évolution de l’IST par la formation ■ En ce sens, un premier « fil rouge » du présent document doit se focaliser sur la définition inchangée de l’IST, ce qui en constitue sa base, et les moyens d’adapter les réalités de ceux qui ont besoin d’IST à cette base, en les préparant et en les formant. Ce processus a déjà été largement engagé, et mérite une réflexion quant à ses voies de pérennisation. 2nd fil rouge : Rechercher et publier pour un coût modeste et en toute sécurité ■ Ensuite, l’IST dépasse cependant cette métaphore simplifiée, car contrairement à l’eau terrestre, qui toujours demeure égale à elle-même et dont on ne peut que disperser, répartir les molécules sans en ajouter, son volume total est en constante et exponentielle augmentation. Le second « fil rouge » doit donc s’attacher à permettre à celui qui recherche, qui fonde ses espoirs sur l’acquisition de nouvelles connaissances parmi ce nombre croissant de publications et bases de données, de pouvoir explorer les chemins les plus larges (potentialisation par l’acquisition de fonds documentaires), sans pour autant s’y perdre (référencement, loyauté des plateformes), ni encourir de dangers (protection des droits d’auteur, des données, de la vie privée, droit à l’oubli). En effet, si nul ne peut affecter cette production exponentielle d’IST, car elle dépend de chaque individu et se nourrit d’elle-même en recoupant les données entre elles dans un monde numérique peuplé d’interactions, un cadre coopéré par tous les acteurs nationaux doit

Page 12: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

12

permettre à l’usager des plateformes et services IST de ne pas se perdre, ni encourir le moindre danger en les utilisant. 3ème fil rouge : Simplifier le point d’entrée, les conditions d’usage et de partage ■ Enfin, cette croissance exponentielle de l’IST a eu comme corolaire la création par des ingénieurs et programmeurs de nouveaux outils et services (services partagés d’organisation du travail, fouille de textes avancée (TDM), bibliométrie) pour la traiter. Le troisième « fil rouge » concerne donc les besoins exprimés par les chercheurs d’unification d’outils aujourd’hui disparates et aux utilités se recoupant pourtant souvent. Ces besoins doivent trouver une réponse maximisant l’efficacité des outils sous la contrainte de prise en main par ceux auxquels ces derniers sont destinés ; le non-recours et les mauvais usages seraient ainsi diminués. En outre, ces points d’entrée simplifiés vers l’IST doivent présenter, pour plus de commodité, un caractère interopérable, et être adaptables facilement à chaque domaine de la science. ■ Pour synthétiser le déroulement ces trois fils rouges à chaque étape, ce tableau de trois colonnes évoluera en début de chaque partie ; Une définition inchangée Un changement d'échelle (big

data) De nouveaux outils pour la traiter (smart data)

0.3. Mutations en cours

Des externalités positives au cœur d’une formidable prise de volume

L’IST connaît des externalités positives générant une multiplication endogène des potentiels ; plus il y a de volume d’IST mis en relation sur une même plateforme, un même outil de traitement, plus il y a de potentielle IST générée. Métaphoriquement, l’IST est un monde où 1 + 1 est égal à 3. Plus encore, ce phénomène est exponentiel ; (2 + 2) > 6. Les chercheurs, les citoyens et les entreprises produisent de l’IST en publiant des articles et textes (voie classique), mais également en générant des données par leurs recherches bibliométriques et leurs propres travaux (voie périphérique). Elle a connu, sur les 20 dernières années, une progression exponentielle comparable à celle connue par la puissance des processeurs décrite par la loi de Moore. Cette prise de volume a été accompagnée et encadrée par une évolution majeure dans 3 domaines ; les supports, les usages et les outils de traitement de l’IST.

Page 13: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

13

0.3.1. De nouveaux volumes

La constante est le volume de ces données, réparties sous divers formats dans des endroits physiques très éparpillés et avec des conditions sécuritaires très hétérogènes ; entre 1980 et 2015, le volume total des données a connu une prise de masse sans précédent, à tel point qu’il est estimé1 que l’Humanité produit aujourd’hui en 2 jours autant de données brutes que pendant les 2 millions d’années précédant l’avènement de l’informatique. Bernard Benhamou, délégué aux usages d’Internet auprès du ministère de l’Enseignement supérieur et de la Recherche : « L’essentiel du volume d’informations généré aujourd’hui l’est encore par des humains, mais, dans les prochaines années, il sera produit par des capteurs.» ■ Ces capteurs peuvent notamment être des outils de précision utilisés par les sciences dures, comme des outils statistiques chers à la sociologie, ou encore des détections automatiques issues de larges fouilles de textes concernant les SHS. Serge Abiteboul, de l’Institut national de recherche en informatique et en automatique (Inria), dans une interview pour Libération : « La nouveauté, c’est la capacité à croiser toutes les données en provenance des capteurs, du Web et de l’Open Data gouvernementale. » ■ Le téraoctet est couramment utilisé par les unités de recherche voire les particuliers, et les entreprises connaissent le pétaoctet depuis plusieurs années déjà. Ces volumes

1 INSEE et Eurostat, 2015.

Page 14: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

14

sont hors de toute mesure humaine, et les consciences ne peuvent donc plus les traiter, ni même avec l’aide d’outils traditionnels. C’est en cela que l’algorithmique et le traitement par l’intelligence artificielle sertie du deep-learning prend son sens, afin de rétablir du sens et de permettre aux chercheurs ou aux citoyens de s’y retrouver au beau milieu de cet océan, de ces torrents d’IST se déversant sans jamais discontinuer. Jean-Yves Pronier : « C’est bien d’avoir des données, mais c’est mieux de les faire parler. Et, pour cela, les technologies traditionnelles ne suffisent plus. » 0.3.2. De nouveaux supports et démarches : plateformes Quels rôles pour les plateformes de l’IST ? ■ Certaines plateformes sont commerciales, d’autres non. Certaines ont un nombre de filtres restreint, d’autres beaucoup. Certaines encore hébergent des biens et capacités de service en leur possession, d’autres présentent simplement des biens et services de prestataires extérieurs. Enfin, certaines ont une matière bien définie, et d’autres sont généralistes. Des articles papier s’additionnant au sein de journaux eux-mêmes compris dans des cercles de diffusion, l’IST a éclaté en des bribes d’information disséminées et rapprochables par la recherche voire le text and data mining (TDM), qui forment à chaque nouvelle recherche une nouvelle galaxie de possibles, un nouveau texte qui se lit différemment et associe plusieurs auteurs, plusieurs contributeurs. Les données personnelles issues de ces recherches ont bien évidemment trouvé une place plus discrète pour le grand public, et constituent la matière première des plateformes. ■ Dire « plateforme », c’est comprendre, avec une pondération différente selon le contexte, trois grands rôles fonctionnels qui interviennent dans la chaîne fléchant cette information vers l’utilisateur final ;

HEBERGEUR Stocke des data sets bruts

(matériellement) EDITEUR Sélectionne des portions de données

AFFICHEUR Gère l’ordre et les modalités de listing des résultats

Page 15: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

15

La situation du marché actuel des plateformes : entre hégémonie et reconfiguration ■ De grandes plateformes anglo-saxonnes monopolisent les marchés, pour trois grandes raisons ;

1. d’abord car cette économie est automatisée, dématérialisée et désintermédiée, ses coûts fixes de lancement très forts, et ses coûts marginaux quasi-nuls

2. ensuite, car les effets de réseaux y dominent (plus il y a d’utilisateurs sur une plateforme donnée, plus le coût d’opportunité de la quitter est fort, et plus elle croît)

3. et enfin et surtout parce que les plateformes réalisent de larges marges et bénéfices, en offrant souvent un modèle « Premium », en plus de revendre la valeur publicitaire générée par l’agrégation des audiences (vues, clics, temps passé, etc.) qu’elle reçoit.

■ Cette hégémonie a généré un questionnement sur ce que devrait être la « loyauté » de ces plateformes envers leurs utilisateurs ; en effet, le niveau de maîtrise moyen par les utilisateurs des outils numériques ne permet pas à ces derniers d’appréhender avec précision la complexité des modèles économiques et du partage des revenus par les plateformes. La caractéristique du concept anciennement admis de plateforme est qu’il désigne un aspect pragmatiste, quasi-visuel, de la réalité offerte à l’utilisateur, et non un rôle précis dans le circuit de la valeur-information. Un rapport de force que la loi doit arbitrer ■ La particularité de l’IST est qu’elle se cache partout, y compris dans les métadonnées des moteurs de recherche tels que Google. La trouver relève donc d’une compétence technique avancée, ou de l’usage des plateformes, qui doivent donc présenter des conditions d’utilisation simples et ne trompant pas l’utilisateur, le rapport de force réel étant très déséquilibré entre des expertises serties d’algorithmes et des profanes munis de leurs seuls ordinateurs personnels. C’est ce rapport de force que la Loi pour une République Numérique doit tenter d’arbitrer avec des principes tels que la « loyauté des plateformes ». En outre, la loi pour la confiance dans l'économie numérique (LCEN, juin 2014) prévoyait déjà l'obligation de signaler qu'un contenu est publicitaire, ce qui s'applique par exemple aux liens sponsorisés. On peut imaginer un système de labellisation d’Etat, révélant l’information payée, potentiellement complété par un peer-

Page 16: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

16

reviewing en blockchain, révélant quelle information est fiable, afin de permettre à l’utilisateur de savoir qui est qui. 0.3.3. De nouvelles formes : métaconnaissances… Les différents niveaux d’IST ■ L’IST regroupe des données brutes pouvant servir dans des études statistiques, des tests, ou encore l’élaboration d’articles et textes exigeants une réflexion périphérique, mais elle s’étend également plus loin. Jusqu’à la donnée qui parle de données, la métadonnée. Il peut s’agir d’informations sur les volumes, les récurrences, les dates, les contenus spécifiques. Et cela s’inscrit dans plusieurs cadres ; bibliométrie, analyse de la production scientifique, de la production de données par les consommateurs, les utilisateurs, les usagers, etc. ■ L’information scientifique et technique, c’est en définitive l’ensemble des données chiffrées, verbales et/ou picturales, qui abritent le potentiel d’un usage pour améliorer l’état de connaissance scientifique, ou rendre possible l’application d’un nouveau produit commercialisable à terme. QUELQUES EXEMPLES D’IST

Production Destination

Articles scientifiques Chercheurs Chercheurs, société civile Données bibliométriques Chercheurs, experts TDM Chercheurs Big data Consommateurs, citoyens Entreprises, Etat Algorithmes statistiques Entreprises Entreprises, Etat Un périmètre large pour comprendre l’IST ■ Aussi, ces données doivent être entendues dans un sens très général, et inclure à la fois les données issues de la Recherche (collectées par les laboratoires et le CNRS), celles issues des autres sphères administratives, c’est-à-dire des citoyens en tant qu’entrepreneurs, contribuables et usagers (collectées par les services de l’Etat), et enfin celles issues des citoyens en tant que consommateurs (collectées par des entreprises). ■ Assimiler une méthodologie prend du temps pour le chercheur, émetteur de la connaissance, comme pour le lecteur de l’article, de la revue, du brevet, qui en est le

Page 17: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

17

récepteur mais aussi le tributaire. Il y a une opposition classique entre deux logiques ; une première logique, existante semble-t-il depuis toujours, qui veut que l’émetteur de la connaissance soit docte, assimile la méthode et le langage technique afin de travailler dans un environnement spécialisé, et que ce dernier soit responsable directement, ou laisse à des intermédiaires la responsabilité de la vulgarisation vers le récepteur. Une seconde logique, apparue depuis les années 1990 avec l’émergence d’internet, qui veut que les rôles d’émetteur et de récepteur soient confondus, et que les deux maîtrisent le même langage et la même méthodologie, afin de pouvoir communiquer directement, l’un et l’autre étant tour émetteur et récepteur. L’intermédiaire est dans ce cas relégué au rôle transitoire du commentateur ponctuel. Le partage et les circuits de l’IST ■ L’IST peut être considérée comme un produit qui se transmet, mais cette voie classique de production trouve sa limite dans un fait pas nécessairement intuitif, que les groupes travaillant dans le secteur numérique connaissent bien comme étant leur source de revenus la plus importante ; l’IST se génère aussi par les habitudes de recherche, et d’interaction (ex : réseaux sociaux, peer-reviewing sur les plateformes, etc.) des utilisateurs. Voie classique ; Emetteur de l’info A Récepteur de l’info A, avec différents niveaux d’intermédiation Voie périphérique ; Emetteur de l’info A Récepteur recherche info A produit info B Récepteur de l’info B ■ L'innovation repose surtout sur l'évolution des systèmes d’information, des bases de données, des systèmes d'archivage, de la gestion électronique des documents (GED), des traitements linguistiques, de la conceptualisation de l'information, de la connaissance i.e. tout ce qui peut enrichir les bases de données et accélérer la recherche en ligne. Il faut être en mesure de s'emparer des technologies novatrices pour optimiser le traitement ou l'accès à l'information.

Page 18: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

18

0.3.4. De nouveaux usages : recommandation, captation contrôlée ■ En ce sens, les chercheurs en situation de recherche documentaire produisant de l’IST (par la création de schémas bibliométriques ou leurs propres historiques de recherche) sont rapprochables des citoyens en situation de consommation ou d’activité sociale. Cette voie périphérique est donc à protéger et doit faire l’objet de règles différentes de la voie classique, qui connaît déjà un long passé de techniques de protection juridique (brevets, contrats, notion de secret). Des indicateurs bibliométriques (répartition par institut, relations interdisciplinaires, part nationale ou régionale, collaborations internationales,…) sont produits par le Service d’appui à la politique et à la prospective scientifique (SAPPS) de la Direction d’appui à la structuration territoriale de la recherche (DASTR), et sont largement utilisés. Les nouveaux usages dans l’entreprise ■ A l’échelle collective, au sein de l’entreprise, la voie périphérique se doit d’être encore plus protégée, en raison des potentielles distorsions de la concurrence qui pourraient résulter d’une divulgation des informations privées des clientèles et modèles de management internes. ■ Les entreprises sont un acteur majeur qui, en prenant leur part dans le réemploi de l’IST à fin commerciale, ont profondément modifié les normes qui la structurent. Elles produisent de l’IST à plusieurs titres ;

- En recevant et incrémentant l’IST produite par les chercheurs afin de servir les intérêts de ces derniers, dans des marchés de niche (voie classique spécialisée)

- En développant de nouveaux produits grâce à l’IST (voie classique commerciale) - En produisant leurs propres données IST (voie périphérique)

De grands axes d’usage IST contemporains ■ Les recherches en IST s'organisent autour de trois axes correspondant à de nombreux nouveaux usages potentiels : les mathématiques appliquées, les techniques symboliques et numériques de l'intelligence artificielle et le Traitement Automatique du Langage (TAL). ■ La recherche d’une donnée précise au sein de corpus de plus en plus larges, la compilation, le TDM, la citation et la création automatique de bibliographies, sont autant

Page 19: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

19

de nouveaux usages cruciaux qui amènent à des innovations dans la manière de gérer les supports et outils IST. La gestion des usages de l’IST est répartie, comme suit, en différentes catégories, avec des volumes différents ;

Source : analyse technico-budgétaire par le cabinet Ourouk

0.4. Contexte et objectif du présent document Points d’ancrage fixés et limites de la Stratégie 2013

Le document de Stratégie IST 2013 avait souligné plusieurs défaillances concernant la mise en œuvre d’une cohérence nationale dans les usages et la gestion de l’IST. Cependant, plusieurs études ont souligné les insuffisances de cette approche, qui intervient dans le cadre d’évolution rapide et changeante qu’il a été donné de voir dans le point précédent.

Page 20: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

20

- D’abord, l’enquête UMR auprès des directeurs d’unités (DU) avait mis en évidence une connaissance des pratiques incertaine et inégale, rendant le non-recours aux outils numériques de traitement et d’analyse de l’IST très prégnant.

- Ensuite, et du fait de cette connaissance incertaine, l’enquête COPIST avait

souligné la difficulté dans la mise en œuvre concrète d’un partage de l’IST efficace et élargi.

Page 21: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

21

- Enfin, il manquait des normes d’encadrement juridique de l’IST, prenant en compte ses spécificités ayant trait au numérique et portant en conséquence des modifications dans tous les domaines de la Loi.

La résolution des questions ouvertes : marché-cadre, PAP, coopération européenne ■ La mise en place d’un marché-cadre national pour l’acquisition de ressources documentaires, ainsi que la communication établie entre les acteurs de l’IST (établissements, universités, unités mixtes de recherche (UMR), administrations) ont permis d’amorcer une mise à niveau des connaissances et une relance du partage. La recherche en IST autour du Pôle Lorrain (Université de Lorraine, LORIA, ATILF…) et de l’INIST est venue en appui aux projets IST du CNRS et de tout l’Enseignement Supérieur et Recherche (ESR). Les projets retenus viseront une valorisation économique et sociale. Un partenariat sur l’IST a été développé par mise en réseau des projets des organismes de recherche. Les travaux d’amont visant l’interdisciplinarité ont été développés en partenariat avec la Mission Interdisciplinarité (MI). ■ En 2014, l’analyse stratégique de l’IST française (SIST : « Mieux partager les connaissances ; Une stratégie ouverte pour une information scientifique et technique d’avenir ») rappelait les 4 plans d’action partagée (PAP) définis par le Directeur général délégué pour la science du CNRS, visant à mieux : 1."Se documenter", 2."Publier", 3."Analyser l'information", 4."Accompagner l'IST et sa valorisation". Ces PAP ont porté leurs fruits dans différentes mesures, et un retour sur les résultats doit être effectué, comme une reformulation des objectifs à la lumière du recul acquis d’une part et des nouveaux événements survenus dans le monde de l’économie numérique de l’autre. Conjointement à cette progression globale de la Recherche et de l’Education pour la science numérique, la Loi pour une République Numérique (LPRN) a fait émerger les premières bornes d’un cadre juridique agile et intelligent, qui prend en compte l’apport économique des grandes entreprises du secteur sans l’ignorer et tout en protégeant les données pour l’intérêt général. Cette Loi constitue le point de convergence de toutes les attentes des acteurs de l’IST, et tous les regards convergent donc dans sa direction. Les objectifs de la Stratégie IST 2013 ont donc été atteints. ■ Ces 4 PAP étaient ensuite reliés parallèlement à 10 grandes orientations (O) pour l’action concrète visant à faciliter les 4 démarches. D’abord, une conception évolutive consistant à partager les savoirs et compétences au service de l’IST (O1 ; anticiper et

Page 22: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

22

construire les options globales, O2 ; adapter les savoirs et compétences, O3 ; former par et dans la recherche). Ensuite, l’ouverture des modalités pour accueillir les besoins de tous les chercheurs (O4 ; harmoniser l’offre et la demande d’IST, O5 ; partager les ressources communes HAL et Persée, O6 ; valoriser et partager les données de la recherche, O7 ; identifier et analyser les publications, O8 ; une stratégie globale pour le libre accès à la science publique). Enfin, une régulation partagée destinée à dynamiser les pratiques (O9 ; partager les règles, O10 ; innover dans les démarches). Ces 10 orientations ont connu des développements alternant entre réussites et difficultés de mise en œuvre, entraînant parfois la « mise en silos » de certaines logiques, alors même que des fusions et des interactions sont possibles. C’est pourquoi le présent document stratégique tâche d’adapter les recommandations au paysage de l’IST 2017, avec ses nouveautés, et fort de l’héritage des stratégies antérieures. La partie II (Vision) détaille les points d’amélioration proposés, qui sont ensuite repris de façon synthétique dans la partie III (Résumé et plan de mise en œuvre). ■ A l’échelle européenne également, la déclaration de Berlin (2003), les principes OCDE d’accès aux données de recherche (2006), les principes des conseils de recherche britanniques (2011), les recommandations de la Commission européenne (2012) suite au rapport «Riding the Wave» (2010), les directives de l’OSTP vers les agences fédérales de recherche américaines (2013), sont autant de recommandations, principes voire injonctions à partager, rendre accessibles les productions scientifiques de recherche, tout comme la directive européenne 2007/2/CE du 14 mars 2007 (INSPIRE), qui vise à établir une infrastructure d’information géographique dans la Communauté européenne pour favoriser la protection de l’environnement. Son application aux données de la recherche fait l’objet de soins attentifs de la part de l’Institut Ecologie et Environnement (INEE) et de l’Institut National des Sciences de l’Univers (INSU). Explorer les zones de questionnement profondes tout en répondant aux besoins immédiats ■ Néanmoins, des interrogations majeures demeurent, en raison de la perpétuelle évolution des attentes et de la technologie y étant associée. Le cabinet Ourouk a été chargé par la DIST du CNRS d’identifier les grands points de tension empêchant le partage de l’IST. Au nombre de 6, ces « verrous » sont à lever pour assurer une meilleure cohérence du système national, et grâce aux activités et entrevues mises en place à la mi-2017 par Ourouk, ils concentreront les efforts de chacun pour poser la première brique des objectifs de l’Horizon 2020 (H2020). Un verrou est en général plus

Page 23: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

23

politique que technique : les mathématiciens utilisent par exemple une base de données IST spécifique, qui pourrait facilement être convertible vers le format employé sur le Système Universitaire de documentation (SUDOC), mais certaines logiques de chasses gardées persistent. Par ailleurs, en dehors des « verrous » que les études du cabinet Ourouk s’emploient à définir, certaines inerties correspondent à des zones d’oubli, qui n’ont simplement pas recueilli jusqu’alors l’attention nécessaire au changement ; les thèses en ligne ne sont par exemple pas signalées dans le SUDOC. ■ Un premier pas a été fait, durant l’année 2016-2017, en réunissant dans une liste claire, exhaustive et cliquable tous les outils et supports participant de l’offre IST pour les chercheurs. Elle est en ligne sur le site de la DIST, et permet, en amont d’une simplification des outils eux-mêmes, d’apporter en miroir une simplification de l’accès à ces ressources. A la moitié du gué : les objectifs 2017 inscrits dans le projet d’un grand Etat numérique ■ Le présent document de Stratégie IST 2017 ne prétend pas apporter une réponse unilatérale et exhaustive à la multitude d’enjeux soulevés par le passage de la France et de sa Recherche à l’heure numérique. Il s’agit bien plutôt de prendre acte dans un premier temps des étapes d’ores et déjà franchies pour fournir une vision d’ensemble claire et synthétique (1), pour ensuite estimer la portée et la direction des actions qui restent à mener tout en en identifiant les points de tensions (2). Enfin, un bref résumé établira les circuits de mise en œuvre des préconisations ayant été effectuées (3). ■ L’ensemble de ces événements marquants, dans tous les secteurs de l’IST, ont jalonné le long sentier vers un grand Etat numérique. La Recherche française, et la France toute entière, sont à la croisée des chemins. Dans cet état intermédiaire, à la mi-parcours en quelque sorte, il est nécessaire de préciser la portée normative de la LPRN, qui doit s’inscrire dans un cadre européen plus large et plus profond, en visant la mise à niveau de la France vis-à-vis de ses partenaires. Il est nécessaire de développer de nouvelles pratiques opérationnelles, modifiant les structures et les logiques de la politique numérique nationale concernant l’IST ; en ce sens, la réforme récente de l’INIST a ouvert des perspectives d’optimisation des ressources mobilisées. Ces perspectives s’inscrivent dans un ancrage territorial fort, celui d’un pôle d’excellence IST en Lorraine. L’INIST, en association avec des partenaires universitaires dont en particulier l’Université de Lorraine, dispose d'atouts pour développer le pôle d’excellence

Page 24: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

24

en IST qui s’impose au niveau national. Cette conviction s’appuie sur les compétences qu’a développé l’INIST mais aussi la présence de recherche de qualité sur le traitement automatique des langues, tant au sein de l’ATILF que du LORIA (plus spécialement dans son département « Traitement automatique des langues et des connaissances »). La présence d’un laboratoire de recherche de qualité en sciences de l’information et de la communication, le Centre de Recherche en Ethnomusicologie (CREM), complète ces ressources. ■ La stratégie IST doit être considérée comme une politique d’investissement visant l’intérêt général et l’équité intergénérationnelle. En effet, d’une part les secteurs intégrant l’IST sont créateurs de connaissances, et à terme de valeurs économiques réelles, mais ne sont rentables qu’à long terme et avec de fortes incertitudes ; l’Etat doit donc jouer un rôle de développement des innovations, y compris en sciences humaines et sociales. D’autre part, des quasi-monopoles ayant émergé grâce de forts coûts fixes et de faibles coûts marginaux et à l’effet de réseau, une action de sécurisation de l’emploi et des données IST doit être menée par tous les partenaires français, et ce dès la formation des personnels produisant et gérant l’IST, évitant parallèlement leur subordination complète à des méthodes et besoins ne représentant pas l’intérêt général national. 0.5. Une vision d’ensemble fournie par le CNRS aux acteurs de l’IST Le positionnement du CNRS en tant qu’acteur coordinateur

Les positions du CNRS sont motrices dans la définition et la promotion des positions nationales, européennes et internationales en faveur d'une IST partagée. Comme les constats globaux l'ont mis en évidence, le CNRS est présent dans toutes les enceintes nationales, européennes et internationales où progresse le projet de la Science ouverte. Ces positions peuvent s'appuyer sur des ressources et des réflexions internes qui développent autant de lignes d'actions opérationnelles. Les difficultés à assurer la cohérence globale des positions en faveur de la science ouverte ne sont pas sous-estimées, comme le montre les étapes en cours des négociations sur l'Open Access (cf. Principe d'action 8).

■ Les positions internationales, européennes et nationales du CNRS en faveur de la Science ouverte sont confortées par l'ampleur des besoins et la qualité des propositions de mise en œuvre. Ces positions s'appuient à l'amont sur l'action du

Page 25: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

25

Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation, dans le cadre de la Bibliothèque Scientifique Numérique (BSN). Le Schéma d'Orientation stratégique s'appuie sur le projet national de la BSN, dont le programme observe : "Le secteur de l’édition scientifique a été totalement bouleversé par les nouveaux modes de diffusion du savoir, à la fois sur les plans économique et heuristique.(…) Aux médiations traditionnelles a succédé un ensemble d’usages qui méritent d’être encouragés tout en conservant la liberté indispensable à l’exercice scientifique et la qualité des protocoles de validation de la production scientifique". Le Chantier BSN 7 mène dans ce sens une veille globale sur l'Edition scientifique numérique et a mis en place la ressource nationale qu'est le Collège de l'Edition numérique scientifique. Une enquête nationale est lancée sur l'Edition scientifique : le CNRS y participera activement. Une vision générale à l’écoute des chercheurs et qui sert leurs intérêts ■ Le CNRS, en tant qu’acteur possédant une vision globale de l’écosystème scientifique des chercheurs, producteurs et consommateurs d’IST français, adresse donc à tous ses partenaires ce document afin de focaliser les attentions sur les points stratégiques qui constitueront les leviers numériques et éthiques d’encadrement de l’IST dans les années à venir. Le champ d’action de la Direction de l’Information Scientifique et Technique du CNRS est donc orienté vers la collecte des requêtes émanant des différents acteurs de l’IST, la définition des limites des périmètres de cette dernière, ainsi que la formulation de recommandations dans la mise en œuvre de la formation, des outils eux-mêmes, et de l’application des normes juridiques. Cette approche, fondée sur l’interdépendance des communautés de chercheurs et la mutualisation de l’IST dans les UMR, par-delà les frontières des institutions, repose à l’amont sur la BSN, l’Association des directeurs et personnels de direction des bibliothèques universitaires (ADBU), le Consortium Couperin, sur l’Agence bibliographique de l’Enseignement Supérieur (ABES), qui acquièrent les ressources et analysent l’évolution des modèles de collaboration et de publication. Ces partenaires sont en relation étroite avec le CNRS, notamment à travers le projet ISTEX. Contre l’effet « page blanche » : une méthode tenant compte de l’existant, des efforts déjà entrepris ■ Le projet stratégique du CNRS doit prendre en compte et s’inclure dans les projets déjà réalisés à la périphérie dans certaines CMUE, et créer des liens forts évitant les doubles usages avec les projets de l’administration centrale. Il vise donc à poursuivre et

Page 26: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

26

renforcer la formation et le partage, et à définir l’effort d’ouverture des perspectives qui doit être mené par le groupe de travail sur le Guide d’Application de la LPRN, afin de permettre la mise en œuvre forte et complète de cette Loi, et plus largement la mise en cohérence des démarches entreprises par chaque acteur. En effet, tous ceux qui font avancer l’état du progrès technique des outils de l’IST doivent pouvoir réfléchir et agir au sein d’un cadre mettant en commun les intérêts des différents secteurs publics et privés, dans la sérénité et la coopération. ■ Le CNRS consulte et forme, d’abord, puis il construit lorsque la solution publique est optimale, et enfin il co-gère si cela est nécessaire. Le principe général de son action répond en quelque sorte à l’idée selon laquelle donner un poisson ne nourrit qu’une fois, quand apprendre à pêcher nourrit toute une vie. ■ La problématique de l'accès à l'IST et des services offerts aux communautés de recherche doit être abordée par une double entrée : celle du national pour offrir une vision partagée par tous les acteurs de l'ESR et pour offrir des outils mutualisés (dans leur conception ainsi que leur gouvernance) mais aussi celle du local afin d'exploiter le potentiel de la proximité de terrain, de la connaissance des champs de recherche et des besoins exprimés par les chercheurs. Ce dialogue permanent entre local et national doit s'exprimer dans la notion de "réseau" qui a déjà fait le succès des réussites françaises en matière d'IST (Couperin, ABES, unités régionales de formation à l’IST (URFIST)...).

Page 27: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

27

1. CONSTAT : Des attentes partagées entre les nouveaux acteurs de l’IST : Une dynamique pour la science

Le besoin d'être formés à l'interaction avec l'IST

Un besoin d'accéder pour un prix modeste à ces larges fonds documentaires

Un besoin d'unification des outils, aux utilités aujourd'hui superposées

1.1. Une nécessité commune : Ouvrir et simplifier les conditions d’accès La crainte réaliste d’un éparpillement des outils et supports de l’IST

Les utilisateurs principaux de l’IST font état d’une trop grande ramification des supports, et d’une complexité de certains outils, conçus pour une prise en main spécialiste plutôt que pour un usage généralisé. La gouvernance des projets d’IST présente des modalités très différenciées d’une communauté de recherche à l’autre et s’appuie sur un potentiel de service dont le trio « informaticien, documentaliste, chercheur » est la forme de base, avec des déclinaisons. Le partage des données de l’IST et de la somme monumentale de connaissances qu’il suppose ne peut être permis que dans un environnement de travail où l’offre est modulable, adaptable aux besoins de chacun, et surtout organisée ; c’est-à-dire que l’ensemble de l’IST disponible à un moment t pour une personne x doit être visible par x en t. Un engagement partagé en faveur du libre accès (Open Access) et d’une Science Ouverte Par la Déclaration de Berlin, le CNRS s'engageait en 2003 dans la voie du libre-accès aux résultats de la recherche publique, position réaffirmée par les « Position statements » dans le cadre de ScienceEurope en 2013. Dans le même sens, la Recommandation aux états membres de la Commission Européenne en 2012, s'impose, tout comme la position ministérielle précitée de 2013 et les recommandations du G8. Depuis dix ans, les déclarations, initiatives, créations d’archives ouvertes et de journaux en Open Access se sont multipliés. L’INIST a mis en place un outil de veille fort complet,

Page 28: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

28

« Libre accès à l’information scientifique et technique », qui permet de suivre cette dynamique. Le Centre pour la Communication Scientifique directe (CCSD), dès sa création, a toujours mené des actions de communication, formation et promotion de l’Open Access auprès des communautés professionnelles et scientifiques. L'enjeu global est considérable aussi bien du point de vue du partage des bénéfices de la recherche que de celui des conditions de production de la science, entravée qu'elle est aujourd'hui par les multiples péages qu'imposent les entreprises qui contrôlent les divers stades de la publication d'un grand nombre de disciplines. Cet Open Access doit trouver ses racines dans une culture de la donnée partagée, qui s’appuie sur la formation et sur des logiques de coopération entre les différents acteurs.

1.1.1. Le besoin d’être formés à l’interaction avec l’IST, et informés de ses évolutions La nécessité de former aux nouveaux usages de l’IST en s’appuyant sur des ressources humaines fortes et variées organisées en réseaux

Face à tous ces outils et à la possible unification, l’existence de ces dispositifs n’est d’aucune utilité si elle n’est pas suivie (ou précédée) d’une formation pour les personnels de l’IST mais surtout de recherche (doctorants, chercheurs…), afin qu’ils aient connaissance de ces services et qu’ils sachent les utiliser. C’est donc une sensibilisation qui est nécessaire pour tous les acteurs de la recherche en même temps que la création du COPIST, ainsi qu’une communication sur ces outils. Cette question de la formation mène aussi à une interrogation sur les ressources humaines nécessaires pour le COPIST et son information auprès des personnels : qui le fera ? Dans quel cadre ? Avec quel personnel ? ■ Le CNRS bénéficie du concours d'un personnel formé aux actions d'IST, et relevant de plusieurs familles professionnelles, dont la révision est en cours au MESR avec le concours actif du CNRS (OMES). L'Organisme bénéficie par ailleurs des synergies qu'occasionne la mise en réseau très dynamique de ces personnels, notamment dans les réseaux nationaux que sont : Renatis, Medici, RBDD, RNBM, Démocrite et Docplanets. Ces réseaux ainsi que les divers réseaux régionaux et thématiques des personnels, sont particulièrement présents dans la réflexion nationale sur le devenir de l'IST.

Page 29: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

29

Source : analyse technico-budgétaire Ourouk 2015.

■ Cette réflexion, il est vrai, rejoint pour eux la préoccupation professionnelle d'évolutions de carrière et de qualification qu'impose l'évolution des modèles économiques et technologiques de l'IST. Dans ce contexte, les Réseaux ont pu apporter au CNRS, à la fois, l'expérience très riche et diversifiée de personnels présents dans toutes les communautés de la recherche, mais aussi, de façon particulièrement opportune et bénéfique, une expertise à jour sur les nouveaux modèles de l'IST, notamment ceux associés aux données de la recherche. ■ Au 31 décembre 2012, les personnels d'IST travaillant au CNRS présentent un large éventail de compétences, avec les caractéristiques globales suivantes :

Page 30: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

30

un personnel conséquent (770 ITA CNRS et 132 non CNRS) clairement identifié IST (familles A et C de la BAP F2)3,

des personnels n’étant pas identifiés IST mais assurant des fonctions informatiques indispensables à l’IST (certains personnels de la BAP E notamment) ou travaillant spécifiquement en IST pour un institut scientifique très spécialisé (certains personnels des familles A, B et C de la BAP D4 par exemple),

des personnels de niveau élevé de qualification (la moitié environ des personnels CNRS de la famille A de la BAP F est IE-IR) et ayant souvent une double voire une triple compétence (scientifique, informatique, IST) ; des profils très variés : certains IR, (mais aussi AI et IE, selon l’INSU), effectuent la saisie des publications, selon l’INEE ; les correspondants IST en SHS sont le plus souvent des ITA BAP F mais il y a également des BAP D et des chercheurs.

■ Ce personnel, composé en majorité de femmes, est inégalement réparti au sein des Instituts comme entre les unités. La moitié environ des personnels engagés dans les activités d'IST a plus de 50 ans, avec localement des disparitions progressives de la fonction (dans les UMR INSU notamment). Des exemples pionniers, comme celui du CDS, montrent l’impact important de documentalistes de la BAP F formés à la prise en charge des données scientifiques dans la mise à disposition des résultats de la recherche. ■ Il y a là un chantier stratégique RH à bâtir autour de la formation, de l’évolution des métiers et du développement des carrières, les trois notions étant liées. La question du devenir des personnels de moindre qualification est une question sensible et importante. La difficile mise en place de synergies en raison du localisme des formats et supports, et de la préférence pour d’autres offres de formation ■ L'enquête de la DIST rejoint l'opinion établie selon laquelle il y a localement une difficulté à mettre en synergie les compétences des professionnels de l’IST et les besoins des chercheurs : l'idée a été souvent exprimée que ces deux catégories d'acteurs de l'IST avaient le besoin d'approfondir, voire de renouer, une relation de

2 BAP F : Documentation, édition, communication. Famille A : IST, collections patrimoniales. Famille C : édition multi supports, impression, graphisme. 3 Source : Labintel au 31/12/2012, traitement CNRS / SAPPS 4 BAP D : SHS. Famille A : traitement et analyse de bases de données. Famille B : traitement, analyse et représentation de l’information spatiale. Famille C : analyse de sources écrites, iconographies et orales.

Page 31: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

31

collaboration efficace, à l'initiative des directeurs d’universités (DU). Les personnels expriment nettement le souhait de faire évoluer leurs carrières et leurs qualifications au service de l'IST. ■ A l’heure numérique, il existe en effet une grande diversité de systèmes utilisés pour traiter l’information ; en découle donc une immense variété de formats, qui rend l’interopérabilité difficile et empêche l’élaboration aisée de visions d’ensemble claires. La formation aux usages de l’IST est actuellement assurée par différents acteurs ; le réseau Renatis, celui des URFIST, avec l’INIST et la DIST au cœur du système. Mais sans sensibilisation et une meilleure hiérarchisation des méthodes de formation et priorité, répartissant agilement les charges financières sur les différents acteurs, l’offre de formation reste largement inutilisée et donc inefficace, ce qui est dommageable étant donné son coût. Une certaine préférence semble aller aux formations externes Zotero plutôt que Mendeley. Certains directeurs d’UMR estiment également que la France n’a pas besoin d’une formation nationale, trop coûteuse, et croient davantage à une offre basée uniquement sur des formations locales. L’évidence exigeante d’une formation permettant de déléguer les tâches IST en amont ■ Pour le moment, des initiatives « manuelles » de mise en cohérence des formulations ont été élaborées, par exemple par la mission Etalab qui modifie les formats natifs des données brutes afin de les agréger à l’échelle nationale. Mais une mise en cohérence à la source, rationnalisée et automatisée le plus possible, constitue l’étape suivante nécessaire pour obtenir un système national français de collecte des données compétitif. En 2016, il ressortait de l’enquête conduite auprès des DU que 26% seulement utilisent conjointement un système de gestion de base de données tel que 4D, Oracle ou Access, et un tableur tel qu’Excel afin de proportionner l’outil au traitement, tandis que 14% utilisent un système de gestion complexe seul, et 19% un tableur seul. Il faut encourager la pratique d’un rapport à la donnée systématique et dénué de craintes quant à la conformité ou non de la méthodologie utilisée ; en effet, contraindre trop fortement les normes d’archivage peut conduire à ce qu’une partie importante des opérations d’IST soit faite en version papier, voire sans laisser de traces.

Page 32: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

32

De l’information... ■ Avant tout, un préalable est donc de faire connaître l’existant ; à l’heure actuelle, seules 50% des unités de recherche disposent d’un logiciel de traitement spécifique lié à ses expérimentations, dont une moitié en format propriétaire et l’autre en format interopérable. Les 50% restants déclarent « ne pas savoir », soulignant le manque d’information à ce sujet. Le principe même du DMP promu par (CAT)OPIDOR (Optimisation du Partage et de l’Interopérabilité des Données de la Recherche) est ignoré de nombreux chercheurs, qui ne parviennent pas à en discerner l’utilité concrète au vu des informations actuellement communiquées. Aussi un vrai travail d’intéressement doit-il avoir lieu, en prenant des exemples concrets de l’apport du DMP pour chacun. … vers la rationalisation et le partage de standards communs ■ Il convient donc ensuite d’observer à quel point ces usages ont été rationnalisés autour de formations et de guides encadrant les bonnes pratiques. On observe également une difficile mise en cohérence des procédures standardisées. Ainsi, lors de l’enquête auprès des DU, 24% déclaraient partager une procédure élaborée et partagée par toute la communauté scientifique en ce qui a trait aux formats de données, mais seulement 5% pour la méthode de collecte, 2% pour les descriptifs (métadonnées), et 11% pour l’attribution d’identifiants (DOI) et l’usage d’un vocabulaire unique. 45% de 142 unités signalent encore « ne pas collaborer en interne en ce qui concerne les données et l’IST ». ■ Seules 16% des unités de recherche ont élaboré un plan de gestion de données. Il y a donc un enjeu dans la construction d’un programme national cohérent et interdisciplinaire de préservation du patrimoine scientifique, incluant un archivage pérenne. Ce programme vise deux facettes de la même médaille, qui concourent à l’IST et en constituent l’essence ; récupérer et sécuriser l’ancien, et sauvegarder systématiquement le nouveau. Des outils, des guides de pratiques, des sessions de formation et des ateliers (workshops) communs sont autant de solutions envisagées pour dépasser la portée normative faible des simples réunions. ■ Les ingénieurs européens et european project managers ainsi que les valorisateurs de données IST fonctionnant en points-relais nationaux sont actuellement la première ligne d’assistance lorsqu’un chercheur ne sait pas comment utiliser OPIDOR pour générer un

Page 33: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

33

plan de gestion de données efficace et complet. Il en va de même pour beaucoup de domaines, où le seul référent (à l’adresse mail / numéro de téléphone parfois peu visible) est un expert de l’IST très lointain dans l’organigramme socioprofessionnel. Or, cet état de fait occasionne deux effets négatifs ;

- D’une part, une désincitation (le chercheur ne sait pas qui contacter / n’ose pas déranger un professionnel expert n’ayant aucun lien direct formel avec lui, et abandonne sa tâche IST)

- D’autre part, les ingénieurs et managers concernés encourent un risque d’engorgement de leur temps de travail par des tâches de conseil qui ne figurent pas sur leurs fiches de poste à la base, si la communication était plus large ou l’effet désincitatif pour les requérants moins lourd.

■ La formation est un enjeu-clé pour préparer les différents programmes destinés aux Unités de Recherche et les rendre réalisables ; en effet, ils ne peuvent se fonder que sur l’action quotidienne et normée, en amont, de chaque chercheur de l’IST, et non sur une régulation centralisée. A ce titre, les formations à distance sur la gestion, la préservation, le partage et la diffusion en libre accès des données de rechercher (DoRANum, BSN) ont porté de premiers résultats encourageants. En amont : les solutions partielles pour la veille documentaire et le signalement des ressources ■ La question du signalement des ressources, évoquée fréquemment, semble poser problème ; le chercheur français ne peut accéder de façon simple, en une action unique, à l’ensemble des ressources auxquelles il peut prétendre de droit. En effet, ces dernières sont localisées sur différents supports, qui ne veulent pas toujours voir les résultats produits par leurs algorithmes de recherche proposés sur une seule et même page, malgré le risque de doublons que cela comporte. Ce problème de simplicité des usages est intimement lié aux tensions de concurrence commerciale entre fournisseurs de support, et s’étend aussi aux usages des citoyens. ■ La veille et la recherche documentaire (service 4.1.) constituent la première étape de tout travail scientifique approfondi. Pour ce qui est de la veille informationnelle, ce service existe déjà au niveau local, notamment à l’échelle des Universités, et cette échelle semble adaptée en raison tant de l’aspect personnalisable du service que de la forte inertie des habitudes, en dehors de perspectives de mutualisation d’outils de veille informatique pour permettre des économies d’échelle. L'INIST offre un dispositif de veille

Page 34: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

34

avec notamment deux sites de qualité : http://www.donneesdelarecherche.fr et http://openaccess.inist.fr. Les évolutions ont visé à situer ce dispositif au cœur de la démarche IST du CNRS et de ses partenaires, pour en faire l'outil de toutes les évolutions en cours, vers des "connaissances mieux partagées". En aval : l’analyse de l’IST, dont la bibliométrie, est encore fragilisée ■ Le service 4.2 réalise des études bibliométriques destinées à caractériser l’activité scientifique d’une structure de recherche au travers de sa production scientifique, son réseau de collaboration, son positionnement dans une thématique particulière... Les services 4.2. à 4.4. ont produit un résultat mitigé dans l’étude COPIST. Les établissements disposant d’un service d’études bibliométriques (53% d’entre eux) souhaitent le développer, mais mentionnent que « les seules données quantitatives Scopus et Wos ne suffisent pas, et doivent même être relativisées ». Nombreux sont ceux qui travaillent encore avec une majorité d’analyses de l’OST, et les différences et complémentarités inquiètent. Cependant, pour les structures de recherche qui souhaitent produire des indicateurs bibliométriques, une assistance peut être fournie à l’installation et à l’utilisation de l’outil ezVIS, à partir de données propres et consolidées sur la production scientifique d’un laboratoire ou de toute autre structure, d’un thème scientifique particulier… ■ Dans cette catégorie d'offre nationale, la très grande infrastructure de recherche (TGIR) Huma-Num avance l'idée de nouveaux services et d'actions pilotes, reposant sur des relais de formation pour entrer de plain-pied dans le web des données, le linked data. Le chantier est essentiel. "Le travail de structuration des acteurs nationaux offrant des formations sera décisif (Huma-Num, INIST, CCSD notamment). Les initiatives développant des guides de bonnes pratiques (Huma-Num, Centre pour l’édition électronique ouverte (Cléo), BSN) doivent être non seulement encouragées mais également reprises à d'autres échelles" souligne le Cléo. Des plannings chargés, desquels déduire le postulat d’une formation actualisée, peu chronophage ■ Il existe donc un vrai besoin d’actualiser sur le long terme les compétences. Les tutoriels (service 5.6.) sur le libre accès aux résultats de la recherche dans le cadre d’H2020 sont difficilement intégrés dans les plannings souvent chargés des chercheurs, d’autant qu’ils se présentent comme une entité optionnelle et formellement

Page 35: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

35

bien distincte des autres domaines de recherche du chercheur, malgré le caractère en réalité central de l’IST dans tous ces domaines. L’intégration d’un onglet permanent « Formation IST » renvoyant au répertoire des ressources de formation au sein des plateformes (supports) d’Open Access serait à ce titre souhaitable. 1.1.2. Accéder de façon sûre à de larges fonds documentaires et outils d’analyse au meilleur coût

Les chercheurs expriment des besoins forts de recherche, d’analyse et d’accompagnement dans le champ de l’information, et particulièrement de l’IST. Face à des besoins en ressources très distincts selon les secteurs de recherche, les besoins en services sont eux sensiblement similaires. Les guidelines et le cadrage juridique ; une première brique cruciale ■ Ce besoin d’accéder et de prendre en mains l’IST passe d’abord par la demande d’un cadre juridique stabilisé. Outre le besoin général de connaître le droit applicable à chacun, connaître les ayants droits sur les documents et les droits dont ils disposent est nécessaire, mais également organiser les cessions de droit et assurer les conditions d’une diffusion en open access. Pour les questions relatives à l’identité numérique, il est donc nécessaire de disposer de conseil et de directives précises pour les chercheurs : doit-on proposer de la formation ou encore proposer des outils spécifiques, utiliser des réseaux sociaux ? Le rôle de l’institution est essentiel pour forger les bases de production et de partage d’une IST numérique. La DIST soutient le principe d’une action européenne d’accès à ces outils via des guidelines. Le non-recours au dépôt dans HAL ■ Les portails individuels apparaissant dans l’archive ouverte HAL sont suffisants, notamment pour les petites structures comme les grandes écoles par exemple. Le portail institutionnel est toutefois insuffisant dans certains cas. Les dépôts sont souvent faits sur des portails spécifiques (tels que les archives ouvertes institutionnelles des établissements) mais sont ensuite liés à HAL par le protocole de renvoi. La V3 de Hal a été mise en ligne et apporte des améliorations. Elle permet la mise à disposition de nouveaux formats de publication (comme les vidéos). Toutefois, HAL est encore sous-utilisé et fait l’objet d’un non-recours important bien que difficile à estimer. Dans certaines communautés les chercheurs jugent avoir autre chose à faire que de déposer

Page 36: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

36

leurs publications dans une archive, surtout si des saisies ont déjà été faites par ailleurs (notamment archives disciplinaires). Ainsi, l’INEE, qui alimente HAL, observe que toute la production scientifique n'y est pas recensée, que le service rendu se limite actuellement aux recensements des publications précédemment déposées. De plus, il est critiqué pour le manque d’homogénéité des dépôts, l’absence de typologie unifiée des documents, la difficile intégration des métadonnées, et les erreurs d’affiliation (dans le cas d’une double affiliation réelle d’un chercheur notamment) la mauvaise gestion des doublons. L'institut national de physique nucléaire et de physique des particules (IN2P3) exprime, tout comme les autres Instituts, une option de principe favorable au dépôt dans HAL, (l'institut des sciences de l’ingénierie et des systèmes (INSIS) et l’institut des sciences biologiques (INSB) expriment des réserves). L’institut des sciences humaines et sociales (InSHS) soutient quant à lui fermement le dépôt dans HAL. Une équation sous contraintes financières et budgétaires, ne devant pas prendre le pas sur la qualité des ressources ■ Le partage des ressources électroniques payantes sur une plateforme est une équation sous contraintes financières. Les chercheurs utilisent déjà ezPAARSE pour analyser l’utilisation des ressources auxquelles ils sont abonnés, et donc de restreindre les dépenses à celles parmi ces ressources qui sont vraiment consultées. Cependant il faut éviter la formation d’un fait majoritaire absolu, et tenir compte d’une lacune dans le sens inverse, c’est-à-dire les ressources qui répondraient à un besoin existant mais ne sont pas présentes dès le début, voire celles qui pourraient permettre de former de nouveaux besoins. ■ Certains établissements aimeraient des améliorations (retrait des documents, moissonnage, fonctionnalité de dépôt plus légère pour le chercheur). Le coût d’entrée fort est aussi mis en avant comme un obstacle et un poids. En matière de statistiques approfondies, la plupart des acteurs précisent qu’ils seraient intéressés fortement pour être utilisateurs de tels outils, mais n’ont en aucun cas la capacité financière de participer à leur construction ou à leur gestion. Cependant, à côté de ce constat amer, la connaissance du public Ifsttar par certains partenaires a créé des réticences à l’ouverture de l’analyse IST à la concurrence. ■ Le service IST est généralement considéré cher par rapport à l’efficacité des délais. Conjointement, il est également nécessaire de faire passer la Recherche française à des

Page 37: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

37

factures, notes et communications dématérialisées, le format papier étant polluant et ne permettant pas un archivage et une fouille de données approfondie a posteriori. Une grande variété de plateformes correspondant en partie à une variété de formats ■ Les résultats des questions 56 à 58 de l’enquête COPIST montrent que les données les plus recueillies par les chercheurs sont des données brutes d’observation (issues directement d'instruments scientifiques) (30% du volume total, et la plus grosse part, les autres types de données étant très diversifiés), et ce qu’elles soient d’enquête, expérimentales, ou de simulation. Le format le plus commun est la donnée chiffrée (65%), loin devant les textes (25%), les images et les vidéos (10%), le plus courant étant concrètement l’association de plusieurs de ces formats au sein d’un même dossier. Ces raw data sets sont à 24% sous format interopérable, et à 12% sous format propriétaires ; à noter que 42% des correspondants IST interrogés ne connaissent pas la nature du format des données hébergées par leur institut ou unité. ■ RefDoc (COPIST, service 1.2., questions 8&9) est un service de fourniture de documents scientifiques et techniques à la demande. Les interrogés en disent qu’il « n’est pas énormément utilisé mais est satisfaisant. Il offre une bonne complémentarité avec l’accès interne ». ■ Le service 5.4. (« Plateforme de services pour le stockage, le traitement, l’exposition, le signalement, la diffusion et la conservation des données de recherche en SHS ») soulève une limite, en précisant qu’Huma-Num ne peut combler, sur le long terme, l’ensemble des besoins relatifs aux données de la recherche de l’établissement. A ce titre, il pourrait se positionner comme tête de réseau pour la mise en place d’outils et de plateformes locales. Il serait par ailleurs urgent de développer une offre à destination des institutions pour le stockage et la conservation, articulée avec l’offre de service développée localement pour la diffusion. Un verbatim précise : « On sent cependant qu’à mesure qu’Huma-Num va gagner en visibilité, ces services seront sans doute de plus en plus sollicités, avec une capacité moindre de ses équipes à répondre aux sollicitations des partenaires. Par ailleurs, un des éléments forts actuellement de la grille de service de la TGIR est sa gratuité. Si à terme, devant l’afflux de demandes, tout ou partie de ces services devenaient payants (notamment le stockage des données), il n’est pas certain qu’ils ne soient pas délaissés au profit d’autres solutions. »

Page 38: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

38

1.1.3. Le paysage de l’IST française : un territoire en interaction forte mais morcelé, proposant des solutions inégalement ouvertes Le paysage français de l’IST est très complexe et s’inclut dans des logiques européennes comme locales, mais il est possible de le synthétiser comme suit en prenant en comptes un tryptique regroupant premièrement ceux qui font usage de l’IST (la recherche), deuxièmement les outils IST et leurs producteurs (les services) et troisièmement ceux qui légifèrent et réglementent l’IST par des normes d’encadrement (la régulation).

Page 39: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

39

Une politique nationale de l’IST : le CNRS au cœur d’une gouvernance partagée Au terme de réflexions et d'évaluations nombreuses auxquelles le CNRS a été constamment associé, la France s'est dotée d'une politique nationale d'IST numérique. Sous l'autorité du MESR, la Bibliothèque Scientifique Numérique (BSN), avec ses 10 Chantiers actuels5, permet d'accompagner les développements en cours de l'Edition scientifique en intégrant ses fonctionnalités complexes dans une approche globale. Le CNRS, qui est présent dans tous les Chantiers de la BSN à travers 24 experts, a fait récemment état de son analyse et de ses observations sur l'évolution en cours de la BSN : le Schéma d'orientation stratégique de l'IST du CNRS prend appui sur ses ressources et sur ses projets, notamment grâce à l’INIST. ■ La coopération et le partage via le COPIST interroge néanmoins la place du CNRS. Un côté hégémonique traverse les critiques. C’est donc le dialogue entre acteurs de l’IST qui doit prédominer dans la constitution d’un tel catalogue. Cette coopération interroge aussi la différence de taille des établissements. Un seuil critique apparaît pour les petits établissements. Comment sera-t-il possible de lier les besoins et les capacités de chacun ? La coopération questionne aussi la gouvernance et le financement d’un tel partage. Comment s’organise le financement d’un tel projet ? Quel est le coût individuel pour chaque acteur ? Surtout, qui prend la charge de la gestion du projet ? Une invitation à une gouvernance partagée est lancée, qui diminuerait le poids de la gestion centralisée par le CNRS. Centraliser, décentraliser… ■ L’arbitrage doit s’établir entre les économies d’échelle permises par la centralisation, et les captations plus efficaces des requêtes et besoins émanant de chaque individu permises par la décentralisation. Cette présentation de l’arbitrage rejoint les théories de la zone monétaire optimale et de la taille optimale des organisations. Doivent en être écartés les sous-arbitrages créés par des tensions particulières entre individus ralentissant l’optimisation du système IST français. A quoi doit dès lors ressembler la participation de chaque établissement ? Cette implication concerne les acteurs nationaux, mais une ouverture européenne, voire internationale ne serait-elle pas

5 Le CNRS y est représenté par 24 experts, présents dans tous les Chantiers de la BSN.

Page 40: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

40

envisageable, voire nécessaire, pour porter un projet plus conséquent et encore plus pertinent ? Les convergences de positionnement des Instituts sur certains points ■ Du côté des instituts, les opinions convergent sur certains points et divergent partiellement sur d’autres ;

- L'INEE l'observe, il y a une surabondance d’informations : il faut bien y distinguer les flux "entrants" et les flux "sortants" d'IST, pour lesquels les problèmes se posent de façon distincte. Quelle est la bonne solution d'accès à l'IST aujourd'hui et demain ? Plusieurs sources d'IST ou une source unique regroupant les autres ? Il n'y a pas de cohérence d’ensemble et il faut la rechercher : le CNRS a la capacité d'y contribuer, ce qui nécessite de prendre du recul.

- L'institut de chimie (INC), suivie en cela par une majorité d'Instituts, se montre favorable à une approche analytique et stratégique des publications des Instituts, par la mise au point d'outils appropriés de métrique. L'INEE a mené une première expérimentation dans ce sens.

- L'IN2P3 et l'institut national du patrimoine (INP) préconisent ensemble, à travers des initiatives comme SCOAP3, le besoin d'aller vers le libre-accès par une démarche globale construite à partir d'expérimentations immédiates, solides et partagées.

- A l'institut des sciences de l’information et de leurs interactions (INS2I), on voit se dessiner l’idée qu’il faudrait une fonction d’appui à l’ensemble de la recherche d’outils et de modélisation des sources de données et de publications.

- L'INSIS souligne la nécessité d'explorer de nouveaux domaines scientifiques à l’échelle du monde, de développer une veille et de la bibliométrie pour entrer en profondeur dans la maîtrise des outils de la valorisation, des brevets notamment, et de remettre à plat pour cela l'analyse des dispositifs nationaux existants.

- L'INSB fait état d'une relation construite à la fois sur le recours aux archives ouvertes (PubMedCentral), sur la publication systématique dans les grandes revues internationales, sur l'accès à de grandes bases de données : de nombreuses questions éthiques et juridiques posées dans les sciences de la vie mériteraient une approche construite au niveau du CNRS.

- L'INSHS souligne le besoin de repères partagés, de règles communes, dosant l'incitation et l'obligation, fondant le partage de l'IST sur une vision claire des modèles disponibles et accessibles à court et à moyen terme sur les grands

Page 41: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

41

thèmes stratégiques de l'IST. Une feuille de route est nécessaire, pour les chercheurs comme pour les professionnels de l'IST, par-delà les affirmations de principe, de façon à faire progresser les grands dossiers comme le libre-accès, l’accès à l’information scientifique et la valorisation de la production scientifique.

- L'institut national des sciences mathématiques et de leurs interactions (INSMI), qui recommande la construction d'une approche numérique intégrée et globale de l'IST (de l’édition à la recherche de données), constate qu'il y a nécessité de faire progresser et de partager les connaissances sur les structures de données, sur l'hétérogénéité des observations, condition de base pour le développement des informations produites par l'IST. Pour autant, il est nécessaire de faire cohabiter dans la durée (et donc de financer) les bibliothèques papier et les spécialistes de ces documents avec les nouvelles bibliothèques numériques sous leurs diverses formes.

- Pour l'INSU, il faut construire des « piliers solides » pour faire vivre la transversalité et l’adhésion des disciplines. Il organise par exemple ses services de données des Sciences de la Planète en "pôles de données" thématiques, en collaboration avec les autres organismes impliqués (CNES, Ifremer, etc…), et a nommé un chargé de mission pour suivre la problématique des données à l’échelle de l’Institut.

Une carte des réseaux se superposant à la carte des acteurs ■ Des réseaux métier très actifs existent : au niveau national (Renatis, Medici, RBDD, URFIST) au niveau régional (ARPIST, GO!Doc, Isidora, Mistral, Doccitanist, etc…), thématique (Démocrite, RNBM, Docplanets…).

Ces Réseaux se concentrent sur les problèmes relevant des évolutions du métier, de la prospective en IST et de l'adaptation des outils, des compétences et des services proposés aux chercheurs. Ces aspects sont notamment traités à travers les actions de formations, comme les FRéDoc6, les ANF ou les groupes de travail. Les offres de formation sont nombreuses et diversifiées sur le plan interne au CNRS (INSHS, opérateurs IST) comme externe (URFIST notamment). Les Instituts ont une pratique de formation qui peut être partagée, comme celle de l'InSHS, qui met en place 4 à 5 ANF par an.

6 FRéDoc 2013, par exemple, sur le thème de "Gestion et valorisation des données de la recherche".

Page 42: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

42

■ Le CCSD a été créé en 2000 pour permettre la communication directe entre chercheurs. Par le dépôt de sa communication scientifique sous forme d’article dans l’archive ouverte HAL, le chercheur met l'IST à disposition de la communauté globale. Le CCSD a évolué d’UPS en UMS et le dispositif d’archive institutionnelle HAL (hyper article en ligne) a été redéfini dans la convention inter-établissements signée le 2 avril 2013 par un ensemble de partenaires représentatifs de tout l'ESR. Le CCSD a comme fonction de mettre en œuvre la stratégie du CNRS en termes d’archives ouvertes et son expertise à disposition des établissements de l’ESR. Sa mission principale est centrée sur le développement, l’exploitation et l’évolution des archives ouvertes HAL, Thèses en Ligne (TEL) ou encore MédiHAL. Le CCSD entretient de forts partenariats avec l’ABES, le CINES, Huma-Num, Le Cleo, l'INRIA. Les projets du CCSD sont conçus et menés dans l’optique de favoriser le développement de l’Open Access. La France a fait le choix de soutenir fortement la voie verte et HAL répond à cette politique en respectant notamment les recommandations de l’initiative de Budapest (BOAI) dans la mise en œuvre de ses archives ouvertes. ■ L'Agence Bibliographique de l'Enseignement supérieur (ABES), est un acheteur public et un expert de premier rang, partenaire de tous les usagers de l'ESR. ■ Le Consortium Couperin offre un cadre stratégique complet pour une démarche globale de négociation et de conseil dans la relation du monde scientifique (universités et organismes de recherche) avec ses partenaires et ses fournisseurs. ■ L’UMS Persée a pour objectif d’être un opérateur national pour la mise à disposition de la production scientifique rétrospective française, au service de la science en train de se faire (élargissant ainsi le programme PERSEE porté par le MESR qui était initialement principalement en direction des SHS, qui font elles-mêmes l'objet d'un investissement spécifique avec la TGIR Huma-Num). Initié en 2003 par le ministère de l’enseignement supérieur et de la recherche et confirmé en 2007, le programme national Persée a pour missions la numérisation, le traitement documentaire, la diffusion et l’archivage pérenne de collections rétrospectives de revues et de publications scientifiques francophones (publications en série, actes de colloques) en sciences humaines et sociales (SHS), dans une logique de diffusion gratuite et non exclusive. Le changement de portage institutionnel et la mise en place d’une UMS réunissant des acteurs nationaux et locaux offre l’opportunité de franchir une nouvelle étape pour le programme Persée et de définir une nouvelle stratégie de développement à court et moyen terme, conciliant

Page 43: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

43

des missions de portée nationale et un enracinement fort dans le pôle lyonnais d’enseignement supérieur. Persée est fortement impliquée au sein de l’IR documentaire BSN (BSN5) et sera amenée à participer à l’IR CollEX (Collections d’excellence…). Persée s’attache à développer les Interactions avec les opérateurs français d’IST. L’UMS partage des valeurs communes avec le CCSD, le Cléo et le programme NUMDAM de la cellule MathDoc, notamment l’implication dans le mouvement de l’Open Access et par conséquent, la diffusion ouverte de documents scientifiques ; il existe une complémentarité forte entre l’UMS Persée et la TGIR Huma-Num. ■ La TGIR Huma-Num met en œuvre une démarche globale pour les SHS : la TGIR porte en effet l’ERIC (European Research Infrastructure Consortium) de Dariah (Digital Research Infrastructure for the Arts and Humanities). ■ Des initiatives pionnières ont conduit au développement de politiques d'IST cohérentes à l'échelle des organismes de recherche publics : regroupés dans l'association EPRIST, les organismes de recherche mettent en commun leurs expériences. Plusieurs grands établissements publics nationaux partagent ainsi les avancées des plus engagés d’entre eux7. L’arborescence de l’IST ; des services ayant émergé sans coordination globale, de façon ramifiée, pour répondre à des besoins localisés dans le temps et dans l’espace ■ De ce paysage morcelé, ont émergé de nombreuses plateformes et outils aux utilités souvent superposées. L’IST française a grandi progressivement, sans coordination nationale malgré les supervisions croisées pilotées depuis le CNRS, pour répondre à des besoins locaux émergeant suite à des avancées techniques puis technologiques. Sa croissance s’est faite à la manière d’un arbre sans tuteurs, et les différents acteurs et outils présents aujourd’hui sont autant de branches et de feuilles qui résultent d’une vie complexe cherchant à s’étirer vers les soleils divergents d’intérêts locaux pour chaque secteur de la recherche. Aussi, il convient non pas de tailler cet arbre abruptement et sans considérations particulières, mais bien plutôt de favoriser la convergence de toutes ces branches en direction d’objectifs communs, en étayant quelques-unes à la marge, et permettant des divergences de direction lorsqu’elles sont

7 L'INRA en particulier, mais également l'INSERM, l’Inria, l'IRD, le CEA, l’Irstea…

Page 44: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

44

nécessaires, afin de rééquilibrer la forme générale de cet arbre, pour éviter sa chute due au déséquilibre de poids entre ses branches. ■ Une réponse à la question 117 du COPIST précise ; « Il y a beaucoup de dispositifs et projets relatifs aux données de la recherche, aux corpus de recherche, à la numérisation de sources, à la gestion d'archives... On ne voit pas bien la cohérence de l'ensemble, ni l'articulation entre les projets proprement CNRS et les programmes ou instances nationaux d'archivage comme le CINES (pour le MESR). » La coexistence initiale de périmètres variables d’un établissement à l’autre ne pourrait a priori pas être effacée sauf à ce que toute acquisition bascule en licence nationale. Un autre verbatim éclaire le sujet de la sorte ; « Même avec un lien facilitant le passage entre les différents portails, le maintien de deux niveaux d’accès serait indispensable. Le résultat de ce dispositif risquerait donc de conduire à une complexification de l’accès alors que l’offre de service actuelle présente déjà des limites en termes de lisibilité et de gestion. Quelle subsidiarité ? » De nouveaux projets qui fédèrent des ambitions diverses et méritent approfondissement ■ La réponse à cette question a déjà été en partie apportée par l’intégration des résultats bibCNRS et ISTEX dans Google Scholar, via un système de référencement en marque blanche permettant, lors d’une recherche sur Google, de visualiser également les PDF ISTEX et bibCNRS. Cette procédure d’intégration par référencement commun suscite des craintes liées à la propriété et à la sécurité des données, dont certaines ne peuvent être communiquées sans risque à une entreprise internationale. Néanmoins, elle constitue un premier pas vers la simplification du point d’accès. ■ Le projet ISTEX (Initiative d’excellence de l’Information Scientifique et Technique), dont le CNRS (DIST) est le pilote, vise en effet à offrir à l’ensemble de la communauté de l’enseignement supérieur et de la recherche, "un accès en ligne aux collections rétrospectives de la littérature scientifique dans toutes les disciplines". Ce projet s’inscrit dans le programme "Investissements d'Avenir" (PIA) initié par le CGI ; l’ambition directe d'ISTEX est de "renforcer la recherche et l'enseignement supérieur français sur la scène mondiale"; ISTEX permettra par ailleurs de valoriser la politique d'acquisitions de licences nationales, en rendant accessibles les collections courantes et les archives de façon transparente.

Page 45: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

45

■ Les besoins sont donc très variables au sein des laboratoires et les solutions doivent être adaptées en conséquence, comme l'observe l'INEE. Certaines communautés scientifiques sont bien organisées ou s’organisent en matière de gestion de données et leur expérience peut être d’une grande utilité. ■ Le service Episciences.org (3.2.) condense quelques-unes des remarques les plus polarisantes du COPIST. Il s’agit de publier des travaux encore en cours, et des résultats pas totalement publiables en l’état. Beaucoup rappellent qu’il faut « sortir autant que possible du modèle imposé par les grands éditeurs qui facturent des APC délirantes », mais d’autres estiment que les épi-revues ne sont pas prises au sérieux ni reconnues, justifiant leur envie de pouvoir publier dans les plus grandes revues classiques. Ce modèle semble prendre difficilement. En sciences du vivant cela semble exclu de diffuser ses résultats en amont d’une publication empruntant la voie « classique ». PlosONE a actuellement la faveur de certains chercheurs, selon une observation issue des études bibliométriques internes à l’Ifremer. Des portails qui satisfont, mais qui sont appelés à fusionner ■ « Nous faisons le constat de la richesse des services proposés mais également d'une certaine difficulté de lisibilité qui rend le paysage complexe pour un enseignant-chercheur. Il serait par exemple intéressant de dépasser certaines segmentations disciplinaires (SHS, Maths...) pour des objets et des services identiques (numérisation de corpus de revues, diffusion de revues en ligne...) »8. Les portails actuels de documentation satisfont les utilisateurs interrogés à 68%, et pourtant 71% sont favorables à un regroupement et à des fusions de ces derniers ; est-ce-à-dire que les chercheurs français en demandent trop ? En réalité, ce qu’il faut lire derrière ces chiffres, et notamment derrière les 20% d’abstention aux deux questions, c’est que les supports existants sont suffisamment complets en termes de ressources, mais les services proposés (outils), notamment les filtrages approfondis de recherche sur critères, sont perçus comme immensément améliorables par la perspective d’un tel regroupement.

8 Verbatim d’une réponse à la question 146 de l’enquête COPIST 2016.

Page 46: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

46

Quelle offre apporter : vers une plateforme unifiée ? Selon quelles modalités ? ■ L’offre ne portant que sur les aspects de diffusion n’intéresse que peu les acteurs de l’IST, qui cherche des supports offrant une palette d’outils intégrés correspondant à une offre complète, allant de la recherche d’information (gestion des abonnements) à la diffusion en passant par les PAO et la gestion des relectures. Le service I-Revues semble faire double emploi avec d’autres plateformes telles que les archives institutionnelles, Persée, ou encore les épi-revues… Le projet Numdam ne peut se construire sans articulation avec COLLEX-Persée, et présente des insuffisances du point de vue de l’ergonomie et de la diffusion. ■ De façon générale, la sous-traitance est perçue comme une solution moins chère à court terme mais insuffisante à long terme car ne garantissant pas ni l’autonomie à moyen terme ni la sécurisation de l’IST locale à long terme. La dépense d’investissement doit ici être privilégiée sur de menus frais de fonctionnement qui, mis bout à bout, empêcheront le passage au numérique de la Recherche française. S’il est important que l’établissement ait la maitrise de ses analyses et développe les compétences suffisantes pour être autonome, la sous-traitance n’est pas une solution permettant une véritable appropriation. Le développement d’une expertise commune par la formation et la mutualisation de méthodes partagées est donc pleinement utile. ■ La mise en place d’une plateforme unique d’accès aux ressources pose cependant des questions (COPIST, service 1.1., questions 4&6) ;

- « La création d’une telle plateforme rencontre majoritairement des problèmes techniques et de gouvernance. Quel réalisme pour un accès unique et unifié ? »

- « Comment créer une offre unifiée pour tous les établissements ? » - « Quelles ressources humaines pour gérer tous ces points ? » - « Quelle gestion technique : les ressources négociées pour le personnel de

chaque unité sont-elles accessibles grâce à la reconnaissance des adresses IPs ? »

■ Le projet OPIDOR participe à la migration de deux outils étasuniens permettant de créer des plans de gestion de données (PGD, ou DMP Data Management Plan en anglais) ; DMP Tools et DMP Online, vers un seul mutualisé. Le DMP n’est pas une procédure souvent mise en place pour l’heure, mais il doit aussi être en marque blanche pour permettre une forte interopérabilité, condition sine qua none d’une unification fluide des supports.

Page 47: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

47

■ A la question du portail unique, l'INC précise que, face à la nette augmentation de la production scientifique, le numérique permet la facilité de transmission, l’instantanéité mais aussi la multiplication des formats possibles (publications dans les revues, production de données, logiciels, blogs, …). L'INS2I, l'INEE, l'IN2P3, l'INSB, l'INSIS pratiquent les revues électroniques et n'ont pas d’appétence pour le papier. Mais l’INC souligne également que les chercheurs ont accès à un nombre parfois trop élevé de portails : le temps d’accès de recherche et de gestion des portails est une contrainte supplémentaire dans l’accès à l'information. L'INSB, qui est utilisateur du portail "BiblioVie" de l'INIST, a fait état des redondances de cet outil avec les portails des universités et surtout celui de l'INSERM. La réponse apportée pour le moment a été une fusion dans bibCNRS. ■ La communauté mathématique travaille sur la mise en place d'un portail par le biais de la cellule MathDoc, du réseau RNBM et du réseau Mathrice (informaticiens des unités de mathématiques). Ce portail, conçu pour être un "portail à façon", spécifique à la discipline, s'appuiera sur le hub de métadonnées des collections acquises ou utiles. Il n'est pas conçu comme un concurrent au portail unique mais bien comme un complément, s'appuyant sur des bases communes et offrant des services spécifiques à la discipline plus large que les services documentaires (notamment des services informatiques et collaboratifs proposés par Mathrice). Ce projet s'appuie sur l'expertise de la cellule MathDoc qui a joué un rôle moteur dans un projet européen similaire (EuDML). Le résultat : une galaxie complexe avec laquelle il faut composer une symphonie heureuse ■ Les différents acteurs de cette galaxie très complexe et ramifiée sont identifiés par les branches et secteurs de l’IST qui correspondent à leur zone d’influence, et certaines de ces zones d’influence se superposent. La difficulté réside donc dans le fait de ne pas envoyer de signaux contraires, et d’éviter la mise en place d’une concurrence stérile entre ces acteurs aux sources de financement et de hiérarchie certes divergentes mais qui auraient bien plus à gagner dans l’application d’un effort commun. Le présent document vise donc à apporter les premiers éléments d’une coopération horizontale entre acteurs de l’IST, s’inscrivant au cœur de la stratégie nationale impulsée par le Gouvernement, et la dépassant en démultipliant l’efficacité des décisions prises par chacun.

Page 48: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

48

1.2. Des besoins d’IST spécifiques à certains acteurs En dehors des besoins communs qui peuvent être fusionnés en répartissant

l’effort et en dépassant les antagonismes de surface, certains besoins sont aussi spécifiques à certains acteurs de l’IST. Il existe en effet des communautés scientifiques moins organisées quant à l’IST. L’ADBU insiste beaucoup sur ce point ; certaines communautés de recherche disposent de moins de moyens organisationnels, tandis que d’autres utilisent les outils d’analyse avancée de l’IST depuis longue date.

1.2.1. Les spécificités des Unités de Recherche et Instituts Partager le rôle de prestataire d’offres payantes du CNRS avec les COMUE ■ La notion de gouvernance est précisée par les verbatims issus des réponses à la question n°146 ; « Se pose la question du business model. Est-ce que le CNRS se pose en prestataire d’une offre payante et se met alors en position de répondre à un appel d’offres ? Quelle est alors sa plus-value par rapport à des offres existantes sur le marché ? Le CNRS a-t-il un mandat du MESR pour proposer ce COPIST ? » mentionne ainsi un répondant. Un autre précise que ; « le CNRS devrait, peut-être, plutôt se positionner comme centre de ressources, comme pourvoyeur d'outils et comme organisme dispensant des formations et des conseils pour les établissements et éviter de se substituer à eux pour proposer des services qui ont tout intérêt à être développés localement plutôt qu'au niveau national. »

Page 49: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

49

■ Le CNRS a une offre de service mais les établissements proposent eux aussi un service analogue, d’ailleurs gratuit dans beaucoup d’universités pour les unités de l’établissement. La question de la gouvernance pour la fourniture de documents est posée. Elle ne peut être que partagée, et l’initiative des acquisitions pourrait être pilotée conjointement, par un système en ligne agile, par le CNRS et les COMUE. Mutualiser la formation de façon intelligente : UFRIST et INIST ■ Si la mutualisation est importante pour monter les formations, avec la place centrale occupée par l’UFRIST, il faut prendre en compte les spécificités institutionnelles et les besoins différents. Un verbatim précise ainsi : « Qu’un tel service soit porté par le réseau des URFIST est très approprié. Que l’INIST en revanche se lance dans des projets de formation à destination des professionnels de l’IST interroge : il serait probablement plus pertinent d’articuler autour de cette action le réseau des URFIST et l’ENSSIB de Lyon. »

Page 50: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

50

Les établissements ne disposant pas encore de formations ont par ailleurs formulés le vœu d’être associés au GTAO de Couperin. Des divergences fortes de positionnements entre les Instituts ■ Les enquêtes auprès des Instituts ont permis de développer des analyses multivariées pour affiner des « profils » d’Instituts.

■ L'INEE est partenaire de grandes bases de données internationales (GBIF, WOORS) et développe une politique systématique de valorisation. SCAR-MarBIN, par exemple, est un portail de bases de données interopérables, auquel le CNRS contribue en fournissant des données et la Belgique offre l’infrastructure. Zookeys et Phytokeys sont des journaux qui éditent des articles automatiquement à partir de bases de données. Pour l'INEE, il faut définir une incitation du CNRS à l’ouverture des données avec une obligation à citer, tout en admettant qu’il existe bien sûr des données sensibles à ne pas diffuser. Les données "sont les alliées" des publications, qu'elles complètent systématiquement pour le test et la contre-épreuve du travail scientifique (INEE, INSIS, INSB, INP).

Page 51: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

51

■ L’IN2P3 ne publie pas les données brutes (illisibles pour des tiers) mais les Data management plans sont connus et utilisés. Le TGIR SOLEIL expose également un besoin, au-delà de la gestion des données, sur les règles de stockage à long terme. ■ L’INSB avec la bioinformatique, est partenaire d'infrastructures nationales (avec l'Inria), pour les ressources biologiques et biomédicales (biobanques). L’accès aux données est par exemple très spécifique, et nécessite un support bien adapté. ■ L’INSU produit des bases de données et est partenaire de bases de données internationales (Astronomie, sismologie, Géochimie…). Il souhaite à ce titre la valorisation des publications liées à ces bases de données. D’autres bases nécessitent une sécurisation dans le temps des données et une valorisation de celles-ci. ■ Pour l’InSHS, il est impératif de sauvegarder les bases de données produites dans les laboratoires : l'Institut voudrait développer un projet de coopération avec l’INIST pour répondre aux besoins des laboratoires en matière de sauvegarde et d’interopérabilité des bases de données et ainsi faciliter à terme la diffusion des données de la recherche. Il parait nécessaire de créer des triplets documentaliste, informaticien et chercheur destinés à aider les laboratoires à pérenniser les bases de données SHS : c'est une demande récurrente des unités ; cela doit être un de nos objectifs prioritaires. ■ Enfin, pour l'InSHS il faut renforcer les infrastructures : Huma-Num, Progedo-réseau Quételet, programmes d’excellence (Biblissima http://www.biblissima-condorcet.fr/) en stabilisant le rôle du réseau des MSH. Il faut également accompagner l’évolution des personnels d’appui en IST dans la gestion des données de la recherche. ■ L’INSMI utilise peu de bases de données généralistes comme Web of Science (WoS) ou Scopus. En revanche, l'Institut utilise quotidiennement les deux bases dédiées MathSciNet (alias Math.Reviews, éditée par la société mathématique américaine AMS) et zbMATH (alias Zentralblatt, produit par le FIZ et commercialisé par Springer). Il existe des liens anciens entre la France et le zbMATH, dont la première version web a été développée par la cellule Mathdoc. De façon générale, il y a la volonté de soutenir cette base européenne pour limiter l'hégémonie (et les tarifs) de la base américaine.

Page 52: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

52

Des difficultés techniques signalées par des utilisateurs spécifiques ■ Concernant SciencesConf.org (service 3.3.), le service est très intéressant et la prise en main facile par les chercheurs mais le couplage à un outil local de gestion des paiements en ligne est trop complexe ou impossible à admettre du point de vue administratif et comptable d'un établissement hors CNRS. Il manque en outre une fonction « Tout déployer », car aucune vue globale ne peut être affichée. La concurrence d’outils gratuits ou payants internationaux est forte sur ce segment. Il conviendrait de renforcer la capacité d’intégration de l’application dans les sites institutionnels des établissements ainsi que l'intégration dans les environnements numériques de travail. L’interopérabilité est ainsi l’enjeu central d’un meilleur taux de recours aux outils nationaux officiels. Calenda (service 3.9) est un outil de planification commune entre chercheurs. Mais comme en témoigne un verbatim de l’enquête auprès des DU « les calendriers annonçant un trop grand nombre d’événements ne sont pas consultés par des collègues surchargés. ». Un contexte où de grands principes éthiques doivent dominer ■ Le contexte est donc particulièrement favorable à la définition de principes éthiques, qui soient de nature à transcender les catégories instrumentales et à affirmer les buts de la recherche publique dans un contexte global de Science Ouverte. Le comité d’éthique (COMETS) du CNRS a constaté que beaucoup d’acteurs de l’ESR ressentent le besoin de partager des bonnes pratiques et mène une réflexion autour du data sharing (enjeu éthique du partage des données scientifiques). Une charte d’éthique nationale de déontologie des métiers de la recherche avait été signée le 29 janvier 2015. L’objectif de cette charte était d’expliciter les critères d’une démarche scientifique rigoureuse et intègre, applicable notamment dans le cadre de tous les partenariats nationaux et internationaux, afin de consolider le lien de confiance entre la société et les organismes et établissements publics d’enseignement supérieur et de recherche, dans une société de la connaissance et de l’innovation. La charte nationale se déclinait en 6 grands chapitres :

- Respect du dispositif législatif et réglementaire - Fiabilité des résultats de recherche - Communication du travail (informer n’est pas communiquer) - Responsabilité dans le travail collectif - Travaux collaboratifs et formation à l’éthique

Page 53: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

53

1.2.2. Les besoins différenciés des Universités, Organismes et Grandes Ecoles

L’ADBU représente efficacement les universités et n’est l’objet que de très faibles contestations de la part de ces dernières ; en ce sens, l’ADBU doit être un partenaire national majeur. D’autres sont néanmoins développées, mais c’est plus rare.

Indépendance des Grandes Ecoles, réunion des Universités, diversité des Organismes ■ Les grandes écoles défendent une forme d’indépendance. Les universités sont ouvertes mais sous de nombreuses conditions. Il est plus difficile de donner une opinion claire pour les organismes, qui sont souvent différents, n’ont pas la même renommée donc les mêmes accès, ni les mêmes budgets, etc. Des divergences distinguent les universités des grandes écoles ; les grandes écoles sont facilement dotées de services de protection, chose que les universités font porter sur les SCD. Les bibliothèques universitaires (BU), elles, interviennent déjà beaucoup dans la partie formation documentaire au droit d’auteur, et de nombreux dispositifs mutualisés dominent l’échelle régionale. En revanche, les questions d’éthique de la publication ne sont que peu traitées, aussi bien par les universités que les grandes écoles. ■ Concernant les périmètres d’accès à l’IST, en l’état, il est difficile pour une université d’avoir accès aux informations sur les ressources (bouquets) disponibles sur les portails thématiques du CNRS. La liste exhaustive des titres accessibles n’est pas une information suffisamment souple à exploiter. Toutes les UMR doivent-elles pouvoir accéder au même périmètre ? Tous les membres de l’établissement ? Car les portails CNRS s'adressent uniquement aux membres attachés à des unités CNRS (UMR

Page 54: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

54

essentiellement), chercheurs, enseignants-chercheurs et doctorants uniquement, quand les portails documentaires des établissements desservent aussi les élèves/étudiants qui constituent leur population de base. Le particularisme de la recherche médicale ■ Les milieux de la recherche médicale universitaire et les organismes (ASSO et ODAC) de la fonction publique hospitalière sont aussi de grands utilisateurs d’IST aux besoins de confidentialité et de sécurisation élevés. Le service MediHAL de dépôt sécurisé et de consultation de données visuelles et sonores produites dans le cadre de la recherche scientifique a été critiqué sur plusieurs aspects dans les réponses faites à la question 115. D’abord, la logique de description à l'unité de MediHAL fait perdre de vue d'une part la notion de collection, essentielle pour des corpus iconographiques ou sonores, d'autre part les recherches et articles auxquels ces documents ont servi. Ensuite, le point de la limite du service POPS sur ce support a été soulevé. Enfin ; « dans bien des cas, le devenir à long terme des matériaux collectés est une question non réglée, sinon par stockage de copies multiples. MédiHAL a déjà été envisagé comme un outil de dépôt externe possible. Un versement massif, par une bibliothèque universitaire, d'images issues de corpus numérisés pourrait-il être envisagé, ou serait-il considéré comme un détournement ? De la réponse à cette question dépend l'intérêt de l'offre. ». Globalement, il est possible de dire que le fond est trop modeste (en termes de volumétrie comme de diversité) et largement dominé par les SHS. Or, les critères d’interrogation étant ceux de HAL, il n’y a à l’heure actuelle aucun moyen d’interroger ce fonds sur des critères pertinents pour les illustrations. Un modèle néerlandais en matière de gestion et diffusion des données émerge, à même de constituer une source d’inspiration. 1.2.3. L’action de l’Etat au service du citoyen (agences, APUL, ODAC, mission Etalab) L’Etat comme libérateur des forces de réseaux issus des autonomisations

Les requêtes très fréquentes d’autonomisation de certains acteurs ne doivent pas se lire comme une volonté de pratiquer des communautarismes autarciques ou d’ignorer les directives nationales, mais bien plutôt comme une manière de renforcer la crédibilité et les marges de manœuvre de chacun au sein de réseaux d’entraide, par opposition justement à la granularité forte (chaque acteur devant chercher un prestataire

Page 55: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

55

de services) en situation de dépendance au marché. L’Etat, et en particulier à travers le CNRS, agit donc pour libérer les forces à même de créer à partir de l’IST, en rendant possibles tous les usages par la formation. Une communication nationale doit par ailleurs être assurée en parallèle vers les communautés de recherche (très largement sous-informées aujourd’hui) et les communautés professionnelles. Un régulateur également acteur Ces rôles quasi-régaliens de régulateur, d’arbitre, s’associent à une nouvelle mission de l’Etat comme acteur à part entière de l’IST.

■ L’Etat en lui-même, on l’oublie trop souvent, est non seulement un financeur de la recherche, avec notamment plus de 40% des 47 milliards des PIA financés via la Caisse des Dépôts et la BNP, mais également un client majeur de données issues du TDM. ■ Une ouverture des droits sur les portails CNRS pour des profils ciblés en-dehors du CNRS est demandée. Cette ouverture peut s’effectuer dans le cadre de contrats mutuels de confidentialité, ou dans le cadre d’un paiement ponctuel sur certaines ressources. Le

Page 56: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

56

portail data.gouv.fr de la Mission Etalab va dans le sens d’une co-construction, à partir de l’IST issue des datasets étatiques, d’applications entre start-ups, entreprises classiques et développeurs indépendants voire autodidactes. L’e-administration appuyée sur l’IST : une longue histoire française ■ En vue de souligner l’imbrication forte de l’Etat dans les questions ayant trait au numérique et donc à la connexion avec la technologie scientifique, un bref rappel doit être fait. L’« e-administration », que la Commission de Terminologie de l’Académie française préfère qualifier d’ « administration en ligne », repose principalement sur la facilitation et la fluidification de procédures courantes, en les dématérialisant. L’administration électronique par le Gouvernement français ne date pas d’hier ; en France, en août 1997, soit 19 ans après la toute première Loi Informatique et Liberté, Lionel Jospin lance le Programme d’Action Gouvernemental pour la Société de l’Information, visant une généralisation des sites Internet publics et la mise en ligne des formulaires administratifs sur un Espace Public Numérique. Après le rapport Carcenac sur les téléprocédures, l’interopérabilité et le logiciel public libre en 2001, celui de la Délégation interministérielle à la Réforme de l'État sur les sites .gouv et service-public.fr, on propose en 2002 une Agence NTIC (ATICA), qui donnera l’agence pour le développement de l’administration électronique (ADAE) en 2003. Entre 2004 et 2007, le plan ADELE formule 47 propositions, mais plus de 90% d’entre elles concernent en fait uniquement des dématérialisations de procédures comme le changement d’adresse ou l’achat public. La DGME coordonne ces efforts. S’ensuit le Plan France Numérique 2008-2012, concernant notamment la Justice en ligne et la confiance numérique. Depuis 2012, l’ex-DGME, c’est-à-dire le Secrétariat Général pour la Modernisation de l’Action Publique (SGMAP), coordonne les projets de réformes. Beaucoup sont restés des projets, des rapports assez éparses, sans grande vision globale. De grandes idées se développent dans nombre de pays, comme Allemagne, les Etats-Unis, ou encore au Japon, pays qui a pris de l’avance, telles que la carte nationale d’identité électronique, un service de dossier médical personnalisé, « l’université numérique » pour former à l’économie numérique, ou encore l’adresse mail publique à vie. Les applications concrètes de l’IST par l’Etat Ce « state as a service » a déjà donné de premiers éléments de politiques publiques reposant entièrement sur de l’IST ;

Page 57: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

57

1. Le transport peut simplement faire l’objet de statistiques permettant d’améliorer la qualité du service rendu via la e-administration ;

2. La sécurité est notoirement améliorée par la création de fichiers de police partagés par INTERPOL ou les services de renseignement, ou encore le casier judiciaire en ligne, et des sociétés comme Safran produisent des programmes permettant de prévenir plus précisément les risques lors des passages de checkpoints, par exemple aux frontières ;

3. La santé a déjà été changée par la connexion du médecin généraliste aux urgentistes et spécialistes via le Dossier Médical Personnalisé (DMP), et le puçage des Cartes Vitales ;

4. On pourrait aussi citer les Ressources et l’énergie ; 5. Ou encore les Prélèvements obligatoires (impôts et taxes), avec les déclarations en

ligne comme on les connaît aujourd’hui. 6. Il y a aussi la délivrance de permis, diplômes et licences, et la poursuite d’une

actualisation de ces derniers personnalisée et surtout efficiente, pour pallier aux mauvais résultats européens aux tests PIAAC.

7. L’organisation de la vie citoyenne, de l’échelle du quartier à celle du pays, par des Calendriers fonctionnant selon les choix de chacun comme des matrices est aussi possible.

Aller plus loin : govtech, civic tech, quand l’IST sert à gouverner autrement ■ Outre cette dématérialisation de l’existant, l’Etat peut aussi gouverner autrement, plus en profondeur, de façon plus intelligente et coordonnée, grâce à l’IST. La « GOVTECH », parfois nommée « CIVIC TECH » est l’infrastructure technologique utilisée pour faire le travail administratif interne ou innover auprès du citoyen. Il s’agit donc de modifier le « système opérationnel » du gouvernement, mais les citoyens peuvent se l’approprier aussi via des initiatives publiques ou privées. Cela n’implique cependant pas nécessairement de « retrait de l’Etat » au profit d’agences issues des démembrements administratifs, d’opérateurs extérieurs, ou d’entreprises privées, ni une réponse aux attentes des usagers ; on peut créer de nouveaux besoins et innover. Il s’agit de mieux gouverner grâce aux moyens numériques offerts par l’IST. 1. la GovTech peut faire du transport un pilier de développement de villes mieux

dessinées, en étudiant le parcours optimal ou la durée du trajet domicile-travail de chaque citoyen, notamment à l’échelle européenne avec l’expertise d’EuroCities, ou en Amérique avec LivingCities ;

Page 58: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

58

2. Cela a aussi à voir avec la surveillance, qui se généralise via la reconnaissance faciale, et le fléchage de tous les appareils d’usage courant. Les liens entreprises-gouvernements, donc B2G et G2B, sont ici la zone sensible ;

3. On peut imaginer un monitoring en temps réel des fonctions vitales de chaque citoyen, contrôlé par Santé Publique France afin de détecter les épidémies, et d’évaluer les marchés de toxiques à réguler.

4. La mise en place de compteurs électriques automatisés rentre dans ce cadre ; 5. La GovTech permet d’aller d’un prélèvement à la source généralisé, à l’ajustement

automatique des taux d’imposition en temps réel selon l’économie ; 6. La mise en adéquation, par des numerus clausus et des quotas, de l’offre et de la

demande d’emploi 7. Et enfin, la prévision des manifestations, voire des événements violents, et donc un

contrôle policier renforcé par algorithmes, avec des solutions comme Palantir, qui travaille tous les jours à des outils de GovTech.

■ En réalité, mieux l’Etat est informé, plus il peut gouverner efficacement, comme un arbre qui croit d’autant plus haut que ses racines vont puiser des ressources dans la profondeur. Mais une grande partie du chemin est encore à tracer, et aucun « sentier » historique ne semble restreindre les possibles en la matière, qui est toute neuve. Pour résumer ce qui a déjà été fait en France ; 1978 : Première Loi Informatique et Liberté, fondation de la Commission

Nationale Informatique et Libertés (CNIL) 1997 : Programme d’Action Gouvernemental pour la Société de l’Information 2000 : Ouverture de service-public.fr et de Légifrance 2001 : rapport Carcenac (téléprocédures, interopérabilité, logiciel libre) 2001 : rapport de la Délégation interministérielle à la Réforme de l'État (sites web

publics) 2003 : Agence pour le Développement de l’Administration Electronique (ADAE) 2004-2007 : Plan ADELE 2005 : Direction Générale de la Modernisation de l’Etat (DGME) 2008-2012 : Plan France Numérique 2012 : Secrétariat Général pour la Modernisation de l’Action Publique (SGMAP)

Page 59: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

59

La mission Etalab : au cœur d’une Europe des bases de discussion sur l’Open Data ■ De plus, des forums européens existent également, qui sont la base de discussions dont l’Etat est un acteur incontournable, mais qui mettent au premier plan la Recherche : Open Knowledge (UE), Fondation pour les Générations Futures (BEL), Hanns Seidel Stiftung (ALL), etc. et mondiaux : Govtech Fund (US), NewDemocracy (AUS), etc. ■ La mission Etalab gère de grandes quantités de données en mettant en ligne des datasets et en administrant la réception de datasets externes sur le site data.gouv, qui sont amenées à servir de pivot vers d’innovants projets émanant de la société civile et des entreprises (dont start-ups) souhaitant développer des applications faisant usage de ces données. Nombre de ces data sets rentrent dans la catégorie IST par leur nature ; collecte automatisée de renseignements objectifs (cadastre, dénombrements d’événements récurrents, votes, etc.) ou leurs modes de consultation (API intégrées, nécessité d’employer le TDM). ■ Néanmoins, de fortes contraintes s’appliquent aux organes décisionnels de l’Etat : 1ère limite à l’action étatique : économique ■ D’abord, il existe des contraintes économiques, évaluées par le cabinet Ourouk dans une analyse technico-budgétaire de la stratégie IST conduite en 2015.

Page 60: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

60

- Certains projets publics coûtent très cher dans les premières années, sans certitude d’amortissement, ce qui constitue donc une dépense d’investissement et justifie un endettement pour répartir le poids financier sur plusieurs générations ; or la dette publique est déjà trop élevée presque partout…

- De plus, on peut se demander si ce coût doit être assumé par tous les contribuables via un impôt, ou seulement par les usagers finaux, auquel cas peu seraient enclins à payer pour ces options de service (moins de 20% selon un sondage INSEE 2014).

- Les réformes numériques de l’Etat peinent à se développer lorsqu’elles sortent du cadre de la simple dématérialisation procédurale. En effet, de grands monopoles privés sont devenus hégémoniques, pour deux raisons ; d’une part l’absence de coût marginal, de hauts coûts de recherche et développement, et d’autre part les effets de réseau.

2ème limite à l’action étatique : technique ■ Parallèlement, il existe des limites techniques ; les pays où moins de 60% des citoyens possèdent un ordinateur personnel ou ont, à défaut, accès à internet, tels que le Brésil ou la majorité des pays d’Afrique, ne peuvent que difficilement mettre en place ce genre de mesures, a fortiori si le taux d’équipements en smartphones est également faible, sauf pour les mesures n’exigeant que des ordinateurs publics, comme le vote électronique. En tout cas, la GovTech à proprement parler ne peut s’y installer. Les initiatives gouvernementales se sont néanmoins structurées lors de la création de l'Open Government Partnership en 2011, qui regroupe aujourd'hui 69 pays, et qui défend l’Open Data et la transparence sur les données comme moyen de contrecarrer les éventuelles dérives éthiques liées aux grands pouvoirs nouveaux que ces données impliquent. La France est 10ème mondiale en termes d’accès ouvert à ses datasets publics rendus disponibles par la mission Etalab. La science et la recherche ont donc un rôle à jouer dans la mise en valeur et en applications de ces données précieuses. 3ème limite à l’action étatique : éthique et morale ■ Car enfin, en effet, coupler ces bases avec des décisions technocratiques extrêmement complexes à prendre, avec un stress temporel fort, pourrait amener vers une disparition du décideur humain en bout de chaîne. Pour certains, il s’agit d’un risque d’aliénation et de perte de liberté, pour d’autres, il s’agit du remède contre les failles du

Page 61: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

61

raisonnement humain, telles que les abus du pouvoir qu’offre la maîtrise des données, les discriminations ou les erreurs stratégiques.

- La protection des données du citoyen, la confidentialité, le droit à la vie privée ou à la déconnexion sont autant de traductions juridiques de contraintes éthiques qui freinent une réforme en profondeur, et qui sont toutes en train d’évoluer à l’heure où nous parlons.

Le lien avec l’intérêt général : mettre l’IST au service de chacun ■ Le développement des start-ups d’Etat et des entrepreneurs d’intérêt général ouvre la porte à un emploi de l’IST pour mieux évaluer les attentes et besoins des citoyens ; le travail législatif doit donc focaliser ses efforts sur le maintien d’un environnement favorable au réemploi des données IST. Le site data.gouv enregistre de très bonnes statistiques, et les applications qui y sont créées par des start-ups et des particuliers à partir des données publiques servent l’intérêt général. 1.2.4. Les besoins des entreprises Une décorrélation entre la formation initiale et les qualifications professionnelles attendues à l’heure numérique, que tentent de corriger des initiatives très récentes

Aujourd’hui, le marché réclame des spécialistes capables de décrypter et de rendre clair pour un dirigeant d’entreprise les résultats issus du TDM, et pourtant seules 4 universités en France proposent cette spécialisation (Lyon 2, Paris 6 et 8, et Nice)... Cependant, de nouveaux diplômes et filières liées aux problématiques du numérique (dont le TDM et l’IST en général) sont en train d’être fondés par quelques professeurs visionnaires sur le territoire, depuis le début de l’année 2017, notamment à Paris.

Page 62: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

62

Quels sont ces nouveaux besoins d’IST des entreprises ? ■ Les entreprises ont besoin de l’IST, tant pour déterminer leurs bases de clientèle que pour fournir des produits innovants, qui permettent d’augmenter les externalités positives générées par un progrès endogène, fonctionnant en réseau, autour de grands monopoles chefs de file. Les plus grandes masses de données produites se situent dans les champs suivants ; physique, biologico-médical, chimique, linguistique, et historique dans une plus faible proportion. Nombre de ces données sont à même d’intéresser des entreprises valorisant ces données à travers des applications, numériques ou non. Ces applications peuvent aller dans le sens de l’intérêt général ; c’est l’idée des start-ups d’Etat, renforcée par la mise en place d’une première promotion des Entrepreneurs d’Intérêt Général en 2017. ■ Globalement, de grandes entreprises ont des besoins extrêmement spécifiques en innovation et donc en IST pour notamment envisager l’approche de la frontière technologique dans différents domaines, ce qui se traduit par le volume très lourd de publications financées ou à destination d’entreprises.

Source : Wos, Scopus, Reseda (données agrégées 2000-2014),

volumes de publications en partenariat.

Page 63: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

63

L’intrapreneuriat et les start-ups : pas seulement à Palo Alto ■ Outre l’essor bien connu des start-ups dans le sillage des GAFAM (Google Amazon Facebook Apple Microsoft), l’intrapreneuriat s’est également beaucoup développé en France entre 2010 et 2017, et la plupart des start-ups incubées en interne au sein de plus grands groupes font reposer leurs facteurs d’innovation technologique sur l’IST. ■ Le ciblage du marché et le calcul de l’opportunité d’innovation doivent se faire en amont. C’est dans ce sens que va le label Responsible Research and Innovation (RRI) de la Commission européenne, qui prend en compte l’importance de la recherche pour l’intérêt général, et permet d’éviter la sélection biaisée des projets à financer, trop souvent basée sur le profit commercial immédiat. ■ Certains marchés professionnels commerciaux nécessitent des formulations extrêmement détaillées, qui vont couvrir les besoins d’une mise en œuvre pragmatique, qui vont aller dans tous les recoins d’un brevet ou d’un descriptif afin d’éviter les failles dans l’application. Le marché de la recherche, lui, a besoin avant tout d’interactivité, c’est-à-dire d’une formulation qui prend du recul perpétuellement, un résultat qui, aussitôt qu’il est posé, appelle sa propre mise en perspective, son propre débat, in fine sa propre abrogation au profit de son successeur, un résultat qui sera encore plus juste et complet. Nombre d’initiatives de forums, où le résultat n’est jamais un fait acquis présenté dans un rapport ayant un lourd coût fixe logistique, mais bien plutôt un bilan, un état des lieux du chercheur qui souhaite l’avis de ses pairs, fleurissent depuis 10 ans. A la manière d’un statut Facebook, ou d’un tweet, qui ne vont jamais seuls mais toujours solidement reliés, à un tel point qu’ils en sont indissociables, avec une fonction de commentaires ouverts. Cette fonction, qui fut l’une des modalités de la consultation précédant la LPRN, ne doit pas être ignorée, et les chercheurs sont attachés à sa généralisation sur toutes les plateformes. Les entreprises doivent donc éviter de faire travailler leurs chercheurs en vase clos, mais privilégier des logiques d’ouverture et de coopération ; travailler à plusieurs, de façon interdisciplinaire, et sans repli sur les résultats d’un seul laboratoire. Une somme d’incompréhension et de court-termismes, pas une guerre ■ La DIST rappelle la nécessité de stabiliser le cadre public des services d’accès et de partage des résultats de la science publique. Or des services similaires sont proposés par le privé. Il peut donc y avoir conflit d’intérêts entre le principe d’intérêt général du service public et la liberté du commerce et de l’industrie. La stabilisation du droit de

Page 64: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

64

l’intervention publique est donc nécessaire pour fournir les services d’Open Process, nécessaires à la valorisation des résultats de la recherche publique. Cette équation n’est en tout état de cause pas insolvable, et ne doit pas se faire l’objet de pétitions de principe. 2. VISION : Faire évoluer les services d’IST vers

l’interopérabilité Si l’IST a des origines connues et une définition relativement inchangée, sa

direction dépend des décisions stratégiques qui orienteront à la fois les usages de la Recherche et les politiques publiques dans les années à venir, dans un premier temps à l’Horizon 2020, puis de façon étendue. C’est donc une matière d’action, une partie du monde numérique qu’il convient de construire de façon intelligente et avec une vision dépassant tous les court-termismes politiques, économiques et sociaux. Un courant proactif, un contre-courant sécurisant, devant porter à un équilibre ■ Il existe deux dynamiques qui doivent être complémentaires afin d’assurer la stabilité de la stratégie nationale IST ; d’une part, une force motrice, mobile, proactive, visant à ouvrir et simplifier les conditions d’accès et d’utilisation de l’IST, et d’autre part une dynamique de conservation, de stabilisation des acquis, de protection des droits, de défense du chercheur. Les options explorées par les partenaires européens ■ Plusieurs pays européens tels que l’Estonie (citoyenneté numérique) et la Suisse ont mis en place des modèles alternatifs de gestion de l’IST, et des comparatifs sont possibles, tant en matière d’usages (outils, niveau d’imprégnation de l’IST dans la culture scientifique), que de supports (plateformes). Un débat européen majeur a lieu autour de plusieurs sujets présentant plusieurs options possibles et parfois antinomiques, que seule une décision politique forte peut conduire dans une direction précise. Il peut s’agir par exemple du passage des droits d’auteurs classiques au droit de l’IST, de l’action fédératrice d’une agence nationale scientifique (CNRS dans l’ESR), ou encore de la création d’une « plateforme des plateformes » pour simplifier l’accès dans

Page 65: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

65

une époque où le passage à l’intuitivité et la pleine fonctionnalité numérique des travailleurs n’est pas encore complet. Développer une politique nationale de formation pour la Recherche et l'Education

Coordonner les efforts d'acquisition au sein de partenariats européens, avec de nouveaux modèles économiques et de valorisation

Proposer un point d'entrée unique vers l'IST, mais qui soit modulable pour s'adapter aux différents besoins

Limiter les dépenses de formation en utilisant le numérique, et éviter une décorrélation de l'offre et de la demande sur le marché de l'emploi en formant les élèves

Protéger les droits et la rémunération des chercheurs français, faire appliquer le principe de loyauté des plateformes de la LPRN

Ne pas créer un outil d'ingénieur "déconnecté de toute réalité", objet d'un non-recours fort, faire appliquer les principes de protection (secret, vie privée) de la LPRN

Le paradoxe du chercheur : chercheur-cherchant contre chercheur-publiant ■ Le paradoxe majeur qui hante l’IST réside en ce que le chercheur, le citoyen, ou l’entrepreneur qui est à la recherche d’une information veut disposer d’un seul outil unifié rassemblant un maximum de données, mais lorsque ce même chercheur, citoyen ou entrepreneur se voit placé en situation de diffuser ses propres données, celles qui émanent de lui, de ses travaux, de sa personne ou de son business, il fait montre d’un désir irascible de se protéger, c’est-à-dire d’en donner le moins possible, et appelle de ses vœux la spécificité des services par lesquels ces données transitent ou sur lesquels elles sont stockées, ce qui à l’échelle collective implique une diversité d’outils. ■ Ce paradoxe a bien été souligné dans les résultats de l’enquête conduite auprès des Directeurs d’Unités ; 89% des DU se déclarent favorables à une mise en réseau européenne voire internationale des dépôts de communication en Open Access, mais seuls 30% ont déjà payé pour qu’un article soit en libre accès, et seuls 16% de ceux ne l’ayant pas fait se déclarent prêts à le faire.

Page 66: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

66

Comment répondre à ce paradoxe ? ■ Il faut donc implémenter un service (plateforme ou module) unique et public, qui puisse être sujette à des choix internes (options convenant à chaque domaine d’IST, personnalisation pour chaque type de secteur/recherche), et qui se serve de la puissance et du professionnalisme des systèmes privés déjà existants. Cette plateforme devra garantir un prélèvement algorithmique standardisé de l’information, qui ne rencontre pas d’opposition forte de la part des usagers, et dont l’Etat puisse garantir la sécurisation, en partenariat avec le CNRS et la DIST pour gérer la frange « Recherche » et donc les désirs et besoins des chercheurs. ■ Cette plateforme pourrait être conçue comme un point d’entrée général de tous les citoyens, chercheurs, entrepreneurs, et donc comme la mise en relation des demandes et des offres d’IST, avec en parallèle des programmes d’analyse fine qui permettraient de dégager les grandes tendances statistiques de ces demandes et des offres, afin de les adapter l’une à l’autre. ■ L’objectif est donc de doter les Unités du CNRS et leurs partenaires, de références sur l’accès à la documentation, les usages documentaires, la publication, les données, et de clarifier les alternatives juridiques ouvertes aux publications en Open Access. Un autre objectif prioritaire est de couvrir le périmètre des services à valeur ajoutée publics, aujourd’hui mal définis, dans un contexte où l’offre est dominée par le marché. 2.1. Développer une politique nationale de formation de soutien pour la recherche et l’éducation

La production généralisée de données numériques induit de facto des besoins importants de formation continue permettant la maîtrise des descriptions, stockage, traitement, analyse. Ces formations ne se limitent pas à la connaissance des outils technologiques pour accomplir ces tâches mais englobent également les aspects méthodologiques, juridiques et organisationnels nécessaires au montage des plans de gestion de données et fonctionnement des infrastructures. Pour partie, ces formations devront être communes aux trois corps de métiers qui concourent à la gestion efficace des infrastructures : scientifique, informaticien et professionnel de l’information. La description des données met en jeu aussi des connaissances du champ scientifique.

Page 67: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

67

2.1.1. Fluidifier l’utilisation des outils en répondant aux difficultés rencontrées Rendre les outils intuitifs, informer

Avant tout, des FAQ (Foires aux Questions) solides et exhaustives doivent être établies sur le site de la DIST, afin de permettre d’apporter un point de recours et de réponse central et bien aiguillé pour tous les personnels maniant de l’IST. Cette première dynamique, fondée sur l’envoi, par chaque chef de projet (outil, support), de sa FAQ locale (une pour ISTEX, une pour OPIDOR, une pour HAL, etc.) combinée à une nomenclature des questions portant sur l’IST en général, servirait à diminuer le volume de réponses à apporter. ■ Il faut rendre les outils intuitifs pour limiter les besoins d’assistance récurrents, et c’est dans ce sens que va l’étude commandée par ISTEX concernant l’ergonomie. Une expérience utilisateur robuste et facile permet de désengorger les besoins de formation et les requêtes d’information. ■ Au vu de l’urgence d’une mise à niveau permettant à chacun de déposer dans HAL et arXiv, il faut d’emblée effectuer un rappel obligatoire sur ce point, sous la forme d’un atelier géré par les chargés locaux de la formation IST auprès de chaque acteur. L'INP ainsi que l’INSU font observer la nécessité d’améliorer des "vases communicants" simples entre HAL et arXiv, afin d'assurer une représentation pertinente et complète des dépôts et de valoriser ainsi le projet national, soutenu par le MESR et l'Académie des sciences. Mettre en relation les bonnes personnes avec les bonnes consignes et orientations ■ De plus, il convient de mettre en relation les ingénieurs européens et european project managers servant de répondants aux différentes questions concernant les plans de gestion de données (OPIDOR) avec les personnels de l’INIST. ■ Sur la suggestion de l'ADBU, il faut articuler les tutoriels et l’offre de formation avec le programme européen FOSTER, en inscrivant dans chaque module/note/atelier un renvoi à FOSTER.

Page 68: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

68

■ Donner des ordres de mission concernant la diffusion de l’information en interne à chaque CORIST pourrait être utile, ce qui permettrait de conférer une autorité plus grande à chaque correspondant au sein de son milieu de travail, et par là même une plus grande légitimité et visibilité pour recevoir et identifier les requêtes. Aller plus loin grâce à la technique ■ L’exigence d’un matériel informatique de qualité est une condition nécessaire pour rendre possible le passage complet du CNRS au numérique. En effet, la non-conformité de certains ordinateurs aux prérequis récents, et les inégaux niveaux d’équipement logiciel existants entre les UMR et établissements, limitent l’utilisation des standards communs de format de l’IST (simplification). ■ Pour aller plus loin que la veille et la recherche documentaire, certains algorithmes suggèrent désormais des sujets de recherche aux chercheurs ; cependant, ces algorithmes doivent veiller à ne pas entretenir des logiques de priorité déjà existantes, contournant ainsi les nouveaux sujets et réduisant le potentiel d’innovation de la recherche. Une part d’aléa, qui constitue la base de tout travail sur des documents papiers dans un environnement de type bibliothèque physique, doit être conservée. 2.1.2. Optimiser les savoirs et compétences pour la transition numérique ■ Outre le flux des questions/réponses ponctuelles, il convient cependant de former durablement les personnels de la Recherche aux nouveaux supports et usages de l’IST, sans trop faire reposer d’espoirs sur l’ajustement naturel provoqué par le changement de classes d’âge et de générations. Il faut donc encourager la mise en œuvre d’un plan de formation par les personnels de l’INIST notamment, au sein des URFIST. Pratiques de recrutement et de gestion du personnel prenant en compte les besoins en IST ■ Cela passe avant tout par des pratiques de recrutement qui tiennent compte de la stratégie à long-terme de mise à niveau en matière numérique, et plus particulièrement concernant les pratiques IST. Ce qui doit être recherché n’est pas une compétence spécifique, mais la capacité d’adaptation ou la résilience permettant à chaque individu de comprendre les nouveaux enjeux, évoluant en permanence et de plus en plus rapidement, qui parsèment leur environnement professionnellement.

Page 69: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

69

■ Le chercheur n’est pas toujours disponible, physiquement et mentalement, pour entendre parler de l’IST, même si cette dernière occupe une place de choix chaque jour grandissante au sein de ses activités. En effet, de nombreux autres impératifs s’appliquent à ses journées, et les normes formelles imposées par le cadre européen ne suffisent pas, pour une grande majorité de travaux fonctionnant en vase clos (étant encore à l’état de brouillons, documents de travail) ou ne nécessitant pas de collaborations internationales, à motiver un apprentissage rigoureux des subtilités d’usage de l’IST. 1ère ligne de formation : en ligne ■ La première ligne de formation aux nouveaux usages de l’IST doit ainsi passer par une offre de formation en ligne. « Nous ne disposons pas de service de formation à distance et serions très intéressés par un site qui nous permettrait de développer nos propres formations à distance ou d’utiliser/faire utiliser celles qui seraient réalisées par d’autres professionnels de l’information de l’ESR sur des sujets que nous ne maîtrisons pas, ou sur lesquels nous n’avons pas le temps de développer des outils d’apprentissage. » Cette offre permet à chacun d’organiser son apprentissage par rapport à ses disponibilités d’une part, et à ses besoins spécifiques d’autre part, sans contrainte horaire ou spatiale, et surtout sans donner une information à quelqu’un qui la connaît déjà. Cette ligne existe dès à présent à travers OPIDOR et DoRANum. Le service 5.5. (« Formations à distance sur la gestion, la préservation, le partage et la diffusion en libre accès des données de recherche (DoRANum BSN) ») a été encadré par les réponses aux questions 120 et 122 notamment, qui mettaient en avant des points à améliorer. DoRANum a d’ores et déjà commencé à diffuser ses vidéos de formation en ligne. Il s’agit d’une formation complète, à distance, fondée sur de petits modules de e-learning s’adaptant à chaque besoin d’apprentissage en fonction non seulement du niveau de compétence mais aussi du niveau d’intérêt pour l’IST (« en bref », « pour comprendre », puis « pour aller plus loin »). Ces modules sont pour certains imprimables et DoRANum propose également des visuels concernant l’IST (marque-pages et fiches synthétiques) que chaque unité peut diffuser ou afficher en interne. Cependant, une mise à disposition d’OPIDOR et de DoRANum sur un site commun serait à ce titre envisageable. Cependant, cette ligne nécessite d’être associée à une seconde ligne, permettant le contact humain avec des personnels IST, car il peut être difficile d’accéder spontanément à la bonne information, les réflexes informatiques n’étant pas toujours présents parmi les communautés de chercheurs. Cette première ligne numérique doit

Page 70: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

70

donc pleinement dépasser le cadre de l’information pour constituer une véritable formation. 2nde ligne de formation : ponctuelle, pour les personnels locaux non-spécialistes ■ La seconde ligne, complémentaire, consiste en une formation ponctuelle des personnels informatiques et des documentalistes locaux, au sein de chaque unité de recherche ou établissement. On a constaté que les chercheurs, enseignants et étudiants se tournent en priorité vers eux lorsqu’ils sont confrontés à une interrogation concernant l’IST. Les former permettrait donc, par ruissellement, d’apporter une information de qualité jusqu’aux couches académiques et professionnelles les plus éloignées de l’IST au quotidien, et ce à l’initiative de chacun, ce qui éviterait toute forme de lassitude ou de non-recours. Cette ligne a pour but de délester la troisième ligne, tout en permettant d’orienter chacun vers les ressources issues de la première ligne si le désir d’en savoir plus est manifesté, à titre du droit à la formation continue ouvert pour les salariés et agents de la fonction publique. 3ème ligne de formation : continue, par et pour des personnels qualifiés en interne ■ La troisième ligne, déjà bien établie mais qui doit poursuivre les efforts engagés, est celle de formation continue, par des personnels qualifiés rattachés à des organes centraux du CNRS (DIST et INIST). A ce titre, le nombre de personnels dédiés à ces tâches de formation en interne pourrait être augmenté afin de pouvoir compter sur ces agents pour de nouvelles missions auprès des partenaires de l’IST, aux premiers rangs desquels les établissements et unités de recherche. Il faut harmoniser l’offre de formation de l’INIST et celle des URFIST par un approfondissement du dialogue entre les deux. De façon globale, redessiner la structure décisionnelle dédiée à l’IST au sein du CNRS autour d’une approche utilisateur serait souhaitable, sur le modèle d’un large « front office » spécialisé en formation et à même de répondre aux questions formulées en termes profanes, secondé par un « middle office » centré sur la coordination des acteurs œuvrant dans le même sens, et d’un petit « back office » impulsant la stratégie et commandant les études nécessaires à la prise de recul sur le sujet.

Page 71: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

71

Une validation des acquis de l’expérience corrélée à la maîtrise des usages de l’IST ■ La validation des acquis de l’expérience (VAE) en matière d’IST doit pouvoir se faire sur la base d’un cahier de critères précis déterminant le degré de maîtrise de diverses compétences génériques, sans que ce dernier soit trop dépendant des supports ou outils précis (plateformes, logiciels), qui eux varient perpétuellement. ■ Outre cette VAE, il convient de s’assurer que les actions de base requises par les chartes de bonne utilisation de l’IST dans la recherche soient effectuées avec précision et systématisme. Avant tout, il faut assurer le respect des règles de dépôt dans les archives ouvertes HAL, en mettant en place un mécanisme incitatif adossé pour les cas d’abus à un mécanisme correctif fermant certains droits de lecture tant qu’une production rédigée voire publiée n’est pas intégrée ou ses métadonnées pas suffisamment renseignées. La dépendance des protocoles au marché ■ Les protocoles d’IST peuvent être développés unilatéralement par les entreprises ou individus au sein de ces dernières ayant une autorité suffisante, sans prendre en compte leur légitimité ni l’acceptation préalable de la communauté scientifique. Ainsi, certaines firmes formulent leurs résultats dans un protocole qui leur est propre, et imposent leur formulation à ceux qui dépendent de la compréhension de cette information pour leur développement académique ou professionnel. En revanche, si les universitaires ou les développeurs d’applications techniques issues de ces projets « cryptés » doivent apprendre le nouveau protocole par besoin, le profane ou le passionné simplement intéressé par un résultat ponctuel à propos d’un élément qui le fascine n’aura ni la motivation (incitative) ni le temps nécessaires. A l’inverse, un acteur se donnant pour but de vulgariser un résultat peut utiliser des termes totalement différents de ceux reconnus par le milieu scientifique, voire pire encore, en amalgamer plusieurs et brouiller les définitions. Vulgariser l’IST… ■ La vulgarisation est la plus connue des « reformulations » qui prennent en compte le niveau de prérequis minimal et le contexte social de l’opinion pour enseigner des techniques d’IST. Le volume de ces formulations destinées au profane représente

Page 72: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

72

20 000 titres cette année ! Permettant une large diffusion et une uniformisation des résultats, la vulgarisation a pour défaut d’infantiliser le récepteur, et de réduire l’ampleur de l’information, l’angle par lequel l’IST est abordée empêchant au récepteur de réaliser tous les potentiels et interconnexions de cette dernière. De plus, il ne faut ni subordonner l’IST à ses applications les plus spectaculaires, qui de surcroît ne sont pas toujours les plus utiles, ni masquer ses limites en en faisant une science absolue, effaçant sa nature instable, ses fragilités nécessaires. … ou plutôt la simplifier et la spécialiser ? ■ Plus que d’une vulgarisation, c’est donc d’une simplification dont l’IST a besoin à l’horizon 2020. La LPRN va dans ce sens, et elle a été préfigurée par les travaux sur la rationalisation, depuis les Lumières. La simplification permet une large diffusion du résultat, l’atteinte du marché niche souhaité, sans niveler par le bas. ■ Outre cette simplification générale de l’IST, commandée par les besoins exprimés par tous les acteurs conjointement, un second principe, celui de spécialisation, doit intervenir ; il faut diriger la bonne quantité et la bonne nature d’IST vers chaque acteur, et appliquer un niveau de sécurité cohérent avec les réalités de chacun. Proposer la même arme et la même armure à chaque combattant, qu’il soit tireur d’élite, fantassin, blindé ou pilote de l’air, serait vouer le combat à l’échec ; il en va de même pour l’IST, où chacun est différent mais complémentaire, et engagé dans un parcours d’une même intensité pour faire de la France un grand Etat numérique. Une formation solide par l’INIST pour H2020 ; comment améliorer les tutoriels proposés ■ La DIST a sollicité l’Inist pour participer à la mise en place de formations visant à accompagner les chercheurs ainsi que les ingénieurs projet européens (IPE) sur le volet IST de H2020. Elles se présentent sous forme de modules en ligne, à destination des chercheurs, des IPE (Ingénieurs projets européens) et des responsables des SPV (services de prospective et de valorisation). Ces tutoriels sont disponibles en ligne avec une documentation associée sur www.inist.fr rubrique « tutoriels libre accès aux résultats de la recherche » dans le cadre de H2020. Chacun dure environ 10 minutes. Les tutoriels actuels doivent cependant faire montre d’une meilleure qualité visuelle, à préférer aux présentations PowerPoint, tout en mettant une voix agréable et un ton enjoué au service de résumés brefs ponctués d’exemples très concrets, voire de

Page 73: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

73

captures d’écran illustrant les procédures pas-à-pas. Ajouter des thèmes tels que la propriété intellectuelle ou industrielle et leur encadrement, ou encore l’IST au service de la robotique, permettrait de susciter un plus vif intérêt chez les individus, et de créer des motivations supplémentaires pour accéder aux ressources, en faisant de la culture et de la connaissance personnelle une dynamique prenant le pas sur le simple utilitarisme pragmatique et professionnel. D’autres idées complémentaires ■ Le site d’information sur les données de la recherche (service 5.7.) doit être animé par un acteur (ou un groupe d’acteurs) de l’IST ; en effet, sans cette présence en ligne qui va au-delà de l’hébergement ou du simple entretien, il ne saurait être autre chose qu’un vulgaire réservoir de documents, peu opérationnel. Une newsletter IST, copiable et collable dans chaque newsletter locale, permettrait tant d’informer la communauté scientifique des nouveautés de l’Open Science que de rappeler en fin de mail les URLs utiles. Pratiquer un référencement intelligent par l’apposition de tags sur chaque article / ressource dudit site et sa galaxie de blogs est nécessaire à la navigation fluide côté visiteur. 2.1.3. Connecter les chercheurs de l’IST française entre eux

Le lien entre l’IST et les chercheurs est donc d’abord une question d’information et de formation. Néanmoins, le resserrement des liens entre les chercheurs utilisant et produisant de l’IST permettrait d’ouvrir encore plus les forces en présence aux externalités positives, et de favoriser des synergies encourageant une acquisition commune des compétences autour de laboratoire et organismes « chefs de file ». L’essor de véritables synergies par le bas, horizontalement entre les acteurs de l’IST, s’est traduit par le formidable essor des revues interdisciplinaires entre 2000 et 2015.

Page 74: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

74

L’existant est déjà bien développé, il faut le recadrer et le partager ■ Partager les règles de régulation et mettre en lumière les outils organisationnels d’ores et déjà intégrés aux supports est essentiel pour assurer un partage convivial de l’IST. Ces outils relèvent de l’organisation de conférences, de l’inscription d’événements et réunions au sein de calendriers collaboratifs, ou encore de l’établissement d’un véritable « réseau social des chercheurs », intersectoriel, qui se superpose à un réseau social existant ou complète l’offre de service du point d’accès unique développé. ■ L’INIST est par ailleurs impliqué dans des projets de R&D et investissement d’avenir intégrant une part importante de fouille de textes pour proposer un accès élaboré aux connaissances scientifiques décrites dans les publications que l’INIST met à disposition de la communauté. Les projets actuels sont : Au sein d’ISTEX : enrichissement des textes par reconnaissance de termes, entités nommées, citations, nécessaires au développement de services à valeur ajoutée, Quareo : annotation de textes et développement d’outils d’analyse sémantique de textes scientifiques ; ANR TermITH (Terminologie et Indexation de Textes en sciences Humaines) : accès à l'information des documents numériques par le biais d’une indexation fondée sur les termes qu’ils contiennent, ce qui suppose reconnaissance, désambiguïsation et analyse des termes ; UBIK : détection et caractérisation de vocabulaires transdisciplinaires, approche complémentaire des travaux sur les terminologies. ■ Lorsqu’un établissement possède un service en ligne d’assistance pour les questions d’IST (service 6.3.), une collaboration peut être envisagée si la proximité de l’outil d’assistance avec les acteurs locaux est garantie. Le CNRS doit jouer le rôle d’un animateur de réseau. Le rôle du CORIST local ou d’une FAQ généraliste facile d’accès est ici primordial. Les autres réseaux d’assistance, tels que le réseau Boomerang, ne seront mis de côté que si l’offre nationale est cohérente, consultable librement, conviviale et surtout utile. Un verbatim résume cette précaution ; « Le guichet d'assistance est actuellement limité aux archives ouvertes et les autres demandes de documentation électroniques se font directement par mail et téléphone à la responsable du portail ou des ressources électroniques. Un service de guichet permettrait de mieux associer les correspondants dans les laboratoires et de répartir ce service au niveau national pour les questions d'ordre général. Il ne peut fonctionner qu'en intégrant les professionnels de l'IST des établissements. »

Page 75: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

75

Apporter des outils utiles sans tenter de rivaliser avec les réseaux sociaux classiques issus du secteur privé ■ En vue de mutualiser les outils terminologiques et de développer et gérer des ressources terminologiques et des ontologies nécessaires aux processus d'enrichissement des métadonnées, en construisant et exploitant des ressources de représentation des connaissances (RRC), il est en outre engageant de ;

- Créer une plateforme unique des vocabulaires de l’ESR - Alerter (sous forme de notifications) pour informer sur les thésaurus alignés - Faire du lobbying pour les thésaurus internationaux (Gemet par exemple) - Assister au traitement ponctuel de vocabulaires

■ Il faut coupler les services tels que I-Revues avec ScienceConf par exemple, pour les actes de congrès. Les congrès, qui sont autant d’occasions d’aménager les interactions entre chercheurs et de renforcer les maillages interprofessionnels, doivent trouver leur extension naturelle dans des comptes-rendus pouvant générer de nouvelles discussions entre les participants, y compris une fois l’évènement physique terminé. ■ Une politique intelligente de l’IST française doit savoir négocier habilement des ressources et outils issus de la concurrence privée internationale lorsque le rattrapage de ces derniers par des outils développés nationalement par une agence de l’Etat est trop coûteux. Les dépenses d’investissement doivent se focaliser sur les clés de formation, d’unification de l’accès et de partage. Les équivalents internationaux de SciencesConf tels qu’EDAS, Azur Colloque et Easychair sont plébiscités par les chercheurs, et les solutions sont à chercher non pas dans un énième effort de publicité et communication sur SciencesConf, mais dans la capacité de ce projet à innover en prenant exemple sur les fonctionnalités phares des deux programmes cités. Un paiement en ligne pour les frais d’inscription aux colloques serait notamment envisageable sur la plateforme. La plateforme doit mieux savoir communiquer avec l'archive ouverte HAL (ce qui n'est pas le cas actuellement) et aligner ses fonctionnalités éditoriales sur les pratiques en vigueur à l'international pour les grosses conférences (plus de 300 articles à gérer avec des fonctions automatiques). La possibilité de signaler des « conférences isolées » sur Calenda serait très appréciée. ■ Un autre enjeu en lien avec cet alignement sur les outils disponibles gratuitement sur le marché, et qui n'est pas des moindres, est de permettre aux scientifiques, de conserver la souveraineté sur les données (notamment les rapports de relecture) en ne

Page 76: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

76

les laissant pas à disposition d'entités privées qui les monnaient à des tiers pour des usages non maîtrisés. Sans vouloir créer un « entre-soi », une certaine proximité et confiance sont nécessaires à la formation d’un environnement sécure et confortable où les chercheurs et les amateurs intéressés trouvent de l’intérêt à communiquer et à se passionner ensemble pour leurs sujets d’étude. 2.2. Développer de nouveaux circuits économiques

“Winner takes all, first come first served” ; une approche publique fine

Entrer dans une concurrence directe et violente avec l’offre privée, représentée

par OST ou Google Scholar, serait couronné de peu de succès, dans la mesure où des logiques de monopole (le gagnant prend tout et premier arrivé, premier servi) priment, et que le coût en argent et en temps nécessaire pour ne serait-ce qu’espérer égaler ces outils par une offre nationalisée serait trop élevé, sans maximiser l’utilité générale. Des partenariats doivent donc être mis en place pour penser le périmètre d’IST nécessaire à chaque acteur, et cette offre intelligente doit faire l’objet d’une régulation juridique nationale, où l’Etat retrouve toute sa place de premier plan.

Convergence de principe sur le libre accès, divergence entre voie verte et voie dorée

Le libre accès, tout comme la recherche elle-même, est une question globale, traitée par ailleurs à de nombreux niveaux internationaux (Science Europe, Global Research Council, Knowledge Exchange COAR9 etc), au niveau européen, au niveau national dans le cadre de la BSN. Cette convergence de principe n'exclut pas les divergences, avec une opposition portant, notamment sur le modèle d'auto-archivage (voie verte) et le modèle de publication dans des journaux « Open Access » (voie dorée). Au sein de cette voie dorée, on peut distinguer deux variantes ; le doré avec frais de publication réglés par l’auteur ou son institution (dites APC, pour « article processing charges »), et le doré sans frais, avec de nouvelles formes d’édition. Le lobbying des grands éditeurs classiques a conduit à décrédibiliser l’Open Access en voie dorée, en faisant passer les journaux qui le pratiquent pour des prédateurs offrant peu de services et faisant payer l’auteur. Mais l’incidence du coût ne repose que très rarement sur le

9 http://www.scienceeurope.org/, http://www.globalresearchcouncil.org/, http://www.knowledge-exchange.info/, http://www.coar-repositories.org/

Page 77: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

77

publiant, et n’est que très rarement assumé par l’auteur, mais bien plus souvent par son organisme de rattachement. Cela ouvre bien des questions, tant sur l’acceptabilité de nouveaux modèles que sur leur pérennité. 2.2.1. Poursuivre la coordination les efforts de négociation et d’acquisition des établissements au sein de partenariats européens pour les stratégies d’achat

Le CNRS a une offre de service mais les établissements proposent eux aussi un service analogue, d’ailleurs gratuit dans beaucoup d’universités pour les unités de l’établissement. La question de la gouvernance pour la fourniture de documents est posée.

Un tronc commun, des tailles locales ■ Elle ne peut être que partagée, et l’initiative des acquisitions pourrait être pilotée conjointement, par un système en ligne agile, par le CNRS et les COMUE. Le partage de services doit se faire en parallèle d’un partage de ressources. Le CNRS doit fournir un « tronc commun », un fond de ressource documentaire, complété sur des sujets de niche ou spécifiques à un territoire par les Universités et acteurs locaux. D’une manière générale, il est absolument nécessaire que l’offre du CNRS s’articule de manière efficace avec les acteurs de l’IST en local, en particulier avec les SCD. La mutualisation doit se penser selon une approche de complémentarité : d’une part le rôle de l’accompagnement de proximité doit être dédié aux acteurs implantés en local, d’autre part au niveau national le CNRS doit proposer des outils et des infrastructures dotés d’une gouvernance partagée. Les outils proposés doivent être en open source et complètement adaptables en local. Les ressources doivent pouvoir être librement modifiées et réutilisées. Intégrer la dimension européenne des politiques d’acquisition ■ Ce qui a été fait dans ce sens est déjà très concluant, et témoigne d’un effort national important concernant les stratégies d’achat de ressources. Cependant, la dimension européenne de ces achats est souvent laissée de côté, et il est envisageable d’impliquer les partenaires européens tels que le réseau Knowledge Exchange au sein d’acquisitions coordonnées et négociées, permettant les échanges amiables d’articles au lieu du paiement systématique et parfois doublonné qui existe actuellement.

Page 78: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

78

Aller vers une plateforme européenne commune à terme, dans un horizon plus étendu, est également imaginable. Une politique publique polymorphe ■ Pour poursuivre cette coordination de façon plus sereine, il est important de ;

- Décentraliser la collecte des avis et besoins o collecter les avis (COPIST) o les synthétiser (DIST)

- Centraliser l’offre de services et la formation - Intégrer la stratégie IST

o à l’échelle européenne o au milieu entrepreneurial

L’ingénierie de négociation d’achat des ressources et des outils ■ L'ingénierie de négociation d’achat de ressources numériques est une activité dans laquelle l'INIST bénéficie d’une expérience acquise depuis presque 10 ans dans les négociations thématiques (pour les portails) ainsi que de celle acquise dans les négociations nationales (au côté de Couperin, des EPST et de l’ABES) dans lesquelles l’INIST représente le CNRS. Ces négociations concernent annuellement plus de 50 éditeurs (70 bouquets de revues ou bases de données) afin d’obtenir des baisses tarifaires, la pérennité des accès et la mise à disposition de statistiques d’usage. Sur cette base, l'INIST peut apporter une réflexion et un conseil aux Instituts autour du besoin du chercheur (I’InSHS souhaite un service au plus près des besoins, l’INSIS n’exprime pas de besoins (à part IEEE), l’IN2P3 n’a pas de besoins identifiés).

Page 79: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

79

■ Parallèlement aux acquisitions de ressources, existent des acquisitions d’outils. Il serait intéressant d’agréger les données statistiques des portails CNRS à celle des portails universitaires afin de produire des statistiques consolidées au niveau d'un type de ressources, d'un labo, d'un établissement ou d'un groupement. Un dialogue COMUE – CNRS doit être engagé à ce sujet. Il convient désormais de développer le périmètre des établissements utilisateurs de la solution ainsi que le nombre de plateformes analysées. Mettre en commun les coûts de développement de services statistiques performants en utilisant l’Open Source pour certaines parties du code permettrait de proposer ces services quasi-gratuitement aux acteurs de l’IST. La prudence des Instituts quant à l’acquisition ■ L'InSHS choisit de négocier lui-même ses revues avec CAIRN, pour rester ferme sur le périmètre des revues à acquérir. La suggestion est faite d’inclure au besoin un chercheur dans le périmètre des négociations. L'INSHS entend définir ses acquisitions et abonnements au plus près des besoins des chercheurs et des laboratoires. Le RNBM a tenté de le faire, en se maintenant dans la négociation avec Springer en y amenant un regard scientifique. Il y a un besoin de soutien juridique aux instituts qui s'engagent dans les négociations. ■ L’INSMI est en train de monter une organisation de mutualisation afin d’assurer la pérennité des services offerts par les 3 sociétés savantes (françaises et européenne) les plus proches de la communauté. ■ En cette période de transition entre les modèles Gold et les abonnements, il est prudent « d’assurer ses arrières » en conservant un service de fourniture de documents performant (à ce titre, l’INRA vient de décider de réactiver la fourniture de documents pour ses équipes de recherche). 2.2.2. Concevoir une offre soutenable pour les établissements, en repenser les périmètres d’accès

Chaque établissement a des besoins en IST différents, allant de la simple consultation de titres rapide à des fonctions de suggestion de sujets de recherche approfondies en passant par des besoins complémentaires de TDM. En dehors des acquisitions de ressources et d’outils pour les traiter, les frais d’adhésion à un support

Page 80: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

80

sont donc une part majeure du choix complexe que doivent effectuer les décideurs dans chaque acteur. 1er arbitrage : rechercher sans perdre de temps ■ Un premier arbitrage se fait entre la volonté de pouvoir rechercher l’information parmi le corpus le plus large possible, sans pour autant consacrer un temps trop important à cette recherche ; il a été solvé par les puissants outils de TDM qui, en dépassant largement les fonctions de base d’un simple CTRL+F tapé au clavier, permettent désormais de rechercher des synonymes, des unités de sens, voire des motifs iconographiques. 2nd arbitrage : trouver sans trop dépenser ■ Le second arbitrage, en revanche, demeure ; entre cette même volonté d’accéder à une somme maximale de documents et une possibilité de financement contrainte, avec l’impossibilité de déterminer, document par document, lequel entre ou non dans le périmètre d’intérêt. Un premier possible : consultation de listes et paiement à l’article ■ De surcroît, si privilégier un système où chacun dispose d’une liste a maxima de titres de documents, puis doit payer pour en lire le contenu exhaustif (à la manière des articles de presse présentant seulement un résumé et leur titre gratuitement, ou « paiement à l’article ») a longtemps paru être une piste envisageable, ce n’est plus vraiment le cas. En effet, les listes de titres constituent en elles-mêmes, étant donné le volume global d’information que les éditeurs doivent traiter, une IST valorisable, issue d’un long travail sur les métadonnées et le référencement, qui ne peut donc pas se voir proposer gratuitement.

Page 81: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

81

■ Ce traitement de l’IST côté éditeurs rejoint aussi un long travail de préparation de l’environnement de diffusion par les entités de coordination de l’IST, qui a également un coût ;

Page 82: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

82

Les bouquets d’achats, « packs » et autres acquisitions en lots ■ L’acquisition définitive des droits sur les documents par chaque unité est une option évacuée d’emblée, car d’une part elle accroît la concurrence et la détention exclusive et va à l’encontre du partage, et d’autre part elle occasionne des coûts bien trop importants, sachant qu’aucun directeur d’unité ne peut anticiper exactement quelle est la nature et l’étendue de l’IST que ses chercheurs nécessiteront durant une année civile. ■ Si les « packs » ou options d’achat proposés par exemple par le consortium Couperin pour adapter le périmètre documentaire selon les besoins de chaque acteur ont constitué une première étape de résolution, il faut aller plus loin, car nombre de documents et volumes d’IST sont encore acquis sans jamais être utilisés. Des doublons et une double irrigation instituts/universités doivent aussi être supprimés dans une concertation signalant les opportunités de commandes groupées. Et, si des soutiens ponctuels de la part de l’Etat (subventions, transferts, aides à l’acquisition) ont été établis sur les 5 dernières années, ce système n’est pas pérenne et ne peut rendre possible une gestion sereine à long terme de l’acquisition d’IST. Au-delà des voies vertes et dorées : imaginer un modèle économique des micropaiements ■ Aussi, une première solution intéressante serait de mettre en place une tarification qui voit au-delà des voies vertes et dorées, permettant l’émergence d’un nouveau workflow, d’un nouveau rapport à la recherche, intégrant totalement les possibles numériques, sans être le format classique de « paiement à l’article » peu plébiscité par les grands noms de l’édition, et composée par exemple comme suit :

- Une part forfaitaire, liée au coût logistique pour le fournisseur du service de recherche centralisé ;

- Une part « sectorielle », liée aux centres d’intérêt scientifique renseignés comme prioritaires par l’unité ;

- Une part « au volume de recherche », proportionnelle au volume d’IST sollicité par les recherches de l’unité en question (indépendamment de la lecture effective des données, il s’agirait d’une compensation du coût de référencement et d’affichage ordonné, couvrant également la réutilisation-citation de titres) ;

- Enfin, une part « en lecture pleine », concernant les documents (articles, datasets) lus intégralement ou téléchargés.

Page 83: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

83

■ Une seconde piste non-concurrente, qui reste dans cette approche de l’IST comme un service partagé payé à l’usage, consiste à rendre disponibles pour un coût moindre les résultats d’une recherche effectuée préalablement par un chercheur A (en t-1) au chercheur B en t. L’avantage d’une telle optimisation des recherches serait qu’une partie du paiement effectué par B (sur la part « en volume ») pourrait être transférée à A au titre de l’effort de curation qu’il a effectuée sur les données brutes, à la mesure du nombre d’opérations de filtrage effectuées. L’inconvénient est qu’il faudrait munir chaque unité, si pas chaque citoyen ou chercheur, d’un compte capable de quantifier l’effort fourni et reçu, et donc les micropaiements. Inciter au lieu de contraindre : le principe de confiance contenu dans la blockchain ■ Il faut définir, préalablement avec la DSFIM et la DDAI, les bases budgétaires à retenir pour encadrer les évolutions possibles. Techniquement toutefois, ces deux options sont tout à fait envisageables, et rappellent dans leur principe la rémunération interne prévue lors du « minage » (chiffrement) d’un bloc monétaire (ex : 1 bitcoin) lors du développement d’une blockchain. En d’autres termes, celui qui permet à l’information d’exister ou d’être sécurisée reçoit en contrepartie un paiement utilisable seulement pour acquérir plus d’information. Le principe de fonctionnement en boucle fermée présuppose que ces micropaiements ne se feraient donc pas nécessairement en monnaie réelle, mais plutôt sous forme de « points ». De cela résulteraient deux avantages supplémentaires ; l’incitation à curer les résultats pour en gagner, et l’incitation à poursuivre ses recherches, ceux gagnés ne pouvant être dépensés autrement. ■ En termes de gouvernance, la section IST du CNRS doit se recentrer sur les compétences IST opérationnelles, et prioriser le fait de rendre possible l’accès sur l’analyse de ce même accès. Cette dynamique se fonde sur le rapport fourni par le cabinet Ourouk synthétisant les résultats de l’enquête COPIST 2016. De même, une co-gestion entre la CPU et les organismes, à partir des retours du COPIST, semble la manière la plus soutenable et légitime d’opérer la mise en œuvre de ces nouveaux modèles d’achat.

Page 84: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

84

2.2.3. Etablir un nouveau modèle économique de valorisation (recommandation, etc.) au cœur d’une Science Ouverte fonctionnant sur le principe de Libre Accès

En dehors de ce premier besoin qu’est l’acquisition d’IST, les chercheurs sont aussi producteurs d’IST et d’articles issus de cette dernière. Leur existence dépend de revenus générés par cette production. Il convient donc de mieux valoriser les sciences dures à travers de nouvelles entreprises, et plus largement de redynamiser les systèmes éditoriaux pour permettre à tous les secteurs scientifiques, y compris les SHS, d’éviter la précarisation et la marginalisation. ■ Le chercheur se voit proposer de nombreux outils de valorisation de sa production, nés sur le marché privé dans les communautés du libre, dans les réseaux sociaux (Research Gate et Orcid, Scopus, ResearchID, LinkedIn…). Ces outils peuvent à la fois générer des classifications de thématiques des chercheurs et des publications et de mettre en relation les chercheurs. Mendeley, par exemple, permet de générer des bibliographies automatiques, de gérer une bibliographie en collaboration avec d’autres chercheurs, de trier de la bibliographie et d’être en relation avec sa communauté Les difficultés de mise en place d’un paiement au volume de lecture ■ Le modèle de paiement au volume de recherche permettrait de rémunérer les auteurs sur un compte associé à la plateforme. Cependant, plusieurs phénomènes concourent à rendre impossible une parfaite mise en équivalence entre les paiements effectués et les rémunérations reçues par la communauté scientifique sur une période donnée (1 an, 1 mois, 1 jour) :

- D’abord, certains des auteurs dont les ressources sont consultées sont morts, et les paiements sont difficilement répartissables entre les auteurs vivants, y compris lorsque ces derniers ont permis la remise au goût du jour des travaux de leurs prédécesseurs ; en effet, des fondations et éditeurs récupèrent une partie des droits, et le reste éventuel est moralement impossible à diviser entre les vivants ;

- Ensuite, certains auteurs sont peu lus, mais leurs travaux n’en sont pas moins cruciaux, puisqu’ils apportent un regard neuf pour une « niche » de recherche, ou parce qu’ils permettent de générer, à travers des chaînes causales longues, des externalités positives en grand volume : on ne peut donc pas mettre leurs travaux en danger en ne les rémunérant pas à la hauteur de leurs compétences ;

Page 85: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

85

- Enfin, il est difficile de mesurer l’effet du piratage et de la copie illégale de ressources pour des diffusions internes notamment, floutant le réel usage de chacun. Le taux d’équipement informatique ainsi que les habitudes du format papier, combinées à des difficultés techniques majeures (possibilité de faire des captures d’écran même lorsque le copié-collé est interdit, voire de photographier l’écran) ne permettent pas aujourd’hui d’envisager une individualisation pure et parfaitement traçable des points d’accès.

La Science doit trouver des solutions ; à défaut, le marché privé le fera pour elle et sans prendre en compte les paramètres d’éthique et de service de l’intérêt général identiquement ■ Néanmoins, le constat demeure le même : la science doit s’ouvrir, et même si elle ne le veut pas, elle sera ouverte de façon abrupte par le partage sauvage et les pratiques de peer-to-peer et de téléchargement illégal, la régulation sur le format d’Hadopi ne pouvant porter ses fruits. Alors, plutôt que de subir cette modalité du partage, mieux vaut en comprendre les subtilités et en faire un principe-phare ■ Aux tarifs actuellement demandés par l'Edition, le pur doré est difficilement soutenable comme voie de généralisation du Libre-Accès pour les organismes qui publient beaucoup. On ne sait évaluer les usages liés au "doré auteur-payeur", qui est représenté par le projet SCOAP3 (IN2P3 et INP) et les journaux de l’EGU soutenus par l’INSU. ■ Des projets de nouvelles formes d’édition existent, déjà avancés ou mûrs, comme Open Edition (InSHS), ou ayant émergé plus récemment, tels que le projet episciences.org avec les épijournaux en maths et informatique. Il en existe encore d’autres comme par exemple de nouvelles méthodes d’évaluation du type « open peer review ». Globalement en France, il existe trois types de projets menés pour renouveler les modèles économiques ; Les épirevues (Bordeaux) (IDEX) (OpenEdition) ■ Concernant les épi-revues, une répartition intelligente des fonctions entre les différents projets (Episcience, I-revues) serait indiquée, passant soit par une véritable différentiation des offres, soit par une fusion, en vertu du principe de non-superposition. Par ailleurs, pour que des projets locaux de publication scientifique en libre accès puissent voir le jour, il faut que les établissements disposent d'une

Page 86: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

86

cartographie leur permettant de s'orienter et de choisir rapidement parmi les possibilités qui s'offrent, celle qui convient à leur projet et aux moyens dont ils disposent. Le listing de l’offre de services aux chercheurs établi et diffusé par la DIST du CNRS trouve ici toute sa place, et doit faire l’objet d’une communication renforcée. La valorisation par le peer-reviewing ■ La pratique de la recommandation par les pairs, plus connue sous le terme de peer-reviewing, doit se généraliser pour permettre une présélection des ressources de confiance dans des supports aux accès plus ouverts et aux volumes sans précédents. Cependant, des procédures de filtrage manuel doivent continuer à se développer en parallèle, pour éviter que les sujets les moins recherchés ou les publiants les moins connus soient discriminés et demeurent en fin de listes perpétuellement. ■ Les chercheurs doivent à ce titre pouvoir disposer d’un Curriculum Vitae (CV) complet, retraçant avec précision toutes leurs publications, distinctions et participations à des colloques. Un générateur automatisé de CV, fondé sur un algorithme établissant des « filtres d’alerte » sur chaque plateforme d’IST, qui se déclenchant à l’apparition du nom du chercheur, serait utile tant pour les chercheurs que pour les investisseurs et organisateurs souhaitant opérer une recherche de personnes compétentes sur un point précis. Pour ce faire, les identifiants nationaux doivent servir de base au dépôt dans HAL. Pour servir de référence en lien avec IdRef, afin d'identifier et signaler la production des chercheurs, nourrir et créer les fédérations et réseaux de recherche, l’idée du CV semble utile. Elle offre une motivation supplémentaire pour déposer dans HAL. Cependant, le CV doit pouvoir intégrer sous un format interopérable les autres publications externes certifiées (par exemple par ORCID). Une API agile pour automatiser les tâches répétitives qui occupent le chercheur ■ Pour faire simple, en amont (versement automatique des articles dans HAL, aidant et remplaçant en partie le dépôt manuel) comme en aval (inclusion automatique de la ligne de cet article dans le CV du/des publiant(s), une API agile et fonctionnelle doit effectuer les tâches répétitives de publication et post-publication des travaux, l’objectif étant in fine de laisser le chercheur focaliser sa précieuse attention sur ses travaux de recherche, et non sur les aspects logistiques d’une machinerie informatique IST étant devenue trop complexe pour qu’il sache la programmer de A à Z. Cette complexité doit néanmoins servir l’efficacité au service des chercheurs et des citoyens, et ne pas exister « pour elle-même ». En ce sens, si la comparaison avec le monde entrepreneurial est

Page 87: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

87

permise, il faut que le « back office » développe des API d’une grande technicité pour que le « front office », ou en d’autres termes l’expérience utilisateur, soit fluide, simple et intuitive. De nouveaux types de contrats d’édition et de formats de publication auxquels la LPRN ouvre la voie ■ Sertis de grilles tarifaires plus fluides, de nouveaux contrats d’édition permettent de diminuer le seuil critique de vues à atteindre pour enclencher un paiement, tout en diminuant la durée des embargos. Ces contrats ont souvent vocation à être complétés par des revenus fixes, tels que ceux des chercheurs, revenus financés à travers des organismes tels que le CNRS par les prélèvements obligatoires. ■ En outre, la publication conjointe d’articles avec les données de recherche ayant servi à les rédiger se développe, voire la publication des données elles-mêmes, les « data journals » (Nature, RDJHSS, etc.). Les « mega-journals », s’ils relèvent aujourd’hui du « pur doré » n’en sont pas moins des initiatives originales dont l’arrivée peut bousculer le paysage de l’édition savante de manière importante. En outre, la publication conjointe d’articles avec les données de recherche ayant servi à les rédiger se développe, voire la publication des données elles-mêmes, les « data journals ». Les « mega-journals », s’ils relèvent aujourd’hui du « pur doré » n’en sont pas moins des initiatives originales dont l’arrivée peut bousculer le paysage de l’édition savante de manière importante. Il ne s’agit plus vraiment de journaux, mais de sortes d’archives ouvertes payantes et au contenu certifié. Des modèles commerciaux innovants basés sur l’algorithmique et des indicateurs ■ Globalement, outre le paiement par l’auteur, divers modèles sont envisageables ; le financement d’une plateforme par la publicité, l’accès libre conditionné à un volume de peer-reviewing à effectuer chaque mois (entretenant ainsi une boucle vertueuse), ou encore le crédit « d’autorité », ajoutant de la force aux reviews d’un auteur lorsque celui-ci a lui-même reçu beaucoup de reviews positives, avec cependant le risque de formation de « groupes de soutiens » fonctionnant en vase clos… Il est évident que les indicateurs comme le facteur d’impact développé par Thomson-Reuters doivent aussi être agrégés à d’autres indicateurs concernant par exemple l’audience réelle (nombre de lecteurs) ou la labellisation par des tiers certificateurs concernant la qualité / respect des données. Plusieurs de ces modèles, rendus possibles

Page 88: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

88

par la science algorithmique, peuvent être combinés afin de limiter les risques de chacun. ■ Quoiqu’il arrive, même si le modèle de l’éditeur en ligne, basé sur l’éditeur papier aujourd’hui largement dépassé dans la recherche, doit céder du terrain à des modèles d’agrégateurs et de référenceurs, le rôle d’hébergeur demeure, avec des volumes de données de plus en plus importants à mesure que l’exigence de publication conjointe article + données se renforce. Aussi, l’hébergement coûtant de l’électricité, du matériel et des ressources diverses, le paiement ne peut totalement être laissé à la publicité en raison du fait que, contrairement à des plateformes comme Facebook ou Google, dont les données constituent la valeur, certaines données reliées à des articles n’ont qu’une valeur marginale lors d’éventuelles vérifications de méthodologie ou de fiabilité, et non une valeur commerciale brute. Le règne de l’actualité et des sujets en vogue, à compenser par la suggestion de sujets ■ Le risque cependant est que le règne du plus intelligent soit parfois remplacé par un règne du plus visible ; celui qui produit le plus de résultats ou emploie des formulations allant toujours dans le sens d’une surenchère médiatique emporte la visibilité maximale et déséquilibre l’attribution des bons résultats aux bons marchés-cibles. Enfin, on assiste à un règne de certains « sujets du moment », qu’il fait bon étudier pour recevoir des subventions ou un afflux d’audience, dans une vision très politiquement populiste et court-termiste de la recherche. Ce côté « auto-entretenu » des logiques de publication en raison des indicateurs fixes et de l’actualité doit être contrebalancé par l’introduction de suggestions algorithmiques de sujets de recherche fondées sur les mots-clés les moins traités, et qui reste insondable et donc imprévisible en étant en partie aléatoire. 2.2.4. Mettre en place les structures (agences, charte éthique) à même d’assurer l’application des principes juridiques contenus dans la LPRN (loyauté des plateformes, lisibilité, exhaustivité)

Enfin, les fonctions d’acquisition et de production d’IST doivent être placées plus largement au cœur d’un cadre juridique stabilisé et sûr, cocon protecteur respectant les spécificités liées à certaines données sans ignorer les exigences de partage et celles du marché, qui ne sont pas nécessairement antinomiques.

Page 89: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

89

Inciter les chercheurs à utiliser les outils publics en soulignant les défaillances ailleurs, en vue de rationaliser les dépenses publiques ■ Pour les établissements ne disposant pas d’un service d’études bibliométriques, la voie des partenariats a historiquement été employée comme correctif. Une tension est perceptible entre les outils promus par le CNRS (Web of Science (WoS), Scopus) et l’offre externe existante (OST, Google Scholar), qui est jugée par certains établissements comme plus adéquate. Il n’est donc pas possible de lutter frontalement, par orgueil, contre des outils qui ont fait leurs preuves et en tirent un quasi-plébiscite. Bien plutôt, il convient de souligner auprès des chercheurs les défaillances de tels outils en matière de sécurité, et leur coût fort sur le long terme, mettant en comparaison ces modèles privés avec le modèle de la science publique, coûtant cher dans sa phase R&D, mais beaucoup plus stable et moins chère à long-terme. L’idée est de sensibiliser le chercheur à l’Open Science, tout en lui faisant comprendre que le modèle vers lequel tous les efforts privés tendent aujourd’hui n’est possible qu’avec un Etat fort assurant des revenus aux innovateurs et chercheurs. Or, ceci passe forcément par l’allocation de produits issus de prélèvements obligatoires à la recherche (produits dont les vagues de PIA témoignent) ; ce financement issu des impôts et des taxes pesant sur les ménages et les entreprises dans un contexte de dégonflement de la dette doit trouver des sources de diversification via la valorisation (recherche appliquée), mais une part structurelle ne peut être financée que par l’Etat, notamment en SHS, en raison de la compétitivité culturelle et non-commerciale engendrée. Ainsi, il n’est ni souhaitable ni soutenable de financer des outils de traitement de l’IST et des plateformes privées avec l’argent du contribuable, lorsqu’un modèle d’outils et de supports public est concevable à l’échelle nationale et en concertation avec l’Europe. Ces incohérences économiques et en matière de protection des données doivent être mises en lumière et l’arbitrage en résultant de la part des chercheurs se fera sentir. Harmoniser les rythmes et délais : vers une concertation nationale ■ Un verbatim de l’enquête COPIST relevait avec justesse ; « Si la feuille de route HAL est arrêtée dans le courant du 2ème trimestre 2016, alors il est peu probable que les demandes formulées par les établissements au cours de cette enquête puissent être prise en compte dans cette feuille de route. ». Une harmonisation des rythmes et une synchronisation des consultations à l’échelle nationale entre tous les acteurs de l’IST est

Page 90: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

90

donc nécessaire. En effet, les individus se désintéressent du sujet en l’absence de prise en compte de leurs avis, et ce durablement. ■ L’arbitrage de la voie partenariale trouve sa source dans la voie éthique ; il faut mettre en place une concertation nationale des acteurs suffisamment large et englobante pour être représentative et coller aux réalités du terrain, mais suffisamment peu nombreuse pour éviter des inerties freinant la créativité ainsi que des lourdeurs occasionnant des longueurs dans les délais. Prendre en compte tous les positionnements sous l’exigence absolue d’intérêt général

■ Il convient d’opter pour un positionnement englobant suffisamment le milieu de la Recherche et les organismes directement rattachés à l’Etat, sans pour autant céder trop de terrain à la volonté des GAFAM, qui peuvent avoir des intérêts divergents mais occupent une place suffisamment importante et mature sur le marché pour pouvoir être à même de négocier. Renforcer les agences existantes et en créer de nouvelles ■ La création d’une centrale de services à l'INIST, en réseau avec PERSEE et le CCSD est nécessaire. ■ La création d'une Agence nationale de valorisation numérique du travail scientifique est indiquée afin d’obtenir un interlocuteur unique à même de négocier les données avec Etalab.

Page 91: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

91

■ La LPRN établit, dans sa Section 3, le principe de « loyauté des plateformes ». La notion de plateforme telle que le Conseil National du Numérique l'envisage, englobe toujours un hébergeur et un afficheur, comme Google qui stocke des liens et détermine algorithmiquement leur ordre d’affichage. Une plateforme peut englober des réalités aussi variées qu’un moteur de recherche, un comparateur, un site de petites annonces, une place de marché, un site de crowdfunding, ou encore un réseau social. La loyauté des plateformes : faire respecter un principe complexe et contesté ■ Les premières versions du projet de LPRN définissaient, en article 22, la plateforme comme le référencement de biens ou services mis en ligne par des tiers, et la mise en relation de la demande et de l’offre pour une transaction de vente, de partage ou d’échange. L’article 19 fondait le principe de « loyauté envers le consommateur ». Cette notion est à rapprocher de celle d’« exécution de bonne foi du contrat », auparavant définie par l’article 1134-3 du Code Civil, mais qui se limitait à la phase d’exécution, là où le nouvel article 1104 du Code Civil dispose que « les contrats doivent être négociés, formés et exécutés de bonne foi », en faisant une disposition d’ordre public. Cela passe par plusieurs leviers de politiques publiques ; apprendre la programmation informatique à l’école dès le jeune âge, sanctionner les pratiques anticoncurrentielles, et combler les vides juridiques existants entre les CGU/CGV des plateformes et les droits de propriété et de travail émergents pour les producteurs et récepteurs d’IST via l’économie numérique. La LPRN pose l’obligation de loyauté en ces termes : « Tout opérateur de plateforme en ligne est tenu de délivrer au consommateur une information loyale, claire et transparente sur les CGU et sur les modalités de référencement, de classement et de déréférencement des contenus […] ». De manière globale, l’objectif de la loyauté est d’empêcher l’existence de plateformes abusant, au détriment du libre arbitre du client et/ou des droits des producteurs de données (par exemple les chercheurs), des données mises en ligne par le biais de termes de services complexes et trop chronophages pour être lus, dans un monde où chaque consommateur utilise des dizaines de plateformes.

■ Pour répondre efficacement aux enjeux économiques des plateformes, la LPRN a adopté une vision transversale du sujet, prenant en compte les aspects suivants, qui relèvent de différents aspects du droit ;

Page 92: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

92

Asymétrie d’information (en la corrigeant en faveur du consommateur) Règles de concurrence (en faisant une lecture compréhensive sans

négliger les métiers existants) Concentration des fonctions et des circuits (en tentant de diviser

juridiquement ces fonctions) Fonctionnements des marchés multifaces (en formulant des définitions

larges et englobantes) ■ La division des rôles d’une plateforme conduit à établir les frontières de la « loyauté » autour de l’idée d’afficheur : ce dernier doit dès lors être transparent sur ce que fait la plateforme : comment choisit-elle les items affichés, quelles règles régissent l’ordre de classement, qui la finance ? Elle doit également permettre ;

- à l’utilisateur de modifier les critères de sa recherche - de garantir l’interopérabilité et la portabilité des données pour changer de

plateforme sans perdre de données Et cela sans confronter l’utilisateur à un plafond de verre technique limitant ses choix ;

- il doit pouvoir choisir l’usage de toute application, même non certifiée (à ses risques et périls)

- en créer, pour reprendre le mot de Steve Jobs, et in fine ne pas être contraint d’utiliser une application.

■ Empêcher les concurrences déloyales et les biais informationnels, tout en rendant visibles les « empilements hiérarchiques » entre sociétés, constitue le cœur de cette exigence. Les travaux préparatoires des lois Macron et Hamon désignaient l’obligation de « faire apparaître clairement l’existence ou non d’une relation contractuelle ou de liens capitalistiques avec les personnes refe rencees, [ainsi que] l’impact de celle-ci sur le classement des contenus proposés » : il est nécessaire de rendre clairs tous les liens financiers pour garantir le consentement éclairé de l’utilisateur. ■ Les politiques publiques visant à garantir la loyauté des plateformes relèvent d’une distorsion de la concurrence, et donc d’une défavorisation des leaders « naturels » ; en ce sens, les entreprises gérant les principales plateformes n’ont que peu d’intérêts dans la révélation de leurs modèles économiques, et par conséquent un fort lobbying anti-LPRN s’applique de la part notamment des GAFAM.

Page 93: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

93

Traces laissées par les personnes dans les systèmes : l’urgence d’un cadrage éthique ■ L’InSHS souligne l’importance et l’urgence de fournir un cadre éthique au travail sur les données relatives à la personne, aux opinions et aux préférences. Les SHS elles-mêmes peuvent contribuer à construire des références. La réflexion est étendue et pluridisciplinaire. Le TGIR Huma-Num a mis en place une démarche éthique interne sur les données ethnologiques et sociologiques. Comment traiter la question des traces laissées par les personnes (les chercheurs) dans les systèmes d’information ? Le Cléo souligne que les choix éthiques ne peuvent être abordés de façon unilatérale et sans débat. L’obligation de révéler les données devrait toutefois devenir la règle, et le secret l’exception nécessaire, afin de permettre la reproductibilité et la « confrontabilité » du travail de la science. L’INIST émet également une demande dans ces sens. RENATIS indique disposer d’un Code de déontologie rédigé par des professionnels des réseaux (2004-2005) à remettre à jour, diffuser et promouvoir auprès des professionnels de l’IST ; porter à la connaissance des directions d’Instituts, des directions des laboratoires, des chercheurs. ■ Afin de restreindre les conflits d’intérêt et de leur fournir un cadre d’expression sur lequel le législateur peut poser un regard informé, une Agence d’Ethique fondatrice et protectrice d’un texte définissant des normes de discussion et des critères d’acceptabilité mutuels entre les entreprises et l’Etat pourrait être mise en place. Ce texte, complémentaire à la Loi qui corrige les attitudes pénalement répréhensibles telles que le piratage, et qui pourrait s’inspirer de ceux de Renatis et de l’INSB tout en intégrant les nouvelles variables, serait une Charte Ethique d’application de la LPRN, qui aurait vocation à faire éclore des décrets d’application facilement acceptables par le Conseil d’Etat, car issus d’une concertation entre les acteurs concernés, chapeautée par des juristes spécialisés. Les axes de réflexion éthique au service de l’IST, et les avancées respectives ■ Parmi les sujets-clés à traiter, figurent ; - quel statut donner aux données « brutes » ? Aux données « interprétées » ? Quelle est la frontière ? La question se pose avec la caractérisation d’échantillons et la part que peut y laisser la trace laissée par l’outil d’analyse…. - le plagiat - les données erronées

Page 94: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

94

- la diffusion interne/externe : quels doivent en être les délais ? L’INSU par exemple, en particulier en astronomie, a une pratique très positive de l’accès ouvert aux données, tempéré par une période propriétaire – souvent un an – qui permet aux chercheurs ayant obtenu du temps d’observation sur appel d’offre d’étudier les données avant la mise à disposition de tous. ■ L’article 29 du Code des contrats européens oblige le dépôt de l’ensemble des publications financées par le contrat dans des archives ouvertes et de les rendre accessibles (un embargo est possible en fonction des disciplines). Les coûts générés par ces dépôts sont éligibles à la justification financière. Il en va de même pour les données de la recherche (sous-jacentes ou ayant été utilisées pour obtenir les résultats). Elles doivent être déposées dans un réservoir (sauf dérogations) et rendues accessibles avec des outils permettant de les utiliser. - à partir de quel critère les données deviennent publiques ? L’INEE fait observer que la frontière est difficile à établir : les recherches sur contrat peuvent dans leurs clauses, prohiber la mise à disposition des résultats et/ou des données : quels critères appliquer au regard de la libre disposition des résultats de la recherche publique ? ■ L’INSB dispose d’une Cellule Ethique qui veille au respect des réglementations en vigueur concernant les organismes génétiquement modifiés, les tissus humains, l’utilisation des animaux, y compris les primates non-humains et toute recherche sur l’homme. Il pourra être intéressant de partager cette expérience avec les autres Instituts. Le TGIR SOLEIL souligne que les questions techniques et juridiques doivent répondre à des règles pas seulement françaises mais européennes. En somme, il faut mettre à contribution les pratiques existantes en France (Alliances, Organismes de recherche), comme au plan international (Europe, Grands organismes étrangers…) en examinant les besoins de Chartes IST spécifiques par domaine ou projets de recherche en vue d’une contribution au dispositif public Etalab. 2.3. Proposer un point d’entrée unique, tenant compte de la grande diversité de ressources et de plateformes

Un certain nombre de réponses revient sur la crainte d’un éparpillement des outils. Les cinq sections proposées par le COPIST semblent parfois détachées, disjointes et un manque de cohésion de tous ces outils porte le risque d’un mauvais usage. Cette lisibilité est aussi liée aux acteurs qui proposent ces services. C’est la

Page 95: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

95

question de l’articulation entre le niveau national (le CNRS notamment) et le niveau local (les SCD des établissements). Comment le COPIST pourra-t-il prendre en compte les réalisations locales déjà implantées ? Va-t-il les supprimer ? Le manque de cohérence viendrait donc d’un risque de doublons dans tous ces services. C’est encore plus vrai avec les autres dispositifs existants, comme ceux proposés par l’ADBU ou Couperin. Comment penser la convergence des outils ? Cette cohérence tient enfin à la matière qui paraît proposée par le COPIST. La prédominance des SHS et le manque d’accès à des outils utiles pour certaines formations scientifiques apportent le risque d’un manque d’implication des acteurs concernés. L’interdisciplinarité apparaît aussi comme un élément de lecture essentiel.

2.3.1. Faire appliquer les principes juridiques de protection des données (secret dans la recherche, confidentialité, anonymat simple ou coordonné) La sécurité des données issues de l’IST : aspects matériels et logiciels ■ Les chercheurs, à l’avant-garde des consommateurs interagissant quotidiennement sans le savoir avec de l’IST (soit qu’ils soient producteurs ou récepteurs), tiennent à la sécurité de leurs données. Cette sécurité est d’abord informatique. Elle est ensuite nationale ; une des nouvelles missions de l’Etat est de garantir un niveau de confidentialité réelle adéquat à chaque situation ; du secret au public, chaque information doit pouvoir se prémunir d’éventuelles attaques extérieures ou intérieures, de toute spéculation, et le cas échéant conserver un caractère destructible que la nature même d’internet rend difficile à assurer. En mettant ces deux premières exigences en vis-à-vis, il ne faut pas omettre le caractère matériel des installations (serveurs, data centers) rendant possible le fonctionnement d’internet. ■ L’enjeu de la territorialité du stockage et du traitement des données IST est majeur. ArXiv est très utilisé par les mathématiciens mais il y a une nécessité que le CNRS ait une relation forte et construite avec ArXiv. Ainsi, il existe, pour l'INSMI, un risque d'une relation de dépendance mal contrôlée : la publication scientifique ne peut être placée dans les mains d’une entité indépendante comme ArXiv, hébergée à l’université Cornell. Le problème est d’ordre stratégique car cette base est unique. Les miroirs qui existaient en Europe sont en train de disparaître. Si l’accès à ArXiv rencontre des difficultés, le patrimoine scientifique peut se trouver menacé. Pour l’INSU et l’INSMI le maintien de la relation à arXiv est important : une convention paraît nécessaire. Il faudrait une

Page 96: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

96

négociation globale et siéger au CA. Heureusement, le CCSD gère un des rares miroirs pour les dépôts français d’arXiv. ■ Elle est, enfin, éthique ; en effet, chaque règle établie ne doit pas l’être pour elle-même, mais en vertu d’un raisonnement humain et juridique complet, qui intègre la possibilité de sa propre transgression si la sauvegarde d’un intérêt ultérieur et supérieur l’impose. Pour l’INEE, la sécurité ne doit pas être conçue comme une « action IST », mais comme une condition de cette action. De la PPSI à la LPRN : affiner la définition des matières à protéger et des manières de le faire… ■ Comment gérer les contenus générés par les utilisateurs ? Comment contrôler les cookies, les pop-ups qui peuvent autoriser des tiers à s’introduire dans le réseau ? Les textes de la LPRN sur la sécurité en IST reprennent largement des éléments définis dans la Politique de Protection des Systèmes d’Information (PPSI) notamment ceux relatifs à la protection des jeux de données. Il définit des maîtrises de risques et ce que l’on protège. Des rappels sont faits sur la sécurité en matière de dépôt de brevet, de responsabilisation des DU et des responsables de projets, ainsi que 3 niveaux de diffusion : public, interne, confidentiel. Afin d’éviter les attaques informatiques, il faut encourager l’utilisation d’un cloud privé et appliquer des règles d’hygiène informatique disponibles auprès des RSI. Les unités doivent non seulement faire signer et appliquer la charte informatique mais aussi faire remonter les incidents au niveau national (piratage…). De la LPRN à une intégration forte des paramètres numériques de l’IST dans chaque domaine juridique ? ■ Une fois les grandes lignes stratégiques de l’application de la LPRN établies, le dilemme réside dans l’attitude normative à adopter ; continuer de forger, dans le sillage de la LPRN d’Axelle Lemaire, une structure dédiée au numérique incluant les obligations des plateformes… ou plutôt développer le droit des plateformes comme une extension des domaines de droits existants à un nouvel objet ?

- La première solution, absolue et monobloc, est séduisante ; elle permet de regrouper tous les nouveaux problèmes émergents, et leurs réponses correctives,

Page 97: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

97

dans un même texte, sur une page blanche, et donc de sensibiliser tous les acteurs à peu de frais.

- Néanmoins, dans le texte finalement adopté de la LPRN, on observe une méthodologie intéressante ; par exemple, l’article 49, définissant les plateformes, porte modification de l’article L. 111-7 du Code de la Consommation, et le suivant modifie le Code du Tourisme pour les plateformes telles qu’AirBnb. On assiste donc dans les faits à un redécoupage des frontières de lois déjà existantes.

- De surcroît, beaucoup de paramètres, tels que les seuils d’audience à partir desquels la plateforme se voit ajouter de nouvelles obligations, sont laissés à des décrets ultérieurs, ce qui donne une large marge de manœuvre à l’administration.

■ Le Conseil National du Numérique a désigné, dans un rapport consultatif, comme urgent « le renouvellement de la définition de 1996 », mais également « l’adaptation des lois existantes au numérique », soulignant en filigrane le mirage que représente un domaine « numérique » unifié et cohérent. En effet, l’évolution des NTIC porte sur tous les pans de la société, et affecte donc tous les Codes législatifs (travail, propriété intellectuelle, impôts, etc.).

■ La loi Hamon sur la régulation des comparateurs, puis la loi Macron sur les marketplaces et les plateformes collaboratives, sont allées dans le sens de la répercussion de principes généraux sur les différents domaines de droit qu’emprunte le chemin du consommateur/utilisateur. ■ Il faut cependant veiller à éviter la superposition des normes concernant la loyauté des plateformes, un « téléscopage » selon le mot de Marc Lolivier, délégué général de la FEVAD, afin d’éviter une confusion préjudiciable pour les utilisateurs. Ces derniers représentent plus de 85% des citoyens selon l’INSEE. Informer sur les droits et les possibles ■ 73% des directeurs d’université n’ont jamais été confrontés à des questions juridiques concernant la valorisation de données de la recherche. Les 27% restants l’ont tous été concernant notamment les données à caractère personnel. On observe un score exactement identique pour les questions juridiques concernant l’ouverture de données (open data, données administratives par exemple), ce qui pourrait indiquer une mauvaise appréhension du découpage sectoriel du droit relatif à l’IST. Concernant l'autorisation

Page 98: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

98

donnée à des tiers d'utiliser et ou de réutiliser des contenus créés dans votre unité et le dépôt de publications dans une archive ouverte alors qu’un contrat est conclu avec un éditeur, ou encore le partage de responsabilité entre coauteurs, le nombre d’unités confrontées à des questionnements sur l’état de la Loi monte à 32% ; aussi, l’angle de lecture à adopter est un faible degré d’information à mesure que le sujet devient plus technique et porte non plus sur les individus, mais sur des droits collectifs (de laboratoire, d’université). Il convient donc de mieux informer, sans vouloir faire de chacun un juriste. Gradualité du secret et degrés de confidentialité ■ Une certaine défiance parfois envers les "archives institutionnelles" qui ne servent pas uniquement à rendre la littérature accessible, mais aussi à faire de la bibliométrie, est présente. D’une part, il faut donc rendre la bibliométrie plus attrayante et compréhensible dans le travail quotidien du chercheur, et d’autre part il faut obtenir la préséance d’une notion de secret graduel. Cette notion de secret doit être articulée algorithmiquement avec une possibilité de rechercher les données de l’archive via les moteurs de recherche en utilisant le nom de l’établissement comme critère de requête, en vue d’obtenir une visualisation des résultats qui respecte les plafonds d’audience définis localement sans aller en-dessous des planchers d’audience tolérés par les auteurs. ■ Lorsqu’un acteur souhaite enregistrer sur HAL (ou tout autre plateforme publique) uniquement les métadonnées d’un document confidentiel et en réserver la consultation à certains secteurs/agents, il faut qu’il puisse le faire techniquement. Cela n’est actuellement pas le cas, contrairement aux offres proposées par d’autres supports privés tels que le célèbre Google Drive. Le retrait définitif de fichiers, sans préjudice de l’archivage pérenne, doit aussi être rendu possible, tout comme une autre fonctionnalité qui paraît évidente sur le marché privé, à savoir l’empilement automatique (le nouveau fichier écrasant l’ancien) lors de l’ajout d’une nouvelle version d’un même document ou source d’IST. ■ Sur cette « gradualité du secret », la confidentialité relative des données échangées dans le cadre par exemple d’Hypothèses.org (service 3.7.) revient souvent dans les propos des chercheurs. Il est essentiel d’en assurer la réalité en privilégiant cette discrétion nécessaire à la finalisation de travaux, qui n’est pas un secret absolu (de nouvelles mains et de nouveaux regards sur le travail pouvant être utiles) ni un partage

Page 99: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

99

en Open Access absolu (une trop large audience endommageant la finition du document tant sur le plan économique que sur celui du contenu). Un service rendu « pour le » et non « au » chercheur ■ Il faut donc légiférer de façon agile, c’est-à-dire mettre en place des règles claires, faisant appel au bon sens, qui ne nécessitent pas de lourdes campagnes d’information pour être respectées. En d’autres termes, la loi doit définir l’étendue des possibles techniques des outils et supports, qui conditionnent à leur tour les usages. Car tenter de conditionner directement, par voie législative, les usages et habitudes (voire les traditions) ancrés dans le milieu de la recherche française est voué à l’incompréhension, et donc à l’échec. Pour faire bref, il faut envisager l’exigence juridique et technique comme un service rendu non pas au chercheur mais pour le chercheur.

2.3.2. Tenir compte des évolutions vers l’interopérabilité des outils de l’industrie et des voisins européens

Il faut tirer le meilleur parti d’un fonds documentaire d’une richesse inédite pour

rendre l’IST française compétitive. Retravailler l’interopérabilité et la complémentarité de divers services ■ Il paraît essentiel de signaler les thèses en ligne dans le SUDOC, dans cette perspective de mise en relation de toutes les sources d’IST afin d’éviter un dispersement superficiel qui entrave la maximisation des fruits de la recherche sur l’IST. ■ Il faut notamment retravailler l’interopérabilité et la complémentarité de services tels que Cedram ou I-Revues, qui possèdent une interface un peu dépassée et doublonnent d’une part entre eux et d’autre part avec les services existants tel que Gallica, Persée pour les fonds patrimoniaux, revues.org ou des plateformes développées au sein des établissements. ■ Le mode d’intégration automatique des notices dans la collection n’est pas toujours clair ni efficace et génère lui aussi beaucoup de travail de vérification. De surcroît, en l’état, la fonctionnalité permettant à n’importe qui de créer une collection dans HAL entraîne une cacophonie des intitulés, parfois inintelligibles, ou similaires à ceux d’une collection institutionnelle. La solution semble être d’intégrer plus de peer-reviewing, et de

Page 100: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

100

classer la visibilité des collections en fonction de l’aval, de la validation par chaque secteur de ces dernières. L’administrateur d’une collection institutionnelle devrait être informé par des notifications push et mail lorsqu’une collection identique ou semblable à la sienne est créée dans le domaine d’activité auquel il appartient. Un niveau d’astuce supplémentaire consisterait à doter ce peer-reviewing, idéalement fonctionnant sur le principe de la blockchain, de pondérations des « points de confiance » accordés selon des paramètres tels que la proximité du votant avec le publiant (corrélé négativement), ou l’appartenance du votant au milieu de recherche concerné par la collection (corrélé positivement). ■ L’articulation de ces différents niveaux de service pourrait se faire autour de fonctions « sociales » ; par exemple, la possibilité d’annoter des textes au sein de collections qui correspondraient à des « éditions critiques ». Le projet ISTEX se réoriente afin de pouvoir constituer un exemple d’interopérabilité ■ L’accès aux ressources documentaires est aujourd’hui très diversifié, et passe par divers points d’accès. Le projet ISTEX porté par la DIST, d’abord focalisé sur le stock documentaire, se tourne désormais vers l’acquisition du flux, des nouvelles ressources, en s’organisant autour d’outils d’analyse approfondie, et vers une méthode d’interopérabilité permettant d’adapter ISTEX aux supports et usages de chaque acteur.

Page 101: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

101

2.3.3. Permettre l’adoption de référentiels et standards normés communs

A l’heure actuelle, il existe une grande diversité de systèmes utilisés pour traiter l’information ; en découle donc une immense variété de formats, qui rend l’interopérabilité difficile et empêche l’élaboration aisée de visions d’ensemble claires.

Normes communes de formulation : un bref rappel de la situation ■ Des normes communes de présentation et formulation existaient déjà avant l’invention de l’imprimerie pour communiquer le fruit d’une pensée, le résultat d’un long et abouti travail de recherche. L’imprimerie, pour permettre la diffusion uniforme d’un même contenu équivalent et vidé le plus possible du caractère aléatoire de l’interprétation individuelle, de la « mauvaise lecture », en d’autres termes, a rendu nécessaire l’émergence de standards de typographie, tels que la police, la hauteur de caractère, l’empâtement Serif ou encore la justification des colonnes de texte. ■ Parallèlement, des standards de référencement bibliographiques communs tentent d’émerger, notamment avec les universités britanniques et celles de la Ivy

Page 102: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

102

League. Tout le monde a entendu parler de la bibliographie « à la française », « à l’anglaise », ou de la « méthode Harvard ». On constate donc que bien souvent, il existe une variété de standards, selon les pays, les écoles, voire les maisons d’édition. La formulation des résultats semble donc ne pas pouvoir être universelle in fine car il existe une concurrence entre les producteurs de connaissance, qui veulent voir leur standard privilégié. L’Etat ou l’autorité indépendante gérant un domaine défini doit donc pouvoir en établir des normes, dans un contexte où la part des brevets dont les inventeurs sont localisés dans deux pays différents ou plus est passée de 3,5% en 1994-1995 à 7,1% en 2004-2005 selon l’OCDE. Il faut organiser prioritairement le recueil (avec une estimation de la complétude des données recueillies) et la mise à disposition des données de publication en estimant la complétude des dispositifs de référencements/Instituts ou sur un échantillon d'unités en partant de l'exploitation de la question suivante de l'enquête des DU : « Ce référencement est-il exhaustif par rapport à la production de l’unité ? », en mesurant le lien, s'il existe, de cette valeur de complétude avec la manière dont le référencement est effectué : saisie manuelle ou téléchargement à partir de bases de données existante. Les exigences dans la formulation des résultats par le chercheur : unicité, hiérarchisation, scalability ■ Formuler un résultat, c’est accepter sa continuité et son interprétation dans les mains d’autrui, et rejeter radicalement sa déformation en revanche. Pour superposer ces deux objectifs, il faut être clair, mais ne pas fermer la boucle. A titre d’exemple, la direction scientifique du CIRAD, le Centre de coopération International en Recherche Agronomique pour le Développement, possède une section dédiée aux protocoles de formulation du résultat scientifique dans sa délégation à l’IST, qui propose dans son rapport de 2015 plusieurs procédés afin de rendre extensibles la portée comme les effets d’un résultat. ■ Il y a d’abord une exigence d’unicité ; les figures et tableaux doivent se lire indépendamment des textes, et rien ne doit se répéter. Les mêmes mots ou expressions doivent être employés pour désigner le même objet, traitement, variable, ou concept. ■ Il y a, ensuite, une exigence de hiérarchisation : commencer par le résultat majeur de votre recherche, puis ceux qui s’y rapportent en arborescence, et éliminez ceux qui n’ont qu’un lien infime voire pas de lien du tout.

Page 103: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

103

■ Et il y a, enfin, une exigence sur laquelle l’anglais, le premier, a mis un mot : scalability, qui englobe et recoupe en français les sens d’évolutivité, de capacité à monter en charge, d’extensibilité et de facilité à changer d’échelle. Le correctif apporté par le TDM doit être complété en raison de l’augmentation, de la diversification et de l’interconnexion croissantes de l’IST ■ Le TDM est un correctif partiel pour ces failles, ces défauts de longueur qui rendent difficile la sédimentation pour l’individu d’une somme à chaque instant exponentiellement plus grande de résultats, mais en tant que chercheur, intégrer l’idée que l’on n’est pas tout seul à devoir être lu ou écouté dès la formulation du résultat est encore mieux. ■ Du niveau « recherche universitaire » au niveau « école primaire », le même résultat doit être reformulable sans perdre son sens général. La fluidité de cette mise à l’échelle permet de connecter par un lien permanent et perpétuel les différentes sphères de l’apprentissage, et c’est en cela que sont porteurs des projets comme la très grande infrastructure de recherche (TGIR) Huma-Num, porté par le CNRS, l’Université d’Aix-Marseille et le Campus Condorcet, et qui s’inscrit dans le projet européen DARIAH (Digital Infrastructure for Art and Humanities). ■ L’émergence relativement récente de l’ère numérique a renforcé cette nécessité d’universaliser la manière standard de présenter un résultat afin de le rendre facilement transférable, transposable, et de faciliter son commentaire. En effet, trois facteurs ont transformé la production des connaissances, et ont accru cette nécessité ;

- la multiplication de la quantité de sources, qui malgré des outils de TDM avancés ne permet pas d’échapper au brouillage de l’information. L’universalisation des formulations par les auteurs, les producteurs de connaissances, dès la source, permettrait d’automatiser ces procédés coûteux en temps et sous-optimaux car soumis à trop d’aléas. Basiquement, désigner le même objet « x » par le même terme « y » partout où il est mentionné permet de rendre le TDM plus efficace ;

- la diversification de ces sources ; le spécialiste est désormais partout, sur les

forums et sur la section commentaires, prêt à contredire ou documenter un argument, et à l’inverse l’amateur éclairé ou le profane peuvent désormais formuler des résultats à leur échelle, qu’il convient de vérifier. Cette diversité

Page 104: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

104

socio-professionnelle se combine à une diversité linguistique incroyable, qui rendent nécessaire la pratique de formulations communes ;

- enfin, internet, en ce qu’il est internet, a connecté entre eux les concepts, puis les objets, et désormais les intelligences artificielles. Ces systèmes fonctionnent avec un langage informatique rationnalisé, binaire, qui est formé à partir de langages intermédiaires comportant des commandes arbitraires fixées par l’homme et pouvant s’apprendre. Ces langages de programmation, qui ressemblent au langage mathématique en ce qu’ils existent de façon exogène aux langues verbales nationales, est une réponse partielle aux divergences linguistiques mentionnées plus tôt, et une porte ouverte aux collaborations internationales.

Mise en commun normative : initiatives prises et contraintes de chaque langage ■ C’est dans le sens de cette universalisation que va le Référentiel Général d’Interopérabilité, officialisé par l’arrêté du 20 avril 2016 (JORF N°0095 du 22 avril 2016), et ayant pour but de permettre aux conservateurs de données de les fournir dans un format universel, opérable par tous les acteurs. ■ Il existe cependant plusieurs contraintes à cette adaptation. En effet, pour employer le langage du code informatique comme socle commun, encore faudrait-il qu’il soit unifié, car l’existence de différents codes selon le type de firmes ou de produit nuit à l’universalisation aisée de la formulation de résultats. De plus, les chercheurs en sciences sociales, et plus largement toutes les sciences dites « non-dures », rechignent encore à apprendre, utiliser ou même jeter un œil à ces formes de langages nouveaux, notamment car il s’agit pour eux d’une réduction au tout-chiffré, d’un avilissement de la langue classique d’une part, et d’autre part car ils considèrent que l’effort d’apprentissage à fournir n’en vaut pas la peine. Peut-on imaginer un monde où chacun apprendrait une langue universelle verbale (l’anglais par exemple) et un langage de code scientifique, un langage logique universel en parallèle dès le plus jeune âge de la vie ? ■ On peut même rêver d’une formulation universelle, qui aurait la rigueur des mathématiques et l’intelligence prospective de la logique philosophique, qui permettrait de mettre tous les résultats dans un même système de registre. Cependant peu d’initiatives vont dans ce sens. A titre d’exemple crucial et marquant, l’identifiant idHAL est lié à la plateforme. Le lien entre « structure » et « objet » n’est pas le bon.

Page 105: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

105

Vers la complète universalisation des normes ; référentiel national d’autorité, signature monoligne ■ Une stratégie unique et internationale est attendue, car la multiplication des référentiels de structures et d’auteurs appelle à conduire une réflexion globale sur la production et le partage de ces référentiels, ainsi que sur leur alignement, dans une logique Web de données : ce travail a certes commencé à être engagé par le CCSD avec idHAL, mais aussi par la BnF (data.bnf.fr) et l’ABES (IdRef), lesquelles projettent la création d’un référentiel national d’autorité, ouvert à d’autres partenaires (INIST-CNRS, CCSD, Archives de France, …), et qui a vocation à favoriser l’utilisation de normes et standards internationaux (standard ISO International Standard Name Identifier (ISNI), ORCID). C’est dans ce cadre partagé internationalement que doit s’inscrire la stratégie de HAL, plutôt que de proposer HAL, outil spécifique à l’ESR français, comme un cadre national. Il faudrait plutôt renforcer les projets comme CONDITOR, qui vont dans le sens d’une universalité du standard, ou employer les identifiants ORCID sur HAL. ■ Adopter un langage commun dans l’écriture de l’information, des références et métadonnées semble essentiel ; c’est à ce prix, par un effort partagé et réparti sur chacun « à l’amont », qu’un système IST cohérent peut se mettre en place, et cela ne peut passer que par la formation. En effet, une politique « à l’aval », consistant à modifier les erreurs de format de chacun de manière centralisée, ne peut assumer un rôle national aussi lourd, et n’agit que comme palliatif du facteur « erreur humaine ». En effet, si l’informatique peut fonctionner en réseau, c’est grâce au caractère universel du langage binaire, et semi-universel des langages humains produisant ce langage machine (langages de programmation ou « codes »). Il en va de même pour l’IST. ■ Le principe de la signature monoligne est retenu avec :

- Nom du laboratoire (sigle) - Tutelles (pas d’importance sur leur ordre)

Ne pas indiquer l’appartenance à des Labex, Idex… mais l’indiquer dans les remerciements

- Terminer avec l’adresse contenant le nom de la ville Le document correspondant a été préparé par la DASTR qui est en charge de ce dossier, et validé en comité de direction. Reste le cas particulier de personnes membres du laboratoire dont l’employeur n’est pas tutelle, dans ce cas on ajoute l’employeur de la personne si c’est un établissement public. Ce document a obtenu de larges réutilisations (Sorbonne, Université Pierre et Marie Curie (UPMC), etc.).

Page 106: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

106

2.3.4. Rendre le dispositif modulable pour s’adapter aux différents besoins Tenir compte des usages pour fournir un outil approprié que le chercheur a envie d’utiliser

Il faut tenir compte des usages (étude COPIST) et des types de données les plus employés dans chaque domaine scientifique afin de ne pas proposer d’outils totalement inappropriés qui découragent par la suite le contact du chercheur à l’IST. Cette « non-appropriation », qui prend tout son sens dans son étymologie, par opposition à l’appropriation permise par le don d’un outil adéquat à chacun, que chacun prendrait en main avec enthousiasme et soulagement, peut relever soit de l’excès soit de l’insuffisance vis-à-vis du besoin réel de l’individu. En effet, un excès dans l’offre conduit à devoir remplir de longs et fastidieux protocoles, ou à avoir accès à trop de données pour des travaux qui ne les nécessitent pas, et une insuffisance conduit à trouver des protocoles/sources dérogatoires, le protocole/source proposé ne suffisant pas. Bref, le modèle de la plateforme (tel qu’on entend ce terme lorsqu’on qualifie les GAFA de « plateformes ») gagne aujourd’hui l’IST. La bonne réponse à cette situation ne réside pas dans le schéma-type du « portail », solution phare des années 2000, mais plutôt dans l’idée de construire la réflexion à partir d’une analyse de la situation actuelle, plutôt que d’essayer d’adapter les outils hérités d’hier à une situation qui a profondément évolué, et va continuer de le faire dans les années à venir. 4 catégories d’activités pour le chercheur : un document résumant l’offre de services ■ Un premier pas nécessaire, peu coûteux et non-contraignant pour l’usager consiste en la création d’une « plateforme des plateformes d'IST » à partir de la DIST et sous la forme d'un aiguillage selon 4 catégories correspondant aux activités du chercheur (#1. Me documenter. #2. Publier. #3. Être accompagné.e. #4. Analyser.). Il s’agirait d’une forme d’annuaire en ligne, très simple, réutilisant le pointeur sur les services déjà disponible en version PDF sur le site de la DIST, afin de permettre une vision d’ensemble des outils disponibles et dont les droits sont ouverts pour chaque chercheur, en s’inspirant du modèle étatique de site permettant de déterminer l’étendue des droits ouverts pour un citoyen ou un foyer fiscal (aides au logement, bourses, réductions et crédits d’impôts, etc.).

Page 107: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

107

Le nœud gordien du dilemme centralisation/décentralisation peut être tranché par la technologie et une communication forte ■ L’exigence la plus élémentaire est de ne pas créer un outil d’ingénieur « déconnecté de la réalité de travail du chercheur ». La technique de la marque blanche, consistant à programmer une API ou un outil dans un langage permettant son intégration à n’importe quel site local, afin de rapprocher les options de personnalisation d’un portail commun de chaque utilisateur final, est à privilégier pour assurer l’interopérabilité, en sus des référentiels communs. Le paradoxe apparent entre la centralisation et la décentralisation de la gestion de l’IST nationale est un nœud gordien que seule la technologie est à même de trancher. En faisant de ce point d’entrée unique un outil interopérable et intégrable à chaque support local, on en fait une barre de recherche améliorée, munie de nombreux filtres et outils d’analyse, et donc un format adaptable facilement adoptable. ■ Le principe ayant été éprouvé avec, à sa base, la formation d’un consensus dans le sillage des premières réunions et expérimentations, la réflexion technique doit aussi tenir compte de la démarche conduite au sein de l’AMUE dans le cadre du projet SINAPS qui propose des briques logicielles à tous les acteurs de l’ESR pour permettre aux établissements de gérer en interne leurs propres référentiels et qui prévoit l’interopérabilité avec des référentiels communs nationaux. 2.3.5. Bibliométrie et outils assimilés : vers la curation et la facilitation de l’exploitation des données de la recherche

Outre l’utilisation des données issues de l’IST, l’analyse de cette utilisation constitue à elle-seule un nouveau champ disciplinaire, intéressant tant la recherche que les entreprises. A la marge de cette analyse en profondeur des volumes et directions de l’utilisation, des services de curation permettent de faciliter l’accès à l’IST en renforçant les logiques d’identification des contenus (tagging), de notation (marking) et de classement (ranking). Mettre à disposition un service plutôt que fournir systématiquement, en analysant les besoins grâce aux indicateurs du SAPPS notamment ■ L’intérêt pour les services d’études bibliométriques se trouve dans la mise à disposition des outils d’analyse plus que dans la fourniture directe du service. Ce dernier est néanmoins difficile à externaliser, et il convient encore une fois de former à l’analyse

Page 108: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

108

de l’IST, afin de passer d’un modèle profanes-spécialistes à un modèle de capacitation généralisée des chercheurs, puis dans un second temps de la société civile. L’idée n’est pas de faire de chacun un expert de l’IST, mais bien de rendre chacun capable d’analyser l’IST qu’il a à sa disposition. Il faut par exemple prendre en compte les spécificités SHS en sortant du panel d’indicateurs quantitatifs existants afin de mettre en œuvre une bibliométrie qui corresponde à chaque domaine de la recherche et aux formats particuliers de leurs IST. Des indicateurs bibliométriques (répartition par institut, relations interdisciplinaires, part nationale ou régionale, collaborations internationales,…) sont produits par le SAPPS et sont largement utilisés. Toutefois, les instituts ne disposent pas toujours d’une vision complète de leur production scientifique (l'INC par exemple, le fait observer) et apprécieraient la mise à disposition d’outils de gestion bibliographique optimisés et partagés. Dans ce sens, apparait la demande d'une exploitation plus ciblée, de la base issue du WoS, par repérage des unités CNRS dans les affiliations. La demande en est exprimée par certains instituts (INSB par exemple). D’autres méthodes de mesure complémentaires sont souhaitées dans les cas où, dans le cadre des métriques existantes, la France n’apparaît pas à la place qui est la sienne dans le travail des communautés scientifiques correspondantes (c’est le cas de l’IN2P3 qui observe la nécessité de faire mieux ressortir la place qu’il occupe dans les publications au CERN). ■ Concernant la mise à disposition de ressources terminologiques scientifiques et techniques, l’ADBU signale qu’une articulation avec les initiatives des autres opérateurs nationaux qui interviennent sur les questions de signalement serait très souhaitable et permettrait de mieux valoriser la plus-value de l’INIST dans ce domaine. Ainsi, une mise à disposition des outils peut passer par ;

- Une plateforme des vocabulaires de l’ESR - Des alertes pour informer sur les thésaurus alignés - Un lobbying pour les thésaurus internationaux (Gemet par exemple) - Une assistance au traitement ponctuel de vocabulaires

■ Les sites de veille d’actualité en IST (service 6.1.) manquent de notoriété et de visibilité. Ce sont des sites d’accès à l’IST et à ses réflexions, mais pas à de la veille disciplinaire. La LIST suit un éventail trop important de sujets, difficiles à suivre dans leur totalité et avec le même approfondissement. Les sites doivent donc aller vers une fusion progressive.

Page 109: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

109

Disposer d'une politique cohérente d'affiliation ■ Cette politique, à laquelle travaille la DASTR par le biais du SAPPS, est un facteur majeur d’optimisation pour toutes les étapes de construction de l'action d'IST. Il a déjà été préconisé à plusieurs reprises que, notamment dans les contrats entre le CNRS et ses partenaires, la mention de CNRS soit obligatoire : en pratique ce n’est pas toujours le cas ; or, de la précision des affiliations de chaque papier dépend la précision des indicateurs et des classements au sein d’outils tels que Google scholar, Publish or perish, Research Gate, H-Index du WoS : il faut inciter à la discipline collective sur ce point ! Accompagner les chercheurs dans la valorisation des données et la création de DMP ■ L’accompagnement des chercheurs pour la gestion et la valorisation des données de recherche (service 5.1.) doit être effectué de façon permanente, sans pour autant interférer avec les initiatives locales. L’ADBU abonde également dans le sens d’une formation coordonnée par l’INIST mais dont la responsabilité repose sur les professionnels locaux qui sont les personnels d’appui naturels des communautés locales. Créer une forme de « SUDOC des données IST », sur la base d’un service centralisé décliné de DMP Online et fonctionnant grâce au réseau des archivistes de terrain est une option. L'INS2I suggère la mise en place d'une structure de DMP avec diverses étapes, ce qui permettrait de posséder non pas simplement des modes d’emploi mais aussi des normes communes en termes de curation. Le CNRS est quant à lui globalement attendu pour son appui technologique et logistique (ex : le stockage) et pour la sécurisation des données. Le modèle du Digital Curation Center (DCC) en Grande-Bretagne paraît un bon moyen d’impulser une politique coordonnée au niveau national et efficace sur le plan local. Créer un partenariat sur ce point avec le projet d’entrepôt national de métadonnées de l’ABES est aussi indiqué. Développer des métriques alternatives, récupérer les métriques existantes pour forger des bases de données cogérées et publiques ■ Enfin, une démarche en cours grandissante met l'accent sur les métriques "alternatives" (Altmetrics), qui s'appuient sur les pratiques des chercheurs et les analyses (préférences et opinions, notamment). Des alternatives aux indicateurs historiques tels que le Facteur d’impact apparaissent ainsi, et sont proposées à l’échelle

Page 110: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

110

internationale. Il y a place également pour les analyses heuristiques et leurs développements en cours (Méta et Hyper-heuristiques nées dans les applications industrielles de la recherche). Le colloque Innometrics constitue pour la seconde année consécutive un grand rassemblement destiné à approfondir ces sujets avec tout l’ESR. ■ Certaines infos bibliographiques passent aujourd'hui sur les réseaux sociaux de type Mendeley ou Academia. Il serait intéressant de les récupérer. L'idée de proposer des outils de gestion d'éventuelles bases documentaires est bonne, mais la récupération de notices depuis les catalogues de bibliothèques, les bases de données ou les bouquets électroniques doit être facile. De toutes les manières, ce service demeure parfois inadapté selon la nature de certains établissements, comme en témoigne l’un des verbatims de l’étude COPIST ; « Notre institution ne souhaite pas encourager ce type de démarche individuelle de constitution de bases de données parallèles à la base de données institutionnelles. ». Le développement d’outils d’analyse en open source et avec le concours des bonnes volontés locales doit donc au fur et à mesure remplacer le développement en version propriétaire ou en version centralisée publique. 2.4. Sauvegarder la pérennité et la compétitivité de l’IST française

Il est donc nécessaire de garantir la production d’IST, mais il ne faut pas négliger d’assurer l’archivage pérenne des documents anciens (numérisation) et récents (système de dépôt central). En outre, fournir un cadre complet d’assistance à la publication pour les chercheurs, au sein d’un environnement juridique évolutif et protecteur, constitue une démarche cruciale qui compense les manques structurels irréductibles des politiques de formation et de changement de modèle économique. 2.4.1. Construire un programme national cohérent et interdisciplinaire de préservation du patrimoine scientifique incluant un archivage pérenne (HAL, ISTEX)

Il y a donc aujourd'hui un important besoin d’archivage pérenne, de recensement de l’existant et par la suite de pouvoir faire des choix quant à ce qu’il faut garder ou pas. Les universités et les instituts de recherche sont intéressés par la gestion et l’exposition des bases de données produites dans leurs établissements, mais ne relevant pas du champ d’application d’entrepôts thématiques ou institutionnels. Ce spectre étant très large, des coopérations sont à valoriser, par exemple avec Huma-Num (très grande

Page 111: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

111

infrastructure dédiée à la recherche en SHS) travaillant sur l’objet des humanités numériques ou l’UMS 3468 « Bases de données Biodiversité, Ecologie, Environnements Sociétés (BBEES) ». Mettre en place prioritairement un dispositif de recensement/signalement des bases de données produites par les unités en menant une enquête avec un site de dépôt (similaire à l’action BBEES) à démarrer avec un institut pilote, en vue de définir les métadonnées nécessaires au signalement et à l’identification (DOI) des jeux de données en recensant les pratiques existantes par des schémas de métadonnées disciplinaires. La perte sèche de données : une hémorragie pas tout à fait arrêtée ■ Cristinel Diaconu (IN2P3) parle également de la perte sèche, en termes de données, qu’occasionne la suppression des données inutiles, trop massives ou contraires, à l’issue d’un projet par les chercheurs. Cette perte sèche demande de fournir à nouveau les efforts de recherche si un projet semblable qui aurait pu les utiliser s’ouvre dix ans après. Elle estime à 1 millième du coût total l’épargne réalisée en ne conservant pas tous les résultats, alors que la rentabilité de ces données sur 5 ans est en moyenne de 10%. ■ On pourrait donc envisager la sauvegarde d’un maximum de données comme un enjeu national pour l’Etat, qui jouerait un rôle d’arbitre répartissant vers les bons marchés ces résultats, aujourd’hui voués à la corbeille faute de visibilité. L’article 30 de la LPRN institue un allégement juridique progressif de la protection des résultats, pour aller vers l’Open Science, qui en diminuant le coût marginal pour une entreprise de recevoir un set de données, augmenterait les possibilités d’optimiser les découvertes de la science dans l’économie. ■ Pour les disciplines qui relèvent des Big Data (HEP par exemple), les infrastructures de calcul assurent les fonctions de base de gestion des données (stockage, sauvegarde), mais rarement très au-delà de la vie des projets. Une infrastructure de données se doit d’inclure dans ses services les dimensions archivage pérenne, règles de partage et de réutilisation, gestion des accès, … Il n’en est pas de même des nombreux projets « small data » qui présentent des solutions de gestion de données moins sûres et moins pérennes. Il s’agit donc de mettre en place une offre de services, en liaison ou non avec l’offre de calcul, s’appuyant sur les moyens des laboratoires, les centres de type CC-IN2P3, CINES, mais aussi INIST et cloud CNRS.

Page 112: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

112

Prendre en compte les archives locales au sein de HAL ■ Il faut que les archives institutionnelles locales soient prises en compte. Au sein de HAL, il faut développer la précision des statistiques déjà existantes, et ne plus rendre obligatoire le passage par le protocole SWORD, très long et très développé. Il manque un dépôt rapide pour les chercheurs, ainsi que pour les bases de données. Un répondant va jusqu’à dire ; « Il est insensé que le dépôt masqué ne soit pas encore proposé, alors que c’est une fonctionnalité techniquement basique, maintes fois demandée, standard dans les archives ouvertes du monde entier et qu’elle est la condition de possibilité technique d’une politique de dépôt systématique ». Une interrogation annexe porte sur la capacité de HAL à produire des statistiques sur mesure concernant le nombre d’auteurs, le rang, les quartiles… Un nombre important de chercheurs comparent HAL à ResearchGate (« pourquoi est-ce si compliqué dans HAL alors que dans ResearchGate, il suffit d'un clic pour dire si c'est notre publication ou non et celle-ci est intégrée »). Les arguments de pérennité pour le dépôt et le CV chercheur, de transparence (porteur de Hal CNRS) dénuée de business caché, de facilité de dépôt grâce au DOI et au PDF etc. doivent faire l’objet d’un regain d’attention. ■ HAL doit effectivement viser l’exhaustivité, et donc prendre en compte les structures rigides de certaines disciplines. Les pistes envisageables rejoignent toutes l'élaboration d'une procédure accélérée/allégée de dépôt ou de pré-dépôt, d'un "dépôt rapide" ou d'un "dépôt en trois clics" sur le modèle des expériences existant déjà, telles que DISSEMIN, permettant de revenir compléter le dépôt a posteriori. Cette exhaustivité passe par une automatisation des interactions entre les échelles ; à ce titre, l’Ifremer souligne : « Il serait intéressant d’avoir des droits liés aux affiliations Ifremer présentent dans les références de HAL sans pour autant s’engager à entretenir un portail parallèle à notre archive. HAL améliorerait ainsi la qualité et la complétude de son contenu et les établissements pourraient agir directement sur leurs références sans demander un partage de propriété référence par référence au contributeur. » Quelques pistes complémentaires ■ Les autres pistes complémentaires pour répondre à l’utilisation encore fragile et incomplète du dépôt dans HAL sont, outre une intégration de DISSEMIN ;

- Un fichier d’autorité des laboratoires - Un réseau social des chercheurs intégré à HAL - Un site ergonomique, attrayant et design

Page 113: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

113

- Un lien pour le référentiel, avec RNSR - Une amélioration de la saisie du dépôt - Des exports paramétrés - Une récupération automatique depuis le WoS ou Scopus - Un lien avec les bases de financement ou d’appels à projets - Un service de traduction - Une fonction « request a copy » - Une gestion d’accès réservés en intranet - Établir des tables de correspondance entre autorités HAL et autorités des

archives institutionnelles qui versent dans HAL est indispensable pour que les administrateurs HAL ne passent plus leur temps à corriger dans AureHAL les doublons générés par ces imports

- Une traduction des interfaces en anglais plus précise - Ouvrir HAL aux mémoires est également une idée qui revient régulièrement

dans les débats, afin d’augmenter le « mandat réel » de la plateforme, et la portée de son audience tout à la fois.

- Enfin, une promotion et communication enjouée et continue sur HAL ! ■ En ce qui concerne le cas particulier des thèses en ligne dans HAL (TEL), étant donné l’existence de la passerelle permettant le versement depuis le dépôt légal STAR vers TEL, il semble contreproductif de laisser ouvert un dépôt direct des thèses sur TEL (avec le risque de confusion sur la nature canonique ou non de la version déposée, alors que la version déposée via le dispositif STAR est la seule valide). L’ADBU propose aussi que d'autres documents puissent être déposés sur TEL directement par leurs auteurs est tout à fait défendable, mais en ce qui concerne les thèses de doctorat, le principe du dépôt automatique à l'issue d'un processus de validation interne est plus fiable. Cela pourrait faire l'objet d'une précision sur TEL, renvoyant les docteurs à leur BU et empêchant le dépôt direct, OU éventuellement, proposant la fusion de leur dépôt personnel avec le dépôt institutionnel, que celui-ci soit antérieur ou postérieur. Une mise en cohérence avec theses.fr est absolument et radicalement nécessaire ; un positionnement de TEL comme une surcouche officielle exhaustive de theses.fr semble optimal, à défaut d’une fusion bienvenue. Les établissements délivrant des thèses ont souligné qu’il est urgent de mettre en place une fonction « embargo » sur les PDF des thèses, afin de respecter les délais prescrits.

Page 114: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

114

Laisser les chercheurs autoévaluer l’importance de leurs données et en définir les modalités de sauvegarde en favorisant les collaborations ■ La pérennisation de la sauvegarde des données issues de la recherche passe aussi par la mise en place de plans de gestion de données (via OPIDOR) pour tout dataset considéré comme important. Cette notion d’importance intergénérationnelle est à laisser à la discrétion de chaque unité, qui doit être à même d’évaluer quelle IST vaut la peine de passer 1 heure à élaborer un DMP, et quelle IST peut être stockée sur des disques durs externes locaux voire supprimée. Ce principe d’action vise à ce que, dès la genèse des projets, les chercheurs prennent en compte les aspects des modalités de stockage, de description, de mise à disposition et d’archivage des données qui seront amenées à être collectées et traitées. L’établissement d’un DMP est de plus en plus fréquemment demandé dans les appels à projet. Il s’appuie sur la prise en compte du cycle de vie des données et décrit les règles applicables en termes de normes de métadonnées, format des bases de données, méthode et sécurité d’accès, durée d’archivage, ainsi que les coûts associés. Une mention particulière doit être apportée aux données venant en appui des publications et qui doivent à ce titre rester disponibles et accessibles le plus largement possible ■ A l'InSHS, le programme Persée du MESR qui était consacré à la numérisation d’archives scientifiques en sciences humaines et sociales est élargi avec le portage du CNRS, de l’ENS et du CUE de Lyon, sous l’égide de BSN 5. L'INSU a également des besoins, notamment avec les revues géologiques. Cette catégorie de besoin ne concerne pas que les publications : l'INSB, par exemple, participe aux bio-banques européennes de stockage et aux bases de données de séquençage. ■ A l'IN2P3, à l’InSHS, et à l'INP, mais aussi à l’INSMI et le RNBM, le papier reste un support recherché : il est de moins en moins essentiel de « conserver un voire deux exemplaires papiers pour la France entière » (préconisation de la SIST 2014). 2.4.2. Apporter un appui logistique et linguistique à la visibilité internationale des publications (notamment en OA) du CNRS et de ses partenaires, en assistant la rédaction et la traduction

La traduction, l’assistance rédactionnelle, l’accompagnement de l’évolution du dispositif de fournitures de documents primaires, ainsi que la mise en œuvre

Page 115: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

115

d’un conseil en négociations sont autant d’instruments au service de la visibilité internationale de la recherche française.

Les publications du CNRS en font un acteur incontournable du paysage mondial de la science, dont il s’agit d’améliorer la visibilité ■ Le CNRS produit en moyenne 40 000 articles par an, ce qui représente 1.50% des publications mondiales, avec 26% d’impact en plus par article rapporté à la moyenne mondiale.

Analyse d’impact (en nombre de citations),

un indicateur supérieur à 1 révèle un impact supérieur à la moyenne. ■ Les deux principaux supports de publication du CNRS sont le WoS (Thomson-Reuters) et Scopus (Elsevier), avec respectivement 420 000 et 540 000 publications françaises entre 2000 et 2014. Malgré cela, le taux de croissance du CNRS et de ses partenaires ralentit (4.6% en France contre 6.3% mondialement), et c’est en partie en raison de barrières à l’exportation de l’IST française. ■ Persée.fr (service 3.4.) permet d’améliorer la visibilité des publications en revues de la recherche SHS française. Cependant, du point de vue de l'utilisateur chercheur, un rapprochement avec une autre plateforme, un peu en retrait techniquement ; Revues.org (quand ce ne serait que par moissonnage mutuel) serait très souhaitable, en dépit de contraintes institutionnelles et humaines fortes. Au sein du programme

Page 116: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

116

COLLEX, il est absolument nécessaire de clarifier l’articulation entre Persée et les autres acteurs opérateurs de numérisation, BNF en tête. En effet, une cohésion nationale est le premier ingrédient d’une intégration internationale accrue. ■ La présence de plus de contenus images, et donc de fonctionnalités de retouche d’image (rogner, cadrer, etc.) est nécessaire par exemple dans le domaine des revues d’Art. Sur l’aspect iconographique de l’IST, la France accuse en effet un retard international : il faut donc ouvrir l’IST aux formats image. ■ Le service de numérisation et d’océrisation (3.15.) doit être articulé avec le COLLEX-Persée et l’offre de service BNF pour être efficace pleinement et permettre un passage au numérique de l’IST française. PSL précise que ce service sera utilisé « à la double condition que la qualité des prestations soit au même niveau que celles des prestataires privés avec lesquels PSL travaille actuellement, et que le coût soit concurrentiel. ». Il serait par ailleurs très utile de disposer d'une plateforme qui permettre de travailler sur la sémantisation des données issues des catalogues et des programmes de numérisation en établissant de façon scientifique des relations structurées entre les entités. A ce titre, le service POPS ne paraît pas prioritaire, et semble dépendre de sa capacité à se différencier des autres outils et à présenter des coûts modérés. Augmenter une interaction déjà prégnante avec les pays partenaires implique d’avoir un service de qualité pour traduire et internationaliser les productions de la recherche ■ Voici les principaux pays avec lesquels le CNRS entretient des partenariats de publication entre chercheurs forts ;

Page 117: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

117

■ Ces pays ont bien entendu vocation à voir leur liste développée et renforcée de nouveaux arrivants au fur et à mesure du développement de services d’internationalisation performants, dépassant la simple traduction anglais-français et un annuaire basique des supports étrangers de publication de l’IST. En surchappement de portails tels que iPubli, cogéré par l’INIST et le CNRS-INSERM, un service d’appui à la publication de bases de données documentaires concourrait à ce renforcement, ce long et fastidieux travail d’obturation des fuites du système IST national. PSL mentionne que ses plateformes seront utilisées sous Omeka-s et Cubicweb pour proposer le même type de services. L’interopérabilité avec ce service 3.13. du CNRS permettrait de viser l’exhaustivité. ■ En matière de langues, il conviendrait que le service d’assistance à la rédaction de documents scientifiques en anglais (3.14.) soit axé sur les chercheurs et enseignants-chercheurs juniors et ouvert aux doctorants. La difficulté réside dans le fait de proposer des traducteurs compétents dans toutes les spécialités (terminologie et usages communicationnels). Cette prestation doit être dématérialisée entièrement pour éviter tout déplacement inutile vers l’INIST à Nancy. Si l’on veut développer la dimension interculturelle, importante en SHS, l’anglais et l’allemand ne sont pas les seules langues à prendre en considération. Il faut donc envisager son ouverture vers d’autres

Page 118: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

118

langues, avec des partenariats locaux. Ces partenariats pourraient s’établir avec des centres d’apprentissage de la langue de niveau professionnel agréés par l’Etat, au moyen de crédits « assistance linguistique » alloués à chaque unité en prévision de l’ouverture de commandes publiques de petite taille. En effet, cela permettrait de contourner la réticence unique qui préoccupe les chercheurs, à savoir que le partage d’un tel service risquerait de remettre en cause les partenariats existant au sein des unités de recherche avec des traducteurs réguliers. ■ Il faut rendre les publications scientifiques françaises disponibles sur des plateformes en OA plus visibles (HAL, Persée, Open Editions, I-Revues, etc.) en traduisant leurs métadonnées et plus particulièrement les résumés, « quatrièmes de couverture » dans des langues de communication internationales, en premier chef l'anglais. Conjointement, il convient de définir des processus d'assurance qualité scientifique pour les traductions, et de construire un processus permettant de collecter, traiter et traduire ces éléments et les réintégrer dans leur environnement original de diffusion. Assister les tâches quotidiennes de rédaction et de mise en document des données IST ■ La fourniture de document permet de fournir des articles rares et difficilement identifiables et localisables. Le service de fourniture de document de l’INIST permet aujourd’hui d’atteindre plus de 96% de satisfaction des commandes (notamment grâce à un réseau de 280 bibliothèques partenaires). Sous des conditions nouvelles à définir, cette activité portant sur des demandes de documents rares ou nécessitant des compléments d’identification pourrait apporter une véritable valeur ajoutée au dispositif académique géré par l’ABES. L’intégration de ressources en accès libre devrait également être un levier de signalement renforcé. BSN 8 a retenu parmi ses priorités une meilleure articulation entre les ressources des Cadist et la plateforme RefDoc. ■ Enfin, le service 3.16., à savoir le secrétariat de rédaction, est utile lorsqu’un acteur monte en puissance et décide d’éditer ses propres revues / documents. Ce service doit être couplé à l’hébergement de sites web IST, avec l’aide à la réalisation et à la mise en ligne pour les acteurs qui souhaitent en disposer. Localement, les questions d'image et de communication attachées à la gestion des sites web sont essentielles (charte graphique, gabarits web, identité visuelle, ligne éditoriale...). Aucune externalisation complète n’est donc possible, et les conseils doivent se limiter à la technique, laissant

Page 119: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

119

chacun remplir ses textes et compléter son imagerie officielle. Les CRI ou DSI proposent déjà des services d’hébergement web. Il serait intéressant d’établir clairement et publiquement les conditions tarifaires de ce service et sa plus-value par rapport aux services internes des universités. 2.4.3. Anticiper les partenariats pour réguler les relations entre les producteurs, les intermédiaires et les usagers finaux d’IST Continuer à privilégier les études de faisabilité préalables pour produire mieux ■ L’UMS Persée est également moteur d’innovation juridique car elle opère dans un cadre juridique complexe à anticiper et à faire évoluer. En effet, l’UMS ne limite pas son action aux corpus libres de droit et prend en charge des documents qui peuvent être soumis au droit d’auteur. Les aspects juridiques occupent en conséquence une place centrale. Il convient non seulement de connaître les ayants droits sur les documents et les droits dont ils disposent mais également d’organiser les cessions de droit nécessaires et d’assurer les conditions d’une diffusion en Open Access. Cela se traduit par des études de faisabilité préalables et une réflexion sur l’évolution du droit d’auteur. La mise en réseaux diminue le paradoxe du chercheur ■ Fort de nouveaux modèles économiques pour rechercher et publier l’IST, le chercheur français a tout intérêt à s’appuyer également en amont sur la formation et les outils d’analyse, et en aval sur les assistances proposées pour le dépôt et la rédaction-traduction tant des données que des métadonnées. Celui qui produit de l’IST trouve donc le paradoxe de son positionnement double (producteur et chercheur) réduit par cette mise en réseau, voire en rhizomes pour reprendre Deleuze, des compétences et des offres d’outils et de supports. En d’autres termes, le producteur d’IST doit trouver dans les avantages portés à sa recherche d’IST l’équivalence compensatoire des inconvénients trouvés dans la production, sur les plans économiques et techniques (ce qui revient au final au même, le dénominateur commun étant le temps investi pour comprendre le fonctionnement des systèmes et normes IST, étant traduit en argent ou non).

Page 120: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

120

L’effacement de l’intermédiaire ■ De son côté, l’intermédiaire doit s’effacer le plus possible pour éviter les logiques de silo et fonctionner en marque blanche, se rendant donc invisible par l’automatisation et l’interopérabilité. Le support de recherche idéal combine agilement un moteur de recherche doté d’outils d’analyse, de bibliométrie et de TDM approfondis, et des algorithmes permettant un dépôt des documents facile, avec inscription automatisée des métadonnées lorsque c’est possible, voire des suggestions de sujets de recherche. L’expérience doit être pensée côté utilisateur, sur la voie qu’a ouvert l’Etat avec sa refonte du CNN, de l’Agence du Numérique et le lancement de la Mission Etalab, qui met la donnée publique au niveau d’intéressement minimal de chaque citoyen. De nouveaux questionnements émergents, source de futurs travaux juridiques ■ Concernant l’assistance et le conseil juridique en matière d’IST, le SCD est déjà en mesure de répondre à une partie des questions juridiques. En revanche, un service spécialisé centralisé au niveau national pourrait permettre la prise en charge des questions les plus complexes. Parmi ces questions, on peut déjà entrevoir le profil qu’en adopteront certaines ;

- Comment répartir les bénéfices des articles publiés en se basant sur des données partagées, voire en Open Access ? Le producteur d’IST originel doit-il percevoir une forme de « royalties » sur chaque vente/lecture, ou un paiement forfaitaire de début ? En effet, il apparaît clair que les droits classiques, celui de l’auteur et celui du brevet, sont déjà submergés par les nouvelles interconnexions possibles.

- Comment garantir un revenu au chercheur, et faire valoir sa propriété intellectuelle, par exemple dans le cadre de projets à plusieurs mains basés en partie sur de l’open source en matière de programmation ?

- Jusqu’où la sécurisation étatique contre le piratage doit-elle aller pour garantir la sécurité des données issues de l’IST, sans être ni trop encombrante (discrète) ni trop envahissante pour la vie privée (subtile) ? Ceci s’inscrivant bien sûr dans un cadre légal bien plus général, qui a tout à voir avec les lignes de force majeures des politiques publiques mises en œuvre durant le mandat présidentiel en cours.

- Comment assurer la vérification de fiabilité de l’information ? Le peer-reviewing apporte des réponses, mais il vient aussi avec ses limites liées au social scamming et aux intéressements financiers des audiences (paying e-

Page 121: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

121

reputation). Dès lors, une labellisation officielle est-elle possible ? Si oui, quelles peuvent en être les modalités de contestation pour le chercheur s’estimant injustement exclu de son champ ?

- Comment rentabiliser l’achat de fonds documentaires dans le cadre d’un paiement « à l’usage » si l’usage s’avère plus faible que les estimations prises en compte ?

Bien entendu, il ne s’agit que de quelques exemples, et ce triangle de tensions amènera bien d’autres questionnements sur le devant de la scène, qui doivent être anticipés. 3. SYNTHESE ET ACTUALISATION STRATEGIQUE :

Vers l’interopérabilité des outils et des usages Des tutoriels et des personnels facilement joignables pour les chercheurs à travers un guichet unique

Un plan de communication sur les nouveaux fonds documentaires et les nouveaux outils à grande échelle

Continuer à rester en contact avec les universités et les UMR via des procédures telles que le COPIST

Afin de faire de cette vision stratégique une réalité commune et acceptée de tous,

il faut communiquer dessus, et établir des règles et des chemins d’application concrets, dans les champs sociaux, politiques, juridiques et économiques. Cette troisième partie, plus courte, est consacrée à une synthèse des étapes franchies et à franchir, une sorte de témoin du gué sur lequel toute la troupe IST française s’est engagée, sur une longue rivière aux forts courants contraires dont le franchissement portera des conséquences sur l’ensemble des ménages et des entreprises. Cette mise en place stratégique, en tant qu’elle est le fruit d’une réflexion commune, doit se fondre dans les cadres rigides qui ont été dessinés en certains endroits, dans certaines entreprises, laboratoires, voire dans certains secteurs de la recherche, de la science, tout y apportant une fraîcheur et une praticité inédite, mais qui n’ont pas ce caractère éphémère et grandiloquent des « nouveautés nouvelles », car ce serait là une démarche bien inconsciente après tous les efforts d’analyse et le recul pris durant ces 5 dernières années. Le mot d’ordre en est donc la prévoyance et l’interopérabilité. Récapitulatif des progrès faits et à faire, par angle de traitement

2014 2017 2020

Page 122: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

122

■ L’acceptation d’une éthique et de principes - par la recherche - par la société civile

Logiciels et données propriétaires

Open Access Open Science

Sécurisation des données entravant l’innovation

Libéralisation relative de certaines données, dans une optique contractualiste

Dépasser l’optique contractualiste et établir un droit agile de l’IST issue des plateformes

Chartes éthiques rédigées par plusieurs acteurs

Concertation des principes autour de la sémantique LPRN

Agence éthique de l’IST et de la Science Ouverte

■ L’application de principes juridiques et économiques adaptés au monde numérique

- par le parlement, conseil d’Etat, pour et par l’Etat Données éparpillées, sécurisées localement ou pas du tout le plus souvent

Innovation technique au service de l’Etat et de la recherche

Sécurité des données garantie par l’Etat

Mise en place des marchés multifaces sur les plateformes

Bases du principe de loyauté des plateformes

Application de la loyauté par un dialogue avec les GAFAM notamment

Augmentation des volumes d’écrits anciens numérisés, et des catégories d’écrits courants déposés en ligne, développement d’une science TDM

Bases de l’autorisation du TDM, développement des possibilités techniques, notamment algorithmiques,

Application d’un TDM large et partagé grâce à un modèle économique fin, négocié avec les éditeurs sans

Modèles de contrats d’édition, de brevets classiques, débuts de l’open access

Diminution des délais d’embargos, volonté de modernisation de l’open access

Vers un nouveau modèle (par exemple les micropaiements)

Achat de bouquets documentaires, négociations avec les éditeurs

Meilleure concertation des négociations pour se rapprocher des besoins réels, parallèlement à la modernisation des logiciels économiques des éditeurs

Vers un nouveau modèle (par exemple les micropaiements)

Page 123: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

123

■ Le suivi des demandes émanant des chercheurs via les enquêtes et études associées Premiers résultats de l’enquête COPIST

Résultats COPIST améliorés et recompilés, avec une analyse en profondeur effectuée

COPIST à poursuivre, avec la possibilité de confier des missions plus précises aux CORISTs

Début des réflexions nationales, consultation LPRN

Intensification des réunions et rencontres des différents acteurs de l’IST

Rationalisation du système de dialogue multilatéral pour limiter les forces d’inertie du consensus

■ La simplification des outils et services Emergence d’une grande diversité d’outils pour répondre aux besoins qui émergent

Renforcement des coopérations et des réseaux

Mise en cohérence des réseaux avec l’échelle européenne, mise en avance de la France numérique

Haute technicité des outils, inadaptation aux besoins locaux

Mise à niveau des personnels, plans de formation et mise en ligne de l’information (approche « en aval »)

Prise en compte de l’ergonomie, de l’intuitivité de l’expérience utilisateur (approche « en amont »)

■ Un plan de communication et de formation à destination de la recherche Livrables de la DIST Livrables mis en ligne par

tous les réseaux, la DIST prend un rôle de répertoire et de centralisation de l’information

Livrables imprimés et/ou diffusés par les partenaires (universités, UMR, etc.)

Peu de formation généraliste, existence de « silos » spécialisés dans un seul domaine, avec début de communication entre les personnels

Accompagnement par des personnels du CNRS, en tant qu’interlocuteurs privilégiés, formation centrée sur la formation initiale

Faire reposer les appuis de la formation sur une plus large frange de personnels locaux en reconnaissant leurs compétences par une VAE fondée sur un cahier de critères plus pertinent, leur permettre le suivi et l’entretien du niveau de compétences des chercheurs pour

Page 124: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

124

s’assurer d’une corrélation avec la vitesse de progrès technique

L’IST est réservée à un public assez confidentiel, cantonné à certains domaines de la Recherche particulièrement bien développés sur le sujet

Ouverture de l’IST à tous les chercheurs grâce à l’effort des CORIST et aux projets DORANUM et OPIDOR

Faire participer les étudiants et les citoyens à l’IST en tant que récepteurs et en tant qu’utilisateurs des fonctionnalités secondaires des outils IST

Page 125: CNRS – Direction de l’Information Scientifique et … · Faire appliquer les principes juridiques de protection des données (secret ... "vocabulaires" de l'IST à grande échelle

CNRS – Direction de l’Information Scientifique et Technique

125

4. ANNEXE BIBLIOGRAPHIQUE

Dans une approche évolutive générale du partage de l’information scientifique et technique, et afin de donner une trame à la coordination de tous ses acteurs -notamment en vue de l’application des mesures de la Loi pour une République Numérique- les documents suivants ont été repris, combinés, et réorganisés dans le présent document ;

Stratégie IST 2014 Livre blanc et guide stratégique d’application (« Une Science ouverte dans une

République numérique : études et propositions en vue de l’application de la Loi ») Enquête COPIST (premiers résultats d’octobre, version du 14 mars 2016) Enquête auprès des DU (« Mieux partager l’information scientifique », résultats de

mars 2015 de l’enquête sur les usages et besoins d’IST des Unités de Recherche, réalisée auprès des Directrices et Directeurs d’Unités du CNRS)

Actes du Colloque de Meudon ; o « Dynamiques de l’édition scientifique, de l’industrie, de l’information, de la

documentation » (4 et 5 novembre 2014) o « Publication scientifique, innovation et services à la recherche » (9 et 10

novembre 2015) o « La Loi Numérique : et après ? » (9 et 10 novembre 2016)

Rapport de mission sur les systèmes de recommandation (Elsevier, 6 avril 2017) Schéma opérationnel (Panorama de l’écosystème IST 2017) Ouverture des données de recherche : cadre juridique (INRA) Rapport 2017 au MESR « Les enjeux du numérique concernant les ressources

documentaires en SHS » Rapports d’activité des segments 4 et 7 de la BSN (2016) Etude technico-budgétaire Ourouk Travaux sur les indicateurs IST des EPST et des Epic (séminaire ADBU 2012,

Dominique Cavet)


Recommended