Contexte

Les données de la recherche sont l’ensemble des données collectées, utilisées et produites par la recherche scientifique.

Selon l'OCDE : « Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. » [1].  Cette définition est reprise par ailleurs : "the recorded factual material commonly accepted in the scientific community as necessary to validate research findings." [2].


Chaque métier impliqué dans le processus de recherche scientifique a néanmoins sa propre conceptualisation du sujet en fonction de ses objectifs métiers.

Nous pouvons identifier :

  • les métiers de la recherche proprement dit (ingénieurs de recherche, enseignants-chercheurs, gestionnaires de laboratoires)
  • les métiers de l’information scientifique et technique (IST) (archivistes, bibliothécaires, documentalistes)
  • les métiers de support à l’activité de recherche (informaticiens).
  • les scientifiques de données
     

Feuilles de route vers la Science Ouverte

Le livre Blanc sur les Données au CNRS [3] fait en 2018 un état des lieux sur les pratiques et les besoins en matière de données au sein du CNRS. Il traite de l’organisation, de la gestion et de l’exploitation des données de recherche au coeur de l’activité de recherche.

Nous pouvons noter des rapports sur les données de recherche disciplinaire comme cette enquête à l’université de Rennes 2 sur les données en SHS [4]

La commission européenne dès son programme H2020 [10] sur la période 2014-2020 incitent les bénéficiaires de ces financements publics à élaborer un Plan de Gestion des Données (PGD) ou Data Management Plan (DMP).

Dès 2018, le Plan National de la Science Ouverte [5] promeut le mouvement de la Science ouverte visant à construire un écosystème dans lequel la science sera plus cumulative, plus fortement étayée par des données, plus transparente, plus rapide et d’accès universel : « La science ouverte est la diffusion sans entrave des publications et des données de la recherche. Elle s’appuie sur l’opportunité que représente la mutation numérique pour développer l’accès ouvert aux publications et – autant que possible – aux données de la recherche. »

 

De nombreuses initiatives voient le jour.

Au CNRS, Doranum [6], DOnnées de la Recherche Apprentissage NUMérique, propose des ressources pour accompagner la communautés scientifique dans la gestion et le partage de leurs données. OPIDOR [7], met à disposition de la communauté de l’Enseignement Supérieur et de la Recherche un ensemble d’outils et de services facilitant la mise en application des principes FAIR pour rendre les données Faciles à trouver, Accessibles, Interopérables et Réutilisables. Ce portail est mis en place par l’Inist-CNRS et participe à la démarche du Plan national pour la science ouverte portée par la France et animée par le Comité pour la science ouverte (CoSO) [11]. Nous pouvons noter l’outil dmp.opidor.fr pour gérer les Plan de Gestion de Données de la communauté scientifique française [7b].

Fin 2019, le CNRS présente sa politique des données dans sa feuille de route pour la science ouverte [8] : la science ouverte consiste à rendre « accessible autant que possible et fermé autant que nécessaire » les résultats de la recherche, issus en majorité des fonds publics.

 

A l’international, GoFAIR [9] pour la mise en pratique des principes FAIR dans les données et les services, la RDA [12] pour favoriser le partage des données, EOSC [13] le cloud européen pour opérationnaliser la science ouverte.

 

[1] «Principes  et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics » [archive] , http://www.oecd.org/fr/science/inno/38500823.pdf, Paris, 2007 (consulté le 24 sptembre 2020)
[2] OMB Circular 110 https://www.whitehouse.gov/sites/whitehouse.gov/files/omb/circulars/A110/2cfr215-0.pdf (consulté le 24 sptembre 2020)
[3] Livre Blanc sur les Données au CNRS : État des Lieux et Pratiques pdf, 2018
[4] Rapport « Données de la recherche en SHS » Alexandre Serres, Marie-Laure Malingre, Morgane Mignon, Cécile Pierre, Didier Colet, 2017
[5] Plan National pour la Science Ouverte, https://www.ouvrirlascience.fr/plan-national-pour-la-science-ouverte/, 2017 (consulté le 24 sptembre 2020)
[6] Doranum, DOnnées de la Recherche Apprentissage NUMérique, https://doranum.fr/
[7] OPIDOR, outils et services pour accompagner la gestion des données de la recherche, https://opidor.fr/
[7b] DMP opidor https://dmp.opidor.fr/
[8] Feuille de route pour la science ouverte du CNRS https://www.science-ouverte.cnrs.fr/, 18 novembre 2019
[9] FAIR principles, GoFAIR, https://www.go-fair.org/fair-principles/
[10] Horizon 2020, lignes directrices pour la gestion des données, 11/12/2013 http://openaccess.inist.fr/IMG/pdf/14081_lignes_directrices_pgd_horizon_2020_tr_fr_versionavril2015-2.pdf
[11] COSO, COmité Sience ouverte, https://www.ouvrirlascience.fr/presentation-du-comite/
[12] RDA, Reearch Data Alliance, https://www.rd-alliance.org
[13] portail d’EOSC (European Open Science Cloud), https://www.eosc-portal.eu/