Menu
Catégorie de la page

Données, services et infrastructures numériques

Résultat remarquable / EaSy Data rassemble les données de « longue traîne » de la Terre et de l’environnement

Introduction d'entête
L’entrepôt thématique national des données dites « orphelines » ou « de longue traîne » de l’environnement et du système Terre est né en 2023. Dans le cadre de l’infrastructure de recherche Data Terra, EaSy Data, porté par le BRGM, vise à capitaliser tout un pan des données de la recherche publique dans le domaine des sciences de la Terre et de l’environnement.
Body
Image
Légende

L'entrepôt national de données "EaSy Data" a pour but de centraliser, organiser et partager les nombreuses données dîtes orphelines sur la thématique de l'environnement et du système Terre. © BRGM

 

Contrairement aux données d’observation qui sont par essence structurées, une part non négligeable des données issues de la recherche publique sur le système Terre et l’environnement restent peu ou pas organisées ou même partagées. Elles ne sont pas systématiquement archivées dans des entrepôts, et pas suffisamment documentées. Ces données, que l’on appelle « orphelines » ou de « longue traîne », constituent pourtant un sujet stratégique dans la mesure où il s’agit de pérenniser le fruit des recherches dont elles sont issues.

La problématique est assez générale et commune à l’ensemble des domaines de la recherche scientifique. Cependant, alors que le ministère de l’Enseignement supérieur et de la Recherche, avec son plan national pour la science ouverte veut favoriser l’ouverture et le partage des données, des publications et des codes sources, le sujet vient de trouver sa solution concernant les sciences de la Terre.

Une diffusion large et obligatoire des données de la recherche publique

Le 6 novembre 2023, EaSy Data, entrepôt thématique national français des données orphelines ou de longue traîne de l’environnement et du système Terre, a ainsi été inauguré au ministère de l'Enseignement supérieur et de la Recherche. 

Cet entrepôt, porté par l’infrastructure de recherche nationale Data Terra, est opéré par le BRGM. Il s’inscrit plus largement dans le cadre du plan national pour la science ouverte initié en 2018, qui vise à structurer les actions en faveur de l’ouverture et du partage des données, des publications et des codes sources de projets financés sur fonds publics.

Un entrepôt de données développé par une équipe projet virtuelle

La création de tels entrepôts permet aux chercheurs de déposer et référencer les données de leurs travaux. Une plateforme nationale destinée à fédérer ces données, Recherche Data Gouv (RDG), a été créée pour cela. EaSy Data en est l’un des premiers composants.

EaSy Data est mis à disposition de la communauté scientifique du système Terre pour faire face aux enjeux environnementaux majeurs comme le changement climatique, la ressource eau, les risques naturels, l’énergie durable, etc. Il permettra de confronter, réutiliser, partager ou redécouvrir des données.

L’entrepôt utilise la norme de métadonnées ISO 19115, standard international des données géospatiales. L’outil de catalogage employé est Geonetwork, développé en open source. Les données sont entreposées dans le datacentre du BRGM, et l’expertise des équipes de l’établissement (le projet a mobilisé près de 20 personnes) a été au cœur des développements réalisés avec l’appui des équipes infrastructure.

Une équipe de pilotage « virtuelle » s’est réunie pendant deux ans pour la mise en place (Véronique Bertrand, CNRS - Epos-France ; Hélène Bressan, BRGM ; Christelle Pierkot, CNRS - DataTerra et Marine Vernet, IFREMER - DataTerra). Une surcouche applicative a été développée pour faciliter la saisie, adaptée aux besoins du chercheur. Une équipe de modération composée de scientifiques des pôles de données et volontaires est présente pour assurer la compa­tibilité avec les périmètres définis.

Des retours encourageants de la part des déposants

Au final, c’est une réussite du BRGM doublée d’une belle histoire et d’une aventure humaine avec quatre femmes qui ont travaillé uniquement en virtuel pour EaSy Data pendant deux ans.

Les dépôts par des chercheurs ont commencé d’emblée. Les retours sont encourageants de la part des déposants et l’entrepôt a déjà permis l’attribution de plus de 20 DOI (identifiants pérennes), ce qui montre que l’entrepôt répond à un besoin des communautés. Certes le dépôt n’est pas obligatoire, mais la pratique est largement encouragée car clairement dans l’intérêt du chercheur pour partager son travail, améliorer sa data citation et contribuer à une recherche plus reproductible. 

Des perspectives se dessinent déjà, avec l’amélioration de l’accès, un travail sur le vocabulaire et la sémantique pour faciliter le dépôt par exemple. La mise en œuvre de l’entrepôt EaSy Data témoigne bien des actions menées par le BRGM dans le cadre de sa politique de science ouverte. 

Image
Légende

L'interface de saisie de description des jeux de données permet de renseigner facilement les informations demandées, en français et/ou en anglais. Les déposants s'identifient soit via leurs identifiants ORCID ou Renater, soit par la création d'un compte. © BRGM

Portrait de l'auteur
Hélène Bressan
Prénom de l'auteur
Hélène
Nom de l'auteur
Bressan
Métier de l'auteur
Chef de projet vocabulaires et qualité de la donnée
EaSy Data s’inscrit dans le cadre du plan national pour la science ouverte qui vise à structurer les actions en faveur de l’ouverture et du partage des données, des publications et des codes sources.