Cloud Environnemental au Bénéfice de l'Auvergne (CEBA)

Contexte : I-Site CAP 20-25 – (IRC-SAE, ex CIR1) - Optimiser l'intégration des agrosystèmes dans leurs environnements et territoires

Objectif : permettre de mieux comprendre les systèmes environnementaux, leurs évolutions dans le contexte du changement climatique global et leurs interactions avec les agroécosystèmes : impact des facteurs environnementaux sur les productions agricoles et inversement.

Le CEBA

Le CEBA est un lac de données offrant des possibilités de stockage, de partage et de fouille de données à ses utilisateurs, que celles-ci proviennent de fichiers ou de réseaux de capteurs. Le catalogue de données associé au CEBA permet de gérer les métadonnées afin de retrouver efficacement les données souhaitées.

Le « Cloud Environnemental » incarne l’ambition de créer un « grand » observatoire numérique de l’environnement en Auvergne, en mettant à la disposition de la communauté scientifique et de la société un environnement numérique interconnecté valorisant les données environnementales existantes ou à acquérir, avec le support du Mésocentre Clermont-Auvergne.


Apportant des fonctionnalités en matière de stockage, gestion, sécurisation des données environnementales mesurées par les différents dispositifs instrumentés en région Auvergne ainsi les analyses résultantes de projet scientifique, le « Cloud environnemental » offre des facilités en terme d’organisation et d’extraction des informations pour:

  • progresser dans notre compréhension des compartiments environnementaux face au changement global (évolutions, interactions)
  • en comprendre l’impact sur les agro-écosystèmes et réciproquement
  • conceptualiser les interrelations entre les compartiments pour comprendre, modéliser et prédire le comportement des agroécosystèmes.
Le CEBA permet de gérer les données de projet tout au long du cycle de vie de la données (de la donnée brute à la donnée élaborée) jusqu’à sa diffusion.

Données et accessibilité

Les jeux de données stockés sur le CEBA peuvent avoir 3 niveaux de visibilité :

  • Ouverts (Open Data) : accessibles sans aucune restriction, de même pour les données associées
  • Privés : visibles à tous, mais leurs données ne sont accessibles que par les membres du projet
  • Sous embargo : visibilité limitée aux seules personnes associées au projet pendant une durée de 2 ans
Les notions de données privées et sous embargo sont particulièrement utiles pendant les phases amont d’un projet (avant publication) pour partager, structurer et documenter les données. Ouvrir son jeu de données permet de diffuser des données une fois que tout le travail nécessaire a été réalisé pour les rendre aussi FAIR que possible ou qu’un DOI leur a été attribué. Les données ouvertes sont accessibles sans authentification, cependant il est nécessaire de se connecter si vous souhaitez déposer un jeu de données dans un projet.


Le CEBA est particulièrement adapté pour les données de biodiversité, écologie, environnement au sens large, mais les données d’autres thématiques peuvent également être accueillies.

Le CEBA peut délivrer un identifiant unique de type DOI (Digital Object Identifier - Identifiant numérique d'objet) à un jeu de données Open Data. Pour rappel, un DOI permet de citer et de retrouver facilement le jeu de données dans les publications scientifiques. Le jeu de données ne peut plus être supprimer ainsi que les données partagées une fois le DOI attribué. Il est cependant possible de modifier les informations de la fiche de métadonnées, même après l’attribution du DOI.

Taille maximale des fichiers et formats acceptés

Le CEBA accepte tout type de fichiers (images, vidéos, PDFs, excels…), sans aucune limite de nombre de fichiers par jeu de données. Cependant, la taille maximale actuelle pour un seul fichier est de 3 Go. Les fichiers peuvent être préalablement organisés avant leur dépôt, dans le but de respecter les principes FAIR et faciliter leur diffusion.

Métadonnées, standards et vocabulaires compatibles

Il est nécessaire de fournir certaines informations lorsque l’on souhaite créer un jeu de données : un titre, un résumé, le type des données partagées, une période temporelle concernant la création de celles-ci ainsi que le lieu, une liste de mots-clés définissant le thème, une licence de partage ainsi qu’un contact. Certaines informations facultatives sont encouragées, comme les coordonnées GPS, le nom de l’instrument de mesure ainsi que ses paramètres, ou encore les caractéristiques de l’échantillonnage, de l’analyse ou de l’enquête.

Le CEBA est construit autour du standard INSPIRE et du thésaurus GEMET pour  l’ajout de métadonnées de description de jeux de données :

  • INSPIRE fournit une liste de mots-clés généraliste, regroupant plusieurs domaines autour de l’environnement
  • GEMET est un thésaurus multilingue pour l’environnement et la gestion des ressources naturelles

Le CEBA offre aussi la possibilité d’utiliser n’importe quel autre thésaurus non cité ci-dessus tel que AGROVOC pour l’agriculture et ses domaines connexes tant qu'une URI est disponible pour que les personnes puissent vérifier la définition du terme/concept.

Gestion de réseaux de capteurs

Les réseaux de capteurs communicants déjà déployés (utilisant LoRa ou 3G) ou à venir peuvent être intégrés dans le CEBA. Il est pour cela nécessaire de respecter les principes de communication et de partage de données fixées par la plateforme qui sont assez flexibles. Une visualisation en temps quasi réel des données réceptionnées est disponible, ainsi qu’une interface de récupération des données aux formats JSON ou CSV. Une publication des données par l’API SensorThings est en cours de construction.

Accompagnement de projets scientifiques

Nous ne gérons pas directement de projets scientifiques mais l'équipe du CEBA peut vous accompagner dans la mise en place et l'utilisation de ses ressources si votre besoin concerne l’hébergement de données et/ou la collecte de données de réseaux de capteurs. Le CEBA peut être partenaire de votre projet avec le Mésocentre sur les aspects gestion de données. N’hésitez pas à nous consulter en amont de l’élaboration de vos projets à support.ceba@uca.fr.

L‘équipe du CEBA peut également vous accompagner dans la saisie des métadonnées, afin de rendre vos données le plus FAIR possible.

Le CEBA participe entre autres aux projets TERRA-FORMA et FAIR-EASE.

Session de formation: Metadata-Party !


Le CEBA organise régulièrement des Metadata-Party. Lors de ces évènements, nous réunissons pendant 3h quelques personnes qui viennent avec leurs ordinateurs et leurs données (que les participants nous ont envoyé avant la session pour que nous analysions le domaine, la structure ...) avec pour objectifs de créer la fiche de métadonnées, la déposer en test sur le CEBA et déposer les données associées. Un approfondissement sur certains éléments précis est possible si besoin.

Nous expliquons également le fonctionnement de l'attribution d'un DOI par le CEBA.

Après la session, vous serez prêt(e)s à créer les fiches de métadonnées et déposer les données dans le projet que vous aurez créé dans le CEBA. Vous repartirez avec un fichier excel contenant votre jeu de données testé, prêt à être redéposé dans votre projet. 

 / 1

Demande d'accréditation pour la création d'un projet sur le CEBA

Pour pouvoir créer un projet, vous pouvez contacter le CEBA. La création d’un projet implique aussi la responsabilité d’ajout les membres qui y sont associés, afin de leur accorder les droits de création de jeux de données. Le projet permet de regrouper sous un même nom un ensemble de données que l’on souhaite valoriser et partager ensemble. Nous pouvons vous accompagner lors de la création de votre premier projet.

Contacter le CEBA

Si vous souhaitez contacter le CEBA, n’hésitez pas à nous joindre par mail via support.ceba@uca.fr ou bien par téléphone au 04 73 40 73 87.

Coordinateur technique du CEBA: David SARRAMIA (LPC) - 04 70 02 20 82