AuBi présente ses avancées aux All-hands IFB / ELIXIR-FR 2025

Partager cette page
Version PDF

Publié le 8 décembre 2025 – Mis à jour le 8 décembre 2025

Participants présents lors des All-Hands IFB/ELIXIR-FR 2025

Lieu(x)

Institut des Systèmes Complexes, Paris

La plateforme AuBi a participé du 2 au 4 décembre à l’édition 2025 des All-hands IFB / ELIXIR-France, un rendez-vous majeur rassemblant plus de 200 membres des infrastructures nationales en bioinformatique. Ces trois journées riches d’échanges ont permis de faire le point sur les développements technologiques, les besoins des communautés et la feuille de route scientifique de l’Institut Français de Bioinformatique.

L’intervention d’AuBi

Présentation de Christophe Tatout aux All-Hands IFB

La plateforme a été mise à l’honneur à travers une présentation de Christophe Tatout, membre du réseau AuBi, intitulée :

« AuBi : mutualiser, modéliser et enseigner la bioimagerie à l’ère de l’intelligence artificielle »

Il y a présenté :

la stratégie de mutualisation d’un serveur OMERO hébergé au Mésocentre Clermont-Auvergne, désormais partagé par huit laboratoires clermontois pour la gestion, la valorisation et la diffusion ouverte des données d’imagerie ;
l’intégration du framework Biom3d permettant d’entraîner des modèles de deep learning pour la segmentation 3D d’objets biologiques, en tirant parti d’un nœud GPU dédié du cluster HPC ;
l’usage croissant du cloud Biosphère pour l’enseignement, via des machines virtuelles dédiées aux formations en bioinformatique et bioimagerie ;
l’Appliance “Bioimaging Desktop”, regroupant des outils de référence (Fiji, Icy, QuPath, NucleusJ2.0, Napari, OMERO.insight) et utilisée dans le master de bioinformatique de l’UCA, bientôt testée à l’échelle européenne dans le cadre d’AGILE ;
la conformité progressive avec les principes FAIR, grâce à l’attribution de DOI pour les jeux de données publiés et à l’adoption des recommandations REMDI/RDMkit pour les métadonnées, ainsi que l’anticipation des nouveaux formats d’imagerie européens.

Son intervention a suscité de nombreuses questions autour :
– des politiques de données (accès, ouverture, périmètre des jeux publiés) ;
– de l’interopérabilité des métadonnées et de l’usage de standards communautaires ;
– de la connexion aux futures archives d’images européennes dans le cadre des projets en cours.

Temps forts scientifiques & techniques

Ces sessions ont mis en lumière les avancées scientifiques et techniques, les innovations dans les services numériques et l’intelligence artificielle, ainsi que les bonnes pratiques pour la gestion et l’exploitation des données.

Services numériques & AI

Les 10 raisons de choisir le NNCR Cluster. La 3ème va vous étonner — Gildas Le Corguillé (IFB-core & ABIMS) : présentation des services du NNCR cluster et du cloud IFB, de leur charge croissante et de leur ouverture internationale via useGalaxy.
Les Labs Galaxy et le Galaxy Codex pour des interfaces Galaxy personnalisées et adaptées pour chaque communauté — Anthony Bretaudeau & Thomas Chaussepied (IFB-core & GenOuest) : démonstration des Galaxy Labs comme pages d’accueil thématisées et du Codex permettant des interfaces adaptées aux outils et workflows de chaque communauté.
Utilisation des LLM, tour d’horizon et utilisation concrète — Romuald Marin (IFB-core & PRABI-ASMB) : retour d’expérience sur l’usage de modèles de langage pour extraire des métadonnées, explorer des cas d’usage et réfléchir aux limites, coûts et enjeux écologiques de ces approches.
AuBi : mutualiser, modéliser et enseigner la bioimagerie à l’ère de l’intelligence artificielle — Christophe Tatout (AuBi) : présentation des services AuBi autour d’OMERO, de l’appliance BioImaging et de l’usage des machines virtuelles pour l’analyse et l’enseignement en bioimagerie.
Development and sharing of Nextflow pipelines for HPC environments — Quentin Duvert & Philippe Hupé (IFB-core & Institut Curie) : présentation de plus de 20 workflows Nextflow adaptés au HPC, incluant des pipelines de protein folding, docking et d’analyse pour le PEPR CellID.
EDAM MCP : faciliter l’annotation de ressources bioinformatiques via les LLM et les sources de données — Claire Rioualen (IFB-core) : description d’un projet combinant ontologie EDAM, LLM et RAG pour améliorer l’annotation des packages Bioconductor et produire des jeux de référence pour le benchmarking.
Enjeux, attentes et perspectives des axes stratégiques “services numériques” et “IA” — Équipe de direction IFB/ELIXIR-FR : discussion sur l’usage stratégique de l’IA, l’open science, la souveraineté des données et la nécessité d’orienter les collaborations et services pour les années à venir.

Orchestration des flux de données

Données des INBS : rédaction collaborative de profils thématiques — Jean-François Dufayard (IFB-core & SouthGreen) : présentation du travail sur les fiches INBS visant à recommander des entrepôts adaptés aux communautés et à harmoniser les pratiques.
Structuration et interopérabilité des Plans de Gestion de Données thématiques — Saliha Beddek (IFB-core & SouthGreen) & Sylvain Milanesi (IFB-core & ATGC) : discussion sur l’articulation entre DSW et DMP-Opidor et les perspectives d’un écosystème interopérable pour les PGD.
Madbot : une application web de data brokering FAIR — Elora Vigo, Imane Messak & Baptiste Rousseau (IFB-core) : démonstration de MadBot, un outil de soumission de données et métadonnées vers les entrepôts via un système de plugins et des profils d’utilisateurs adaptés.
Les services de FAIRification des données à l’URGI : cas d’utilisation — Michael Alaux (URGI) : présentation des outils et méthodes de FAIRification utilisés dans des projets nationaux et internationaux, ainsi que des réflexions autour des graphes de connaissances et de la curation.
Développement d’une page ressource pour la gestion des données en metabarcoding — Clara Emery (IFB-core & ABIMS) : introduction d’une nouvelle page RDMkit dédiée au metabarcoding, avec appel à contributions pour couvrir d’autres biomes et usages.
Enjeux, attentes et perspectives de l’axe “Orchestration des flux de données” — Équipe de direction IFB/ELIXIR-FR : retour stratégique sur la structuration des flux, la qualité des métadonnées et l’alignement avec les démarches nationales et européennes.

Outils logiciels & ressources de données

From Development to Deployment: Implementing the AlphaScan Protein — Chloé Quignot (I2BC) : présentation du déploiement d’AlphaScan, un pipeline automatisé pour le criblage et la prédiction d’interactions protéine–protéine.
PyFiber : La plate-forme web d’analyse des données de photométrie par fibre et de comportement — Benjamin Dartigues (CBIB) : démonstration d’un outil web intégré permettant de synchroniser et analyser simultanément signaux photométriques et données comportementales en neurosciences.
Panorama, A tool to manipulate and visualize pangenome’s graphs — Matthias Zytnicki (MIAT) : introduction d’un outil basé sur Neo4J capable de manipuler et visualiser de grands graphes de pangenomes, incluant plusieurs centaines de millions de nœuds.
MetamORF : une base de données de petits ORFs — Christine Brun (TAGC) : présentation d’une ressource regroupant 1,16 million de petits ORFs chez l’humain et la souris, avec discussions sur leur fonction potentielle et leur annotation.
Plongez dans le Système d’Information du projet ByteSea — Erwan Corre (ABiMS) : description du système d’information structurant le PEPR ATLASea, conçu pour produire, gérer et annoter les 4500 génomes marins du programme.
ABRomics : une plateforme d’analyse pour la recherche des résistances aux antibiotiques — Julie Lao (IFB-core & Hub Pasteur) : mise en avant d’une plateforme dédiée à l’analyse standardisée des données multi-omiques sur la résistance antimicrobienne.

Données sensibles

Highlight: Deploying a French FEGA node — David Salgado & Frédéric Haziza (IFB-core) : présentation des premières briques du nœud français FEGA, de sa relation avec l’EGA central et de la nécessité d’un environnement sécurisé pour les données génomiques sensibles.
Highlight: Cloud4SAMS, a trusted research environment to handle human gut microbiome data — Christophe Blanchet (IFB-core & PRABI-ASMB) : démonstration de Cloud4SAMS, un environnement sécurisé en “bulles” pour l’analyse de données du microbiote humain, et discussion sur sa complémentarité avec FEGA.
IFB Scientific Program : activities and roadmap — Équipe de direction IFB/ELIXIR-FR : présentation de la feuille de route scientifique incluant qualité des données, enjeux IA, ressources nationales et articulation avec les initiatives européennes.

Discussions stratégiques

Lors des différentes sessions de l’All-hands IFB/ELIXIR-FR, les échanges ont porté sur les enjeux stratégiques des services numériques et de l’IA, en mobilisant l’ensemble des axes de l’infrastructure.

Rôle et utilisation de l’IA

Les grands modèles de langage (LLM) et autres outils d’IA sont explorés pour la correction de métadonnées, l’annotation de ressources bioinformatiques (EDAM MCP), et l’optimisation des workflows analytiques.
La soutenabilité écologique et les coûts énergétiques sont des critères essentiels pour le choix et le déploiement des modèles, avec des approches privilégiant la pertinence scientifique plutôt que la complexité technique inutile.
La stratégie IA vise des usages ciblés, comme la facilitation de l’annotation, l’assistance bibliographique ou le traitement automatisé de pipelines, tout en restant compatible avec la reproductibilité et la robustesse scientifique.

Souveraineté, collaboration et modèle économique

La souveraineté numérique et la protection des données sont au cœur des discussions, notamment vis-à-vis des acteurs industriels internationaux.
Les initiatives EOSC, Data Space et PEPR Clouds sont vues comme des leviers pour renforcer l’alignement européen et la mutualisation des ressources.
Les modèles économiques doivent être réfléchis : la gratuité des services pour les chercheurs est équilibrée par la possibilité de contributions financières de gros utilisateurs afin de garantir la pérennité de l’infrastructure.

Qualité et orchestration des données

La cohérence des métadonnées et leur conformité aux standards FAIR sont essentielles pour l’exploitation des données par l’IA. Des outils comme MadBot, les profils thématiques des INBS, et les connecteurs vers des entrepôts (PRIDE, ArrayExpress, ENA) facilitent cette orchestration.
L’intégration des métadonnées dans les PGD/DMP et la connexion à des outils européens (DSW, SDK, Scientific Knowledge Graphs) permet un usage optimisé pour l’analyse et la réutilisation.
Les environnements sécurisés (FEGA, Cloud4SAMS) garantissent un traitement conforme des données sensibles, tout en favorisant la mutualisation et la collaboration inter-institutionnelle.

Repositories de confiance et alignement européen

Les critères établis par le Comité Scientifique (CoSo) pour les repositories de confiance servent de guide pour la sélection et l’accompagnement des entrepôts utilisés par les communautés.
L’IFB veille à promouvoir les bonnes pratiques, même lorsque des entrepôts internationaux ne respectent pas tous les critères.
L’alignement avec ELIXIR, EOSC et les initiatives Data Space permet de renforcer la visibilité, la fiabilité et l’interopérabilité des services et données.

Perspectives et recommandations

La mutualisation et la standardisation des infrastructures et des outils (Galaxy Labs, pipelines Nextflow, AuBi, plateformes d’analyse) est essentielle pour la reproductibilité et l’adaptation aux besoins des communautés.
Un accompagnement des chercheurs et des développeurs est prévu pour l’usage des infrastructures HPC, la gestion des métadonnées et l’exploitation des outils IA.
Une veille technologique et stratégique est nécessaire pour suivre l’évolution des modèles IA, des standards européens et des besoins des utilisateurs, afin de maintenir l’IFB/ELIXIR-FR en position de leader pour les services numériques et la bioinformatique.

Une dynamique collaborative renforcée