Vous êtes ici : MesocentreActualités

Formation IA en bioinformatique : Retour d'expérience et recommandations

Publié le 24 juin 2025 Mis à jour le 24 juin 2025
Formateurs et participants présents lors de la formation AI & ML in LS 2025
Formateurs et participants présents lors de la formation AI & ML in LS 2025
Date(s)

le 24 juin 2025

Du 19 au 23 mai 2025, grâce à une bourse obtenue via la plateforme AuBi, un participant a eu l'opportunité de suivre la formation "Artificial Intelligence and Machine Learning in Life Sciences: from foundations to applications" proposée par l'IFB. Voici son retour d'expérience.

Artificial Intelligence and Machine Learning in Life Sciences: from foundations to applications (2025)

Cette formation de 4 jours proposée par l’IFB a abordé les grandes familles des méthodes d’intelligences artificielles (IA) : les régressions logistiques du machine learning, puis différentes familles de réseaux de neurones du deep-learning1. Pour ce dernier, nous avons un réseau linéaire simple ainsi que les réseaux convolutifs (CNN, ex. classification d’image) et récurrents (RNN, ex. classification de séquence ADN). La formation s’est terminée par une introduction aux modèles de fondation et grands modèles de langages appliqués à la génomique2. J’ai particulièrement apprécié la session relative aux risques, à l’éthique3, les régulations et standards pour l’IA, avec la entre-autre la présentation de DOME4, un standard d’évaluation pour les méthodes d’IA dans le domaine de la biologie. Il est basé sur des critères comme la disponibilité des données d’entraînement, des métriques d’évaluation, etc. L’objectif est de fournir cette évaluation lors de la publication.
 

Quelques points que j’ai trouvés importants :

  • Selon l’objectif, il est préférable de commencer par des approches de machine learning, plus simple à mettre en place, puis s’orienter vers du deep-learning si les résultats attendus ne sont pas satisfaisants
  • La qualité des données d’entraînement est cruciale, le machine learning ne remplace par une analyse exploratoire des données ni la discussion avec un spécialiste
  • La phase d’optimisation des hyper-paramètres (nombre de couches, de nœuds, les fonctions d’activations, le taux d’apprentissage, etc.) peut être très lourde en temps de calcul. Il existe des dashboards pour visualiser cette phase d’optimisation
  • Les outils CUDA, TensorFlow, PyTorch et autres librairies ont un développement très actif, avec des changements de version fréquents. Les conteneurs, Docker / Apptainer, sont un bon moyen de garder un environnement opérationnel.

Le monde de l’IA semble au premier abord très complexe, c’est une formation que je recommande de suivre pour en comprendre les mécanismes plus en détail. Il faut cependant des connaissances de base sur l’IA et être à l’aise avec l’environnement Python / Numpy / Pandas. Enfin, y assister avec un projet en maturation ou une idée de projet est un plus, des sessions « Bring Your Own Data » sont prévues et les formateurs sont à l’écoute pour nous guider.
 

Ressources

Références

1 https://github.com/CompOmics/intro-to-deep-learning/

2 https://github.com/raphaelmourad/LLM-for-genomics-training/

3 https://airisk.mit.edu/

4 https://registry.dome-ml.org/intro