Code : IMBA Semestre : M2S1 ECTS : 3

IMBA : Introduction à la modélisation bayésienne des données écologiques (AgroParisTech)

Localisation principale : AgroParisTech

Responsables : Eric Parent (AgroParisTech) et Marie-Pierre Etienne (MC AgroParisTech)


Contexte :

Depuis le passage du siècle, l’approche bayésienne a connu un développement méthodologique accéléré, et s’est affirmée comme un cadre de référence efficace pour la modélisation stochastique, l’inférence statistique et la sélection de modèle, la prévision probabiliste et l’aide à la décision en avenir incertain. Le raisonnement bayésien s’impose aujourd’hui dans de nombreux domaines des sciences biologiques et de l’environnement, du biomédical ou encore de l’économie. Cet outil de modélisation doit d’abord son succès actuel au fait qu’il est adapté pour intégrer des connaissances et des données de sources variées dans des modèles complexes, pour prendre en compte les multiples sources d’incertitude et pour quantifier les risques. En second lieu, l’essor des moyens de calculs accompagnés d’un constant effort de mise à disposition des nombreux outils de simulation Monte Carlo issus des recherches avancées en théorie des probabilités a également contribué à l’implémentation pratique des techniques bayésiennes. Enfin, le raisonnement bayésien se prête bien à la modélisation graphique, une mise à plat visuelle et conviviale de la structure interne du modèle probabiliste qui facilite le dialogue entre analystes et apporteurs de cas. En particulier, les modèles hiérarchiques, appelés également modèles à variables cachées, sont conçus comme un assemblage de petits modèles cimenté par des distributions conditionnelles. Chaque couche fonctionnelle modélise un sous-phénomène, observable ou non, du modèle final que l’on souhaite élaborer. Cette approche permet d’introduire des connaissances sur le fonctionnement des systèmes que l’on souhaite étudier et de traiter des observations à différentes échelles.
Cette formation à l’intention des étudiants du M2 EBE se propose d’introduire ce cadre méthodologique actuel et de l’illustrer sur l’exemple de la modélisation de données écologiques. Elle vise ainsi à procurer une vision éco-systémique quantitative, utile dans le cadre d’une approche de précaution, et opérationnelle pour de nombreuses applications dans le domaine des ressources renouvelables.

Objectifs :

Le cours introduit la modélisation hiérarchique bayésienne, en s’appuyant largement sur le contexte de l’écologie et la gestion des ressources naturelles, en particulier à partir d’exemples halieuthiques. Mais la composante méthodologique du cours sera transposable à d’autres domaines d’application. Le cours poursuit trois objectifs :
a) Présenter les fondements mathématiques de la modélisation probabiliste hiérarchique et de l’inférence statistique bayésienne ;
b) Montrer l’intérêt du cadre bayésien pour répondre à des questions actuelles de modélisation : i) construire des modèles en intégrant des processus biologiques complexes et de multiples sources de données ; ii) intégrer explicitement les différentes composantes de l’incertitude provenant des modèles et des données ; iii) prendre en compte les incertitudes dans les diagnostics et les prédictions et quantifier les risques associés à différents scenarii ;
c) Permettre aux étudiants d’acquérir une autonomie en mettant en pratique les acquis via le traitement d’exemples concrets. Sur des cas environnementaux, ils seront en particulier initiés au logiciel OpenBugs qui propose une implémentation commode et une mise en œuvre automatique des algorithmes Monte Carlo par Chaînes de Markov (MCMC).

Plan des enseignements :

D’une durée de 4.5 jours (environ 27 heures), la formation s’appuie sur les deux formes pédagogiques complémentaires alternant cours et travaux pratiques. Cinq interventions de type cours/conférences d’une demi journée porteront sur i) l’acquisition d’une compétence technique en modélisation bayésienne, assortie de la compréhension du principe des outils d’inférence avancée, fondés sur les méthodes de simulation stochastique ; ii) la présentation des applications en matière de gestion (expertise, diagnostics, analyses de risque) des ressources naturelles. Cinq séances d’une demi-journée seront consacrées à des travaux dirigés permettant aux étudiants de mettre en pratique les acquis sur des exemples concrets (manipulation de logiciels spécifique de calcul bayésien). La présence à plein temps d’au moins deux intervenants est nécessaire pour assurer un bon encadrement de ces travaux.

Intervenants :

- Eric Parent (AgroParisTech)
- Marie-Pierre Etienne (MC AgroParisTech)
- Pierre Barbillon (MC AgroParisTech)

| Plan du site