Aller au contenu

Smart-Biodiv

Le projet Smart-Biodiv : Intelligence Artificielle pour la Recherche en Bio-Diversité

Présentation générale du projet

Les environnements marins subissent des changements rapides et la surveillance de l’état de leur écosystème devient critique. Un tel suivi nécessite la collecte de données, leur traitement et l’extraction d’indicateurs résumant l’état de l’environnement. Cependant, les données en sciences environnementales sont souvent éparses et déséquilibrées, ce qui constitue un défi pour les algorithmes d’IA.

Cela conduit aux deux directions suivies dans la proposition SMART-BIODIV :

  1. Exploiter la puissance des algorithmes d’apprentissage automatique pour compléter et traiter les données éparses et déséquilibrées que nous rencontrons souvent dans les sciences environnementales ;
  2. Concevoir des indicateurs pour qualifier l’état écologique des environnements considérés. Nous exploiterons également les grandes bases de données d’images collectées par les partenaires sur le plancton marin et les mettrons à la disposition des participants au défi.

Les grands objectifs du projet

  • Concevoir des méthodes d’IA optimisées pour la recherche sur la biodiversité :

Nous nous concentrerons ici sur le développement de méthodes d’apprentissage supervisé robustes appliquées à :

  1. Des données quantitatives (occurrences, paramètres physico-chimiques, etc.) utilisées pour des tâches de régression ou de classification ;
  2. Des données spatio-temporelles (séries temporelles, échantillons géolocalisés) utilisées pour modéliser la dynamique, interpoler et/ou extrapoler des paramètres dans l’espace et le temps sur la base de paramètres de
    forçage ;
  3. Des données d’images (par exemple de plancton individuel) pour détecter et identifier des taxons ou des traits et soutenir le suivi des occurrences. Dans ces trois variantes d’IA, les défis liés à l’explicabilité, à de la quantité limitée d’annotations et à l’apprentissage incrémental seront abordés. En outre, un accent important sera mis sur l’utilisation d’étiquettes incertaines et d’ensembles de données fortement déséquilibrés, qui sont typiques des ensembles de données utilisés en sciences environnementales.
  • Conception de modèles et d’indicateurs prédictifs pour la recherche sur la biodiversité :

Notre expertise combinée sur les écosystèmes marins et de la bioindication, en particulier dans les environnements d’eau douce, sera mise à profit pour définir de nouveaux indicateurs adaptés aux écosystèmes marins, en utilisant non seulement les occurrences taxonomiques mais aussi des approches basées sur les traits. Bien qu’il existe de nombreuses façons de récupérer des traits fonctionnels, cet aspect bénéficiera spécifiquement des méthodes de traitement d’images issues du point précédent.

  • Conception de modèles d’IA hybrides :

La recherche sur la biodiversité combine de nombreux défis sub-symboliques, qui seront principalement abordés dans le cadre du premier point de ces objectifs, avec des a priori symboliques exprimant les réseaux de relations trophiques, de compétitions, de cooccurrences, etc. entre les taxons exposés aux pressions environnementales. En unissant les forces entre la recherche en biodiversité et la recherche en IA, nous pourrons exprimer, modéliser et représenter formellement ces réseaux de relations, puis nous appuyer sur des méthodes orientées données pour identifier les paramètres de ces modèles, et enfin utiliser ces connaissances combinées comme modèles d’assemblage prédictifs.

Le consortium

IRL

L’IRL2958 GT-CNRS est un Laboratoire Mixte International fondé en 2006 par le Centre National de la Recherche Scientifique (CNRS) et le Georgia Institute of Technology (Georgia Tech) basé à Atlanta, USA. Ce laboratoire est la première et unique entité IRL implantée en France. Il est basé sur le campus de Georgia Tech-Lorraine, le campus européen de Georgia Tech à Metz. Les activités sur le campus d’Atlanta ont débuté en 2010. L’IRL2958 implique également des laboratoires associés, parmi lesquels : le Laboratoire des Propriétés Optique des Matériaux (LMOPS), co-exploité par CentraleSupélec et l’Université de Lorraine, le Laboratoire Microstructures et Mécanique des Matériaux (LEM3), co-exploité par les Arts & Métiers Paris Tech et l’Université de Lorraine, et le Laboratoire MEMS, Photonique, Métrologie et Mécanique (FEMTO-ST), associé à l’Université de Franche-Comté.

L’équipe du DreamLab, spécialisée dans la robotique des milieux naturels et la perception computationnelle appliquée notamment aux sciences de l’environnement, utilisera son expertise dans les technologies d’IA (Intelligence Artificielle) pour développer, adapter et évaluer des méthodes d’IA aux enjeux spécifiques du suivi de la biodiversité. Ici, le défi consistera à extraire des informations utiles des grands ensembles de données hétérogènes couvrant diverses composantes de l’écosystème. L’équipe sera responsable du WP2 (IA pour la biodiversité) et du WP5 (Gestion de projet, activités à l’échelle du défi et sensibilisation). L’équipe sera également impliquée dans tous les WP.

LORIA

Le Loria, Laboratoire lorrain de Recherche en Informatique et ses Applications est une Unité Mixte de Recherche (UMR 7503), commune à plusieurs établissements : le CNRS, l’Université de Lorraine et Inria.

Le Loria a pour mission la recherche fondamentale et appliquée en sciences informatiques et ce, depuis sa création, en 1997. Le Loria est membre de la Fédération Charles Hermite qui regroupe les trois principaux laboratoires de recherche en mathématiques et STIC (sciences et technologies de l’information et de la communication) de Lorraine. Le laboratoire fait partie du pôle scientifique AM2I (Automatique, Mathématiques, Informatique et leurs interactions) de l’Université de Lorraine. Les travaux scientifiques sont menés au sein de 29 équipes organisées en 5 départements, dont 15 sont communes avec Inria, représentant un total de plus de 430 personnes. Sept axes transverses structurent le laboratoire autour de grandes thématiques telles que la sécurité informatique, la santé, l’E-éducation, les systèmes cyber-physiques, le traitement automatique des langues et l’intelligence artificielle, l’énergie et l’usine du futur. Le Loria est un des plus grands laboratoires de la région lorraine.

Le Loria et CentraleSupélec apportent leur expertise en informatique et plus particulièrement en intelligence artificielle appliquées sur la thématique particulière de la biodiversité. L’équipe impliquée dirigera le WP3 sur l’IA hybride et participera également aux autres WP. Le challenge du WP3 va consister à incorporer des connaissances métiers sous forme de graphe de relation dans les modèles prédictifs de biodiversité.

LIEC

Le Laboratoire Interdisciplinaire des Environnements Continentaux (LIEC), est une unité mixte de recherche (UMR 7360) entre le CNRS et l’Université de Lorraine composée d’environ 140 membres répartis sur 3 sites géographiques à Metz et Nancy.

Le LIEC mène des recherches en sciences de l’environnement, avec comme objectif premier de comprendre le fonctionnement des écosystèmes continentaux fortement perturbés par l’activité humaine, avec pour finalité leur réhabilitation. Au sein de l’équipe EcoSe (écologie du stress), les chercheurs du LIEC impliqués dans Smart-Biodiv (M Laviale, P Usseglio-Polatera) apporteront leur expertise en bioindication des écosystèmes aquatiques, reconnue internationalement à travers le développement d’outils opérationnels basés sur les traits, déjà démontrés pour différents compartiments biologiques des écosystèmes d’eau douce (bactéries, diatomées, macroinvertébrés, poissons).

Dans Smart-Biodiv, le LIEC est responsable du WP4 (Ecosystem models and bioindicators). En lien avec les WPs 2 (AI for biodiversity) et 3 (hybrid AI), les objectifs sont de produire des indicateurs synthétiques mais également des modèles fonctionnels permettant de prédire l’état écologique des milieux marins.

LOV

L’UMR 7093, Laboratoire d’Océanographie de Villefranche sur Mer (LOV) est une unité mixte de recherche de Sorbonne Université (SU) et du Centre National de la Recherche Scientifique (CNRS), qui conduit des recherches aux interfaces entre océanographie physique et biologique.

À l’aide de capteurs sophistiqués conçus par les équipes du laboratoire et en combinant les données récoltées à des observations satellitaires, le LOV effectue un suivi de grands cycles biologiques et biogéochimiques de l’océan mondial. Il est aussi spécialisé dans le suivi des écosystèmes planctoniques, dans la rade de Villefranche comme dans de nombreux océans du globe. Le LOV est impliqué dans de nombreuses campagnes océanographiques hauturières et côtières et son expertise dans la gestion et la modélisation de données marines est reconnue.

Le LOV est responsable du WP1, les chercheurs du LOV impliqués dans Smart-Biodiv (F. Lombard, J.O. Irisson) de l’équipe Complex,  apporteront leur expertise sur l’analyse de grands jeux d’observations couplant environnement et écosystème planctonique à l’aide de techniques d’imagerie quantitative. Les jeux de données proposés recouvrent à la fois les écosystèmes méditerranéens via la série chronologique du point B de Villefranche (échantillonnée depuis les années 60) et les écosystèmes insulaires de l’Océan Pacifique via les données collectées lors de l’expédition Tara Pacifique.

LOCEAN

L’UMR 7159, Laboratoire d’Océanographie et du Climat : Expérimentations et Approches Numériques (LOCEAN) est une unité mixte de recherche en partenariat avec Sorbonne Université (SU), le Centre National de la Recherche Scientifique (CNRS), l’Institut de Recherche pour le Développement (IRD) et le Muséum National d’Histoire Naturelle (MNHN). Il regroupe environ 185 personnes, dont 121 permanents. Le LOCEAN conduit des études sur les processus physiques et biogéochimiques de l’océan et leur rôle dans le climat en interaction avec les écosystèmes marins. Ses équipes, largement reconnues au niveau international, abordent une large gamme d’échelles de temps et d’espace pour une meilleure compréhension de la dynamique et des variations de l’océan au sein du système climatique ainsi que son évolution présente, passée et future. Elles contribuent aussi au développement de méthodes d’analyses, de modélisation et d’observation, ainsi qu’à l’observation systématique de l’océan, in situ ou depuis l’espace.

Au sein du projet SmartBiodiv, l’équipe PROTEO est impliquée dans le WP1 – Intégration des données (responsable du WP : SD Ayata). Au sein de ce WP, et en collaboration avec le LOV, le LOCEAN contribuera à la co-supervision d’un assistant ingénieur basé au LOV. Le LOCEAN contribuera aussi au WP4 sur les modèles d’écosystèmes marins et le développement de bioindicateurs en collaboration avec le LIEC et le LORIA. Enfin, le LOCEAN contribuera au WP5 via la co-organisation d’école d’été, de workshop, et de hackathon.

Recevez toutes nos actualités

Co-Financé par

Avec un don de

organisé par