Traitement de données magnéto-telluriques : identification des sources de bruit et de signal
Stage 6 mois, second semestre 2024-2025
Laboratoires de rattachement : LISTIC et ISTerre
Encadrants : Eric BENOIT (LISTIC), Svetlana BYRDINA et Jean-Luc GOT (ISTerre)
Contacts : Eric.Benoit univ-smb.fr, Svetlana.Byrdina univ-smb.fr, Jean-Luc.Got univ-smb.fr
Lieu : Annecy (France)
Niveau de Formation : M2 ou 3ème année école ; connaissances en physique et traitement du signal
Mots-clés : Magnéto-tellurique, traitement du signal, Machine-Learning
L’analyse de données magnéto-telluriques (variations du champ électrique et du champ
magnétique) permet de représenter la distribution des résistivités électriques dans la terre jusqu’à une profondeur qui croit avec la période, la résistivité et le rapport signal sur bruit. Cette analyse est particulièrement adaptée à la recherche de fluides conducteurs (résistivité 10 Ohm.m, par exemple) dans des roches (résistivité 1000 Ohm.m) ; elle est puissante et très utilisée pour la recherche de fluides ionisés profonds et la mise en évidence de structures dans les zones de subduction, les volcans et pour la géothermie. Son utilisation est néanmoins contrariée par l’augmentation des perturbations électromagnétiques (« bruit ») d’origine anthropique, notamment dans les zones les plus urbanisées, et suite au développement des moyens de télécommunication modernes. Pour obtenir les meilleurs résultats il faut donc utiliser des méthodes de traitement du signal adaptées et performantes. Pour cela, il est utile de caractériser correctement le bruit et d’en
identifier les sources. Nous désirons tester la conjecture suivant laquelle ces sources de bruit sont récurrentes et peuvent être identifiées puis extraites du signal mesuré.
L’objectif de ce stage est de tester différentes approches d’analyse de données basées sur
l’utilisation d’algorithmes de machine learning de type auto-encodeur pour l’identification et
l’extraction de ces contributions du bruit électro-magnétique. L’idée est d’entraîner un autoencodeur sur des signaux principalement constitués de bruit d’origine anthropique pour qu’il en réalise une classification.
Une première approche basée sur la transformée en ondelettes utilisée en pré-traitement sera testée et comparée à une approche plus directe sans pré-traitement pour vérifier la pertinence de préparer les données. Ensuite, l’étude se basera sur les méthodes existantes de traitement des données magnéto-telluriques pour affiner la structure de l’auto-encodeur et de son espace latent (voir les liens ci-dessous). L’étude pourra être orientée vers l’utilisation d’auto-encodeurs variationnels qui semblent prometteurs à ce stade précoce de l’étude. En fin, l’étude sera validée par une tentative d’extraction du signal pertinent.
Le stagiaire disposera d’un accès à la ferme de calcul du LISTIC et d’un environnement dynamique de chercheurs et d’étudiants dans le domaine du traitement de l’information (LISTIC) et des sciences physiques de la terre (ISTerre).
Liens recommandés :
https://www.ibm.com/fr-fr/topics/autoencoder
https://intelligence-artificielle.com/auto-encodeur-guide-complet/
Compétences requises :
Connaissances solides dans le domaine de la physique, appétence pour le traitement du signal et de l’information, le machine-learning ; curiosité, autonomie, rigueur.
Mis à jour le 2 octobre 2024