Gaël Richard

Spécialiste du traitement du signal audio au sein du LTCI, Gaël Richard est enseignant-chercheur à Télécom Paris depuis 2001 et directeur exécutif de Hi! Paris, un centre pluridisciplinaire consacré à l’intelligence artificielle et aux données.

Plus spécifiquement, ses travaux de recherche sont au cœur du numérique et dédiés à l’analyse, la transformation, la compréhension ou l’interprétation des signaux sonores (parole, musique, sons environnementaux,…) et dans une moindre mesure des signaux multimedia. En traitement de la parole, il travaille au développement de modèles d’analyse et de représentation des signaux, afin par exemple d’améliorer la qualité ou l’intelligibilité en milieux bruités.

 

Segmentation audio-visuelle de clips musicaux

Une part importante du travail de Gaël Richard est liée à la séparation de mélanges de sources sonores. En musique, l’objectif est ainsi de séparer chaque instrument de l’enregistrement musical polyphonique. Il a notamment développé plusieurs méthodes pour la séparation des signaux musicaux et audio reposant sur des principes de factorisations de matrices non-négatives et d’apprentissage automatique (machine learning).

Décomposition en atomes temps-fréquences d’un extrait musical polyphonique

 

Plus généralement, ses recherches s’inscrivent pleinement dans le domaine du Music Information Retrieval (MIR) qui se définit comme le domaine multidisciplinaire de l’extraction d’information à partir de la musique. L’un de ses buts est ainsi d’apprendre à l’ordinateur à « écouter » intelligemment le son, à en extraire des caractéristiques utiles et informatives. Les domaines d’application sont multiples : streaming, indexation et recommandations musicales, intelligence artificielle, spatialisation sonore, domotique, cinéma et tout ce qui touche aux applications de reconnaissance sonore.