ROUTE

Éditer

Contenu :
<p>Le programme proposé par ROUTE se concentre sur une problématique commune à deux domaines de recherche a priori distincts :</p> <ul> <li>l’analyse automatique d’une scène sonore, à partir d’un processus d’apprentissage de dictionnaire. En traitement du signal audio, on retrouve cet aspect dans plusieurs applications d’intérêt majeur : computational auditory scene analysis (CASA), indexation automatique, séparation de source, détection et localisation d’objets sonores, parmi d’autres ;</li> <li>l’audition artificielle, domaine d’étude récent en robotique, pour lequel l’analyse d’une scène sonore devient petit à petit un prérequis nécessaire à toute application moderne (par exemple, pour la surveillance des personnes âgées, ou l’étude de l’interaction homme/robot).</li> </ul> <p>L’objectif central du projet porte sur la conception et la mise en place d’une stratégie de détection et localisation de locuteur principal dans la scène sonore : une telle stratégie doit permettre à un robot d’identifier un signal vocal en présence de bruit, et localiser la position du locuteur principal (en cas de plusieurs locuteurs en simultanée). Le problème traité est lié étroitement au domaine très actuel du computational auditory scene analysis (CASA). En CASA, il s’agit de concevoir des systèmes automatiques avec une perception qui reproduit l’audition humaine, en considérant ses aspects physiques et psychoacoustiques. Ce projet se situe dans une perspective différente, bien que les outils de traitement audio considérés soient comparables (machine learning, séparation de source) : le côté audition est traité du point de vue du robot, et l’intérêt se concentre dans l’analyse de la scène audio en soi.</p>

Le programme proposé par ROUTE se concentre sur une problématique commune à deux domaines de recherche a priori distincts :

l’analyse automatique d’une scène sonore, à partir d’un processus d’apprentissage de dictionnaire. En traitement du signal audio, on retrouve cet aspect dans plusieurs applications d’intérêt majeur : computational auditory scene analysis (CASA), indexation automatique, séparation de source, détection et localisation d’objets sonores, parmi d’autres ;
l’audition artificielle, domaine d’étude récent en robotique, pour lequel l’analyse d’une scène sonore devient petit à petit un prérequis nécessaire à toute application moderne (par exemple, pour la surveillance des personnes âgées, ou l’étude de l’interaction homme/robot).

L’objectif central du projet porte sur la conception et la mise en place d’une stratégie de détection et localisation de locuteur principal dans la scène sonore : une telle stratégie doit permettre à un robot d’identifier un signal vocal en présence de bruit, et localiser la position du locuteur principal (en cas de plusieurs locuteurs en simultanée). Le problème traité est lié étroitement au domaine très actuel du computational auditory scene analysis (CASA). En CASA, il s’agit de concevoir des systèmes automatiques avec une perception qui reproduit l’audition humaine, en considérant ses aspects physiques et psychoacoustiques. Ce projet se situe dans une perspective différente, bien que les outils de traitement audio considérés soient comparables (machine learning, séparation de source) : le côté audition est traité du point de vue du robot, et l’intérêt se concentre dans l’analyse de la scène audio en soi.

Éditer

Détails du projet

Programme

Convergence de Sorbonne Universités

Type de programme

Appel à projet Emergence 2014

Début

1 septembre 2015

Fin

30 septembre 2016

Statut

Participants

Partenaires

Institut des systèmes intelligents et de robotique (ISIR)
Ircam

équipes (Ircam)

Ircam - Analyse et synthèse des sons