Recherche
Actualité

Soutenance de thèse d'Hélène Bahu

« Localisation auditive en contexte de synthèse binaurale non-individuelle »

Thèse de doctorat, réalisée au sein de l'équipe Espaces acoustiques et cognitifs (STMS - CNRS/Ircam/UPMC).

Mercredi 14 décembre 2016 à 14h30
Ircam, Salle Stravinsky

Résumé

Avec la généralisation de l’écoute au casque en mobilité, la technique binaurale apparaît à ce jour comme une solution privilégiée pour démocratiser l’accès à des contenus sonores spatialisés. Cette thèse s’inscrit dans le cadre du projet BiLi (Binaural Listening), visant le déploiement de solutions grand public pour la diffusion de contenus sonores binauraux.

La synthèse binaurale repose sur l’utilisation des filtres appelés HRTFs (Head Related Transfer Functions) qui confèrent à l’auditeur l’ensemble des indices de localisation. Ces indices possèdent une composante individuelle forte et l’utilisation de filtres non-individuels à la synthèse se traduit par des défauts de localisation ou de timbre à la restitution.

Afin d’évaluer le rendu spatial des sources sonores virtuelles, des tests de localisation auditive sont généralement réalisés. Cependant, la méthode utilisée pour le report des directions perçues introduit une part d’erreur dans les jugements. Une première contribution de la thèse concerne la comparaison de différentes méthodes de report de la localisation auditive, et la préconisation d’une méthode mieux adaptée au contexte de l’écoute binaurale au casque.

L’acquisition individuelle des HRTFs requiert un dispositif de mesure complexe installé en chambre anéchoïque et par conséquent incompatible avec un usage grand public. La recherche de méthodes d’individualisation vise à offrir des solutions alternatives à cette mesure individuelle complexe. Ces méthodes reposent généralement sur l’exploitation de bases de données de HRTFs. A cet effet, une nouvelle base de données de HRTFs à haute résolution spatiale a été constituée.

Parmi les méthodes d’individualisation, nombre d’entre elles font appel à un calcul de similarité entre HRTFs et s’appuient ainsi sur la définition d’une métrique opérant notamment sur la représentation spectrale des HRTFs. La définition d’une métrique forme également la base des modèles de prédiction de la localisation auditive. Le cœur du travail de thèse a été consacré au développement d’un modèle visant à prédire les directions perçues de sources virtuelles synthétisées avec des HRTFs non-individuelles. Les paramètres du modèle, dont la métrique spectrale, ont été analysés et optimisés, de sorte à s’approcher au mieux des observations effectuées dans un test de localisation auditive. L’objectif ultime de ce travail est d’évaluer dans quelle mesure ce modèle peut être utilisé afin de sélectionner automatiquement le jeu de HRTFs optimal pour un individu, à partir de l’observation de ces réponses dans un test de localisation de sources sonores virtuelles synthétisées avec des HRTFs non-individuelles.

Jury

Étienne Parizet, Rapporteur - INSA, Lyon
Mathieu Paquier, Rapporteur - Université de Bretagne Occidentale
Bruno Gas, Examinateur - UPMC
Rozenn Nicol, Examinatrice - Orange Labs
Gérard Assayag, Directeur de thèse - STMS - CNRS/Ircam/UPMC
Olivier Warusfel, Encadrant de thèse - STMS - CNRS/Ircam/UPMC