La pollution sonore a un impact significatif sur la qualité de vie. Au bureau, l'exposition au bruit peut créer un stress qui entraîne une diminution de la concentration, provoque des réactions d'agacement et des changements de comportement social. Pour se protéger de l'exposition au bruit, il est aujourd'hui possible de se procurer des écouteurs réalisant un traitement antibruit très performant. Bien que ces techniques aient atteint un haut niveau de performance, il reste souvent des bruits résiduels qui peuvent être des sources importantes de distraction et de gêne. Nous proposons d'étudier deux approches de réalité augmentée, principalement orientées sur les perturbations dans les bureaux ouverts. Dans ce projet, nous ciblons des niveaux de source sonore supplémentaires inférieurs ou égaux à celui de la source de bruit.
La première approche consiste à dissimuler la présence d'une source désagréable en ajoutant des indices spectro-temporels qui la transformeront en une source plus agréable. Des techniques d'apprentissage automatique adversaires seront envisagées pour apprendre les correspondances entre le bruit et les sons agréables et pour entraîner un synthétiseur audio profond capable de générer un son de dissimulation efficace d'intensité modérée.
La deuxième approche consiste à résoudre un problème courant rencontré dans les bureaux ouverts, où la capacité à se concentrer sur la tâche à accomplir est rendue plus difficile lorsque des personnes parlent à proximité. Nous proposons de réduire l'intelligibilité de la parole proche par l'ajout de sources sonores dont les propriétés spectro-temporelles sont spécifiquement conçues ou synthétisées avec un modèle génératif pour dissimuler des aspects importants de la parole proche.
Les résultats attendus du projet sont : 1) des avancées dans le domaine récent de la synthèse audio et vocale neurale profonde et 2) des applications innovantes pour l'ingénierie de l'atténuation du bruit dans notre vie quotidienne.
Détails du projet







