Maxime Mantovani : Rencontre avec Philippe Esling 2/5

Le blog des résidences artistiques

Contenu :
Dans le cadre de sa résidence en recherche artistique, <a href="https://maximemantovani.com/">Maxime Mantovani </a>développe une interface de contrôle organique d’un moteur de synthèse sonore par des modèles d’intelligence artificielle. Une proposition qui tombait à pic, nous dit <a href="https://esling.github.io/">Philippe Esling</a>, responsable de l’équipe de recherche qui entoure le compositeur. <img src="https://www.ircam.fr/media/uploads/magazine/2022/Article Mantovani 1/philippe-esling-720x435.jpg" style="margin-right: 10px; margin-left: 10px; float: right;" width="450" height="272" />« Quand la proposition de Maxime nous est parvenue, se rappelle le chercheur Philippe Esling, elle correspondait exactement à nos préoccupations scientifiques du moment : mettre au point un contrôle compréhensible de l’intelligence artificielle. Aujourd’hui, soit la machine fonctionne toute seule, quasi en autonomie (même si elle ne fait que ce qu’on lui demande de faire), soit elle génère une forme d’onde qui suit un signal source. Un geste organologique associé à l’intelligence artificielle nous manque donc cruellement. » L’un des principaux enjeux est donc de générer du son, en temps réel. Constituée, outre Philippe Esling, du doctorant <a href="https://github.com/caillonantoine">Antoine Caillon</a> et du post-doc Axel Chemla-Romeu-Santos, l’équipe s’est appuyée sur des modèles qu’elle avait déjà développés, notamment le modèle de transfert de timbre : à partir d’un signal sonore source, la machine génère un son qui suit le même profil (ou du moins certains paramètres choisis de ce profil), mais dans un timbre autre (par exemple : à l’entrée, une mélodie de violon, à la sortie, une voix qui chante), en suivant exactement le même profil, et même les contours expressifs de la ligne musicale, en les adaptant au timbre de destination. Ensuite, au lieu d’un signal sonore, la machine devra être capable d’interpréter les informations que lui impulse le musicien, via l’interface de contrôle développée par Maxime Mantovani et Emmanuel Fléty. <img src="/media/uploads/magazine/2022/Article Mantovani 1/mantovani.jpg" style="float: left; margin-right: 20px; margin-bottom: 10px;" width="350" /> « L’intégration de Maxime à l’équipe et ses retours sur les différents modèles qu’il teste, nous permettent d’éprouver ces modèles et leurs qualités sonores, de mieux en déterminer les limites d’utilisabilités, ainsi que la latence (le temps nécessaire à la machine pour générer le nouveau discours en fonction de l’entrée, l’idée étant d’approcher le plus possible l’instantanéité), et donc d’en mettre au point de nouveaux, bien plus rapidement qu’à l’accoutumée, résume Philippe Esling. L’apport de Maxime a été unique et, sans son travail remarquable, il aurait été impossible d’obtenir des modèles de génération d’une qualité musicale telle que l’on a obtenue aujourd’hui. » Photo 1 : Philippe Esling Photo 2 : Maxime Mantovani dans les studios de l'ircam

Dans le cadre de sa résidence en recherche artistique, Maxime Mantovani développe une interface de contrôle organique d’un moteur de synthèse sonore par des modèles d’intelligence artificielle. Une proposition qui tombait à pic, nous dit Philippe Esling, responsable de l’équipe de recherche qui entoure le compositeur.

« Quand la proposition de Maxime nous est parvenue, se rappelle le chercheur Philippe Esling, elle correspondait exactement à nos préoccupations scientifiques du moment : mettre au point un contrôle compréhensible de l’intelligence artificielle. Aujourd’hui, soit la machine fonctionne toute seule, quasi en autonomie (même si elle ne fait que ce qu’on lui demande de faire), soit elle génère une forme d’onde qui suit un signal source. Un geste organologique associé à l’intelligence artificielle nous manque donc cruellement. »

L’un des principaux enjeux est donc de générer du son, en temps réel.

Constituée, outre Philippe Esling, du doctorant Antoine Caillon et du post-doc Axel Chemla-Romeu-Santos, l’équipe s’est appuyée sur des modèles qu’elle avait déjà développés, notamment le modèle de transfert de timbre : à partir d’un signal sonore source, la machine génère un son qui suit le même profil (ou du moins certains paramètres choisis de ce profil), mais dans un timbre autre (par exemple : à l’entrée, une mélodie de violon, à la sortie, une voix qui chante), en suivant exactement le même profil, et même les contours expressifs de la ligne musicale, en les adaptant au timbre de destination. Ensuite, au lieu d’un signal sonore, la machine devra être capable d’interpréter les informations que lui impulse le musicien, via l’interface de contrôle développée par Maxime Mantovani et Emmanuel Fléty.

« L’intégration de Maxime à l’équipe et ses retours sur les différents modèles qu’il teste, nous permettent d’éprouver ces modèles et leurs qualités sonores, de mieux en déterminer les limites d’utilisabilités, ainsi que la latence (le temps nécessaire à la machine pour générer le nouveau discours en fonction de l’entrée, l’idée étant d’approcher le plus possible l’instantanéité), et donc d’en mettre au point de nouveaux, bien plus rapidement qu’à l’accoutumée, résume Philippe Esling. L’apport de Maxime a été unique et, sans son travail remarquable, il aurait été impossible d’obtenir des modèles de génération d’une qualité musicale telle que l’on a obtenue aujourd’hui. »

Photo 1 : Philippe Esling
Photo 2 : Maxime Mantovani dans les studios de l'ircam

Éditer

Tous les épisodes

Actualité

Création

Maxime Mantovani : Rencontre avec Philippe Esling 2/5

Tous les épisodes

Maxime Mantovani : Associer le geste organologique à l’IA 1/5

Maxime Mantovani : Une impro 3/5

Maxime Mantovani : Showcase 5/5

Maxime Mantovani : Interface 4/5