Nicolas Obin

I am Lecturer at Sorbonne University and a researcher in the Sound Analysis and Synthesis team at the Sound and Music Sciences and Technologies laboratory (Ircam, CNRS, Sorbonne University). My background is mainly in mathematics, computer science, and physics and I am a member of the 2005-2006 class of the Master 2 ATIAM (Acoustics, Signal Processing and Computer Science Applied to Music) at the Université Pierre et Marie Curie; and secondarily in musicology, with a Master 2 in Arts, Philosophy and Aesthetics from the Université Vincennes Saint-Denis in 2006 under the supervision of Ivanka Stoïanova. I have a doctoral thesis in computer science and telecommunications entitled: ‘MeLos:analysisandmodellingofspeechprosodyandspeakingstyle’ (2011) under the supervision of Xavier Rodet, for which I was awarded the prize for the best doctoral thesis by the Fondation Des Treilles in 2011. In 2023, I defended my Habilitation à Diriger des Recherches (HDR) entitled: ‘From signal modelling to representation learning: structured modelling of speech signals’.

At the interface of the bio-sensible world and formal theories of information, communication, and cognition, I have developed through time a keen interest in modelling behaviour and interactions between humans, animals and robots. My research activities focus mainly on generative modelling of complex human productions such as speech, singing and music with various applications in sound and multimodal generation, cyber-physical human and musical systems, and augmented creation. I am a researcher committed to the technological, creative and ethical implications of my research, particularly the impact of artificial intelligence on artistic creation, the creative professions and the creative and cultural industries. I am also involved in the issues of inclusion and digital sovereignty in order to promote the presence and diversity of dialects, languages and cultures in the digital world.

I am responsible for the Master's degree in Intelligent Systems Engineering (ISI), in which I teach digital audio signal processing, machine learning and deep neural networks, and I am also responsible for the ‘Deep Learning par la Pratique’ professional training course offered at Sorbonne University. I am the founder of DeepVoice, Paris (since 2020), the Paris event on speech technologies and artificial intelligence, SophIA (2021): Sorbonne University's student association for Artificial Intelligence in collaboration with the Sorbonne Centre for Artificial Intelligence (SCAI), and Fast-Forward (2022) the informal and experimental meetings of science and technology and sound design in cinema and the moving image.

As part of my artistic commitment at Ircam, I am very involved in promoting digital science and technology for the arts, culture and heritage with numerous collaborations with renowned artists such as Eric Rohmer, Philippe Parreno, Roman Polansky, Leos Carax, George Aperghis and Alexander Schubert.

My detailed CV is available here

CV nicolas obin

Email : Nicolas.Obin (at) ircam.fr


L'IA au service du sonore ? UNESCO (2024)

Soirée "L'IA au service du sonore?" 18 janvier 2024 Organisée dans le cadre de la 21ème édition de la semaine du son

Nicolas Obin, conférence de presse, UNESCO


Soutenance d'habilitation à diriger des recherches

Nicolas Obin soutient son Habilitation à Diriger des Recherches (HDR) le 12 septembre 2023 à 14h - "De la représentation du signal à l’apprentissage de représentations : modélisation structurée de signaux de parole »

Composition du jury

• M. Thomas HUEBER, Directeur de recherche CNRS, GIPSA lab, Rapporteur
• M. Emmanuel VINCENT, Directeur de recherche INRIA, MultiSpeech, Rapporteur
• M. Bjorn SCHULLER, Professeur, Imperial College London, Rapporteur
• M. Gérard BIAU, Professeur, Sorbonne Université, Examinateur
• M. Jean-François BONASTRE, Directeur de Recherche INRIA, Défense et Sécurité, Examinateur
• Mme Catherine PELACHAUD, Directrice de recherche CNRS, ISIR, Examinatrice
• M. Axel ROEBEL, Directeur de recherche, IRCAM, Examinateur
• Mme Isabel TRANCOSO, Professeure, INESC - Université de Lisbonne, Examinatrice
• Mr Nicolas BECKER, Designer sonore et artiste, Membre Invité

Le texte de mon HDR est librement accessible sur HAL.

Deep Voice, Paris

Deep Voice, Paris est l’événement parisien dédié à la voix et à l’intelligence artificielle dont l’objectif est de réunir expertises scientifique et technique, innovation et entrepreneuriat. Des ateliers techniques - “hands-on” - seront proposés aux participants pour développer leurs compétences dans les domaines du traitement de la parole et du langage naturel. Des moments de rencontres et de réseautage en fin de journée faciliteront les rencontres et l’échange entre les participants en toute décontraction. Deep Voice est un événement co-organisé par l’Ircam, Sorbonne Université, et SCAI dans le cadre du festival ManiFeste 2022.


L'Hôtel du Temps (2022)

Recréation de la voix de Dalida avec de l'intelligence artificielle pour la nouvelle émission de Thierry Ardisson "L'Hôtel du Temps"

Deepfake : le vrai du faux d'une technologie révolutionnaire

Le Meilleur des Mondes, France Culture, 13 Mai 2022 Animé par François Saltiel


Vox ex-machina

Présentation au Collège de France, 6 juin 2017


Assistants, robots affectifs et réalité virtuelle | Deep Voice, Paris 2021

Comment la simulation des émotions va-t-elle modifier notre rapport affectif aux machines et notre immersion dans un monde social artificiel ? Une table-ronde organisée par le Sorbonne Center for Artificial Intelligence (SCAI) et l'Ircam, animée par Nicolas Obin, chercheur à l'Ircam.


On a volé la voix d'André Dussolier

Le Monde, 7 juillet 2014


Artistic Production

[ 2022 ] Anima, par l'artiste Alexander Schubert, Festival Manifeste, Centre-Pompidou.

[ 2021 ] Annette, film du réalisateur Léos Carax, avec le sound designer Erwan Kerzanet

[ 2019 ]Lullaby experience, par le compositeur Pascal Dusapin, Frankfurter Positionen festival (Frankfurt) et Théâtre 104 (Paris).


[ 2018 ]Les guerriers de l'ombre, documentaire réalisé par Frédéric Schoendoerffer, Canal+. Anonymisation réaliste de voix d'agents secrets.

[ 2014-2015 ]Pourquoi j'ai pas mangé mon père, film de Jamel Debbouze. Recréation de la voix de Louis de Funès par la technologie de conversion d'identité de la voix

[ 2014-2015 ]Juger Pétain,  films documentaires de Richard Saada, Planète, France 5. Recréation de la voix du maréchal Pétain et de protagonistes de son procès par la technologie de conversion d'identité de la voix

[ 2013 ]Aliados, opéra composé par Sebastian Rivas, Ircam Manifeste festival.

[ 2012-2013 ]Marilyn,  film de Philippe Parreno, Fondation Beyeler (2012) et Palais de Tokyo (2013) avec le sound designer Nicolas Becker. Recréation de la voix de Marilyn Monroe par la technologie de conversion d'identité de la voix

[ 2011 ]Luna Park, théâtre musical composé par Georges Aperghis, festival Agora (Paris).

[ 2010 ]Escort Girl, première partie du cycle de documentaires "L'Europe judiciaire" réalisé par Olivier Ballande, Maha Productions, France Télévision. Anonymisation réaliste de voix de protagonistes impliqués dans des enquêtes judiciaires.

[ 2009 ]Hypermusic Prologue, opéra du compositeur Hector Parra, festival Agora (Paris).


Communication

Here is a selection of my main public interventions

Conferences

La manipulation dans le discours politique, Gouverner, Les Napoléons, Val d'Isère, 14 janvier 2022

Deep fakes audio : entre manipulation et créativité, Voice Tech, Paris, 23-24 Novembre 2020

Trucages, deepfake, clonage vocal : en 2020, ne croyez plus vos yeux et vos oreilles. Futurapolis, Toulouse, 16 novembre 2019. Avec Vincent Nozick, maître de conférences à l’Université Paris-Est Marne la Vallée, et Guerric Poncet, journaliste au Point

Voix artificielle et sound design : concepts, pratiques, enjeux (avec N. Misdariis, de l'équipe Perception et Design Sonore, Ircam), HyperVoix : enjeux de conception des interfaces conversationnelles, Journée d'étude organisée par la Fing, Le Square, Paris, 15 avril 2019.

AI and creativity: can AI be creative?, Changing IP in Changing Europe, Trilateral Seminar of the French, German and Polish Groups of AIPPI, Paris, France, 05 avril 2019.

La voix à l’ère du numérique et de l'IA, CNIL, Paris, France, 15 février 2019

La voix et l'IA, Parcours Innovateur ignorant, Sciences Po, Paris, France, 19 octobre 2018.

Marilyn: histoire de la recréation de la voix d'une icône, Ecole Normale Supérieure, Paris-Saclay, France, 9 octobre 2018

Les voix du numérique pour le design sonore et la création artistique, Festival Vino Voce, Saint-Emilion, France, 8-10 septembre 2017.

Vox ex-machina. La voix et ses doubles numériques, Collège de France, Paris, France, 6 juin 2017.

Broadcast medias

Les prouesses des assistants vocaux. Dossier Intelligence Artificielle. Ca m'intéresse, février 2019.

Comment fabrique-t-on une voix de synthèse ? La Croix, 22 Janvier 2019.

La voix sacrée, dossier voix et IA, Télérama, 16 Janvier 2019.

Les chanteurs disparus ressuscités par la high-tech, L'express, 21 Décembre 2018.

Des voix de synthèse presque humaines, Pour la Science, Décembre 2016, numéro 470, p. 54-62.

TV and documentaries

Deep fake : le vrai du faux d'une technologie révolutionnaire, le meilleur des mondes, France Culture, 13 mai 2022

A l'Ircam, la salle la plus silencieuse au monde dévoile ses secrets, journal télévisé, 20h,  TF1, 9 septembre 2016.

Donner de la Voix, FutureMag, Arte, 5 décembre 2015.

Petite Histoire de la Synthèse Vocale, France Culture, 12 Août 2014.

On a Volé la Voix d'André Dussolier, Le Monde, 7 Juillet 2014.