Nicolas Obin

I am lecturer at Sorbonne University and a senior research scientist s in the Sound Analysis and Synthesis team at the Sound and Music Sciences and Technologies laboratory (Ircam, CNRS, Sorbonne University). My background is primarily in mathematics, computer science, and physics, including a Master internship at the CMNAT, University of Berkeley, Califronia under the supervision of Adrian Freed and David Wessel and graduate of the 2005-2006 Master 2 ATIAM (Acoustics, Signal Processing and Computer Science Applied to Music) at the Université Pierre et Marie Curie; secondarily in musicology, with a Master 2 in Arts, Philosophy and Aesthetics from the Université Vincennes Saint-Denis in 2006 under the supervision of Ivanka Stoïanova. I have a doctoral thesis in computer science and telecommunications entitled: ‘MeLos:analysisandmodellingofspeechprosodyandspeakingstyle’ (2011) under the supervision of Xavier Rodet, for which I was awarded the prize for the best doctoral thesis by the Fondation Des Treilles in 2011. In 2023, I defended my Habilitation à Diriger des Recherches (HDR) entitled: ‘From signal modelling to representation learning: structured modelling of speech signals’.

At the interface of the bio-sensible world and formal theories of information, communication, and cognition, I have developed through time a keen interest in modelling behaviour and interactions between humans, animals and robots. My research activities focus mainly on generative modelling of complex human productions such as speech, singing and music with various applications in sound and multimodal generation, cyber-physical human and musical systems, and augmented creation. I am a researcher committed to the technological, creative and ethical implications of my research, particularly the impact of artificial intelligence on artistic creation, the creative professions and the creative and cultural industries. I am also involved in the issues of inclusion and digital sovereignty in order to promote the presence and diversity of dialects, languages and cultures in the digital world.

I am responsible for the Master's degree in Intelligent Systems (SI), in which I teach digital audio signal processing, machine learning and deep neural networks, and I am also responsible for the Hands-on AI: Deep Learning by Practice professional training course offered at Sorbonne University. I am the founder of DeepVoice, Paris (since 2020), the Paris event on speech technologies and artificial intelligence, SophIA (2021): Sorbonne University's student association for Artificial Intelligence in collaboration with the Sorbonne Centre for Artificial Intelligence (SCAI), and Fast-Forward (2022) the informal and experimental meetings of science and technology and sound design in cinema and the moving image.

I am currently a board member and secretary of the French Association on Speech Communication (AFCP) and chair of the ISCA Special Interest Group on Speech Synthesis (SynSIG).


As part of my artistic commitment at Ircam, I am very involved in promoting digital science and technology for the arts, culture and heritage with numerous collaborations with renowned artists such as Eric Rohmer, Philippe Parreno, Roman Polansky, Leos Carax, George Aperghis and Alexander Schubert.

My detailed CV is available here

CV nicolas obin

Email : Nicolas.Obin (at) ircam.fr


Supervision de thèses de doctorat

Encadrement de thèse (en cours)

[ 2025-2028 ]  Anthony Gallien, Machine Learning for Acoustical In-Painting in Augmented Reality: Enhancing Immersive Audio Realism, École doctorale informatique, télécommunications et électronique (EDITE). Bourse doctorale du Sorbonne Cluster for Articial Intelligence (SCAI). Direction, et co-encadrement avec Markus Noisternig et Benoit Alary (STMS, équipe EAC).

[ 2024-2027 ] Balthazar Bujard, Modèles de couplage entre signaux temporels pour le contrôle créatif de la synthèse sonore, École doctorale informatique, télécommunications et électronique (EDITE). Co-encadrement avec Frédéric Bevilacqua (Direction) et Jérôme Nika (STMS, équipe ISMM).

[ 2024-2027 ] Diego Andres Torres Guarrin, Conversion neuronale des attributs de la voix, projet ANR EVA, École doctorale informatique, télécommunications et électronique (EDITE). Direction et co-encadrement avec Axel Roebel (STMS).

[2023-2026] Téo Guichoux, Génération multimodale du comportement et transfert de style pour l’animation
d’un agent virtuel, bourse du ministère, École doctorale informatique, télécommunications et électronique (EDITE). Co-encadrement avec Laure Soulier (Direction) et Catherine Pelachaud (ISIR)

[ 2023-2026 ] Mathilde Abrassart, Conversion neuronale de la voix pour la création d’attaques à l’usurpation d’identité, projet ANR BRUEL, École doctorale informatique, télécommunications et électronique (EDITE). Co-encadrement avec Axel Roebel (Direction, STMS).

[ 2023-2026 ] Théodor Lemerle, Expressive text-to-speech synthesis for virtual storytelling, projet ANR EXOVOICES, École doctorale informatique, télécommunications et électronique (EDITE). Co-encadrement avec Axel Roebel (Direction, STMS).

Encadrement de thèse (soutenue)

[2017-2025] Lisa La Pietra, Fonction et approches de la vocalité lyrique et contemporaine aujourd’hui. L’interprétation vocale entre le Belcanto et les nouvelles technologies. Co-encadrement avec Antonio Lai (Direction, Université Vincennes -- Saint-Denis). École doctorale «Esthétique, sciences et technologies des arts» (EDESTA). Thèse soutenue le 9 décembre 2205.

[ 2019-2022 ] Clément Le Moine, Neural conversion of social attitudes in speech signals, en collaboration avec Stellantis, programme doctoral Ph2D/IDF, École doctorale informatique, télécommunications et électronique (EDITE).  Co-encadrement avec Axel Roebel (Direction, STMS). Thèse soutenue le 27 février 2023


[ 2019-2022 ] Mireille Fares, Multimodal expressive gesturing with style, programme doctoral AI @ Sorbonne Université, École doctorale informatique, télécommunications et électronique (EDITE). Co-encadrement avec Catherine Pelachaud (Direction, ISIR). Thèse soutenue le 15 février 2023


[ 2019-2022 ] Killian Martin, Cognitive control of Rooks’ vocalizations, ED 549 Santé, Sciences Biologiques et Chimie du Vivant, Université de Tours, 2019. Co-encadrement avec Valérie Dufour (Direction, CNRS). Thèse soutenue le 13 décembre 2022.

[ 2013-2016 ] Olivier Migliore, Analyser la prosodie musicale du punk, du rap et du ragga français (1977-1992)
à l’aide de l’outil informatique, co-encadrement avec Yvan Nommick (Direction), École doctorale Langues, littératures, cultures, civilisations, Université Montpellier 3. Participation à l'encadrement. Thèse soutenue le 13 décembre 2016.


Le projet TheVoice sélectionné pour les 20 ans de l'ANR

🎉 𝟮𝟬 𝗮𝗻𝘀 | 𝟮𝟬 𝘀𝗰𝗶𝗲𝗻𝘁𝗶𝗳𝗶𝗾𝘂𝗲𝘀 | 𝟮𝟬 𝗽𝗿𝗼𝗷𝗲𝘁𝘀 | 𝟮𝟬 𝗿𝗲𝗴𝗮𝗿𝗱𝘀 𝘀𝘂𝗿 𝗹𝗮 𝗿𝗲𝗰𝗵𝗲𝗿𝗰𝗵𝗲 Depuis 2005, l’Agence nationale de la recherche soutient la recherche dans toute sa diversité. En 20 ans, plus de 32 000 projets ont ainsi été financés par l’ANR. Et autant d’histoires et d’aventures scientifiques et humaines. La série de portraits #monANR revient sur ce que ces projets ont changé dans la vie des scientifiques, et sur l’impact de leurs recherches sur la société.


GRABUGE (2025) -- Rejoins-nous !!

G.R.A.B.U.G.E est un espace de rencontres, d’échanges, et d’expérimentation ouvert à tous les étudiants passionnés de son, de musique, de danse, de réalités mixtes, de machines et autres geekeries phoniques et sensibles ! Les principes de notre démarche : le bricolage, l’expérimentation, l’auto-organisation, la convivialité, et l’entraide. En un mot, un joyeux chaos organisé pour se réunir et faire de la musique avec des machines !

Groupe de Recherche /S/onore et Autres Bidouilles Utopiques, Géniales et Éphémères

GRABUGE


Tribune : Pour une intelligence artificielle responsable au service d’une création musicale inventive et diverse (2024)


L'IA au service du sonore ? UNESCO (2024)

Soirée "L'IA au service du sonore?" 18 janvier 2024 Organisée dans le cadre de la 21ème édition de la semaine du son

Nicolas Obin, conférence de presse, UNESCO


Soutenance d'habilitation à diriger des recherches

Nicolas Obin soutient son Habilitation à Diriger des Recherches (HDR) le 12 septembre 2023 à 14h - "De la représentation du signal à l’apprentissage de représentations : modélisation structurée de signaux de parole »

Composition du jury

• M. Thomas HUEBER, Directeur de recherche CNRS, GIPSA lab, Rapporteur
• M. Emmanuel VINCENT, Directeur de recherche INRIA, MultiSpeech, Rapporteur
• M. Bjorn SCHULLER, Professeur, Imperial College London, Rapporteur
• M. Gérard BIAU, Professeur, Sorbonne Université, Examinateur
• M. Jean-François BONASTRE, Directeur de Recherche INRIA, Défense et Sécurité, Examinateur
• Mme Catherine PELACHAUD, Directrice de recherche CNRS, ISIR, Examinatrice
• M. Axel ROEBEL, Directeur de recherche, IRCAM, Examinateur
• Mme Isabel TRANCOSO, Professeure, INESC - Université de Lisbonne, Examinatrice
• Mr Nicolas BECKER, Designer sonore et artiste, Membre Invité

Le texte de mon HDR est librement accessible sur HAL.


Deep Voice, Paris

Deep Voice, Paris est l’événement parisien dédié à la voix et à l’intelligence artificielle dont l’objectif est de réunir expertises scientifique et technique, innovation et entrepreneuriat. Des ateliers techniques - “hands-on” - seront proposés aux participants pour développer leurs compétences dans les domaines du traitement de la parole et du langage naturel. Des moments de rencontres et de réseautage en fin de journée faciliteront les rencontres et l’échange entre les participants en toute décontraction. Deep Voice est un événement co-organisé par l’Ircam, Sorbonne Université, et SCAI dans le cadre du festival ManiFeste 2022.