Recherche efficace de séries temporelles

La recherche de sons peut s’avérer une tâche pénible et laborieuse dans le cas de bases de données massives. Même lorsque des méta-informations sont disponibles, les résultats restent souvent loin de la représentation mentale imaginée par l’utilisateur. Aucun système ne permet actuellement la projection intuitive d’une idée sonore en requête efficace, les échantillons sonores ne permettant pas la même extraction d’information de haut niveau que les chansons (e.g. mélodie, paroles).

Description des travaux/Objectifs

Partant de cette observation, nous avons développé un système générique permettant d’effectuer des requêtes efficaces sur des formes temporelles et de prendre en compte la nature multidimensionelle de la perception sonore. Celle-ci permet d’effectuer des requêtes basées sur la forme temporelle de descripteurs plutôt que sur de simples valeurs moyennées. Ces descripteurs sont modélisés pour obtenir leur moyenne, écart-type ainsi que la forme de leur évolution temporelle grâce à une représentation symbolique permettant à la fois un stockage compact et une recherche efficace. Cependant, il était primordial que la comparaison des séries temporelles permette d’obtenir une similarité basée sur des critères perceptifs pour des objets pouvant être mathématiquement très divergents. En utilisant une approche dérivant du Dynamic Time Warping (DTW), nous avons développé une mesure de similarité robuste suivant les distorsions
non-linéaires aussi bien d’amplitude, de temps de bruit et de valeurs singulières. Grâce à un algorithme d’indexation novateur, il est possible d’obtenir presque instantanément le meilleur élément d’une base de plusieurs millions d’échantillons sonores.

Notre étude s’est ensuite ouverte à l’implémentation d’interactions de plus haut niveau. Nous avons étudié la possibilité d’une recherche pertinente sur plusieurs courbes temporelles simultanément, dépassant le cadre de la simple pondération de critères souvent peu pertinente. Grâce à une heuristique novatrice, nous avons réalisé le premier algorithme exact de recherche multi-objectif des séries temporelles.

Ces techniques s’appliquent à tous les champs de recherche scientifique de par l’ubiquité de l’information temporelle. La recherche multi-objective de séries temporelles ouvre à de nombreuses applications dans divers domaines allant de l’analyse médicale à la robotique. Celle-ci permet également la mise en place d’un système de requête par imitation vocale basé sur de multiples descripteurs spectraux.

Toutes ces avancées ont été implémentées dans une interface utilisant la technologie multi-touch de l’iPad.

Équipe Ircam : Représentations musicales.

  • logo Ircam