Vous êtes ici : GIPSA-lab > Formation > Thèses soutenues
DO Cao Tri

“Multi-modal and multi-scale temporal metric learning for time series nearest neighbors classification

 

Directeur de thèse :     Michèle ROMBAUT

École doctorale : Mathématiques, sciences et technologies de l'information, informatique (MSTII)

Spécialité : Informatique

Structure de rattachement : Autre

Établissement d'origine : INPG - ENSE3

Financement(s) : contrat à durée déterminée ; CIFRE

 

Date d'entrée en thèse : 14/01/2013

Date de soutenance : 06/05/2016

 

Composition du jury :
- Stéphane Canu (Normandie Université, LITIS) - Rapporteur - Marc Sebban (Université Jean Monnet, St-Etienne Hubert Curien Lab) - Rapporteur - Patrick Gallinari (Université Pierre et Marie Curie, LIP6) - Examinateur - Gustavo CAMPS-VALLS (Parc Científic Universitat de València, IPL) – Examinateur - Ahlame Douzal (UGA, AMA, LIG) - Directeur de thèse - Michèle Rombaut (UGA, GIPSA-Lab; AGPIG) - Co-directeur de thèse - Sylvain Marié (Schneider Electric) - Co-encadrant de thèse

 

Résumé : --- Résumé en Anglais — The definition of a metric between time series is inherent to several data analysis and mining tasks, including clustering, classification or forecasting. Time series data present naturally several modalities covering their amplitude, behavior or frequential spectrum, that may be expressed with varying delays and at multiple temporal scales —exhibited globally or locally. Combining several modalities at multiple temporal scales to learn a holistic metric is a key challenge for many real temporal data applications. This thesis proposes a Multi-modal and Multi-scale Temporal Metric Learning (M2TML) approach for maximum margin time series nearest neighbors classification. The solution lies in embedding time series into a dissimilarity space where a pairwise SVM is used to learn the metric. The M2TML solution is proposed for both linear and non linear contexts. A sparse and interpretable variant of the solution shows the ability of the learned temporal metric to localize accurately discriminative modalities as well as their temporal scales. A wide range of 30 public and challenging datasets, encompassing images, traces and ECG data, that are linearly or non linearly separable, are used to show the efficiency and the potential of M2TML for time series nearest neighbors classification. --- Résumé en Français — L'apprentissage de métriques temporelles est un processus crucial pour la classification supervisée ou non supervisée de séries temporelles. Les séries temporelles sont naturellement caractérisées par différentes modalités (valeurs, formes, spectres des fréquences...). Ces caractéristiques peuvent être observées avec des délais variables, à différentes échelles et impliquant une partie ou totalité des observations. L'apprentissage de métriques temporelles combinant plusieurs modalités à plusieurs échelles temporelles est un défi au cœur de nombreuses applications émergentes visant la classification et la prédiction de séries temporelles complexes. Cette thèse propose une nouvelle approche M2TML (Multi-modal and Multi-scale Temporal Metric Learning) d'apprentissage de métrique temporelle multi-modale et multi-échelle en vue d'une classification robuste par plus proches voisins. La solution est basée sur la projection de paires de séries dans un espace de dissimilarités, dans lequel un processus d'optimisation à vaste marge est opéré. La solution M2TML est proposée à la fois dans le contexte linéaire et non-linéaire, et est étudiée pour différents types de régularisation. Une variante parcimonieuse et interprétable de la solution montre le potentiel de la métrique temporelle apprise à localiser finement les modalités et échelles discriminantes. L'approche est testée sur une trentaine de bases de données publiques de classes linéairement ou non-linéairement séparables, couvrant entre autres des images, des traces et des ECG. Les expériences menées attestent de l'efficacité et du potentiel de la méthode M2TML pour la classification de séries temporelles complexes.


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31