Vendredi 31 janvier 2025

Local clustering and motif discovery of functional data
Marzia A. Cremona
Professeure agrégée, Département opérations systèmes de décision (FSA)

Heure: 13h30
Local: PLT-3775

Résumé: Recent evolution in data acquisition technologies enabled the generation of high-dimensional, complex data in several research areas – in the sciences and engineering, among other disciplines. Increasingly sophisticated statistical and computational methods are needed in order to analyze these data. Functional data analysis (FDA) can be broadly employed to analyze functional data, i.e. data that vary over a continuum and can be naturally viewed as smooth curves or surfaces, exploiting information in their shapes.

In this talk, I will present probabilistic K-mean with local alignment (probKMA, [1]), a novel unsupervised learning method to locally cluster a set of misaligned curves and to address the problem of discovering functional motifs, i.e. typical « shapes » or « patterns » that may recur several times along and across a set of curves, capturing important local characteristics of these curves. After demonstrating the performance of the method on simulated data and showing how it generalizes other clustering methods for functional data, I will present three applications to the analysis of functional data from different fields. First, I will apply probKMA to discover functional motifs in « Omics » signals related to mutagenesis and genome dynamics. Second, I will employ probKMA as a probabilistic clustering method to group COVID-19 death curves of the different Italian regions during the first wave of the pandemic. Finally, I will present an application to the discovery and characterization of financial bubbles in price time series.

Finally, I will briefly introduce funBIalign [2], another novel method inspired by clustering and biclustering for discovering functional motifs, both in a single curve and in a set of curves.

[1] Cremona, Chiaromonte (2023) Probabilistic K-means with local alignment for clustering and motif discovery in functional data. Journal of Computational and Graphical Statistics 32(3): 1119-1130.

[2] Di Iorio, Cremona, Chiaromonte (2025) funBIalign: a hierarchical algorithm for functional motif discovery based on mean squared residue scores. Statistics and Computing 35:11.

Biographie: Marzia A. Cremona est professeure agrégée en science des données au département d’Opérations et Systèmes de Décision de l’Université Laval et chercheuse au centre de recherche du CHU de Québec – Université Laval. Elle est aussi membre de l’IID et du CIRRELT. Elle a obtenu un doctorat en Modèles et Méthodes Mathématiques pour l’Ingénierie du Politecnico di Milano (Italie) en 2016 et elle est arrivée à l’Université Laval en 2019 après avoir travaillé pendant quatre ans à la Pennsylvania State University (États-Unis).

Ses intérêts de recherche portent sur le développement de méthodes statistiques et informatiques pour l’analyse de données complexes et de grande dimension et sur l’application de ces méthodes aux sciences «omiques» et biomédicales, ainsi qu’aux sciences de l’administration. Une partie importante du programme de recherche du Dr Cremona concerne le développement de nouvelles techniques de l’analyse des données fonctionnelles (ADF), une branche des statistiques visant à analyser les courbes (fonctions mathématiques). Un aspect important de sa recherche est sa nature collaborative et multidisciplinaire. En effet, elle est impliquée dans de nombreuses collaborations internationales impliquant l’analyse des données à l’aide de techniques statistiques et d’apprentissage automatique.

Note: La présentation sera donnée en anglais.

LiensArticle 1Article 2

http://www2.ift.ulaval.ca/~quimper/Seminaires/