Programme de Doctorat en informatique

Département d’informatique et de génie logiciel

Faculté des sciences et de génie

Présentation de la proposition de thèse doctorale

de

Mazid Abiodoun Osseni

Vendredi 20 janvier à 14h30

Par vidéoconférence (voir lien ci-dessous)

Rejoindre la réunion Zoom :

https://ulaval.zoom.us/j/64561669110?pwd=a2VnU0p4TUlLMTV5VWRsemdlOHZwQT09

Meeting ID: 645 6166 9110

Passcode: 171873

« L’apprentissage automatique et les sciences omiques
aux services du traitement du cancer du sein »

 

Membres du comité d’encadrement

 

Jacques Corbeil, Directeur de recherche, Département de médecine moléculaire, Université Laval

Elsa Marie Suzanne Rousseau, Département d’informatique et de génie logiciel, Université Laval

Pascal Germain, Département d’informatique et de génie logiciel, Université Laval

Résumé

De nos jours, l’abondance des données omiques met à notre disponibilité différentes facettes biologiques représentant un individu. La combinaison de ces représentations permet d’avoir une meilleure compréhension et un profil biologique plus complet des patients. Afin d’améliorer nos connaissances sur les raisons provoquant les maladies et par conséquent de trouver les solutions, une étude du profil complet (multi-omiques) est plus avantageuse que les études mono-omiques portées uniquement vers un type en particulier (la transcriptomique). L’apprentissage automatique est une science dont le but est de développer des algorithmes capables d’apprendre à partir d’exemples. Ces algorithmes peuvent être utilisés pour produire des modèles capables de prédire l’état d’un patient cancéreux ou pas, à partir des données multi-omiques.

Cette thèse applicative présente entre autres des algorithmes d’apprentissage produisant des modèles interprétables et parcimonieux pour la prédiction de type de cancer à partir des données multi-omiques, essentiellement la génomique, la transcriptomique, l’épigénomique et la protéomique. En premier lieu, nous démontrons l’application des algorithmes d’apprentissage (SCM, arbres de décisions et forêts aléatoires) à la détection de biomarqueurs pour différencier les patients ayant le cancer de sein de type triple négatif des autres types de cancer du sein. En second lieu, le développement d’un nouvel algorithme a été réalisé toujours pour résoudre la même tâche. Il s’agit du GroupSCM qui est basé sur le SCM et intègre une connaissance a priori dans la fonction d’utilité. Pour finir, nous présentons MOT qui est un classificateur multi-classes dont le but est de différentier parmi 33 cancers à l’aide des données multi-omiques et des réseaux de neurones profonds de types transformers.

Tout au long de cette thèse, nous démontrons l’utilité et la puissance de l’apprentissage automatique appliqué aux données multi-omiques dans le cadre de la distinction des différents cancers et en particulier le cancer du sein. Les modèles computationnels présentés dans cette thèse s’inscrivent dans une perspective d’utilisation des données omiques à très grandes échelles afin d’utiliser un profil biologique plus complet des patients dans l’objectif de trouver les biomarqueurs et les causes responsables d’un phénotype.

 

Note: Les diapos seront en anglais, mais la présentation est faite en français.

 

Bienvenue à tous !