Programme de Doctorat en informatique
Département d’informatique et de génie logiciel
Faculté des sciences et de génie
Présentation de la proposition de thèse doctorale (IFT-8004)
de
Jean-Thomas Baillargeon
Le mercredi 7 février 2024 à 9h
Local 3904, Pavillon Adrien Pouliot
Classification et analyse de sinistres dispendieux
dans les réclamations d’assurance à l’aide de
réseaux de neurones profonds
Membres du jury
Luc Lamontagne, Ph.D. (Directeur de recherche)
Département d’informatique et de génie logiciel
Richard Khoury, Ph.D. (Examinateur)
Département d’informatique et de génie logiciel
Michael Morin, Ph.D. (Examinateur)
Département des opérations et systèmes de décision
Faculté des sciences de l’administration
Résumé
Cette présentation a pour objectif de présenter un projet de thèse qui porte sur l’analyse de la détection de réclamations dispendieuses en assurance de dommage. Cette analyse se fait grâce aux techniques de pointe en intelligence artificielle et exploite des séries de documents textuels qui suivent l’évolution temporelle des réclamations.
Dans un premier temps, on propose un modèle permettant de détecter les réclamations dispendieuses a posteriori, alors que toutes les notes d’une réclamation sont disponibles. Ce modèle se nomme RoTRAN (Recurrence over Transformer), une architecture hiérarchique qui utilise l’encodeur de notes Longitudinal-BERT, un transformeur préentraîné avec la prédiction de la même réclamation. Cette tâche auxiliaire proposée dans cette thèse permet de mettre en évidence les éléments récurrents d’une réclamation. Dans un second temps, on propose différentes approches permettant d’améliorer les performances de classification en cours de sinistre. Ces différentes approches exploitent l’augmentation de données et utilisent une classification calibrée à l’aide d’une fonction de survie.
Finalement, on propose un cadre d’évaluation statistique permettant de comparer l’appréciation humaine de justifications provenant de deux modèles. Ce cadre d’évaluation utilise des mesures d’extraction d’information telle le mean average precision (mAP) pour évaluer la capacité de cartes de saillance à extraire l’information pertinente d’un dossier de réclamation. Ce cadre est utilisé pour démontrer l’utilisation de raccourcis de classification et de supporter l’utilisation de modèles plus explicables, pour lesquels l’utilisateur aura une plus grande confiance lors de son utilisation.
Note: La présentation sera donnée en français.
Bienvenue à tous !