Programme de Doctorat en informatique

Département d’informatique et de génie logiciel

Faculté des sciences et de génie

Présentation de la proposition de thèse doctorale (IFT-8004)

de

Jean-Thomas Baillargeon

 

Le mercredi 7 février 2024 à 9h

Local 3904, Pavillon Adrien Pouliot

Classification et analyse de sinistres dispendieux
dans les réclamations d’assurance à l’aide de
réseaux de neurones profonds

Membres du jury

 

Luc Lamontagne, Ph.D. (Directeur de recherche)

Département d’informatique et de génie logiciel

Richard Khoury, Ph.D. (Examinateur)

Département d’informatique et de génie logiciel

Michael Morin, Ph.D. (Examinateur)

Département des opérations et systèmes de décision

Faculté des sciences de l’administration

 

Résumé

Cette présentation a pour objectif de présenter un projet de thèse qui porte sur l’analyse de la détection de réclamations dispendieuses en assurance de dommage. Cette analyse se fait grâce aux techniques de pointe en intelligence artificielle et exploite des séries de documents textuels qui suivent l’évolution temporelle des réclamations.

Dans un premier temps, on propose un modèle permettant de détecter les réclamations dispendieuses a posteriori, alors que toutes les notes d’une réclamation sont disponibles. Ce modèle se nomme RoTRAN (Recurrence over Transformer), une architecture hiérarchique qui utilise l’encodeur de notes Longitudinal-BERT, un transformeur préentraîné avec la prédiction de la même réclamation. Cette tâche auxiliaire proposée dans cette thèse permet de mettre en évidence les éléments récurrents d’une réclamation. Dans un second temps, on propose différentes approches permettant d’améliorer les performances de classification en cours de sinistre. Ces différentes approches exploitent l’augmentation de données et utilisent une classification calibrée à l’aide d’une fonction de survie.

Finalement, on propose un cadre d’évaluation statistique permettant de comparer l’appréciation humaine de justifications provenant de deux modèles. Ce cadre d’évaluation utilise des mesures d’extraction d’information telle le mean average precision (mAP) pour évaluer la capacité de cartes de saillance à extraire l’information pertinente d’un dossier de réclamation. Ce cadre est utilisé pour démontrer l’utilisation de raccourcis de classification et de supporter l’utilisation de modèles plus explicables, pour lesquels l’utilisateur aura une plus grande confiance lors de son utilisation.

Note: La présentation sera donnée en français.

 

Bienvenue à tous !