Programme de Doctorat en informatique

Département d’informatique et de génie logiciel

Faculté des sciences et de génie

Présentation orale de la proposition de sujet de recherche

De

David Beauchemin

Vendredi 11 février 2022 à 12h30

Par vidéoconférence (voir lien ci-dessous)

Rejoindre la réunion Zoom :

https://ulaval.zoom.us/j/61031314666?pwd=OVNjZndnSlRGR2RFdTg3MmplZk0rQT09

« Insurance Literacy: Automatic Summarization, Reformulation and Personalization Explication of Insurance Contracts »

 

 

Membres du comité d’encadrement

Pr. Richard Khoury, Ph.D. (Directeur de recherche)

Département d’informatique et de génie logiciel

Pr. Luc Lamontagne, Ph.D.

Département d’informatique et de génie logiciel

Pr. Pierre-Luc Déziel, Ph.D.

Faculté de droit

Projet réalisé en collaboration avec La Capitale Assurances / Beneva.

 

Résumé

Avec l’entrée en vigueur en 2019 du projet de loi 141, Loi visant à “à améliorer l’encadrement du secteur financier, la protection des dépôts et le régime de fonctionnement des institutions financières,” un assureur peut désormais vendre un produit d’assurance entièrement en ligne sans qu’il soit nécessaire de faire intervenir un agent d’assurance. Toutefois, cette nouvelle possibilité ne supprime pas l’obligation légale de l’assureur d’informer ses clients sur les produits d’assurance. Avant cette législation, les assureurs s’appuyaient sur deux types d’actions pour se conformer à cette obligation légale. Premièrement, les agents d’assurance constituent l’épine dorsale de la stratégie de l’assureur pour informer correctement les clients. Lors du questionnaire d’évaluation du risque, ils peuvent expliquer divers concepts si les clients semblent ne pas les comprendre ou les comprendre mal. Deuxièmement, les assureurs s’appuient sur diverses initiatives d’information du public pour renseigner les clients sur les produits d’assurance, comme le site Web Info assurance qui offre des informations complètes sur l’assurance habitation et automobile. Le fait de supprimer potentiellement l’agent d’assurance enlève un élément clé dans la manière habituelle d’informer correctement un client. Par ailleurs, une autre approche a commencé à apparaître ces dernières années. Les assureurs utilisent maintenant leur application de questionnaire d’assurance en ligne pour donner de petites informations sur certains concepts d’assurance tels que la franchise et la couverture de la police. Cependant, ces informations sont non contextuelles, non personnalisées et trop génériques par rapport aux explications que donnerait un agent d’assurance. Les assureurs doivent donc trouver de nouvelles façons d’apporter des informations à leurs clients.

 

Cette proposition de projet de recherche se concentre sur la possibilité d’utiliser l’apprentissage profond pour expliquer automatiquement un contrat d’assurance à un nouveau client. Les deux objectifs sont de résumer automatiquement de longs contrats d’assurance avec des informations contradictoires et de reformuler, personnaliser et ajouter automatiquement l’explication de leur contrat. Les approches adoptées pour atteindre ces objectifs sont les suivantes : le développement d’une nouvelle architecture de modélisation de sujets non supervisée, consciente du contexte et de la contradiction, et une nouvelle architecture de simplification élaborative personnalisée multiniveaux d’adaptation de domaine contrastive.

La nouvelle architecture de modélisation de sujets non supervisée, consciente du contexte et de la contradiction, s’appuiera sur une distribution du contexte d’un contrat d’assurance. Ainsi, une phrase donnée dans un contrat d’assurance variera en fonction de sa position contextuelle dans le contrat d’assurance (par exemple, dans la couverture de la police ou la section de définition) et des phrases voisines. De plus, un résolveur de coréférence de document sera utilisé dans l’architecture pour résoudre le problème des informations contradictoires. Son objectif sera d’identifier et de mettre en correspondance les informations contradictoires entre un avenant et la section du contrat d’assurance que cet avenant modifie dans le contrat de base.

La nouvelle architecture de simplification élaborative personnalisée multiniveaux personnalisée multiniveaux d’adaptation de domaine contrastive reposera sur le contrastive learning et l’adaptation de domain (domain adaptation). Puisqu’il est complexe de définir une bonne reformulation et explication d’une couverture d’assurance, et que nous ne disposons que de quelques exemples, les techniques de contrastive learning et de domain adaptation peuvent augmenter la distinction entre les différents niveaux de reformulation souhaitée. De plus, un modèle entrainé en format tâche à trou cloze task sera également utilisé pour créer une simplification élaborative du résumé du contrat d’assurance reformulé.

Enfin, la reformulation générée automatiquement et les résumés personnalisés des contrats d’assurance ne doivent pas véhiculer d’informations non factuelles ou manquer d’informations importantes. Il est donc insuffisant d’évaluer uniquement la qualité globale des résumés à l’aide de métrique d’évaluation automatique. Un groupe d’experts en assurance évaluera manuellement un sous-ensemble des résumés afin d’évaluer leur qualité factuelle ainsi que leur qualité linguistique. De plus, afin d’approfondir l’utilité et l’efficacité des deux architectures, des clients évalueront également leur utilité informationnelle lors d’une soumission d’assurance. Ils évalueront si cette nouvelle façon de leur transmettre des informations leur est utile.

 

Abstract

With the entry into force in 2019 of Bill 141, An Act to “improve the supervision of the financial sector, the protection of deposits and the operating regime of financial institutions,” an insurer may now sell an insurance product entirely online without the need to involve an insurance agent. However, this new possibility does not remove the insurer’s legal obligation to inform its customers about insurance products. Prior to this legislation, insurers relied on two types of actions to comply with this legal obligation. First, insurance agents are the backbone of the insurer’s strategy to properly inform customers. During the risk assessment questionnaire, they can explain various concepts if customers seem not to understand them or misunderstand them. Second, insurers rely on various public information initiatives to inform customers about insurance products, such as the Insurance News website, which provides comprehensive information on home and auto insurance. Potentially removing the insurance agent removes a key element in the usual way of properly informing a customer. In addition, another approach has begun to emerge in recent years. Insurers are now using their online insurance questionnaire application to give small pieces of information about certain insurance concepts such as deductible and policy coverage. However, this information is non-contextual, non-personalised and too generic compared to what an insurance agent would explain. Insurers therefore need to find new ways of providing information to their customers.

This research proposal focuses on the possibility of using deep learning to automatically explain an insurance contract to a new customer. The two objectives are to automatically summarise long insurance contracts with conflicting information and to automatically rephrase, personalise and add to their contract explanation. The approaches taken to achieve these objectives are: the development of a new unsupervised, context-aware and contradiction-aware topic modelling architecture, and a new multi-level personalised elaborative simplification architecture for contrastive domain adaptation.

The new unsupervised, context-aware and contradiction-aware topic modelling architecture will be based on a distribution of the context of an insurance contract. Thus, a given sentence in an insurance contract will vary according to its contextual position in the insurance contract (e.g. in the policy cover or definition section) and neighbouring sentences. In addition, a document co-reference solver will be used in the architecture to solve the problem of conflicting information. Its purpose will be to identify and map conflicting information between an endorsement and the section of the insurance contract that this endorsement modifies in the base contract.

The new architecture for elaborative customised multilevel simplification customised multilevel contrastive domain adaptation will be based on contrastive learning and domain adaptation. Since defining a good reformulation and explanation of insurance coverage is complex, and we have only a few examples, contrastive learning and domain adaptation techniques can increase the distinction between different levels of desired reformulation. In addition, a trained model in cloze task format will also be used to create an elaborative simplification of the reformulated insurance contract summary.

Finally, the automatically generated reformulation and personalised summaries of insurance contracts should not convey non-factual information or lack important information. It is therefore insufficient to assess only the overall quality of summaries using automatic evaluation metrics. A group of insurance experts will manually assess a subset of the summaries to evaluate their factual quality as well as their linguistic quality. In addition, to further investigate the usefulness and effectiveness of both architectures, clients will also evaluate their informational usefulness during an insurance submission. They will assess whether this new way of transmitting information is useful to them.

 

Note: La présentation sera donnée en français et en anglais.

Bienvenue à tous!