Résumé : Les méthodes par apprentissage profond nécessitent généralement une grande quantité de données d’entraînement. Pour développer des applications spécifiques, un long processus d’acquisition et d’annotation d’images est donc nécessaire à leur bon fonctionnement. Dans cette présentation, nous proposons une architecture de réseau de neurones et un processus d’entraînement qui combine l’utilisation d’images synthétiques et d’images réelles faiblement annotées pour la détection et l’estimation de la pose en 6 dimensions d’instances d’objets. Cette méthode performe comparablement aux méthodes de l’état de l’art tout en nécessitant moins d’images et un niveau d’annotation beaucoup plus faible.
Calendrier des séminaires