Daniel Braun soutiendra sa thèse le 14 décembre à 14h dans l’Amphi MP du Creusot.
Titre de la thèse :
The Usage of Quadtree in Deep Neural Networks to Represent Data for Navigation from a Monocular Camera
Composition du Jury :
- Vincent Frémont – Centrale Nantes – Rapporteur
- Sylvie Chambon – Toulouse INP – Rapportrice
- Thierry Chateau – Logiroad / Université Clermont Auvergne – Examinateur
- Pascal Vasseur – Université de Picardie Jules Verne – co-encadrant
- Olivier Morel – Université Bourgogne Franche-Comté – co-directeur
- Cédric Demonceaux- Université Bourgogne Franche-Comté – co-directeur
Résumé :
L’acquisition de la profondeur représente un élément clé pour les tâches de navigation. Il fait donc partie des principaux sujets de recherche en vision par ordinateur. De nombreuses approches ont été développées pour répondre à ce problème en construisant la profondeur à partir d’une série d’images. Toutefois, il existe un cas minimal proposant une prédiction à partir d’une seule image, rendu possible avec l’émergence des approches d’apprentissage profond. Ces dernières permettent ainsi d’envisager une réduction des coûts en matériel et en temps de calcul, ce qui est bénéfique pour les systèmes embarqués. Cependant, l’architecture du réseau reste un processus lourd nécessitant beaucoup de mémoire du GPU. Certaines approches ont proposé de résoudre ce problème en développant des architectures légères, permettant une exécution en temps réel. Nous proposons ici d’étudier ce problème sous un autre angle, consistant à sélectionner soigneusement les opérations à exécuter plutôt que d’alléger l’architecture. Nos travaux s’appuient sur les réseaux générateurs de quadtree qui tirent parti des convolutions éparses pour n’effectuer que les opérations nécessaires à la génération du quadtree, réduisant ainsi le coût de calcul. Cette méthode, initialement développée pour la segmentation sémantique, sera appliquée dans cette étude aux problèmes d’acquisition de données pour la navigation. À savoir, la segmentation d’images pour l’évitement d’obstacles et la génération de cartes de profondeur compressées en quadtree. Il sera démontré, à travers une série d’expériences, que la compression en quadtree permet une réduction significative du besoin en mémoire avec une perte limitée de précision. Le niveau de compression de la prédiction est entièrement réglable pour l’estimation de la profondeur, ce qui la rend adaptable à toutes les situations.