La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Génération automatique de cartes de profondeur relative par utilisation des occlusions dynamiques

Téléchargements

Téléchargements par mois depuis la dernière année

Oudni, Louiza (2018). Génération automatique de cartes de profondeur relative par utilisation des occlusions dynamiques. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[thumbnail of OUDNI_Louiza.pdf]
Prévisualisation
PDF
Télécharger (10MB) | Prévisualisation
[thumbnail of OUDNI_Louiza-web.pdf]
Prévisualisation
PDF
Télécharger (6MB) | Prévisualisation

Résumé

L’insuffisance de contenu 3D est un frein majeur à l’expansion des téléviseurs 3D. La generation automatique de contenu 3D à partir de contenu 2D ordinaire constitue une solution possible à ce problème.

En effet, plusieurs indices de profondeur sont présents sur des images ou vidéos 2D, ce qui rend la conversion automatique 2D à 3D possible. Parmi ces indices, les occlusions dynamiques, qui permettent d’attribuer un ordre relatif aux objets adjacents, offrent les avantages d’être fiables et présentes dans tous les types de scènes.

L’approche pour convertir du contenu 2D en 3D, proposée dans ce mémoire, repose sur l’utilisation de cet indice pour générer des cartes de profondeur relative. L’analyse du mouvement, avant et arrière entre deux trames consécutives, permet le calcul des occlusions dynamiques. Le mouvement considéré est calculé par une version modifiée du flot optique Epic-Flow propose par Revaud et al. en 2015. Les modifications apportées au calcul de ce flot optique ont permis de le rendre cohérent en avant-arrière sans détériorer ses performances. Grâce à cette nouvelle propriété, les occlusions sont plus simplement calculées que dans les approches présentes dans la littérature. En effet, contrairement à l’approche suivie par Salembier et Palou en 2014, la méthode de calcul des occlusions proposée ne nécessite pas la coûteuse opération de l’estimation de mouvement par région selon un modèle quadratique. Une fois les relations d’occlusions obtenues, elles permettent de déduire l’ordre des objets contenus dans l’image. Ces objets sont obtenus par une segmentation qui considère à la fois la couleur et le mouvement.

La méthode proposée permet la génération automatique de cartes de profondeur relative en présence de mouvement des objets de la scène. Elle permet d’obtenir des résultats comparables à ceux obtenus par Salembier et Palou, sans nécessiter l’estimation de mouvement par région.

Titre traduit

Automatic generation of relative depth maps using dynamic occlusions

Résumé traduit

The lack of 3D content is a major obstacle to 3D television expansion. One viable solution to this obstacle is the 3D content generation out of ordinary 2D content.

As a matter of fact, several depth cues can be found in a 2D image or video, which makes the automatic conversion from 2D to 3D possible. Among those cues, dynamic occlusions, that allow a relative order attribution to adjacent objects, represent a reliable base for 2D to 3D conversion and are available in all types of scenes.

In this thesis, an improved 2D to 3D conversion approach is presented. It relies on the dynamic occlusion depth cue to generate relative depth maps. The front and back motion analysis between two consecutive frames allows the calculation of the dynamic occlusions. The utilized motion is calculated using a revised version of the optical flow estimation algorithm Epic-Flow, and the revisions added to this optical flow made it coherent in Forward-backward without compromising its performance. Thanks to this new feature, occlusions are simpler to calculate than the approaches used in the literature. Indeed, contrary to the approach followed by Salembier and Palou in 2014, the proposed method of calculating occlusions does not require the costly operation of motion estimation by region according to a quadratic model. The obtained occlusions allow order deduction of the objects contained in the image. These objects are obtained using segmentation, which considers both color and motion.

The proposed method allows the automatic generation of relative depth maps in the presence of motion of the objects in the scene. It makes it possible to obtain results comparable to those obtained by Salembier and Palou, without requiring the estimation of movement by region.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise avec mémoire en technologie de l'information". Comprend des références bibliographiques (pages 81-87).
Mots-clés libres: carte de profondeur relative, flot optique, segmentation, occlusions dynamiques, conversion automatique 2D à 3D
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Vázquez, Carlos
Codirecteur:
Codirecteur
Coulombe, Stéphane
Programme: Maîtrise en ingénierie > Génie des technologies de l'information
Date de dépôt: 31 oct. 2018 14:55
Dernière modification: 31 oct. 2018 14:55
URI: https://espace.etsmtl.ca/id/eprint/2101

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt