Franche, Jean-François (2016). Transcodage rapide de H.264 à HEVC basé sur la propagation du mouvement et une traversée postfixe des unités de codage arborescent. Thèse de doctorat électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (5MB) | Prévisualisation |
Prévisualisation |
PDF
Télécharger (704kB) | Prévisualisation |
Résumé
En 2013, l’ITU-T et l’ISO ont publié conjointement le plus récent standard de compression vidéo, appelé HEVC. Comparé à son prédécesseur, H.264, ce nouveau standard réduit le débit d’environ 50% pour une qualité vidéo similaire. Pour bénéficier de cette plus grande efficacité de codage, et pour assurer l’interopérabilité entre les systèmes, plusieurs séquences vidéos H.264 doivent être transcodées (converties) en séquences HEVC. La manière la plus simple de réaliser cette opération consiste à décoder entièrement la séquence H.264 source, puis à la réencoder entièrement à l’aide d’un encodeur HEVC. Cette approche, appelée transcodage en cascade dans le domaine des pixels (TCDP), produit un codage efficace et offre un maximum de flexibilité, notamment en ce qui a trait à la configuration de la séquence de sortie. Cependant, elle est très complexe en calculs. Pour réduire cette complexité, plusieurs approches réutilisent de l’information de codage (vecteurs de mouvement, modes de codage, données résiduelles, etc.) extraite de la séquence H.264, afin d’accélérer certaines étapes de l’encodage HEVC. La majorité de ces approches préserve l’efficacité de codage, mais obtient cependant des accélérations limitées (habituellement, entre 2 et 4x, selon l’approche).
Dans cette thèse, nous proposons une approche de transcodage H.264 à HEVC plus rapide que celles présentées dans la littérature. Notre solution est composée d’un algorithme de propagation du mouvement et d’une méthode pour réduire le nombre de modes HEVC à tester. L’algorithme de propagation de mouvement crée une liste des vecteurs de mouvement candidats au niveau des unités de codage arborescent (CTU) et, par la suite, sélectionne le meilleur candidat au niveau des unités de prédiction. Cette méthode élimine la redondance des calculs en précalculant l’erreur de prédiction de chaque candidat au niveau des CTUs, et réutilise cette information pour différentes tailles de partitionnement. Pour sa part, l’algorithme de réduction des modes est basé sur un parcours postfixe de la CTU traitée. Cet algorithme permet notamment d’arrêter prématurément le traitement d’un mode jugé non prometteur.
Par rapport à une approche de transcodage TCDP, nos résultats expérimentaux montrent que la solution proposée est en moyenne 7.81 fois plus rapide, pour une augmentation moyenne du BD-Rate de 2.05%. Nous expériences montrent également que les résultats obtenus sont significativement supérieurs à ceux de l’état de l’art.
Titre traduit
Fast H.264-to-HEVC transcoding based on motion propagation and post-order traversal of coding tree units
Résumé traduit
In 2013, the Joint Collaborative Team on Video Coding completed HEVC, the most recent video compression standard. Compared to its predecessor, H.264, the new standard HEVC can save approximately 50% of the bitrate for similar video quality. To take advantage of HEVC coding efficiency and to ensure systems interoperability, several H.264 sequences must be transcoded to HEVC. The simplest video transcoding approach, called cascade pixel-domain transcoding (CPDT), decodes the input sequence entirely and re-encodes the pixel data in the output format. This approach achieves high coding efficiency and offers great flexibility on video encoding parameters. However, it is very complex computationally. To reduce this complexity, several approaches reuse extracted information – such as coding modes, motion information and encoded residuals – from the incoming bitstream to speed up the HEVC encoding process. For inter frames, these approaches typically focus on fast mode decision and fast motion estimation. Most of these approaches preserve the coding efficiency, but achieve limited speedup (usually between 2 and 4x).
In this thesis, we propose a faster H.264 to HEVC transcoder that also preserves the coding efficiency. Our solution is composed of a motion propagation algorithm and a fast mode decision framework. The motion propagation algorithm creates a motion vector candidate list at the coding tree unit (CTU) level and, thereafter, selects the best candidate at the prediction unit level. This method eliminates computational redundancy by pre-computing the prediction error of each candidate at the CTU level and reusing the information for various partition sizes. The fast mode decision framework is based on a post-order traversal of the CTU, and includes several mode reduction techniques. In particular, the framework permits the early termination of the rate-distortion cost computation, a highly complex task, when a mode is unpromising. Moreover, a method is presented to recursively determine, with the help of H.264 modes and information created by the motion propagation algorithm, whether or not each coding unit must be split. This allows the pruning of unpromising sub-partitions.
Compared to a CPDT approach, the experimental results show that the proposed solution is on average 7.81 times faster, for an average BD-Rate of 2.05%. Our experiment shows that these results exceed those of state-of-the-art methods.
Type de document: | Mémoire ou thèse (Thèse de doctorat électronique) |
---|---|
Mots-clés libres: | H.264/AVC, H.265/HEVC, transcodage vidéo, estimation du mouvement, sélection du mode à encoder |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Coulombe, Stéphane |
Programme: | Doctorat en génie > Génie |
Date de dépôt: | 20 févr. 2019 21:57 |
Dernière modification: | 09 oct. 2019 18:24 |
URI: | https://espace.etsmtl.ca/id/eprint/1776 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |