La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Macroblock level rate and distortion estimation applied to the computation of the Lagrange multiplier in H.264 compression

Téléchargements

Téléchargements par mois depuis la dernière année

Cotoros Petrulian, Alexandru (2014). Macroblock level rate and distortion estimation applied to the computation of the Lagrange multiplier in H.264 compression. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[thumbnail of COTOROS_PETRULIAN_Alexandru.pdf]
Prévisualisation
PDF
Télécharger (22MB) | Prévisualisation
[thumbnail of COTOROS_PETRULIAN_Alexandru-web.pdf]
Prévisualisation
PDF
Télécharger (11MB) | Prévisualisation

Résumé

The optimal value of Lagrange multiplier, a trade-off factor between the conveyed rate and distortion measured at the signal reconstruction has been a fundamental problem of rate distortion theory and video compression in particular.

The H.264 standard does not specify how to determine the optimal combination of the quantization parameter (QP) values and encoding choices (motion vectors, mode decision). So far, the encoding process is still subject to the static value of Lagrange multiplier, having an exponential dependence on QP as adopted by the scientific community. However, this static value cannot accommodate the diversity of video sequences. Determining its optimal value is still a challenge for current research.

In this thesis, we propose a novel algorithm that dynamically adapts the Lagrange multiplier to the video input by using the distribution of the transformed residuals at the macroblock level, expected to result in an improved compression performance in the rate-distortion space.

We apply several models to the transformed residuals (Laplace, Gaussian, generic probability density function) at the macroblock level to estimate the rate and distortion, and study how well they fit the actual values. We then analyze the benefits and drawbacks of a few simple models (Laplace and a mixture of Laplace and Gaussian) from the standpoint of acquired compression gain versus visual improvement in connection to the H.264 standard.

Rather than computing the Lagrange multiplier based on a model applied to the whole frame, as proposed in the state-of-the-art, we compute it based on models applied at the macroblock level. The new algorithm estimates, from the macroblock’s transformed residuals, its rate and distortion and then combines the contribution of each to compute the frame’s Lagrange multiplier.

The experiments on various types of videos showed that the distortion calculated at the macroblock level approaches the real one delivered by the reference software for most sequences tested, although a reliable rate model is still lacking especially at low bit rate. Nevertheless, the results obtained from compressing various video sequences show that the proposed method performs significantly better than the H.264 Joint Model and is slightly better than state-of-the-art methods.

Titre traduit

Estimation du débit et de la distorsion au niveau du macrobloc appliquée au calcul du multiplicateur de Lagrange en compression avec la norme H.264

Résumé traduit

La valeur optimale du multiplicateur de Lagrange (λ ), un facteur de compromis entre le débit obtenu et la distorsion mesurée lors de la compression d’un signal, est un problème fondamental de la théorie de la débit-distorsion et particulièrement de la compression vidéo.

Le standard H.264 ne spécifie pas comment déterminer la combinaison optimale des valeurs des paramètres de quantification (QP) et des choix de codage (vecteurs de mouvement, choix de mode). Actuellement, le processus d’encodage est encore dépendant de la valeur statique du multiplicateur de Lagrange, dont une dépendance exponentielle du QP est adoptée par la communauté scientifique, mais qui ne peut pas accommoder la diversité des vidéos. La détermination efficace de sa valeur optimale reste encore un défi à relever et un sujet de recherche d’actualité.

Dans la présente recherche, nous proposons un nouvel algorithme qui adapte de façon dynamique le multiplicateur de Lagrange en fonction des caractéristiques de la vidéo d’entrée en utilisant la distribution des résidus transformés au niveau du macrobloc. Le but recherché est d’augmenter la performance de codage de l’espace débit-distorsion.

Nous appliquons plusieurs modèles aux coefficients résiduels transformés (Laplace, Gaussien, densité de probabilité générique) au niveau du macrobloc pour estimer le débit et la distorsion et étudier dans quelle mesure ils correspondent aux vraies valeurs. Nous analysons ensuite les bénéfices et désavantages de quelques modèles simples (Laplace et un mélange de Laplace et Gaussien) du point de vue du gain en compression et de l’amélioration visuelle en rapport avec le code de référence du standard H.264 (amélioration débitdistorsion).

Plutôt que de calculer le multiplicateur de Lagrange basé sur un seul modèle appliqué sur toute la trame, comme proposé dans l’état de l’art, nous le calculons basé sur des modèles appliqués au niveau du macroblock. Le nouvel algorithme estime, à partir de la distribution des résidus transformés du macrobloc, le débit et la distorsion de chacun, pour ensuite combiner la contribution de chacun pour calculer multiplicateur de Lagrange de la trame.

Les expériences sur des types variés de vidéos ont démontré que la distorsion calculée au niveau du macrobloc est proche de la distorsion réelle offerte par le logiciel de compression vidéo de référence pour la plupart des séquences vidéo testées, mais un modèle fiable pour le débit est encore recherché particulièrement à très bas débit. Néanmoins, les résultats de compression de diverses séquences vidéo montrent que la méthode proposée performe beaucoup mieux que le Joint Model du standard H.264 et un peu mieux que l’état de l’art.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Thesis presented to École de technologie supérieure in partial fulfillment of the requirements for the master degree in information technology engineering". Comprend des références bibliographiques (pages 143-146).
Mots-clés libres: Compression vidéo. Compression vidéo Normes. Équations de Lagrange. Théorie du taux de distorsion. Imagerie (Technique) Qualité de l'image. H.264 Lagrange, macrobloc, multiplicateur
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Coulombe, Stéphane
Programme: Maîtrise en ingénierie > Génie
Date de dépôt: 13 avr. 2016 20:34
Dernière modification: 10 déc. 2016 16:18
URI: https://espace.etsmtl.ca/id/eprint/1263

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt