FR2829345A1

FR2829345A1 - Dispositif et procede de codage d'images video par compensation de mouvement

Info

Publication number: FR2829345A1
Application number: FR0111655A
Authority: FR
Inventors: Patrice Alexandre; Meur Olivier Le; Ludovic Noblet
Original assignee: Nextream SA
Current assignee: Nextream SA
Priority date: 2001-09-06
Filing date: 2001-09-06
Publication date: 2003-03-07
Anticipated expiration: 2021-09-06
Also published as: US7379604B2; FR2829345B1; WO2003024115A1; EP1425921A1; EP1425921B1; US20050031211A1

Abstract

L'invention concerne un dispositif et une méthode de codage d'images vidéo par compensation de mouvement.Le dispositif selon l'invention intègre des moyens de codage et des moyens de filtrage intégrés. Il comporte des moyens de calcul d'un coefficient de récursivité (α) en fonction d'un niveau de bruit estimé (σ inf , σ sup) et d'une erreur de prédiction (ε), des moyens de mesure de la corrélation intra-image et de la corrélation inter-image, des moyens de sélection d'un type de codage appliqué à l'image d'entrée courante en fonction au moins des mesures de la corrélation inter-images et des mesures de la corrélation intra-images et en fonction du niveau de bruit estimé (σ inf , σsup), des moyens de codage de l'image d'entrée courante en fonction du type de codage sélectionné.

Description

L'invention concerne un procédé et un dispositif de codage d'images vidéo par compensation de mouvement
Le codage par compensation de mouvement offre des possibilités de réduction de débit considérables sur des images animées qui présentent une forte cohérence temporelle.

L'acquisition des séquences d'images vidéo est encore aujourd'hui largement réalisée sous une forme analogique de sorte que les images, une fois acquises et éventuellement transmises puis stockées dans des formats analogiques, présentent une part sensible de bruit dans leur contenu. Une fois numérisées, ces images sont également souvent soumises à des opérations de stockage/édition qui, à leur tour introduisent un bruit de nature numérique cette fois. En final, une séquence d'images subit généralement une succession de transformations dont le résultat se caractérise par un bruit patio-temporel de nature fortement aléatoire. L'effet de ce bruit sur les procédés de codage par compensation de mouvement est fortement pénalisant en terme de rendement de codage dans la mesure o la nature aléatoire du bruit rend toute compensation de mouvement inefficace.

Le bruit représente donc une part importante du débit du flux binaire après codage. Cette composante ne présentant pas d'information utile, il est généralement souhaitable de l'atténuer par des procédés de filtrage dont le rôle est d'éliminer les composantes spatio-temporelles aléatoires dans la séquence d'images.

Parmi les techniques de réduction de bruit, une des techniques les plus appropriées consiste à moyenner de manière récursive les images de la séquence. Pour les plans/objets statiques d'une séquence, le moyennage permet d'atténuer la composante aléatoire propre au bruit tout en conservant, avec un certain degré de fidélité, les plans/objets originaux. Pour les plans/objets animés, le problème est plus délicat dans la mesure o un moyennage temporel introduit un effet de rémanence (ou encore de traînage) inacceptable. Il convient alors de choisir entre deux stratégies : laisser intacts les plans/objets en mouvement (donc laisser le bruit) ou bien utiliser une compensation de mouvement de façon à suivre les plans/objets dans leur

mouvement et filtrer dans la direction du mouvement. La première stratégie permet d'aboutir à un filtrage récursif adapté en mouvement (c'est-à-dire. adapté à la présence de mouvement), la seconde stratégie, intuitivement plus performante, réalise un filtrage récursif compensé en mouvement.

Pour diminuer les effets du bruit dans les systèmes de codage d'images par compensation de mouvement, des solutions connues consistent à placer un module de filtrage en amont du procédé de codage. Cependant cette solution constitue un surcoût non négligeable pour le système.

Afin de réduire les coûts d'un tel système, une solution consiste à intégrer les procédés de filtrage récursif et codage plutôt qu'à les cascader.

Dans cette approche, l'architecture de compensation de mouvement propre au codeur est mise à profit pour réaliser, en une seule passe, un filtrage récursif compensé en mouvement. Il en découle une architecture dont le rapport performance/coût d'implémentation dépasse, pour certaines configurations de codage, celui des solutions traditionnelles.

Le principe de réduction de bruit par filtre récursif repose sur l'absence de cohérence spatio-temporelle du bruit par rapport au signal utile. Il n'adresse de ce fait que les bruits de nature aléatoire tels que ceux rencontrés sur certains supports de transmission/stockage analogique et, dans une moindre mesure, ceux engendrés par certains procédés de codage numérique tels que la quantification. L'information contenue dans le signal utile étant caractérisée par son niveau de cohérence patio-temporel (superposition de plans/objets animés), la suppression du bruit s'obtient par moyennage temporel des plans/objets contenus dans la séquence. Pour réaliser ce moyennage, il convient de détecter les différents plans/objets de la séquence de façon à caractériser la nature du mouvement sur ces plans/objets.

Différents modes de réalisation de la fonction d'estimation de mouvement permettent d'aboutir à la prédiction. Certains modes utilisent une fonction d'estimation de mouvement par pixel , ce qui signifie qu'un

nouveau vecteur de déplacement est calculé pour chaque pixel. D'autres modes de réalisation exploitent les solutions d'estimation de mouvement par bloc , ce qui signifie que le même vecteur de mouvement est utilisé pour l'ensemble des pixels qui constituent le bloc (un bloc étant constitué d'une matrice de pixels contigus dans l'image). Il est évident que les modes basés sur une compensation de mouvement par bloc peuvent potentiellement présenter des limitations de performances lorsqu'il y a déformation importante des plans/objets en mouvement. Dans ce cas, il en résulte une erreur de prédiction importante qui engendre à son tour une atténuation de l'effet du filtre récursif.

On connaît d'après le brevet US 6,122, 314 le principe du filtrage récursif qui consiste à pondérer le signal d'erreur d'un codeur à compensation de mouvement et codage différentiel.

Cependant, ce brevet décrit un procédé dont la performance n'est pas maximale notamment lorsque le signal d'erreur est essentiellement composé d'une composante de bruit de forte énergie.

La présente invention concerne un dispositif de codage par compensation de mouvement fondé sur une gestion adaptative du type des images à coder et d'une estimation du niveau de bruit dans le but d'améliorer conjointement la performance du codage et du filtrage récursif, qui permet d'obtenir une bonne qualité d'image, en réduisant considérablement les effets négatifs exposés ci-dessus.

A cet effet, l'invention propose un dispositif de codage d'images vidéo par compensation de mouvement comprenant un codeur comportant : - des moyens de stockage d'au moins une image d'entrée, - des moyens d'estimation de mouvement, prévus pour produire des vecteurs de mouvement (D (dx, dy)) et des grandeurs représentatives de variations d'images compensées en mouvement (DFD), à partir d'une image d'entrée courante et d'au moins ladite image d'entrée stockée antérieurement dans lesdits moyens de stockage,

- des moyens de calcul d'une image compensée en mouvement à partir d'une image filtrée et desdits vecteurs de mouvement (D (dx, dy)), - des moyens de calcul d'une erreur de prédiction (g), entre ladite image d'entrée courante et ladite image filtrée et prédite par compensation de mouvement, - des moyens de calcul d'un coefficient de récursivité (a), - des premiers moyens de filtrage, destinés à produire une pondération de ladite erreur de prédiction par un coefficient de récursivité modifié (1-a), - des seconds moyens de filtrage, destinés à ajouter à l'erreur de prédiction pondérée par ledit coefficient de récursivité modifié, le contenu de ladite image d'entrée prédite lorsque ladite image d'entrée est une image codée en type intra, et - des moyens d'estimation d'au moins un niveau de bruit (ojnf, croup) en fonction d'au moins lesdites grandeurs représentatives de variations d'images compensées en mouvement (DFD) Selon l'invention, 0 ledit coefficient de récursivité (a) est calculé en fonction dudit niveau de bruit (ojnf, asp) et de ladite erreur de prédiction (8), 0 ledit dispositif de codage comporte : des moyens de mesure de la corrélation intra-image, 0 des moyens de mesure de la corrélation inter-images (FD), et 0 des moyens de sélection d'un type de codage appliqué à ladite image d'entrée courante en fonction au moins des mesures effectuées par les moyens de mesure de la corrélation inter- images et les moyens de mesure de la corrélation intra-image et en fonction dudit niveau de bruit estimé (ain, sup), - et les moyens de filtrage et le codeur d'une image compensée en mouvement sont dépendants dudit type de codage sélectionné par lesdits moyens de sélection.

Le calcul du coefficient de récursivité a en fonction du niveau de bruit estimé améliore l'efficacité du filtre pour un bruit donné. Avantageusement, le dispositif calcule au moins deux niveaux de bruit CJinf et CJsup'De préférence, lorsque l'erreur de prédiction est supérieure à la borne supérieure (sup, le coefficient de récursivité a vaut alors 0 et lorsque l'erreur de prédiction est inférieure à la borne cjnf, a vaut 0.9 .

Un tel dispositif améliore les performances du filtrage récursif pour un codage utilisant des images de type bi-directionnelles. En effet, l'utilisation d'images bi-directionnelles a pour effet indirect d'éloigner les images 1 ou P entre elles ce qui se traduit en général par une augmentation de l'erreur de prédiction. De plus, l'éloignement des images 1 ou P entre elles réduit la performance de la récursivité du filtre, notamment en ce qui concerne la vitesse de convergence du filtre.

De façon préférentielle, le coefficient de récursivité est calculé pour chaque pixel de l'image d'entrée.

Ainsi, le calcul du coefficient de récursivité est affiné et l'on évite les effets de flou liés à une homogénéisation de ce coefficient réalisée dans les systèmes basés sur des blocs.

Dans un mode de réalisation particulièrement avantageux, le dispositif de codage comprend des moyens de détection de changement de scène.

Ceci permet d'améliorer le codage des images en choisissant le type de codage appliqué à l'image courante en fonction également de la détection d'un changement de scène.

Préférentiellement ledit coefficient de récursivité (a) prend une valeur nulle pour la première image suivant le changement de scène lorsque les moyens de détection de changement de scène détectent un changement de scène.

De manière avantageuse, lesdits moyens de sélection d'un type de codage sélectionnent le type de codage appliqué à ladite image d'entrée courante en fonction d'informations reçues dudit détecteur de changement de scène.

Préférentiellement, les moyens de sélection du type de codage de l'image ajustent le séquencement des types de codage et le choix du nombre d'images bi-directionnelles successives.

Selon un mode de réalisation particulier, la première image suivant une détection de changement de scène est codée en type intra et l'image suivante est codée en type prédictif.

En présence d'un changement de scène, le choix d'un codage en type Intra de la première image suivant ce changement de scène améliore la performance du codage. Dans le cadre de l'invention, ce forçage de la première image de la nouvelle séquence en type Intra s'accompagne en plus d'une remise à zéro du bloc de filtrage (forçage a = 0 sur l'image Intra de la nouvelle séquence). Cette remise à zéro est commandée par un signal RAZ émis vers le codeur vidéo.

Dans un mode de réalisation particulier l'espacement entre deux images de type intra ou de type prédictive successives est calculé suivant la formule :
GOPM = Max [GOPMdéfaut-nint [p * max { (FDd-LDcj)/LDd, 0}], 1], 0 :

- vaut de préférence 1 et nint représente l'entier le plus proche,

- FDd=Max (1, FD- jnf), - LDd=Max (1, LD-cinf), - GOPMdéfaut représente la valeur maximale admise par le dispositif de codage, Max représentant la fonction maximum, FD représentant la mesure de corrélation inter-trame et LD représentant la mesure de corrélation intratrame.

Dans ce mode de réalisation, les moyens de sélection du type d'image, lorsqu'ils sont en présence d'une nouvelle scène d'images, démarrent avec une image de type Intra directement suivie par une image de type Prédite. Ce choix permet d'obtenir la plus grande vitesse de convergence du filtre récursif embarqué dans le codeur. Ensuite, le sélecteur de type d'image détermine le choix approprié de l'espacement entre images 1 ou P à utiliser en fonction des mesures de corrélation spatio-temporelles corrigées par la mesure de la borne inférieure du niveau de bruit. Il en résulte un choix optimisé de la performance conjointe du codeur et du filtre récursif.

L'invention concerne également un procédé de codage d'images vidéo par compensation de mouvement dans lequel - on mémorise au moins une image d'entrée, - on produit des vecteurs de mouvement (D (dx, dy)) et des grandeurs représentatives de variations d'images compensées en mouvement (DFD), à partir d'une image d'entrée courante et d'au moins ladite image d'entrée stockée antérieurement dans lesdits moyens de stockage, - on calcule une image compensée en mouvement à partir d'une image filtrée et desdits vecteurs de mouvement (D (dx, dy)), - on calcule une erreur de prédiction (S), entre ladite image d'entrée courante et ladite image filtrée et prédite par compensation de mouvement,

- calcule un coefficient de récursivité (a), - on produit une pondération de ladite erreur de prédiction par un coefficient de récursivité modifié (1-a), et - on ajoute à l'erreur de prédiction pondérée par ledit coefficient de récursivité modifié, le contenu de ladite image d'entrée prédite lorsque ladite image d'entrée est une image codée en type intra, - on estime au moins un niveau de bruit (ajnf, crsup) en fonction d'au moins lesdites grandeurs représentatives de variations d'images compensées en mouvement (DFD), caractérisé en ce que - on calcule ledit coefficient de récursivité (a) en fonction dudit niveau de bruit estimé (crinf, crsup) et de ladite erreur de prédiction (8), - on mesure la corrélation intra-image, - on mesure la corrélation inter-image, - on sélectionne un type de codage appliqué à ladite image d'entrée courante en fonction au moins des mesures de la corrélation inter-images et des mesures de la corrélation intra- images et en fonction dudit niveau de bruit estimé (ainf, crsup), - on code ladite image d'entrée courante en fonction dudit type de codage sélectionné.

L'invention sera mieux comprise et illustrée au moyen d'exemples de modes de réalisation et de mise en oeuvre avantageux, nullement limitatifs, en référence aux figures annexées sur lesquelles : - la figure 1 représente un schéma synoptique d'un codeur par compensation de mouvement incorporé dans le dispositif de la figure
4, - la figure 2 représente l'évolution du coefficient de récursivité oc en fonction de l'erreur de prédiction 8.

- la figure 3 représente le séquencement des images codées selon la norme MPEG-2, - la figure 4 représente un dispositif selon l'invention, - la figure 5 représente les modifications apportées au séquencement des images selon l'invention, - la figure 6 représente un organigramme de fonctionnement d'un mode de réalisation du sélecteur de type de codage de l'image représenté en figure 4, - la figure 7 représente les étapes de réinitialisation des compteurs GOPMindex et GOPNindex mis en oeuvre dans un sélecteur de type d'image représenté en figure 4, - la figure 8 représente les étapes du calcul du type d'image à partir des index GOPMindex et GOPNindex mis en oeuvre dans un sélecteur de type d'image représenté en figure 4.

La figure 1 représente le principe d'un codeur 22 à compensation de mouvement intégrant un dispositif de filtrage récursif. Attention aux termes selon l'invention . Ils ont une définition bien précise, puisqu'ils renvoient directement aux objets définis dans les revendications indépendantes et fonctionnant selon la norme MPEG-2.

On note : - x, y et t respectivement l'abscisse, l'ordonnée et le temps, - u (x, y ; t) : un signal d'entrée courant, - u (x, y ; t-T) : un signal d'entrée retardé d'un délai T (T représente un délai d'une trame vidéo par exemple), - D (dx, dy) : un vecteur de déplacement, dx désignant le décalage (offset) de déplacement suivant l'axe des abscisses et dy le décalage de déplacement suivant l'axe des ordonnées, - v (x, y ; t) la sortie du filtre, - v (x+dx, y+dy ; t-T) la sortie du filtre compensée en mouvement retardée d'un délai T.

- a coefficient de récursivité pour l'échantillon courant, -6nif limite inférieure d'un niveau de bruit estimé pour l'image entière, - coup : limite supérieure d'un niveau de bruit estimé pour l'image entière, - NL : fonction non linéaire a = f (8, a ; nf, c ? gup) - DFD (x, y ; t) : DFD (x, y ; t) = u (x, y ; t)-u (x+dx, y+dy ; t-T) appliquée sur un pixel ou sur un bloc de pixels.

Le codeur 22 comprend une mémoire 1, prévue pour stocker une image d'entrée (signal u (x, y ; t)) et un estimateur de mouvement par blocs 3, prévu pour produire par blocs des vecteurs de mouvement D (dx, dy) et des DFDs, à partir d'une image d'entrée courante (signal u (x, y ; t)) et d'une image d'entrée stockée antérieurement (signal u (x, y ; t-T)) dans la mémoire 1.

Un module de retard 14 retarde le signal d'entrée u (x, y ; t) d'une période trame vidéo et produit donc en sortie un signal u (x, y ; t-T). Le module de retard 14 permet d'obtenir des statistiques de DFD en phase avec l'image à filtrer.

Le dispositif de codage comporte en outre un module de compensation de mouvement 2 dont la sortie est aiguillée vers un multiplexeur 16 et vers un additionneur 6.

Le multiplexeur 16 aiguille le signal v (x+dx, y+dy ; t-T) en sortie du compensateur de mouvement 2 vers un additionneur 8 dont la sortie est reliée à l'entrée d'un module 9 de codage DCT ou vers un additionneur 15 dont la sortie est reliée en entrée du compensateur de mouvement 2. La commande du multiplexeur est réalisée par le choix du type d'images à coder. Cette commande est générée par un sélecteur du type de l'image 23 (figure 4). Si le type de codage intra est sélectionné, alors la sortie du multiplexeur est connectée à l'additionneur 18. Sinon, si le type prédictif est sélectionné, la sortie du multiplexeur est connectée en entrée de l'additionneur 15.

La norme MPEG-2 prévoit trois types de codage des images et le séquencement de ces images est représenté en figures 3 et 5. Le premier type, indispensable pour démarrer l'opération de codage d'une séquence, est le type intra noté 1. Dans ce type, le codeur ignore l'image prédite en vidant la mémoire utilisée par le bloc de compensation de mouvement. L'erreur de prédiction devient alors l'image à coder et aucun vecteur de mouvement n'est associé à cette image codée.

Le second type de codage des images repose sur un codage différentiel. Le codeur ayant stocké l'image précédemment codée et compensée en mouvement, appelée image prédite, l'erreur de prédiction constitue dans ce cas la différence entre l'image réelle et l'image prédite.

Cette différence subit alors le même traitement que l'image codée dans le type Intra et les opérations de quantification inverse et DCT inverse permettent d'accumuler le résultat de l'erreur de prédiction quantifiée à l'image prédite. Les images codées par prédiction simple (en anglais Forward prediction ) sont appelées images prédictives et notées P. Ces images utilisent comme image prédite soit l'image Intra soit l'image prédictive temporellement antérieure.

Le dernier type de codage possible est le type Bi-directionnel pour lequel une image peut utiliser deux images prédites pour la construction de l'erreur de prédiction. Ce doublement de possibilité de compensation de mouvement en fait un procédé de codage plus efficace que le type Prédictif.

Par construction, une image Bi-directionnelle, notée B, s'appuie sur les deux images Intra ou Prédictive qui l'encadrent temporellement. Cela signifie que le codage dans ce type impose de désorganiser la structure temporelle de présentation des images car le décodeur, pour décoder une image Bidirectionnelle, doit disposer de l'image Intra ou Prédictive temporellement postérieure. Dans ce cas, le décodeur utilise une mémoire pour réorganiser les images dans leur ordre de présentation. Ce type de codage n'est pas représenté en figure 1.

Une caractéristique importante des images Bi-directionnelles est qu'elles n'entrent pas dans la mémoire du bloc de compensation de

mouvement 2 du fait qu'elles ne sont jamais utilisées dans la construction des images prédites (rôle uniquement joué par les images Intra et Prédictives). De ce fait, seules les images Intra et Prédictives sont nécessaires sous leur forme décodée local dans le processus de codage. Le bloc d'estimation de mouvement 3, dans le cas d'images B, réalise la recherche du vecteur candidat (celui qui minimise l'erreur quadratique) relativement aux deux dernières images codées dans les types Intra ou Prédictif.

L'additionneur 6 est capable de soustraire l'image d'entrée courante (signal u (x+, y+ ; t-T)) et une image prédite antérieurement par compensation de mouvement (signal v (x+dx, y+dy ; t-2T)) à partir d'une image filtrée. L'additionneur 6 produit ainsi une erreur de prédiction 8.

Le codeur 22 est également pourvu d'une unité 4 de détermination de niveaux de bruit oinfet Ogup en fonction des DFDs. Les niveaux de bruit Ojnf et sup sont utilisés pour calculer un coefficient de récursivité a.

Un module de calcul 5 du coefficient de récursivité a est destiné à recevoir de l'unité 4 les niveaux de bruit omf et cgup et de l'additionneur 6, l'erreur de prédiction s, et à calculer par une fonction de filtre non linéaire (NL) le coefficient de récursivité a. Les limites du niveau de bruit estimé ainfet Ogup s'obtiennent à partir des valeurs des DFDs. De manière préférentielle, les limites du niveau de bruit sont déduites d'une analyse statistique des DFDs calculées pour l'image en définissant deux seuils sur une représentation en histogramme.

Dans un type de réalisation particulier on peut prendre par exemple pour a ; nfta valeur de la DFD pour laquelle l'histogramme des DFDs atteint 5% de la population image et pour asp la valeur de la DFD pour laquelle l'histogramme des DFDs atteint 95% de la population image. La valeur croup

reste néanmoins bornée au maximum à 4 fois la valeur aine de façon à éviter d'entacher l'estimation du niveau de bruit des erreurs de prédiction et quantification introduites par le codeur.

Un multiplieur 7 permet de multiplier l'erreur de prédiction E en sortie de l'additionneur 6 par (1-a), valeur reçue du module de calcul 5. De plus, un second additionneur 8 est destiné à recevoir du multiplieur 7 le résultat de ce produit et à l'additionner à l'image prédite antérieurement par compensation de mouvement (signal v (x+dx, y+dy ; t-2T)) à partir d'une image filtrée lorsque l'image est codée en type intra.

Lorsque l'image u (x, y ; t-T) est destinée à un codage en type intra, il faut en effet ajouter à l'erreur de prédiction 8 l'image prédite afin que le décodeur puisse décoder une image codée en type intra.

Le codage par compensation de mouvement est généralement combiné à un codage par réduction entropique dont le rôle est de rendre le débit de codage fixe au cours du temps. Cela permet notamment d'asservir le procédé de codage au débit imposé par un canal de transmission du flux codé. Parmi les approches couramment rencontrées, le codage par quantification dans le domaine DCT (acronyme anglais de Discrete Cosinus Transform signifiant Transformation en Cosinus Discrète ) est le plus répandu et est repris ici à titre illustratif et non pas limitatif.

Le dispositif comporte donc en outre le module 9 de codage DCT qui effectue une transformation en cosinus discrète de l'erreur de prédiction E. Le signal ainsi transformé subit une quantification par un module 10 de quantification afin de réduire son débit.

Le dernier étage avant de générer le flux est un étage 11 de codage entropique VLC (acronyme en anglais de Variable Length Coding signifiant codage à longueur variable ) dont le rôle est de réduire encore le débit en exprimant par des codes courts les séquences binaires dont la probabilité d'apparition est la plus élevée. Il reçoit en entrée le signal issu du

module de quantification 10. Le module VLC 11 réalise également le codage des vecteurs de déplacement issus du bloc d'estimation de mouvement suivant le même principe.

Le dispositif comporte également un module 12 réalisant l'opération inverse du module 10, soit une opération de quantification inverse IQ. Ce module 12 est connecté à un module 13 qui réalise l'opération inverse du module 9, soit une transformation inverse en cosinus discrète IDCT. Ces modules permettent de disposer de l'image décodée locale précédente qui correspond à l'image reconstruite par le décodeur. L'erreur de prédiction s constitue alors l'écart entre l'image à coder et l'image prédite par le décodeur par compensation de mouvement.

En ignorant les dégradations apportées par le quantificateur 10 et le quantificateur inverse 12, on a donc à la sortie de l'additionneur 15 :

v (x, y ; t-T) = (1-a) x u (x, y ; t-T) + a x v (x+dx, y+dy ; t-2T)) Eq (1)
L'équation (1) ci-dessus est mise à jour à chaque pixel u (x, y ; t-T) de l'image entrante en fonction des limites du niveau de bruit estimé dans l'image et de l'erreur de prédiction s. Cette mise à jour se fait en agissant sur le coefficient de récursivité a en sortie du module de calcul 5. Ce module 5 réalise la fonction de transformation (Figure 2) :

Cette fonction fait tendre le coefficient de récursivité a vers 0.9 lorsque l'erreur de prédiction s décroît vers la limite inférieure du bruit estimé, l'erreur est alors entièrement assimilée à du bruit. A l'inverse, a tend vers 0 lorsque l'erreur de prédiction croît vers la limite supérieure du bruit estimé : au-delà de cette limite, l'erreur est alors entièrement assimilée à du signal utile.

La sortie du module 13 est reliée à l'additionneur 15 qui additionne le signal produit par le module 13 IDCT et l'image prédite v (x+dx, y+dy ; t-2T) lorsque le type de codage sélectionné est le type prédictif. La sortie de l'additionneur 15 est injectée dans le module 2 de compensation de

mouvement. En sortie du module 15, le signal v (x, y ; t-T) est également le signal en sortie d'un décodeur qui décoderait le flux de sortie.

Dans le cas d'un codage suivant la norme MPEG-2, le niveau de performance du filtre récursif est dépendant du choix de séquencement du type de codage des images. En effet, les images prédites par compensation de mouvement sont déduites des images décodées locales qui ne sont codées que dans les types intra ou prédictifs.

La présence d'images codées en type bi-directionnel provoque l'éloignement entre elles des images intra et prédictives, ce qui diminue potentiellement la qualité des images prédites lorsque les mouvements sont complexes.

Plus précisément, le signal d'erreur 8 obtenu en sortie de l'additionneur 6 peut se décomposer en trois composantes :

Epred représente l'erreur de prédiction induite par la compensation de mouvement, par exemple lors de rotation ou de déformations.

Ebruit représente la composante de bruit aléatoire du signal vidéo.

quant représente la composante de bruit de quantification induite par le codeur lui-même, au cours des opérations de quantification (Q) et de déquantification (IQ).

L'unité 4 d'estimation du niveau de bruit a pour rôle d'estimer le niveau de bruit brUit. Elle reçoit en entrée les DFDs obtenues par l'estimateur de mouvement 3, et réalise une analyse statistique des DFDs qu'elle reçoit en entrée. Le niveau de bruit étant généralement homogène dans une image, l'estimation du niveau de bruit s'obtient alors par seuillage de l'histogramme des DFDs.

La réduction de bruit est d'autant plus efficace que les composantes spredet equant sont faibles par rapport à la composante Ebruit.

L'éloignement entre elles d'images codées en type intra ou prédictive a pour effet d'augmenter l'erreur de prédiction Spred ce qui tend à réduire l'action du filtre qui identifie cette erreur comme du signal utile. D'autre part, la nature récursive du procédé de filtrage induit un phénomène de convergence sur une durée qui est d'autant plus grande que l'éloignement entre images intra ou prédictives est important.

De façon préférentielle, le niveau de bruit induit par le procédé de quantification 8quant n'est pas pris en compte dans l'estimation du niveau de bruit.

Un dispositif de codage selon l'invention (Figure 4) comporte un codeur 22 conforme à celui de la figure 1. Il reçoit en entrée le signal u (x, y ; t) à coder.

Celui-ci rentre dans un module de retard 21 o il est retardé d'une période trame vidéo T. La sortie du module de retard 21 est reliée au codeur 22, à un module 25 de mesure de la corrélation intra-image et à un module 26 de mesure de la corrélation inter-images.

La mesure de corrélation inter-images, appelée encore corrélation temporelle FD (acronyme en anglais de Frame Difference signifiant différence entre image ), entre deux images successives peut s'obtenir par la moyenne par image des valeurs :
FD (x, y ; t) = u (x, y ; t)-u (x, y ; t-T), T représentant le retard temporel appliqué sur l'image u (x, y ; t).

La mesure de corrélation intra-image, appelée encore corrélation spatiale, LD (acronyme en anglais de Line Difference signifiant différence entre lignes ) peut s'obtenir par la moyenne par image des valeurs :

LD (x, y ; t) = u (x, y ; t)-u (x, y+1 ; t), y et y+1 représentant deux indices de lignes adjacentes.

Le sélecteur 23 du type de codage de l'image reçoit en entrée les mesures faites par les modules 25 et 26, et la borne inférieure du niveau de bruit uinf estimé par le codeur vidéo 22.

Dans un type de réalisation préféré, le sélecteur de type d'images 23 reçoit également une information de changement de scène délivrée par un détecteur de changement de scène 24.

Le détecteur de changement de scène 24 mesure les ruptures de continuité des corrélations inter-trame selon des procédés connus. Ainsi le détecteur 24 identifie la position des images correspondant à un changement de plan, dans le cas par exemple de montage ou de prise de vue. Le procédé de décision du type d'image à coder à partir des informations de changement de scène est détaillé sur les figures 6 à 8.

A partir des données qu'il reçoit en entrée, le sélecteur 23 émet vers le codeur 22 le choix du type d'image de codage appropriée au contenu de la séquence vidéo ainsi qu'un ordre de remise à zéro du filtre (a = 0).

Un exemple des modifications apportées sur le type de codage des images par le sélecteur 23 lors d'un changement de scène est détaillé cidessous, en référence à la figure 5.

L'organisation représentée des images est une organisation temporelle, telle qu'affichée par un décodeur, pour deux scènes successives scène 1 et scène 2 .

Le flux A 1 est le flux obtenu par l'utilisation des valeurs par défaut qui sont :

GOPNdéfaut = 12 GOPMdéfaut = 3,

La valeur GOPN représente l'espacement entre deux images intra successives, soit 12 dans l'exemple proposé. La valeur GOPM représente l'espacement entre deux images 1 ou P successives, soit 3 dans l'exemple proposé.

Le flux A2 est un exemple de flux obtenu à la sortie du codeur 22 par l'intermédiaire du sélecteur de type de codage de l'image 23.

La première image de la scène 2 est codée suivant le type intra (1) et non plus suivant le type bi-directionnel (B) comme dans le flux Ai. La seconde image de la scène 2 est codée en utilisant le type prédictif (P) et non pas le type bidirectionnel B comme c'est le cas dans le codage par défaut.

De plus, la valeur de GOPM est réduite à 2 de façon à améliorer la convergence du filtre.

Le fonctionnement d'un type de réalisation du sélecteur 23 permettant de générer le flux A2 représenté en figure 5 est exposé ci-après, en référence à l'organigramme de la Figure 6.

Lorsqu'une nouvelle image est reçue à l'entrée du codeur 22 (signal u (x, y ; t)) (étape E1), le détecteur 24 détecte un changement de scène à l'aide des mesures de corrélation inter-image fournies par le module 26. Le sélecteur 23 reçoit également la valeur du niveau de bruit cinf du codeur 22 ainsi que les mesures de corrélation intra-image LD et les mesures de corrélation inter-images FD fournies respectivement par les modules 25 et 26.

A partir des ces mesures, le sélecteur 23 calcule une valeur de GOPM en fonction de la valeur GOPM par défaut, des mesures FD et LD et de crinf ceci afin de :
1-contrôler une convergence correcte du filtrage à chaque nouvelle scène d'images et
2-contrôler la faible proportion des erreurs induites par le procédé de codage par rapport au niveau de bruit contenu dans le signal vidéo.

Pour répondre à ces deux points, une première étape consiste à forcer un codage en type prédictif de l'image qui suit temporellement la première

image d'un changement de scène. En complément, il est judicieux de choisir un espacement entre images 1 ou P afin de diminuer les erreurs induites par le procédé de codage.

L'espacement par défaut entre 2 images 1 ou P successives conditionne la rapidité de convergence du filtre récursif embarqué dans le codeur. Il est donc important d'accélérer la convergence du filtre en réduisant l'espacement entre les images 1 ou P juste après un changement de scène.

Selon un mode de réalisation particulièrement avantageux, la valeur de cet espacement adaptée aux mesures de corrélation intra-et inter-images réalisées en amont du codeur ainsi que de la borne inférieure de niveau de bruit estimée par le codeur.

Ceci consiste dans un premier temps à réaliser une correction de bruit sur les mesures des FDs et des LDs. Les mesures FD et LD, en présence de bruit aléatoire, sont entachées de la valeur moyenne de ce bruit. Il convient

donc de corriger ces valeurs par la valeur du bruit amf estimé par le codeur.

FDd = max (1, FD-oinf) LDd = max (1, LD-a ; jif)

Dans un second temps, cela consiste à calculer la valeur de GOPM.

On prend par exemple :
GOPM = GOPMdéfaut-nint [p * max { (FDd-LDd)/LDd, 0}].

Dans le cas d'un codeur MPEG, la valeur de GOPM est bornée. On effectue donc un seuillage de la valeur de GOPM obtenue selon la formule suivante : GOPM = max {GOPM, 1}
La valeur GOPMdéfaut est la valeur maximale absolue admise par le codeur MPEG en fonction des capacités de mémorisation utilisées pour la réorganisation.

Le paramètre p permet d'accentuer plus ou moins l'adaptation de la valeur GOPM au contenu des images vidéo. Ainsi, plus ss tend vers la valeur "0", moins il y a adaptation, la valeur GOPM prenant alors essentiellement la valeur GOPMdéfaut. De façon préférentielle, on donne à p la valeur 1 .

Lorsqu'un changement de scène est détecté, étape E2, on passe à une étape E3, dans laquelle le sélecteur 23 positionne à la valeur 1 les compteurs GOPNindex et GOPMindex, Scenecutflag et RAZ.

Ensuite, on passe à une étape E8 et on calcule selon des étapes F1 à F5 décrites ultérieurement (Figure 8), le type d'image.

Lorsque le type d'image est déterminé, il est envoyé au codeur 22, étape E9, ainsi que le signal RAZ. Le signal RAZ est une commande de forçage à la valeur 0 , vers le dispositif de filtrage, du coefficient de

récursivité a. Lorsque a vaut 0 , alors l'erreur de prédiction s n'est pas pondérée, ceci afin d'éviter un moyennage récursif entre des images appartenant à des plans différents.

Lorsqu'aucun changement de scène n'est détecté, étape E2, on passe à une étape E4 de test du signal Scenecutflag. Le signal Scenecutflag permet de savoir si l'image précédente est une image de début de scène ou non. Si la valeur de ce signal est égale à 1 , alors on passe à une étape

E7, au cours de laquelle on incrémente de 1 le compteur GOPNindex, on attribue la valeur 1 au compteur GOPMindex et la valeur 0 aux signaux SceneCutFlag et RAZ. On passe ensuite à l'étape E8 décrite précédemment.

Au cours de l'étape E4, si le signal SceneCutFlag ne vaut pas 1 , on passe à une étape E5 et on incrémente de 1 les compteurs GOPMindex et GOPNindex. Ensuite, on passe à une étape E6 dans laquelle on met à jour les compteurs GOPMindex et GOPNindex en fonction des signaux GOPNdéfaut et GOPM selon des étapes S1 à S5 décrites ci-après (Figure 7).

On s'intéresse maintenant (Figure 7) aux étapes de réinitialisation S1 à S5 des signaux GOPNindex et GOPMindex, effectuées lors de l'étape E6 (Figure 6).

Lorsque la valeur du compteur GOPMindex est supérieure à la valeur du signal GOPM (test de l'étape S1), on affecte au compteur GOPMindex la valeur 1 (étape S2), puis on passe à l'étape S3. Sinon, lorsque la valeur GOPMindex est inférieure ou égale à la valeur de GOPM, on passe directement à l'étape S3. On teste ensuite si la valeur de GOPNindex est supérieure à la valeur GOPNdéfaut (étape S3). Si elle est supérieure alors on teste si la valeur de GOPMindex est égale à 1 (étape S4). Si oui, alors on affecte la valeur 1 à GOPNindex (étape S5), sinon on ne modifie pas la valeur de GOPNindex.

Le calcul du type d'image à partir des index GOPMindex et GOPNindex est effectué de la manière suivante (Figure 8)
Lorsque GOPNindex vaut 1 (test d'une étape F1), le type d'image sélectionné est le type intra (étape F3). Lorsque GOPNindex ne vaut pas 1 , on fait un test sur la valeur de GOPMindex (étape F2). Si GOPMindex vaut 1 , alors le type d'image sélectionné est une image prédite (étape F4).

Si la valeur de GOPMindex n'est pas égale à 1 , alors le type d'image sélectionné est une image bidirectionnelle (étape F5).

Claims

Revendications 1. Dispositif de codage d'images vidéo par compensation de mouvement comprenant un codeur (22) comportant : - des moyens de stockage (1) d'au moins une image d'entrée, - des moyens d'estimation de mouvement (3), prévus pour produire des vecteurs de mouvement (D (dx, dy)) et des grandeurs représentatives de variations d'images compensées en mouvement (DFD), à partir d'une image d'entrée courante et d'au moins ladite image d'entrée stockée antérieurement dans lesdits moyens de stockage, - des moyens de calcul d'une image compensée en mouvement à partir d'une image filtrée et desdits vecteurs de mouvement (D (dx, dy)), - des moyens de calcul (5) d'une erreur de prédiction (s), entre ladite image d'entrée courante et ladite image filtrée et prédite par compensation de mouvement, - des moyens de calcul d'un coefficient de récursivité (a), - des premiers moyens de filtrage (7), destinés à produire une pondération de ladite erreur de prédiction par un coefficient de récursivité modifié (1-a), - des seconds moyens de filtrage (8,16), destinés à ajouter à l'erreur de prédiction pondérée par ledit coefficient de récursivité modifié, le contenu de ladite image d'entrée prédite lorsque ladite image d'entrée est une image codée en type intra, et - des moyens d'estimation (4) d'au moins un niveau de bruit (ojnf, crsup) en fonction d'au moins lesdites grandeurs représentatives de variations d'images compensées en mouvement (DFD) ledit dispositif de codage étant caractérisé en ce que : - ledit coefficient de récursivité (a) est calculé en fonction dudit niveau de bruit (crinf, crsup) et de ladite erreur de prédiction (s),

<Desc/Clms Page number 23>

0 -ledit dispositif de codage comporte : des moyens de mesure (25) de la corrélation intra-image (LD), 0 des moyens de mesure (26) de la corrélation inter-images (FD), et 0 des moyens de sélection (23) d'un type de codage appliqué à ladite image d'entrée courante en fonction au moins des mesures effectuées par les moyens de mesure (26) de la corrélation inter-images et les moyens de mesure (25) de la corrélation intra-image et en fonction dudit niveau de bruit estimé (o,inf, sup), - et les moyens de filtrage (7,8, 16) et le codeur d'une image compensée en mouvement sont dépendants dudit type de codage sélectionné par lesdits moyens de sélection (23).
2. Dispositif selon la revendication 1 caractérisé en ce que ledit coefficient de récursivité est calculé pour chaque pixel de ladite image d'entrée.
3. Dispositif selon l'une quelconque des revendications 1 ou 2 caractérisé en ce qu'il comprend des moyens de détection (24) de changement de scène.
4. Dispositif selon la revendication 3 caractérisé en ce que ledit coefficient de récursivité (a) prend une valeur nulle pour la première image suivant le changement de scène lorsque les moyens de détection (24) de changement de scène détectent un changement de scène.
5. Dispositif selon l'une des revendications 3 ou 4 caractérisé en ce que lesdits moyens de sélection (23) d'un type de codage sélectionnent le type de codage appliqué à ladite image d'entrée courante en fonction d'informations reçues dudit détecteur de changement de scène.
6. Dispositif selon l'une quelconque des revendications 1 à 5 caractérisé en ce que les images sont codées en type intra, prédictif ou bi-directionnel et les moyens de sélection (23) du type de codage de l'image ajustent le

<Desc/Clms Page number 24>

séquencement des types de codage et le choix du nombre d'images bidirectionnelles successives.
7. Dispositif selon la revendication 6 caractérisé en ce que la première image suivant une détection de changement de scène est codée en type intra et l'image suivante est codée en type prédictif.
8. Dispositif selon l'une quelconque des revendications 6 à 7 caractérisé en ce que l'espacement (GOPM) entre deux images de type intra ou prédictif successives est calculé suivant la formule

GOPM = Max [GOPMdéfaut-nint [p * max { (FDd-LDd)/LDd, 0}], 1], 0 : - ss vaut de préférence 1 et nint représente l'entier le plus proche,

- FDd = Max (1, FD-a,inf), - LDd=Max (1, LD-ainf), - GOPMdéfaut représente la valeur maximale admise par le dispositif de codage, Max représentant la fonction maximum, FD représentant la mesure de corrélation inter-trame et LD représentant la mesure de corrélation intratrame.
9. Procédé de codage d'images vidéo par compensation de mouvement dans lequel - on mémorise au moins une image d'entrée, - on produit des vecteurs de mouvement (D (dx, dy)) et des grandeurs représentatives de variations d'images compensées en mouvement (DFD), à partir d'une image d'entrée courante et d'au moins ladite image d'entrée stockée antérieurement dans lesdits moyens de stockage,

<Desc/Clms Page number 25>

- on calcule une image compensée en mouvement à partir d'une image filtrée et desdits vecteurs de mouvement (D (dx, dy)), - on calcule une erreur de prédiction (s), entre ladite image d'entrée courante et ladite image filtrée et prédite par compensation de mouvement, - on calcule un coefficient de récursivité (a), - on produit une pondération de ladite erreur de prédiction par un coefficient de récursivité modifié (1-a), et - on ajoute à l'erreur de prédiction pondérée par ledit coefficient de récursivité modifié, le contenu de ladite image d'entrée prédite lorsque ladite image d'entrée est une image codée en type intra, - on estime au moins un niveau de bruit (ojnf, cysup) en fonction d'au moins lesdites grandeurs représentatives de variations d'images compensées en mouvement (DFD), caractérisé en ce que - on calcule ledit coefficient de récursivité (a) en fonction dudit niveau de bruit estimé (crinf, (sup) et de ladite erreur de prédiction (s), - on mesure la corrélation intra-image (LD), - on mesure la corrélation inter-images (FD), - on sélectionne un type de codage appliqué à ladite image d'entrée courante en fonction au moins des mesures de la corrélation inter-images et des mesures de la corrélation intra- image et en fonction dudit niveau de bruit estimé (crinf, sup), - on code ladite image d'entrée courante en fonction dudit type de codage sélectionné.