EP1982330A2

EP1982330A2 - Procede de codage d'un signal audio source, dispositif de codage, procede de decodage, signal, support de donnees, produits programme d'ordinateur correspondants

Info

Publication number: EP1982330A2
Application number: EP07731600A
Authority: EP
Inventors: Pierrick Philippe; Christophe Veaux; Patrice Collen
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2006-02-09
Filing date: 2007-02-09
Publication date: 2008-10-22
Also published as: FR2897212A1; US20090187411A1; WO2007091000A3; WO2007091000A2

Abstract

L'invention concerne un procédé de codage d'un signal audio source, comprenant une transformation d'un espace amplitude / temps vers un espace multi-composantes décrites en amplitude, phase et temps, mettant en oevre une modélisation sinusoïdale du signal audio et délivrant des composantes sinusoïdales évoluant dans le temps. Le procédé comprend les étapes suivantes : - comparaison entre elles des composantes, pour définir au moins un groupe d'au moins deux composantes selon au moins un critère de similarité ; codage, pour au moins un groupe : d'au moins une donnée de référence, la donnée de référence étant représentée par une phase déroulée issue d'une première composante du groupe, dite composante de référence ; d'au moins une donnée de complément, associée à au moins une seconde composante du groupe, et permettant de reconstruire, en combinaison avec la donnée de référence, au moins une information représentative d'au moins une composante.

Description

Procédé de codage d'un signal audio source, dispositif de codage, procédé de décodage, signal, support de données, produits programme d'ordinateur correspondants.

1. Domaine de l'invention Le domaine de l'invention est celui du codage et du décodage de signaux audionumériques et plus précisément de signaux audio, tels que des signaux de musique ou de parole, comprenant un ensemble d'harmoniques, ou de sinusoïdes. Une application particulière de l'invention est l'amélioration du standard MPEG Audio (ISO/IEC 14496-3) qui prévoit que les données audio sont modélisées selon un codage paramétrique pour permettre une transmission du son et/ou de la parole à très bas débit.

Plus généralement, l'invention se place dans le cadre de la transmission, du stockage et de la compression des sons et de la musique de façon efficace.

2. Solution de l'art antérieur Une méthode classique pour transmettre de façon efficace un signal audio consiste tout d'abord à décomposer ce dernier en composantes sinusoïdales, puis à transmettre des informations relatives à ces composantes de façon qu'un récepteur soit en mesure de restituer le signal à partir de ces informations.

En effet, ces techniques de transmission exploitent les caractéristiques particulières d'une composante sinusoïdale selon laquelle celle-ci est hautement prédictible, et de ce fait, transmissible à un très faible débit.

On détaille ci-après la décomposition d'un signal en composantes sinusoïdales ainsi que les techniques classiques de codage de ce type de signal. 2.1 Analyse sinusoïdale La décomposition de signaux audio en composantes sinusoïdales est bien connue. Pour une présentation exhaustive de cette technique, on peut notamment se référer aux documents R. McAulay, T Quatieri, "Speech analysis/ synthesis based on a sinusoïdal représentation", IEEE Trans. on Acoustics, Speech and Signal Processing, vol. 34(4), pp. 744- 754, 1986 et Y. Medan, E. Yair and D. Chazan, "Super Resolution Pitch Détermination of Speech Signais" IEEE trans on Signal Processing vol. 39(1), pp. 40-48,1991.

La modélisation sinusoïdale se base sur le principe de décomposition d'un signal en une somme de sinusoïdes de fréquences, d'amplitudes et de phases variables dans le temps (partiels), et de bruit. En ne considérant que la partie déterministe du signal audio x(t), le signal modélisé x(t) s'exprime alors par: κ-ι x(t) = ∑ a_ktK ∞s(Φ_ktn(t))_y avec : nT ≤ t ≤ nT - \ ;

K correspond au nombre total de partiels contenus dans le signal ; - a_{k n} représente l'amplitude du partiel k durant la trame d'indice n ;

Φ^_n(0 représente la phase du partiel k durant la trame n ;

T représente le nombre d'échantillons décrivant une trame d'analyse.

La phase Φ^ _n(t) d'un partiel d'indice k dépend de sa fréquence f_k,n et de sa phase initiale φ_{k Q} telle que :

L'ensemble des trois paramètres (%_jπ ,Λ,n ^et Ψkfi ) permettent ainsi de décrire de façon concise, sur un intervalle de temps T , le signal x(t) à modéliser.

2.2 Codage de composantes sinusoïdales On peut se référer aux documents W. B. Kleijn and K. K. Paliwal, Speech

Coding and Synthesis_? Elsevier, Amsterdam, 1995, H. Purnhagen , N. Meine "HILN - The MPEG-4 Parametric Audio Coding Tools", ISCAS 2000 Vol III pp 201-204 etB. den Brinker, E.Schuijers and W.Oomen/'Parametric coding for high-quality audio", in Proc. 112nd AES Convention, Munich, Germany, 2002 pour une explication détaillée du codage et de la transmission des composantes sinusoïdales.

Plus généralement, le codage de composantes sinusoïdales a pour but de coder les paramètres ^α _έ,_« > /_&,_« et Ψk,o ^sous for∞e condensée en introduisant une distorsion de quantification. Ces valeurs quantifiées sont ensuite représentées de façon compacte par exemple à l'aide d'un codage dit sans pertes, c'est-à-dire réduisant le débit d'informations sans affecter le signal d'une erreur supplémentaire.

Dans la plupart des systèmes de codage/décodage, les composantes de phases (/>_{% $} ne sont pas transmises. Cette approche est basée sur le fait que l'oreille perçoit mal l'influence de la phase sur un signal musical. Ne sont alors codées que les trajectoires de la fréquence /^ _n et de l'amplitude a^ _n .

Classiquement, les valeurs de ces deux derniers paramètres sont quantifiées et transmises indépendamment les unes des autres, par le biais d'un quantificateur scalaire, par l'emploi d'une échelle logarithmique.

Une autre technique de codage, appelée codage SSC (pour « SinuSoidal Coding » en anglais) propose quant à elle un codage explicite des phases instantanées.

On rappelle qu'une composante sinusoïdale d'indice k est représentée, sur une trame d'analyse d'indice «par une fréquence fk _n , une phase instantanée, φ^ _n et une amplitude % „ , considérées comme constantes durant cette trame.

Cependant, ces trois paramètres évoluent au fil du signal, donc varient d'une trame à la suivante.

Pour plus de clarté, nous ne décrivons pas dans la suite du document les informations relatives à la transmission du paramètre d'amplitude % _n , ce dernier n'entrant pas dans le cadre de la présente invention.

Ces évolutions temporelles de fréquence et de phase peuvent être respectivement représentées par des fonctions temporelles qu'on notera /^(t) et <Pk(i) . Le codage de ces éléments est détaillé en Annexe A. Dans le cadre de la transmission, le codage, le stockage de signaux audio, on constate donc que les techniques de l'art antérieur proposent de transmettre les composantes sinusoïdales soit en estimant et en codant de manière indépendante les phases et les fréquences analysées, soit de manière conjointe, en utilisant la phase déroulée. De plus, quelle que soit la technique utilisée, il est nécessaire de transmettre ces informations pour chacune des composantes. De manière générale, ces techniques de l'art antérieur de codage de composantes sinusoïdales sont coûteuses en termes de débit, ou de mémoire de stockage. En effet, il est nécessaire d'envoyer au moins une information pour chaque trame d'analyse. De plus, cette opération est réitérée pour chacune des composantes sinusoïdales du signal sonore à transmettre, puisque celles-ci sont analysées et traitées indépendamment les unes des autres.

Ceci implique des étapes de quantification, codage, transmission ou stockage nombreuses et coûteuses. De telles techniques nuisent à l'efficacité de transmission ou de stockage. Enfin, les techniques de prédiction mises en œuvre sont efficaces uniquement lorsque la fréquence du partiel considéré est relativement stable dans le temps. Si cela n'est pas le cas, l'erreur de prédiction temporelle devient importante, augmentant de façon non négligeable la distorsion lors de la reconstruction du signal audio. 3. Objectifs de l'invention

L'invention a notamment pour objectif de pallier ces inconvénients de l'art antérieur.

Plus précisément, un objectif de la présente invention consiste à fournir une nouvelle technique de codage paramétrique des signaux , ainsi qu'une technique de décodage correspondante. Pour une même qualité de reconstruction, la solution proposée permet de réduire le débit de transmission.

Un autre objectif de la présente invention est de fournir une technique qui permette de réduire de façon importante l'espace mémoire nécessaire au stockage d'un signal harmonique codé. Notamment, un des objectifs de l'invention est de fournir une technique qui soit particulièrement adaptée à la transmission ou au stockage de signaux audionumériques, de parole ou de musique, et qui permette un codage efficace des composantes sinusoïdales d'un tel signal.

Un autre objectif de l'invention est de fournir une technique qui soit particulièrement efficace en termes de débit de transmission des composantes sinusoïdales, tout en générant une distorsion de signal équivalente, voire inférieure, aux techniques classiques de l'art antérieur.

Un objectif supplémentaire de l'invention est de proposer une telle technique qui s'étende ou soit aisément adaptable à, la plupart des spécifications existantes dans les différents standards du domaine du codage des signaux multimédia, telles que la norme MPEG-4 notamment. 4. Exposé de l'invention

Ces différents objectifs, ainsi que d'autres qui apparaîtront par la suite, sont atteints à l'aide d'un procédé de codage d'un signal audio source, comprenant une étape de transformation d'un espace amplitude / temps vers un espace multi composantes décrites en amplitude, en phase et en temps, mettant en œuvre une modélisation sinusoïdale du signal audio et délivrant une pluralité de composantes sinusoïdales évoluant dans le temps. Selon l'invention, le procédé de codage comprend les étapes suivantes : - comparaison entre elles des composantes, de façon à définir au moins un groupe d'au moins deux composantes selon au moins un critère de similarité prédéterminé ; - codage, pour au moins un des groupes : d'au moins une donnée de référence du groupe, ladite donnée de référence étant représentée par une phase déroulée issue d'une première composante dudit groupe, dite composante de référence ; d'au moins une donnée de complément, associée à au moins une seconde composante du groupe, et permettant de reconstruire, en combinaison avec la donnée de référence, au moins une information représentative d'au moins une composante.

Ainsi, l'invention repose sur une approche nouvelle et inventive du codage d'un signal audio source exploitant les caractéristiques des composantes sinusoïdales qui le constituent. En effet, le procédé de l'invention regroupe et code les composantes sinusoïdales du signal présentant un degré de similitude. Ainsi, il est possible de reconstruire chacune des composantes d'un groupe à partir de la connaissance de la composante de référence et de la donnée de complément correspondante. Une telle technique permet d'éviter de coder toutes les composantes indépendamment les unes des autres, et présente ainsi un gain très important en termes d'informations à quantifier, prédire, stocker ou encore transmettre.

Avantageusement, le critère de similarité tient compte d'une évolution de la phase d'au moins deux composantes. Une telle évolution de phase est aussi appelée phase déroulée.

Dans un mode de réalisation avantageux, l'étape de comparaison met en oeuvre un calcul de corrélation entre l'évolution de phase des deux composantes.

Le coefficient de corrélation permet en effet de refléter, selon sa valeur, un degré de ressemblance.

De façon avantageuse, l'étape de codage met en œuvre un codage différentiel selon un axe temporel comprenant : - une étape de prédiction de la donnée de référence et/ou de la donnée de complément, par rapport à au moins une valeur précédente correspondante ;

- une étape de détermination d'au moins un résidu à coder, par différence entre une donnée prédite et une donnée réelle. Avantageusement, le résidu est codé selon une période multiple de la période d'échantillonnage d'extraction des composantes, et en ce qu'une information représentative du multiple est générée.

Ce multiple est aussi appelé facteur de décimation. On gagne ainsi en termes de quantité d'informations à coder et quantifier. De façon avantageuse, l'étape de codage met en œuvre un codage différentiel selon un axe fréquentiel comprenant :

- une étape de codage d'au moins une donnée de référence, représentative d'une composante de référence dudit groupe ; - une étape de codage d'au moins une donnée de complément, représentative d'une autre composante du groupe, par comparaison avec la donnée de référence.

Avantageusement, l'étape de codage met en œuvre, pour chaque composante d'indice k, les équations suivantes :

n est l'indice de temps ;

Φ_{k n} est la valeur, à un instant indicé n, de la phase de la composante d'indice A: ;

Φ^ „ est une donnée de prédiction, à un instant indicé n, de la phase de la composante d'indice k ;

Φ_jt _M-i est une donnée quantifiée, à un instant indicé n-1, de la phase de la composante harmonique d'indice k ; - Φ_/5M_i est une donnée quantifiée, à un instant indicé n-1, de la phase de la composante d'indice / ; a_/ç et ai sont des valeurs proportionnelles aux fréquences de base des composantes k et /, choisies de façon à ce que le rapport de ces valeurs soit représentatif d'un rapport de fréquence entre la composante sinusoïdale d'indice k et la composante sinusoïdale d'indice /; d_{k n} est une valeur de résidu, à un instant indicé », entre la valeur de phase et la donnée de prédiction de la composante d'indice k. L'invention concerne par ailleurs un produit programme d'ordinateur pour la mise en œuvre du procédé de codage tel que décrit précédemment. L'invention concerne encore un dispositif de codage d'un signal audio source, comprenant des moyens de mise en œuvre d'un tel procédé.

L'invention concerne également un signal codé représentatif d'un signal audio source, dont les composantes d'un tel signal sont regroupées en au moins un groupe d'au moins deux composantes selon au moins un critère de similarité, chacun des groupes comprenant : - au moins une donnée de référence dudit groupe, ladite donnée de référence étant représentée par une phase déroulée issue d'une première composante dudit groupe, dite composante de référence ;

- au moins une donnée de complément, associée à au moins une seconde composante du groupe, et permettant de reconstruire, en combinaison avec ladite donnée de référence, au moins une information représentative d'au moins une composante.

Ce signal peut bien sûr comporter différentes informations produites par le procédé de codage décrit ci-dessus. L'invention concerne également un support de données comprenant au moins un tel signal codé.

L'invention concerne par ailleurs un procédé de décodage d'un tel signal codé. Ce procédé comprend les étapes suivantes :

- obtention de la ou les données de référence et de la ou les données de complément ; reconstruction de la ou les informations représentatives des composantes, à partir des données de référence et de complément.

Un tel procédé de décodage permet de décoder un signal codé selon le procédé de codage de l'invention tel que décrit précédemment. Avantageusement, un tel procédé de décodage comprend une étape de construction d'un signal audio reconstruit, représentatif du signal audio source, en tenant compte des informations représentatives des composantes.

Selon l'invention, un tel procédé de décodage comprend notamment : une étape de décodage d'au moins une donnée de référence, représentative d'une composante de référence du groupe ; une étape de décodage d'au moins une donnée de complément représentative d'une autre composante du groupe, par comparaison avec la donnée de référence ; une étape de reconstruction de l'autre composante par combinaison de la donnée de référence et de la donnée de complément. Le procédé de décodage permet ainsi de reconstruire efficacement les composantes présentant un lien harmonique avec une composante de référence (mise en œuvre d'un décodage « inter »).

Avantageusement, la donnée de complément ayant été codée selon une période multiple d'une période d'échantillonnage, le procédé de décodage comprend une étape d'interpolation d'une donnée de complément estimée pour les instants pour lesquels une donnée de complément n' a pas été codée.

De façon avantageuse, l'étape de construction de l'évolution de phase met en oeuvre l'équation suivante : Φ_M = Φ_k^_m +(Φ_hn -Φ,,_n-_m )j- + Δ_p *q[index] où :

®k,n-m ^{est 1}^ donnée quantifiée, à un instant indicé n-m, de la phase reconstruite de la composante d'indice k ;

Φ_{/ n} est une donnée quantifiée, à un instant indicé n, de la phase reconstruite de la composante d'indice /; Φ_{/ n}__m est une donnée quantifiée, à un instant indicé n-m, de la phase reconstruite de la composante d'indice /; fjç est une valeur de la fréquence reconstruite correspondant à la composante d'indice k ; fl est une valeur de la fréquence reconstruite correspondant à la composante du groupe de référence ;

Δ^ est un pas de quantification ; q [index] est une valeur entière correspondant à une valeur quantifiée de correction.

De façon avantageuse, un tel procédé de décodage comprend : - une étape de prédiction selon un axe temporel de la donnée de référence par rapport à au moins une valeur précédente correspondante, délivrant au moins une donnée prédite ; - une étape d'ajout à au moins une des données prédites d'un résidu correspondant transmis dans le signal de façon à obtenir une donnée réelle reconstruite.

Le procédé de décodage selon l'invention permet ainsi de reconstruire les données non transmises par prédiction (mise en œuvre d'un décodage « intra »).

Avantageusement, le résidu est codé selon une période multiple d'une période d'échantillonnage, et le procédé de décodage comprend une étape d'interpolation d'un résidu estimé pour les instants pour lesquels un résidu n a pas été codé. Plus précisément, le procédé de décodage peut mettre en œuvre l'équation suivante :

Φ*,» = ² *%,_«-« -Φjfc,«-2« + Δ_P * q[index] où :

Ô>k,_n-m ^{est 1}^ donnée quantifiée, à un instant indicé n-m, de la phase reconstruite de la composante d'indice k ; - Φyt,_M-₂m ^{est une} donnée quantifiée, à un instant indicé n-2m, de la phase reconstruite de ladite composante d'indice k ;

Δ_p est un pas de quantification d'une erreur de quantification ; q[index] est une valeur entière correspondant à une valeur quantifiée de correction. L'invention concerne aussi un produit programme d'ordinateur pour la mise en œuvre du procédé de décodage tel que décrit précédemment.

L'invention concerne enfin un dispositif de décodage d'un signal codé représentatif d'un signal audio source. Selon l'invention, le signal comprenant une représentation du signal source sous la forme d'une pluralité de composantes sinusoïdales décrites dans un espace de représentation en amplitude, en phase et en temps, les composantes étant regroupées en au moins un groupe d'au moins deux composantes selon au moins un critère de similarité, chacun des groupes comprenant : - au moins une donnée de référence du groupe, ladite donnée de référence étant représentée par une phase déroulée issue d'une première composante dudit groupe, dite composante de référence ;

- au moins une donnée de complément, associée à au moins une seconde composantes du groupe, et permettant de reconstruire, en combinaison avec la donnée de référence, au moins une information représentative d'une composante, le dispositif comprend :

- des moyens d'obtention de la ou les données de référence et de la ou les données de complément ;

- des moyens de reconstruction de la ou les informations représentatives des composantes, à partir des données de référence et de complément.

Un tel dispositif peut notamment mettre en oeuvre le procédé de décodage tel que décrit précédemment, et comprend les moyens nécessaires pour ce faire. 5. Liste des figures

D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante d'un mode de réalisation préférentiel, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels : - la figure 1 illustre la prédiction linéaire décrite en Annexe A ; la figure 2 est un organigramme simplifié du procédé de codage selon l'invention ;

- la figure 3 est un graphique de l'évolution des phases et fréquences des composantes sinusoïdales d'un signal audio source ; - la figure 4 est un organigramme du procédé de décodage selon l'invention;

- les figures 5A et 5B illustrent schématiquement un dispositif de codage et un dispositif de décodage mettant en œuvre l'invention.

6. Description d'un mode de réalisation de l'invention 6.1 Principe général L'invention propose donc une approche tout à fait nouvelle et efficace de codage d'un signal harmonique, permettant d'améliorer sa transmission ou son stockage, en réduisant le débit nécessaire pour la transmission ou l'espace mémoire pour le stockage, tout en assurant un signal reconstruit de haute qualité, et ce même si les variations de fréquence au cours du temps sont importantes.

L'invention exploite pour cela de façon nouvelle et efficace le fait que les composantes sinusoïdales d'un signal sont étroitement liées.

En effet, considérant un signal harmonique ou quasi-harmonique, on définit de façon connue la relation suivante entre une composante harmonique de référence (appelée souvent fondamentale), de fréquence notée f§ _n à la trame d'indice n , et une composante harmonique, du même signal, qu'on appelle composante de complément, d'indice k , à la fréquence notée fe _n :

β représente un facteur d'inharmonicité proche de zéro et pouvant être négligé pour les sons vocaux par exemple. A titre d'exemple, il vaut 0,0004 pour le piano.

On note a^ alors le rapport entre la fréquence /^ _n de la composante d'indice k et la fréquence fo _n de la composante de référence d'indice 0, soit :

En d'autres termes, à chaque composante d'indice k correspond un facteur a^ , reflétant une relation d'harmonicité avec la composante de référence.

Une autre caractéristique importante de l'invention consiste à transmettre certaines informations, notamment les informations de complément obtenues par codage différentiel, avec un rafraîchissement temporel plus espacé. Une telle technique permet ainsi de réduire encore plus le débit nécessaire, sans affecter la qualité du signal reconstruit, pour les composantes fréquentielles les plus stables en particulier. En relation avec la figure 2, le synoptique d'un système d'analyse pour la transmission et le codage d'un signal audio tel que proposé par l'invention comprend, de manière générale, trois étapes principales.

Un signal x(t) sonore est traité dans une étape 21 d'analyse sinusoïdale, qui consiste à décomposer le signal audio x(t) en entités sinusoïdales et à en extraire ainsi, pour chaque composante d'indice k , les informations d'amplitude a_{k n} , de phase φ_{k n} et enfin de fréquence f_k,n , à chaque trame d'indice n . On obtient un signal x(t) approché de x(t) de la forme : κ-ι x(t) ≈ ]T a_{k n} cos(Φ_£)W(t))_> telle que déjà décrite en préambule. *=0 II s'ensuit l'étape 22 d'appariement des entités harmoniques, ou entités sinusoïdales, qui consiste à les regrouper par familles harmoniques : il s'agit ici d'effectuer un travail de classification dans lequel les composantes sinusoïdales ayant une relation harmonique entre elles sont identifiées.

Cette étape 22 d'appariement peut être réalisée en comparant notamment les phases déroulées de chaque composante. Une telle étape permet de définir, pour une composante sinusoïdale d'indice k, une composante sinusoïdale de référence dont la phase déroulée est notée Φ_n ainsi qu'une donnée de complément, a_k, représentant la relation existant entre cette dernière composante et la composante de référence. Ainsi, il sera possible de reconstruire la composante d'indice k simplement à partir des informations transmises sur la composante de référence (comme sa phase déroulée Φ_n) ainsi que de cette donnée a_k de complément.

La donnée de complément a_k , la phase déroulée Φ_n de la composante de référence ainsi que les informations de phase, d'amplitude et de fréquence de la composante d'indice k sont ensuite quantifiées et codées dans une étape 23. Les données quantifiées représentant le signal x(t) sont alors transmises (24). De telles données quantifiées sont notamment les â_k et des valeurs quantifiées de fréquence de base (notée index_fl)), ainsi que de la phase initiale de la référence de base, notée q[0], et aussi des paramètres représentatifs de l'erreur de prédiction lors du codage, notés q[l], q[index]. Ces derniers paramètres quantifiés représentatifs du signal audio source encodé sont des valeurs entières qui sont multipliées par un pas de quantification correspondant lors de la reconstruction du signal. Ils sont explicités plus en détail dans la suite de la présente description. C'est à partir de ces données que l'harmonique d'indice k pourra être reconstruit par un décodeur, sans perte de qualité.

On développe maintenant plus en détail les étapes 22 et 23 d'appariement des entités harmoniques et de quantification et de codage.

6.2 Appartement des entités harmoniques (étape 22) L'étape 21 d'analyse sinusoïdale présentée en relation avec la figure 2 permet donc d'obtenir une représentation, pour chacune des composantes sinusoïdales du signal, de l'évolution de leur phase et de leur fréquence. On parle alors de phase déroulée. Elles sont illustrées par la figure 3. L'axe des abscisses représente le temps en termes de trames d'indice n , et l'axe des ordonnées représente la phase déroulée, en radians.

L'idée ici est d'exploiter cette connaissance des phases déroulées pour identifier des groupes de ressemblance entre un certain nombre d'harmoniques.

On voit notamment sur la figure 3 qu'il est possible de déterminer trois groupes, ou entités, 31, 32, 33. On note que les entités 31 et 32 comprennent chacune un groupe de composantes, représentées par leur phase déroulée, alors que l'entité 33 ne contient d'une seule composante sinusoïdale.

Pour réaliser l'étape d'appariement, on peut par exemple calculer les coefficients de corrélation p_{k i} entre deux composantes harmoniques d'indices respectifs k et / de phase déroulée différentiées selon la formule : n=N-l

dk _n ⁼ ®k n ~ ^φ _/fc n-i _> c'est-à-dire la phase déroulée différentiée entre la trame d'indice n et la trame d'indice n - 1 pour la composante d'indice k ;

- N est le nombre d'instants temporels communs aux composantes k et /.

Un exemple de résultats des calculs de corrélation est exposé dans le tableau suivant :

La similarité entre composantes est donc mesurée par le calcul du coefficient de corrélation. On considère que deux composantes d'indices respectifs k et / appartiennent à la même entité lorsque la valeur du coefficient de corrélation est supérieure à un seuil, par exemple à une valeur τ = 0, 95 .

En relation avec la figure 3 et le tableau précédent, on voit alors que les composantes ayant les phases déroulées indicées 311, 312, 313, 314, 315 et 316 appartiennent à la même entité 31 ,

De même les composantes ayant les phases déroulées indicées 321, 322 et 323 appartiennent à une même seconde entité 32. Enfin, la composante de phase déroulée 331 ne présente de similitude avec aucune autre composante, puisque le coefficient de corrélation de cette composante avec toute autre composante est faible. Elle représente alors à elle seule une troisième entité 33.

Les entités disposant d'une relation harmonique, à savoir les entités 31 et 32 sont ainsi rassemblées et chacun des partiels est affecté d'un facteur a ^, ou données de complément, dénotant son rapport harmonique avec une composante de référence, dont la phase déroulée est notée Φ_n , et représentant alors la trajectoire commune à l'entité considérée.

On exprime alors la phase déroulée à la trame d'indice n de la composante harmonique d'indice k en fonction de la phase déroulée de la composante de référence par la formule suivante : ^φk,_n = oe_k - Φ_n + Φ_w + b_Kn avec : b_{k n} représente un bruit aléatoire expliquant l'erreur de mesure effectuée sur les fréquences et les phases, ainsi que l'inadéquation de ces mesures vis-à-vis du modèle harmonique ; aj_ç est le facteur précédemment introduit par la relation :

Φj_c o est une correction de phase initiale.

On constate alors au vu de cette formule qu'il est possible d'obtenir la valeur d'une phase déroulée d'une composante d'indice k à la trame d'indice n à partir de la phase déroulée d'une composante de référence.

Dans un mode de réalisation particulier, il est possible de calculer les valeurs de Φ_n et de û^par itération jusqu'à la convergence des deux équations suivantes :

k=K~\

Σ ^ak^φk,n

Ces deux relations peuvent être considérées par morceaux : si par exemple, les composantes 311 et 312 de la figure 3 ne couvrent qu'un intervalle commun N₁ < N , alors la formule permettant de calculer Φ_n ne sera appliquée que sur les portions communes au deux composantes, et la formule permettant de calculer a^ n'intégrera pas les indices non représentés (N étant le nombre d'instants temporels communs défini précédemment).

On note que selon le mode de réalisation choisi, il est possible de choisir pour valeur initiale de Φ_n l'une des phases déroulées des composantes d'indice k , ou également choisir : Φ_n = 1 Vn e [0, N - 1].

De plus, dans un autre mode de réalisation, la puissance de b_{k n} , notée σ^ , peut également servir à l'appariement : les composantes sinusoïdales répondant correctement à l'équation précédente seront en effet entachées d'une variance σ^ faible. Dans un mode de réalisation supplémentaire, cet appariement peut également se faire à l'aide d'un critère de maximum de vraisemblance, en maximisant la probabilité de Φ^ _n connaissant le modèle décrit par Φ_n et les a _% .

Ces mesures a posteriori peuvent donc confirmer l'appariement réalisé selon le principe de la corrélation présenté.

En d'autres termes, et dans un premier mode de réalisation, chaque composante d'indice k, de phase déroulée notée Φ_{k n} sera parfaitement décrite par la transmission (ou le stockage) d'une phase déroulée Φ_/ „ d'une composante de référence d'indice / choisie parmi l'ensemble K des composantes du signal, des facteurs a \ ainsi que des paramètres D^ _n , avec l'indice k ayant une valeur différente de celle de l'indice / . Dans un second mode de réalisation, on transmet pour chaque phase déroulée de référence une valeur Φ_n , de référence commune à toutes les composantes du signal à transmettre, puis pour chaque composante, les facteurs ccfr et les paramètres b^ , avec O ≤ k ≤ K - l .

6.3 Quantification et codage (étape 23)

La connaissance des évolutions des fréquences et des phases de chaque composante sinusoïdale, ainsi que des relations de similarité entre chacune d'entre elles, est ici exploitée pour un codage optimal.

Suite à l'étape d'appariement, les entités sinusoïdales sont regroupées en deux familles. Une première famille comprenant des liens d'harmonicité et une seconde famille de composantes indépendantes entre elles (du type de l'entité 33 présentée en relation avec la figure 3).

Dans le cadre de la transmission d'entité appartenant à la première famille, il est alors nécessaire de transmettre, pour une composante d'indice k , le signal de référence dont l'évolution de phase et fréquence est notée Φ_n , ou bien Φ/ _n , selon le mode de réalisation choisi, l'erreur d'estimation b^ _n ainsi que le facteur CC^, reflétant l'harmonicité de la composante d'indice k avec la composante de référence. L'erreur d'estimation ^ _n est une valeur de résidu qui permet de compenser l'erreur de prédiction lors de la reconstruction du signal.

Selon le paramètre à coder et la famille à laquelle l'entité considérée appartient, on considère deux types de codages, présentés ci-après, appelés respectivement codage Intra et codage Inter.

6.3.1 Le codage Intra

Dans le mode de quantification Intra composante, il s'agit de quantifier une évolution de phase et de fréquence, ou phase déroulée, relativement à elle-même, sans référence à aucune autre composante. Cette description est basée sur une technique de prédiction linéaire, connue en soi. En d'autres termes, on prédit la valeur de la phase déroulée à un instant, à partir de sa valeur aux instants précédents. Selon un mode de réalisation préférentiel de l'invention, cette technique de prédiction est étendue en utilisant des décimations temporelles, de façon à réduire le débit nécessaire à la transmission des informations. Par exemple, la prédiction linéaire de la phase déroulée de la composante d'indice k à l'instant n + 2m , notée Φ_n+2m » ^est calculée de la façon suivante : ^avec

- Φk,n₊m ^est *^a valeur quantifiée de Φk,_n+m > - m est un facteur de décimation temporelle représentant une période multi riode 'échantillonna e

Si la durée du signal n'est pas exactement un multiple de m , alors les extrémités seront extrapolées sous forme linéaire en utilisant les dernières valeurs reçues par le décodeur.

On obtient alors une valeur de résidu, notée ε^ _n , qui sera effectivement transmise (ou stockée), sous forme uantifiée et codée aux instants n = l - m , multiples de m valant '. e signal est représentatif d'un écart entre la valeur réelle et la valeur prédite de l'évolution en fréquence et en phase. Une telle méthode est particulièrement efficace pour transmettre des composantes dont la fréquence varie peu au cours du temps. Il faut en effet s'assurer que l'erreur de reconstruction augmentée par cette décimation temporelle assure par ailleurs une réduction importante du débit de transmission. La réduction de débit sera d'autant plus importante que Φ^ „ décrit une droite par morceaux.

Les éléments ou entités codées et quantifiées selon ce type de codage Intra sont alors les suivantes : le facteur de décimation m ;

- le jeu de signaux ε_{k n} , valeurs quantifiées de ε^_n aux instants multiples de m; la quantification sera par exemple réalisée par un quantificateur scalaire (uniforme ou non) ou vectoriel. Cette quantification peut être suivie d'un codeur entropique de type

Huffman ou arithmétique.

- les valeurs initiales quantifiées nécessaires au prédicteur <% ₀ et Φk,m - P°^{ur ce} f^au"e> ^on P^eut transmettre une fréquence initiale f_{k 0} permettant de retrouver l'évolution Φ_{k m} par la relation :

Ces valeurs peuvent être quantifiées par un quantificateur scalaire (uniforme ou non) et éventuellement également codées par un code de longueur variable. Des valeurs convenables pour m couvrent la plage 1 < m ≤ 16.

En d'autres termes, on met en œuvre ici un codage différentiel selon un axe temporel.

6.3.2 Le codage Inter

II s'agit maintenant de coder conjointement une composante sinusoïdale relativement à une autre, en utilisant leur relation d'harmonicité, ou de similarité. On exprime l'évolution de phase et de fréquence Φ_{k n} d'une composante d'indice k à un instant de trame d'indice n par rapport à une composante dont l'évolution est notée Φ_{[ n} , d'indice /, qui lui est harmoniquement liée. Afin d'obtenir un fonctionnement identique aussi bien au niveau du codeur que du décodeur, les Φ^ „ seront exprimées par rapport à une version quantifiée de Φ^_n notée Φ_{l n} .

On appelle ce type de codage le codage Inter.

Grâce à la relation d'harmonicité, une valeur prédite de Φ_k>n , notée

Φ_β. „ est obtenue selon la relation suivante :

Φ^ = Φ_M-i +^(Φ/,_Λ -Φ/,«-i) -

On voit au travers de cette formule que la valeur à un instant n de la phase déroulée d'une composante codée par codage Inter est obtenue d'une part à partir de sa valeur prédite à un instant précédent n - 1 ( Φ^ _M__j ), et d'autre part à partir de la valeur prédite de la phase déroulée d'une composante de référence d'indice / aux instants n et n - \ (Φ^_n et Φ_{/ Λ}_i ).

C'est alors l' erreur de prédiction d_{k n} qui sera transmise sous forme quantifiée : d_{k n} = Φ_{k n} - Φ_{k n} . En effet, la connaissance de cette erreur par le décodeur, ou le dispositif de restitution, est utile pour corriger l'erreur de prédiction générée à l'encodage, et assurer ainsi une bonne qualité du signal audio reconstruit. Grâce à cette erreur de prédiction, il sera possible de reconstruire avec précision l'harmonique d'indice k, à l'aide de la composante de référence d'indice I .

Plus précisément, le signal d_{k n} est l'erreur de prédiction de l'harmonique d'indice k par rapport à l'harmonique de référence d'indice / , cumulée à l'erreur de quantification réalisée sur Φ_{i n} . Si Φ_{[ n} est quantifiée suffisamment précisément, alors d_{k n} ne représente que l'erreur de prédiction entre harmonique.

Dans un mode de réalisation préférentiel, ce type de codage Inter peut lui aussi reposer sur une version décimée de Φ/_)W . De même, les signaux J^ _n peuvent être eux aussi transmis sous forme décimée. On pourra alors exprimer la prédiction de Φ^ „ sous la forme :

Dans ce cas, d_{k n} ne sera transmis que pour les indices n multiples de m .

En résumé, les éléments transmis dans le cas du codage Inter sont donc les suivants : une composante de base (transmise en mode Intra selon le mode de réalisation préférentiel) ;

- les valeurs des données de complément, ou facteur, a_k, transmis soit sous forme directe, soit sous forme d'une fréquence f_k qui permet de retrouver α^ ≈ ^par rapport à la composante de

// référence d'indice / ;

- les erreurs de prédiction d_{k n} quantifiées sous forme décimée ou non ;

- les phases déroulées initiales Φ^ _o quantifiées par un quantificateur scalaire (uniforme ou non) et éventuellement codées par un code de longueur variable (arithmétique, ou Huffman par exemple).

L'invention s'étend également à la transmission d'un signal en Intra, commun Φ_n assorti de a_k et φ_k>0 , mais sans transmission des d_{k n} ,Φ_n pouvant représenter une composante à restituer (c'est-à-dire un Φ_nj), ou ^non> ^{selon le} mode de réalisation choisi.

En conclusion, les inventeurs ont constaté que les performances de ces types de codages mettant en œuvre la décimation sont avantageuses. Par exemple, la caractéristique de débit en fonction de la distorsion d'un codage Intra avec décimation d'un facteur deux permet d'économiser un débit substantiel par rapport à une transmission de type Intra sans décimation, d'environ 30%.

En termes de performances, si la fréquence de la phase déroulée Φ/ „ de la composante de référence varie rapidement au cours du temps, alors le coût de la transmission, en codage Intra, sera élevé car le modèle prédictif temporel sera mal respecté. En revanche, lorsqu'on appuiera la quantification des phases déroulées Φ^ _n des composantes liées sur ce signal, alors les effets des variations temporelles auront disparu : le codage en mode Inter sera donc particulièrement adapté aux composantes harmoniques de forte variation temporelle. 6.4 Procédé de décodage

L'invention concerne par ailleurs le procédé de décodage d'un signal codé et quantifié tel que décrit précédemment. Là aussi, selon le type de codage réalisé (mode Intra ou Inter), on envisage deux types de décodage.

La figure 4 représente un synoptique général du procédé de décodage selon l'invention. Un train binaire contenant les données quantifiées (q[0], q[l], q[index], index fO, α...) représentatives d'une trame d'indice n du signal audio source quantifié est tout d'abord décodée dans une étape 41 de décodage syntaxique. H est possible de se référer à l'annexe B de la présente description pour une des informations détaillées sur cette étape 41. II s'en suit une étape de test 42 sur le type de codage par lequel a été codée la trame reçue : « mode = =inter ? ». Si la réponse à ce test est oui, une étape 431 de décodage en mode Inter est mise en œuvre. Sinon, la trame est décodée en mode Intra dans une étape 432. On obtient alors en sortie de chacune de ces étapes 431 ou 432 de décodage les informations recherchées de phase φ_k>n , de fréquence f_k≠ et d'amplitude a^ _n .

Ces informations sont ensuite exploitées dans une étape 44 de synthèse sinusoïdale, dans laquelle est reconstruite la composante sinusoïdale considérée.

Enfin, un test 45 est réalisé pour déterminer si la composante traitée est la dernière ou non : « Dernière composante ? ». Sinon, les étapes 41, 42, 431, 432, 44 et 45 sont réitérées. Si oui, une étape 46 finale d'addition d'un résiduel est réalisée avant la restitution du signal par un haut-parleur 47. On décrit maintenant plus en détail chacune de ces étapes.

6.4.1 Mode Intra (étape 432)

On définit Δy , A_p comme étant les pas de quantification respectifs pour la fréquence initiale et l'erreur de prédiction sur la phase ( Δ^ peut être différent pour la première valeur de phase et ses suivantes, comme il peut être rendu adaptatif par l'utilisation d'un quantificateur au pas de quantification adaptatif).

Des valeurs convenables sont de l'ordre de — .

32

On note index_fθ l'indice fréquentiel de la composante codée en mode

Inter servant de référence. Cet index est un entier, qui permet de reconstruire la valeur réelle de la fréquence de base fa de la composante d'indice k en multipliant cet index par le pas de quantification de la fréquence Δy . On obtient la valeur reconstruite de fa : fa . Dans un second mode de réalisation, index_fθ peut être utilisé pour pointer directement dans une table permettant d'obtenir les valeurs fa reconstruites de fa .

De façon similaire q[0], q[l] et q[index] sont des entiers correspondant à une valeur quantifiée de la phase de la composante d'indice k et par lesquels on obtient une valeur reconstruite en les multipliant par le pas de quantification A_p appliqué aux phases. De façon plus détaillée, q[0] correspond à la valeur quantifiée de la phase initiale d'une composante, q[l] correspond à la valeur quantifiée de la correction à appliquer à la phase d'une composante aux instant multiples de m et q[index] correspond à la valeur quantifiée de la correction à appliquer à la phase aux instants indicés n (entre les instants multiples de m).

La reconstruction d'une composante en mode Intra se fait de la façon suivante: - construction de la fréquence de base de la composante k à partir du pas de quantification de cette valeur et de sa valeur quantifiée: fa ≈ Aj- * index_fθ ;

- construction de la phase initiale de la composante k à partir du pas de quantification de cette valeur et de sa valeur quantifiée: Φ_{k 0} = A_p * q[0] ;

- construction de la phase à l'instant m de la composante k à partir de la phase initiale de cette composante, de sa fréquence de base, de l'instant considéré pondéré et d'une valeur quantifiée pondérée par un pas de quantification : Φ_k ^_n = Φ^_Q + m • a • fa + Δ „ * q[l] ; - construction de la phase à chaque instant multiple du facteur de décimation par extrapolation des deux instants précédents décimés et d'une correction quantifiée multipliée par un pas de quantification : Φ_{k n} = 2 -Φ_Kn__m ~Φ_Kn__2m +A_p *q[index] ;

Les valeurs intermédiaires entre les indices n - m et n sont reconstruites à l'aide de l'équation précédemment introduite :

Si n n'est pas un multiple de m , alors les dernières valeurs sont extrapolées de façon linéaire : Φ^_n+m ⁼ %,_« ⁺ (^{m ~ n})^ω » ^{avec ω} étant proportionnel à la dérivée de Φ_{k n} .

6.4.2 Mode Inter (étape 431)

On décrit maintenant le décodage d'une composante sinusoïdale d'indice k , codée en mode Inter par rapport à une composante d'indice / déjà quantifiée en Inter (ou éventuellement en Intra). La reconstruction d'une composante en mode Inter se fait de la façon suivante:

- construction de la fréquence de base de la composante d'indice k à partir du pas de quantification de cette valeur et de sa valeur quantifiée : fa = Δy * index fO ;

- construction de la phase initiale de la composante k à partir du pas de quantification de cette valeur et de sa valeur quantifiée: Φ*,o = Δ^ *q[O] ;

- construction de la phase à l'instant d'indice n de la composante k à partir de la phase au temps n - m de cette composante, de sa fréquence de base et de celle de référence / , des phases reconstituées de la composante de référence et d'une correction quantifiée multipliée par un pas de quantification :

Les valeurs intermédiaires entre les indices n - m et n sont reconstruites à l'aide de l'équation précédemment introduite : ^φ _k,n+l = -[(m-l)Φ_k,n +l-Φk,n + m] .

Si n n'est pas un multiple de m , alors les dernières valeurs sont extrapolées de façon linéaire : Φ£_>Λ+m = ^φk,_n +(m- ή)ω , avec ω étant proportionnel à la dérivée de Φ_{k n} .

6.5 Reconstruction

En utilisant les phases déroulées reconstruites Φ^ , on retrouve les fréquences et phases instantanées à partir des équations précédemment introduites Ψk,_n = Ct(⁷¹T) = moά(Φ _/çit = nT),2π) et au choix une des fonctions J_n+1 = J_n — - — '— ou J_n+1 = — '- 2- également introduite en

2 • ai ai préambule de la présente description. Les fréquences instantanées et phases instantanées ainsi déterminées alimentent ensuite des synthétiseurs sinusoïdaux (étape 44) commandés par ces valeurs.

L'ensemble des composantes sinusoïdales est ensuite sommé pour retrouver la partie déterministe du signal audio.

Cette partie déterministe est ensuite optionnellement complétée par un signal résiduel (étape 46), sous la forme d'un bruit de confort ou par un signal codé par un codeur par transformée de type AAC.

Le signal complet ainsi reconstruit alimente ensuite un convertisseur numérique analogique qui permet de restituer le son (étape 47). 6.6. Dispositifs de mise en œuyre

Le procédé de l'invention peut être mis en œuvre un dispositif de codage, dont la structure est présentée en relation avec la figure 5 A.

Un tel dispositif comprend une mémoire M 500, une unité de traitement 501, équipée par exemple d'un microprocesseur, et pilotée par le programme d'ordinateur Pg 502. A l'initialisation, les instructions de code du programme d'ordinateur 502 sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 501. L'unité de traitement 501 reçoit en entrée un signal audio source à coder 503. Le microprocesseur μP de l'unité de traitement 501 met en œuvre le procédé de codage décrit ci-dessus, selon les instructions du programme Pg 502. L'unité de traitement 501 délivre en sortie des données quantifiées représentatives du signal audio source codé 504.

L'invention concerne également un dispositif de décodage d'un signal codé représentatif d'un signal audio source selon l'invention, dont la structure générale simplifiée est illustrée schématiquement par la figure 5B. Il comprend une mémoire M 510, une unité de traitement 511, équipée par exemple d'un microprocesseur, et pilotée par le programme d'ordinateur Pg 512. A l'initialisation, les instructions de code du programme d'ordinateur 512 sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 511. L'unité de traitement 511 reçoit en entrée 75

un signal codé représentatif d'un signal audio source 513. Le microprocesseur μP de l'unité de traitement 511 met en œuvre le procédé de décodage selon les instructions du programme Pg 112, pour délivrer un signal audio reconstruit 512.

ANNEXE A La relation entre f_k,n et la fréquence instantanée f_k(t) est : f_k,n = fk(nT) .

De même, le lien entre la phase ^_n et la phase instantanée φ_k(t) est : φ_{k n} = φ_k(nT) . De façon à modéliser l'évolution temporelle au fil du signal des paramètres de fréquence et de phase, il a été introduit la notion de phase déroulée Φk(t), portant à la fois pour chacune des composantes sinusoïdales du signal à modéliser, la fréquence instantanée f_k(t) et la phase instantanée ψkit). La phase déroulée Φ^(0 permet donc de représenter à la fois l'évolution de la phase instantanée et de la fréquence instantanée d'un partiel sous la forme d'une unique fonction temporelle continue, puis échantillonnée. En d'autres termes, on modélise l'évolution de la phase Φ^. _n(t) initialement introduite, sur toute la longueur du signal.

Dans le cas idéal, lorsque l'estimateur chargé de décomposer le signal audio en partiels est parfait, on met en rapport les fréquences f_k,n et les phases instantanées φ_{k n} par les deux relations suivantes :

φi_{c n} = φ]₍(nT) = moά(Φk(t = nT),2π) , avec mod(α,Z>) représentant la fonction modulo, c'est-à-dire le reste de la division entière de a par b. Plus spécifiquement, il existe une relation entre la valeur de la phase déroulée à la trame n + 1 et la valeur à la trame n , ce qui permet alors d'estimer la phase déroulée Φ_k{t) par prédiction.

En effet, d'une trame d'indice « à la trame suivante d'indice n + l , la phase déroulée s'exprime par :

Φ*,«₊i = Φ/fc,» + ≈ J fk(t)dt avec a = -— . nT ^e

On note par la suite Δ_{φ]t M+1} la variation de la phase déroulée d'une trame

(«+1)7 à la suivante, soit : à_{φk n+ι} = J f_k(t) • dt . nT Dans le cas où la fréquence est considérée comme constante au cours du temps, la quantité Δ_{φjt n+1} est constante au cours du temps, et la fonction

Φ_jt(Oest une droite.

Dans le cas où la fréquence f_k{t) varie peu entre les instants nT et (n + T)T , alors la variation de la phase déroulée est considérée comme constante, c'est-à-dire que : à_{Φk n+2} ≈ Δφk n₊i ^{et on} P^{rédit alors φ}k,n+2 P^ ^la relation suivante

L'erreur d'estimation, ou de prédiction est L'écart Δ_{φk n+ι} de phase déroulée entre deux instants est aussi appelé déroulement de phase.

La fi de la phase déroulée du partiel d'indice k , aux instants . L'axe des abscisses présente le temps et l'axe des ordonnées la valeur de la phase déroulée Φ_k{t) .

On constate que l'erreur de prédiction ε_k>n+2 est faible devant le déroulement de phase Δφ£ _M+2.

Toujours dans le cas où la fréquence d'un partiel varie peu dans le temps, une seconde variante possible pour prédire la phase déroulée, c'est-à-dire pour déduire la valeur de la phase à un instant à artir de sa valeur à un instant précédent, est d'utiliser la relation suivante : Se basant sur le principe de base du codage stipulant qu'un signal de faible énergie est beaucoup moins coûteux à transmettre qu'un signal de forte énergie, la technique classique consiste alors à transmettre ou à stocker l'ensemble des éléments ε_k^n . Etant petits devant les éléments à_{φk n} , ils seront moins coûteux à en termes de débit ou de mémoire. Ayant transmis la phase déroulée initiale Φ la hase à la trame suivante Φ^_j ainsi que la suite d'éléments il est possible de reconstruire, à la précision voulue, les phases et les fréquences initialement déterminées suivant les relations suivantes :

fn+ι - fn ^^ ~ ' ^avec l'hypothèse que la conservation

de la fréquence qui entraîne 1 approximation suivante : f_n+1 = — ² .

ANNEXE B

Syntaxe de transmission des phases déroulées

Un exemple de syntaxe de transmission des modes Inter et Intra est présenté dans ce paragraphe. La table suivante décrit la syntaxe de la fonction « read_sinus » de lecture des composantes sinusoïdales,

uimsbf signifie « unsigned integer most significant bit first » en anglais (pour : bit de poids le plus fort de l'entier non signé en premier).

Le mode Intra/Inter est lu, permettant de savoir sous quelle forme la composante sinusoïdale est lue. Suivant le mode lu, la syntaxe est décodée, puis les phases déroulées sont reconstruites suivant le mode. L'index de la composante Intra servant de référence à la composante Inter suivante est constamment mis à jour.

La table suivante décrit la syntaxe de la fonction « intra sinus » de détection du mode de codage Intra,

vlclbf signifie « variable length code, least bit first » en anglais (pour : code de longueur variable, bit de poids le plus faible en premier).

HuffÇ) est une fonction permettant retrouver un index stocké sous forme d'un code à longueur variable.

L'index de décimation est lu, suivi d'une valeur de fréquence. Ensuite la phase initiale est lue suivie des erreurs de prédiction qui serviront à reconstruire les phases déroulées.

La table suivante décrit la syntaxe de la fonction « inter_sinus » de détection du mode de codage Inter.

Une autre alternative consiste à ne pas transmettre les index_fθ pour les composantes codées en mode Inter. Le rapport α^ devenant implicite et croissant : une composante codée en Inter après une composante en Intra aura une valeur par défaut a_k = 2 ce qui équivaudrait à ≈M- = 2 , a_k étant augmenté de 1 à chaque

// réception de composante Inter, jusqu'à ce qu'on rencontre une nouvelle composante codée en Intra.

Claims

REVENDICATIONS

1. Procédé de codage d'un signal audio source, comprenant une étape de transformation d'un espace amplitude / temps vers un espace multi-composantes décrites en amplitude, en phase et en temps, mettant en œuvre une modélisation sinusoïdale du signal audio et délivrant une pluralité de composantes sinusoïdales évoluant dans le temps, caractérisé en ce qu'il comprend les étapes suivantes :

- comparaison entre elles desdites composantes, de façon à définir au moins un groupe d'au moins deux composantes selon au moins un critère de similarité prédéterminé ;

- codage, pour au moins un desdits groupes : d'au moins une donnée de référence dudit groupe, ladite donnée de référence étant représentée par une phase déroulée issue d'une première composante dudit groupe, dite composante de référence ; d'au moins une donnée de complément, associée à au moins une seconde composante dudit groupe, et permettant de reconstruire, en combinaison avec ladite donnée de référence, au moins une information représentative d'au moins une composante.

2. Procédé de codage selon la revendication 1, caractérisé en ce que ledit critère de similarité tient compte d'une évolution de la phase d'au moins deux composantes.

3. Procédé de codage selon la revendication 2, caractérisé en ce que ladite étape de comparaison met en oeuvre un calcul de corrélation entre ladite évolution de phase desdites au moins deux composantes.

4. Procédé de codage selon l'une quelconque des revendications 1 à 3, caractérisé en ce que ladite étape de codage met en œuvre un codage différentiel selon un axe temporel comprenant : - une étape de prédiction de ladite donnée de référence et/ou de ladite donnée de complément, par rapport à au moins une valeur précédente correspondante, délivrant au moins une donnée prédite ;

- une étape de détermination d'au moins un résidu à coder, par différence entre d'une desdites données prédites et d'une donnée réelle correspondante.

5. Procédé de codage selon la revendication 4, caractérisé en ce que ledit résidu est codé selon une période multiple d'une période d'échantillonnage, et en ce qu'une information représentative dudit multiple est générée.

6. Procédé de codage selon l'une quelconque des revendications 1 à 5, caractérisé en ce que ladite étape de codage met en œuvre un codage différentiel selon un axe fréquentiel comprenant : une étape de codage d'au moins une donnée de référence, représentative d'une composante de référence dudit groupe ; - une étape de codage d'au moins une donnée de complément, représentative d'une autre composante dudit groupe, par comparaison avec ladite donnée de référence.

7. Procédé de codage selon la revendication 6, caractérisé en ce que ladite étape de codage met en œuvre, pour chaque composante d'indice k les équations suivantes :

4_,« = %_,« - %_{,« >} où n est l'indice de temps ;

Φ_k r, est la valeur, à un instant indicé n, de la phase de la composante d'indice k,

®k,n ^{est une} donnée de prédiction, à un instant indicé n, de la phase de la composante d'indice k ;

Φk,n-ι ^{est une} donnée quantifiée, à un instant indicé n-1, de la phase de ladite composante harmonique ; φ_{j n}__λ est une donnée quantifiée, à un instant indicé n-1, de la phase de la composante d'indice / ; a_k et ai sont des valeurs proportionnelles aux fréquences de base des composantes h et /, choisies de façon à ce que le rapport de ces valeurs soit représentatif d'un rapport de fréquence entre la composante sinusoïdale d'indice k et la composante sinusoïdale d'indice /; d_{k n} est une valeur de résidu, à un instant indicé n, entre ladite valeur de phase et ladite donnée de prédiction de la composante d'indice k.

8. Produit programme d'ordinateur téléchargeable depuis un réseau de communication et/ou stocké sur un support lisible par ordinateur et/ou exécutable par un microprocesseur, caractérisé en ce qu'il comprend des instructions de code de programme pour la mise en œuvre du procédé de codage selon au moins une des revendications 1 à 7.

9. Dispositif de codage d'un signal audio source, comprenant des moyens de transformation d'un espace amplitude / temps vers un espace multi-composantes décrites en amplitude, en phase et en temps, mettant en œuvre une modélisation sinusoïdale du signal audio et délivrant une pluralité de composantes sinusoïdales évoluant dans le temps, caractérisé en ce qu'il comprend : - des moyens de comparaison desdites composantes entre elles, de façon à définir au moins un groupe d'au moins deux composantes selon au moins un critère de similarité ; des moyens de codage, pour au moins un desdits groupes : - d'au moins une donnée de référence dudit groupe, ladite donnée de référence étant représentée par une phase déroulée issue d'une première composante dudit groupe, dite composante de référence ; d'au moins une donnée de complément, associée à au moins une seconde composante dudit groupe, et permettant de reconstruire, en combinaison avec ladite donnée de référence, au moins une information représentative d'au moins une composante.

10. Signal codé représentatif d'un signal audio source, comprenant une représentation du signal source sous la forme d'une pluralité de composantes sinusoïdales décrites dans un espace de représentation en amplitude, en phase et en temps, caractérisé en ce que lesdites composantes sont regroupées en au moins un groupe d'au moins deux composantes selon au moins un critère de similarité, et en ce qu'au moins un desdits groupes comprend :

- au moins une donnée de référence dudit groupe, ladite donnée de référence étant représentée par une phase déroulée issue d'une première composante dudit groupe, dite composante de référence ; au moins une donnée de complément, associée à au moins une seconde composante dudit groupe, et permettant de reconstruire, en combinaison avec ladite donnée de référence, au moins une information représentative d'au moins une composante.

11. Support de données comprenant au moins un signal codé représentatif d'un signal audio source, comprenant une représentation du signal source sous la forme d'une pluralité de composantes sinusoïdales décrites dans un espace de représentation en amplitude, en phase et en temps, lesdites composantes étant regroupées en au moins un groupe d'au moins deux composantes selon au moins un critère de similarité, au moins un desdits groupes comprenant : au moins une donnée de référence dudit groupe, ladite donnée de référence étant représentée par une phase déroulée issue d'une première composante dudit groupe, dite composante de référence ; - au moins une donnée de complément, associée à au moins une seconde composante dudit groupe, et permettant de reconstruire, en combinaison avec ladite donnée de référence, au moins une information représentative d'au moins une composante.

12. Procédé de décodage d'un signal codé représentatif d'un signal audio source, caractérisé en ce que, ledit signal comprenant une représentation du signal source sous la forme d'une pluralité de composantes sinusoïdales décrites dans un espace de représentation en amplitude, en phase et en temps, lesdites composantes étant regroupées en au moins un groupe d'au moins deux composantes selon au moins un critère de similarité, au moins un desdits groupes comprenant :

- au moins une donnée de référence dudit groupe, ladite donnée de référence étant représentée par une phase déroulée issue d'une première composante dudit groupe, dite composante de référence ; - au moins une donnée de complément, associée à au moins une seconde composante dudit groupe, et permettant de reconstruire, en combinaison avec ladite donnée de référence, au moins une information représentative d'une composante, ledit procédé comprend les étapes de : - obtention de la ou desdites données de référence et de la ou desdites données de complément ;

- reconstruction de la ou desdites informations représentatives desdites composantes, à partir desdites données de référence et de complément.

13. Procédé de décodage selon la revendication 12, caractérisé en ce qu'il comprend une étape de construction d'un signal audio reconstruit, représentatif dudit signal audio source, en tenant compte desdites informations représentatives desdites composantes.

14. Procédé de décodage selon l'une quelconque des revendications 12 et 13, caractérisé en ce qu'il comprend : - une étape de décodage d'au moins une donnée de référence, représentative d'une composante de référence dudit groupe ;

- une étape de décodage d'au moins une donnée de complément représentative d'une autre composante dudit groupe, par comparaison avec ladite donnée de référence ; - une étape de reconstruction de ladite autre composante par combinaison de ladite donnée de référence et de la ou desdites données de complément.

15. Procédé de décodage selon la revendication 14, caractérisé en ce que lesdites données de complément sont codées selon une période multiple d'une période d'échantillonnage, et en ce qu'il comprend une étape d'interpolation de données de complément estimées pour les périodes d'échantillonnage pour lesquelles une donnée de complément n'a pas été codée.

16. Procédé de décodage selon l'une quelconque des revendications 12 à 15, caractérisé en ce qu'il met en œuvre l'équation suivante : Φ_{k n} = Φ_M__W +(Φ_/>B ~Φι_A~m)y + Δ_p *q[index] où :

4>A_:,n-m est une donnée quantifiée, à un instant indicé n-m, de la phase reconstruite de ladite composante d'indice k ;

Φ/ „ est une donnée quantifiée, à un instant indicé n, de la phase reconstruite de ladite composante d'indice /; - Φ}_>n-m ^{est mιG} donnée quantifiée, à un instant indicé n-m, de la phase reconstruite de ladite composante d'indice /;

J^ est une valeur de ladite fréquence reconstruite correspondant à ladite composante ; fl est une valeur de ladite fréquence reconstruite correspondant à ladite composante du groupe de référence ;

A_p est un pas de quantification d'une erreur de quantification ; q[index] est une valeur entière correspondant à une valeur quantifiée de correction.

17. Procédé de décodage selon l'une quelconque des revendications 12 à 16, caractérisé en ce qu'il comprend : une étape de prédiction selon un axe temporel de ladite donnée de référence par rapport à au moins une valeur précédente correspondante, délivrant au moins une donnée prédite ; - une étape d'ajout à au moins une desdites données prédites d'un résidu correspondant transmis dans ledit signal, de façon à obtenir une donnée réelle reconstruite.

18. Produit programme d'ordinateur téléchargeable depuis un réseau de communication et/ou stocké sur un support lisible par ordinateur et/ou exécutable par un microprocesseur, caractérisé en ce qu'il comprend des instructions de code de programme pour la mise en œuvre du procédé de décodage selon l'une au moins des revendications 12 à 17.

19. Dispositif de décodage d'un signal codé représentatif d'un signal audio source, caractérisé en ce que, ledit signal comprenant une représentation du signal source sous la forme d'une pluralité de composantes sinusoïdales décrites dans un espace de représentation en amplitude, en phase et en temps, lesdites composantes étant regroupées en au moins un groupe d'au moins deux composantes selon au moins un critère de similarité, chacun desdits groupes comprenant : au moins une donnée de référence dudit groupe, ladite donnée de référence étant représentée par une phase déroulée issue d'une première composante dudit groupe, dite composante de référence ; - au moins une donnée de complément, associée à au moins une seconde composante dudit groupe, et permettant de reconstruire, en combinaison avec ladite donnée de référence, au moins une information représentative d'une composante, ledit dispositif comprend : - des moyens d'obtention de la ou desdites données de référence et de la ou desdites données de complément ;

- des moyens de reconstruction de la ou desdites informations représentatives desdites composantes, à partir desdites données de référence et de complément.