FR2995754A1

FR2995754A1 - Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs

Info

Publication number: FR2995754A1
Application number: FR1258760A
Authority: FR
Inventors: Romain Deprez; Rozenn Nicol
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2012-09-18
Filing date: 2012-09-18
Publication date: 2014-03-21
Also published as: WO2014044948A1; EP2898707B1; US20150223004A1; US9584947B2; EP2898707A1

Abstract

L'invention se rapporte à un procédé de calibration d'un ensemble de restitution sonore d'un signal sonore multi canal comportant une pluralité de haut-parleurs. Le procédé comporte les étapes d'obtention (E201) de réponses impulsionnelles multidirectionnelles des haut-parleurs à la reproduction d'un signal audio prédéterminé, d'analyse (E202) des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques (A , C , T ) des premières réflexions, de comparaison (E203) de l'amplitude de chacune des réflexions à un seuil de perceptibilité prédéterminé (E204) et d'identification (E203) des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil prédéterminé, de modification (E205) des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles et de détermination (E206) d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio-multi canal avant restitution sonore. L'invention se rapporte également à un dispositif de calibration mettant en oeuvre le procédé ainsi décrit.

Description

Calibration optimisée d'un système de restitution sonore multi haut-parleurs La présente invention se rapporte à un procédé et un dispositif de calibration d'un système de restitution sonore comportant une pluralité de haut-parleurs ou d'éléments de restitution sonore. La calibration permet d'optimiser la qualité d'écoute du système de restitution que constitue l'ensemble des éléments de restitution, comprenant le dispositif des haut-parleurs et la salle d'écoute. Les systèmes de restitution particulièrement concernés sont les systèmes de restitution sonore de type multicanal (5.1, 7.1, 10.2, 22.2, etc...) ou encore de type ambisonique (Ambisonics en anglais ou Higher Order Ambisonics (HOA)). Pour permettre une restitution de bonne qualité des signaux multicanaux, les dispositifs actuels de calibration de l'acoustique du lieu d'écoute sont basés sur une méthode générale de type "égalisation multicanale" dans laquelle les réponses impulsionnelles de chaque haut-parleur du système de restitution sont mesurées à l'aide d'un ou plusieurs microphones en un ou plusieurs points du lieu d'écoute et un filtrage d'égalisation fréquentielle est effectué sur chaque haut-parleur, indépendamment, en inversant tout ou partie de la réponse impulsionnelle mesurée pour le haut-parleur concerné. L'inversion vise à corriger la réponse du haut-parleur de façon à ce qu'elle se rapproche au mieux d'une courbe "cible" généralement définie dans le domaine fréquentiel pour améliorer le rendu du timbre des sources sonores. Une telle méthode est par exemple décrite dans le document intitulé "Digital Fi/ter Design for Inversion Problems in Sound Reproduction", des auteurs Kirkeby et Nelson, dans JAES 7/8, pp.583-595, 1999. Ce type de calibration ou correction se focalise sur la correction de l'aspect fréquentiel de la réponse du système de restitution du lieu d'écoute sans exploiter les informations temporelles comme les phénomènes de réflexions et notamment les premières réflexions des signaux sonores. Or les premières réflexions de signaux sonores ont un impact non négligeable sur la perception auditive du signal sonore restitué.

De plus, l'analyse des réponses impulsionnelles effectuée dans les méthodes de calibration existantes est de type monophonique, c'est-à-dire qu'elle ne prend pas non plus en compte l'information spatiale des réflexions comme la direction d'incidence. L'absence de données temporelles et spatiales des réflexions, ne permet pas de prendre en compte le rôle des ces réflexions sur la perception de l'onde directe du signal sonore par un auditeur, et ainsi d'ajuster la correction en fonction de leur effet spécifique. La qualité du signal sonore restitué et perçue par l'auditeur n'est alors pas optimale. Les techniques de l'état de l'art sont basées sur l'application de filtres de correction sur chacun des canaux du signal multi canal, c'est-à-dire que chaque haut-parleur du système de restitution est corrigé individuellement sans tenir compte de l'ensemble du réseau de haut-parleurs. Il existe donc un besoin d'optimisation du calibrage effectué sur les systèmes de restitution de signaux audio multicanaux pour d'une part prendre en compte les propriétés temporelles et spatiales des réflexions sonores qui impactent la perception auditive des ondes directes, afin d'ajuster l'effort de traitement selon la perceptibilité des dégradations et ainsi limiter les artefacts audibles susceptibles d'être générés par les traitements trop contraints effectués dans les méthodes de calibration existantes ; et d'autre part utiliser de façon conjointe les différents haut-parleurs, afin de répartir l'effort de traitement sur l'ensemble des haut-parleurs. La présente invention vient améliorer la situation. Elle propose à cet effet, un procédé de calibration d'un ensemble de restitution sonore d'un signal sonore multi canal comportant une pluralité de haut-parleurs. Le procédé est tel qu'il comporte les étapes suivantes: obtention de réponses impulsionnelles multidirectionnelles des haut-parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé; analyse des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques des premières réflexions; comparaison de l'amplitude de chacune des réflexions à un seuil de perceptibilité prédéterminé et identification des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil prédéterminé; modification des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles; détermination d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio multi canal avant restitution sonore. Ainsi, dans la mise en oeuvre de la correction du système de restitution audio multi canal, l'effet des premières réflexions des ondes sonores diffusées par le système de restitution sur la perception auditive des ondes directes est évalué et pris en compte pour adapter le traitement appliqué aux canaux du signal multi canal selon l'effet perceptif spécifique associé à chaque réflexion. Le filtrage des canaux du signal multi canal prend ainsi en compte exclusivement les réflexions qui ont un impact sur la perception auditive des ondes directes. Ceci permet donc d'augmenter la qualité du signal audio restitué.

De plus, comme il n'est pas nécessaire de prendre en compte les réflexions qui ne sont pas perceptibles, au sens ou leur amplitude est inférieure à un seuil de perceptibilité, les contraintes de la correction sont allégées du fait qu'elles prennent en compte les réponses impulsionnelles perceptives au lieu des réponses impulsionnelles brutes. De plus, certaines des réflexions non perceptibles qui sont éliminées des réponses impulsionnelles obtenues correspondent à des composantes de la réponse impulsionnelle qui sont justement à l'origine d'instabilités du traitement (notamment des composantes à phase non minimale). Avec les réponses impulsionnelles perceptives, on diminue ainsi les risques d'instabilités et d'artefacts qui peuvent être générés lors de traitements prenant en compte la totalité des réflexions.

Les différents modes particuliers de réalisation mentionnés ci-après peuvent être ajoutés indépendamment ou en combinaison les uns avec les autres, aux étapes du procédé défini ci-dessus. Dans un mode de réalisation de l'invention, le seuil de perceptibilité est déterminé en fonction de caractéristiques de l'onde directe et des premières réflexions du signal audio 15 prédéterminé. L'influence des réflexions sur la perception de l'onde directe dépend en effet de plusieurs caractéristiques des réflexions. Avantageusement, le seuil de perceptibilité peut être obtenu à partir de caractéristiques déterminées par l'étape d'analyse des réponses impulsionnelles multidirectionnelles des haut-parleurs. 20 Plus particulièrement, le seuil de perceptibilité est déterminé en fonction de la direction d'incidence de l'onde directe et/ou de son amplitude, et des directions d'incidences des premières réflexions et/ou de leurs délais d'arrivée par rapport à l'onde directe. L'effet d'une réflexion sur la perception de l'onde directe dépend généralement de cinq paramètres au total ; d'une part il dépend de deux caractéristiques de l'onde directe 25 son amplitude et sa direction; d'autre part il dépend de trois caractéristiques de la réflexion : son amplitude, son instant d'arrivée et son incidence. Cependant, si l'une des caractéristiques de l'onde directe n'est pas connue, il est possible d'estimer la caractéristique manquante en fixant à une valeur arbitraire l'autre caractéristique. 30 De même, si l'une des informations concernant les réflexions n'est pas connue, on peut par exemple estimer l'effet perceptif de la réflexion en fixant à une valeur arbitraire la caractéristique manquante, en prenant par exemple la valeur correspondant au cas le plus défavorable afin de majorer la perceptibilité. Ainsi, dans le cas où seule l'information de direction des réflexions est connue, il est possible de fixer une valeur à la caractéristique 35 d'instant d'arrivée de la réflexion pour déterminer une valeur du seuil de perceptibilité uniquement par rapport à la valeur de la direction, de même si seule l'information d'instant d'arrivée de la réflexion est connue, on peut fixer la valeur de direction et déterminer le seuil de perceptibilité uniquement selon la valeur de l'instant d'arrivée. Enfin, dans le cas où les deux caractéristiques sont connues, la valeur du seuil peut être déterminée en fonction de ces deux caractéristiques. Dans un mode de réalisation particulier, la détermination de la matrice de filtrage comporte les étapes de: - détermination d'un signal d'erreur défini par la différence entre un signal de réponse cible prédéterminé du système de restitution et un signal de réponse reconstruit à partir des réponses impulsionnelles perceptives; - inversion multicanale par minimisation du signal d'erreur ainsi déterminé pour obtenir les filtres de la matrice de filtrage.

Le signal d'erreur ainsi déterminé permet de prendre en compte dans le calcul de la matrice de filtrage, uniquement les réflexions qui ont un impact sur la perception auditive de l'onde directe. En effet, seules les réflexions qui ne sont pas perceptibles sont enlevées pour la détermination du signal d'erreur. Dans un mode de réalisation possible, le signal de réponse cible prédéterminé correspond à la réponse de l'onde directe seule sans aucune réflexion. Ceci permet de prendre en compte comme signal de référence un signal dépourvu de tout effet de salle. Dans une première variante de réalisation, le signal de réponse cible prédéterminé correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un lieu d'écoute prédéterminé. La réponse de référence peut alors être volontairement choisie comme un lieu d'écoute voulue dans lequel le son est à une qualité souhaitée. Dans une seconde variante de réalisation, le signal de réponse cible prédéterminé correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un ensemble de restitution différent. La réponse de référence est ici choisie en fonction d'un système de restitution de référence choisi, dans lequel le nombre et la position des haut-parleurs peuvent être différents du système de restitution faisant l'objet de la correction. La présente invention vise également un dispositif de calibration d'un ensemble de restitution sonore d'un signal sonore multi canal comportant une pluralité de haut-parleurs. Ce dispositif est tel qu'il comporte: un module d'obtention de réponses impulsionnelles multidirectionnelles des haut-parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé; un module d'analyse des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques des premières réflexions; un module de comparaison de l'amplitude de chacune des réflexions à un seuil de perceptibilité prédéterminé et d'identification des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil prédéterminé; un module de modification des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles par le module d'identification; un module de calcul d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio multi canal avant restitution sonore. Ce dispositif présente les mêmes avantages que le procédé décrit précédemment, qu'il met en oeuvre. L'invention vise également un décodeur audio comportant un dispositif de calibration tel que décrit. Elle vise un programme informatique comportant des instructions de code pour la mise en oeuvre des étapes du procédé de calibration tel que décrit, lorsque ces instructions sont exécutées par un processeur.

Enfin l'invention se rapporte à un support de stockage, lisible par un processeur, intégré ou non au dispositif de calibration, éventuellement amovible, mémorisant un programme informatique mettant en oeuvre un procédé de calibration tel que décrit précédemment. D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels la figure 1 représente un système de restitution sonore et un dispositif de calibration du système de restitution selon un mode de réalisation de l'invention; la figure 2 représente sous forme d'organigramme les étapes principales d'un procédé de calibration selon un mode de réalisation de l'invention; la figure 3a est une représentation d'un repère sphérique; la figure 3b, illustre les composantes harmoniques sphériques dans le cas d'une représentation spatiale ambisonique d'ordre 3; la figure 4 représente un exemple de tableau de valeurs en dB que peut prendre le seuil de perceptibilité utilisé dans le procédé de calibration selon un mode de réalisation de l'invention, pour un son direct d'angle d'incidence de 60°, en fonction de l'angle d'incidence (exprimé en degrés) de la réflexion et du temps d'arrivée (exprimé en ms) de cette réflexion par rapport à l'instant tO d'arrivée de l'onde directe; le seuil de perceptibilité est défini comme le niveau (en dB) de la réflexion auquel est soustrait le niveau (en dB) de l'onde directe ; la figure 5 propose une autre illustration des valeurs prises par le seuil de perceptibilité : le seuil est cette fois représenté en fonction de l'incidence de la réflexion, et ceci pour différentes directions de l'onde directe ; dans tous les cas, le retard de la réflexion par rapport à l'onde directe est fixe et vaut 15 ms; la figure 6 représente un exemple d'une réponse impulsionnelle d'un haut-parleur d'un système de restitution ; le seuil de perceptibilité associé à chaque réflexion est également reproduit par une courbe pointillée; la figure 7 représente un exemple de réalisation matérielle d'un dispositif de calibration selon un mode de réalisation de l'invention. La figure 1 illustre donc un exemple de système de restitution sonore dans lequel le procédé de calibration selon un mode de réalisation de l'invention est mis en oeuvre. Ce système comporte un dispositif de traitement 100 comportant un dispositif de calibration E selon un mode de réalisation de l'invention pilotant un ensemble de restitution 180 qui comporte une pluralité d'éléments de restitutions (haut-parleurs, enceintes acoustiques, ...) représentés ici par des haut-parleurs HP1, HP2, HP3, HP, et HPN. Ces haut-parleurs sont agencés dans un lieu d'écoute dans lequel un microphone ou ensemble de microphones MA est aussi prévu. Ces haut-parleurs et microphones sont pilotés par un dispositif de traitement 100 qui peut être un décodeur tel qu'un décodeur de salon de type "set top box" pour lire ou diffuser des contenus audio ou vidéo, un serveur de traitement apte à traiter des contenus audio et vidéo et à les retransmettre à l'ensemble de restitution, un pont de conférence apte à traiter les signaux audio de différents lieux de conférence ou tout dispositif de traitement audio de signal multi canal. Le dispositif de traitement 100 comporte un dispositif de calibration E selon un mode de réalisation de l'invention et une matrice de filtrage 170 composée d'une pluralité de filtres de traitement qui sont déterminés par le dispositif de calibration selon un procédé de calibration tel qu'illustré ultérieurement en référence à la figure 2. Cette matrice de filtrage reçoit en entrée un signal multi canal Si et transmet en sortie les signaux SC1, SC2, SC,, SCN aptes à être restitués par l'ensemble de restitution 180. Le dispositif de calibration E comporte un module de réception et d'émission 110 apte à transmettre d'une part des signaux audio de référence (Sref) aux différents haut-parleurs de l'ensemble de restitution 180 et à recevoir par le microphone ou l'ensemble de microphones MA, les réponses impulsionnelles multidirectionnelles (RIs) de ces différents haut-parleurs correspondant à la diffusion de ces signaux de référence.

Une réponse impulsionnelle multidirectionnelle contient l'information temporelle et l'information spatiale relatives à l'ensemble des ondes sonores induites par le haut-parleur considéré dans la salle de reproduction. Les signaux de référence sont par exemple des signaux dont la fréquence augmente de façon logarithmique avec le temps, ces signaux étant appelés en anglais "chirps" ou "sweeps" logarithmiques. La convolution du signal mesuré à la sortie du haut-parleur avec un signal de référence inverse permet d'obtenir directement la réponse impulsionnelle du haut-parleur. Dans un mode de réalisation particulier adapté au domaine de représentation des harmoniques sphériques lié au format ambisonique ou HOA, le microphone apte à mesurer les réponses impulsionnelles multidirectionnelles des haut-parleurs est un microphone de type HOA placé en un point du lieu d'écoute, par exemple au centre des haut-parleurs de l'ensemble de restitution. Ce microphone va recevoir, pour chaque haut-parleur restituant un signal audio de référence, le son restitué dans plusieurs directions. En effet, le microphone HOA est constitué d'une pluralité de microphones. Par un traitement approprié, l'information spatiale des différents sons captés peut être extraite. Pour plus de détails sur ce type de microphone, on peut se référer au document intitulé "Etude et réalisation d'outils avancés d'encodage spatial pour la technique de spatialisation sonore Higher Order Ambisonics : microphone 3D et contrôle de la distance" de S. Moreau cité à Univ. du Maine, PhD thesis, 2006. Le microphone HOA récupère alors les réponses impulsionnelles multidirectionnelles de chacun des haut-parleurs pour les transmettre au dispositif de calibration ou pour les stocker en mémoire dans un espace mémoire local ou distant. Lorsque que ces informations sont stockées en mémoire, l'obtention de ces réponses impulsionnelles multidirectionnelles par le dispositif de calibration selon l'invention, s'effectue alors par une simple lecture en mémoire. Ces réponses impulsionnelles multidirectionnelles permettent d'obtenir des informations sur les directions d'arrivée des ondes directes et des réflexions du signal restitué ainsi que des informations de temps d'arrivée à la fois des ondes directes et des réflexions.

Le module d'analyse 120 du dispositif E effectue une analyse conjointe des réponses impulsionnelles obtenues, ce qui permet d'obtenir ces caractéristiques et notamment les caractéristiques des premières réflexions des signaux restitués. Dans le mode de réalisation particulier adapté au domaine de représentation des harmoniques sphériques, les réponses impulsionnelles multidirectionnelles sont obtenues dans une représentation spatio-temporelle où l'information spatiale est décrite sur la base des harmoniques sphériques et permet d'identifier les directions d'incidence des différentes composantes sonores. Ainsi, on obtient au final l'ensemble des informations sur l'amplitude des réflexions, leurs directions d'arrivée et leurs temps d'arrivée en comparaison au temps d'arrivée de l'onde directe. Cette étape sera décrite ultérieurement en référence à la figure 2. L'analyse des réponses impulsionnelles est faite sur une échelle temporelle prédéterminée, englobant les instants des premières réflexions.

Dans un exemple de réalisation cette fenêtre temporelle est de longueur comprise entre 50 et 100 ms, ce qui correspond à l'échelle temporelle des instants d'arrivée des premières réflexions. Bien entendu, le mode de réalisation ainsi décrit est adapté au domaine de représentation des harmoniques sphériques mais il est tout à fait envisageable d'effectuer ces même étapes dans un domaine de représentation WFS (pour "Wave Field Synthesis" en anglais) ou dans le domaine des ondes planes. Dans ces cas de figures, les moyens de captation des signaux restitués par les haut-parleurs seront à adapter à ces domaines de représentation pour obtenir des réponses impulsionnelles multidirectionnelles, sans que cela s'éloigne du cadre de l'invention.

Le dispositif de calibration E comporte également un module 130 de comparaison et d'identification des réflexions non perceptibles. Ce module met en oeuvre une étape de comparaison des amplitudes des réflexions, obtenues par le module d'analyse 120, à un seuil de perceptibilité Se prédéterminé. Ce seuil de perceptibilité est déterminé par le module 140 à partir d'une table de valeurs prédéfinie et stockée dans un espace mémoire.

La détermination de ce seuil de perceptibilité sera explicitée ultérieurement en référence aux figures 4 et 5. Dans le cas où l'amplitude d'une réflexion est inférieure au seuil de perceptibilité tel que défini, cela veut dire que cette réflexion n'a pas d'impact significatif sur la perception auditive de l'onde directe du signal restitué.

Une étape d'identification des ces réflexions "non perceptibles "est alors mise en oeuvre par le module 130. Ces réflexions identifiées permettent de mettre en oeuvre par le module 150 une étape de détermination de réponses impulsionnelles perceptives qui sont déduites des réponses impulsionnelles obtenues par le module 110 par suppression des réflexions jugées comme non perceptibles.

Ainsi, seules les réflexions qui ont un impact sur la perception des ondes directes sont prises en compte pour calculer dans le module 160, la matrice de filtrage Filt. du module de filtrage matriciel 170. La figure 2 illustre sous forme d'organigramme, les étapes principales mises en oeuvre dans un mode de réalisation du procédé de calibration selon l'invention.

A l'étape E201, les réponses impulsionnelles multidirectionnelles des différents haut- parleurs de l'ensemble de restitution tel que décrit en référence à la figure 1, sont obtenues. Elles sont obtenues par le dispositif de calibration, soit par simple lecture en mémoire si celles-ci ont été sauvegardées au préalable, soit par réception du microphone ou d'un ensemble de microphones ayant effectué la mesure. Ces réponses impulsionnelles multidirectionnelles sont les réponses de chaque haut-parleur suite à la reproduction d'un signal de référence tel que décrit en référence à la figure 1. Une étape E202 d'analyse des réponses impulsionnelles multidirectionnelles ainsi obtenues est alors mise en oeuvre. Cette analyse s'effectue dans un domaine de représentation spatio-temporelle. L'information spatiale peut par exemple être décrite dans le domaine de représentation des harmoniques sphériques. Dans cette représentation illustrée à la figure 3a, chaque point a pour coordonnées sphériques, une distance r par rapport à l'origine 0, un angle 0 d'azimut ou d'orientation dans le plan horizontal et un angle S d'élévation ou d'orientation dans le plan vertical. Préférentiellement, la direction définie par (0=0°,8=0°) correspond à la direction en face de l'auditeur. Dans un tel repère, une onde acoustique est parfaitement décrite si l'on définit en tout point à chaque instant t, la pression acoustique notée p(r, 0, 8, t) dont la transformée de Fourier temporelle est notée P(r, 0, 8, f) où f désigne la fréquence temporelle. Dans le contexte de spatialisation ambisonique d'ordre supérieur (HOA), les composantes spatiales sont des composantes ambisoniques 13,:n qui correspondent à la décomposition de l'onde de pression acoustique p sur la base des harmoniques sphériques.

Par exemple, pour une source sonore en champ lointain, c'est-à-dire une onde plane d'incidence (Os, Ss) portant un signal S(t), les composantes ambisoniques Kr, sont données par: 1377,' = S(t). g?, , s) où les fonctions harmoniques sphériques y7°,-', (0, 8) décrivent une base orthonormée: ! Y'' (19, 5) = i2m+1)(2-50,') ((mm±nn))IP,,,,,(sin d) cosne si cr = +1 sin ne si cr = -1 (ignoré si n = 0) Les Pmn (sin br) sont les fonctions de Legendre associées. Une illustration des fonctions harmoniques sphériques est représentée en figure 3b. On peut ainsi voir la composante omnidirective Y' (désignée comme la « composante W » dans la terminologie ambisonique) correspondant à l'ordre 0, les composantes bidirectives il (désignée respectivement comme les « composantes Z, X et Y » dans la terminologie ambisonique) correspondant à l'ordre 1, et les composantes des ordres supérieurs.

Une représentation spatiale tridimensionnelle ou "3D" dite "d'ordre M' comprend K = (M+1)2 composantes dont les triplets d'indices {m,n, o} sont tels que C^InM, cr=±1. Une représentation bidimensionnelle ou "2D" d'ordre M comprend un sous-ensemble de ces composantes en ne retenant que les indices m=n, soit K=2M+1 composantes.

La décomposition sur la base des harmoniques sphériques peut être considérée comme la transformée duale entre coordonnées spatiales et les fréquences spatiales. Les composantes Kr, définissent donc un spectre spatial. Pour chaque haut-parleur, on obtient à l'issue de l'étape E201, une réponse impulsionnelle multidirectionnelle qui est constituée de K réponses impulsionnelles correspondant aux K composantes de la représentation spatiale choisie. Dans le cas de la représentation des harmoniques sphériques, il s'agit des K composantes sur les K=2M+1 harmoniques sphériques considérés. Pour le jième haut-parleur, la réponse impulsionnelle multidirectionnelle qui lui est associée se compose ainsi de K réponses élémentaires HJI(t) où l'indice I repère l'indice de la composante spatiale et t correspond à l'échantillon temporel. Par la suite, on désigne par Mt) le vecteur des K composantes spatiales mesurées pour le jième haut-parleur Mt) = [H,1(t) HJIM 1-1,K(t)]. Si le système de reproduction comprend au total N haut-parleurs, l'ensemble des réponses impulsionnelles multidirectionnelles mesurées pour les N haut-parleurs et les K composantes spatiales définit une matrice H de taille KA, dans laquelle la jième colonne correspond à la réponse impulsionnelle multidirectionnelle associée au jième haut-parleur. Pour chaque haut-parleur, les K composantes spatiales contenues dans le vecteur Mt) représentent le spectre spatial des sons captés par le microphone. Pour accéder à l'information de direction des sons, il convient donc d'effectuer une transformation inverse pour repasser d'une représentation en fonction des fréquences spatiales à une représentation en fonction des coordonnées spatiales. Cette transformation inverse est réalisée en reconstruisant l'onde de pression p(r, 0, 3, t) par combinaison linéaire des harmoniques sphériques, chaque harmonique étant pondéré par l'amplitude de la composante qui lui est associée. On retrouve ces éléments dans la thèse de S. Moreau citée ci-dessus. On peut alors évaluer l'onde de pression p(r, 0, 3, t) en tout point d'une sphère centrée sur le point de mesure des réponses impulsionnelles multidirectionnelles en reconstruisant l'onde de pression point par point par combinaison linéaire des harmoniques sphériques. On peut par exemple évaluer cette pression sur un réseau de P points définissant un « échantillonnage régulier » de la sphère au sens défini dans le mémoire de thèse de S. Moreau. Cette opération s'apparente alors au décodage spatial des composantes ambisoniques pour une restitution par un réseau sphérique régulier de P haut-parleurs virtuels. Cette étape de décodage spatial est par exemple décrite dans le document intitulé "Ambisonics encoding of other audio formats for multiple listening conditions" des auteurs Jérôme Daniel, Jean-Bernard Rault et Jean-Dominique Polack dans AES 105th Convention, September 1998. En pratique, cette transformation des fréquences spatiales (composantes ambisoniques) vers les coordonnées spatiales s'effectue en multipliant, pour chaque haut- parleur et chaque échantillon temporel t, le vecteur Mt) par une matrice de décodage D. Par exemple, la matrice D peut être obtenue comme D=YT, où la matrice Y est calculée en évaluant les K harmoniques sphériques yi,-,'(6,,c5) pour les P directions des haut-parleurs virtuels, en regroupant les azimuths Bq et élévations 8q dans un unique doublet C = (Bq, 8q) associé à un haut-parleur (q désigne l'indice du haut-parleur). Dans la matrice Y, chaque colonne est constituée des valeurs des K harmoniques sphériques pour un haut-parleur donné. Au final, on obtient, pour chaque haut-parleur et chaque échantillon temporel t, un vecteur G,(t) de longueur P décrivant la distribution spatiale des composantes sonores captées sur un réseau de P points définissant un échantillonnage régulier de la sphère: G, (t) = YThi (t) Le maximum de cette fonction G,(t) identifie une réflexion. Si G,(t) présente plusieurs maxima, ces différents maxima identifient chacun une réflexion. Ainsi, pour chaque réflexion identifiée, ses caractéristiques sont déterminées selon la procédure suivante : son instant d'arrivée correspond à l'échantillon tR, = t pour lequel elle est identifiée, son incidence correspond aux coordonnées spatiales CRI = (ORI, dm.) = (Bq, ci) du point pour lequel le maximum de G,(t) est observé, et son amplitude correspond à l'amplitude de ce maximum AR,=G,(t,). Dans ce qui précède, l'indice i repère l'indice de la réflexion considérée. La précision d'estimation de ces caractéristiques dépend donc du nombre P de haut-parleurs virtuels utilisés pour cette analyse. Le premier échantillon temporel pour lequel on observe un maximum définit l'instant d'arrivée de l'onde directe. On a soin de relever aussi l'amplitude (AD) et l'incidence de cette dernière (CD = (OD, SD) où O et 8D définissent respectivement l'angle d'azimut et l'angle d'élévation repérant la direction de l'onde directe). Ainsi, à partir des réponses impulsionnelles multidirectionnelles obtenues, considérées sur une fenêtre d'analyse temporelle englobant les instants des premières réflexions du signal audio reproduit par les haut-parleurs, il est possible de déterminer, et ce pour chaque haut- parleur, les caractéristiques de l'onde directe et les caractéristiques des réflexions qui lui sont associées. Ainsi, pour le jième haut-parleur, sont déterminées d'une part les caractéristiques de l'onde directe comme son amplitude AD(j), son instant d'arrivée sur le microphone TD(j) ou sa direction d'incidence CD(j) ; et d'autre part les caractéristiques des réflexions comme leurs amplitudes AR,(j), leurs instants d'arrivée sur le microphone TR,(j) ou leurs directions d'incidences CR,(j). Dans la suite, on utilisera plutôt l'amplitude normalisée par l'amplitude de l'onde directe ANR, (j) = AARD'(°J)), et le retard entre l'onde directe et la réflexion : T Ri (1) = TRi(1) TD Les premières réflexions d'un signal audio restitué dépendent du lieu d'écoute dans lequel est placé l'ensemble de restitution. D'une façon générale, ces premières réflexions apparaissent dans un temps situé dans une plage allant de 50 à 100ms après l'onde directe. De façon avantageuse, la fenêtre temporelle d'analyse de l'étape E202 sera, dans un mode de réalisation adapté, d'une taille comprise entre 50 et 100 ms. L'étape E203 compare les amplitudes obtenues par l'étape d'analyse à un seuil de perceptibilité Se des réflexions qui a été défini au préalable et stocké en mémoire. L'étape E204 permet de retrouver la valeur de seuil prédéfinie en fonction de caractéristiques de chaque réflexion et de l'onde directe associée, obtenues à l'étape d'analyse E202.

En effet, plusieurs cas de figure peuvent se présenter. Dans un premier exemple de réalisation, seule l'information de direction des réflexions est connue et récupérée de l'étape d'analyse. Pour retrouver le seuil de perceptibilité correspondant, on fixe la valeur de la caractéristique d'instant d'arrivée de la réflexion, par exemple la valeur la plus critique (celle qui donne une perceptibilité maximale) et on détermine la valeur du seuil de perceptibilité uniquement par rapport à la valeur de la direction. De même si seule l'information d'instant d'arrivée de la réflexion est connue, on peut fixer la valeur de direction, par exemple la valeur la plus critique (celle qui donne une perceptibilité maximale), et déterminer le seuil de perceptibilité selon la valeur de l'instant d'arrivée.

Enfin, dans le cas où les deux caractéristiques sont connues, la valeur du seuil peut être déterminée, avec une meilleure précision, en fonction de ces deux caractéristiques. Pour cela, un tableau de valeurs de seuil de perceptibilité est stocké en mémoire. Un exemple d'un tel tableau est illustré en référence à la figure 4. Ce tableau montre, pour un son direct situé à un angle d'azimut à 60°, la valeur du seuil de perceptibilité d'une réflexion exprimée en dB, en fonction des caractéristiques d'angle d'incidence de la réflexion (i.e. son angle d'azimut °Ri dans le plan horizontal correspondant à l'élévation SR,= 0°) et de temps d'arrivée de cette réflexion par rapport au temps d'arrivée de l'onde directe TRI (j). Le seuil est défini comme le niveau relatif de la réflexion, c'est-à-dire qu'il représente la différence entre les valeurs d'amplitude (exprimées en dB) de la réflexion et de l'onde directe considérée.

Ce tableau de valeurs est un exemple de valeurs seuils définies à partir d'expériences psycho-acoustiques réalisées en considérant différents types de signal sonore (parole, clics, musique, etc...), différents angles d'incidences et différents temps d'arrivée des réflexions et de l'onde directe. Un seuil de perceptibilité de ces réflexions est défini en fonction de ces paramètres. Pour compléter l'illustration des valeurs du seuil de perceptibilité de la figure 4, la figure 5 montre différentes courbes de seuil de perceptibilité exprimé en dB (qui correspond toujours au seuil relatif correspondant à la différence entre le niveau de la réflexion et celui de l'onde directe). Ces différentes courbes correspondent à différentes positions de l'onde directe (azimut de 0° pour D1, 60° pour D2, 90° pour D3 et 150° pour D4) et représentent les seuils de perceptibilité en fonction de la direction de la réflexion, ceci pour un temps d'arrivée fixe (correspondant en l'occurrence à 15 ms).

Ainsi, à l'étape E204, la valeur de seuil correspondant aux caractéristiques obtenues à l'étape d'analyse est récupérée. On compare cette valeur de seuil à la valeur d'amplitude de chaque réflexion à l'étape E203. Pour être comparée au seuil de perceptibilité, la valeur de l'amplitude de la réflexion est référencée à celle de l'onde directe associée et exprimée en dB: 2 Olog (AN R,(f)).

Dans le cas où la valeur d'amplitude de la réflexion est inférieure à la valeur de seuil de perceptibilité, cela veut dire que cette réflexion n'a pas d'impact sur la perception que peut avoir un auditeur de l'onde directe. Cette réflexion n'est donc pas à prendre en compte pour le traitement d'un signal multi canal avant restitution. L'étape E203 permet ainsi d'identifier toutes les réflexions qui n'ont pas d'impact sur la perception de l'onde directe. L'étape E203 identifie donc toutes les réflexions pour lesquelles l'amplitude est inférieure au seuil de perceptibilité. Pour illustrer cette étape E203, la figure 6 représente un exemple de réponse impulsionnelle, pour une direction donnée, d'un des haut-parleurs de l'ensemble de restitution en comparaison avec la courbe en trait discontinu représentant le seuil de perceptibilité (RMT pour « Reflection Masked Threshold ») obtenu par la table décrite ci-dessus en référence à la figure 4. Les réflexions dont le niveau est inférieur à la courbe de seuil sont ainsi identifiées. On note que dans le cas illustré, les premières réflexions survenant dans les 15 premières ms ne sont pas perceptibles. A partir de cette identification des réflexions non perceptibles, l'étape E205 effectue une modification des réponses impulsionnelles Mt) obtenues à l'étape E201 pour les j=1 à N haut-parleurs, pour obtenir des réponses impulsionnelles perceptives hp,(t). Pour cela, la modification consiste à éliminer les réflexions non perceptibles identifiées à l'étape E203 dans les réponses impulsionnelles. De façon plus détaillée, cette opération s'effectue par exemple par une opération de seuillage. A chaque instant t, la valeur du seuil de perceptibilité Se est retranchée au signal de réponse impulsionnelle qui a été obtenue à l'étape E201. Préférentiellement ce traitement est appliqué sur le spectre spatial défini par les K composantes Mt) = [I-1,1(t) 1-1,1(t) 1-1,K(t)] dans le domaine de représentation spatiale choisi, correspondant par exemple à la représentation sur la base des harmoniques sphériques. Cependant le traitement peut aussi s'appliquer dans le domaine dual des coordonnées d'espace. Dans la suite, nous allons décrire l'opération réalisée dans le cas du spectre spatial.

L'opération de seuillage consiste à comparer pour chaque réflexion identifiée son amplitude au seuil de perceptibilité Se associé à ses caractéristiques. Ainsi, pour la ième réflexion identifiée pour le jième haut-parleur, le seuil Se(i) est déterminé en fonction de ses caractéristiques [ T Ri(1), CRia)]. Cette réflexion est localisée à l'instant t, donné par: t, = TD(j) + T Ri(l) .

Pour réaliser le seuillage, on considère donc la réponse impulsionnelle à cet instant, soit he,), ou plus exactement sur le spectre spatial associé et constitué des K composantes-[1-1,1(t) -.. 1-11(t) HK(t,)]. Plusieurs stratégies sont alors possibles. La plus simple consiste à préserver l'amplitude relative des composantes du spectre spatial, c'est-à-dire qu'on applique un traitement identique à toutes les composantes. Dans ce cas, pour chaque composante 1-11(t,), l'opération de seuillage peut se traduire par les équations suivantes: HP t-) = 0 si ANR,(j) < 100.055e HPii(ti) = (ilii(ti) - 10'3°51) 1111(t1) si ANR,(j) > 100.05se IHJI(t1)1 où HP,I(t) désigne la réponse impulsionnelle perceptive associée à H i(t).

Ainsi, les réponses impulsionnelles perceptives ne conservent que les réflexions ayant un impact significatif sur la perception de l'onde directe. Ces réponses impulsionnelles perceptives sont alors utilisées pour déterminer la matrice de filtrage, à l'étape E206. Cette matrice de filtrage est ensuite utilisée pour traiter le signal audio multi canal avant sa restitution sonore par l'ensemble de restitution du système.

Pour obtenir l'ensemble de filtres constituant la matrice de filtrage Filt du dispositif de traitement, un mode de réalisation possible comporte une étape de détermination d'un signal d'erreur défini par la différence entre un signal de réponse cible prédéterminé de l'ensemble de restitution et un signal de réponse reconstruit à partir des réponses impulsionnelles perceptives et une étape d'inversion multicanale par minimisation du signal d'erreur ainsi déterminé. Le signal d'erreur ainsi obtenu ne prend donc en compte que les réflexions perceptibles puisque qu'il est calculé à partir d'un signal reconstruit basé sur les réponses impulsionnelles perceptives. L'inversion peut être réalisée par un algorithme de descente de gradient ou ses variantes. Un exemple d'algorithme d'inversion possible est celui de type ISTA (pour "Iterative Shrinkage-Thresholding algorithm) tel que décrit dans le document intitulé " A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems" des auteurs Amir Beck & Marc Teboulle, publié dans SIAM J. IMAGING SCIENCES, Vol. 2, No. 1, pp. 183-202 en 2009. D'une façon générale, le problème qui se pose pour calculer les filtres de la matrice de traitement, est le suivant. Il y a N haut-parleurs qui constituent le système réel de reproduction. Dans le contexte de spatialisation ambisonique d'ordre supérieur (HOA), l'espace de représentation spatiale est de dimension K. L'information spatiale est donc décrite par K coefficients. L'objectif est de reproduire avec le système de N haut-parleurs, un ensemble de V signaux définissant le signal audio multicanal d'entrée. Ces V signaux sont dédiés à un système idéal de reproduction constitués de V haut-parleurs. Ce système idéal définit les V signaux cibles qu'on souhaite reproduire et qui correspondent donc aux réponses d'un système fictif de V haut-parleurs virtuels. Dans le cas le plus simple, le système réel de reproduction comporte aussi N=V haut-parleurs. Mais dans le cas général, on est capable d'émuler un système de V haut-parleurs virtuels à partir d'un dispositif de N haut-parleurs réels.

L'équation à résoudre est la suivante: T(t)=H*W(t) avec H, la matrice de dimension KxN comportant les réponses impulsionnelles des N éléments du système de restitution dans le domaine d'analyse spatiale, W, la matrice comportant les filtres de correction à calculer, de dimension NxV, T, la matrice contenant les V réponses cibles définies dans le domaine d'analyse spatiale, de dimension et l'opération dénotée par « * » est un produit matriciel convolutif où un élément Tu de la matrice T est obtenu de la façon suivante : Tii = Hik * Wki k=1 Chaque matrice est une matrice de vecteurs, au sens où la troisième dimension correspond à l'échelle des temps. L'objectif de l'opération d'inversion est de trouver les éléments de la matrice W. La résolution de cette opération peut s'effectuer en deux temps. Tout d'abord, on calcule les filtres de correction en ne corrigeant que l'effet de salle du lieu de restitution, c'est-à-dire qu'on prend en compte le dispositif réel de haut-parleurs, soit N haut-parleurs. Dans une seconde étape, on compense la disposition des haut-parleurs pour adapter les V signaux à une restitution selon une configuration non idéale de N haut-parleurs. Dans ce but, les V signaux sont répartis par matriçage sur les N canaux associés au système réel de reproduction afin d'émuler un système de V haut-parleurs virtuels.

Dans le cas présent, pour mettre en oeuvre l'invention, les éléments de la matrice H comportent les réponses impulsionnelles perceptives telles qu'obtenues à l'étape E205.

Les réponses cibles peuvent varier selon le résultat de restitution sonore attendue. Dans un mode de réalisation, cette réponse cible correspond à la réponse impulsionnelle donnée par l'onde directe seule sans aucune réflexion. Cela revient à supprimer tout l'effet de salle dans le signal attendu.

Dans une première variante de réalisation, le signal de réponse cible correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un lieu d'écoute prédéterminé. Un lieu d'écoute caractéristique qui présente une bonne qualité d'écoute peut être souhaitée (par exemple le lieu d'écoute de la salle Pleyeln. Dans ce cas, les filtres de traitement seront calculés pour obtenir une restitution sonore proche de cette qualité d'écoute. Dans une deuxième variante de réalisation, le signal de réponse cible correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un ensemble de restitution différent de celui utilisé pour restituer le signal résultant.

Ainsi, un système de restitution souhaité, par exemple comportant plus de haut- parleurs, est pris comme référence pour obtenir une restitution proche de celle qui aurait été obtenu avec un tel système. D'autres signaux de réponse cibles peuvent bien évidemment être choisi selon l'effet de la restitution souhaitée.

Ainsi, la mise en oeuvre du procédé décrit permet d'obtenir une meilleure qualité d'écoute lors de la restitution d'un signal audio multi canal grâce à la prise en compte seule des réflexions perceptibles des signaux par l'ensemble de restitution dans le lieu d'écoute. La figure 7 représente un exemple de réalisation matérielle d'un dispositif de calibration selon l'invention. Celui-ci peut faire partie intégrante d'un décodeur audio/vidéo, d'un serveur de traitement, d'un pont de conférence ou de tout autre équipement de lecture ou de diffusion audio ou vidéo. Ce type de dispositif comporte un processeur pP coopérant avec un bloc mémoire MEM comportant une mémoire de stockage et/ou de travail. Le bloc mémoire peut avantageusement comporter un programme informatique comportant des instructions de code pour la mise en oeuvre des étapes du procédé de calibration au sens de l'invention, lorsque ces instructions sont exécutées par le processeur, et notamment les étapes d'obtention de réponses impulsionnelles multidirectionnelles des haut-parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé, d'analyse des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques des premières réflexions, de comparaison de l'amplitude de chacune des réflexions à un seuil de perceptibilité prédéterminé et d'identification des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil prédéterminé, de modification des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles et de détermination d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio multi canal avant restitution sonore. Typiquement, la description de la figure 2 reprend les étapes d'un algorithme d'un tel programme informatique. Le programme informatique peut également être stocké sur un support mémoire lisible par un lecteur du dispositif ou téléchargeable dans l'espace mémoire de celui-ci. La mémoire MEM enregistre une table de valeurs de seuil de perceptibilité en fonction de caractéristiques des composantes sonores constituées de l'onde directe et des réflexions utilisée dans le procédé selon un mode de réalisation de l'invention et de manière générale, toutes les données nécessaires à la mise en oeuvre du procédé.

Un tel dispositif comporte un module d'entrée I apte à recevoir des réponses impulsionnelles d'un ensemble de restitution et un module de sortie S apte à transmettre à un module de traitement, les filtres calculés d'une matrice de filtrage. Dans un mode possible de réalisation, le dispositif ainsi décrit peut également comporter les fonctions de traitement par la mise en oeuvre de la matrice de traitement à la réception en I d'un signal multi canal Si pour transmettre en sortie des signaux traités SCi aptes à être restitués par l'ensemble de restitution.25

Claims

REVENDICATIONS1. Procédé de calibration d'un ensemble de restitution sonore d'un signal sonore multi canal comportant une pluralité de haut-parleurs, caractérisé en ce qu'il comporte les étapes suivantes: obtention (E201) de réponses impulsionnelles multidirectionnelles des haut-parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé; analyse (E202) des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques (AR,, CR,, TR,) des premières réflexions; comparaison (E203) de l'amplitude de chacune des réflexions à un seuil de perceptibilité prédéterminé (E204) et identification (E203) des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil prédéterminé; modification (E205) des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles; détermination (E206) d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au signal audio multi canal avant restitution sonore.2. 3. 35 4. Procédé selon la revendication 1, caractérisé en ce que le seuil de perceptibilité est déterminé en fonction de caractéristiques de l'onde directe et des premières réflexions du signal audio prédéterminé. Procédé selon la revendication 2, caractérisé en ce que le seuil de perceptibilité est déterminé en fonction de la direction d'incidence de l'onde directe (CD) et/ou de son amplitude (AD), et des directions d'incidences des premières réflexions (CR,) et/ou de leurs délais d'arrivée (TR,) par rapport à l'onde directe. Procédé selon la revendication 1, caractérisé en ce que la détermination de la matrice de filtrage comporte les étapes de: - détermination d'un signal d'erreur défini par la différence entre un signal de réponse cible prédéterminé du système de restitution et un signal de réponse reconstruit à partir des réponses impulsionnelles perceptives;- inversion multicanale par minimisation du signal d'erreur ainsi déterminé pour obtenir les filtres de la matrice de filtrage. Procédé selon la revendication 4, caractérisé en ce que le signal de réponse cible prédéterminé correspond à la réponse de l'onde directe seule sans aucune réflexion. Procédé selon la revendication 4, caractérisé en ce que le signal de réponse cible prédéterminé correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un lieu d'écoute prédéterminé. Procédé selon la revendication 4, caractérisé en ce que le signal de réponse cible prédéterminé correspond à la réponse d'une onde directe associée à des réflexions représentatives d'un ensemble de restitution différent. Dispositif de calibration d'un ensemble de restitution sonore d'un signal sonore multi canal comportant une pluralité de haut-parleurs, caractérisé en ce qu'il comporte: un module d'obtention (110) de réponses impulsionnelles multidirectionnelles des haut-parleurs de l'ensemble de restitution à la reproduction d'un signal audio prédéterminé; un module d'analyse (120) des réponses impulsionnelles multidirectionnelles obtenues, dans un domaine de représentation spatio-temporelle, sur au moins une fenêtre temporelle englobant les instants d'arrivée des premières réflexions 25 du signal audio prédéterminé reproduit pour déterminer un ensemble de caractéristiques (AR,, CR,, TR,) des premières réflexions; un module de comparaison (120) de l'amplitude de chacune des réflexions à un seuil de perceptibilité prédéterminé (140) et d'identification (120) des réflexions non perceptibles pour lesquelles l'amplitude est inférieure au seuil prédéterminé; 30 un module de modification (150) des réponses impulsionnelles obtenues pour obtenir des réponses impulsionnelles perceptives, par suppression des réflexions identifiées comme non perceptibles par le module d'identification; un module de calcul (130) d'une matrice de filtrage à partir des réponses impulsionnelles perceptives pour une application de cette matrice de filtrage au 35 signal audio multi canal avant restitution sonore. 9. Décodeur audio comportant un dispositif de calibration selon la revendication 8. 5. 6. 7. 8.2010. Programme informatique comportant des instructions de code pour la mise en oeuvre des étapes du procédé de calibration selon l'une des revendications 1 à 7, lorsque ces instructions sont exécutées par un processeur. 11. Support de stockage, lisible par un processeur, sur lequel est stocké un programme informatique comprenant des instructions de code pour l'exécution des étapes du procédé de calibration selon l'une des revendications 1 à 7.10