ES2585406T3 - Aparato y método para calcular coeficientes de filtro para supresión de eco - Google Patents

Aparato y método para calcular coeficientes de filtro para supresión de eco Download PDF

Info

Publication number
ES2585406T3
ES2585406T3 ES09705713.7T ES09705713T ES2585406T3 ES 2585406 T3 ES2585406 T3 ES 2585406T3 ES 09705713 T ES09705713 T ES 09705713T ES 2585406 T3 ES2585406 T3 ES 2585406T3
Authority
ES
Spain
Prior art keywords
signal
filter
filter coefficients
stationary component
echo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09705713.7T
Other languages
English (en)
Inventor
Fabian Kuech
Markus Kallinger
Christof Faller
Alexis Favrot
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2585406T3 publication Critical patent/ES2585406T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • H04B3/237Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using two adaptive filters, e.g. for near end and for end echo cancelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Abstract

Un aparato (200) para el calculo de coeficientes de filtro para un filtro adaptativo (210) para filtrar una senal de microfono con el fin de suprimir un eco debido a una senal de altavoz, que comprende: medios de extraccion (250) para la extraccion de una senal de componente estacionario o una senal de componente no estacionario de la senal de altavoz o de una senal derivada de la senal de altavoz, en el que los medios de extraccion (250) estan configurados para emitir la senal de componente estacionario y la senal de componente no estacionario; y medios de calculo (270) para el calculo de los coeficientes de filtro del filtro adaptativo (210) sobre la base de la senal de componente estacionario extraida o la senal de componente no estacionario extraida, en el que los medios de calculo (270) estan configurados para calcular unos primeros coeficientes de filtro en base a la senal de componente estacionario, y para calcular unos segundos coeficientes de filtro en base a la senal de componente no estacionario, y en el que los medios de calculo estan configurados ademas para determinar los coeficientes de filtro, ya sea sobre la base de los primeros coeficientes del filtro o sobre la base de los segundos coeficientes del filtro, y en el que los medios de calculo (270) estan configurados para determinar los coeficientes de filtro sobre la base de los coeficientes de filtro de los primeros coeficientes de filtro o de los segundos coeficientes de filtro que corresponden a un mayor nivel de atenuacion.

Description

5
10
15
20
25
30
35
40
45
50
55
60
Aparato y metodo para calcular coeficientes de filtro para supresion de eco
DESCRIPCION
Las realizaciones de la presente invencion se refieren a metodos y aparatos para calcular coeficientes de filtro para un filtro adaptable para la filtracion de una senal de microfono para suprimir un eco debido a una senal de altavoz, como puede ser empleada, por ejemplo, en el contexto de sistemas de conferencia. Ejemplos de sistemas de conferencia incluyen sistemas de conferencia telefonicos, sistemas de conferencia de video u otros sistemas de conferencia bidireccionales.
Antecedentes
Los ecos acusticos surgen siempre que tonos, sonidos y ruidos de un altavoz son captados por un microfono ubicado en la misma sala o en el mismo medio ambiente acustico. En sistemas de telecomunicaciones, esta senal de retroalimentacion acustica es transmitida de regreso al suscriptor del extremo lejano, que nota una version retardada de su propia habla. En este contexto, las senales de eco representan una alteracion muy distractora y puede aun inhibir la comunicacion plenamente duplex interactiva. Adicionalmente, los ecos acusticos pueden dar como resultado efectos de aullido y otras inestabilidades del circuito de retroalimentacion acustico.
El documento WO 2006/111370 A1 se refiere a un metodo y aparato para remover un eco en una senal de audio de multicanal. El control de eco acustico y supresion de ruido son una parte importante de cualquier sistema de telecomunicacion de manos libres, tales como sistemas de conferencia telefonicos, de audio o video. El metodo, descrito en el documento, de procesamiento de senales de altavoz de audio de multicanal y por lo menos una senal de microfono en este contexto incluye las etapas de transformar la senal de entrada del microfono a espectros de corto tiempo de microfono de entrada, calcular un espectro corto tiempo de senal de altavoz combinada de las senales de altavoz, calcular un espectro de corto tiempo de senal de microfono combinada a partir de la senal de microfono de entrada, estimar un espectro de magnitud o un espectro de potencia del eco en el espectro de corto tiempo de senal de microfono combinada, calcular un filtro de ganancia para la modificacion de magnitud del espectro de corto tiempo del microfono de entrada, aplicar el filtro de ganancia a por lo menos un espectro de microfono de entrada y convertir el espectro de microfono de entrada filtrado al dominio de tiempo.
Sistemas de supresion de eco y cancelacion de eco como ya son empleados hoy en dfa y pueden tambien ser denominados como sistemas de remocion de eco, en resumen, frecuentemente tienen el problema de que no tratan con diferentes componentes de sonido, tono y ruido de una manera optima a pesar del uso de filtros adaptables. Si un componente es predominante en comparacion con otro, se puede presentar una supresion no optima del eco de la senal de altavoz en la senal de microfono de tal sistema de comunicacion, por ejemplo. Por otra parte, en el caso de una composicion de desviacion de los componentes de las diferentes fuentes, pueden surgir artefactos tonales debido a la utilizacion de un sistema de supresion de eco cancelacion de eco, tales artefactos tonales son tambien percibidos como extremadamente molestos.
El documento EP 1. 429 315 A1 se refiere a un metodo y a un sistema para la supresion de ecos y ruido en entornos de bajas condiciones acusticas variables, asf como condiciones de una gran proporcion de realimentacion. El sistema de cancelacion de ecos y ruidos en entornos con condiciones acusticas variables y alta regeneracion, como en el interior de un vetuculo automovil, que permite la comunicacion acustica entre los ocupantes, comprende uno o varios microfonos para una senal de voz y A/D, convertidores D/A, amplificacion y filtrado de medios de generacion de una senal electrica que se reproduce como una senal acustica mediante un altavoz, y un cancelador de eco que utiliza la senal y una senal electrica desde el microfono que integra de la senal de retroalimentacion de la senal, otra senal de voz y el ruido dimensionado por el microfono. El sistema se aplica a la eliminacion de la retroalimentacion, proporcionando un filtrado adicional de una senal de salida electrica del dispositivo de cancelacion, despues del tratamiento de la de la senal, que comprende un filtro variante en el tiempo que suprime el eco acustico residual con eco cancelado por el sistema y el ruido dimensionado por los microfonos.
Iniciando de este arte previo, el objeto de la presente invencion es por consiguiente mejorar la calidad de sonido de un sistema de supresion de eco o sistema de cancelacion de eco.
Esto objeto es obtenido por un aparato como se reivindica en la reivindicacion 1, un metodo como se reivindica en la reivindicacion 19 o un programa como se reivindica en la reivindicacion 20, o un aparato como se reivindica en la reivindicacion 21.
Sumario
Realizaciones de un aparato para calcular coeficientes de filtro para un filtro adaptable para la filtracion de una senal
5
10
15
20
25
30
35
40
45
50
55
60
de microfono para suprimir un eco debido a una senal de altavoz, como se especifica en las reivindicaciones 1 y 21.
Una realizacion de un metodo para calcular coeficientes de filtro para un filtro adaptable para la filtracion de una senal de microfono para suprimir un eco debido a una senal de altavoz en este contexto como se especifica en la reivindicacion 19.
Realizaciones de la presente invencion estan basadas en el hallazgo de que se puede obtener mejora de la calidad de audio en que las propiedades estaticas de la senal de altavoz o de una senal derivada de la senal de altavoz pueden ser mejoradas, dentro del contexto de calculo de los coeficientes de filtro para filtracion adaptable para suprimir un eco en la senal de microfono, en que la senal de altavoz es analizada en cuanto a sus propiedades estaticas. Para este fin, la senal de altavoz o una senal derivada de la senal de altavoz es analizada - de acuerdo con realizaciones de la presente invencion - en cuanto a un componente estacionario y/o un componente no estacionario en que una o mas senales componentes correspondientes son extrafdas de la respectiva senal de altavoz o de la senal derivada de la misma. El calculo de los coeficientes de filtro adaptable es luego efectuado en base a la senal componente estacionaria extrafda o la senal componente no estacionaria extrafda.
Un componente estacionario de una senal, esto es, por ejemplo, de la senal de altavoz o de una senal derivada de la senal de altavoz, puede representar, por ejemplo, en un dominio frecuencia-relacionado, un valor relacionado con la energfa que vana poco con el paso del tiempo, o puede formar un componente estacionario correspondiente. Un componente estacionario de tal senal puede asf ser determinado, por ejemplo, en un dominio frecuencia-relacionado en que un valor relacionado con la energfa es determinado para una senal de paso de banda de la senal respectiva y que se realiza el promedio sobre el avance del tiempo. El promedio puede ser conducido como promedio flotante, posiblemente utilizando diferentes especificaciones de calculo. Tal calculo se puede llevar a cabo, por ejemplo, de manera recursiva aprovechando una estructura tipo filtro IIR (IIR = respuesta de impulso infinita). Similarmente, el promedio correspondiente puede tambien ser efectuada utilizando una estructura tipo filtro FIR (FIR = respuesta de impulso finita).
Asf, un componente no estacionario de la senal de altavoz o de la senal derivada puede ser determinado en base a una senal de paso de banda correspondiente de la senal respectiva. Por ejemplo, en realizaciones de la presente invencion, la senal componente no estacionaria asociada puede ser determinada, por ejemplo, en base a la senal componente estacionaria y un filtro de ganancia. En realizaciones, el filtro de ganancia puede depender ademas de por lo menos un parametro de control, que en realizaciones de la presente invencion es determinado, por ejemplo, en base a una funcion de coherencia que toma en cuenta la senal de altavoz y la senal de microfono, o senales derivadas de las mismas.
En realizaciones de la presente invencion, primeros coeficientes de filtro pueden ser calculados en base a la senal componente estacionaria y segundos coeficientes de filtro pueden ser calculados en base a la senal componente no estacionaria, en base a lo cual los coeficientes de filtro para el filtro adaptable son inevitablemente determinados. Esto puede tomar lugar, por ejemplo, de tal manera que los coeficientes de filtro del filtro adaptable corresponden a una conexion en serie de un primer filtro, que esta basado en primeros coeficientes de filtro, y un segundo filtro, que esta basado en los segundos coeficientes de filtro. En realizaciones de la presente invencion tambien es posible determinar los coeficientes de filtro ya sea en base a los primeros coeficientes de filtro o en base a los segundos coeficientes de filtro.
Realizaciones adicionales seran descritas, en el curso adicional de la presente descripcion, con respecto a sus estructuras y modos de operacion. Dependiendo de la realizacion especifica, las senales componentes estacionarias y las senales componentes no estacionarias pueden ser senales estimadas de las senales respectivas. Asimismo, un aparato de acuerdo con una realizacion de la presente invencion puede comprender ademas supresion de medios de filtracion configurados para filtrar la senal de microfono en base a los coeficientes de filtro.
Breve descripcion de las figuras
Realizaciones de la presente invencion seran explicadas a continuacion en mas detalle con referencia a las figuras adjuntas. Realizaciones de la presente invencion pueden por consiguiente ser comprendidas mejor con respecto a las siguientes figuras:
La Figura 1
La Figura 2
Las Figuras 3a a 3c
muestra un montaje general de un problema de remocion de eco acustico;
muestra un diagrama de bloques de un aparato para calcular coeficientes de filtro de acuerdo con una realizacion de la presente invencion;
muestran diagramas de bloque de diferentes medios de extraccion de acuerdo con realizaciones de la presente invencion;
5
10
15
20
25
30
35
40
45
50
55
60
Las Figuras 4a y 4b muestran diagramas de bloque de un filtro de estimacion de eco opcional de acuerdo
con realizaciones de la presente invencion;
Las Figuras 5a a 5e muestran diagramas de bloque de medios de calculo de acuerdo con varias
realizaciones de la presente invencion;
La Figura 6
muestra un diagrama de bloques de una realizacion adicional de acuerdo con la presente invencion;
La Figura 7 muestra un diagrama de bloques de una realizacion adicional de la presente invencion
en forma de un aparato para calcular coeficientes de filtro;
Las Figuras 8a a 8c ilustran a separacion de un componente estacionario y un componente no estacionario
de una senal de altavoz;
La Figura 9a muestra un filtro de supresion de eco para el componente no estacionario a una
frecuencia de 1 kHz;
La Figura 9b muestra un filtro de supresion de eco asociado para un componente estacionario de la
senal;
Las Figuras 10a a 10c ilustran la relacion entre la intensidad de un componente estacionario y un componente
no estacionario y una ganancia de prediccion junto con una actividad de voz de un canal de altavoz;
La Figura 11 La Figura 12 La Figura 13
La Figura 14 La Figura 15a
muestra un diagrama de bloques de una realizacion adicional de la presente invencion;
muestra un diagrama de bloques de una realizacion adicional de la presente invencion;
muestra un diagrama de bloques de una realizacion de la presente invencion para una implementacion de multicanal;
muestra una ilustracion de un agrupamiento de un espectro de transformacion de Fourier de corto tiempo uniforme a grupos para imitar la resolucion de frecuencia no uniforme del sistema auditivo humano;
muestra filtros de interpolacion de Hann usados para suavizar el filtro de ganancia sobre la frecuencia; y
La Figura 15b
muestra el curso de los coeficientes de filtro de ganancia junto con una curva interpolada de los mismos.
Descripcion detallada de las realizaciones
Antes de describir, con referencia a las Figuras 2 a 15, varias realizaciones de la presente invencion que permiten la supresion de eco acustico en tanto que se usa una separacion de componentes de senal estacionarios y no estacionarios, un montaje general de un problema de remocion de eco acustico sera inicialmente ilustrado con referencia a la Figura 1.
Los ecos acusticos surgen siempre que sonidos, tonos y ruidos de un altavoz son captados por un microfono ubicado en la misma sala o en el mismo medio ambiente acustico. En sistemas de telecomunicacion, estas senales de retroalimentacion acusticas son transmitidas de regreso al suscriptor del extremo lejano, que nota una version retardada de su propia habla. En este contexto, las senales de eco pueden representar una atraccion muy distractiva y aun puede inhibir la comunicacion plenamente duplex interactiva. Adicionalmente, los ecos acusticos pueden dar como resultado efectos de aullido y otras inestabilidades del circuito de retroalimentacion acustico. En un sistema de telecomunicacion de manos libres apropiado plenamente duplex, el control de eco es por consiguiente requerido para la supresion del acoplamiento entre el altavoz y el microfono. La Figura 1 ilustra el problema de eco acustico.
La Figura 1 muestra asf un altavoz 100, que puede ser provisto, junto con un microfono 110, en un medio ambiente acustico 120, que puede ser por ejemplo una sala, Similarmente, el medio ambiente acustico 120 puede tambien ser el interior de un vehfculo.
5
10
15
20
25
30
35
40
45
50
55
60
En este contexto, una senal de altavoz 130, que en la Figura 1 es tambien denominada como x[n] con un mdice de tiempo entero n, se hace disponible al altavoz 100. El microfono 110 capta los ruidos, sonidos y tonos que se derivan del medio ambiente acustico 120, y genera una senal de microfono 140, que es tambien denominada como y[n] en la Figura 1. Tanto la senal del altavoz 130 como la senal de microfono 140 son provistas como senales de entrada a una unidad de proceso de remocion de eco 150, que provee, en una salida, una senal eco-suprimida 160 de la senal de microfono 140, que tambien es denominada como e[n] en la Figura 1.
La Figura 1 ilustra asf basicamente el problema de eco acustico como puede surgir en sistemas de comunicacion bidireccionales. La senal del extremo lejano del sistema de telecomunicacion que es emitida por el altavoz llega al microfono en una trayectoria directa 170 y via trayectorias reflejadas 180-1, 180-2, que tambien son denominadas como trayectorias indirectas. Por esta razon, el microfono 110 no solamente capta la voz en el local, extremo cercano, sino tambien registra el eco que es luego retroalimentado al usuario en el extremo lejano.
En otras palabras, la senal del altavoz x[n] es retroalimentada a la senal del microfono y[n]. Un proceso de remocion de eco, efectuado en la unidad de proceso de remocion de eco 150, idealmente remueve este eco mientras que permite que la voz del extremo local, cercano del sistema telecomunicacion pase a traves.
Un metodo convencional para tratar este eco es colocar un cancelador de eco acustico (AEC) en paralelo con la trayectoria de propagacion de la senal de eco, como se describe en la Referencia [1]. En tal cancelador de eco acustico, se estima una replica digital de la senal de eco y es restada subsecuentemente de la senal de microfono medida u observada. Procedimientos estandar para cancelar ecos acusticos dependen de la suposicion de que la trayectoria de eco puede ser modelada mediante un filtro de FIR lineal (FIR = respuesta de impulso finita), e implementar canceladores de eco acusticos asf, como tambien se describe en la Referencia [1]. Puesto que la trayectoria de eco comunmente es desconocida y ademas, puede cambiar durante el tiempo de operacion, el filtro lineal de tal cancelador de eco acustico es comunmente realizado de manera adaptable. Para ser aptos de modelar trayectorias de eco tfpicas, se hace uso de filtros de FIR de longitudes de comunmente algunos cientos de milisegundos - en relacion con la velocidad de toma de muestras respectiva - que tambien implica un alto nivel de complejidad de calculo.
En la practica, las atenuaciones de eco obtenibles por estos procedimientos convencionales frecuentemente no son suficientes por varias razones. Las varias razones incluyen, por ejemplo, tiempos de reverberacion largos (efecto de cola de eco), que resultan en submodelado de la trayectoria de eco, componentes de eco no lineales provocados, por ejemplo, por los efectos de vibracion o el comportamiento no lineal de los elementos ffsicos de audio particularmente de bajo costo y problemas de convergencia en caso de una velocidad de cambio temporal alta con respecto a las trayectorias de eco, como se describe en la Referencia [2]. Por consiguiente, los canceladores de eco acusticos son combinados con post-procesadores no lineales para remover ecos residuales y componentes de eco que el cancelador de eco no podna eliminar, como se describe en la Referencia [3]. Comunmente, la supresion de ecos residuales es efectuada de manera frecuencia-selectiva, como se describe en la Referencia [4]. Por supuesto, virtualmente todos los canceladores de eco acusticos utilizan tales post-procesadores debido a que frecuentemente fallan en reducir suficientemente el eco de tal manera que se vuelve inaudible.
Recientemente, un numero de supresores de eco acusticos para el dominio de sub-banda han sido propuestos en las Referencias [5, 6] que llevan similaridades a los post-procesadores no lineales mencionados anteriormente, pero no tienen la necesidad de un cancelador de eco acustico y para estimar la respuesta de impulso de trayectoria de eco. Se reivindica que estos sistemas son de baja complejidad computacional para ser robustos en tanto que obtienen un alto grado de duplexidad.
El esquema de supresor de ecos propuesto en la Referencia [6] aplica una transformada de Fourier de corto tiempo (STFT) para calcular espectros de las senales de altavoz y microfono. Un valor de retardo d entre las transformadas de tiempo corto de las dos senales es aplicado a la senal de altavoz correspondiente, dicho valor de retardo es escogido de tal manera que la mayona del efecto de la respuesta de impulso de trayectoria de eco es tomada en cuenta.
Luego, se estima un filtro de estimacion de eco de valor real, que imita el efecto de la trayectoria de eco inicial. Para obtener un espectro de magnitud de eco estimado, el valor de retardo estimado y el filtro de estimacion de eco son aplicados a los espectros del altavoz, en tanto que se utiliza un valor estimativo del espectro de magnitud de eco, se calcula un filtro de supresion de eco de valor real y es aplicado al espectro de senal de microfono para suprimir el eco.
La debilidad de los sistemas de supresion de eco acusticos mencionados anteriormente es que no se desempenan bien en relacion con senales de altavoz compuestas de una mezcla de componentes de senal estacionarios y no estacionarios. Este es el caso, por ejemplo, cuando el habla del extremo lejano es registrada en un medio ambiente ruidoso. Luego, la senal de altavoz y la senal de eco contienen el habla del extremo lejano no estacionaria y el ruido
5
10
15
20
25
30
35
40
45
50
55
60
de fondo del extremo lejano estacionario.
Los sistemas de supresion de eco acustico actuales determinan solamente un filtro de remocion de senal de eco para la senal de altavoz. Consecuentemente, estos procedimientos no toman en cuenta que componentes de eco con diferentes caractensticas provocan diferentes tipos de alteraciones en las senales de extremo cercano, lo que por consiguiente deben ser procesados diferentemente.
La Figura 2 muestra una primera realizacion de un aparato 200 para calcular coeficientes de filtro para un filtro adaptable 210, dicho aparato utiliza, como el metodo asociado, una separacion de una senal estacionaria y una senal no estacionaria con el fin de mejorar la supresion de eco y, asf, mejorar la calidad de audio obtenible. Realizaciones de la presente invencion permiten asf diferentes clases de manipulacion de la supresion de senales de acuerdo con sus propiedades y elementos estadfsticos, lo que conduce a una supresion de eco mas efectiva que es menos propensa a artefactos.
Como introduccion, un diagrama de bloques del aparato 200 de acuerdo con una realizacion de la presente invencion sera explicado inicialmente, antes de que detalles de implementacion adicionales sean explicados, en relacion con las Figuras 3 a 5, con respecto a varias realizaciones de la presente invencion. En este contexto, es util indicar que aun si los diagramas de bloques de aparatos de acuerdo con realizaciones de la presente invencion son mostrados y descritos en las figuras, dichos diagramas de bloques pueden tambien ser entendidos como diagramas de flujo de metodos correspondientes que ilustran las etapas de metodo correspondientes en tanto que indican las direcciones de flujo. En otras palabras, los diagramas de bloques ilustrados en relacion con la presente descripcion pueden tambien ser entendidos como diagramas de flujo correspondientes que reflejan las etapas del metodo individuales de los medios y unidades individuales.
Ademas, es util notar en este punto, en el contexto de la presente descripcion, numeros de referencia identicos o similares seran usados para medios, objetos y estructuras que son identicos o similares en funcion. Por otra parte, los medios, unidades y objetos designados por numeros de referencia identicos o similares comprenden elementos estructurales y funcionales identicos o similares. En otras palabras, en la presente descripcion, los numeros de referencia identicos designan medios, unidades y objetos que son identicos en accion, funcion, estructura o similares en accion, funcion o estructura. Esto permite una representacion mas corta y mas concisa de las realizaciones de la presente invencion, puesto que los pasajes de descripcion pueden ser transferidos de una realizacion a otra, a no ser que se afirme de otra manera explfcitamente.
Ademas, en la presente descripcion, numeros de referencia resumidos seran usados para medios, estructuras y objetos que se presentan mas de una vez dentro de una figura o realizacion. Por ejemplo, las dos trayectorias indirectas 180-1, 180-2 que son mostradas en la Figura 1 tienen por supuesto numeros de referencia diferentes en la Figura 1, pero si las trayectorias indirectas son designadas per se, o si elementos generales de los mismos son descritas, solamente el numero de referencia resumido 180 sera usado en la presente descripcion. Asf, tambien sirve para mejorar el entendimiento y concision de la presente descripcion.
El aparato 200 como se muestra en la Figura 2, incluye una entrada 220 para una senal de altavoz de un altavoz no mostrado en la Figura 2. La entrada 220 es acoplada, en el lado de entrada, a medios de convertidor de tiempo/frecuencia 230, que son ilustrados en lmeas discontinuas en la Figura 2 como un componente opcional del aparato 200. Los medios convertidores de tiempo/frecuencia 230 son acoplados a un primer filtro de estimacion de eco opcional 240 que, como componente opcional, sin embargo, no necesita ser implementado necesariamente en el contexto del aparato 200. Una salida del filtro de estimacion de eco 240 es acoplada a una entrada 250a de medios de extraccion 250, que a su vez son acoplados, con una primera salida 250c y una segunda salida 250d, a un segundo filtro de estimacion de eco opcional 260 via la primera entrada 260a y una segunda entrada 260b. Este filtro de estimacion de eco tambien, puede ser omitido con respecto a su implementacion, en realizaciones de la presente invencion. Por ejemplo, en diferentes realizaciones de la presente invencion del aparato 200, el primer filtro de estimacion de eco 240 puede ser implementado, junto con el segundo filtro de estimacion de eco 260, exactamente de la misma manera como un aparato 200 completamente sin primeros o segundos filtros de estimacion de eco 240, 260. Por supuesto, implementaciones donde solamente uno de los dos filtros de estimacion de eco 240, 260 es implementado son tambien posibles. Una implementacion de componentes adicionales es tambien posible.
Si existe el segundo filtro de estimacion de eco 260, sera acoplado, con una primera salida 260c y una segunda salida 260d, en una primera entrada 270a y una segunda entrada 270b de medios de calculo 270 para calcular los coeficientes de filtro para el filtro adaptable 210. Los medios de calculo 270 son tambien acoplados, via una salida 270d, a una entrada del filtro adaptable 210.
Ademas, el filtro adaptable 210 es acoplado a una entrada del filtro adaptable 210 via una entrada 280 para una senal de microfono via medios convertidores de tiempo/frecuencia opcionales 290. Una salida del filtro adaptable 210 es acoplada a una salida para la senal de microfono eco-cancelada via medios de convertidor de
5
10
15
20
25
30
35
40
45
50
55
60
frecuencia/tiempo opcionales 300. Ademas, la entrada 280 es opcionalmente tambien acoplada, v^a los medios de convertidor de tiempo/frecuencia 290, a una segunda entrada 250b de los medios de extraccion 250 y a una tercera entrada 270c de los medios de calculo 270. Estas dos entradas 250b, 270c de los medios de extraccion 250 y de los medios de calculo 270, sin embargo, son opcionales y pueden ser implementadas independientemente entre sf en varias realizaciones de la presente invencion.
El aparato 200 puede ser implementado, por ejemplo, en la unidad de proceso de remocion de eco 150 mostrada en la Figura 1.
Antes de que el modo de operacion de la realizacion, mostrada en la Figura 2, de un aparato 200 sera explicada en mas detalle, se debe tambien mencionar que realizaciones de la presente invencion pueden basicamente ser implementadas tanto dentro de circuitos discretos como dentro de circuitos integrados u otros circuitos mas complejos. Por ejemplo, realizaciones de la presente invencion pueden tambien ser implementadas en medios de procesamiento de datos, esto es, procesadores, sistemas integrados (SOC = sistema sobre chip), circuitos integrados aplicacion-espedficos (ASIC) u otros circuitos integrados y procesadores de proposito especial. En este contexto, es completamente posible que partes de circuito identicas de los medios de procesamiento de datos respectivos sean empleados en medios diferentes de manera temporalmente consecutiva. Por ejemplo, la misma compuerta logica de la unidad logica aritmetica (ALU) de un procesador puede ser usada, en primer lugar, dentro del contexto de la funcionalidad de los medios de extraccion 250 y, en segundo lugar, dentro del contexto de la funcionalidad de los medios de calculo 270. No obstante, los dos medios difieren no por lo menos con respecto a elementos adicionales, tales como en el caso mencionado anteriormente, con respecto a diferentes comandos de control, que co-definen los medios diferentes, por ejemplo. Una superposicion parcial o completa de implementaciones de diseno de circuitos de diferentes medios es por consiguiente completamente posible.
No es menos por esta razon que en la presente descripcion los medios, componentes y estructuras que son acoplados entre sf entendidos como medios, componentes y estructuras que estan indirecta o directamente interconectados. Si hay una implementacion basada en medios de procesamiento de datos, por ejemplo, se puede llevar a cabo un acoplamiento por medio de un sitio de almacenamiento de una memoria que tiene un resultado intermedio en forma de una senal retenida en el mismo.
Ademas, sin embargo, las realizaciones de la presente invencion basicamente no estan limitadas a implementaciones digitales, aun si principalmente implementaciones digitales seran descritas en el curso adicional de la descripcion. Por ejemplo, una implementacion analoga o una implementacion mezclada que comprende componentes analogicos y digitales es factible, en principio. En tal caso, se puede emplear convertidores A/D o D/A adicionales (convertidores analogico/digital y digital/analogico), por ejemplo, para formar posiblemente las senales de un tipo a otro.
Con respecto al modo de operacion del aparato 200 como se ilustra en la Figura 2, una senal de altavoz se hace disponible en la entrada 220 del aparato 200 es transformada posiblemente a un dominio frecuencia-relacionado por los medios de convertidor de tiempo/frecuencia 230 que estan opcionalmente presentes. Los medios de convertidor de tiempo/frecuencia 230 aseguran, en el caso de una implementacion que opera en bloques (cuadros) de datos, una conversion a una representacion espectral del bloque de datos respectivo, de tal manera que la representacion espectral provista en la salida de los medios de convertidor de tiempo/frecuencia 230 corresponde al bloque de datos en el dominio de tiempo. Dependiendo de la implementacion espedfica, medios de convertidor a base de transformacion de Fourier, medios de convertidor a base de sub-banda o medios de convertidor a base de QMF (QMF = filtro de espejo de cuadratura) pueden ser usados dentro del contexto de los medios de convertidor de tiempo/frecuencia 230. Sin consideracion del modo de operacion preciso de los medios de convertidor de tiempo/frecuencia implementado 230, dichos medios de convertidor 230 convierten la senal (presente en el dominio de tiempo) provista en su entrada a una pluralidad de senales de paso de banda. Cada senal de paso de banda tiene una frecuencia caractenstica asociada con la misma, que puede ser, por ejemplo, una frecuencia central, una frecuencia de corte inferior de la respectiva banda o una frecuencia de corte superior de la banda respectiva, por ejemplo. Dependiendo de la implementacion espedfica, las senales de paso de banda individuales pueden tener mas de una frecuencia caractenstica o un parametro caractenstico adicional asociado con ella.
El primer filtro de estimacion de eco 240 representa una posibilidad de modulacion del medio ambiente acustico 120 (de la Figura 1), de tal manera que una senal esta presente en su salida que comprende idealmente un espectro de magnitud que corresponde a la senal que sena captada por la senal de microfono en cuenta de la senal de altavoz. Como ya se explico anteriormente, sin embargo, el primer filtro de estimacion de eco 240 es un filtro opcional que puede posiblemente no ser implementado.
La senal de altavoz o la senal que es opcionalmente procesada, filtrada y por consiguiente derivada asf por los componentes opcionales 230, 240 es ahora provista a los medios de extraccion 250 en su primera entrada. Los medios de extraccion 250 estan configurados para generar una senal componente estacionaria y una senal
5
10
15
20
25
30
35
40
45
50
55
60
componente no estacionaria de la senal de altavoz o de la senal derivada de la senal de altavoz. Como se vera en la descripcion adicional de realizaciones de la presente invencion, esto puede ser efectuado, por ejemplo, mediante promedio de la senal entrante para determinar la senal componente estacionaria, por ejemplo.
Dependiendo de la implementacion espedfica, la senal puede ser una senal estimada que se desvfa de un componente estacionario “real”. Asf, un componente no estacionario, o una senal componente no estacionaria, puede ser determinada a partir de la senal componente estacionario, posiblemente en tanto que se usa un filtro de ganancia no ilustrado en la Figura 2.
En otras realizaciones de la presente invencion, los medios de extraccion 250 pueden tambien usar una medida de estado estable diferente que aquella descrita, por ejemplo.
Con respecto al componente no estacionario, o la senal componente no estacionaria, dicho componente o senal puede tambien ser determinado, por ejemplo, por una comparacion del cambio temporal en la senal de entrada. Tambien, en el caso de la implementacion de un codec de voz dentro del contexto del aparato 200 o en los alrededores del aparato 200, una medida de prediccion puede posiblemente ser usada, en los medios de extraccion 250, para extraer por lo menos una de las dos senales mencionadas. Tal medida de prediccion puede representar, por ejemplo, la senal de error de un codec de LPC (LPC = codificacion predictiva lineal).
Los medios de extraccion 250 comprenden las dos salidas que ya fueron descritas anteriormente y donde senales diferentes pueden ser provistas, dependiendo de la implementacion. Por ejemplo, por lo menos la senal componente estacionaria o la senal componente no estacionaria es comunmente provista a la primera salida de los medios de extraccion 250. La otra de las dos senales componentes, o una senal que comprende informacion con respecto a la senal emitida en la primera salida, puede posiblemente ser provista en la segunda salida. Esto puede ser, por ejemplo, parametros para el procesamiento adicional de la senal respectiva en los medios de calculo 270 o esta puede solamente ser una senal de control que indica cual de las dos senales componentes es transmitida.
El segundo filtro de estimacion de eco opcional 260 corresponde en general al primer filtro de estimacion de eco 240 con respecto a funcionalidad. El segundo filtro de estimacion de eco 260, tambien, en general, es capaz, a condicion de que sea implementado para efectuar una estimacion de eco de esta manera, de estimar la senal de altavoz provista en la entrada 220, de tal manera para obtener una senal que corresponded a la senal registrada por el microfono, a condicion de que, idealmente, ninguna fuente adicional de ruido este presente. El primer filtro de estimacion de eco 240 tambien como el segundo filtro de estimacion de eco 260 pueden comprender opcionalmente medios de retardo que toman en cuenta un retardo del eco del altavoz que es captado por el microfono. En otras palabras, los filtros 240, 260 pueden tambien ser usados para retardar la senal de altavoz o la senal derivada de la misma, ya sea por una implementacion adicional de medios de retardo o en cuenta de sus estructuras internas. En general, una separacion de las dos funcionalidades de la estimacion de eco, por una parte, y del retardo, por otra parte, es adicionalmente tambien posible, por supuesto, en que, por ejemplo, el primer filtro de estimacion de eco 240 es usado solamente para retardar la senal respectiva, mientras que el segundo filtro de estimacion de eco 260 efectua la estimacion de eco real.
Las senales provistas por el segundo filtro de estimacion de eco 260 son luego provistas a los medios de calculo 270, que a su vez estan configurados para calcular o para determinar los coeficientes de filtro para el filtro adaptable 210, en base a la senal componente estacionaria extrafda o la senal componente no estacionaria extrafda. Dependiendo de la implementacion espedfica, los medios de calculo 270 pueden tambien caer atras, para este proposito, en la senal de microfono provista en la entrada 280 o sobre las senales de microfono transferidas al dominio frecuencia-relacionado. Esta senal esta posiblemente tambien disponible a los medios de extraccion 250, como se describira en mas detalle posteriormente en la presente.
El filtro adaptable 210, que obtiene los coeficientes de filtro de los medios de calculo 270, efectua luego la modificacion espectral real de la senal de microfono para proveer, en su salida, por lo menos una version parcialmente eco-cancelada de la senal de microfono para procesamiento adicional. Dependiendo de la implementacion espedfica, la senal de microfono que ha sido eco-cancelada o modificada espectralmente de esta manera puede ser convertida de regreso al dominio de tiempo via los medios de convertidor de frecuencia/tiempo 300 o pueden ser emitidos directamente en la salida 310. Por ejemplo, una transformacion inversa al dominio de tiempo por los medios de convertidor 300 puede no ser util cuando, por ejemplo, la senal de microfono correspondiente es codificada en el dominio de frecuencia o un dominio frecuencia-relacionado de cualquier manera.
Antes de que componentes individuales del diagrama de bloques, mostrado en la Figura 2, del aparato 200 sean descritos en mas detalle en relacion con las Figuras 3a a 5e, se debe notar en este punto que el procesamiento de la senal de altavoz o la senal derivada de la senal de altavoz puede en general ser efectuada en el dominio frecuencia- relacionado de tal manera que una senal de paso de banda asociada individual, una pluralidad de senales de paso de banda, una multitud de senales de paso de banda o todas las senales de paso de banda son procesadas de
5
10
15
20
25
30
35
40
45
50
55
60
acuerdo.
Tambien se debe notar que los medios individuals y filtros pueden operar en tanto que se usan valores energfa- relacionados, dependiendo de las implementaciones espedficas. Un valor energfa-relacionado es un valor que es formado como una potencia de un valor de base real con un exponente de numero par o es formado como una potencia de una magnitud de un valor (valor absoluto) con cualquier potencia. Si, por ejemplo, espectros de tiempo corto son procesados en los filtros individuales o en los medios individuales, dichos espectros pueden operar sobre valores de energfa-relacionados, por ejemplo, sobre valores de energfa que son formados como cuadrados de magnitud de los coeficientes espectrales asociados. Asimismo, espectros de magnitud, esto es, valores absolutos de los coeficientes espectrales respectivos, pueden ser usados con el exponente 1. En otras palabras, los valores que son proporcionales a |z|m, m siendo un numero positivo, por ejemplo, un numero natural, pueden ser usados, como valores de energfa-relacionados, empezando desde cualquier valor z, que es un valor real o un valor complejo. En el caso de un valor real z, los valores que son proporcionales a z2m pueden adicionalmente ser usados como valores energfa-relacionados.
La Figura 3a muestra un diagrama de bloques de los medios de extraccion 250 de acuerdo con una realizacion de la presente invencion, como se puede implementar en el contexto del aparato 200. Los medios de extraccion 250 comprenden solamente una primera entrada 250a, que es acoplada a la salida del primer filtro de estimacion de eco opcional 240 en la Figura 2. Los medios de extraccion 250, como se muestra en la Figura 3a, no comprenden ninguna segunda entrada, sin embargo (entrada 250b en la Figura 2).
La primera entrada 250a de los medios de extraccion 250 es acoplada a medios de promedio 320 configurados para determinar un valor medio de la senal provista en la entrada 250a. El termino senal, en la presente comprende no solamente senales en el dominio de tiempo (senales de tiempo), sino tambien senales en el dominio de frecuencia o un dominio frecuencia-relacionado, donde las senales respectivas son representaciones espectrales de senales en el dominio de tiempo. Asimismo, las senales pueden tambien comprender y transmitir informacion derivada de las senales mencionadas previamente, tales como magnitudes de valores en el dominio de frecuencia (amplitud espectral), valores de energfa (cuadrados de magnitud), espectros y otros valores y cantidades derivados.
En una salida de los medios de promedio 320, dicha senal que es provista en la entrada 250a es emitida, en los medios de extraccion 250 mostrados en la Figura 3a, como una senal componente estacionaria en una primera salida 250c de los medios de extraccion 250. Como tambien se muestra en la Figura 2, la primera salida 250c es acoplada al segundo filtro de estimacion de eco opcional 260 y/o a los medios de calculo 270.
La senal provista en la primera entrada 250a esta provista ademas, junto con la senal componente estacionaria provista en la salida, de los medios de promedio 320, a un filtro de ganancia 330 que emite la senal componente no estacionaria en una salida, y la envfa a la segunda salida 250d de los medios de extraccion 250. El filtro de ganancia 330 esta configurado para determinar la senal componente no estacionaria en base a la senal de altavoz entrante en la primera entrada 250a, o de la senal derivada de la misma, como de la senal componente estacionaria. Con respecto a la funcionalidad adicional tanto de los medios de promedio 320 como el filtro de ganancia 330, se debe hacer referencia a las explicaciones anteriores dadas con respecto a la Figura 2, y a las explicaciones adicionales dadas en el curso adicional de la presente descripcion.
La Figura 3b muestra medios de extraccion adicionales 250 como pueden ser empleados en una realizacion de la presente invencion en un aparato 200. Los medios de extraccion 250 mostrados en la Figura 3b difieren de aquel mostrado en la Figura 3a esencialmente en que el mostrado en la Figura 3b comprende ademas medios de calculo de parametros 340 que tambien estan acoplados al lado de salida, a la primera entrada 250a. Con una salida, los medios de calculo de parametros 340 son acoplados al filtro de ganancia 330, que tiene un parametro de control provisto al mismo por los medios de calculo de parametros 340 para calcular la senal componente no estacionaria. Para detalles mas espedficos con respecto al modo de operacion, se debe hacer referencia a la descripcion que sigue.
Como un componente opcional, los medios de extraccion 250 mostrados en la Figura 3b comprenden ademas la segunda entrada 250b ya ilustrada en relacion con la Figura 2, que es posiblemente acoplada de manera indirecta, por una parte, a una entrada adicional de los medios de calculo de parametros 340, y, por otra parte, como tambien se muestra en la Figura 2, a la entrada 280 para la senal de microfono. En el caso presente, el acoplamiento indirecto puede posiblemente ser efectuado en tanto que se utilizan los medios de convertidor de tiempo/frecuencia 290. Tambien con respecto al modo de operacion de los medios de calculo de parametros 340, se debe hacer referencia a la descripcion que sigue.
La Figura 3c muestra una implementacion potencial adicional de medios de extraccion 250 como pueden ser empleados en el aparato 200 de la Figura 2. Los medios de extraccion 250 mostrados en la Figura 3c en la presente estan basados en aquellos mostrados en la Figura 3b, los medios de calculo de parametros 340 son tambien
5
10
15
20
25
30
35
40
45
50
55
60
mostrados, junto con sus conexiones, como un componente opcional. A diferencia de los medios de extraccion 250 mostrados en la Figura 3b, los medios de extraccion 250 mostrados en la Figura 3c comprenden medios de distribucion 350 que son acoplados, con una entrada en cada caso, a las salidas de los medios de promedio y del filtro de ganancia 330, respectivamente. Los medios de distribucion 350 tienen tanto la senal componente estacionaria de los medios de promedio 320 y la senal componente no estacionaria del filtro de ganancia 330 provistos al mismo.
En el lado de salida, los medios de distribucion 350 son acoplados tanto a la primera salida 250c como la segunda salida 250d de los medios de extraccion 250. Los medios de distribucion 350 son implementados para decidir, en base a las dos senales componentes hechas disponibles al mismo, cual de las dos sera provista al componente subsecuente via la primera salida 250c. Dependiendo de cual de las dos senales componentes es concerniente, los medios de distribucion 350 emiten ademas una senal de control via la segunda salida 250d de los medios de extraccion 250, dicha senal de control comprende, por ejemplo, informacion en cuanto a cual de las dos senales componentes esta presente en la primera salida 250c, o los medios de distribucion 350 emiten una senal de control correspondiente que comprende parametros para el procesamiento adicional de la senal componente emitida. Con respecto a los diferentes parametros que pueden ser transmitidos, por ejemplo, dentro del contexto de la senal de control, se puede tener referencia a la descripcion que sigue.
Dependiendo de la implementacion espedfica, los medios de distribucion 350 pueden ser implementados de tal manera que transfieren aquella senal componente a la primera salida 250c que comprende un volumen mas alto, una energfa mas alta o un valor de energfa mas alto en comparacion con la otra senal componente. Diferentes senales componentes pueden ser emitidas para diferentes senales de banda, por ejemplo.
Los medios de extraccion 250 mostrados en la Figura 3c difieren asf de aquellos mostrados en las Figuras 3a y 3b no menos en que solo una de las dos senales componentes es emitida en la primera salida 250c de los medios de extraccion 250. Como ya se explico en relacion con la Figura 2, solamente una senal de control que comprende informacion con respecto a la senal componente emitida en la primera salida 250c es emitida por los medios de extraccion 250 mostrados en la Figura 3c.
La Figura 4a muestra una primera realizacion del segundo filtro de estimacion de eco 260, como es tambien mostrado como un componente opcional en la Figura 2. El segundo filtro de estimacion de eco opcional 260 comprende dos etapas de filtro 360-1, 360-2, que son cada una acopladas, con una entrada, a una entrada 260a, 260b, respectivamente, del segundo filtro de estimacion de eco 260. Las dos etapas de filtro 360-1, 360-2 son acopladas adicionalmente, con una salida, a una salida 260c, 260d, respectivamente, del segundo filtro de estimacion de eco 260.
El segundo filtro de estimacion de eco opcional 260 mostrado en la Figura 4a en este contexto, es uno que puede ser empleado en relacion con los medios de extraccion 250 mostrados en las Figuras 3a y 3b. Mas espedficamente, el segundo filtro de estimacion de eco 260 mostrado en la Figura 4a permite el procesamiento en paralelo tanto de la senal componente estacionaria por la etapa de filtro 360-1 como de la senal componente no estacionaria por la etapa de filtro 360-2. Las dos etapas de filtro 360-1, 360-2 pueden en general estar configuradas para ser identicas o diferentes, dependiendo de si diferentes filtros de estimacion de eco van a ser empleados para modular el medio ambiente acustico 120 (como se muestra en la Figura 1) para las senales componentes estacionaria y no estacionaria. Naturalmente, las dos etapas de filtro 360-1, 360-2 pueden tambien ser realizadas, en terminos de disenos de circuitos, por los mismos elementos de circuito, por ejemplo, cuando la retencion o almacenamiento de memoria temporal o intermedia de una senal es tambien implementada.
Como ya se explico en relacion con la discusion de la posibilidad de la implementacion de dos veces del filtro de estimacion de eco 240, 260 en relacion con la Figura 2, las etapas de filtro 360 pueden tambien ser etapas de filtro que solamente realizan un retardo, por ejemplo. Por supuesto, tambien se puede hacer uso, dentro del contexto del segundo filtro de estimacion de eco 260, de otras etapas de filtro que las etapas de filtro de estimacion de eco descritas. La etapa de filtro 360, por ejemplo, comprende una entrada de control opcional para recibir senales de control para implementar el efecto de filtracion, de tal manera que puede ser ajustado o influenciado.
La Figura 4b muestra una forma adicional de implementacion del segundo filtro de estimacion de eco opcional 260, que difiere de aquel mostrado en la Figura 4a solamente en que solo se implementa una etapa de filtro 360, que es conectada entre la primera entrada 260a y la primera salida 260c. En la realizacion mostrada en la Figura 4, la senal entrante en la segunda entrada 260b es transferida a la segunda salida 260d.
El segundo filtro de estimacion de eco 260 mostrado en la Figura 4b puede ser empleado asf, por ejemplo, dentro del contexto de medios de extraccion 250 como se representa en la Figura 3c. En este caso, la senal de control, que comprende la informacion en la senal componente entrante en la primera entrada 260a, no es modificada por el filtro de estimacion de eco 260.
5
10
15
20
25
30
35
40
45
50
55
60
Por supuesto, el filtro de estimacion de eco mostrado en la Figura 4b puede tambien ser implementado, en una realizacion, con los medios de extraccion 250 mostrados en las Figuras 3a y 3b, por ejemplo, cuando solamente una de las dos senales componentes va a ser modificada por la etapa de filtro 360. Aqm, por supuesto, tambien se puede hacer uso de una version reflejada del filtro de estimacion de eco 260, que filtra la senal entrante en la segunda entrada 260b.
La Figura 5a muestra una implementacion de medios de calculo 270 de acuerdo con una realizacion de la presente invencion, como puede ser empleada en relacion con el aparato 200 de la Figura 2. Otra vez, los medios de calculo 270 en la presente comprenden la primera entrada 270a y la segunda entrada 270b. Los medios de calculo 270 comprenden ademas primeros y segundos medios de calculo de filtro 370-1, 370-2, que son acoplados, en el lado de entrada, a un de las dos entradas 270a, 270b, respectivamente, de los medios de calculo 270. Mas espedficamente, los medios de calculo de filtro 370-1 son acoplados, en el lado de entrada, a la primera entrada 270a para recibir, por ejemplo, la senal componente estacionaria. Asf, los segundos medios de calculo de filtro 370-2 son acoplados a la segunda entrada 270b para recibir la senal componente no estacionaria de los medios de extraccion 250, tal como es implementada, por ejemplo, de acuerdo con las Figuras 3a o 3b. En caso de que el segundo filtro de estimacion de eco 260 este conectado entre los medios de extraccion 250 y los medios de calculo 270, una senal derivada de las senales componentes respectivas es alimentada a ambos medios de calculo de filtro 370.
Con una salida, los dos medios de calculo de filtro 370 son acoplados a medios de combinacion 380, que por su parte son acoplados, en el lado de salida, a la salida 270d. Como componente opcional, los medios de calculo 270 mostrados en la Figura 5a comprenden ademas la tercera entrada 270c, que es acoplada, dentro de los medios de calculo 270, tanto a medios de calculo de filtro 370 y como tambien se muestra en la Figura 2, son acoplados directa o indirectamente a la entrada 280 para la senal de microfono.
Con respecto al modo de operacion de los medios de calculo 270, ambos medios de calculo de filtro 370 estan configurados para calcular, en base a las senales componentes que se hacen disponibles a los mismos y opcionalmente, en tanto que se toma en cuenta la senal de microfono de la entrada 280, coeficientes de filtro correspondientes que subsecuentemente se hacen disponibles a los medios de combinacion 380. Si los dos medios de calculo de filtro 370 tienen senales derivadas de las senales componentes respectivas hechas disponibles a ellos que son posiblemente modificadas por el segundo filtro de estimacion de eco 260, los medios de calculo de filtro 370 efectuan los calculos respectivos en base a estas senales. Sin consideracion de esto, sin embargo, los medios de calculo de filtro 370 son asf configurados para calcular primeros y segundos coeficientes de filtro, respectivamente, en base a las senales componentes provistas por los medios de extraccion 250.
Los primeros y segundos coeficientes de filtro calculados de esta manera son luego combinados a un conjunto de coeficientes de filtro por los medios de combinacion 380, y son luego provistos como datos de entrada al filtro adaptable 210 via la salida 270d de los medios de calculo 270. La combinacion se puede llevar a cabo mediante una pluralidad de diferentes operaciones. Dependiendo de la tecnologfa de filtro realmente implementada, que no menos depende tambien de los medios de convertidor de tiempo/frecuencia 230, 290 usados y de los medios de convertidor de frecuencia/tiempo asociados 300, una multitud de diferentes posibilidades de combinacion de los primeros coeficientes de filtro y los segundos coeficientes de filtro son posibles con el fin de obtener los coeficientes de filtro para el filtro adaptable 210. Ejemplos correspondientes seran explicados en mas detalle en el curso adicional de la descripcion.
La Figura 5b muestra unos segundos medios de calculo 270, que son muy similares a aquel de la Figura 5a. Difieren de los medios de calculo 270 mostrados en la Figura 5a solamente en que los medios de seleccion 390 son ahora implementados en lugar de los medios de combinacion 380 de la Figura 5a, los medios de seleccion 390 son implementados para emitir, en base a los primeros coeficientes de filtro y los segundos coeficientes de filtro, un conjunto de coeficientes de filtro en la salida 270d, que esta ya sea basado en los primeros coeficientes de filtro de los primeros medios de calculo de filtro 370-1 o en los segundos coeficientes de filtro de los segundos medios de calculo de filtro 370-2. En otras palabras, los medios de seleccion 390 son implementados para determinar los coeficientes de filtro para el filtro adaptable 210 ya sea en base a la senal componente estacionaria o en base a la senal componente no estacionaria.
Aqm, los medios de seleccion 390 pueden efectuar bastante posiblemente relaciones matematicas mas complejas en base al conjunto respectivo de coeficientes de filtro de los medios de calculo 370. Sin embargo, difiere de los medios de combinacion 380 de los medios de calculo 270 de Figura 5a en que solamente tome en cuenta un conjunto de los dos conjuntos de coeficientes de filtro emitidos por los medios de calculo de filtro 370.
La Figura 5c muestra medios de calculo adicionales 270, que difieren de los medios de calculo 270 mostrados en la Figura 5a en que los medios de calculo 270 de Figura 5a solamente comprenden medios de calculo de filtro 370,
5
10
15
20
25
30
35
40
45
50
55
60
que son acoplados a la primera entrada 270a de los medios de calculo 270. Adicionalmente, en los medios de calculo 270 mostrados en la Figura 5c, los medios de calculo de filtro 370 son acoplados a la segunda entrada 270b y son implementados para obtener, via los mismos, parametros para determinar los coeficientes de filtro. Tambien, como un componente opcional, los medios de calculo de filtro 370 de Figura 5c pueden tambien ser acoplados a la tercera entrada 270c para efectuar el calculo de coeficientes de filtros posiblemente en base a la senal de microfono.
Los medios de calculo 270 mostrados en la Figura 5c corresponden asf a tales medios de calculo que se pueden poner en operacion en relacion con los medios de extraccion 250 mostrados en la Figura 3c, y posiblemente con el segundo filtro de estimacion de eco 260 mostrado en la Figura 4b. Via la segunda salida 250d de los medios de extraccion 250, parametros correspondientes para calculo dentro del contexto de los medios de calculo de filtro 370 son transmitidos directamente a los medios de calculo de filtro respectivos 370 via la segunda entrada 270b de los medios de calculo 270. Para este proposito, la segunda entrada 270b es acoplada a una entrada de parametros de los medios de calculo de filtros 370, via tal entrada de parametros los medios de calculo de filtro 370 pueden recibir parametros adicionales para calcular los coeficientes de filtro.
Debido al hecho de que con estos medios de calculo 270, solamente medios de calculo de filtros individuales 370 son implementados, un medio de combinacion y un medio de seleccion pueden ser omitidos.
La Figura 5d muestra medios de calculo adicionales 270, que son muy similares a aquel de la Figura 5c con respecto a estructura y modo de operacion. A diferencia de los medios de calculo 270 mostrados en la Figura 5c, aquellos ilustrados en la Figura 5d comprenden ademas medios de determinacion de parametros 400 acoplados entre la segunda entrada 270b y la entrada de parametros correspondientes de los medios de calculo de filtro 370.
A diferencia de los medios de calculo 270 mostrados en la Figura 5c, los medios de calculo 270 mostrados en la Figura 5d se pueden poner en operacion en el contexto de aparatos 200, donde los medios de extraccion 250 proveen, via la segunda salida 250d, una senal de control que solamente comprende informacion en cuanto a cual de las dos senales componentes es emitida por los mismos via la primera salida correspondiente 250c. Si las especificaciones usadas en el contexto de los medios de calculo de filtro 370, para calcular los coeficientes de filtro para las dos senales componentes, o si las senales estan basadas en las mismas, difieren solamente con respecto a parametros, el (los) parametro(s) respectivo(s) puede(n) ser calculado(s), dependiendo de la senal componente transmitida, por los medios de determinacion de parametros 400 en tanto que hacen uso de los medios de calculo 270 como se ilustra en la Figura 5d. Por consiguiente, los medios de determinacion de parametros 400 pueden ser implementados, por ejemplo, como una memoria o como un circuito de calculo. Si son implementados como una memoria, memorias de solo lectura (ROM), memorias no volatiles (NVM) o memorias de acceso aleatorio (REM) son posibles.
La Figura 5e muestra medios de calculo adicionales 270 que comprenden dos medios de calculo de filtro 370-1, 3702, dependiendo de la senal componente en base a la cual los coeficientes de filtro para el filtro adaptable 210 van a ser calculados. Aqrn, ambos medios de calculo de filtro 370 son acoplados, en el lado de entrada, a la primera entrada 270a. Ademas del acoplamiento opcional en la tercera entrada opcional 270c, ambos medios de calculo de filtro 370 son cada uno acoplados a una entrada de un punto de distribucion 410, respectivamente, tal punto de distribucion es acoplado, con una salida, a la salida de los medios de calculo 270. El punto de distribucion 410 comprende adicionalmente una entrada de control, que es acoplada a la segunda entrada 270b de los medios de calculo 270.
Los medios de calculo 270 de la Figura 5e permiten asf el calculo del primer conjunto de coeficientes de filtro en base los medios de calculo de filtro 370-1, y calculo de un segundo conjunto de coeficientes de filtro en base a los segundos medios de calculo de filtro 370-2 en base a las senales entrantes en la primera entrada 270a. La seleccion en cuanto a cuales coeficientes de filtro de los dos coeficientes de filtro calculados por los medios de calculo de filtro 370 son finalmente enviados a la salida 270d se hace dependiendo de la senal que es enviada a la entrada de control del punto de distribucion 410 via la segunda entrada 270b. Dependiendo de la senal de control en su entrada de control, el punto de distribucion 410 acopla una de las entradas a la salida 270d.
Los medios de calculo 270 de la Figura 5e se pueden asf poner en operacion, por ejemplo, en relacion con los medios de extraccion 250 como se muestra en la Figura 3c, donde una senal de control es transmitida, via la segunda salida 250d, que incluye informacion en cuanto a la senal componente transmitida via la primera salida 250c. Los medios de calculo 270 mostrados en la Figura 5c pueden asf ser implementados, por ejemplo, cuando las especificaciones de calculo para las dos senales componentes que son usadas en el contexto de los medios de calculo de filtro 370 difieren a tal extension que no pueden ser convertidas eficientemente por un simple cambio en los parametros.
Por supuesto, se debe notar aqrn que los varios medios de extraccion 250 como se describen en las Figuras 3a a 3c, los varios filtros de estimacion de eco 260 como se describe en las Figuras 4a y 4b, y los varios medios de
5
10
15
20
25
30
35
40
45
50
55
60
calculo 270 son como se describe en las Figuras 5a a 5e pueden ser combinados mutuamente con respecto a aspectos individuales. Por ejemplo, un medio que ademas de efectuar una seleccion de los medios de calculo de filtro 370 a ser acoplados a la salida 270d efectuan una manipulacion adicional, por ejemplo, un calculo, en base a los coeficientes de filtro, puede ser usado, por ejemplo, en los medios de calculo mostrados en la Figura 5e en lugar del punto de distribucion 410.
Realizaciones de la presente invencion como ya fueron descritos en las Figuras 2 a 5 representan una tecnica novedosa que permite la supresion separada de componentes de eco estacionarios y no estacionarios. Esto se obtiene al estimar el eco separadamente de los componentes fluctuantes y estacionarios de la senal de altavoz. Luego, dos filtros de remocion de eco correspondientes son calculados para ambos tipos de senales en realizaciones de la presente invencion. Los filtros de remocion de eco pueden ser optimizados individualmente con el fin de obtener el mejor desempeno de supresion de eco posible en tanto que se minimizan artefactos y perturbaciones en la senal de extremo cercano.
La descripcion adicional es organizada como sigue. Inicialmente, se propone un modelo para la senal de altavoz. Subsecuentemente, de acuerdo con este modelo, los componentes estacionario y no estacionario son separados, lo que se puede llevar a cabo en base a una estimacion de los componentes estacionarios. Luego, los espectros de potencia de los componentes de eco estacionarios y no estacionarios son estimados en base a los filtros de estimacion de eco. Correspondientemente, en algunas realizaciones de la presente invencion, dos filtros de remocion de eco son calculados. Subsecuentemente, la separacion de los componentes estacionario y no estacionario puede ser adaptada en base a un analisis de un desempeno a posteriori de los filtros de remocion de eco.
Con respecto al modelado de senal se afirmara que una estimacion del espectro de contribucion de eco o del espectro de potencia de eco utilizando un filtro de estimacion de eco es comunmente no muy exacta bajo condiciones practicas, puesto que solamente una fraccion de la longitud de trayectoria de eco verdadera puede ser considerada. Para impedir que estas inexactitudes den como resultado ecos residuales, los filtros de remocion de eco son calculados de tal manera que suprimen agresivamente los ecos, de tal manera que no permanecen ecos residuales. Esto es obtenido al sobreestimar el espectro de potencia de eco y al efectuar el suavizado en el tiempo, que favorece los valores de filtro de ganancia pequena.
Cuando la senal de altavoz contiene ruido estacionario, el supresor de eco intentara suprimir el eco de dicho ruido estacionario. Debido a los filtros de expresion de eco agresivos mencionados anteriormente, esto muy frecuentemente conduce no solamente a la supresion del eco de ruido estacionario, sino tambien al deterioro del ruido del extremo cercano estacionario y del habla del extremo cercano.
El procedimiento propuesto en la presente mitiga este problema al usar dos trayectorias de supresion de eco diferentes para senales estacionarias y no estacionarias, respectivamente, como tambien se ilustra en la Figura 6.
La Figura 6 muestra un diagrama de bloques de un aparato 200 de acuerdo con una realizacion de la presente invencion, que comprende un altavoz 100 y un microfono 110. El altavoz 100 tiene una senal de altavoz x[n] hecha disponible al mismo, que es provista a medios de extraccion 250. Los medios de extraccion 250 son tambien denominados como discriminador de estado estable (discriminacion estacionaria). Como ya se explico en relacion con la Figura 2, los medios de extraccion 250 comprenden dos salidas, que son acopladas a los medios de calculo 270. Ademas, los medios de calculo 270 tambien tienen la senal y[n] del microfono 110 hecha disponible a los mismos.
Como tambien se mostro en la Figura 5a, los medios de calculo 270 comprenden primeros medios de calculo de filtro 370-1 para la senal componente estacionaria, y unos medios de calculo de filtro 370-2 para la senal componente no estacionaria, que son emitidas por los medios de extraccion 250. Ademas, ambos medios de calculo de filtro 370 son provistos con la senal de microfono, respectivamente.
En base a las senales hechas disponibles a ellos en cada caso, ambos medios de calculo de filtro 370 calculan coeficientes de filtro Hw y Hs, que son provistos a medios de combinacion 380. Para este fin, ambos medios de calculo de filtro 370 son acoplados a los medios de combinacion 380 con una salida, respectivamente. Los medios de combinacion 380, por su parte, emiten, a un filtro adaptable 210, los coeficientes de filtro que han sido calculados o determinados en base a los dos conjuntos de coeficientes de filtro Hw y Hs.
Con el fin de obtener inevitablemente una senal eco-suprimida e[n] de la senal de microfono y[n], el filtro adaptable 210 es acoplado adicionalmente al microfono para recibir la senal de microfono en una entrada. La senal eco- suprimida e[n] esta presente en una salida del filtro adaptable 210.
El filtro adaptable 210 lleva a cabo asf la supresion de eco real, donde los dos medios de calculo de filtro 370 cada
5
10
15
20
25
30
35
40
45
uno calculan filtros de remocion de eco en forma de coeficientes de filtro correspondientes, que son luego combinados al filtro de remocion de eco efectivo por los medios de combinacion 380.
Con respecto a la representacion en la Figura 6 se notara que en el diagrama de bloques ilustrado en la Figura 6 es un diagrama de bloques simplificado donde, por ejemplo, medios de convertidor de tiempo/frecuencia que son posiblemente implementados, tambien como filtros de estimacion de eco no son mostrados con el fin de simplificar la representacion.
Los ecos no estacionarios (habla) deben ser suprimidos agresivamente con el fin de evitar ecos residuales que en este caso podnan ser percibidos como molestos. Los ecos estacionarios, sin embargo, que se podnan derivar del ruido estacionario en la senal del altavoz, son comunmente suprimidos de una manera menos agresiva para impedir artefactos tales como alteraciones tonales.
Con el fin de generar un modelo apropiado, la senal x[n], que es emitida por el altavoz, puede ser dividida de acuerdo con
x[n] = xs[n] + xw[n] (1)
donde Xs[n] modela las contribuciones del habla estacionaria, y Xw[n] modela las contribuciones del ruido estacionario. El mdice de tiempo discreto es denotado por la variable n.
Con respecto a la separacion de los componentes estacionarios y no estacionarios, un analisis de Fourier de corto tiempo (STFT) es inicialmente efectuado en ambos lados del modelo indicado en la ecuacion (1), lo que produce
X[k,m] = XJk,m] + Xw[k,m], (2)
donde m denota una frecuencia y k es un mdice de bloque de datos temporal. Ambos m y k son numeros enteros. En la ecuacion (2) los componentes no estacionario y estacionario del espectro de potencia de altavoz IX[K' m]
|x„ [k, mil2 |x [k, ml2
son denotados por 1 s y1 1 . Es razonable suponer que Xs[n] y Xw[n] no estan correlacionados y
tienen un valor medio que se aproxima a cero.
„ ■ , |x[k, mi2 , ,
Se sigue luego que es dado por
|x[k m]|2 « |Xs [k, mf + |Xw[k, m]|2
(3)
|Xs [k, mi2
Por esta razon, el espectro de potencia instantaneo de la senal componente no estacionaria 1 s 1 de la
senal de altavoz Xs[n] puede ser recuperado al restar un valor estimativo del espectro de potencia de la senal
componente estacionaria lX“ ^ m] del espectro de potencia de la senal de altavoz m] de acuerdo con:
XXs [k, m] = \X[k, m] - Xw [k, m]
(4)
X [k, m]| |x[k, m]|2
En la practica, 1 s 1 es estimado al filtrar el espectro de potencia de la senal de altavoz 1 L J| de
acuerdo con:
2
Xs [k,m]
2
F [k, mf Xw [k, m\
2
(5)
El filtro Fx[k,m], que es tambien denominado como filtro de ganancia, puede ser escrito en su forma generica, de acuerdo con la Referencia [7], como sigue:
5
10
15
20
25
30
35
40
Fx [k m] =
X[k, m|Yx - px|xw [k, m]| X[k, m|Yx
Yx
donde Yx es un exponente y px es un parametro de control o parametro para controlar la intensidad de la supresion de componentes de senal estacionaria para el caso de que el mismo este sub- o sobre-estimado. La separacion de los componentes estacionario y no estacionario sera ilustrada con referencia a la Figura 8 para una frecuencia de 1 kHz.
La funcionalidad descrita por las ecuaciones (5) y (6) es efectuada, en las realizaciones descritas en las Figuras 2 a 6, por el filtro de ganancia 330 de los medios de extraccion 250.
La estimacion de ruido estacionario puede ser efectuada al actualizar el espectro de potencia de corto tiempo de
|Xw [k, m]|2
ruido estimado 1 w en el tiempo. En cada bloque de datos (cuadro) k, el espectro de potencia de ruido es
actualizado en que se efectua el promedio de un solo polo con las dos constantes de tiempo para decidir si el habla o ruido esta presente. Una constante de tiempo de ataque pequena refleja que el bloque de datos actual comprende ruido. Una constante de tiempo de liberacion larga refleja que el bloque de datos actual comprende habla.
En la practica, esto es implementado de acuerdo con
imagen1
Y
donde |Ji es la constante de tiempo de ataque, y |J2 es la constante de tiempo de liberacion. Mas espedficamente, los parametros j y j que vienen en la ecuacion (7) son parametros adimensionales para los cuales j < j2 se aplica. Tomando en cuenta la frecuencia de toma de muestras, sin embargo, estos parametros pueden ser interpretados y referidos a las constantes de tiempo indicadas anteriormente, por ejemplo. En la relacion de proporcionalidad (16) a continuacion tambien mostrada, las constantes de tiempo reales y los parametros son cada uno inversamente proporcionales entre sf. La constante de tiempo de ataque j puede comprender un valor de 10000 ms = 10 s, por ejemplo, mientras que la constante de tiempo de liberacion puede corresponder a un valor de 10 ms tomando en cuenta la velocidad de toma de muestras.
En las realizaciones de la presente invencion que son descritas en las Figuras 2 a 6, la funcionalidad de la ecuacion (7) es implementada por los medios de promedio 320 de los medios de extraccion 250.
Con respecto a una estimacion de potencia de eco, se puede obtener un valor estimativo del espectro de eco de la senal de eco al aplicar un filtro de estimacion de eco G[k,m] a una version temporalmente retardada del espectro de potencia de altavoz de acuerdo con:
|x[k, mf = G[k, m]2|x[k - d, m]|2 11 , (8)
x[k, m]l
donde un valor estimativo del espectro de potencia del eco dentro
usa la ecuacion (3), se sigue que el eco resultante del componente de senal de
de la senal de microfono. Cuando se altavoz no estacionario es dado por:
|ys [k, m]|2 = G[k, m]2|xs [k - d, m]|2
y el eco dado por el componente de senal de altavoz estacionaria es:
10
15
20
25
30
35
40
It [k mf = g[k m]2|xw [k - d, mf
(10)
Dependiendo de la implementacion espedfica de una realizacion de la presente invencion como se ilustra, por ejemplo, en relacion con las Figuras 2 a 5, la funcionalidad descrita por la ecuacion (8) puede ser implementada por el primer filtro de estimacion de eco 240, por ejemplo. Asf, las funcionalidades descritas por las ecuaciones (9) y (10) pueden ser implementadas por el segundo filtro de estimacion de eco 260 por las dos etapas de filtro 360-1, 360-2.
Como ya se menciono anteriormente, la funcionalidad de retardo con respecto a las senales que tienen el valor de retardo d y se presentan en las ecuaciones (8) a (10) puede tambien ser implementada por dicho filtro de estimacion de eco 240, 260. Alternativamente, dicha funcionalidad de retardo puede naturalmente ser realizada por los medios de convertidor de tiempo/frecuencia 230, si no se implementan medios de retardo independientes.
Con respecto a los filtros de remocion de eco, los filtros de remocion de eco asociados Hs[k,m] y Hw[k,m] son calculados y aplicados a la senal de microfono con el fin de suprimir la senal de eco iniciando de los valores
estimativos de eco estacionarios y estacionarios
It [k, m] w |yw [k, m]
y
En el caso de una realizacion que
comprende medios de calculo 270 como se muestra, por ejemplo, en la Figura 5a, esto es efectuado de acuerdo con:
2
E[k, m] = Hs [k, m]Hw [k, m]y[k, m]
(11)
En este caso, una multiplicacion de los coeficientes de filtro respectivos de los filtros de remocion de eco
Hs [k m]
y w[ , ] es efectuada en los medios de combinacion 380, que corresponde a una conexion en serie de filtros de
remocion de eco respectivos. La multiplicacion de los coeficientes de filtro respectivos en el dominio a base de frecuencia corresponde a una convolucion de la respuesta de impulso respectiva en el dominio de tiempo.
Al realizar los filtros de remocion de eco de manera factorizada como es tambien ilustrado en la ecuacion (11), es posible introducir diferentes factores de ganancia como parametros para los diferentes componentes de eco. Los componentes de filtro del filtro de remocion de eco no estacionario pueden ser calculados, por ejemplo, de acuerdo con
imagen2
(12)
y aquellos del filtro de remocion de eco estacionario pueden ser calculados de acuerdo con:
imagen3
(13)
Los parametros de diseno ps, Ys, Pw y Yw pueden ser usados para controlar el desempeno propuesto para cada uno de los filtros de remocion de eco. Dependiendo de la implementacion espedfica de realizaciones de la presente invencion, dichos parametros de diseno pueden se[ seleccionados para ser fijos, disenados para ser adaptables, programables o modiricables de cualquier manera. Una eleccion tfpica de los parametros exponenciales es Ys = Yw = 2, por ejemplo.
Los llamados factores de sobre-estimacion ps y pw son usados para controlar la agresividad de la atenuacion de eco. Por ejemplo, la agresividad del filtro de remocion de eco correspondiente puede ser incrementada al incrementar el factor de sobreestimacion. Por consiguiente, una eleccion tfpica del filtro de remocion de eco estacionario Hw[k,m] con respecto al parametro pw = 2, con el fin de aplicar solamente atenuacion de eco moderada.
5
10
15
20
25
30
35
40
45
50
55
60
Por otra parte, el filtro de remocion de eco responsable por la supresion de los componentes de eco no estacionarios va a ser disenado de una manera altamente agresiva con el fin de atenuar efectivamente componentes de habla perturbantes en la senal de eco. El factor de sobreestimacion ps es por consiguiente disenado frecuentemente para ser mayor que pw, de tal manera que comunmente, ps > pw. A condicion de que pw = 2 sea seleccionado, ps puede comprender valores en el intervalo de 20 > ps > 2 = pw, por ejemplo (por ejemplo, ps = 4). En general, pw y ps pertenecen al mismo orden de magnitud.
Los valores lfmite Ls y Lw determinan la atenuacion de eco maxima permitida en decibeles (dB). Un valor tipo del filtro de remocion de eco estacionario es Lw = -10 dB o -15 dB, lo que limita expedientemente la atenuacion para ecos estacionarios para reducir artefactos accidentales. En el caso de habla no estacionaria en el extremo lejano, la atenuacion debe asegurar atenuacion completa de los componentes de eco correspondientes, lo que corresponde a un valor lfmite para Ls de aproximadamente -60 dB para senales componentes no estacionarias.
La funcionalidad tal como es designada por las ecuaciones (12) y (13) pueden ser implementada y realizada, en las realizaciones descritas en las Figuras 2 a 6, en el contexto de medios de calculo de filtro 370.
En algunas realizaciones de la presente invencion, la supresion de eco real no es efectuada directamente al aplicar los filtros de remocion de eco, como se describe en las ecuaciones (12) y (13). Mas bien, la remocion de eco correspondiente es efectuada en base a una version suavizada en tiempo correspondiente. Como en el caso de los parametros de diseno descritos anteriormente, los parametros de suavizacion en el tiempo son comunmente ajustados de manera manual y optimizados separadamente para la supresion de eco no estacionaria, respectivamente. Mediante esto, a calidad de audio perceptible puede ser mejorada adicionalmente, ya que los requerimientos para la supresion de componentes de ruido estacionarios difieren de aquellos para componentes de habla no estacionarios.
Tal funcionalidad puede ser efectuada, por ejemplo, dentro del contexto de los medios de calculo de filtro 370 mismos o en cualquier medio corriente abajo de los mismos, por ejemplo, en los medios de combinacion 380, los medios de seleccion 390 o el punto de distribucion 410. Tambien es posible efectuar tal suavizacion en el tiempo directamente dentro del contexto del filtro adaptable 210, si fuera necesario.
Con respecto a la mejora mencionada anteriormente en calidad, es conocido por ejemplo que la suavizacion incrementada va a ser aplicada en casos donde componentes de senal estacionaria son suprimidos, para evitar las llamadas alteraciones tonales, como se describe en la Referencia [8]. Por otra parte, tambien se debe asegurar que la atenuacion aplicada de los filtros de remocion de eco no estacionarios favorece valores pequenos para provocar una atenuacion suficientemente alta del eco, dicha atenuacion es debida a la reverberacion de la trayectoria de eco. Sin embargo, esto no debe degradar la rastreabilidad del filtro adaptable 210 en casos de niveles de eco cambiantes rapidamente. Esta discusion, que tiende a ser cualitativa, muestra claramente la necesidad de ajuste y optimizacion individual de los filtros de remocion de eco indicados por las ecuaciones (12) y (13).
La Figura 7 muestra una realizacion adicional de la presente invencion en forma de un diagrama de bloques mas grande, mas completo o diagrama de flujo de un algoritmo de atenuacion de eco acustico propuesto y descrito en el contexto de la presente invencion. La Figura 7 muestra una realizacion de la presente invencion ya que es bastante similar a la realizacion descrita en la Figura 2. Aqrn, tambien, el aparato 200 comprende medios de convertidor de tiempo/frecuencia 230 en forma de una unidad de transformacion de Fourier de tiempo corto (STFT) que tiene la senal de altavoz x[n] provista a la misma. A manera de ejemplo, la parte superior de la Figura 7 muestra una curva 420 de la senal de altavoz x[n] como funcion del tiempo, graficada sobre el mdice de tiempo n.
Ademas de convertir la senal x[n] del dominio de tiempo al dominio de frecuencia, los medios de convertidor de tiempo/frecuencia 230 tambien efectuan el retardo mencionado anteriormente por el valor de retardo d. Por consiguiente, el espectro X[k-d,m], que en general es un espectro de valores complejos, esta disponible en la salida de los medios de convertidor de tiempo/frecuencia 230. Dicho espectro X[k-d,m] es provisto a los medios de extraccion 250, que a su vez son designados por las letras SD (discriminacion estacionaria) en la Figura 7. Como ya se explico en relacion con la realizacion descrita en las Figuras 2 a 5, los medios de extraccion 250 tambien proveen, en la realizacion mostrada en la Figura 7, una senal componente estacionaria en el dominio de frecuencia Xw[k,m,], y una senal componente no estacionaria en el dominio de frecuencia Xs[k,m]. Dichas senales componentes se hacen disponibles a los medios de calculo 270.
Ademas, la realizacion mostrada en la Figura 7, de un aparato 200 comprende medios de convertidor de tiempo/frecuencia 290, que son tambien implementados en forma de una unidad de transformacion de Fourier de tiempo corto (STFT). Dichos medios de convertidor de tiempo/frecuencia 290 tienen una senal de microfono y[n] provista a los mismos como una senal de entrada, como se ilustra, por ejemplo, por una curva 430 en la parte superior de la Figura 7. Los medios de convertidor de tiempo/frecuencia 290, tambien generan una representacion correspondiente de la senal de microfono Y[k,m] en el dominio de frecuencia, el mdice k otra vez denota el bloque de
5
10
15
20
25
30
35
40
45
50
55
60
datos, y el mdice m denota la banda de frecuencia o el valor de frecuencia o el coeficiente espectral. Este espectro Y[k,m], tambien, es un espectro en general de valores complejos.
Sin embargo, a diferencia de los medios de convertidor de tiempo/frecuencia 230, los medios de convertidor de tiempo/frecuencia 290 no comprenden funcionalidad de retardo adicional. En general, esto es necesario ya que la velocidad de propagacion de las ondas de sonido (velocidad de sonido), que conduce al retardo en la senal y[n] captada por el microfono, en comparacion con la senal de altavoz asociada x[n], es claramente mas baja en comparacion con la velocidad de propagacion de senales electricas en circuitos y otros componentes.
Para ilustrar esto, un primer corchete 440 es mostrado con respecto a la senal de altavoz x[n] con respecto a las dos curvas 420, 430 en la parte superior de la Figura 7. Con respecto a la senal de microfono y[n], un segundo corchete 450 es mostrado en la Figura 7 que designa el intervalo de la senal de microfono y[n] que corresponde a aquella porcion de la senal de altavoz x[n] que es designada por el corchete 440. La senal de altavoz x[n] y la senal de microfono y[n] estan por consiguiente mutuamente desplazadas por un valor de retardo d, como tambien se indica por la flecha 460 en la Figura 7.
En la realizacion mostrada en la Figura 7, los espectros de la senal de altavoz y de la senal de microfono son provistos a medios de filtro de estimacion de eco 470, que estiman el filtro de estimacion de eco o sus componentes
m] en base a las senales entrantes. Estos coeficientes de filtro son tambien transmitidos a los medios de calculo 270.
Los medios de calculo 270, a su vez, comprenden dos medios de calculo de filtro 370-1, 370-2 para la senal componente estacionaria y la senal componente no estacionaria, ambos medios de calculo de filtro 370-1, 370-2 tienen ademas el espectro de la senal de microfono, tambien como los coeficientes de filtro para el filtro de
estimacion de eco m] provisto a ellos en la realizacion mostrada en la Figura 7. Ambos medios de calculo de filtro 370 implementan por consiguiente no solamente la funcionalidad de calculo de filtro real, como se explico en relacion con la realizacion de las Figuras 2 a 5, sino que tambien implementan la funcionalidad, contenido en los mismos, del segundo filtro de estimacion de eco 260.
Como tambien se muestra en relacion con la Figura 5a, ambos medios de calculo de filtro 370, que tambien son denominados como ERF (filtro de remocion de eco) en la Figura 7, son acoplados a medios de combinacion 380, que son denominados como FC (combinacion de filtro) en la Figura 7. Tales medios de combinacion 380 combinan los coeficientes de filtro obtenidos de ambos medios de calculo de filtro con el fin de generar los coeficientes de filtro para el filtro adaptable 210.
Asf, como ya se ilustro por las realizaciones discutidas en relacion con las Figuras 2 y 5, los medios de combinacion 380 son acoplados al filtro adaptable 210, que en la Figura 7 son denominados como SM (modificacion espectral). Dicho filtro adaptable 210 efectua la modificacion espectral asociada en base a la representacion espectral Y[k,m], tambien hecha disponible al mismo, de la senal de microfono y[n] con el fin de atenuar o suprimir el eco contenido dentro de la senal de microfono.
Finalmente, el filtro adaptable 210 es acoplado a medios de convertidor de frecuencia/tiempo 300, que es una unidad de transformacion de Fourier de tiempo corto inversa (ISTFT). La ultima emite, en el dominio de tiempo, la senal e[n] cancelada por el eco.
Realizaciones de la presente invencion en forma de metodos o aparatos correspondientes 200 como se muestra, por ejemplo, en la Figura 7 permiten la reduccion en el numero de artefactos introducidos debido a la modificacion espectral por el filtro adaptable 210. En otras palabras, realizaciones de la presente invencion permiten asf el control de potencia con respecto a los mismos. Cuando solamente el habla del extremo lejano esta presente, el proceso de supresion de eco debe ser suficientemente agresivo no para permitir que cualquier senal pase a traves, de tal manera que puede posiblemente no ser deseado, en tal situacion, separar las senales no estacionarias y senales estacionarios y las senales componentes. Por esta razon, puede posiblemente ser recomendable en tal situacion adaptar de acuerdo el parametro de control px, que controla o por lo menos influencia la misma magnitud de la senal componente estacionaria que es restada de la senal de altavoz, en la ecuacion (6) al detectar esta situacion que ya se ha descrito.
Con el fin de diferenciar entre las situaciones cuando solamente el habla del extremo lejano es emitida por la senal de altavoz, dos parametros diferentes son calculados. Esto incluye, inicialmente, la llamada ganancia de prediccion, que corresponde al promedio de plena banda de funciones de coherencia entre el canal de altavoz y el canal de microfono. Como segundo parametro, se hace uso de la actividad de voz dentro del canal de altavoz que, por ejemplo, puede ser derivada de una comparacion de niveles de senal temporal de la senal de altavoz o de
5
10
15
20
25
30
35
40
parametros codec-espedficos como se usan, por ejemplo, espedficamente con codecs apropiados para transmision de voz. Estos codecs incluyen, por ejemplo, codecs a base de LPC o codecs a base de CELP (CELP = prediccion lineal codigo excitada o prediccion lineal excitada de libro de codigos), el termino codec es una palabra artificial creada por la combinacion de las abreviaturas de los terminos en ingles codificador y descodificador.
La ganancia de prediccion o ganancia de prediccion de eco w[k] describe el nivel de similaridad entre la senal de microfono y la senal de altavoz retardada. El calculo de la ganancia de prediccion w[k] es efectuada en base a una
funcion de coherencia cuadrada entre el espectro de potencia retardado de la senal de altavoz
|Y[k, m]2
Ixd[k m ]
y el
espectro de potencia de la senal de microfono
de acuerdo con
2
r, [a-.®]-
{■
EiX^M
X„ jit. mf ^jlft. ni]J|r[/t. mf
(14)
donde E{...} designa el valor de esperanza matematica. Dicho valor de esperanza matematica puede ser obtenido en
r [k m]
el contexto de una estimacion de tiempo corto de la funcion de coherencia d al calcular o aproximar el valor
de esperanza
e)xd [k, m f |Y[k, mf }
de acuerdo con
f pwf |r [*, m]z |= | JTj [*, j»] 21 y[jt, ]2
+ (l -a)ElATj\k - l,jnf|y[t -1, m]2 j
' (15)
El factor a determina el grado de suavizacion de la estimacion sobre el tiempo. Este factor tiene una constante en el tiempo relacionada con el mismo, puesto que la ecuacion (15) corresponde aproximadamente a un decaimiento potencial. La constante de tiempo Ta del decaimiento exponencial en segundos es aproximadamente
(16)
imagen4
donde fs denota la frecuencia de toma de muestras. En otras palabras, la relacion de proporcionalidad (16) ilustra como los factores que son realmente adimensionales (en la presente a), se relacionan con la velocidad de toma de muestras fs, puede ser indicada como constante de tiempo (aqu Ta).
La ganancia de prediccion w[k] es luego calculada como el valor medio de las funciones de coherencia con respecto a las frecuencias que son indicadas por los indices m = 0, ..., M - 1, de acuerdo con
imagen5
(17)
rd[k m]
donde M denota el mismo numero de bandas de frecuencia.
Un factor de ganancia de eco cercano a 1 significa que la senal de microfono puede ser (casi) plenamente predicha en base a la senal de altavoz retardada. Por consiguiente, la probabilidad de que la senal de microfono contenga solamente habla de extremo lejano tiende hacia 1. El parametro de control px puede luego ser controlado en relacion con la ganancia de prediccion w. Siempre que la ganancia de prediccion es alta, solamente habla del extremo lejano esta presente, y la atenuacion de eco debe ser suficientemente agresiva para remover todas las senales (eco). Asf, el ruido es mantenido dentro de la trayectoria no estacionaria y es removido con el valor lfmite mas bajo Ls en decibeles (dB) en que se escoge el parametro de control px = pw = 0. Siempre que la ganancia de prediccion es baja, tanto habla del extremo cercano como habla del extremo lejano puede estar presente, de tal manera que la supresion de eco debe ser menos agresiva para no introducir artefactos. En este caso, el ruido es procesado por medio de la trayectoria estacionaria, y es removido con el valor lfmite Lw en decibeles (dB). Ademas, el parametro de
5
10
15
20
25
30
35
40
45
50
55
60
control px = Pw es usado en este caso.
En este caso, se debe notar, sin embargo, que la ganancia de prediccion podna ser alta si la senal de altavoz contiene solamente ruido que es captado por el microfono sin la presencia de habla. Para impedir que el valor del parametro de control px sea escogido para ser demasiado grande en este caso, lo que conducina a supresion excesiva, un segundo parametro de control es usado, es decir la actividad de voz dentro del canal de altavoz. Por consiguiente, las reglas descritas anteriormente para calcular el parametro de control px como funcion de la ganancia de prediccion w se aplican realmente solo cuando el habla esta activa dentro del canal de altavoz.
En la realizacion ilustrada en la Figura 7, esta funcionalidad, que es descrita por las ecuaciones (14) a (17), es efectuada por los medios de calculo 270, mas espedficamente por los dos medios de calculo de filtro 370 y los medios de combinacion 380. Una implementacion correspondiente es naturalmente tambien posible dentro del contexto de las realizaciones descritas en las Figuras 2 a 5 en que los medios de calculo 270 posiblemente no solo tienen la senal de microfono, que es dibujada opcionalmente en la Figura 2, provista a los mismos via la entrada 280, sino tambien tienen la senal de altavoz posiblemente sin modificar provista a los mismos via la entrada 220.
Para ilustrar el modo de operacion de las realizaciones de la presente invencion en mas detalle, el procesamiento de senal sera descrito a continuacion en relacion con las Figuras 8 a 10. La Figura 8 muestra la separacion o extraccion del componente estacionario y el componente no estacionario de la senal de altavoz. En la ilustracion parcial a, Figura 8 muestra el espectro de potencia de altavoz a una frecuencia de 1 kHz, que es graficada como funcion del tiempo en un intervalo de aproximadamente 5 segundos a aproximadamente 7.5 segundos. La abscisa de la ilustracion parcial c aqrn se aplica a todas las tres ilustraciones parciales a a c. La ilustracion parcial b muestra el espectro de potencia correspondiente del componente no estacionario, mientras que la ilustracion parcial c refleja el espectro de potencia correspondiente del componente estacionario.
El componente no estacionario, o la senal componente no estacionaria asociada, ilustrada en la ilustracion parcial 8b comprende altos valores en cada caso cuando el espectro de potencia asociado en la ilustracion parcial 8a, tambien, comprende correspondientemente altas contribuciones. En las areas entre estos intervalos, sin embargo, el componente no estacionario desaparece casi completamente.
En contraste, el componente estacionario, que fue determinado por el promedio recursivo flotante de acuerdo con la ecuacion (7), exhibe valores que, en comparacion con el componente no estacionario de la Figura 8b, son claramente mas pequenos en magnitud y que, sin embargo, exhiben una curva claramente mas uniforme a cuenta del promedio flotante. En particular, el componente estacionario en la Figura 8c y/o la senal componente estacionaria asociada en el penodo de tiempo de aproximadamente 6.4 segundos exhibe una cafda exponencial o semejante a exponencial como tambien se menciono en relacion con la relacion de proporcionalidad (16). Este decaimiento aqrn es debido al hecho de que el espectro de potencia en la Figura 8a en este intervalo no comprende mas valores altos que son debidos a senales de habla correspondientes. Las contribuciones espectrales que exceden el componente estacionario caen de acuerdo.
En base a los datos mostrados en la Figura 8, la Figura 9 ilustra los filtros de remocion de eco asociados. Mas espedficamente, la Figura 9 muestra las dos curvas de filtro de remocion asociadas Hs y Hw para la frecuencia de 1 kHz, que son calculadas en base a las ecuaciones (12) y (13). La ilustracion parcial 9a muestra el filtro de remocion de eco Hs para el componente no estacionario a la frecuencia de 1 kHz, dicho filtro es calculado de acuerdo con la ecuacion (12). La ilustracion parcial b muestra el filtro de remocion de eco correspondiente para el componente estacionario Hw de acuerdo con la ecuacion (13).
La Figura 10 ilustra, en base a los mismos datos, que es graficada en una escala de tiempo mas grande, sin embargo, como se muestra por la abscisa de la ilustracion parcial 10c, que tambien se aplica a las ilustraciones parciales a y b. la Figura 10 ilustra la relacion entre la intensidad del parametro de control px y la separacion estacionaria/no estacionaria en la ilustracion parcial 10a, y de la ganancia de prediccion w en la ilustracion parcial 10b junto con la actividad de voz del canal de altavoz en la ilustracion parcial 10c.
Mas espedficamente, la Figura 10 ilustra la relacion entre el parametro de control px y los dos parametros de control w y la actividad de voz, como fueron presentados en la descripcion anterior. El primer tercio de la simulacion subyacente de la Figura 10 corresponde a la situacion donde solamente habla del extremo lejano esta presente, que es caracterizada por una ganancia de prediccion alta. En este caso, el parametro de control px es ajustado al valor px = pw = 0, para suprimir el componente no estacionario de manera agresiva, y para tambien suprimir el componente estacionario, con el fin de no permitir que ninguna senal pase a traves.
El segundo tercio de la simulacion corresponde a la situacion donde el habla esta presente solo en el extremo lejano, que es reconocible y asf, detectable, por una ganancia de prediccion baja w y una carencia de actividad de voz en la senal de altavoz. Luego, el parametro de control px es seleccionado para ser grande para permitir que
5
10
15
20
25
30
35
40
45
50
55
60
todos los componentes estacionarios pasen a traves de la trayectoria estacionaria y sean removidos con poca agresividad como sea posible para no introducir ningun artefacto. El ultimo tercio de la simulacion corresponde a una situacion de doble habla donde el parametro de control px fluctua entre valores bajos siempre que la actividad de voz esta presente en el canal de altavoz y valores mas grandes cuando no se detecta ninguna actividad de voz.
En realizaciones de la presente invencion que han sido descritos hasta ahora, como se ilustra, por ejemplo, en la Figura 6, que puede tambien ser considerada como un diagrama de flujo general de una realizacion correspondiente de acuerdo con la presente invencion, la supresion separada de los componentes de eco estacionarios y no estacionarios no es obtenida al separar las senales de altavoz correspondientes, sino que es efectuada al estimar la senal de eco global.
En estas realizaciones de la presente invencion, se obtiene una estimacion del espectro de potencia de la senal de eco mediante la aplicacion de un filtro de estimacion de eco G[k,m] o G[k,m]2 a una version retardada del espectro
de potencia de altavoz de acuerdo con la ecuacion (8), donde I^PL m] - representa un valor estimativo del espectro de potencia del eco, tal valor estimativo esta contenido en la senal de microfono. La separacion del espectro de
potencia de altavoz en componentes estacionarios IXJk, m]|? y componentes no estacionarios l>C[k.rri]^ ^e acuerdo con la ecuacion (3) da como resultado en que el eco que se origina del componente de senal de altavoz no estacionario es dado por la ecuacion (10) y que el eco que se origina de los componentes de senal de altavoz estacionaria es dado por la ecuacion (9).
Utilizando los valores estimativos de eco no estacionarios y estacionarios mil1, y l*Jk. mil2,
se pueden
calcular los filtros de remocion de eco correspondientes Hs[k,m] y Hw[k,m]. Estos filtros de remocion de eco son luego combinados y aplicados a la senal de microfono para suprimir la senal de eco, que es efectuada de acuerdo con la ecuacion:

E[k,m] = H[k,m]Y[k,m] , (18)
donde H[k,m] es dado por

H[k,m] = combinacion(Hs[k,m], Hw[k,m]). (19)
Una posibilidad de combinar los diferentes filtros de remocion de eco Hs[k,m] y Hw[k,m] es usar el producto de los mismos de acuerdo con la ecuacion (11), que corresponde a conectar los dos filtros en serie.
Una posibilidad adicional es usar el mmimo respectivo de los filtros de remocion de eco de acuerdo con:

E[k,m] = min(Hs[k,m], Hw[k,m])Y[k,m], (20)
donde la funcion min(...) representa el mmimo de los valores respectivos. En otras palabras, en este caso, se aplica la combinacion de relacion (...) = min(...).
Como ya se explico anteriormente, estos calculos pueden ser efectuados, por ejemplo, en los medios de combinacion 380, pero pueden tambien ser efectuados en los medios de seleccion 390 o el punto de distribucion 410. Ademas, combinaciones y calculos mas complejos de los filtros de supresion individuales, que estan basados, por ejemplo, en combinaciones lineales o ecuaciones no lineales, pueden tambien ser efectuadas en los medios respectivos. Asimismo, es posible efectuar la combinacion correspondiente no a la manera de senal de paso de banda, sino basada en grupos de senales de paso de banda o para todas las senales de paso de banda de la misma manera.
Al realizar los filtros de remocion de eco de esta manera combinada, es posible introducir diferentes ganancias para diferentes componentes de eco. El filtro de remocion de eco no estacionario es calculado de acuerdo con la ecuacion (12), mientras que el filtro de remocion de eco estacionario es calculado de acuerdo con la ecuacion (13).
La supresion de eco real es frecuentemente no efectuada en base a la aplicacion directa de los filtros de remocion de eco de acuerdo con las ecuaciones (12) y (13), sino que es mas bien efectuada en base a las versiones suavizadas en el tiempo correspondientes. Como en el caso de los parametros de diseno descritos anteriormente, los parametros de suavizacion en el tiempo, tambien, pueden ser ajustados de manera manual separadamente para la supresion de eco no estacionaria y la supresion de eco estacionaria. De esta manera, la calidad de audio percibida puede ser incrementada adicionalmente, puesto que los requerimientos para la supresion de los componentes de ruido estacionarios difieren de aquellos para los componentes de habla no estacionarios.
Por ejemplo, es bien conocido que es recomendable utilizar una suavizacion mas intensa en aquellos casos donde
5
10
15
20
25
30
35
40
45
50
55
60
los componentes de senal estacionarios van a ser suprimidos, para evitar los llamados tonos musicales. Por otra parte, se asegura que la suavizacion que es aplicada a los filtros de remocion de eco no estacionarios favorece a los valores mas pequenos para suprimir eficientemente ecos que se originan de contribuciones largas de la trayectoria de eco o colas largas de la trayectoria de eco. Sin embargo, esto no debe deteriorar el comportamiento de sucesion en el caso de niveles de eco que cambian rapidamente. Esta discusion cualitativa muestra la necesidad de adaptar y optimizar individualmente los dos filtros de remocion de eco diferentes de acuerdo con las ecuaciones (12) y (l3).
En lo siguiente, un procedimiento diferente de acuerdo con una realizacion adicional de la presente invencion en forma de un metodo y/o aparato sera descrito donde los filtros de remocion de eco separados son aplicados a los componentes de senal estacionarios y los componentes de senal no estacionarios. La Figura 11 muestra el diagrama de bloques correspondiente de un aparato 200 que comprende un filtro adaptable correspondiente 210. De acuerdo al gran numero de similaridades estructurales, se hara referencia a continuacion en particular a la descripcion de las realizaciones mostradas en las Figuras 2 a 5 y 6 a 7.
El aparato 200 de acuerdo con una realizacion de la presente invencion incluye otra vez un altavoz 100 o una terminal para un altavoz 100 o una entrada para una senal de altavoz correspondiente x[n]. Dicha senal de altavoz x[n] es transformada a una representacion espectral X[k,m] de la senal de altavoz dentro del contexto de medios de convertidor de tiempo/frecuencia 230 denominados como DFT (Transformada de Fourier discreta). Dicha senal de altavoz es provista a medios de retardo 480, que generan una version retardada de la misma X[k - d(k,m), m], d(k,m) que es del valor de retardo correspondiente.
La senal retardada por los medios de retardo 480 es luego provista a un primer filtro de estimacion de eco 240, que genera una serial de estimacion de eco Y[k,m] en base a los coeficientes de filtro G[k,m], Dicha serial de estimacion de eco Ylkjn]
es provista a medios de extraccion 250, que generan, en base a los coeficientes espectrales de esa serial de eco estimada, espectros de potencia no estacionarios y estacionarios de esta serial como senales
componentes (derivadas) de la serial de altavoz. Asi, los medios de extraccion 250 emiten las senales l^[k- y
a medios de calculo 270.
imagen6
La senal de microfono y[n] de un microfono 110 es tambien provista a medios de convertidor de tiempo/frecuencia 290 configurados como una DFT, que genera una representacion espectral Y[k,m] de la senal de tiempo y[n] del mismo. Esta senal es suministrada via medios de calculo de valor de energfa 490 que, en base a los componentes espectrales de la senal de microfono, determinan un espectro de potencia de los componentes espectrales al elevar al cuadrado la magnitud (absoluta) de los valores individuales. El espectro de potencia asf obtenido es tambien provisto a los medios de calculo 270, que junto con los espectros de potencia descritos anteriormente calculan los dos filtros de remocion de eco Hs[k,m] y Hw[k,m] los coeficientes de filtro del filtro adaptable real H[k,m] y los envfa al filtro adaptable 210.
El filtro adaptable 210 es tambien acoplado a la salida de los medios de convertidor de tiempo/frecuencia 290 y asf tambien recibe los componentes espectrales Y[k,m] de la senal de microfono y[n], de la cual genera la senal eco- suprimida en el dominio de frecuencia o el dominio frecuencia-relacionado E[k,m], en tanto que toma en cuenta los coeficientes de filtro H[k,m]. Esta senal eco-suprimida es luego provista a los medios de convertidor de frecuencia/tiempo 300 configurados como una IDFt (DFT inversa), que inevitablemente convierte esta senal de regreso al dominio de tiempo.
Para determinar el valor de retardo d(k,m) para los medios de retardo 480 y para determinar los coeficientes de filtro de estimacion de eco para el filtro de estimacion de eco 240, ambas de las representaciones espectrales de la senal de altavoz [k,m] y las representaciones espectrales de la senal de microfono Y[k,m] son transmitidas a medios de calculo de energfa correspondiente 500, 510 que son acoplados a la salidas de los dos medios de convertidor de tiempo/frecuencia 230, 290. Los medios de calculo de energfa 500 son acoplados a la salida de los medios de convertidor de tiempo/frecuencia 230 y los medios de calculo de energfa 510 son acoplados a la salida de los medios de convertidor de frecuencia/tiempo 300.
Cada uno de los medios de calculo de valor de energfa 500, 510 calculan, por analogfa con los medios de calculo de energfa 490, los espectros de potencia al elevar al cuadrado las magnitudes de los componentes espectrales respectivos y proveen esos valores a medios de calculo adicionales 520. Los medios de calculo adicionales 520 determinan luego, en base a los valores hechos disponibles a los mismos, un valor estimativo del retardo d(k,m) y valores para los coeficientes de filtro G[k,m] para el filtro de estimacion de eco 240. Los valores mencionados anteriormente correspondientes son luego transmitidos a los medios de retardo 480 por una parte y al filtro de estimacion de eco 240, por otra parte, con los cuales los medios de calculo adicionales 520 estan tambien acoplados.
Como tambien se puede ver de la realizacion mostrada en la Figura 11, la separacion de las senales componentes
5
10
15
20
25
30
35
40
45
50
a 2 a 2
respectivas ( r,[k, mr y I "wlk mll") puede asi ser efectuada en base a una estimacion del espectro de senal de eco Y[k; m],
que es calculado de acuerdo con:
Y[k, m] = G[k, m]x[k - d, m]
Este calculo se lleva a cabo en el filtro de estimacion de eco 240.
(21)
La definicion de los dos filtros de remocion de eco Hs[k,m] y Hw[k,m] de acuerdo con las ecuaciones (12) y (13) sigue sin cambios. Lo mismo se aplica a la determinacion del filtro de remocion de eco combinado H[k,m].
El metodo adicional descrito en la Figura 11 o el aparato asociado 200, esta asf basado en la suposicion de que los componentes de eco estacionarios y componentes de eco no estacionarios de las senales de eco estimadas estan tambien sin correlacionar, de tal manera que:
|Y[k, m]2
|YS [k, m]2 + |YW [k, m]2
(22)
Los espectros de potencia estimados de los componentes de eco estacionarios pueden luego ser determinados al restar un valor estimativo del componente estacionario del valor estimativo de eco m]l2 del espectro de
potencia de la senal de eco estimada |^[k, m]|2
Asi:
It [k, m]2 = |Y[k, m]2 - |Yw [k, m]2
(23)
En la practica, la senal ^ " es estimada al filtrar el espectro de potencia de la senal de eco estimada
de acuerdo con:
imagen7
imagen8
Fy [k, m ]2 Y [k, m ]
2
(24)
En cuanto al filtro, un filtro de ganancia adicional Fy[k,m] o su valor elevado al cuadrado Fy[k,m]2 es empleado que es determinado por analogfa con el filtro de ganancia Fx[k,m] o Fx[k,m]2 y por consiguiente no es discutido y explicado en detalle en este punto. Esta funcionalidad es tambien efectuada por los medios de extraccion 250 en base a las senales derivadas respectivas.
Se debe notar en este punto que la realizacion mostrada en la Figura 11 es concerniente con el caso donde el espectro estimado de la senal de eco Y(k, m] ya esta disponible. Por supuesto, el metodo correspondiente es
tambien explicable cuando solamente la senal de potencia estimada de la senal de eco estimada IY|k. m]|2 de acuerdo con la ecuacion (8) es conocida. Esta situacion sera descrita en mas detalle en relacion con la realizacion mostrada en la Figura 12.
Mientras que la Figura 11 muestra un diagrama de bloques de un procedimiento de atenuacion de eco acustico, donde la separacion de los componentes de eco estacionarios y componentes de eco no estacionarios es aplicada
en base a un espectro de eco estimado Y(k, nn) e| diagrama de bloques ilustrado en la Figura 12 ilustra un procedimiento similar. En contraste, sin embargo, el ultimo esta basado en un procedimiento de atenuacion de eco acustico que aplica la separacion de los componentes de eco estacionarios y componentes de eco no estacionarios
en base a un espectro de potencia estimado de la senal de eco |Y[k; m]|2
Consecuentemente, no son solamente los modos de operacion de las dos realizaciones mostradas en las Figuras 11 y 12 que son muy similares, sino tambien sus estructuras, ya que la descripcion que sigue lo mostrara.
Mas espedficamente, la realizacion mostrada en la Figura 12 difiere de aquella mostrada en la Figura 11 en que los medios de calculo de energfa 500 ya no son conectados exclusivamente corriente arriba de los medios de calculo adicionales 520 con respecto a la senal de altavoz x[n] transferida al dominio de frecuencia, sino que mas bien son conectados directamente a la salida de los medios de convertidor de tiempo/frecuencia 230 otra vez configurados como DFT. De esta manera, no solamente los medios de calculo adicionales 520, sino tambien los medios de retardo 480, el filtro de estimacion de eco 240 y los medios de extraccion 250 ya no son provistos con los
5
10
15
20
25
30
35
40
45
50
55
60
componentes espectrales reales, sino mas bien con el espectro de potencia de los mismos.
Aparte de esto, sin embargo, las dos realizaciones mostradas en las Figuras 11 y 12 difieren solamente en que los calculos respectivos posiblemente proceden marginalmente de manera diferente entre sf dentro de los componentes y medios individuales. Por ejemplo, el calculo correspondiente de los valores relacionados con la energfa de los componentes espectrales individuales ya no es efectuada en los medios de extraccion 250, puesto que ya se efectuo previamente por los medios de calculo del valor de energfa 500.
La Figura 13 muestra una realizacion adicional de la presente invencion, donde, por ejemplo, mas de una senal de altavoz o mas de una senal de microfono son provistas al aparato respectivo 200. En otras palabras, la realizacion ilustrada en la Figura 13 es un aparato de multicanal.
En tanto que realizaciones de la presente invencion fueron discutidas y descritas anteriormente solo para canales individuales o el caso de un canal individual, donde solamente una senal de altavoz y una senal de microfono estaban disponibles, realizaciones de la presente invencion no estan limitadas al caso de un canal individual, como se explicara posteriormente en la presente. Dichas realizaciones pueden tambien ser aplicadas, por analogfa, a sistemas de atenuacion de eco acusticos con capacidad de multicanal. Puesto que la realizacion mostrada en la Figura 13 del aparato 200 es muy similar en estructura a aquella mostrada en la Figura 2 se hara referencia posteriormente en la presente a la descripcion en relacion con las Figuras 2 y 5 ya que el modo de operacion, conexion y otros aspectos son concernientes.
La variante de multicanal mostrada en la Figura 13 del aparato 200 comprende una pluralidad de entradas 220-1, 220-2, ..., donde varias senales de altavoz pueden ser acopladas al aparato 200. Asf, el aparato 200 tambien comprende una pluralidad correspondiente de medios de convertidor de tiempo/frecuencia opcionales 230-1, 230-2, ..., que posiblemente efectuan una traduccion o conversion de las senales de altavoz correspondientes del dominio de tiempo a un dominio frecuencia-relacionado, como ya se resumio en detalle en relacion con la Figura 2.
La pluralidad de medios de convertidor de tiempo/frecuencia 230 son acoplados a un numero correspondiente de entradas de medios de enfardado 530, que en base a las senales de altavoz entrantes forma una senal de altavoz derivada comun que luego envfa la misma al primer filtro de estimacion de eco 240 o a los medios de extraccion 250, dependiendo de si el primer filtro de estimacion de eco opcional 240 esta presente. Como ya se describio en relacion con la realizacion mostrada en la Figura 2, los medios de extraccion 250 son acoplados posiblemente a un segundo filtro de estimacion de eco opcional 260 o directamente a los medios de calculo 270. Dichos medios finalmente emiten los coeficientes de filtro calculados en una salida de los mismos.
A diferencia de la realizacion mostrada en la Figura 2, la variante de multicanal del aparato 200 de la Figura 13 comprende ademas medios de enfardado adicionales 540, que son acoplados, en el lado de salida, a un numero correspondiente de entradas 280-1, 280-2, ... para senales de microfono correspondientes via medios de convertidor de tiempo/frecuencia opcionales 290-1, 290-2, ... Los medios de enfardado adicionales 540 determinan, por analogfa con los medios de enfardado 530, en base a las senales de microfono que estan presentes dentro del dominio de tiempo o en un dominio frecuencia-relacionado y se hace disponible al mismo, una senal de microfono derivada, efectiva o comun, que opcionalmente se puede hacer disponible a los medios de extraccion 250 o a los medios de calculo 270.
La variante de multicanal del aparato 200 como se muestra en la Figura 13 muestra ademas un filtro adaptable 2101, 210-2, ... para cada senal de microfono o cada una de las entradas de senal de microfono 280, dicho filtro adaptable 210-1, 210-2, ... es acoplado, posiblemente via los medios de convertidor de tiempo/frecuencia opcionales 290-1, 290-2, ..., a las entradas respectivas 280-1, 280-2, ... Asf, los filtros adaptables 210-1, 210-2, ... son acoplados, posiblemente via una pluralidad de medios de convertidor de frecuencia/tiempo opcionales 300-1, 300-2, ..., a una salida 310-1, 310-2, ..., respectivamente. Las senales de salida que son filtradas por los filtros adaptables 210, estan despejadas de ecos o estan modificadas espectralmente, esta luego disponibles al aparato 200 en las salidas 310.
Los filtros adaptables 210-1, 210-2, ... son todos acoplados en paralelo a las salidas de los medios de calculo 270, en tal salida, los medios de calculo 270 proporcionan los coeficientes de filtro para los filtros adaptables. En otras palabras, todas las senales de microfono de la pluralidad de senales de microfono son filtradas, en una realizacion de la presente invencion, como se ilustra en la Figura 13, con los mismos filtros adaptables desde un punto de vista funcional, esto es, en base a los mismos coeficientes de filtro, para obtener las versiones modificadas espectralmente o eco-canceladas, de las senales de microfono correspondientes.
Asf, si x1[n] son las senales del primer altavoz, donde 1 es un numero entero que fluctua de 0 a L-1, y donde L designa numero de los diferentes altavoces o senales de altavoz, el mismo modelo puede ser introducido, por analogfa con la ecuacion (1), de acuerdo con:
5
10
15
20
25
30
35
40
45
50
55
xi [n ] = xs,i [n ]+ xw ,i [n ] - (25)
donde xs,l[n] modula la contribucion del habla no estacionaria y xw,l[n] modula la contribucion del ruido estacionario, que estan contenidos en la primera senal de altavoz. De acuerdo con la ecuacion (2) la representacion de dominio de STFT de la ecuacion (25) es dada por:
L-1
X [k, m ]=2 \Xi [k, m ]|2 . (26)
l=0
Un espectro de potencia comun, enfardado para todos los canales de altavoz es luego calculado al combinar los espectros de las senales de altavoz individuales en los medios de enfardado 530 mostrados en la Figura 13 de acuerdo con
X i [k, m ]= Xs,i [k, m ]+ Xw,i [k, m ] - (27)
donde L representa el numero de los canales de altavoz. La separacion de los componentes de senal no estacionarios y los componentes de senal estacionarios de acuerdo con las ecuaciones (5) y (7) es luego efectuada con respecto al espectro de potencia comun o enfardado de acuerdo con la ecuacion (27).
En analogfa con lo mismo, un espectro de potencia comun o enfardado para los canales de microfono es tambien calculado de acuerdo con:
P-1 2
Y [k, m ]2 = 2 \Yp [k, m ] - (28)
p=0
donde Yp[k,m] designa la senal del p-esimo microfono 110 y P representa el numero de microfonos. El mdice p otra vez es un numero entero que fluctua de 0 to P - 1. Este calculo es posiblemente efectuado, en la realizacion mostrada en la Figura 13 por los medios de enfardado adicionales 540.
Para la determinacion de los dos filtros de remocion de eco de acuerdo con las ecuaciones (12) y (13), los espectros
de altavoz (potencia) l*[H.m] ~ de acuerdo con la ecuacion (27) y el espectro (potencia) de microfono rr|]^ de acuerdo con la ecuacion (28) son usados durante las etapas algontmicas adicionales, como fueron explicados en los parrafos precedentes de la descripcion. La determinacion del parametro de control px descrita en relacion con el control de desempeno de acuerdo con las ecuaciones (14) a (17) puede tambien ser efectuada en base a los espectros comunes o enfardados de acuerdo con las ecuaciones (27) y (28).
La supresion de eco real dentro del contexto de la modificacion espectral es luego efectuada individualmente para cada senal de microfono, pero usando el mismo filtro de remocion de eco 210 para cada canal de microfono de acuerdo con:
Ep [k, m ]= Hs [k, m ]H w [k, m ^fp [k, m ] (29)
para p = 0, 1, ..., P - 1. En analogfa con lo mismo, los filtros de remocion de eco 210 pueden tambien ser implementados diferentemente, por ejemplo, por analogfa con la ecuacion (19), como se explico anteriormente.
En este contexto, es valioso notar que dentro del contexto de la variante de multicanal del aparato 200, como se muestra, por ejemplo, en la Figura 13, el numero L de las senales de altavoz y el numero P de las senales de microfono debe ser identico y diferente entre sf Cualquier numero de entradas pueden ser provistas, en principio, tanto para las senales de altavoz como para las senales de microfono. Tambien, no es absolutamente necesario proveer tanto una pluralidad de entradas de senal de altavoz como una pluralidad de entradas de senal de microfono con los medios de enfardado correspondientes 530, 540. En realizaciones de la presente invencion, es completamente posible que solo una pluralidad de entradas de senal de altavoz sean implementadas con medios de enfardado correspondientes 530 sin tener que implementar mas de una entrada de senal de microfono con medios de enfardado adicionales correspondientes 540. Tal sistema puede ser empleado, por ejemplo, cuando hay un solo microfono pero una pluralidad de altavoces, por ejemplo debido a que la senal de comunicacion del suscriptor del extremo lejano es reducida via un sistema de sonido que comprende varios altavoces, como puede ser implementado en vetuculos motorizados por ejemplo.
Ademas, no es necesario posiblemente implementar mas que una entrada para una senal de altavoz con medios de enfardado correspondientes 530, cuando solamente un altavoz central, por ejemplo, dentro del contexto de un sistema de conferencia, es implementado, sino una pluralidad de altavoces cada uno tiene un microfono de ellos
5
10
15
20
25
30
35
40
45
50
55
60
disponible para ellos. En tal caso, solamente la implementacion de los medios de enfardado adicionales 540 puede posiblemente ser recomendable.
Ademas, es valioso notar en este punto que los medios de enfardado 530, 540 pueden naturalmente estar configurados de tal manera que estan disenados para mas senales de altavoz o senales de microfono que son inevitablemente provistas a ellos. Asf, el aparato 200 puede comprender posiblemente mas entradas correspondientes 220, 280 que inevitablemente seran usadas. En este caso, por ejemplo, un circuito corriente arriba, tal como los medios de convertidor de tiempo/frecuencia opcionales 230, 290 o los medios de enfardado 530, 540 mismos pueden determinar el numero de canales activos y seleccionar los parametros L y P de acuerdo. Por supuesto, un suministro externo del numero de canales y posiblemente el numero de senales de microfono y altavoz a ser tomados en cuenta pueden tambien ser implementadas.
Tambien se debe notar en este punto que la realizacion mostrada en la Figura 13 naturalmente tambien funciona con solamente una senal de altavoz y una sola senal de microfono, y los parametros correspondientes L y P son transmitidos a los medios de enfardado 530, 540. En principio, las ecuaciones (27) y (28) son tambien aplicables a los casos donde P = 1 y/o L = 1. Asf, la realizacion mostrada en la Figura 13 representa una extension “hacia abajo- compatible” de la realizacion mostrada en la Figura 2.
Con respecto a la resolucion de frecuencia, puede posiblemente ser recomendable desviarla de aquella de un STFT. La resolucion espectral uniforme de una STFT no esta muy bien adaptada a la percepcion humana. Puede por
consiguiente posiblemente ser ventajoso agrupar los coeficientes uniformemente separados |x[k, m]|* y |Y[k; m]|2 en un numero de particiones o grupos no superpuestos, como tambien es mostrado en la referencia [9], estas particiones o grupos comprenden anchos de bandas que imitan la resolucion de frecuencia del sistema auditivo humano, como es representado, por ejemplo, en la referencia [10].
Para una velocidad de toma de muestras de 16 Khz, una longitud de bloque de DFT para la STFT de 512 muestras y 15 grupos o particiones es una eleccion razonable, cada particion tiene un ancho de banda que corresponde aproximadamente al doble del ancho de banda rectangular equivalente (ERB), como se describe en la Referencia [10]. Las bandas corresponden a las particiones como se representa en la Figura 14.
La Figura 14 muestra como los coeficientes espectrales de un espectro de STFT uniforme pueden ser agrupados o divididos en particiones de grupos para imitar la resolucion de frecuencia no uniforme del sistema auditivo humano.
El eje de frecuencia como se ilustra en la Figura 14 se extiende desde 0 Hz a aproximadamente 8000 Hz, que corresponde a una banda de frecuencia efectiva basada en una frecuencia de toma de muestras de 16 Khz.
Los diferentes filtros de ganancia son calculados solamente para la frecuencia central de cada grupo. Adicionalmente, esto da como resultado una reduccion en la complejidad de calculo en comparacion con el caso de una resolucion espectral plena de una STFT uniforme. Antes de que el filtro de ganancia de particion o grupo final sea aplicado al espectro de senal de STFT uniforme, dicho espectro de senal de STFT es interpolado utilizando filtros de interpolacion de Hann.
La Figura 15a muestra filtros de interpolacion de Hann correspondientes que pueden ser empleados para suavizar los filtros de ganancia sobre la frecuencia. La Figura 15b muestra los coeficientes de filtro de ganancia como una lmea contmua, que son obtenidos al interpolar los valores de los filtros de ganancia en las particiones individuales, que por su parte son ilustradas por los puntos gruesos mostrados en la Figura 15b.
La ilustracion parcial a de la Figura 15 ilustra exactamente estos filtros de Hann, mientras que la ilustracion parcial b ilustra un ejemplo de valores de filtros de ganancia antes y despues de la interpolacion. Los puntos ilustrados en la Figura 15b representan los valores antes de la interpolacion, mientras que la imea continua corresponde a dichos valores despues de la interpolacion. La suavizacion de frecuencia de los filtros de ganancia conduce a una variacion mas uniforme del espectro resultante como funcion de la frecuencia y asf reduce los tonos musicales y otros artefactos.
Como la descripcion de realizaciones de la presente invencion demostro, las realizaciones de la presente invencion, en algunos casos, comprenden unidades funcionales que incluyen las siguientes etapas como un breve resumen. Algunas realizaciones de la presente invencion implementan la recepcion de por lo menos una senal de altavoz, recepcion de por lo menos una senal de microfono, conversion de la senal de altavoz y la senal de microfono a espectros de tiempo corto, calculo de los espectros de potencia de altavoz y microfono correspondientes, extraccion o separacion del espectro de potencia de altavoz en espectros de potencia estacionarios y espectros de potencia no estacionarios, calculo de un filtro de ganancia de remocion de eco, en tanto que se usan los espectros de potencia de altavoz estacionarios, calculo del filtro de ganancia de remocion de eco en tanto que se usa el espectro de potencia de altavoz no estacionario, aplicacion del filtro de ganancia al espectro de microfono para suprimir el eco y conversion del espectro de microfono eco-suprimido al dominio de tiempo.
5
10
15
20
25
30
35
40
45
50
55
60
Dependiendo de las circunstancias, las realizaciones de los metodos de la invencion pueden ser implementadas en elementos ffsicos o en elementos de programacion. La implementacion puede ser efectuada en un medio de almacenamiento digital, en particular un disco, CD o DVD con senales de control que se pueden leer electronicamente, que pueden interactuar con un sistema de computadora programable, de tal manera que se efectua una realizacion del metodo de la invencion. En general, las realizaciones de la presente invencion tambien consisten asf de un producto de programa de elementos de programacion o un producto de programa de computadora o un producto de programa que tiene codigos de programa almacenados en un portador que se puede leer por la maquina, para llevar a cabo una realizacion del metodo de la invencion, cuando el producto de programa de elementos de programacion se ejecuta en una computadora o un procesador. En otras palabras, una realizacion de la presente invencion puede asf tambien ser realizada como un programa de computadora o un programa de elementos de programacion o un programa que tiene codigos de programa para efectuar el metodo, cuando el programa se ejecuta en un procesador. El procesador puede consistir de una computadora, una tarjeta de chip (tarjeta inteligente), un sistema integrado (SOC = sistema sobre chip), un circuito integrado aplicacion-espedfico (ASIC) o cualquier otro circuito integrado (IC).
Referencias
[1] C. Breining, P. Dreiseitel, E. Hansler, A. Mader, B. Nitsch, H. Puder, T. Schertler, G. Schmidt y J. Tilp. Acoustic echo control. IEEE Signal Processing Magazine, 16(4): 42 - 69, Julio 1999.
[2] A. N. Birkett y R. A. Goubran. Limitations of handsfree acoustic echo cancellers due to nonlinear loudspeaker distortion and enclosure vibration effects. In Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, pp. 13 - 16, New Paltz, Oct. 1995.
[3] G. Schmidt y E. Hansler. Acoustic echo and noise control: a practical approach. Hoboken: Wiley, 2004.
[4] W. L. B. Jeannes, P. Scalart, G. Faucon y C. Beaugeant. Combined noise and echo reduction in hands-free systems: a survey. IEEE Transactions on Speech and Audio Processing, 9(8): 808 - 820, Nov. 2001.
[5] C. Faller y J. Chen. Suppressing acoustic echo in a sampled auditory envelope space. IEEE Trans. on Speech and Audio Proc., 13(5): 1.048 - 1.062, Sept. 2005.
[6] C. Faller y C. Tournery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works. on Acoust. Echo and Noise Control (IWAENC), Sept. 2005.
[7] W. Etter y G. S. Moschytz. Noise reduction by noise-adaptive spectral magnitude expansion. J. Audio Eng. Soc., 42: 341 - 349, Mayo 1994.
[8] O. Capp'e. Elimination of the musical noise phenomenon with the ephrain and malah noise suppressor. IEEE Trans. Speech and Audio Processing, 2(2): 345 - 349, Abril 1994.
[9] C. Faller y F. Baumgarte. Binaural Cue Coding - Part II: Schemes and applications. IEEE Trans. on Speech and Audio Proc., 11(6): 520 - 531, Nov. 2003.
[10] B. R. Glasberg y B. C. J. Moore. Derivation of auditory filter shapes from notched-noise data. Hear. Res., 47: 103 - 138, 1990.
Lista de numeros de referencia
100 altavoz
110 microfono
120 ambiente acustico
130 senal del altavoz
140 senal del microfono
150 unidad de proceso de eliminacion de eco
160 senal de eco suprimida
170 via directa
180 via indirecta
200 aparato
210 filtro adaptativo
220 entrada
230 medios convertidores de tiempo/frecuencia
240
250
260
270
280
290
300
310
320
330
340
350
360
370
380
390
400
410
420
430
440
450
460
470
480
490
500
510
520
530
540
filtro de estimacion de eco medios de extraccion filtro de estimacion de eco medios de calculo entrada
medios convertidores de tiempo/frecuencia medios convertidores de frecuencia/tiempo salida
medios de promedio
filtro de ganancia
medios de calculo de parametros
medios de distribucion
etapa de filtro
medios de calculo de filtro
medios de combinacion
medios de seleccion
medios de determinacion de parametros
punto de distribucion
curva
curva
soporte
soporte
flecha
medios de filtro de estimacion de eco medios de retardo
medios de calculo de valor de energfa medios de calculo de valor de energfa medios de calculo de valor de energfa medios de calculo adicionales medios de agrupacion medios de agrupacion adicionales

Claims (21)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    REIVINDICACIONES
    1. Un aparato (200) para el calculo de coeficientes de filtro para un filtro adaptativo (210) para filtrar una senal de microfono con el fin de suprimir un eco debido a una senal de altavoz, que comprende:
    medios de extraccion (250) para la extraccion de una senal de componente estacionario o una senal de componente no estacionario de la senal de altavoz o de una senal derivada de la senal de altavoz, en el que los medios de extraccion (250) estan configurados para emitir la senal de componente estacionario y la senal de componente no estacionario; y
    medios de calculo (270) para el calculo de los coeficientes de filtro del filtro adaptativo (210) sobre la base de la senal de componente estacionario extrafda o la senal de componente no estacionario extrafda, en el que los medios de calculo (270) estan configurados para calcular unos primeros coeficientes de filtro en base a la senal de componente estacionario, y para calcular unos segundos coeficientes de filtro en base a la senal de componente no estacionario, y en el que los medios de calculo estan configurados ademas para determinar los coeficientes de filtro, ya sea sobre la base de los primeros coeficientes del filtro o sobre la base de los segundos coeficientes del filtro, y en el que los medios de calculo (270) estan configurados para determinar los coeficientes de filtro sobre la base de los coeficientes de filtro de los primeros coeficientes de filtro o de los segundos coeficientes de filtro que corresponden a un mayor nivel de atenuacion.
  2. 2. El aparato (200) segun la reivindicacion 1, en el que los medios de extraccion (250) estan configurados para extraer la senal de componente estacionario sobre la base de un promedio de un valor relacionado con la energfa de una senal de paso de banda de la senal de altavoz o de la senal derivada.
  3. 3. El aparato (200) segun la reivindicacion 2, en el que los medios de extraccion (250) estan configurados para realizar el calculo del promedio en forma de un promedio flotante sobre un valor de un bloque de datos actual en el que se basa la senal de paso de banda, y solo sobre valores de al menos un bloque de datos que precede temporalmente el bloque de datos actual.
  4. 4. El aparato (200) segun una de las reivindicaciones 2 o 3, en el que los medios de extraccion (250) estan configurados para realizar el calculo del promedio como un promedio flotante sobre la base de diferentes especificaciones de calculo en dependencia de una comparacion del valor relacionado con la energfa del bloque de datos actual y un valor relacionado con la energfa de un bloque de datos anterior o de un valor de un promedio obtenido previamente.
  5. 5. El aparato (200) segun una de las reivindicaciones 3 o 4, en el que los medios de extraccion (250) estan configurados para realizar un calculo recursivo del promedio flotante sobre la base de una adicion del valor relacionado con la energfa del bloque de datos actual a un valor de un promedio calculado previamente en funcion de un parametro de adicion, siendo el parametro de adicion mas pequeno, en el caso de que el valor relacionado con la energfa del bloque de datos actual sea mayor que el del valor previamente determinado del promedio, que en el caso de que el valor relacionado con la energfa del bloque de datos actual es menor que el valor previamente determinado del promedio.
  6. 6. El aparato (200) segun cualquiera de las reivindicaciones anteriores, en el que los medios de extraccion (250)
    estan configurados para extraer la senal de componente no estacionario sobre la base de una senal de paso de
    banda de la senal de altavoz o de la senal derivada.
  7. 7. El aparato (200) segun cualquiera de las reivindicaciones anteriores, en el que los medios de extraccion (250)
    estan configurados para extraer la senal de componente no estacionario sobre la base de la senal de componente
    estacionario y un filtro de ganancia.
  8. 8. El aparato (200) segun la reivindicacion 7, en el que los medios de extraccion (250) estan configurados de tal manera que el filtro de la ganancia depende de un parametro de control variable o no variable.
  9. 9. El aparato (200) segun la reivindicacion 8, en el que los medios de extraccion (250) estan configurados para determinar el parametro de control del filtro de ganancia sobre la base de una funcion de coherencia basada en la senal de altavoz o en la senal derivada de la senal del altavoz, y en base a la senal del microfono o de una senal derivada de la senal del microfono.
  10. 10. El aparato (200) segun la reivindicacion 9, en el que los medios de extraccion (250) estan configurados para determinar el parametro de control sobre la base de un valor medio de la funcion de coherencia a traves de una pluralidad de senales de paso de banda de la senal del altavoz o de la senal derivada de la senal del altavoz, y de la senal del microfono o de la senal derivada de la senal del microfono.
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
  11. 11. El aparato (200) segun cualquiera de las reivindicaciones anteriores, en el que el aparato (200) comprende ademas unos medios de agrupacion (540) para la agrupacion de una pluralidad de senales de microfono con el fin de obtener una senal de microfono integrada como la senal de microfono o como la senal del microfono derivada.
  12. 12. El aparato (200) segun cualquiera de las reivindicaciones anteriores, en el que los medios de extraccion (250) estan configurados para emitir la senal de componente estacionario y la senal de componente no estacionario, y en el que los medios de calculo (270) estan configurados para calcular unos primeros coeficientes de filtro sobre la base de la senal de componente estacionario, y para calcular unos segundos coeficientes de filtro sobre la base de la senal de componente no estacionario, y en el que los medios de calculo (270) estan configurados ademas para determinar los coeficientes de filtro sobre la base del primer y segundo coeficientes de filtro.
  13. 13. El aparato (200) segun la reivindicacion 12, en el que los medios de extraccion (250) estan configurados para calcular los coeficientes de filtro de tal manera que los coeficientes de filtro corresponden a una conexion en serie de un primer filtro al que corresponden los primeros coeficientes del filtro, y un segundo filtro, al que corresponden los segundos coeficientes del filtro.
  14. 14. El aparato (200) segun cualquiera de las reivindicaciones anteriores, en el que los medios de extraccion (250) estan configurados para extraer la senal de componente estacionario o la senal de componente no estacionario, como senales estimadas.
  15. 15. El aparato (200) segun cualquiera de las reivindicaciones anteriores, en el que los medios de extraccion (250) estan configurados para emitir la senal de componente estacionario y la senal de componente no estacionario.
  16. 16. El aparato (200) segun cualquiera de las reivindicaciones anteriores, que comprende ademas el filtro adaptativo (210) con el fin de filtrar la senal del microfono en base a los coeficientes de filtro.
  17. 17. El aparato (200) segun cualquiera de las reivindicaciones anteriores, que comprende ademas unos medios de agrupacion (540) y una pluralidad de filtros adaptativos (210) con el fin de filtrar al menos dos de las senales del microfono de la pluralidad de senales de microfono sobre la base de los mismos coeficientes de filtro de los medios de calculo (270).
  18. 18. El aparato (200) segun cualquiera de las reivindicaciones anteriores, que comprende ademas unos medios de agrupacion (530) para la agrupacion de una pluralidad de senales de los altavoces con el fin de obtener una senal de altavoz integrada como la senal del altavoz o como la senal derivada de la senal del altavoz.
  19. 19. Un metodo de calculo de coeficientes de filtro para un filtro adaptativo (210) para filtrar una senal de microfono con el fin de suprimir un eco debido a una senal de altavoz, que comprende:
    extraer una senal de componente estacionario o una senal de componente no estacionario de la senal de altavoz o de una senal derivada de la senal de altavoz, en el que se emite la senal de componente estacionario extrafda y la senal de componente no estacionario extrafda; y
    calcular los coeficientes de filtro para el filtro de adaptacion sobre la base de la senal de componente estacionario extrafdo o la senal de componente no estacionario extrafdo, en el que los primeros coeficientes del filtro se calculan sobre la base de la senal de componente estacionario, y los coeficientes de segundo filtro se calculan sobre la base de la senal de componente no estacionario, y en el que los coeficientes del filtro se determinan sobre la base de los primeros coeficientes del filtro o sobre la base de los segundos coeficientes del filtro, en el que los coeficientes del filtro se determinan sobre la base de dichos coeficientes de filtro de los primeros coeficientes de filtro o de los segundos coeficientes de filtro que corresponden a un mayor nivel de atenuacion, y
    en el que, sobre la base de los primeros coeficientes de filtro y los segundos coeficientes del filtro, se emite un conjunto de coeficientes de filtro, que se basan en los primeros coeficientes del filtro o en los segundos coeficientes del filtro.
  20. 20. Un programa que comprende un codigo de programa configurado para realizar el metodo segun la reivindicacion 19, cuando el programa se ejecuta en un procesador.
  21. 21. Un aparato (200) para el calculo de coeficientes de filtro para un filtro adaptativo (210) para filtrar una senal de microfono con el fin de suprimir un eco debido a una senal de altavoz, que comprende:
    medios de extraccion (250) para la extraccion de una senal de componente estacionario o una senal de componente no estacionario de la senal de altavoz o de una senal derivada de la senal de altavoz, en el que los medios de extraccion (250) estan configurados para proporcionar la senal de componente estacionario o la senal de componente no estacionario, asf como una senal de informacion de control que comprende informacion sobre la salida de la senal de componente, y en el que los medios de extraccion (250) estan configurados para emitir la
    senal de componente estacionario o la senal de componente no estacionario de los medios de calculo (270) en funcion de una relacion de un valor relacionado con la energfa de la senal de componente estacionario a un valor relacionado con la energfa de la senal de componente no estacionario, y
    medios de calculo (270) para el calculo de los coeficientes de filtro del filtro adaptativo (210) sobre la base de la 5 senal de componente estacionario extrafda o la senal de componente no estacionario extrafda, en el que los medios de calculo (270) estan configurados para calcular los coeficientes de filtro en la base a la salida de senal por los medios de extraccion (250) o de una senal derivada del mismo, asf como de la informacion incluida en la senal de informacion de control.
ES09705713.7T 2008-01-31 2009-01-16 Aparato y método para calcular coeficientes de filtro para supresión de eco Active ES2585406T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US2500608P 2008-01-31 2008-01-31
US25006 2008-01-31
DE102008039330 2008-08-22
DE102008039330A DE102008039330A1 (de) 2008-01-31 2008-08-22 Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
PCT/EP2009/000270 WO2009095161A1 (en) 2008-01-31 2009-01-16 Apparatus and method for computing filter coefficients for echo suppression

Publications (1)

Publication Number Publication Date
ES2585406T3 true ES2585406T3 (es) 2016-10-05

Family

ID=40847455

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09705713.7T Active ES2585406T3 (es) 2008-01-31 2009-01-16 Aparato y método para calcular coeficientes de filtro para supresión de eco

Country Status (12)

Country Link
US (1) US8462958B2 (es)
EP (1) EP2238590B1 (es)
JP (1) JP4954334B2 (es)
KR (1) KR101169535B1 (es)
CN (1) CN101933088B (es)
AU (1) AU2009210295B9 (es)
CA (1) CA2713450C (es)
DE (1) DE102008039330A1 (es)
ES (1) ES2585406T3 (es)
MX (1) MX2010008372A (es)
TW (1) TWI388190B (es)
WO (1) WO2009095161A1 (es)

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8150052B2 (en) * 2008-10-15 2012-04-03 Hewlett-Packard Development Company, L.P. Integrating acoustic echo cancellation as a subsystem into an existing videoconference and telepresence system
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
CN102893633B (zh) * 2010-05-06 2015-04-15 杜比实验室特许公司 用于便携式媒体回放装置的音频系统均衡化
US9307340B2 (en) 2010-05-06 2016-04-05 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
US9245538B1 (en) * 2010-05-20 2016-01-26 Audience, Inc. Bandwidth enhancement of speech signals assisted by noise reduction
EP2444967A1 (en) * 2010-10-25 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Echo suppression comprising modeling of late reverberation components
WO2012105880A1 (en) * 2011-02-03 2012-08-09 Telefonaktiebolaget L M Ericsson (Publ) Estimation and suppression of harmonic loudspeaker nonlinearities
US9462399B2 (en) 2011-07-01 2016-10-04 Dolby Laboratories Licensing Corporation Audio playback system monitoring
US20130066638A1 (en) * 2011-09-09 2013-03-14 Qnx Software Systems Limited Echo Cancelling-Codec
US8896651B2 (en) * 2011-10-27 2014-11-25 Polycom, Inc. Portable devices as videoconferencing peripherals
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
US8737188B1 (en) * 2012-01-11 2014-05-27 Audience, Inc. Crosstalk cancellation systems and methods
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US9524638B2 (en) * 2012-02-08 2016-12-20 Qualcomm Incorporated Controlling mobile device based on sound identification
JP5897343B2 (ja) * 2012-02-17 2016-03-30 株式会社日立製作所 残響除去パラメータ推定装置及び方法、残響・エコー除去パラメータ推定装置、残響除去装置、残響・エコー除去装置、並びに、残響除去装置オンライン会議システム
CN103325379A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN103516921A (zh) 2012-06-28 2014-01-15 杜比实验室特许公司 通过隐藏音频信号的回声控制
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
JP5296247B1 (ja) * 2012-07-02 2013-09-25 リオン株式会社 音処理装置及びフィードバックキャンセル方法
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9768884B2 (en) * 2012-10-17 2017-09-19 Acacia Communications, Inc. Multi-range frequency-domain compensation of chromatic dispersion
US9318092B2 (en) 2013-01-29 2016-04-19 2236008 Ontario Inc. Noise estimation control system
EP2760024B1 (en) * 2013-01-29 2017-08-02 2236008 Ontario Inc. Noise estimation control
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP6087762B2 (ja) * 2013-08-13 2017-03-01 日本電信電話株式会社 残響抑圧装置とその方法と、プログラムとその記録媒体
GB2515592B (en) * 2013-12-23 2016-11-30 Imagination Tech Ltd Echo path change detector
JP6295722B2 (ja) * 2014-02-28 2018-03-20 沖電気工業株式会社 エコー抑圧装置、プログラム及び方法
JP6349899B2 (ja) * 2014-04-14 2018-07-04 ヤマハ株式会社 放収音装置
US9398374B2 (en) * 2014-08-12 2016-07-19 Cirrus Logic, Inc. Systems and methods for nonlinear echo cancellation
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
US9479650B1 (en) * 2015-05-04 2016-10-25 Captioncall, Llc Methods and devices for updating filter coefficients during echo cancellation
US10504501B2 (en) 2016-02-02 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive suppression for removing nuisance audio
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US10743101B2 (en) 2016-02-22 2020-08-11 Sonos, Inc. Content mixing
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
KR20170142001A (ko) * 2016-06-16 2017-12-27 삼성전자주식회사 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체
US9922637B2 (en) 2016-07-11 2018-03-20 Microsoft Technology Licensing, Llc Microphone noise suppression for computing device
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
CA2985433C (en) * 2016-11-14 2019-03-19 Symroc Business And Project Management Ltd. Vibration-analysis system and method therefor
CN110301142B (zh) * 2017-02-24 2021-05-14 Jvc建伍株式会社 滤波器生成装置、滤波器生成方法以及存储介质
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
WO2018230062A1 (ja) * 2017-06-12 2018-12-20 株式会社オーディオテクニカ 音声信号処理装置と音声信号処理方法と音声信号処理プログラム
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
CN107644649B (zh) * 2017-09-13 2022-06-03 黄河科技学院 一种信号处理方法
US10446165B2 (en) * 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
US11017798B2 (en) 2017-12-29 2021-05-25 Harman Becker Automotive Systems Gmbh Dynamic noise suppression and operations for noisy speech signals
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
EP3796629B1 (en) * 2019-05-22 2022-08-31 Shenzhen Goodix Technology Co., Ltd. Double talk detection method, double talk detection device and echo cancellation system
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
CN113160782B (zh) * 2020-01-22 2022-11-01 百度在线网络技术(北京)有限公司 音频处理的方法、装置、电子设备及可读存储介质
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
CN115280412A (zh) 2020-03-17 2022-11-01 杜比实验室特许公司 声学回声消除器中回声路径改变的宽带适应性改变
CN115315935A (zh) 2020-03-23 2022-11-08 杜比实验室特许公司 回声残余抑制
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US12387716B2 (en) 2020-06-08 2025-08-12 Sonos, Inc. Wakewordless voice quickstarts
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US12283269B2 (en) 2020-10-16 2025-04-22 Sonos, Inc. Intent inference in audiovisual communication sessions
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
WO2022103290A1 (en) 2020-11-12 2022-05-19 "Stc"-Innovations Limited" Method for automatic quality evaluation of speech signals using neural networks for selecting a channel in multimicrophone systems
CN113345456B (zh) * 2021-05-31 2023-06-06 北京小米移动软件有限公司 回声分离方法、装置及存储介质
US12327556B2 (en) 2021-09-30 2025-06-10 Sonos, Inc. Enabling and disabling microphones and voice assistants
EP4564154A3 (en) 2021-09-30 2025-07-23 Sonos Inc. Conflict management for wake-word detection processes
US20250159083A1 (en) * 2021-09-30 2025-05-15 Dolby Laboratories Licensing Corporation Robust foreground/background filtering control for acoustic echo cancellation
US12327549B2 (en) 2022-02-09 2025-06-10 Sonos, Inc. Gatekeeping for voice intent processing
US12363260B1 (en) 2023-04-27 2025-07-15 Zoom Communications, Inc. Correcting audio feedback using contextual information

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61242127A (ja) * 1985-04-19 1986-10-28 Fujitsu Ltd エコ−キヤンセラ
JPS62110336A (ja) * 1985-11-08 1987-05-21 Matsushita Electric Ind Co Ltd エコ−キヤンセル装置
JPH01129623A (ja) * 1987-11-16 1989-05-22 Hitachi Ltd エコーキヤンセラ
JPH04335721A (ja) * 1991-05-13 1992-11-24 Matsushita Electric Ind Co Ltd エコーキャンセラー装置
JPH0832494A (ja) * 1994-07-13 1996-02-02 Mitsubishi Electric Corp ハンズフリー通話装置
JP2947093B2 (ja) * 1994-11-02 1999-09-13 日本電気株式会社 適応フィルタによるシステム同定の方法および装置
US5610909A (en) 1995-05-31 1997-03-11 Lucent Technologies Inc. Multistage echo canceler including time variation compensation
US5872728A (en) * 1996-06-20 1999-02-16 International Business Machines Corporation Process for computing the coefficients of an adaptive filter in an echo-cancellor
US5930366A (en) * 1997-08-29 1999-07-27 Telefonaktiebolaget L M Ericsson Synchronization to a base station and code acquisition within a spread spectrum communication system
US6442275B1 (en) * 1998-09-17 2002-08-27 Lucent Technologies Inc. Echo canceler including subband echo suppressor
US6590881B1 (en) 1998-12-04 2003-07-08 Qualcomm, Incorporated Method and apparatus for providing wireless communication system synchronization
FR2791492B1 (fr) * 1999-03-26 2001-06-08 France Telecom Procede et dispositif d'identification adaptative, et annuleur d'echo adaptatif mettant en oeuvre un tel procede
US6665645B1 (en) * 1999-07-28 2003-12-16 Matsushita Electric Industrial Co., Ltd. Speech recognition apparatus for AV equipment
JP4345208B2 (ja) * 2000-08-25 2009-10-14 沖電気工業株式会社 反響及び雑音除去装置
JP3507020B2 (ja) * 2000-09-08 2004-03-15 日本電信電話株式会社 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
JP2002111552A (ja) * 2000-09-29 2002-04-12 Fujitsu Ltd 音響エコーキャンセラ及びハンズフリー電話機
DE60120233D1 (de) * 2001-06-11 2006-07-06 Lear Automotive Eeds Spain Verfahren und system zum unterdrücken von echos und geräuschen in umgebungen unter variablen akustischen und stark rückgekoppelten bedingungen
US20050249347A1 (en) * 2002-06-19 2005-11-10 Koninklijke Philips Electronics N.V. Non stationary echo canceller
US7889804B2 (en) * 2003-05-30 2011-02-15 Mohammad Jaber Borran Partially coherent constellations for multiple-antenna systems
JP4403776B2 (ja) * 2003-11-05 2010-01-27 沖電気工業株式会社 エコーキャンセラ
ATE373302T1 (de) * 2004-05-14 2007-09-15 Loquendo Spa Rauschminderung für die automatische spracherkennung
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
EP1715669A1 (en) * 2005-04-19 2006-10-25 Ecole Polytechnique Federale De Lausanne (Epfl) A method for removing echo in an audio signal
US8594320B2 (en) 2005-04-19 2013-11-26 (Epfl) Ecole Polytechnique Federale De Lausanne Hybrid echo and noise suppression method and device in a multi-channel audio signal
EP1879181B1 (en) 2006-07-11 2014-05-21 Nuance Communications, Inc. Method for compensation audio signal components in a vehicle communication system and system therefor

Also Published As

Publication number Publication date
EP2238590A1 (en) 2010-10-13
CA2713450C (en) 2014-07-29
TW200948030A (en) 2009-11-16
AU2009210295A1 (en) 2009-08-06
CN101933088B (zh) 2016-05-11
BRPI0905794A2 (pt) 2020-08-11
TWI388190B (zh) 2013-03-01
US8462958B2 (en) 2013-06-11
RU2010132161A (ru) 2012-02-10
JP2011514706A (ja) 2011-05-06
CA2713450A1 (en) 2009-08-06
KR20100114059A (ko) 2010-10-22
DE102008039330A1 (de) 2009-08-13
KR101169535B1 (ko) 2012-07-31
CN101933088A (zh) 2010-12-29
MX2010008372A (es) 2010-08-23
JP4954334B2 (ja) 2012-06-13
WO2009095161A1 (en) 2009-08-06
HK1149622A1 (zh) 2011-10-07
EP2238590B1 (en) 2016-06-01
AU2009210295B2 (en) 2013-05-02
US20110019833A1 (en) 2011-01-27
AU2009210295B9 (en) 2014-01-30

Similar Documents

Publication Publication Date Title
ES2585406T3 (es) Aparato y método para calcular coeficientes de filtro para supresión de eco
CA2815577C (en) Echo suppression comprising modeling of late reverberation components
CA2713127C (en) Apparatus and method for computing control information for an echo suppression filter and apparatus and method for computing a delay value
ES2384084T3 (es) Método y aparato para estimar la energía de banda alta en un sistema de extensión de ancho de banda
Ihle et al. Integration of noise reduction and echo attenuation for handset-free communication
AU2011322792B9 (en) Echo suppression comprising modeling of late reverberation components
BRPI0905794B1 (pt) Equipamento e método para computar coeficientes de filtro para supressão de eco
RU2485607C2 (ru) Устройство и способ расчета коэффициентов фильтра эхоподавления
HK1149622B (en) Apparatus and method for computing filter coefficients for echo suppression
HK1189312B (en) Echo suppression comprising modeling of late reverberation components
Benesty et al. Some Practical Aspects of Stereo Teleconferencing System Implementation