PT2057835E - Método de redução do eco acústico residual após supressão de eco num dispositivo ''mãos livres'' - Google Patents

Método de redução do eco acústico residual após supressão de eco num dispositivo ''mãos livres'' Download PDF

Info

Publication number
PT2057835E
PT2057835E PT07823413T PT07823413T PT2057835E PT 2057835 E PT2057835 E PT 2057835E PT 07823413 T PT07823413 T PT 07823413T PT 07823413 T PT07823413 T PT 07823413T PT 2057835 E PT2057835 E PT 2057835E
Authority
PT
Portugal
Prior art keywords
echo
signal
noise
residual echo
power
Prior art date
Application number
PT07823413T
Other languages
English (en)
Inventor
Henri Seydoux
Original Assignee
Parrot
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Parrot filed Critical Parrot
Publication of PT2057835E publication Critical patent/PT2057835E/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

ΡΕ2057835 - 1 -
DESCRIÇÃO "MÉTODO DE REDUÇÃO DO ECO ACÚSTICO RESIDUAL APÓS SUPRESSÃO DE ECO NUM DISPOSITIVO "MÃOS LIVRES" A invenção refere-se, de modo geral, à redução de eco nos dispositivos que utilizam sinais áudio captados por um microfone, por exemplo, os telefones, adaptadores de tipo "mãos livres" e dispositivos análogos.
Em particular, a invenção pode ser aplicada, de um modo vantajoso, a um dispositivo "mãos livres" utilizável em associação com um telefone portátil, nomeadamente um dispositivo "mãos livres" autónomo, adaptável de modo amovível a um veículo automóvel.
Mais precisamente, o eco pode resultar de dois fenómenos, de naturezas diferentes. 0 primeiro, é o eco dito "eco de linha", restringido à via de transmissão e para o qual se conhecem diversos métodos de filtragem; o segundo é denominado "eco acústico", eco realmente captado pelo microfone e devido ao fenómeno de reverberação do ambiente do locutor, tipicamente, o compartimento onde se encontra ou o habitáculo de um veículo. É à eliminação deste último tipo de eco (eco acústico) que a presente invenção se refere mais particularmente.
Este eco acústico constitui um elemento perturbador essencial do dispositivo que pode, -2- ΡΕ2057835 frequentemente, tornar incompreensíveis para 0 locutor distante (o que está na outra extremidade da via de transmissão do sinal telefónico) palavras do locutor próximo (aquele cujas palavras são afogadas no eco acústico.
Estes aparelhos compreendem um microfone sensível destinado a captar a voz do locutor próximo e um altifalante relativamente potente que reproduz a voz do locutor distante durante uma conversação telefónica. No entanto, por acoplamento acústico entre estes dois transdutores, o microfone capta, não somente a voz do locutor próxima, mas igualmente o ruído circundante e, sobretudo, o eco acústico, ou seja a reverberação do som reproduzido pelo altifalante - e isto a um nível ainda mais elevado quando o microfone e altifalante estão próximos e quando a potência acústica restituída pelo altifalante é elevada. Tal é, tipicamente, o caso dos sistemas incorporados num veículo automóvel, onde o nível sonoro do altifalante é relativamente elevado para cobrir os ruídos ambientais.
Além disso, vários destes dispositivos são realizados na forma de aparelhos autónomos, amovíveis, compreendendo numa mesma caixa, simultaneamente, o microfone e o altifalante, bem como os botões de comando: a proximidade (alguns centímetros) entre altifalante e microfone provoca, então, um nível de eco acústico considerável, tipicamente, cerca de vinte vezes mais elevado que o sinal de voz produzido pelo locutor próximo.
Além disso, para além do eco acústico, a distância considerável entre microfone e locutor provoca, -3- ΡΕ2057835 nestes dispositivos, um nível relativo de ruído elevado no sinal captado, que torna a difícil extracção do sinal útil submerso no eco e no ruído. Este ruído apresenta ainda características espectrais não estacionárias, ou seja, que evoluem de modo imprevisível em função das condições de condução: passagem sobre calçadas deformadas ou pavimentadas, auto-rádio em funcionamento, etc., o que torna ainda mais difícil o desenvolvimento de algoritmos apropriados de tratamento do sinal.
Por estas razões, a eliminação do eco acústico é particularmente difícil, nomeadamente em ambientes muito ruidosos, típicos dos veículos automóveis, onde o ruído ambiente é adicionado aos sinais de voz e de eco captados pelo microfone.
Importa, igualmente, que o tratamento de eliminação do eco não introduza distorção sensível no sinal útil e não gere, ou o menos possível, "ruído musical", que é um tipo de ruído estridente particularmente perceptível e desagradável em termos de audição.
Os dispositivos conhecidos mais eficientes implementam, nesses casos: (i) um módulo de anulação de eco, (ii) um módulo de supressão de eco e (iii) um módulo de redução de ruído. 0 módulo denominado de "anulação de eco" (echo cancellation) ou AEC (Acoustic Echo Canceller) executa um algoritmo que modela o acoplamento acústico microfone/altifalante por uma transformação linear entre o sinal do locutor distante (ou seja o sinal destinado a ser reproduzido pelo altifalante) e o eco captado pelo -4- ΡΕ2057835 microfone. Esta transformação define, dinamicamente, um filtro adaptativo, que é, depois, aplicado ao sinal incidente proveniente do locutor distante. 0 resultado desta filtragem é, depois, subtraído do sinal recolhido pelo microfone, o que resulta na anulação da maior parte do eco acústico. 0 módulo denominado de "supressão de eco" (echo supression) tem a função de suprimir o eco residual presente após tratamento pelo módulo de anulação de eco, atenuando este eco residual até ao nível do ruído de fundo. Ao contrário da anulação de eco que é realizada essencialmente por subtracção de sinais, a supressão de eco funciona por um controlo do ganho. 0 inconveniente é que a redução do ganho também é aplicável, por conseguinte, à componente útil do sinal captado pelo microfone (voz do locutor próximo ) , dado que este ganho é aplicado indistintamente ao sinal incidente, considerado na sua globalidade.
Por último, o módulo de redução de ruído (noise reduction) visa reduzir o ruído de fundo captado pelo microfone preservando, ao mesmo tempo, a voz do locutor próximo. Esta redução de ruído é realizada, de um modo vantajoso, de modo dinâmico e adaptativo, discriminando os períodos de silêncio da conversação para aí identificar o ruído e caracterizar o espectro deste, realizando, em seguida, uma insonorização selectiva com uma atenuação adaptada. 0 documento WO-A-OO/25441 descreve um dispositivo que implementa os diversos módulos descritos acima. -5- ΡΕ2057835
Os dispositivos propostos até agora não são, no entanto, totalmente satisfatórios nas configurações de dupla voz, em particular, o caso dos aparelhos em que a distância entre altifalante e microfone é muito pequena em comparação com a distância entre locutor próximo e microfone, pelo que, como indicado acima, quando o locutor distante fala, o nível do eco produzido é consideravelmente superior ao nível médio da voz do locutor próximo.
Além disso, o módulo de anulação de eco, que é baseado num filtro linear adaptativo, não modela perfeitamente o acoplamento e não considera as não-linearidades introduzidas, nomeadamente ao nível do amplificador e do altifalante, nem o ruído de fundo eléctrico ao nível dos circuitos de conversão analógica/digital. Estes diversos fenómenos geram uma instabilidade no algoritmo de anulação de eco, que tem que se readaptar num tempo muito curto. 0 eco residual, após tratamento pelo módulo de anulação de eco, pode, assim, atingir um nível relativamente elevado, daí, a importância da tarefa executada pelo módulo de supressão deste eco residual. A dificuldade para conceber um módulo de anulação de eco eficiente, combinada com a necessidade de um tratamento de redução do eco residual "por um pós-processador", é evocada, em particular por C. Faller e J. Chen, Suppressing Acoustic Echo in a Spectral Envelope Space, IEEE Transactions on Speech and Audio Processing, Vol. 13, N° 5, pp. 1048-1062, Set. 2005.
Para evitar as dificuldades supracitadas e para -6- ΡΕ2057835 reduzir a complexidade do algoritmo de redução do eco acústico, estes autores preconizam uma alternativa à técnica de anulação de eco por filtro adaptativo linear: em vez de tentar modelar o acoplamento acústico, o algoritmo analisa a envolvente espectral do sinal de eco e aplica, directamente, um tratamento de modificação espectral que tem em conta, nomeadamente, a selectividade em termos de frequência do sistema auditivo humano. A técnica proposta por este documento apresenta, contudo, sérias limitações no caso de sinais cujo nível de eco é muito elevado e em ambientes muito ruidosos, típicos dos adaptadores mãos livres utilizados num habitáculo de automóvel, para os quais as técnicas que implementam uma modelização do acoplamento acústico com filtro linear adaptativo se revelam, claramente, mais eficientes, com uma melhor eliminação do eco e uma menor distorção do sinal de voz .
Um dos objectivos da invenção é propor um método melhorado de supressão de eco do tipo supracitado, ou seja, utilizável em combinação com um módulo de anulação de eco com filtro adaptativo, que permita preservar, na medida do possível, as componentes úteis do sinal reduzindo, ao mesmo tempo, de modo mais acentuado, a componente de eco residual. E isto sem introduzir distorção sensível no sinal útil e sem gerar, ou o menos possível, ruído musical parasita.
Um outro objectivo da invenção é propor um método melhorado de supressão de eco que possa, igualmente, assegurar a redução do ruído de fundo, discriminando a componente de ruído e a componente de eco residual no sinal -7 - ΡΕ2057835 captado, de modo a determinar a que, tendo em conta o seu espectro, apresenta o carácter mais prejudicial em relação à componente útil de voz e aplicar-lhe, prioritariamente, o tratamento de supressão. 0 método da invenção é um método de tipo conhecido de acordo com o documento WO-A-OO/25441 supracitado, ou seja, compreendendo, no domínio temporal, um tratamento de anulação de eco que funciona por subtracção, ao sinal captado, de um sinal de referência emitido por um circuito adaptativo de modelização do referido acoplamento acústico. 0 método compreende ainda, no domínio da frequência e ao longo de tramas sucessivas do sinal, um tratamento de supressão do eco residual subsistente após execução do tratamento de anulação de eco, e um tratamento de redução do ruído presente no sinal após execução do tratamento de anulação de eco. 0 tratamento no domínio da frequência de supressão do eco residual compreende uma estimativa dos valores respectivos da potência do eco residual ao longo de uma pluralidade de bandas de frequências definidas para tramas sucessivas do sinal, bem como o cálculo e a aplicação de um ganho variável característico de cada banda de frequência e de cada trama, sendo o ganho respectivo tanto mais fraco quanto, para a banda de frequência considerada, a potência relativa estimada do eco residual é elevada e vice-versa.
De modo característico, de acordo com um primeiro aspecto da invenção, o tratamento compreende ainda, para cada banda de frequências e para cada trama, uma estimativa a priori de valores respectivos da potência do ruído -8- ΡΕ2057835 ambiente presente no sinal captado e uma comparação dos níveis relativos da potência do ruído e da potência do eco residual no sinal captado. 0 cálculo do referido ganho variável é, depois, realizado em função da potência relativa estimada do eco residual, quando o nível deste último é superior ao do ruído, e em função da potência relativa estimada do ruído no caso contrário.
De preferência e de acordo com um segundo aspecto da invenção, o método compreende uma estimativa de uma probabilidade de presença/ausência de voz e uma ponderação, pela probabilidade estimada de presença/ausência de voz, da potência relativa estimada do eco residual, sendo o valor da potência tanto mais reduzido por esta ponderação quanto a probabilidade de voz é fraca e vice-versa.
Numa forma de realização vantajosa, a potência relativa estimada do eco residual é dada, para a banda de frequências k definida para a trama 1, pela expressão:
Puissance _ Ech o _res(k,l) |φ(*,/).*(*.θΓ E\x(kjf\ em que: E{·} E(k,1) X(k,l) representa o valor esperado matemático, é a transformada de Fourier discreta do sinal captado após subtracção do sinal de referência pelo tratamento de anulação de eco, é a transformada de Fourier discreta do sinal de referência utilizado para o tratamento de anulação de eco, e qref. (k,l) representa a probabilidade de presença de voz. -9- ΡΕ2057835 0 cálculo do ganho variável pode ser, igualmente, realizado em função de uma estimativa a posteriori de valores respectivos da potência do eco residual no sinal captado, e isto, tanto no caso de o nivel do eco residual ser superior ao do ruido como no caso contrário.
Irá, agora, descrever-se um exemplo de realização da invenção recorrendo aos desenhos anexos. A figura 1 é um esquema geral que mostra os diferentes andares implicados no tratamento do sinal. A figura 2 é um esquema mais detalhado que mostra os diferentes blocos funcionais implicados, ao mesmo tempo, no módulo de anulação de eco e no módulo de redução de ruído e de supressão de eco residual combinados.
No que se refere à figura 1, ir-se-á, em primeiro lugar, descrever a estrutura geral de um dispositivo "mãos livres" que, de um modo conhecido per se, compreende meios de anulação de eco, redução de eco e redução do ruido.
Este dispositivo está destinado a suportar uma conversação telefónica entre duas pessoas, isto é, um locutor 10 próximo e um locutor 12 distante. O locutor 10 próximo é o que se encontra na proximidade do dispositivo 14 "mãos livres". O locutor 12 distante é aquele com o qual o locutor próximo está em conversação telefónica. O dispositivo 14 é, tipicamente, um dispositivo instalado num veiculo automóvel, de um modo fixo ou amovível. Possui um altifalante 16, destinado a reproduzir -10- ΡΕ2057835 a voz do locutor distante, e um microfone 18 destinado a captar a voz do locutor 10 próximo. O dispositivo compreende, igualmente, meios de interface, esquematizados em 20, para a transmissão bidireccional dos sinais numa rede telefónica, por exemplo (mas de modo não limitativo) uma interface sem fios de tipo Bluetooth (marca registada da Bluetooth SIG, Inc) ou outra que permita acoplar o dispositivo 14 ao telefone celular portátil do locutor próximo, por meio do qual este último está, o próprio, em comunicação radiotelefónica com o locutor distante. 0 sinal incidente recebido na entrada E do dispositivo 14, que compreende a componente de voz 22 do locutor 12 distante, é aplicado a um conversor 28 digital/analógico e, depois, à entrada de um amplificador 30 áudio que reproduz o sinal no altifalante 16. O microfone 18, no seu caso, capta um sinal acústico que será uma combinação (i) da voz 32 do locutor 10 próximo, (ii) do ruido 34 ambiente que reina no ambiente deste último (por exemplo, no habitáculo do veiculo automóvel) e (iii) do sinal 36 reproduzido pelo altifalante 16. O sinal 36 é um sinal de eco indesejável do ponto de vista do microfone 18. Como indicado acima, tendo em conta os níveis de funcionamento do amplificador 30 e do acoplamento importante existente na proximidade entre altifalante 16 e microfone 18, quando o locutor 12 distante fala, o nível do sinal 36 pode atingir vinte vezes o do sinal de voz 32 do locutor 10 próximo. A redução do eco acústico é realizada, após -11- ΡΕ2057835 digitalização do sinal do microfone 18 por meio do andar 38 de conversão analógica/digital, através de três tratamentos sucessivos: (i) anulação de eco 40, (ii) supressão de eco 42 e (iii) redução de ruido 44.
Estes tratamentos são executados sob a forma de algoritmos apropriados executados por um microcontrolador ou um processador de tratamento dos sinais incorporado no dispositivo 14. Embora, para a clareza da exposição, estes três tratamentos sejam apresentados sob a forma de módulos distintos, utilizam elementos comuns e correspondem, com efeito, a uma pluralidade de funções globalmente executadas por um mesmo "software".
Os diferentes blocos funcionais deste "software", que realizam um tratamento do sinal, ao mesmo tempo, no domínio temporal (anulação de eco 40) e no domínio da frequência (supressão de eco 42 e redução do ruído 44) serão expostos, em seguida e em mais pormenor, recorrendo à figura 2. O primeiro módulo é o módulo 40 de anulação de eco. Não tem, essencialmente, efeito sobre a voz do locutor 10 próximo: a voz do locutor próximo fica, por conseguinte, intacta após a anulação de eco 40. A anulação de eco consiste em definir, de modo dinâmico, um filtro de compensação que recebe, na entrada, um sinal 46 de referência proveniente do locutor distante (sinal na entrada E do dispositivo) de modo a subtrair do sinal 48 captado pelo microfone 18 um sinal adaptado representativo do sinal recebido, para emitir, na saída, um sinal desprovido do eco parasita. O filtro linear pode ser caracterizado por meio de um algoritmo de supressão de eco, -12- ΡΕ2057835 tal como um algoritmo de tipo APA (Affin Projection Algorithm) , ou de tipo LMS (Least Mean Squares) ou NLMS (Normalized LMS).
Este algoritmo adaptativo aperfeiçoado de tipo APA está, por exemplo, descrito no documento FR-A-2 792 146 (Parrot SA).
No entanto, por várias razões (identificação do filtro imperfeita, modelização linear aproximativa, presença de não-linearidades,...) é frequente que o eco reste audivel após tratamento pelo módulo 40 de anulação de eco. O módulo 42 de supressão de eco tem como objectivo suprimir este eco residual, atenuando o sinal de eco até ao nível do ruído de fundo. A invenção refere-se, em particular, a esta redução de eco residual, cujo modo de funcionamento será exposto em seguida.
Por último, o módulo 44 de redução do ruído tem como função reduzir o ruído de fundo 34 captado pelo microfone, preservando, ao mesmo tempo, a voz 32 do locutor próximo. O tratamento de insonorização propriamente dito é realizado no domínio da frequência, sendo a passagem entre domínios temporal e de frequência realizada por meio de transformadas de Fourier rápidas com divisão em janelas e sobreposição. A insonorização implica uma estimativa de ruído e um cálculo de ganho para cada banda de frequência: durante os períodos identificados como silêncios, o ruído -13- ΡΕ2057835 captado é analisado nas suas diferentes componentes de frequência de modo a determinar a energia das componentes de frequência mais ruidosas e aplicar, de seguida, ao sinal ruidoso, um ganho fraco, deixando, ao mesmo tempo, intactas as componentes pouco ou não ruidosas. Os valores de ganho são baseados em modelos estatísticos da voz e do ruído e na estimativa de parâmetros destes modelos. 0 sinal assim tratado, desprovido do seu eco e insonorizado, é, por fim, emitido pela saída S do dispositivo, para transmissão ao locutor distante pela interface 20. A invenção propõe uma nova técnica de supressão do eco residual, mais eficiente que as técnicas empregadas até agora. Estas técnicas apresentavam, com efeito, diversas limitações, nomeadamente quando o eco é dificilmente previsível e pode atingir níveis máximos muito elevados devido, nomeadamente, à proximidade material entre microfone e altifalante. O princípio básico do supressor de eco residual da invenção consiste em utilizar uma técnica comparável à utilizada para a redução do ruído. Por outras palavras, assimila-se o eco residual a um ruído e aplica-se-lhe um tratamento de subtracção espectral e de cálculo de um ganho óptimo em cada uma das componentes de frequência. A supressão de eco residual de acordo com a invenção consiste, por conseguinte, para uma componente de frequência k e uma trama (temporal) indexada 1, em calcular e aplicar um ganho G Echo res(k, 1) que será : -14- ΡΕ2057835 pequeno quando as componentes de frequência contêm muito eco residual, e próximo da unidade, ou igual à unidade, quando as componentes de frequência não contêm, ou contêm pouco, eco residual.
Este tratamento tem, como efeito, diminuir a energia das componentes de frequência onde o eco residual é importante e deixar intactas as que não o contêm.
Para poder calcular o ganho, é necessário ter uma estimativa das relações sinais-ruido a priori e a posteriori, necessitando as mesmas de conhecer a potência do eco residual. A invenção propõe o método seguinte, com as notações seguintes: y(n) e (n) echo_res (n) s (n) η (n) x(n) n h sinal captado pelo microfone (sinal 48), sinal captado, do qual se subtraiu o eco estimado, eco residual (após o tratamento de anulação de eco), sinal de voz do locutor próximo, sinal de ruido do ambiente do locutor próximo, sinal de referência (sinal 46 utilizado para o tratamento de anulação de eco), amostra corrente, resposta de impulso real (incógnita) da parte linear do acoplamento entre o altifalante e o microfone, ΡΕ2057835 -15- h exprime-se resposta de impulso estimada, actualizada através de métodos adaptativos. representa o produto de convolução Com as notações precedentes, o sinal captado sob a forma: y(n) - s(n) + echo(n) + n(«). (1)
Negligenciando a parte não linear do acoplamento, obtém-se a relação: y(n) = j(n) + h ® x(/i) + «(«) . (2)
Do mesmo modo, é possível exprimir o sinal captado do qual foi subtraído o eco estimado: (3) e(n) = j(«) + (A - A) ® jc(/i) + n(n).
Utilizando a transformada de Fourier discreta da expressão (3), vem: E{k,l) = S(k,l)+a(k,l).X(k,l) + N(k,l), (4) representando k e 1, respectivamente, a componente de frequência (banda de frequências) e o número da trama.
Isto leva a supor que, para cada banda de frequência k, o eco residual é proporcional ao sinal de referência, correspondendo o parâmetro α (k,1) a uma atenuação. Tudo se passa como se o eco residual fosse igual à referência, atenuada de α (k, 1). -16- ΡΕ2057835
Se se multiplicar (4) por X{k,l) e se se tomar o valor esperado, indicado por E{·}: φ(Α,/).Χ(Μ)} = {S(*,/)JT(*,0}+ E\a(kJ)JC(kJ)JC(k,l)}+ E{N(k,l).X(k,l)}{5)
Supondo que α (k, 1) seja independente da trama considerada, ou seja, que se tem α (k, 1) = α (k). Supondo ainda que as variáveis S(k, 1) e X (k, 1) e as variáveis N(k, 1) e X{k, 1) não estão correlacionadas. Supondo, igualmente, que a sua média é nula, hipótese não restritiva para sinais de voz e do ruído. Obtém-se a expressão simplificada (6): E{E{kJ).X(k,l)}=a(k)£{\X(kJ)f\. (6) É doravante possível definir uma estimativa da potência do eco residual.
Note-se Esp_EX {k, 1) = E {E{k, 1) . X {k, 1)}.
Esp_EX(k, 1) é obtido por alisamento da trama precedente:
Esp _ EX(k, l) = (1 - λ).Esp _ EX{k, /-1) + k.X(k, l).E{k, l), sendo λ sendo o factor de alisamento. A partir de onde: ΡΕ2057835 -17- a(kj)
Esp EX(k,l)
Como Echo res(k, 1) = a (k, 1). X(k, 1) , vem:
Puissance _ Echo _ res(k,l) = l)2.X(k,l).X(k, /)}
Puissance _ Echo _ res(k, /) =
De onde: (7)
Puissance _ Echo _ res(kj) A presença de um ruído de fundo no sinal de referência X (devido ao ruído ambiente captado no lado do locutor distante e ao ruído introduzido pela via de transmissão) implica a estimativa de um eco residual, mesmo quando o locutor distante não fala, porque o valor esperado no numerador não pode ser realmente nulo. Contudo, o eco residual efectivo introduzido por este ruído de fundo no lado do locutor distante não é incomodativo.
Como o processo de supressão de eco residual pelo método proposto provoca uma ligeira distorção da voz, é preferível não sobrestimar demasiado o eco residual quando isso não for necessário. É porque, na prática, é desejável ponderar a expressão (7) pela probabilidade de presença de -18- ΡΕ2057835 voz, que vale (1-probabilidade de ausência). A expressão passa a ser:
Puissance _ Echo _ res{k, l) |£{ε(Μ).ΛΓ(Μ)ίΓ—ifíwip]- (8) onde <jref. (k, 1) representa a probabilidade de presença de voz no sinal de referência, para a frequência k e trama 1.
Obtém-se assim uma estimativa da potência do eco residual que será utilizada, de seguida, no cálculo das relações sinais-eco a priori e a posteriori.
De acordo com um outro aspecto, a invenção propõe calcular um ganho global, em vez de calcular dois ganhos separadamente após tratamento pelo módulo de anulação de eco (um para a supressão do eco residual, função aplicada pelo módulo 42, e o outro para a redução do ruido, função aplicada pelo módulo 44).
Este ganho global, indicado por G (k, 1), terá em conta, simultaneamente, para uma banda de frequência k e uma trama 1, a presença do ruido e a presença do eco residual. A figura 2 ilustra as diferentes funções utilizadas para o cálculo deste ganho G(k, 1). 0 principio básico deste tratamento é fundado sobre os trabalhos descritos por: [1] Y. Ephraim e D. Malah, Speech Enhancement using a Minimum Mean-Square Error -19- ΡΕ2057835
Short-Time Spectral Amplitude Estimator, IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-32, N° 6, pp. 1109-1121, Dez. 1984, e [2] Y. Ephraim e D. Malah, Speech Enhancement using a Minimum Mean-Square Error Log-Spectral Amplitude Estimator, IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-33, N° 2, pp. 443-445, Abril 1985.
Como indicado acima, a invenção propõe utilizar estas técnicas, inicialmente concebidas para a insonorização, para a supressão do eco residual após anulação de eco.
Essencialmente, o sinal contendo o eco residual é analisado em componentes de frequência independentes por uma transformada de Fourier discreta. Um ganho óptimo é calculado e aplicado a cada uma destas componentes e, depois, o sinal assim tratado é recombinado no domínio temporal. Em [1], o ganho aplicado é denominado "ganho STSA" (Short-Time Spectral Amplitude) e permite minimizar a distância quadrática média entre o sinal estimado (à saída do algoritmo) e o sinal de voz original (não ruidoso) . Em [2], a aplicação de um ganho denominado "ganho LSA" (Log-Spectral Amplitude) permite minimizar a distância quadrática média entre o logaritmo da amplitude do sinal estimado e o logaritmo da amplitude do sinal de voz original. Este segundo critério mostra-se superior ao primeiro, porque a distância escolhida é melhor adequada ao comportamento do ouvido humano e dá, por conseguinte e qualitativamente, melhores resultados.
Em todos os casos, a ideia essencial é diminuir a energia das componentes de frequência muito parasitadas aplicando-lhes um ganho pequeno e deixando, ao mesmo tempo, -20- ΡΕ2057835 intactas (pela aplicação de um ganho igual a 1) as que são pouco ou nada parasitadas. A aplicação deste tratamento permite calcular um valor G(k, 1) para o ganho LSA. Um algoritmo de tipo "OM-LSA" (Optimally-Modified Log-Spectral Amplitude), permite melhorar o cálculo do ganho LSA a aplicar, ponderando-o pela probabilidade condicional de presença de voz, de acordo com uma técnica descrita nomeadamente por: [3] I. Cohen, Óptimal Speech Enhancement Under Signal Presence Uncertainty Using Log-Spectral Amplitude Estimator, IEEE Signal Processing Letters, Vol. 9, N° 4, Abril 2002.
Mais precisamente, como ilustrado na figura 2, o tratamento é realizado a partir, por um lado, do sinal 48 captado pelo microfone após anulação de eco pelo módulo 40 (AEC, Acoustic Echo Canceller) e, por outro lado, a partir do sinal 46 de referência representativo do sinal reproduzido pelo altifalante. A passagem para o dominio da frequência destes dois sinais 46, 48 é obtida por uma transformação de Fourier rápida FFT (blocos 50, 50').
Para a insonorizaçao, o sinal é submetido a um tratamento, tal como descrito nas referências [1] e [2], com estimativa da potência do ruido nas diferentes bandas de frequências e para uma trama de sinal dada (bloco 52) e determinação de uma relação sinal-ruido a priori (bloco 54) . Este sinal permite, igualmente, calcular uma probabilidade de ausência de voz (bloco 56) . Um tratamento por um algoritmo de procura dos minimos quadrados LSA -21- ΡΕ2057835 (bloco 58) permite, por realimentação, obter uma relação sinal-ruído a posteriori (bloco 54) após ponderação pela probabilidade de presença de voz condicional (bloco 60) . Obtém-se, assim, para cada componente de frequência (banda de frequência) k de cada trama indexada 1, um valor de relação sinal-ruído a priori e um valor de sinal-ruído a posteriori. Para mais detalhes sobre estes algoritmos de redução de eco, pode recorrer-se às referências [1] e [2] supracitadas. A referência [3] supracitada indica, no seu caso, o modo de ponderar o ganho pela probabilidade condicional de presença de voz.
Se se designar as relações sinal-ruído a priori e sinal-ruído a posteriori, respectivamente, por SNR_ prio(k, 1) e SNR post(k, 1), a referência [3] dá, para a expressão do ganho G_bruit(k, 1), em função dos parâmetros ξ (k, 1) = SNR_prio(k, 1) e γ (k, 1) = SNR_ post(k, 1) : #(M)É(M) +1
(9) com HM) £(*,/) ·/(*> 0 A invenção propõe realizar um tratamento semelhante ao que se acaba de descrever, para calcular uma relação, não sinal-ruído, mas sinal-eco (aqui e em seguida, por simplificação, por "eco" entender-se-á, obviamente, o eco residual, que se procura minimizar). -22- ΡΕ2057835
As relações sinal-eco a priori e sinal-eco a posteriori são indicadas, respectivamente, por SER _ prio(k, 1) e SER_ post(k, 1) . Estas relações são calculadas pelos blocos funcionais 52', 54', 56' e 58' da figura 2, que executam algoritmos semelhantes aos dos blocos homólogos 52, 54, 56 e 58 descritos acima a propósito do tratamento do ruido. Este cálculo é realizado a partir dos dados produzidos por aplicação de uma transformada de Fourier rápida FFT 50' ao sinal 46 de referência.
Os valores das relações sinal-eco a priori e a posteriori e das relações sinal-ruido a priori e a posteriori são, assim, conhecidos e aplicados conjuntamente ao algoritmo de cálculo do ganho LSA (bloco 62). O ganho OM-LSA é calculado pelo bloco 64. Uma transformação de Fourier oposto (bloco 66) restitui, na sarda, o sinal do microfone, insonorizado e sem eco. A invenção propõe, para o cálculo do ganho global G(k, 1), ou seja, o ganho que tem em conta, ao mesmo tempo, o eco e o ruido, utilizar a expressão (9) acima dada para o cálculo do ruido, mas seleccionando parâmetros ξ (k, 1) e γ (k, 1) dependendo, ao mesmo tempo, das relações sinal-ruído e das relações sinal-eco.
Pode-se nomeadamente utilizar, em vez dos parâmetros ξ (k, 1) e γ (λ, 1) , os parâmetros ξ' (k, 1) e γ' {k, 1), tais como: (10) £(kj) - rmn(SER _ prio(k,/), SNR prio{kJ)) -23- ΡΕ2057835 y'{k,l) = SER_post(k,l) (11)
Com efeito, se o eco residual for superior ao ruido, a relação sinal-eco será menor que a relação sinal-ruido; escolher-se-á, por conseguinte, o parâmetro SER prio(k, 1) para aplicar um ganho que reduzirá, sobretudo, o eco. Nesta situação, de facto, o eco mascara o ruído, e procurar-se-á, então, repor o eco até ao nível do ruído.
Pelo contrário, se o ruído for superior ao eco residual, a relação sinal-ruído é menor que a relação sinal-eco, e escolher-se-á o parâmetro SNR_ prio(k, 1) para aplicar um ganho que reduzirá, sobretudo, o ruído.
Por outras palavras, ao adoptar-se o mínimo do SER_ prio{k, 1) e SNR _ prio(k, 1), define-se sempre o caso mais favorável, porque se procurará, sempre, reduzir a componente parasita mais prejudicial. 0 mesmo raciocínio poderia ser aplicado ao parâmetro γ(k, 1) , adoptando o mínimo das relações sinal-ruído e sinal-eco a posteriori. No entanto, na prática, constata-se que a utilização, em todos os casos, das relações sinal-eco a posteriori introduz menos ruído musical no sinal restituído.
Obtém-se, por conseguinte, o valor do ganho que tem em conta o eco e o ruído: ΡΕ2057835 -24- G(k,l) comv\k,l) =
â'Uc A 1 ξ'{ΚΡ ξψ\1) + \
Lisboa, 30 de Abril de 2010

Claims (5)

  1. ΡΕ2057835 - 1 - REIVINDICAÇÕES 1. Método de tratamento de um sinal áudio captado pelo microfone (18) de um dispositivo "mãos livres" (14) compreendendo, igualmente, um altifalante (16) susceptivel de introduzir, por acoplamento acústico com o microfone, um eco acústico parasita, compreendendo o sinal captado pelo microfone uma componente (32) útil de voz, uma componente (36) parasita de eco acústico e uma componente (34) parasita de ruído ambiente, compreendendo este método, no domínio temporal: - um tratamento de anulação de eco (40) que subtrai ao sinal captado um sinal de referência emitido por um circuito adaptativo de modelização do referido acoplamento acústico, compreendendo ainda este método, no domínio da frequência e ao longo de tramas sucessivas do sinal: um tratamento de supressão do eco residual (42) subsistente após execução do tratamento de anulação de eco, compreendendo: • uma estimativa dos valores respectivos da potência do eco residual numa pluralidade de bandas de frequências definidas para tramas sucessivas do sinal, e • o cálculo e a aplicação de um ganho variável característico de cada banda de frequência e em cada trama, sendo o ganho respectivo tanto menor quanto, para a banda -2- ΡΕ2057835 de frequência considerada, a potência relativa estimada do eco residual é elevada e vice-versa; e - um tratamento de redução do ruido (44) presente no sinal após execução do tratamento de anulação de eco, método caracterizado por: - compreender ainda, para cada banda de frequências e para cada trama: • uma estimativa a priori dos valores respectivos da potência do ruido ambiente presente no sinal captado, e • uma comparação dos niveis relativos da potência do ruido e da potência do eco residual no sinal captado, - e por o cálculo do referido ganho variável ser realizado em função da potência relativa estimada do eco residual, quando o nivel deste último é superior ao do ruido, e em função da potência relativa estimada do ruido no caso contrário.
  2. 2. Método da reivindicação 1, compreendendo ainda: • uma estimativa de uma probabilidade de presença/ausência de voz, e • uma ponderação, pela probabilidade estimada de presença/ausência de voz, da potência relativa estimada do eco residual, sendo o valor da potência tanto mais reduzido por esta ponderação quanto a probabilidade de voz é pequena e vice-versa. ΡΕ2057835 -3 -
  3. 3. Método da reivindicação 2, em que a potência relativa estimada do eco residual é dada, para a banda de frequências k definida para a trama I, pela expressão: Puissance_ Echo _res(k, l) I E{E(k,i).x(k,r)fsjw)|2} -0 em que: E{ ·} representa o valor esperado matemático, E{kf 1) é a transformada de Fourier discreta do sinal captado após subtracção do sinal de referência pelo tratamento de anulação de eco, X(k, 1) é a transformada de Fourier discreta do sinal de referência utilizado para o tratamento de anulação de eco, e cirefAk, 1) representa a probabilidade de presença de voz.
  4. 4. Método da reivindicação 1, em que o cálculo do referido qanho variável é realizado, igualmente, em função de uma estimativa a posteriori dos valores respectivos da potência do eco residual no sinal captado.
  5. 5. Método da reivindicação 4, em que o cálculo do referido ganho variável é realizado em função da estimativa a posteriori dos valores respectivos da potência do eco residual no sinal captado, tanto quando o nivel do eco residual é superior ao do ruido como no caso contrário. Lisboa, 30 de Abril de 2010
PT07823413T 2006-10-26 2007-08-10 Método de redução do eco acústico residual após supressão de eco num dispositivo ''mãos livres'' PT2057835E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0609395A FR2908003B1 (fr) 2006-10-26 2006-10-26 Procede de reduction de l'echo acoustique residuel apres supression d'echo dans un dispositif"mains libres"

Publications (1)

Publication Number Publication Date
PT2057835E true PT2057835E (pt) 2010-05-07

Family

ID=37965104

Family Applications (1)

Application Number Title Priority Date Filing Date
PT07823413T PT2057835E (pt) 2006-10-26 2007-08-10 Método de redução do eco acústico residual após supressão de eco num dispositivo ''mãos livres''

Country Status (8)

Country Link
US (1) US8111833B2 (pt)
EP (1) EP2057835B1 (pt)
AT (1) ATE457597T1 (pt)
DE (1) DE602007004738D1 (pt)
ES (1) ES2341500T3 (pt)
FR (1) FR2908003B1 (pt)
PT (1) PT2057835E (pt)
WO (1) WO2008049982A1 (pt)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8582781B2 (en) * 2009-01-20 2013-11-12 Koplar Interactive Systems International, L.L.C. Echo modulation methods and systems
FR2946486B1 (fr) 2009-06-09 2012-04-20 Parrot Procede de detection d'une situation de double parole pour dispositif telephonique "mains libres"
WO2010146711A1 (ja) * 2009-06-19 2010-12-23 富士通株式会社 音声信号処理装置及び音声信号処理方法
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
JP5156043B2 (ja) * 2010-03-26 2013-03-06 株式会社東芝 音声判別装置
ES2558559T3 (es) 2011-02-03 2016-02-05 Telefonaktiebolaget L M Ericsson (Publ) Estimación y supresión de no linealidades de altavoces armónicos
JP5649488B2 (ja) * 2011-03-11 2015-01-07 株式会社東芝 音声判別装置、音声判別方法および音声判別プログラム
US8804977B2 (en) * 2011-03-18 2014-08-12 Dolby Laboratories Licensing Corporation Nonlinear reference signal processing for echo suppression
CN102739886B (zh) * 2011-04-01 2013-10-16 中国科学院声学研究所 基于回声频谱估计和语音存在概率的立体声回声抵消方法
FR2976111B1 (fr) * 2011-06-01 2013-07-05 Parrot Equipement audio comprenant des moyens de debruitage d'un signal de parole par filtrage a delai fractionnaire, notamment pour un systeme de telephonie "mains libres"
US9666206B2 (en) * 2011-08-24 2017-05-30 Texas Instruments Incorporated Method, system and computer program product for attenuating noise in multiple time frames
US9065895B2 (en) * 2012-02-22 2015-06-23 Broadcom Corporation Non-linear echo cancellation
TWI449438B (zh) * 2012-04-09 2014-08-11 Quanta Comp Inc 具有迴音消除機制之通訊系統及方法
US8880058B2 (en) * 2012-09-14 2014-11-04 Toyota Motor Engineering & Manufacturing North America, Inc. Automatic tuning system
CN104050971A (zh) 2013-03-15 2014-09-17 杜比实验室特许公司 声学回声减轻装置和方法、音频处理装置和语音通信终端
CN103680514B (zh) * 2013-12-13 2016-06-29 广州市百果园网络科技有限公司 网络语音通信中的信号处理方法和系统
JP6361156B2 (ja) * 2014-02-10 2018-07-25 沖電気工業株式会社 雑音推定装置、方法及びプログラム
US9940945B2 (en) * 2014-09-03 2018-04-10 Marvell World Trade Ltd. Method and apparatus for eliminating music noise via a nonlinear attenuation/gain function
US9712866B2 (en) 2015-04-16 2017-07-18 Comigo Ltd. Cancelling TV audio disturbance by set-top boxes in conferences
US9900735B2 (en) 2015-12-18 2018-02-20 Federal Signal Corporation Communication systems
KR101934636B1 (ko) * 2017-04-14 2019-01-02 한양대학교 산학협력단 심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치
JP6833616B2 (ja) * 2017-05-29 2021-02-24 株式会社トランストロン エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
US10192567B1 (en) * 2017-10-18 2019-01-29 Motorola Mobility Llc Echo cancellation and suppression in electronic device
CN109901113B (zh) * 2019-03-13 2020-08-11 出门问问信息科技有限公司 一种基于复杂环境的语音信号定位方法、装置及系统
CN115315935A (zh) 2020-03-23 2022-11-08 杜比实验室特许公司 回声残余抑制
CN112709712B (zh) * 2020-11-30 2022-04-08 南京航空航天大学 一种主动噪声多变量控制设计方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60102052A (ja) 1983-11-09 1985-06-06 Hitachi Ltd 拡声通話機
JPH02209027A (ja) 1989-02-09 1990-08-20 Fujitsu Ltd 音響エコーキャンセラー
CA2107316C (en) 1992-11-02 1996-12-17 Roger David Benning Electronic cancellation of ambient noise in telephone receivers
GB2274372A (en) * 1992-12-02 1994-07-20 Ibm Adaptive noise cancellation device
US5680450A (en) 1995-02-24 1997-10-21 Ericsson Inc. Apparatus and method for canceling acoustic echoes including non-linear distortions in loudspeaker telephones
US5761318A (en) * 1995-09-26 1998-06-02 Nippon Telegraph And Telephone Corporation Method and apparatus for multi-channel acoustic echo cancellation
US6442275B1 (en) * 1998-09-17 2002-08-27 Lucent Technologies Inc. Echo canceler including subband echo suppressor
US6658107B1 (en) * 1998-10-23 2003-12-02 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for providing echo suppression using frequency domain nonlinear processing
US6970558B1 (en) 1999-02-26 2005-11-29 Infineon Technologies Ag Method and device for suppressing noise in telephone devices
JP3640576B2 (ja) * 1999-09-07 2005-04-20 沖電気工業株式会社 エコーキャンセラ、及びその動作方法
US6526140B1 (en) * 1999-11-03 2003-02-25 Tellabs Operations, Inc. Consolidated voice activity detection and noise estimation
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US7099458B2 (en) * 2003-12-12 2006-08-29 Motorola, Inc. Downlink activity and double talk probability detector and method for an echo canceler circuit
FR2898209B1 (fr) * 2006-03-01 2008-12-12 Parrot Sa Procede de debruitage d'un signal audio
US7885810B1 (en) * 2007-05-10 2011-02-08 Mediatek Inc. Acoustic signal enhancement method and apparatus

Also Published As

Publication number Publication date
EP2057835B1 (fr) 2010-02-10
EP2057835A1 (fr) 2009-05-13
ATE457597T1 (de) 2010-02-15
WO2008049982A1 (fr) 2008-05-02
ES2341500T3 (es) 2010-06-21
FR2908003B1 (fr) 2009-04-03
FR2908003A1 (fr) 2008-05-02
US20090310796A1 (en) 2009-12-17
DE602007004738D1 (de) 2010-03-25
US8111833B2 (en) 2012-02-07

Similar Documents

Publication Publication Date Title
PT2057835E (pt) Método de redução do eco acústico residual após supressão de eco num dispositivo ''mãos livres''
US9992572B2 (en) Dereverberation system for use in a signal processing apparatus
PT2057834E (pt) Circuito para redução do eco acústico, destinado a um dispositivo de «mãos livres» que pode ser utilizado com um telefone portátil
US8111840B2 (en) Echo reduction system
JP6201949B2 (ja) エコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法
US20190349471A1 (en) Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters
Jeannes et al. Combined noise and echo reduction in hands-free systems: A survey
KR20100003530A (ko) 전자기기에서 음성 신호의 잡음 제거 장치 및 방법
US6859531B1 (en) Residual echo estimation for echo cancellation
US8259926B1 (en) System and method for 2-channel and 3-channel acoustic echo cancellation
CN102739886A (zh) 基于回声频谱估计和语音存在概率的立体声回声抵消方法
JP2004537219A (ja) 高調波計算のための非線形エコーサプレッサを備えたエコーキャンセラ
Djendi et al. Noise Cancellation using Two Closely Spaced Microphones: Experimental Study witha Specific Model and Two Adaptive Algorithms
JP4396449B2 (ja) 残響除去方法及びその装置
Jayakumar et al. An integrated acoustic echo and noise cancellation system using cross-band adaptive filters and wavelet thresholding of multitaper spectrum
US10129410B2 (en) Echo canceller device and echo cancel method
JP3787088B2 (ja) 音響エコー消去方法、装置及び音響エコー消去プログラム
Mahbub et al. A single-channel acoustic echo cancellation scheme using gradient-based adaptive filtering
JP2005533427A5 (pt)
JP2003309493A (ja) 反響低減方法、反響低減装置、反響低減プログラム
CN114650340B (zh) 一种回声消除方法、装置及电子设备
Helwani et al. A single-channel MVDR filter for acoustic echo suppression
Mahbub et al. Gradient based adaptive filter algorithm for single channel acoustic echo cancellation in noise
Ihle et al. Integration of noise reduction and echo attenuation for handset-free communication
US9578426B2 (en) Method for feedback cancelling in hearing devices and hearing device with a feedback canceller