BRPI0813178B1 - Processo de codificação de um sinal de áudio de entrada, processo de decodificação escalável de um sinal de áudio, codificador de sinal de áudio de entrada, e codificador de um sinal de áudio - Google Patents
Processo de codificação de um sinal de áudio de entrada, processo de decodificação escalável de um sinal de áudio, codificador de sinal de áudio de entrada, e codificador de um sinal de áudio Download PDFInfo
- Publication number
- BRPI0813178B1 BRPI0813178B1 BRPI0813178-3A BRPI0813178A BRPI0813178B1 BR PI0813178 B1 BRPI0813178 B1 BR PI0813178B1 BR PI0813178 A BRPI0813178 A BR PI0813178A BR PI0813178 B1 BRPI0813178 B1 BR PI0813178B1
- Authority
- BR
- Brazil
- Prior art keywords
- signal
- quantification
- rate
- reconstructed
- noise
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000005236 sound signal Effects 0.000 title claims abstract description 19
- 230000008569 process Effects 0.000 title claims description 22
- 238000011002 quantification Methods 0.000 claims abstract description 129
- 238000001914 filtration Methods 0.000 claims abstract description 29
- 230000002441 reversible effect Effects 0.000 claims abstract description 17
- 238000013139 quantization Methods 0.000 claims description 57
- 230000004044 response Effects 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 13
- 238000003786 synthesis reaction Methods 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 9
- 238000003780 insertion Methods 0.000 claims 2
- 230000037431 insertion Effects 0.000 claims 2
- 230000006870 function Effects 0.000 description 32
- 230000006978 adaptation Effects 0.000 description 10
- 230000006872 improvement Effects 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 241001123248 Arma Species 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000036961 partial effect Effects 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000007493 shaping process Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003071 parasitic effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101100256007 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) mic-13 gene Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 239000007799 cork Substances 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B14/00—Transmission systems not characterised by the medium used for transmission
- H04B14/02—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
- H04B14/04—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Circuit For Audible Band Transducer (AREA)
- Dental Preparations (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
Abstract
processo de codificação de um sinal de áudio de entrada, processo de decodificação escalável de um sinal de áudio, codificador de sinal de áudio de entrada, e codificador de um sinal de áudio a presente invenção refere-se a um codificador de sinal de áudio de entrada (s(z)), comportando um módulo de combinação que combina o sinal de áudio de entrada a um sinal intermediário de resposta, formando um sinal de entrada modificado e um módulo de quantificação escalável em taxa (91) desse sinal de entrada modificado, liberando uma trama binária de índices de quantificação de uma taxa predeterminada. esse codificador é tal que compreende: um módulo de quantificação inverso (93) de uma parte dos índices de quantificação da trama binária correspondente aos índices de uma taxa inferior à taxa predeterminada, para determinar um sinal (smic (z)) reconstruído, um módulo de determinação (94) de um ruído de quantificação (qmic (z))oriundo pelo menos dos módulos de quantificação e de quantificação inversa em cascata, um módulo de determinação (111) de uma função de filtragem do ruído de quantificação, a partir desse sinal reconstruído e um módulo de filtragem apto a aplicar (33) essa função de filtragem nesse ruído de quantificação para se obter esse sinal intermediário de resposta. a invenção refere-se também a um processo de codificação aplicado pelo codificador assim descrito e a um processo de decodificação correspondente aplicado por um decodificador.
Description
Relatório Descritivo da Patente de Invenção para PROCESSO DE CODIFICAÇÃO DE UM SINAL DE ÁUDIO DE ENTRADA,
PROCESSO DE DECODIFICAÇÃO ESCALÁVEL DE UM SINAL DE
ÁUDIO, CODIFICADOR DE SINAL DE ÁUDIO DE ENTRADA, E CODIFICADOR DE UM SINAL DE ÁUDIO.
[0001] A presente invenção refere-se a um tratamento de dados sonoros.
[0002] Esse tratamento é adaptado notadamente para a transmissão e/ou a armazenagem de sinais digitais, tais como sinais de audiofrequência (palavra, música ou outros).
[0003] A presente invenção refere-se mais particularmente à codificação de formas de onda, tal como a codificação MIC (para Modulação por Impulsos Codificados) dito PCM (para Pulse Code Modulation) em inglês.
[0004] O princípio geral da codificação / decodificação MIC especificado pela recomendação UIT-T G.711 é tal como descrito com referência à figura 1.
[0005] A codificação MIC 13 comporta um módulo de quantificação Qmic 10 que recebe na entrada o sinal de entrada S(z). O índice de quantificação Imic na saída do módulo de quantificação 10 é transmitido via o canal de transmissão 11 ao decodificador 14.
[0006] O decodificador MIC 14 recebe, na entrada, os índices I’mic oriundos do canal de transmissão, versão eventualmente perturbada por erros binários de Imic e realiza uma quantificação inversa pelo módulo de quantificação inversa Q_1mic 12, para se obter o sinal codificado [0007] A codificação MIC normalizada UIT-T G.711 (a seguir denominada G.711) realiza uma compressão da amplitude dos sinais que são definidos com uma largura de banda mínima de [300 - 3400 Hz] e amostrados em 8 kHz - por uma curva logarítmica que permite
Petição 870190106921, de 22/10/2019, pág. 9/46
2/28 obter uma relação sinal de ruído mais ou menos constante para uma ampla dinâmica de sinais. O passo de quantificação no domínio do sinal original é proporcional à amplitude dos sinais.
[0008] O sinal comprimido é quantificado sobre 8 bits, seja 256 níveis. Na rede telefônica comutada (RTC) dita Public Switched Telephone Network (PSTN) em inglês, esses 8 bits são transmitidos a uma frequência de 8 kHz para dar uma taxa de 64 kbits/s.
[0009] Uma trama de sinal quantificado, segundo a norma G.711, é constituída de índices de quantificação codificados sobre 8 bits. Assim, se a quantificação inversa for implantada por mesa, ela consistirá simplesmente em uma marcação pelo índice de um dos 256 valores decodificados possíveis.
[00010] Na norma G.711, segundo a lei A na Europa ou a lei mu (μ) na América do Norte e no Japão, os 8 bits são repartidos da seguinte forma, tal como representado em 15 na figura 1:
[00011] 1 bit de sinal S, 3 bits para indicar o segmento e 4 bits para indicar o local sobre o segmento.
[00012] A etapa de quantificação do codificador gera um ruído de quantificação que é a diferença entre o sinal original e o sinal decodificado.
[00013] Com um grande número de níveis de quantificação (256), o ruído de quantificação tem um espectro relativamente plano como pode mostrar a figura 2 sob a referência 20. O espectro do sinal está representado em 22 na figura 2 (no caso um bloco de sinal com voz), tendo uma grande dinâmica (~40dB). Pode-se ver que nas zonas de pouca energia, o ruído é muito próximo do sinal e não é, portanto, mais forçosamente oculto. Pode, então, tornar-se audível nessas regiões (de 2300 a 3500 Hz).
[00014] No caso dos codificadores preditivos adaptadores de palavra, técnicas de conformação do ruído de quantificação foram aplicaPetição 870190106921, de 22/10/2019, pág. 10/46
3/28 das para ocultar esse ruído e à medida do possível torná-lo inaudível. Com efeito, pelas propriedades de ocultação frequencial simultânea da orelha humana, é possível injetar mais ruído de quantificação nas zonas nas quais o sinal é mais energético. A conformação do ruído consiste em repartir melhor espectralmente o ruído de quantificação, diminuindo o nível do ruído de quantificação nas zonas pouco energéticas para redistribui-lo nas zonas mais energéticas.
[00015] Essa técnica é, por exemplo, descrita no documento Adaptive noise spectral shaping and entropy coding in predictive coding of speech de J.Makhoul, M.Berouti em IEEE Trans. ASSP, Vol.27-3, Junho de 1979.
[00016] Esse documento descreve a utilização de filtros lineares, considerando-se o sinal reconstruído. O filtro de conformação do ruído de quantificação é derivado do filtro de predição linear de síntese dito linear predictive coding (LPC) synthesis filter, em inglês. Assim, a trama obtida na saída desse tipo de codificador comporta índices de coeficientes de predição linear dos filtros, um índice de fator de normalização de ganho e os índices de quantificação.
[00017] Além disso, na referência precedente, o filtro de conformação do ruído é calculado a partir do filtro de síntese reconstruído a partir dos índices de coeficientes de predição linear. O filtro de conformação do ruído será, portanto, tirado do ruído de codificação dos coeficientes de predição linear. Além disso, na referência citada, a função de transferência do filtro de conformação só possui coeficientes no numerador, calculados por duas predições lineares em cascata. As duas predições lineares em cascata fornecendo, cada uma, sua parte de imprecisão, resultando daí, conforme claramente indicado na referência citada, que a conformação de ruído só será efetiva para um número de coeficientes no máximo igual a 2.
[00018] O artigo de Makhoul e Berouti mostra que a conformação
Petição 870190106921, de 22/10/2019, pág. 11/46
4/28 do ruído de quantificação é possível nos sistemas preditivos adaptativos caracterizados por um modelo de síntese constituído de um quantificador inverso e de um filtro de predição a curto prazo. Os filtros de síntese são utilizados na estrutura de codificação para conseguir a conformação adequada.
[00019] Essa técnica não é, portanto, adaptada aos codificadores não-preditivos que não apresentam filtros de síntese como codificador MIC (em particular G.711). Com efeito, a quantificação, incluindo uma conformação - tal como descrito no artigo de Makhoul e Betouti - é realizada no domínio do resíduo de predição linear (ou excitação), isto é, após filtragem do sinal original por um filtro de predição A (z). Os coeficientes do filtro A(z) devem, portanto, ser transmitidos ao decodificador para realizar uma filtragem de síntese 1/A(z), após quantificação inversa. Além disso, a conformação do ruído é realizada via uma função B(z) reduzida à ordem 2 e deduzida da função A(z) transmitida. [00020] A observação precedente se aplica ao artigo, J.H.Chen. Novel codec structures for noise feedbacxk coding of speech. Proc Of ICASSP, 2006, PP.I-681:I-684 que retoma o artigo Makhoul e Berouti aí incorporando um preditor a longo prazo e uma conformação do ruído de quantificação por um filtro de conformação a longo prazo. Além disso, no artigo de Chen et al., a quantificação utilizada é de tipo vetorial.
[00021] A presente invenção oferece uma solução que não apresenta os inconvenientes do estado da técnica.
[00022] Para isso, a invenção propõe um processo de codificação de um sinal de áudio de entrada, no qual esse sinal de áudio de entrada é combinado a um sinal intermediário de resposta, formando um sinal de entrada modificado e comportando uma etapa de quantificação escalável em taxa desse sinal de entrada modificado, liberando uma trama binária de índices de quantificação de uma taxa predeterPetição 870190106921, de 22/10/2019, pág. 12/46
5/28 minada, tal que comporta, além disso, as seguintes etapas:
- quantificação inversa de uma parte dos índices de quantificação da trama binária correspondente aos índices de uma taxa inferior à taxa predeterminada, para determinar um sinal reconstruído;
- determinação de um ruído de quantificação gerado pelo menos pela sucessão da etapa de quantificação e quantificação inversa;
- determinação de uma função de filtragem do ruído de quantificação a partir desse sinal reconstruído;
- aplicação dessa função de filtragem a esse ruído de quantificação para se obter esse sinal intermediário de resposta.
[00023] Assim, o processo, de acordo com a invenção, permite obter uma trama de índices de quantificação capaz de ser decodificada por decodificadores existentes de tipo MIC G.711. O processo, de acordo com a invenção, permite aumentar a qualidade de escuta da trama assim obtida pela consideração do ruído de quantificação, mantendo a interoperabilidade com os decodificadores existentes.
[00024] Uma conformação do ruído de quantificação é assim obtida pela determinação de uma função de filtragem adequada.
[00025] A trama binária é constituída unicamente de índices de quantificação escalar representando individualmente cada amostra do sinal, sem ter de transmitir coeficientes de predição lineares.
[00026] Essa conformação não necessita, portanto, de transmissão de coeficientes ao decodificador e pode ser enformada por um codificador de tipo MIC, sem filtro de síntese.
[00027] A presente invenção permite usar a conformação do ruído de quantificação somente sobre uma quantificação de taxa mínima (taxa-núcleo), vantajosamente um quantificado MIC G.711, no caso, por exemplo, de um codificador com códigos imbricados. Assim, na decodificação, em função da taxa alocada, é possível decodificar ape
Petição 870190106921, de 22/10/2019, pág. 13/46
6/28 nas uma parte do sinal por uma quantificação inversa de taxa-núcleo, beneficiando-se da melhoria da qualidade do sinal por conformação do ruído de quantificação.
[00028] Em um modo particular de realização, a etapa de quantificação escalável em taxa fornece no mínimo índices de quantificação de taxa-núcleo correspondente a uma codificação núcleo de tipo codificação MIC interoperável com a norma IUT-T G.711 lei A ou lei um.
[00029] Em um modo de realização da invenção, a função de filtragem é determinada pela disposição de dois filtros de predição linear, cujos coeficientes são determinados a partir do sinal reconstruído.
[00030] Assim, por essa aplicação, é possível introduzir um aperfeiçoamento do lado do decodificador, aplicando-se o cálculo de filtros, a partir do sinal reconstruído da mesma forma que no codificador. Então, não é necessário transmitir informações suplementares para o cálculo dos filtros.
[00031] Em um outro modo de realização da invenção, a função de filtragem é determinada pela dispositivo de dois filtros de predição linear, cujos coeficientes são determinados a partir do sinal de entrada.
[00032] Assim, os coeficientes considerados para o cálculo da função de filtragem do ruído de quantificação não dependem dos filtros de síntese codificados, portanto degradados, que modelizam o sinal, mas dependem diretamente do sinal de entrada. A conformação do ruído será, portanto, mais adaptada.
[00033] Em um modo particular de realização, esse sinal intermediário de resposta é calculado a partir de uma predição do ruído de quantificação e de uma predição do ruído de quantificação filtrado, o ruído de quantificação filtrado sendo obtido por adição do sinal intermediário e do ruído de quantificação.
[00034] Em um modo de realização, a função de filtragem do ruído de quantificação é um filtro Autoagressivo de Médio Ajuste (ARMA).
Petição 870190106921, de 22/10/2019, pág. 14/46
7/28 [00035] Essa função de ponderação, estando sob a forma de um filtro com coeficientes no numerador, assim como no denominador, sem limitação do número de coeficientes do numerador com 2, permite melhorar a conformação do ruído.
[00036] Em um modo de realização da invenção, a função de ponderação do ruído de quantificação é calculada, além disso, a partir de características de periodicidade do sinal de entrada.
[00037] Uma função de ponderação considerando as características de periodicidade do sinal permite fornecer uma modulação suplementar sobre o ruído nos locais em que o ruído é mais importante, por exemplo, entre os harmônicos do sinal.
[00038] A invenção é particularmente adaptada, no caso em que a trama de indícios de quantificação está de acordo com a norma ITU G.711 lei A ou lei mu.
[00039] Em um modo de realização de furto de bits, a etapa de quantificação escalável de uma taxa predeterminada é uma quantificação escalar MIC interoperável com a norma IUT-T G.711 lei A ou mu, a etapa de quantificação inversa dos índices de taxa inferior à taxa predeterminada se aplica sobre 8-K bits da trama binária, para determinar um sinal reconstruído, e pelo fato de uma etapa de inscrição de K bis de dados ser, além disso, efetuada.
[00040] A invenção se refere também a um codificador de sinal de áudio de entrada, comportando um módulo de combinação, combinando o sinal de áudio de entrada a um sinal intermediário de resposta, formando um sinal de entrada modificado e um módulo de quantificação escalável em taxa desse sinal de entrada modificado, liberando uma trama binária de índices de quantificação de uma taxa predeterminada. Esse codificador é tal que comporta, além disso:
- um módulo de quantificação inversa de uma parte dos índices de quantificação da trama binária correspondente aos índices
Petição 870190106921, de 22/10/2019, pág. 15/46
8/28 dessa taxa inferior à taxa predeterminada, para determinar um sinal reconstruído;
- um módulo de determinação de um ruído de quantificação (Qmic(z)) oriundo pelo menos dos módulos de quantificação e de quantificação inversa em cascata;
- um módulo de determinação de uma função de filtragem do ruído de quantificação a partir desse sinal reconstruído; e
- um módulo de filtragem apto a aplicar essa função de filtragem a esse ruído de quantificação para se obter esse sinal intermediário de resposta.
[00041] Vantajosamente, no caso do codificador imbricado, o módulo de quantificação inversa de taxa inferior é do tipo MIC normalizado UIT-T G.711.
[00042] A invenção se refere também a um processo de decodificação escalável de um sinal áudio, comportando:
- uma primeira etapa de quantificação inversa, decodificando índices de quantificação de uma primeira taxa dita taxa-núcleo, para formar um sinal reconstruído;
- uma segunda etapa de quantificação inversa decodificando índices de quantificação de uma segunda taxa superior à taxanúcleo, utilizada em função da taxa recebida na decodificação, para formar um sinal reconstruído de taxa superior. O processo é tal que ele comporta, além disso:
- uma etapa de obtenção de um sinal de diferença entre esse sinal reconstruído de taxa-núcleo e esse sinal reconstruído de taxa superior;
- uma etapa de determinação de uma função de filtragem de correção a partir do sinal reconstruído de taxa-núcleo;
- uma etapa de aplicação dessa função de filtragem de correção a esse sinal de diferença para se obter um termo corretivo;
Petição 870190106921, de 22/10/2019, pág. 16/46
9/28
- uma etapa de síntese de um sinal corrigido reconstruído de taxa superior, combinando esse termo corretivo e um dos sinais reconstruídos.
[00043] Assim, na decodificação, em função da taxa alocada, é possível decodificar apenas uma parte do sinal por uma quantificação inversa de taxa-núcleo, beneficiando-se da melhoria da qualidade do sinal por conformação do ruído de quantificação.
[00044] Em um modo de realização, esse termo corretivo é aplicado a esse sinal reconstruído de taxa-núcleo.
[00045] Em um outro modo de realização, esse termo corretivo é aplicado a esse sinal reconstruído de taxa superior.
[00046] A invenção se refere a um decodificador de um sinal áudio, comportando:
- um primeiro módulo de quantificação inversa que decodificando índices de quantificação de uma primeira taxa dita taxa-núcleo, para formar um sinal reconstruído;
- um segundo módulo de quantificação inversa que decodifica índices de quantificação de uma segunda taxa superior à taxanúcleo, utilizada em função da taxa recebida na decodificação, para formar um sinal reconstruído de taxa superior. O decodificador é tal que ele comporta, além disso:
- um módulo de obtenção de um sinal de diferença entre esse sinal reconstruído de taxa-núcleo e esse sinal reconstruído de taxa superior;
- um módulo de determinação de uma função de filtragem de correção a partir do sinal reconstruído de taxa-núcleo;
- um módulo de filtragem apto a aplicar essa função de filtragem de correção a esse sinal de diferença para se obter um termo corretivo;
- um módulo de síntese de um sinal corrigido reconstruído
Petição 870190106921, de 22/10/2019, pág. 17/46
10/28 de taxa superior apto a combinar esse termo corretivo e um dos sinais reconstruídos.
[00047] Enfim, a invenção se refere a um programa de computador destinado a ser armazenado em uma memória de um codificador ou de um decodificador e/ou sobre um suporte de memória apto a cooperar com uma leitora do codificador ou do decodificador, comportando instruções de código para a aplicação das etapas do processo de codificação, ou do processo de decodificação, quando esse programa é executado por um processador do codificador ou do decodificador.
[00048] Outras características e vantagens da invenção aparecerão mais claramente com a leitura da descrição seguinte, dada unicamente a título de exemplo não- limitativo, e feita com referência aos desenhos anexados, nos quais:
- a figura 1 ilustra um sistema de codificação / decodificação MIC G.711 clássico do estado da técnica;
- a figura 2 representa um espectro de um bloco de sinal em relação ao espectro de um ruído de quantificação presente em um codificador não implementando a presente invenção;
- a figura 2b representa um espectro de um bloco de sinal em relação ao espectro de um ruído de quantificação presente em um codificador, de acordo com a invenção;
- a figura 3 representa um esquema do bloco geral de um codificador, de acordo com a invenção, e de um decodificador adaptado;
- a figura 4 representa um esquema do bloco de um primeiro modo de realização de um codificador, de acordo com a invenção, e de um decodificador adaptado;
- a figura 5 representa um esquema do bloco de um segundo modo de realização de um codificador, de acordo com a invenção, e de um decodificador adaptado;
Petição 870190106921, de 22/10/2019, pág. 18/46
11/28
- a figura 6 representa um organograma que representa as etapas de um primeiro modo de cálculo de um filtro de conformação do ruído de quantificação, de acordo com a invenção;
- a figura 7 representa um organograma que representa as etaconformaçãopas de um segundo modo de cálculo de um filtro de conformação do ruído de quantificação, de acordo com a invenção;
- a figura 8 representa um organograma que representa as etapas de um terceiro modo de cálculo de um filtro de conformação do ruído de quantificação, de acordo com a invenção;
- a figura 9 representa um esquema do bloco de um codificador, de acordo com a invenção, com quantificador de estrutura imbricada e de um decodificador adaptado;
- a figura 10 representa um esquema do bloco de uma variante de realização de um codificador, de acordo com a invenção, com quantificador de estrutura imbricado e um decodificador adaptado;
- a figura 11 representa um esquema do bloco de um outro modo de realização de um codificador, de acordo com a invenção, e de um decodificador adaptado; e
- a figura 12 representa um esquema do bloco de um outro modo de realização de um codificador, de acordo com a invenção, e de um decodificador adaptado em situação de furto de bit.
[00049] Com referência à figura 3, um codificador 30, de acordo com a invenção, vai a seguir ser descrito. O decodificador 14 correspondente é um decodificador clássico, tal como descrito com referência à figura 1 que comporta um módulo de quantificação inversa 12, que em um modo preferido de realização é uma quantificação MIC inversa.
[00050] O codificador 30 comporta um módulo de quantificação 31, em um modo preferido de realização, um quantificador MIC. Ele comporta também um módulo de quantificação inversa 32, de preferência
Petição 870190106921, de 22/10/2019, pág. 19/46
12/28 do tipo MIC.
[00051] Um circuito de resposta comporta, de acordo com a invenção, um módulo 33 de conformação do ruído de quantificação. Para isso, esse módulo recebe na entrada, ao mesmo tempo, o sinal em entrada do quantificador e o sinal jlíJCV oriundo do módulo de quantificação inversa para se obter o ruído de quantificação. Esse módulo determina uma função de ponderação a aplicar ao ruído de quantificação. Observa-se que nenhum coeficiente de filtro ou outro parâmetro que serve para a conformação do ruído de quantificação não é transmitido.
[00052] Essa função de ponderação pode ser constante e fixada de uma vez, independentemente do sinal de entrada.
[00053] Opcionalmente, ela pode ser adaptada por um módulo de adaptação 34 que recebe em entrada o sinal de entrada a codificar e/ou o sinal na saída do quantificador inverso. Os cálculos utilizados por esse módulo de adaptação são do tipo predição linear. Eles serão detalhados com referência às figuras 6, 7 e 8.
[00054] O ruído de quantificação assim ponderado é, em seguida, combinado ao sinal de entrada em 35. O sinal combinado é fornecido em entrada do quantificador 31 que fornece ao canal de transmissão 11 uma trama de índices de quantificação do tipo trama G.711, tal como definido com referência à figura 1, isto é, 8 bits (sinal, número de segmento e posição sobre o segmento).
[00055] Essa figura 3 é também uma ilustração das principais etapas do processo, de acordo com a invenção, utilizadas pelo codificador.
[00056] Assim, o codificador utiliza o processo, de acordo com a invenção, que comporta as etapas de:
- quantificação escalar das amostras do sinal de entrada combinado com um sinal intermediário de resposta para serem obtidos
Petição 870190106921, de 22/10/2019, pág. 20/46
13/28 índices de quantificação, constituindo uma trama binária de índices de quantificação;
- determinação de um sinal reconstruído a partir dos índices de quantificação por uma etapa de quantificação escalar inversa;
- determinação de um ruído de quantificação gerado pela sucessão da etapa de quantificação e de quantificação inversa;
- determinação de uma função de ponderação do ruído de quantificação;
- aplicação dessa função de ponderação ao ruído de quantificação para se obter esse sinal intermediário de resposta correspondente ao ruído de quantificação ponderado.
[00057] Um programa de computador destinado a ser estocado em uma memória do codificador e/ou sobre um suporte de memória apto a cooperar com uma leitora do codificador comporta instruções de código para a aplicação das etapas do processo, de acordo com a invenção, quando esse programa é executado por um processador do codificador.
[00058] Assim, o decodificador clássico 14 pode, sem modificações, decodificar o sinal I’mic recebido, beneficiando-se da melhoria da qualidade conseguida pela conformação do ruído utilizado no codificador 30.
[00059] Em uma outra aplicação possível, é possível, quando da transmissão entre o codificador e o decodificador, não considerar um bit ou vários ou ainda utilizar um bit ou vários para transmitir outros dados, diferentes daqueles oriundos da codificação. Nesse caso, a presente invenção que melhora a qualidade de codificação permite fornecer uma qualidade de sinal equivalente à qualidade obtida atualmente pelos codificadores clássicos MIC G711, mas sobre um número de bits reduzido.
[00060] Em uma outra aplicação possível, na qual o quantificador é
Petição 870190106921, de 22/10/2019, pág. 21/46
14/28 escalável em taxa, é possível estender um quantificador MIC com 9, 10 bits ou mais, conservando como trama binária na saída do codificador o bit de sinal, o número de segmento e acrescentando locais suplementares sobre os segmentos com a estrutura de trama correspondente. Quando se dobra o número de locais para cada segmento, um bit suplementar é necessário para a transmissão. Nesse caso também, a presente invenção melhora a qualidade de codificação independentemente do número de bits de melhoria opcionais decodificados pelo decodificador.
[00061] Um primeiro modo de realização da invenção é, então, descrito com referência à figura 4.
[00062] O codificador 40 descrito no caso comporta os mesmos módulos 31, 32, 34 e 35 que aqueles referenciados e descritos com referência à figura 3. O decodificador 14 é um decodificador clássico, tal como descrito com referência à figura 1.
[00063] O funcionamento do módulo de conformação do ruído de quantificação 33 é, então, detalhado.
[00064] Em uma primeira etapa, o ruído de quantificação QMIC (Z) é obtido em 41, efetuando-se a diferença entre a entrada do quantificador 31 e a saída do quantificador inverso 32.
[00065] Na sequência, será utilizada indiferentemente à anotação amostras temporais n ou a transformada em z, segundo o fato de uma ou outra ser a mais prática. Por exemplo, s(n) será a amostra temporal da transformada em z S(z).
[00066] Uma disposição de dois filtros Agip (z) em 42 e Ag2P (z) em 44 é prevista para se obter uma função de ponderação do ruído de quantificação.
[00067] Essa disposição funciona da seguinte maneira:
uma primeira soma parcial das amostras é feita pelo filtro Agip(z) em 42 que é da forma:
Petição 870190106921, de 22/10/2019, pág. 22/46
15/28 *ι
Α„,(ζ)-ΣΜ*)* * d)
Jt = l para dar na saída do filtro 42:
•v? («) = Σ X M 3W (« “*) (2) * = L na qual q/w/c (n) é o ruído de quantificação.
[00068] Um ruído de quantificação filtrado qtMic (n) é obtido em 43, acrescentando-se o ruído de quantificação q/w/c (n) ao sinal Sg2P (n) obtido pelo segundo filtro Ag2P (Z) em 44.
[00069] Esse segundo filtro Ag2P (Z) é dado por:
(3) i=l qtMic (n) será, portanto, tal que:
qtMic (n) = Q/w/c (n) + sg2P (n) - sgip (n), na qual sg2P (n) é dado por:
\ («)_ Σ fÍ S2 ) ?/.*/<- (?ϊ - k) (4) ί = Ι [00070] Os coeficientes dos filtros Agip (z) e Ag2P (z) são calculados por métodos de predição linear pelo módulo de adaptação 34. Esses cálculos serão detalhados posteriormente com referência às figuras 6, 7 e 8.
[00071] A diferença efetuada em 45 dos sinais sgip (n) - sg2P (n) constituindo um sinal intermediário de resposta é, em seguida, suprimida em 35 do sinal de entrada para dar 0 sinal de entrada do quantificador 31.
[00072] O sinal é, em seguida, quantificado e 0 ruído de quantificação é obtido no instante n por diferença entre a entrada do quantificador inverso.
[00073] A expressão do sinal restituído em função do sinal a codifiPetição 870190106921, de 22/10/2019, pág. 23/46
16/28 car e do ruído de quantificação será dada por:
1-Λιρ(ζ)
Ãwe(z) =^ω+, / (5) l-^U) [00074] Como o ruído de quantificação é aproximadamente branco, o espectro do ruído de codificação que será percebido será enfermado ι-Λ,ω (ou
Ι-Λ,,,(ζ) Λ 2(z) pelo filtro característico de um filtro Autorregressivo de Médio Ajuste (ARMA).
[00075] Conforme descrito pela sequência, o numerador e o denominador são frequentemente calculados a partir de um filtro,
Λ,ω=1-Σ°#)ζ·* t=i , afetando coeficientes gi e g2 da seguinte forma:
K-l í=l [00076] Esse tipo de função de ponderação, comportando um valor no numerador e um valor no denominador, tem a vantagem pelo valor no denominador de considerar os picos de sinal e pelo valor no numerador de atenuar esses picos fornecendo assim uma conformação ótima do ruído de quantificação. Os valores de gi e g2 são tais que:
> g2 > gi > 0.
[00077] Pode-se anotar que o esquema da figura 4 pode ser generalizado para filtros ARMA em cascata, a fim de modelizar ainda mais o ruído para sinais de entrada de dinâmica muito acentuada.
[00078] Um segundo modo de realização é, então, descrito com referência à figura 5. O codificador 50 comporta os mesmos módulos 31, 32, 34 que aqueles descritos com referência às figuras 3 e 4. Da
Petição 870190106921, de 22/10/2019, pág. 24/46
17/28 mesma forma, o decodificador 14 é idêntico àquele descrito com referência às figuras 3 e 4.
O módulo de conformação do ruído 33 é, então, detalhado. [00079] Nesse módulo, encontra-se a mesma disposição 41, 43, 45 e os filtros 42, 44 descritos com referência à figura 4. Outros filtros Ppi(z) e Pp2(z) referenciados com 51 e 56 são previstos.
[00080] Com efeito, no caso dos sinais com voz e aquele dos sinais digitais de áudio de alta fidelidade, uma ligeira conformação, a partir da estrutura fina do sinal revelando as periodicidades do sinal, reduz o ruído de quantificação percebido entre os harmônicos do sinal. A melhoria é particularmente significativa, no caso dos sinais de frequência fundamental ou pitch relativamente elevada, por exemplo, superior a 200 Hz.
[00081] O filtro 51 de conformação da estrutura fina do espectro é dado por:
P-i(z) = 1-Pp? (z) (6) na qual Ppi (z) é um filtro parcial determinado por:
Pn(z)= £ (7) t=-MF na qual Pitch é o número de amostras de um período de sinal, 2MP + 1 é o número de coeficientes do filtro parcial e Pimp (k)k = Mp...., Mp são os coeficientes do filtro.
[00082] O filtro 56 de conformação em função no denominador é dado por:
P2(Z) = 1 -Pp2 (Z) na qual Pp2 (Z) é um filtro dado por:
&
p^)= Σ [00083] A disposição 52, 54, 55 e 53 dos filtros 51 e 56 com os filPetição 870190106921, de 22/10/2019, pág. 25/46
18/28 (z) tros 42 e 44 é tal que o sinal decodificado f' é dado em função do sinal a codificar e dos filtros de conformação por:
[00084] O filtro 1- Ppi (Z) possui 2MP zeros no interior do círculo de unidade, complexos conjugados, de modo que, quando a variável z percorre o círculo de unidade, a resposta em frequência de 1-Ppi (Z) vai apresentar Mp máximas características da estrutura fina do espectro e correspondente à periodicidade do sinal.
[00085] Os preditores parciais Ppi (Z) e Pp2 (Z) são calculados a partir do sinal de entrada por técnicas de predição linear.
[00086] A figura 2b representa o espectro do mesmo bloco de sinal de voz que na figura 1, mas contrariamente à figura 2 o ruído de quantificação foi enfermado, aplicando-se a variante da invenção, segundo a figura 5. Pode-se observar que o ruído segue ao mesmo tempo os formandos e os harmônicos; ele se situa sempre sob o nível do sinal, o que implica que o ruído é assim tornado inaudível.
[00087] Com referência à figura 6, um primeiro modo de cálculo dos filtros de conformação por predição linear, tal como os filtros referenciados em 42 e 44 nas figuras 4 e 5 vão ser descritos então.
[00088] Esse primeiro exemplo de aplicação é descrito sob a forma de algoritmo a utilizar pelo módulo de adaptação 34 descrito com referência às figuras 3, 4 e 5.
[00089] Em E60, o módulo 34 recebe em entrada um bloco de sinal que corresponde seja ao bloco comum, caso a quantificação MIC seja efetuada por bloco de sinal, seja o sinal do bloco precedente, caso a quantificação MIC seja efetuada amostra por amostra.
[00090] O bloco de sinal é, em seguida, ponderado por uma janela de Hanning em E61. Outras janelas são possíveis, tais como, por exemplo, a janela de Kaiser.
Petição 870190106921, de 22/10/2019, pág. 26/46
19/28 [00091] Os K + 1 coeficientes de correlação são, em seguida, calculados em E62 por:
.¥-]
Cor(k) = ^\s(n)s(n -k) k = 0,..,, K (9) u=0 [00092] Os coeficientes do filtro AR (para Autorregressivo) que modelizam o envoltório do sinal são dados em E6 pelo algoritmo de Levinson-Durbin:
Obtém-se, portanto, um filtro Ag(Z) em E64, o filtro de fun1 1 çao de transferencia , modelizando o envoltorio do sinal de entrada.
[00093] Quando se utiliza esse cálculo para os dois filtros Agi e Ag2, 42 e 44 do codificador, de acordo com a invenção, são obtidos assim em E65 um filtro de conformação dado por:
N.M (10) [00094] Um segundo modo de cálculo dos filtros é, então, descrito com referência à figura 7.
[00095] Em E70, toma-se na entrada um bloco de sinal que corresponde seja ao bloco comum, caso a quantificação MIC seja feita por bloco de sinal, seja ao sinal do bloco precedente, caso a quantificação MIC seja feita amostra por amostra.
[00096] O bloco de sinal é, em seguida, ponderado em E71 por uma janela de ponderação, depois uma curva de ocultação é calculada em E72. Essa curva representa o nível máximo de ruído aceitável de um ponto de vista de inaudibilidade. Um exemplo de cálculo eficaz é dado pela codificação áudio na referência Y.Mahieux, J.P. Petit, High
Petição 870190106921, de 22/10/2019, pág. 27/46
20/28 quality audio transform coding at 64 kbits/s, IEEE Trans, on Com., Vol.
42-11, novembro de 1994.
[00097] Os coeficientes da curva de ocultação representam uma densidade espectral de potência. Essa densidade de potência é aproI í1 ximada por um filtro Autorregressivo * . Para isso, uma transformação de Fourier inversa da curva de ocultação M(z) é inicialmente efetuada em E73 para obter os coeficientes de correlação representativos.
[00098] Os coeficientes do filtro AR que modelizam a curva de ocultação são dados pelo algoritmo de Levinson-Durbin em E74 para dar o filtro Autorregressivo de conformação em E75.
ft=l [00099] Nesse caso, o filtro ARMA de ocultação é reduzido a um filtro autorregressivo (sem numerador) que modeliza a curva de ocultação. Essa forma de proceder pode ser interessante, pois o codificador MIC pode também codificar música (por exemplo: música de fundo de espera) em faixa reduzida [0-4 kHz} e, nesse caso, é mais preciso utilizar as curvas de ocultação.
[000100] Esse modo de cálculo pode assim ser aplicado ao filtro Ag2 da figura 4, o filtro Agi sendo colocado em 0.
[000101] Um terceiro modo de cálculo de filtro de utilização é no caso descrito com referência à figura 8. Em E80, considera-se em entrada um bloco de sinal que corresponde seja ao bloco comum, se a quantificação MIC for efetuada por bloco de sinal, seja ao sinal do bloco precedente, se a quantificação MIC for efetuada amostra por amostra.
[000102] O bloco de sinal é em seguida ponderado em E81 por uma
Petição 870190106921, de 22/10/2019, pág. 28/46
21/28 janela de ponderação, depois a curva de ocultação é calculada em E82 conforme no caso precedente descrito na figura 7. Os coeficientes da curva de ocultação representam uma densidade espectral de potência que é aproximada, no caso presente, por um filtro Médio Ajustado As(z). Para isso, considera-se em E83 o inverso da curva de ocultação, tomando-se o cuidado de limitar as amplitudes provenientes dos baixos valores de M (z) e efetua-se em E84 uma transformada de Fou1 rier inversa de + £ que dá os coeficientes de correlação representativos.
[000103] Os coeficientes do filtro AR que modelizam o inverso da curva de ocultação são dados em E85 pelo algoritmo de LevinsonDurbin:
£ = (12)
Í = L [000104] O filtro de Mediana Ajustada 1-Ag(z) assim definido não comporta coeficientes no denominador e será o filtro MA que modeliza a curva de ocultação.
[000105] Esse módulo de cálculo pode assim ser aplicado ao filtro Agi da figura 4, o filtro Ag2 sendo colocado em 0.
[000106] Um quarto modo de cálculo dos filtros de conformação é possível. Ele apresenta a vantagem de não necessitar de armazenar o sinal por blocos e leva, portanto, a um sistema de codificação de retardo mínimo. Nesse modo, vai-se adaptar os coeficientes do filtro ARMA de conformação a cada amostra por um algoritmo do gradiente. Vai-se inicialmente calcular os coeficientes do filtro ARMA que modelizam o sinal de entrada s(n), conforme descrito, por exemplo, na figura 6. [000107] O sinal de erro será dado em função do sinal s(n) por:
ΧΓΛ.
e(n) = s(n) - £a(k)s(n -k)+^b<k)e(n -k)(13) í-it-i
Petição 870190106921, de 22/10/2019, pág. 29/46
22/28 [000108] Considerando-se o gradiente de e2(n), deduz-se o algoritmo de adaptação dos coeficientes do filtro ARMA:
a(k,n) = ava(kpi-\) + fiDc(n)x(n — k) = (14) = + Λ = (15) [000109] A partir dos coeficientes que modelizam o sinal s(n), vai-se calcular o filtro de conformação, afetando uma ponderação gi e g2 no filtro ARMA, modelizando s(n) para dar:
A M 1 + Σ^)ί'?Γ£ ¢=1 (16) [000110] Com referência à figura 9, um outro modo de realização de um codificador, segundo a invenção, é, então, descrito.
[000111] Nesse modo de realização, o quantificador MIC com 8 bit é estendido a um quantificador MIC com 9, 10 bits ou mais, conservando, como trama binária na saída do codificador, o bit de sinal, o número de segmento e acrescentando-se locais suplementares sobre os segmentos, conforme mostra a figura 9 com a estrutura de trama 116 correspondente. Quando se dobra o número de locais para cada segmento, um bit suplementar é necessário para a transmissão.
[000112] A figura 9 dá um exemplo de utilização de quantificação MIC imbricada, na qual o módulo de conformação do ruído 33, tal como descrito nos modos de realização da figura 3, 4 ou 5 é conservado, assim como o módulo de adaptação 34.
[000113] O quantificador MIC imbricado Qb referenciado 91 se acha em um circuito de resposta de conformação do ruído de quantificação. Ele gera um código Ie à saída do quantificador imbricado Qe de débito mais acentuado de E bits. A conformação do ruído de quantificação é efetuada a partir da saída do quantificador MIC inverso 93 de 8 bits núcleo que corresponde, por exemplo, ao quantificador MIC G.711.
Petição 870190106921, de 22/10/2019, pág. 30/46
23/28
Este deve, portanto, ser alimentado por um índice Imic obtido a partir de Ie, eliminando os F bits de melhoria de peso baixo pelo módulo 92, isto é, F é tal que:
E = 8+F.
[000114] Esse módulo de quantificação inversa de 8 bits de núcleo pode ser denominado módulo de quantificação inversa núcleo que tem a taxa mínima núcleo de 8 bits.
[000115] A função de ponderação do ruído de quantificação aplicado pelo módulo 33, de acordo com a invenção, é aplicada ao ruído de quantificação oriundo desse módulo de quantificação inversa núcleo.
[000116] No decodificador a trama de índices de quantificação I’e recebida é decodificada pelo quantificador inverso Qe referenciado 101 para dar o sinal decodificado de mais elevada taxa .
[000117] Quando um funcionamento a uma taxa de E-1 bit é assinalado (caso Sd no decodificador, isto é, sinalização da taxa), o bit de melhoria de peso baixo de I’e é oculto, o que dá um índice I’e-i bits. Essa operação é assinalada em 102 pelo operador S1.
[000118] A saída com E-1 bits é obtida à saída do quantificador inverso Qe-i 103 alimentado pelo índice I’e-i e assim sucessivamente até SF, na qual E-8 bits de melhoria são suprimidos pela operação SF em 104 para dar o índice I’mic que produz a saída do quantificador MIC de 8 bits inverso. Se, em um local qualquer da transmissão, só os 8 bits MIC forem conservados, o índice resultante poderá ser decodificado por um decodificador MIC padrão.
[000119] Assim, pode-se mostrar, por meio da transformada em z, que a conformação do ruído de quantificação é efetiva. Com efeito, a
JÇ (z) expressão do sinal ΛίΚ γ ’ é dada por:
Petição 870190106921, de 22/10/2019, pág. 31/46
24/28
Ãwc(z)=5(z)+M^(z)^(z) (17) na qual Mask(z) é dado por:
Masked ~ (18) '-Wz' no caso em que se opta pela estrutura de conformação da figura 4.
[000120] O sinal de alta taxa ‘^^será dado por:
S£(z) =5(z)+Mí:^(z)£>e(z)-[1 -Mask{z)]Qt-(z) (19) na qual Qf(z) é igual à diferença dos sinais de saída dos quantificadores Qmic e Qe, tal como:
QF(z)=Q,fir(z)-QM (20) [000121] Para melhorar o modo de realização descrito com referência à figura 9, vai-se a presente descrever em referência à figura 10 uma variante de realização.
[000122] Na estrutura da figura 9, pode-se ver examinando a equação (19) que o sinal XV(£) contém um termo parasita ^ürE^) em relação ao quantificador não-imbricado e ótimo:
/¾¾ (z) =[1 - Mask (z)](?F (z) (21) [000123] Observou-se que para a baixa taxa do MIC se acha na configuração ótima e não há termo parasita na equação (17).
[000124] Para ser capaz de reconstituir o termo parasita no decodificador, é necessário efetuar a adaptação dos filtros pelo módulo 111a
J (7) partir de um dos sinais reconstituídos. Como jlíJCV está sempre presente, é natural escolher esse sinal para a adaptação dos filtros de conformação. A única diferença entre 0 codificador da figura 9 e aquele da figura 10 é que, para 0 codificador 110, a adaptação dos filtros de
Petição 870190106921, de 22/10/2019, pág. 32/46
25/28 (A) conformação em 111 é feita a partir do sinal f' , esse sinal estando presente no decodificador em todos os casos.
[000125] No decodificador, a adaptação dos filtros de conformação é í (?) também efetuada pelo módulo 108, a partir do sinal , esse sinal estando disponível em todas as configurações de taxa. Na ausência de erros de transmissão a adaptação dos filtros será idêntica no codificador e no decodificador.
[000126] A parte imbricada do decodificador é obtida a partir do decodificador descrito na figura 9, modificando as saídas dos quantificadores inversos por um termo corretivo oriundo da saída do filtro Cork (z) alimentado pela diferença entre ct , k sendo o número de bits do quantificador referido e a saída do quantificador inverso k. Os termos corretivos são, portanto, induzidos no decodificador em 106 para Οογε(ζ), em 107 para Οογε -ι(ζ), etc...
[000127] O filtro de correção é dado por:
^>;(ζ)=(1-Μ^(ζ)][^(ζ)-^(ζ)] (22) [000128] Um outro modo de realização da invenção para um codificador de estrutura imbricada é, então, descrito com referência à figura
11.
[000129] Nesse caso presente, a conformação do ruído é efetuada para quantificação elevada taxa. Nessa figura, o quantificador Qe imbricado 121 do codificador 120 se acha em um circuito de resposta de conformação do ruído de quantificação. Ele gera um código Ie à saída do quantificador imbricado Q de mais elevada taxa de E bits. A conformação do ruído de quantificação é efetuada a partir da saída do quantificador Qe'1 inverso 122 de 9, 10 bits ou mais, alimentado pelo índice Ie.
[000130] No decodificador, o índice I’e recebido é decodificado pelo
Petição 870190106921, de 22/10/2019, pág. 33/46
26/28 quantificador inverso (mesa) Qe 101 para dar o sinal decodificado de mais elevada taxa Μ”).
[000131] Quando um funcionamento a uma taxa de E-1 bit é assinalado (caso Sd no decodificador, isto é, sinalização da taxa), o bit de peso baixo do I’e é oculto pela operação S1 em 102, o que dá um índice I’e-i a E-1 bits.
[000132] A saída com E-1 bits é obtida à saída do quantificador inverso Qe-i 103 alimentado pelo índice I’e-i e assim sucessivamente até SF, no qual E-8 bits são suprimidos para dar o índice I’mic que produz a saída do quantificador MIC de 8 bits inverso.
[000133] Por meio da transformada em z, pode-se mostrar que o sinal ^(^é dado por:
5£(z)=5(z)+[1-^(z)]^(z) (23) [000134] O sinal na saída do quantificador MIC será dado por:
(24) no qual Qf(z) é a diferença, no emissor, entre a saída do quantificador inverso Qe'1 e do quantificador MIC inverso Qmic'1.
[000135] No caso presente, na saída do quantificador MIC não se conhece o termo Qf(z), já que os bits de pesos baixos de Ie foram eliminados e não é, portanto, possível eliminar esse termo. O ruído gerado em configuração de quantificação MIC inversa será, portanto, parcialmente enfermado pela soma de um componente de ruído Qf(z) (mais ou menos branco) e de um componente de ruído enfermado [1Bp(Z)]Qe(z).
[000136] Evidentemente, a conformação do ruído de quantificação pode ser também efetuada para uma taxa intermediária entre a taxa de núcleo e a mais elevada taxa.
[000137] A figura 12 dá um exemplo de utilização de quantificação
Petição 870190106921, de 22/10/2019, pág. 34/46
27/28
MIC imbricada com o furto de bits. O módulo de conformação do ruído
33, tal como descrito nos modos de realização da figura 3, 4 ou 5, é conservado, assim como o módulo de adaptação 34.
[000138] O quantificador MIC imbricado Qmic referenciado 91 se acha em um circuito de resposta de conformação do ruído de quantificação. Ele gera um código Imic à saída do quantificador imbricado Qmic taxa de 8 bits. Na realidade, o código MIC G.711 é um código naturalmente imbricado. É possível roubar 1, 2 ou 3 bits de posição sobre o segmento. Vai-se, portanto, utilizar esses bits para transmitir a informação auxiliar, por exemplo, bits de melhoria de qualidade por uma codificação da banda suplementar de 4 a 6 kHz ou mais. Os K = 1, 2 ou 3 bits de peso baixo de Imic serão, portanto, substituídos por bits de dados para dar um índice lg. A conformação do ruído de quantificação é efetuada a partir da saída do quantificador MIC inverso Qmic-k 93 de 8-K bits alimentado pelo índice Imic-k obtido a partir de Imic, ocultando os K bits de peso baixo.
[000139] Esse módulo de quantificação inversa de 8-K bits pode ser ainda denominado módulo de quantificação inversa núcleo que tem a taxa mínima núcleo de 8-K bits.
[000140] A função de ponderação do ruído de quantificação aplicado pelo módulo 33, de acordo com a invenção, é aplicada ao ruído de quantificação oriundo desse módulo de quantificação inverso núcleo.
[000141] Em uma variante de realização, o roubo de bits pode ser efetuado em um módulo 92 fora do codificador. A conformação do ruído de quantificação é efetuada, então, para a saída do G711 Qmic.
[000142] No decodificador, quando o decodificador se acha ser um decodificador MIC padrão, a trama de índices de quantificação l’e recebida é decodificada pelo quantificador inverso Q1mic referenciado
101 para dar o sinal decodificado O índice l’e é decodificado em cego pelo decodificador MIC padrão. Os bits de dados em peso
Petição 870190106921, de 22/10/2019, pág. 35/46
28/28 baixo, se houver, se traduzem por um ruído de codificação suplementar (perdem-se 6 dB por bit utilizado para os dados), mas a qualidade permanece aceitável, graças à conformação do ruído segundo a presente invenção e mantém-se a compatibilidade backward com os antigos sistemas.
[000143] Além disso, caso se disponha de um novo decodificador e a informação de taxa Sv tiver podido ser transmitida pela rede, poder-seão recuperar os bits de dados, por exemplo, para utilização de uma camada de melhoria de qualidade banda larga.
[000144] Acessoriamente, poderão ser ocultados os k bits de peso baixo do índice I'8 antes de efetuar a decodificação MIC, o que terá por efeito reduzir ligeiramente o ruído. Pode-se notar que as aplicações do furto de bit do MIC são numerosas e se tornam tanto mais interessantes que a conformação do ruído de quantificação melhora a qualidade de restituição do sinal de 8 - K bits.
Claims (11)
- REIVINDICAÇÕES1. Processo de codificação de um sinal de áudio de entrada, no qual esse sinal de áudio de entrada é combinado a um sinal intermediário de resposta, formando um sinal de entrada modificado e compreendendo uma etapa de quantificação escalável em taxa (91) desse sinal de entrada modificado, liberando uma trama binária de índices de quantificação (Ie) de uma taxa predeterminada, caracterizado pelo fato de compreender, além disso, as seguintes etapas:- quantificar de forma inversa (93) uma parte dos índices de quantificação da trama binária correspondente aos índices de uma taxa inferior (Imic) à taxa predeterminada, para determinar um sinal reconstruído ;- determinar (94) um ruído de quantificação (Qmic(z)) gerado pelo menos pela sucessão da etapa de quantificação e quantificação inversa;- determinar (111) uma função de filtragem do ruído de quantificação a partir desse sinal reconstruído f;- aplicar (33) essa função de filtragem a esse ruído de quantificação para se obter esse sinal intermediário de resposta.
- 2. Processo, de acordo com a reivindicação 1, caracterizado pelo fato de a etapa de quantificação escalável em taxa fornecer no mínimo índices de quantificação de taxa-núcleo correspondente a uma codificação núcleo de tipo codificação MIC interoperável com a norma IUT-T G.711 lei A ou mu.
- 3. Processo, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de esse sinal intermediário de resposta ser calculado a partir de uma predição (42) do ruído de quantificação (Qmic) e de uma predição (44) do ruído de quantificação filtrado (Qmic), o ruído de quantificação filtrado sendo obtido por adição do sinal intermediário e doPetição 870190106921, de 22/10/2019, pág. 37/462/5 ruído de quantificação (Qmic).
- 4. Processo, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de a função de filtragem do ruído de quantificação ser calculada, além disso, a partir de características de periodicidade do sinal de entrada.
- 5. Processo de codificação, de acordo com a reivindicação 1, caracterizado pelo fato de a etapa de quantificação escalável de uma taxa predeterminada ser uma quantificação escalar MIC interoperável com a norma IUT-T G.711 lei A ou mu, a etapa de quantificação inversa dos índices de taxa inferior à taxa predeterminada se aplica sobre 8-K bits da trama binária para determinar um sinal reconstruído ( Λί/ύ - ) e pelo fato de uma etapa de inserção de K bits de dados ser, além disso, efetuada.
- 6. Processo de decodificação escalável de um sinal de áudio, compreendendo:- uma primeira etapa de quantificação inversa (105), que decodifica índices de quantificação de uma primeira taxa dita taxa- y (z) núcleo, para formar um sinal reconstruído ( jW'ú f' )- uma segunda etapa de quantificação inversa (101) que decodifica índices de quantificação de uma segunda taxa superior à taxa-núcleo, utilizada em função da taxa recebida na decodificação,J (7) para formar um sinal reconstruído ( 7 ’ ) de taxa superior caracterizado pelo fato de compreender, além disso:- uma etapa de obtenção de um sinal de diferença entre y (z) esse sinal ( ) reconstruído de taxa-núcleo e esse sinal y (z) ( ' ) reconstruído de taxa superior;- uma etapa de determinação (108) de uma função de filtra-Petição 870190106921, de 22/10/2019, pág. 38/463/55 (z) gem de correção a partir do sinal ( ) reconstruído de taxanúcleo;- uma etapa de aplicação (106) dessa função de filtragem de correção a esse sinal de diferença para se obter um termo corretivo;- uma etapa de síntese de um sinal corrigido reconstruído de taxa superior, combinando esse termo corretivo e um dos sinais reconstruídos
- 7. Processo, de acordo com a reivindicação 6, caracterizado pelo fato de esse termo corretivo ser aplicado a esse sinal reconstruído de taxa-núcleo.
- 8. Processo, de acordo com a reivindicação 6, caracterizado pelo fato de esse termo corretivo ser aplicado a esse sinal reconstruído de taxa superior.
- 9. Processo de decodificação, de acordo com a reivindicação 6, caracterizado pelo fato de compreender uma etapa de recepção de informação de inserção de bits na codificação e pelo fato de, em caso de informação de inserção de K bits, uma etapa de ocultação dos K bits inseridos ser efetuada, antes da primeira etapa de quantificação inversa de taxa-núcleo.
- 10. Codificador de sinal de áudio de entrada (S(z)), compreendendo um módulo de combinação que combina o sinal de áudio de entrada a um sinal intermediário de resposta, formando um sinal de entrada modificado e um módulo de quantificação escalável em taxa (91) desse sinal de entrada modificado, liberando uma trama binária de índices de quantificação de uma taxa predeterminada, caracterizado pelo fato de compreender, além disso:- um módulo de quantificação inversa (93) de uma parte dos índices de quantificação da trama binária correspondente aos ín-Petição 870190106921, de 22/10/2019, pág. 39/464/5 dices de uma taxa inferior à taxa predeterminada, para determinar urn sinal (^jW/c’ ) reconstruído;- um módulo de determinação (94) de um ruído de quantificação (Qmíc (z))oriundo pelo menos dos módulos de quantificação e de quantificação inversa em cascata;- um módulo de determinação (111) de uma função de filtragem do ruído de quantificação, a partir desse sinal reconstruído ( y q- um módulo de filtragem apto a aplicar (33) essa função de filtragem nesse ruído de quantificação para se obter esse sinal intermediário de resposta.
- 11. Decodificador de um sinal de áudio, compreendendo:- um primeiro módulo de quantificação inversa (105), que decodificando índices de quantificação de uma primeira taxa dita taxa-5' (z) núcleo, para formar um sinal jWíCV reconstruído;- um segundo módulo de quantificação inversa que decodifica índices de quantificação de uma segunda taxa superior à taxanúcleo, utilizada em função da taxa recebida na decodificação, para formar um sinal reconstruído de taxa superior, caracterizado pelo fato de compreender, além disso:- um módulo de obtenção de um sinal de diferença (Qf (z) entre esse sinal reconstruído ( ) de taxa-núcleo e esse sinal reconstruído de taxa superior;- um módulo de determinação (108) de uma função de filtragem de correção a partir do sinal > reconstruído de taxa- núcleo;- um módulo de filtragem apto a aplicar (106) essa funçãoPetição 870190106921, de 22/10/2019, pág. 40/465/5 de filtragem de correção a esse sinal de diferença para se obter urn termo corretivo;- um módulo de síntese de um sinal corrigido reconstruído de taxa superior apto a combinar esse termo corretivo e um dos sinais reconstruídos
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR0755792 | 2007-06-15 | ||
| FR07557792 | 2007-06-15 | ||
| PCT/FR2008/051059 WO2009004227A1 (fr) | 2007-06-15 | 2008-06-13 | Codage de signaux audionumériques |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| BRPI0813178A2 BRPI0813178A2 (pt) | 2014-12-23 |
| BRPI0813178B1 true BRPI0813178B1 (pt) | 2020-05-12 |
Family
ID=38577930
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0813178-3A BRPI0813178B1 (pt) | 2007-06-15 | 2008-06-13 | Processo de codificação de um sinal de áudio de entrada, processo de decodificação escalável de um sinal de áudio, codificador de sinal de áudio de entrada, e codificador de um sinal de áudio |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US8719012B2 (pt) |
| EP (1) | EP2171713B1 (pt) |
| JP (1) | JP5451603B2 (pt) |
| AT (1) | ATE502377T1 (pt) |
| BR (1) | BRPI0813178B1 (pt) |
| DE (1) | DE602008005593D1 (pt) |
| ES (1) | ES2363190T3 (pt) |
| PL (1) | PL2171713T3 (pt) |
| WO (1) | WO2009004227A1 (pt) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
| FR2969360A1 (fr) * | 2010-12-16 | 2012-06-22 | France Telecom | Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique |
| ES2744904T3 (es) | 2014-05-01 | 2020-02-26 | Nippon Telegraph & Telephone | Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y medio de grabación |
| CN115691536B (zh) * | 2022-11-15 | 2025-08-22 | 湖南联智科技股份有限公司 | 一种应用于工业音频处理的音频消噪方法、设备及介质 |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0331405B1 (en) | 1988-02-29 | 1996-11-27 | Sony Corporation | Method and apparatus for processing a digital signal |
| JP2551147B2 (ja) * | 1989-05-19 | 1996-11-06 | 国際電信電話株式会社 | 音声符号化方式 |
| JPH03181232A (ja) * | 1989-12-11 | 1991-08-07 | Toshiba Corp | 可変レート符号化方式 |
| JPH0472909A (ja) * | 1990-07-13 | 1992-03-06 | Sony Corp | オーディオ信号の量子化誤差低減装置 |
| EP0632597B1 (en) | 1993-06-29 | 2002-08-28 | Sony Corporation | Audio signal transmitting apparatus and the method thereof |
| US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
| US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| US6496798B1 (en) * | 1999-09-30 | 2002-12-17 | Motorola, Inc. | Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message |
| JP3559488B2 (ja) * | 2000-02-16 | 2004-09-02 | 日本電信電話株式会社 | 音響信号の階層符号化方法及び復号化方法 |
| US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
| FR2859566B1 (fr) * | 2003-09-05 | 2010-11-05 | Eads Telecom | Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre |
| US7930176B2 (en) * | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
| EP2165328B1 (en) * | 2007-06-11 | 2018-01-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of an audio signal having an impulse-like portion and a stationary portion |
-
2008
- 2008-06-13 DE DE602008005593T patent/DE602008005593D1/de active Active
- 2008-06-13 JP JP2010511709A patent/JP5451603B2/ja active Active
- 2008-06-13 WO PCT/FR2008/051059 patent/WO2009004227A1/fr not_active Ceased
- 2008-06-13 PL PL08805994T patent/PL2171713T3/pl unknown
- 2008-06-13 EP EP08805994A patent/EP2171713B1/fr active Active
- 2008-06-13 AT AT08805994T patent/ATE502377T1/de not_active IP Right Cessation
- 2008-06-13 ES ES08805994T patent/ES2363190T3/es active Active
- 2008-06-13 BR BRPI0813178-3A patent/BRPI0813178B1/pt active IP Right Grant
- 2008-06-13 US US12/602,809 patent/US8719012B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| ATE502377T1 (de) | 2011-04-15 |
| ES2363190T3 (es) | 2011-07-26 |
| DE602008005593D1 (de) | 2011-04-28 |
| EP2171713B1 (fr) | 2011-03-16 |
| US20100145712A1 (en) | 2010-06-10 |
| EP2171713A1 (fr) | 2010-04-07 |
| BRPI0813178A2 (pt) | 2014-12-23 |
| JP5451603B2 (ja) | 2014-03-26 |
| US8719012B2 (en) | 2014-05-06 |
| WO2009004227A1 (fr) | 2009-01-08 |
| PL2171713T3 (pl) | 2011-08-31 |
| JP2010532489A (ja) | 2010-10-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2728329T3 (es) | Aparato y método para decodificar o codificar una señal de audio utilizando valores de información para una banda de reconstrucción | |
| ES2938668T3 (es) | Mejorar la clasificación entre codificación en el dominio del tiempo y codificación en el dominio de la frecuencia | |
| ES2307100T3 (es) | Metodos y aparatos de codificacion de audio mediante replicacion de banda espectral y reconstruccion de alta frecuencia que usan adicion adaptativa de un umbral minimo de ruido y limitacion de la sustitucion de ruido. | |
| ES2732952T3 (es) | Decodificador de audio y procedimiento para proporcionar una información de audio decodificada usando un ocultamiento de error basado en una señal de excitación en el dominio del tiempo | |
| ES2644967T3 (es) | Extensión adaptativa del ancho de banda y aparato para la misma | |
| JP5161212B2 (ja) | Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 | |
| ES2760573T3 (es) | Decodificador de audio y método para proveer una información de audio decodificada usando un ocultamiento de error que modifica una señal de excitación de dominio de tiempo | |
| AU2008339211B2 (en) | A method and an apparatus for processing an audio signal | |
| KR101339857B1 (ko) | 계층적 코더 내에 잡음 성형을 구비한 코딩 | |
| ES2625895T3 (es) | Método y dispositivo para la ocultación eficiente del borrado de tramas en códecs de voz basados en la predicción lineal | |
| ES2858423T3 (es) | Método y dispositivo para el llenado de huecos espectrales | |
| ES2665599T3 (es) | Codificador y descodificador de audio | |
| ES2865099T3 (es) | Procedimiento y aparato de ocultación de errores de trama y procedimiento y aparato de decodificación que usa los mismos | |
| ES2628127T3 (es) | Cuantificador avanzado | |
| JP5285162B2 (ja) | ピーク検出に基づいた選択型スケーリングマスク演算 | |
| ES2687249T3 (es) | Decisión no sonora/sonora para el procesamiento de la voz | |
| KR20090104846A (ko) | 디지털 오디오 신호에 대한 향상된 코딩/디코딩 | |
| ES2870487T3 (es) | Clasificación de audio basada en la calidad perceptual para velocidades de bits bajas o medias | |
| BR112016021165B1 (pt) | dispositivos e métodos de decodificação de áudio e meios de gravação | |
| JP5544370B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
| BRPI0718423B1 (pt) | Método para sintetizar um sinal de áudio digital, dispositivo de síntese de sinal de áudio digital, dispositivo para receber um sinal de áudio digital, e memória de um dispositivo de síntese de sinal de áudio digital | |
| BRPI0813178B1 (pt) | Processo de codificação de um sinal de áudio de entrada, processo de decodificação escalável de um sinal de áudio, codificador de sinal de áudio de entrada, e codificador de um sinal de áudio | |
| US20130268268A1 (en) | Encoding of an improvement stage in a hierarchical encoder | |
| US20090018823A1 (en) | Speech coding |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B15K | Others concerning applications: alteration of classification |
Ipc: H04B 14/04 (2006.01), G10L 19/032 (2013.01), G10L |
|
| B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
| B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
| B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
| B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 12/05/2020, OBSERVADAS AS CONDICOES LEGAIS. |

