ES2997082T3 - Method for predicting bandwith extension frequency band signal, and decoding device - Google Patents

Method for predicting bandwith extension frequency band signal, and decoding device Download PDF

Info

Publication number
ES2997082T3
ES2997082T3 ES20181460T ES20181460T ES2997082T3 ES 2997082 T3 ES2997082 T3 ES 2997082T3 ES 20181460 T ES20181460 T ES 20181460T ES 20181460 T ES20181460 T ES 20181460T ES 2997082 T3 ES2997082 T3 ES 2997082T3
Authority
ES
Spain
Prior art keywords
frequency
frequency band
signal
bandwidth extension
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES20181460T
Other languages
English (en)
Inventor
Zexin Liu
Lei Miao
Fengyan Qi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Crystal Clear Codec LLC
Original Assignee
Crystal Clear Codec LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=51241110&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2997082(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Crystal Clear Codec LLC filed Critical Crystal Clear Codec LLC
Application granted granted Critical
Publication of ES2997082T3 publication Critical patent/ES2997082T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Las realizaciones de la presente invención proporcionan un método para predecir una señal de banda de frecuencia de extensión de ancho de banda, y un dispositivo de decodificación. El método incluye: desmultiplexar un flujo de bits recibido para obtener una señal de dominio de frecuencia; determinar si un intervalo de frecuencia más alto, al que se asigna un bit, de la señal de dominio de frecuencia es menor que un intervalo de frecuencia de inicio preestablecido de una banda de frecuencia de extensión de ancho de banda; cuando es menor, predecir una señal de excitación de la banda de frecuencia de extensión de ancho de banda de acuerdo con una señal de excitación dentro de un rango de banda de frecuencia predeterminado de la señal de dominio de frecuencia y el intervalo de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda; de lo contrario, predecir la señal de excitación de la banda de frecuencia de extensión de ancho de banda de acuerdo con la señal de excitación dentro del rango de banda de frecuencia predeterminado de la señal de dominio de frecuencia, el intervalo de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el intervalo de frecuencia más alto al que se asigna un bit; y predecir la señal de banda de frecuencia de extensión de ancho de banda de acuerdo con la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y una envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda. Las soluciones técnicas de las realizaciones de la presente invención pueden garantizar de manera efectiva la continuidad de las señales de excitación previstas que son de una señal de banda de frecuencia de extensión de ancho de banda y entre un cuadro anterior y un cuadro posterior, garantizando de ese modo la calidad auditiva de una señal de banda de frecuencia de extensión de ancho de banda restaurada. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Método de predicción de señal de banda de frecuencia de extensión de ancho de banda y dispositivo de decodificación
Campo técnico
Las formas de realización de la presente invención se refieren al campo de las tecnologías de comunicaciones y, en particular, a un método para predecir una señal de banda de frecuencia de extensión de ancho de banda, y a un dispositivo de decodificación.
Antecedentes
En el campo de las comunicaciones digitales, existen requisitos de aplicación muy entendidos para la transmisión de voz, imagen, audio y vídeo, como una llamada telefónica, una conferencia de audio y vídeo, la emisión de televisión y el entretenimiento multimedia. Para reducir los recursos ocupados en un proceso de almacenamiento o transmisión de una señal de audio y vídeo, surge una tecnología de compresión y codificación de audio y vídeo. Muchas ramas técnicas diferentes surgen en el desarrollo de la tecnología de compresión y codificación de audio y vídeo, donde una tecnología en la que una señal se codifica y procesa después de ser transformada de un dominio de tiempo a un dominio de frecuencia se aplica ampliamente debido a una buena característica de compresión, y la tecnología también se conoce como una tecnología de codificación de transformación de dominio.
Cada vez se da más importancia a la calidad de audio en la transmisión de comunicaciones; por tanto, es necesario aumentar la calidad de una señal musical en la medida de lo posible partiendo de la premisa de que la calidad de voz está garantizada. Mientras tanto, la cantidad de información de una señal de audio es extremadamente rica; por tanto, no se puede adoptar un modo de codificación de predicción lineal excitada por código (Code Excited Linear Prediction, CELP para abreviar) de voz convencional; en cambio, generalmente, para procesar la señal de audio, una señal de dominio de tiempo se transforma en una señal de dominio de frecuencia mediante la utilización de una tecnología de codificación de audio de codificación de transformación de dominio, mejorando de este modo la calidad de codificación de la señal de audio.
En una tecnología de codificación de audio existente, por lo general, mediante la adopción de una tecnología de transformación, como una transformada rápida de Fourier (Fast Fourier Transform, FFT para abreviar) o una transformada discreta de coseno modificada (Modified Discrete Cosine Transform, MDCT para abreviar) o una transformada discreta de coseno (Discrete Cosine Transform, DCT para abreviar), una señal de banda de alta frecuencia en una señal de audio se transforma de una señal en el dominio de tiempo a una señal en el dominio de frecuencia y, a continuación, se codifica la señal en el dominio de frecuencia. Un ejemplo de códec de última generación se describe en la norma internacional ISO/IEC 14496: “Information technology -Coding of audio-visual objects, Part 3: Audio” (MPEG-4) o en Miyoung Kim y otros, “High-quality scalable audio codec” proc. De SPIE, vol.
6777, págs. 1-11.
En el caso de una velocidad de bits baja, los bits de cuantificación limitados no pueden cuantificar todas las señales de audio que van a cuantificarse; por tanto, un dispositivo de codificación utiliza la mayoría de los bits para cuantificar con precisión las señales de banda de baja frecuencia relativamente importantes en las señales de audio, es decir, los parámetros de cuantificación de las señales de banda de baja frecuencia ocupan la mayoría de los bits, y solo unos pocos bits se utilizan para cuantificar y codificar aproximadamente las señales de banda de alta frecuencia en las señales de audio para obtener envolventes de frecuencia de las señales de banda de alta frecuencia. A continuación, las envolventes de frecuencia de las señales de banda de alta frecuencia y los parámetros de cuantificación de las señales de banda de baja frecuencia se envían a un dispositivo de decodificación en forma de flujo de bits. Los parámetros de cuantificación de las señales de banda de baja frecuencia pueden incluir señales de excitación y envolventes de frecuencia. Cuando se cuantifican, las señales de banda de baja frecuencia también pueden transformarse primero de señales del dominio de tiempo a señales del dominio de frecuencia y, a continuación, las señales del dominio de frecuencia se cuantifican y codifican en señales de excitación.
Por lo general, el dispositivo de decodificación puede restaurar las señales de banda de baja frecuencia según los parámetros de cuantificación que son de las señales de banda de baja frecuencia y en el flujo de bits recibido, a continuación, adquirir las señales de excitación de las señales de banda de baja frecuencia según las señales de banda de baja frecuencia, predecir las señales de excitación de las señales de banda de alta frecuencia mediante la utilización de una extensión de ancho de banda (bandwidth extension, BWE para abreviar) y una tecnología de relleno de espectro y según las señales de excitación de las señales de banda de baja frecuencia, y modificar las señales de excitación previstas de las señales de banda de alta frecuencia según las envolventes de frecuencia que son de las señales de banda de alta frecuencia y en el flujo de bits, para obtener las señales de banda de alta frecuencia previstas. En la presente memoria, las señales de banda de alta frecuencia obtenidas son señales del dominio de frecuencia.
En la tecnología BWE, un segmento de frecuencia más alta al que se asigna un bit puede ser un segmento de frecuencia más alta al que se decodifica una señal de excitación, es decir, no se decodifica ninguna señal de excitación en un segmento de frecuencia mayor que el segmento de frecuencia más alta.
Una banda de frecuencia mayor que el segmento de frecuencia más alta al que se asigna un bit puede denominarse banda de alta frecuencia, y una banda de frecuencia menor que el segmento de frecuencia más alta al que se asigna un bit puede denominarse banda de baja frecuencia. Que una señal de excitación de una señal de banda de alta frecuencia se predice según una señal de excitación de una señal de banda de baja frecuencia puede ser específicamente de la siguiente manera: el segmento de frecuencia más alta al que se asigna un bit se utiliza como centro, una señal de excitación que es de la señal de banda de baja frecuencia y menor que el segmento de frecuencia más alta al que se asigna un bit se copia en una señal de banda de alta frecuencia que es mayor que el segmento de frecuencia más alta al que se asigna un bit y cuyo ancho de banda es equivalente al ancho de banda de la señal de banda de baja frecuencia, y la señal de excitación se utiliza como la señal de excitación de la señal de banda de alta frecuencia.
La técnica anterior presenta las siguientes desventajas: según el método anterior para predecir una señal de banda de frecuencia de extensión de ancho de banda en la técnica anterior, una señal de excitación de una señal de banda de alta frecuencia se predice según una señal de excitación de una señal de banda de baja frecuencia, las señales de excitación de diferentes señales de banda de baja frecuencia pueden copiarse en una misma señal de banda de alta frecuencia en diferentes tramas, causando discontinuidad de la señal de excitación y reduciendo la calidad de la señal de banda de frecuencia de extensión de ancho de banda predicha, reduciendo de este modo la calidad auditiva de una señal de audio.
El documento EP 2 186 086 A1 divulga un método para la recuperación espectral en la decodificación espectral de una señal de audio, que incluye la obtención de un conjunto inicial de coeficientes espectrales que representan la señal de audio, y la determinación de una frecuencia de transición. La frecuencia de transición se adapta a un contenido espectral de la señal de audio. Los agujeros espectrales en el conjunto inicial de coeficientes espectrales por debajo de la frecuencia de transición se rellenan con ruido y el conjunto inicial de coeficientes espectrales se amplía en ancho de banda por encima de la frecuencia de transición.
Sumario
Las formas de realización de la presente invención proporcionan un método para predecir una señal de banda de frecuencia de extensión de ancho de banda, y un dispositivo de decodificación, para mejorar la calidad de la señal de banda de frecuencia de extensión de ancho de banda predicha, mejorando de este modo la calidad auditiva de una señal de audio.
Según un primer aspecto, una forma de realización de la presente invención proporciona un método para predecir una señal de banda de frecuencia de extensión de ancho de banda según la reivindicación 1.
Según un segundo aspecto, una forma de realización de la presente invención proporciona un dispositivo de decodificación según la reivindicación 8.
Breve descripción de los dibujos
Para describir las soluciones técnicas en las formas de realización de la presente invención o en la técnica anterior con mayor claridad, a continuación se presentan brevemente los dibujos adjuntos necesarios para describir las formas de realización o la técnica anterior. Aparentemente, los dibujos adjuntos en la siguiente descripción muestran algunas formas de realización de la presente invención, y un experto en la materia puede derivar otros dibujos de estos dibujos adjuntos sin esfuerzos creativos.
La figura 1 es un diagrama estructural esquemático de un dispositivo de codificación de la técnica anterior;
la figura 2 es un diagrama estructural esquemático de un dispositivo de decodificación de la técnica anterior;
la figura 3 es un diagrama de flujo de un método para predecir una señal de banda de frecuencia de extensión de ancho de banda según una forma de realización de la presente invención;
la figura 4 es un diagrama de flujo de un método para predecir una señal de banda de frecuencia de extensión de ancho de banda según otra realización de la presente invención;
la figura 5a y la figura 5b son unos diagramas esquemáticos de una banda de frecuencia según una forma de realización de la presente invención;
la figura 6 es un diagrama estructural esquemático de un dispositivo de decodificación según una forma de realización de la presente invención;
la figura 7 es un diagrama estructural esquemático de un dispositivo de decodificación según otra realización de la presente invención; y
la figura 8 es un diagrama de bloques de un dispositivo de decodificación 80 según otra realización de la presente invención.
Descripción de formas de realización
Para aclarar los objetivos, soluciones técnicas y ventajas de las formas de realización de la presente invención, a continuación se describen de forma clara y completa las soluciones técnicas en las formas de realización de la presente invención con referencia a los dibujos adjuntos en las formas de realización de la presente invención. Aparentemente, las formas de realización descritas son algunas pero no todas las formas de realización de la presente invención.
En el campo del procesamiento digital de señales, un códec de audio y un códec de vídeo se aplican ampliamente a diversos dispositivos electrónicos, como un teléfono móvil, un aparato inalámbrico, un asistente personal de datos (PDA), un ordenador de mano o portátil, un receptor/navegador GPS, una cámara, un reproductor de audio/vídeo, una videocámara, un videograbador y un dispositivo de monitorización. Generalmente, este tipo de dispositivo electrónico incluye un codificador de audio o un decodificador de audio, en donde el codificador o decodificador de audio puede ser implementado directamente por un circuito digital o un chip como un DSP (procesador de señal digital), o ser implementado accionando, mediante código de software, un procesador para ejecutar un proceso en el código de software.
Por ejemplo, un codificador de audio primero realiza el procesamiento de trama en una señal de entrada para obtener datos de dominio de tiempo con una trama de 20 ms, luego realiza el procesamiento de ventana en los datos de dominio de tiempo para obtener una señal después de la ventana, realiza la transformación de dominio de frecuencia en la señal de dominio de tiempo después de la ventana, para transformar la señal de un dominio de tiempo a un dominio de frecuencia, codifica la señal de dominio de frecuencia, y transmite la señal de dominio de frecuencia codificada a un lado del decodificador. Después de recibir un flujo de bits comprimido transmitido por un lado codificador, el lado decodificador realiza una operación de decodificación correspondiente sobre la señal, realiza, sobre una señal del dominio de frecuencia obtenida por decodificación una transformación inversa correspondiente a la transformación utilizada por el extremo codificador, para transformar la señal del dominio de frecuencia al dominio de tiempo, y realiza un procesamiento posterior sobre la señal del dominio de tiempo para obtener una señal sintetizada, es decir, una señal emitida por el lado decodificador.
La figura 1 es un diagrama estructural esquemático de un dispositivo de codificación de la técnica anterior. Como se muestra en la figura 1, el dispositivo de codificación de la técnica anterior incluye un módulo de transformación de tiempo-frecuencia 10, un módulo de extracción de envolvente 11, un módulo de codificación y cuantificación de envolvente 12, un módulo de asignación de bits 13, un módulo de generación de excitación 14, un módulo de codificación y cuantificación de excitación 15, y un módulo de multiplexación 16.
Como se muestra en la figura 1, el módulo de transformación de tiempo-frecuencia 10 está configurado para: recibir una señal de audio de entrada, y luego transformar la señal de audio de una señal en el dominio de tiempo a una señal en el dominio de frecuencia. A continuación, el módulo de extracción de envolvente 11 extrae una envolvente de frecuencia de la señal de dominio de frecuencia obtenida mediante una transformación por el módulo de transformación de tiempo-frecuencia 10, en donde la envolvente de frecuencia también puede denominarse factor de normalización de subbanda. En la presente memoria, la envolvente de frecuencia incluye una envolvente de frecuencia de una señal de banda de baja frecuencia y una envolvente de frecuencia de una señal de banda de alta frecuencia en la señal del dominio de frecuencia. El módulo de cuantificación y codificación de envolvente 12 realiza el procesamiento de cuantificación y codificación en la envolvente de frecuencia obtenida por el módulo de extracción de envolvente 11, para obtener una envolvente de frecuencia cuantificada y codificada. El módulo de asignación de bits 13 determina la asignación de bits de cada subbanda en función de la envolvente de frecuencia cuantificada. El módulo de generación de excitación 14 realiza, utilizando la información sobre la envolvente cuantificada y codificada obtenida por el módulo de cuantificación y codificación de envolvente 12, un procesamiento de normalización sobre la señal en el dominio de frecuencia obtenida por el módulo de transformación de tiempo-frecuencia 10, para obtener una señal de excitación, es decir, una señal en el dominio de frecuencia normalizada, y la señal de excitación también incluye una señal de excitación de la señal de banda de alta frecuencia y una señal de excitación de la señal de banda de baja frecuencia. El módulo de cuantificación y codificación de excitación 15 realiza, según la asignación de bits de cada subbanda asignada por el módulo de asignación de bits 13, el procesamiento de cuantificación y codificación de la señal de excitación generada por el módulo de generación de excitación 14, para obtener una señal de excitación cuantificada. El módulo de multiplexación 16 multiplexa por separado la envolvente de frecuencia cuantificada por el módulo de codificación y cuantificación de envolvente 12 y la señal de excitación cuantificada por el módulo de codificación y cuantificación de excitación 15 en un flujo de bits, y emite el flujo de bits a un dispositivo de decodificación.
La figura 2 es un diagrama estructural esquemático de un dispositivo de decodificación de la técnica anterior. Como se muestra en la figura 2, el dispositivo de decodificación existente incluye un módulo de demultiplexación 20, un módulo de decodificación de envolvente de frecuencia 21, un módulo de adquisición de asignación de bits 22, un módulo de decodificación de señal de excitación 23, un módulo de extensión de ancho de banda 24, un módulo de restauración de señal de dominio de frecuencia 25, y un módulo de transformación de frecuencia-tiempo 26.
Como se muestra en la figura 2, el módulo de demultiplexación 20 recibe un flujo de bits enviado por un lado de un dispositivo de codificación, y demultiplexa (incluyendo decodificación) el flujo de bits para obtener por separado una envolvente de frecuencia cuantificada y una señal de excitación cuantificada. El módulo de decodificación de envolvente de frecuencia 21 adquiere la envolvente de frecuencia cuantificada a partir de una señal obtenida mediante demultiplexación por el módulo de demultiplexación 20, y realizar la cuantificación y decodificación para obtener una envolvente de frecuencia. El módulo de adquisición de asignación de bits 22 determina una asignación de bits de cada subbanda en función de la envolvente de frecuencia obtenida por el módulo de decodificación de envolvente de frecuencia 21. El módulo de decodificación de señal de excitación 23 adquiere la señal de excitación cuantificada a partir de la señal obtenida por demultiplexación por el módulo de demultiplexación 20, y realiza, según la asignación de bits que es de cada subbanda y se obtiene por el módulo de adquisición de asignación de bits 22, la cuantificación y decodificación para obtener una señal de excitación. El módulo de extensión de ancho de banda 24 realiza la extensión en un ancho de banda completo según la señal de excitación obtenida por el módulo de decodificación de señal de excitación 23. Específicamente, una señal de excitación de una señal de banda de alta frecuencia se extiende utilizando una señal de excitación de una señal de banda de baja frecuencia. Cuando se cuantifica y codifica una señal de excitación y una señal de envolvente, un módulo de cuantificación y codificación de excitación 15 y un módulo de cuantificación y codificación de envolvente 12 utilizan la mayoría de bits para cuantificar una señal de la señal de banda de baja frecuencia relativamente importante, y utilizan pocos bits para cuantificar una señal de la señal de banda de alta frecuencia, y la señal de excitación de la señal de banda de alta frecuencia puede incluso excluirse. Por tanto, el módulo de extensión de ancho de banda 24 necesita utilizar la señal de excitación de la señal de banda de baja frecuencia para extender la señal de excitación de la señal de banda de alta frecuencia, obtenido de este modo una señal de excitación de una banda de frecuencia completa. El módulo de restauración de señal de dominio de frecuencia 25 está conectado por separado al módulo de decodificación de envolvente de frecuencia 21 y al módulo de ampliación de ancho de banda 24, y el módulo de restauración de señal de dominio de frecuencia 25 restaura una señal en el dominio de frecuencia según la envolvente de frecuencia obtenida por el módulo de decodificación de envolvente de frecuencia 21 y la señal de excitación que es de la banda de frecuencia completa y se obtiene por el módulo de ampliación de ancho de banda 24. El módulo de transformación frecuencia-tiempo 26 transforma la señal del dominio de frecuencia restaurada por el módulo de restauración de señal de dominio de frecuencia 25 en una señal del dominio de tiempo, obtenido de este modo una señal de audio de entrada original.
La figura 1 y la figura 2 son diagramas estructurales de un dispositivo de codificación y un dispositivo de decodificación correspondiente de la técnica anterior. Según los procesos de procesamiento del dispositivo de codificación y el dispositivo de decodificación de la técnica anterior que se muestran en la figura 1 y la figura 2, puede saberse que en la técnica anterior, una señal de excitación y una información de envolvente que son de una señal de banda de baja frecuencia y se utilizan cuando el dispositivo de decodificación restaura una señal de dominio de frecuencia de la señal de banda de baja frecuencia se envían por un lado del dispositivo de codificación. Por tanto, la restauración de la señal de dominio de frecuencia de la señal de banda de baja frecuencia es relativamente precisa. Para obtener una señal de dominio de frecuencia de una señal de banda de alta frecuencia, es necesario utilizar primero la señal de excitación de la señal de banda de baja frecuencia para predecir una señal de excitación de la señal de banda de alta frecuencia y, a continuación, utilizar la información de envolvente que es de la señal de banda de alta frecuencia y es enviada por el lado del dispositivo de codificación, para modificar la señal de excitación predicha de la señal de banda de alta frecuencia. Cuando se predice la señal de dominio de frecuencia de la señal de banda de alta frecuencia, el dispositivo de codificación no considera un tipo de señal y utiliza una misma envolvente de frecuencia. Por ejemplo, cuando el tipo de señal es una señal armónica, un intervalo de subbanda cubierto por la envolvente de frecuencia utilizada es relativamente estrecho (menos que un intervalo de subbanda cubierto desde una cresta hasta un valle de un armónico). Cuando se utiliza la envolvente de frecuencia para modificar la señal de excitación prevista de la señal de banda de alta frecuencia, se introducen más ruidos, por lo que existe un error relativamente grande entre la señal de banda de alta frecuencia obtenida por modificación y una señal de banda de alta frecuencia real, afectando gravemente a un índice de precisión de predicción de la señal de banda de alta frecuencia, y reduciendo la calidad de la señal de banda de alta frecuencia prevista y reduciendo la calidad auditiva de una señal de audio. Además, utilizando la técnica anterior en la que una señal de excitación de una señal de banda de alta frecuencia se predice según una señal de excitación de una señal de banda de baja frecuencia, las señales de excitación de diferentes señales de banda de baja frecuencia pueden copiarse en una misma señal de banda de alta frecuencia de diferentes tramas, causando discontinuidad de la señal de excitación, reduciendo la calidad de la señal de banda de alta frecuencia predicha, y reduciendo de este modo la calidad auditiva de una señal de audio. Por tanto, las siguientes soluciones técnicas de las formas de realización de la presente invención pueden utilizarse para resolver el problema técnico anterior.
La figura 3 es un diagrama de flujo de un método para predecir una señal de banda de frecuencia de extensión de ancho de banda según una forma de realización de la presente invención. En esta forma de realización, el método para predecir una señal de banda de frecuencia de extensión de ancho de banda puede ser ejecutado por un dispositivo de decodificación. Como se muestra en la figura 3, en esta forma de realización, el método para predecir una señal de banda de frecuencia de extensión de ancho de banda puede incluir específicamente las siguientes etapas:
100. El dispositivo de decodificación demultiplexa un flujo de bits recibido y decodifica el flujo de bits demultiplexado para obtener una señal en el dominio de frecuencia.
101. El dispositivo de decodificación determina si un segmento de frecuencia más alta, al que se asigna un bit, de la señal de dominio de frecuencia es menor que un segmento de frecuencia de inicio preestablecido de una banda de frecuencia de extensión de ancho de banda; cuando el segmento de frecuencia más alta al que se asigna un bit es menor que el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, ejecuta la etapa 102; de lo contrario, cuando el segmento de frecuencia más alta al que se asigna un bit es mayor o igual que el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, ejecuta la etapa 103.
102. El dispositivo de decodificación predice una señal de excitación de la banda de frecuencia de extensión de ancho de banda según una señal de excitación dentro de un intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, y ejecuta la etapa 104.
103. El dispositivo de decodificación predice la señal de excitación de la banda de frecuencia de extensión de ancho de banda según la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta al que se asigna un bit, y ejecuta la etapa 104.
104. El dispositivo de decodificación predice la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y una envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda.
Según el método para predecir una señal de banda de frecuencia de extensión de ancho de banda en esta forma de realización, se establece un segmento de frecuencia de inicio de extensión de ancho de banda, y se comparan un segmento de frecuencia más alta al que se decodifica una señal de dominio de frecuencia y el segmento de frecuencia de inicio, para realizar la restauración de excitación de una banda de frecuencia de extensión de ancho de banda, de modo que las señales de excitación extendidas sean continuas entre tramas, y se mantenga un segmento de frecuencia de una señal de excitación decodificada, asegurando de este modo la calidad auditiva de una señal de banda de frecuencia de extensión de ancho de banda restaurada y mejorando la calidad auditiva de una señal de audio de salida.
Opcionalmente, sobre la base a las soluciones técnicas de la forma de realización anterior, también se pueden incluir las siguientes soluciones técnicas de ampliación para formar una forma de realización ampliada de la forma de realización mostrada en la figura 3. En esta forma de realización ampliada, el método puede incluir además lo siguiente antes de la etapa 100:
(a) El dispositivo de decodificación recibe un flujo de bits enviado por un dispositivo de codificación, en donde el flujo de bits transporta un parámetro de cuantificación de una señal de banda de baja frecuencia y una envolvente de frecuencia de la señal de banda de frecuencia de extensión de ancho de banda. En esta forma de realización, el parámetro de cuantificación de la señal de banda de baja frecuencia se utiliza para identificar unívocamente la señal de banda de baja frecuencia.
(b) El dispositivo de decodificación adquiere una señal de excitación de la señal de banda de baja frecuencia según el parámetro de cuantificación de la señal de banda de baja frecuencia.
Específicamente, para un proceso específico de adquisición de la señal de excitación de la señal de banda de baja frecuencia por el dispositivo de decodificación según el parámetro de cuantificación de la señal de banda de baja frecuencia, remítase a la técnica anterior. Por ejemplo, cuando el parámetro de cuantificación de la señal de banda de baja frecuencia es la señal de excitación de la señal de banda de baja frecuencia y una envolvente de frecuencia de la señal de banda de baja frecuencia, que el dispositivo de decodificación adquiera una señal de excitación de la señal de banda de baja frecuencia según el parámetro de cuantificación de la señal de banda de baja frecuencia puede ser específicamente de la siguiente manera: el dispositivo de decodificación restaura en primer lugar la señal de banda de baja frecuencia (en la presente memoria, la señal de banda de baja frecuencia es una señal en el dominio de frecuencia) según la señal de excitación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de baja frecuencia, y a continuación, realiza un procesamiento de normalización autoadaptativa en la señal de banda de baja frecuencia, para obtener la señal de excitación de la señal de banda de baja frecuencia. Cuando se utiliza la señal de excitación que es de la señal de banda de baja frecuencia y en el parámetro de cuantificación para predecir la señal de excitación de la banda de frecuencia de extensión de ancho de banda puede satisfacer un requisito de energía de una señal de banda de alta frecuencia, la señal de excitación que es de la señal de banda de baja frecuencia y en el parámetro de cuantificación puede utilizarse directamente para predecir la señal de excitación de la banda de frecuencia de extensión de ancho de banda.
La manera anterior de procesamiento de normalización autoadaptativa puede utilizar las siguientes maneras:
(1) El dispositivo de decodificación restaura la señal de banda de baja frecuencia utilizando el parámetro de cuantificación decodificado de la señal de banda de baja frecuencia (como la señal de excitación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de baja frecuencia), se establece una ventana móvil en un coeficiente de dominio de frecuencia, se calcula un valor medio de las amplitudes de coeficientes de dominio de frecuencia en cada ventana móvil, en donde una cantidad de valores medios calculados es la misma que una cantidad de coeficientes de dominio de frecuencia de la señal de banda de baja frecuencia, y la señal de banda de baja frecuencia (la señal de dominio de frecuencia) se divide entre un valor medio correspondiente de amplitudes de coeficiente de dominio de frecuencia, para obtener la señal de excitación de la señal de banda de baja frecuencia. Por ejemplo, la señal de banda de baja frecuencia presenta N1 coeficientes de dominio de frecuencia. Se calcula un valor medio del primer coeficiente de dominio de frecuencia hasta el décimo coeficiente de dominio de frecuencia, se calcula un valor medio del segundo coeficiente del dominio de frecuencia hasta el undécimo coeficiente del dominio de frecuencia, y se calcula un valor medio del tercer coeficiente del dominio de frecuencia hasta el duodécimo coeficiente del dominio de frecuencia. Por analogía, se calculan los valores medios N1. A continuación, N1 señales de banda de baja frecuencia (señales del dominio de la frecuencia) se dividen entre los valores medios correspondientes, para obtener la señal de excitación de la señal de banda de baja frecuencia (la señal de dominio de frecuencia).
(2) El dispositivo de decodificación restaura la señal de banda de baja frecuencia (la señal del dominio de frecuencia) decodificando el parámetro de cuantificación de la señal de banda de baja frecuencia (como la señal de excitación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de baja frecuencia). Para una señal armónica, se calcula un valor medio de N (N>1) envolventes de frecuencia adyacentes de la señal de banda de baja frecuencia y se utiliza como envolvente de frecuencia de N subbandas adyacentes, y todas las señales de dominio de frecuencia de las N subbandas adyacentes se dividen entre el valor medio, para obtener una señal de excitación de las señales de banda de baja frecuencia de las N subbandas adyacentes. Por analogía, se calcula la señal de excitación de toda la señal de banda de baja frecuencia. Para una señal no armónica, cada subbanda de la señal de banda de baja frecuencia se divide además en M (M>1) subbandas pequeñas, se calcula además una envolvente de frecuencia para cada subbanda pequeña, y una señal de dominio de frecuencia de la subbanda pequeña se divide entre la envolvente de frecuencia calculada de la subbanda pequeña, para obtener una señal de excitación de la subbanda pequeña. Por analogía, se obtiene la señal de excitación de toda la señal de banda de baja frecuencia. Para un proceso detallado de procesamiento de normalización autoadaptativa, remítase a los registros en la técnica anterior. Los detalles no se describen de nuevo en la presente memoria.
Opcionalmente, en esta forma de realización ampliada, antes de la etapa 104, en concreto, el método puede incluir además lo siguiente: el dispositivo de decodificación decodifica el flujo de bits para obtener la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, de modo que pueda ejecutarse la etapa 104.
Opcionalmente, antes de la etapa 104, en concreto, el método puede incluir además lo siguiente: el dispositivo de decodificación decodifica el flujo de bits para obtener un tipo de señal, y adquiere la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda según el tipo de señal.
Por ejemplo, cuando el tipo de señal es una señal no armónica, el dispositivo de decodificación demultiplexa el flujo de bits recibido y decodifica el flujo de bits demultiplexado para obtener la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda. Cuando el tipo de señal es una señal armónica, el dispositivo de decodificación demultiplexa el flujo de bits recibido, decodifica el flujo de bits demultiplexado para obtener una envolvente de frecuencia inicial de la banda de frecuencia de extensión de ancho de banda, y utiliza un valor que se obtiene realizando el cálculo de ponderación en la envolvente de frecuencia inicial y N envolventes de frecuencia inicial adyacentes como la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, donde N es mayor o igual a 1.
Al utilizar el método para predecir una señal de banda de frecuencia de extensión de ancho de banda en la forma de realización anterior, se puede garantizar eficazmente la continuidad de las señales de excitación predichas que son de una señal de banda de frecuencia de extensión de ancho de banda y entre una trama anterior y una trama posterior, asegurando de este modo la calidad auditiva de una señal de banda de frecuencia de extensión de ancho de banda restaurada y mejorando la calidad auditiva de una señal de audio.
La figura 4 es un diagrama de flujo de un método para predecir una señal de banda de frecuencia de extensión de ancho de banda según otra realización de la presente invención. En base a la forma de realización mostrada en la figura 3, en esta forma de realización, las soluciones técnicas de la presente invención se introducen con más detalle en el método para predecir una señal de banda de frecuencia de extensión de ancho de banda. En esta forma de realización, el método para predecir una señal de banda de frecuencia de extensión de ancho de banda puede incluir específicamente el siguiente contenido:
200. Un dispositivo de decodificación recibe un flujo de bits enviado por un dispositivo de codificación, y decodifica el flujo de bits recibido para obtener una señal en el dominio de frecuencia.
El flujo de bits transporta un parámetro de cuantificación de una señal de banda de baja frecuencia y una envolvente de frecuencia de la señal de banda de frecuencia de extensión de ancho de banda.
201. El dispositivo de decodificación adquiere una señal de excitación de la señal de banda de baja frecuencia según el parámetro de cuantificación de la señal de banda de baja frecuencia.
202. El dispositivo de decodificación determina una frecuencia más alta fúltima sfm, a la que se asigna un bit, de la señal de dominio de frecuencia según el parámetro de cuantificación de la señal de banda de baja frecuencia.
En esta forma de realización, la fúltima_sfm se utiliza para representar el segmento de frecuencia más alta, al que se asigna un bit, de la señal en el dominio de frecuencia.
203. El dispositivo de decodificación determina si la fúltima sfm es menor que una frecuencia de inicio preestablecida fbwe inicio de una banda de frecuencia de extensión de ancho de banda de la señal de dominio de frecuencia; cuando fúltima sfm es menor que fbwe inicio, ejecuta la etapa 204; de lo contrario, y cuando fúltima sfm es mayor o igual que fbwe inicio, ejecuta la etapa 205.
Haciendo referencia a los diagramas esquemáticos de los segmentos de frecuencia en una banda de frecuencia en la figura 5a y la figura 5b, una señal de dominio de frecuencia a la cual un bit es asignado puede ser directamente obtenida por decodificación; sin embargo, una señal de excitación de una banda de frecuencia de extensión de ancho de banda necesita ser obtenida por predicción según una señal de dominio de frecuencia decodificada, es decir, una señal de excitación dentro de un intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia es seleccionada para predecir la señal de excitación de la banda de frecuencia de extensión de ancho de banda. Cuando una relación de tamaño entre fúltima sfm y fbwe inicio es diferente, una frecuencia de inicio de extensión y un intervalo de extensión de señal son diferentes. Una parte sombreada mostrada en las figuras representa un intervalo de banda de frecuencia, dentro del cual una señal de excitación necesita ser copiada desde una banda de baja frecuencia, de la banda de frecuencia de extensión de ancho de banda, una parte sombreada en la figura 5a es desde el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda hasta un segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, y una parte sombreada en la figura 5b es desde el segmento de frecuencia más alta al que se asigna un bit hasta el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda. En el caso de la figura 5a, la señal de excitación copiada incluye n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia. En el caso de la figura 5b, la señal de excitación copiada incluye una señal de excitación desde fexcjnicio del intervalo de banda de frecuencia predeterminado hasta una frecuencia fexc fin del intervalo de banda de frecuencia predeterminado y las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado, en donde n es un número entero o un número no entero mayor que 0.
En esta forma de realización, fbwe inicio se utiliza para representar el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda de la señal de dominio de frecuencia. La selección de fbwe inicio está relacionada con una tasa de codificación (es decir, la suma de bits). Una tasa de codificación más alta indica una frecuencia de inicio preestablecida fbwe inicio más alta que es de la banda de frecuencia de extensión de ancho de banda y puede ser seleccionada. Por ejemplo, para una señal de banda ultraancha, cuando la velocidad de codificación es de 24 kbps, la frecuencia de inicio preestablecida fbwe inicio de la banda de frecuencia de extensión de ancho de banda de la señal de dominio de frecuencia es igual a 6.4 kHz; cuando la velocidad de codificación es de 32 kbps, la frecuencia de inicio preestablecida fbwc inicio que es de la banda de frecuencia de extensión de ancho de banda y de la señal de dominio de frecuencia es igual a 8 kHz.
204. El dispositivo de decodificación predice una señal de excitación de la banda de frecuencia de extensión de ancho de banda según una señal de excitación dentro de un intervalo de banda de frecuencia predeterminado de fexcjnicio a fexcjin de la señal de dominio de frecuencia y la frecuencia de inicio preestablecida fbwcjniciode la banda de frecuencia de extensión de ancho de banda, y ejecuta la etapa 206.
En esta forma de realización, el intervalo de banda de frecuencia predeterminado de la señal del dominio de frecuencia es un intervalo de banda de frecuencia predeterminado que va desde fexc inicio hasta fexc fin y en la señal de banda de baja frecuencia, fexc inicio es un segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda que es de la señal del dominio de frecuencia y en la señal de banda de baja frecuencia, y fexc fin es un intervalo de frecuencia final preestablecido de la banda de frecuencia de extensión de ancho de banda que es de la señal del dominio de frecuencia y en la señal de banda de baja frecuencia, donde fexc fin es mayor que fexc inicio
Por ejemplo, el dispositivo de decodificación puede hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia, y utilizar las n copias de la señal de excitación como una señal de excitación entre la frecuencia de inicio preestablecida fbwc inicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, donde n es un número entero o no entero mayor que 0, y n es igual a la relación entre una cantidad de segmentos de frecuencia entre la frecuencia de inicio preestablecida fbwejnicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda y una cantidad de segmentos de frecuencia dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal del dominio de frecuencia.
Por ejemplo, en una forma de realización específica, cuando la predicción se inicia desde la frecuencia de inicio preestablecida fbwe inicio de la banda de frecuencia de extensión de ancho de banda, el dispositivo de decodificación puede hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia, y utilizar las n copias de la señal de excitación como una señal de banda de frecuencia de extensión de ancho de banda entre la frecuencia de inicio preestablecida fbwejnicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda. En esta forma de realización, n puede ser un número entero positivo o un decimal, y n es igual a la relación entre la cantidad de segmentos de frecuencia entre la frecuencia de inicio preestablecida fbwe inicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda y la cantidad de segmentos de frecuencia dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia. La selección del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia está relacionada con un tipo de señal y una tasa de codificación. Por ejemplo, en el caso de una tasa relativamente baja, para una señal armónica, se selecciona una señal de banda de frecuencia relativamente baja con una codificación relativamente mejor en las señales de banda de baja frecuencia, y para una señal no armónica, se selecciona una señal de banda de frecuencia relativamente alta con una codificación relativamente peor en las señales de banda de baja frecuencia; en el caso de una tasa relativamente alta, para una señal armónica, se puede seleccionar una banda de frecuencia relativamente alta en las señales de banda de baja frecuencia.
El segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda se refiere a la frecuencia más alta, a la que debe emitirse una señal, de una banda de frecuencia o de una frecuencia específica. Por ejemplo, una señal de banda ancha puede ser de 7 kHz u 8 kHz, y una señal de banda ultraancha puede ser de 14 kHz o 16 kHz u otra frecuencia específica preestablecida.
En esta forma de realización, cuando la predicción se inicia desde la frecuencia de inicio preestablecida fbwe inicio de la banda de frecuencia de extensión de ancho de banda, el dispositivo de decodificación hace n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia, y utiliza las n copias de la señal de excitación como la señal de banda de frecuencia de extensión de ancho de banda entre la frecuencia de inicio preestablecida fbwe inicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda puede implementarse específicamente de la siguiente manera: cuando se inicia la predicción a partir de la frecuencia de inicio preestablecida fbwe inicio de la banda de frecuencia de extensión de ancho de banda, el dispositivo de decodificación realiza secuencialmente copias enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal del dominio de frecuencia y copias no enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal del dominio de frecuencia, y utiliza las dos partes de señales de excitación como señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia de inicio preestablecida fbwe inicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, donde la parte no entera de n es menor que 1.
En esta forma de realización, las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal en el dominio de frecuencia pueden hacerse en secuencia, es decir, una copia de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexcjnicio hasta fexcjin de la señal en el dominio de frecuencia se hace cada vez hasta que se hacen las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal en el dominio de frecuencia; o también puede realizarse una copia en espejo (o denominada copia plegada), es decir, cuando se realizan las copias enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal del dominio de frecuencia, se realizan alternativamente en secuencia una copia hacia adelante (es decir, desde fexc inicio hasta fexc fin) y una copia hacia atrás (es decir, desde fexc fin hasta fexc inicio) hasta completar n copias.
Alternativamente, cuando la predicción se inicia desde la frecuencia más alta preestablecida fsuperior_sfm de la banda de frecuencia de extensión de ancho de banda, el dispositivo de decodificación puede hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia, y utilizar las n copias de la señal de excitación como una señal de excitación de alta frecuencia entre la frecuencia de inicio preestablecida W inicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, que puede implementarse específicamente de la siguiente manera: cuando se inicia la predicción a partir de la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, el dispositivo de decodificación realiza secuencialmente copias no enteras en las n copias de la señal de excitación de baja frecuencia dentro del intervalo de banda de frecuencia predefinido desde fexc inicio hasta fexc fin y copias enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado entre fexc inicio y fexc fin de la señal del dominio de frecuencia, y utiliza las dos partes de señales de excitación como la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia de inicio preestablecida W inicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, donde la parte no entera de n es menor que 1.
Específicamente, cuando la predicción se inicia desde la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia pertenece a la copia por bloque. Por ejemplo, el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda es de 14 kHz, y fexc inicio a fexc fin es de 1.6 kHz a 4 kHz. Cuando se realizan 0,5 copias de una señal de excitación de baja frecuencia de fexc inicio a fexc fin, es decir, de 1.6 kHz a 2.8 kHz. Utilizando la solución de esta etapa, la señal de excitación en la banda de baja frecuencia de 1.6 kHz a 2.8 kHz puede copiarse en una banda de frecuencia de extensión de ancho de banda entre (14-1.2) kHz y 14 kHz y utilizarse como señal de excitación de esta banda de frecuencia de extensión de ancho de banda. En este caso, 1.6 kHz se copia en (14-1.2) kHz, y 2.8 kHz se copia en 14 kHz.
De las dos maneras anteriores, independientemente de si se predice la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia de inicio W inicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda a partir de la frecuencia de inicio preestablecida W inicio de la banda de frecuencia de extensión de ancho de banda o a partir de la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, los resultados de la señal de excitación que se obtiene finalmente por predicción y es de la banda de frecuencia de extensión de ancho de banda entre la frecuencia de inicio preestablecida fbwcjniciode la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda son los mismos.
En un proceso de implementación de la solución anterior, un cociente y un resto pueden calcularse primero y adquirirse dividiendo un ancho de banda de frecuencia entre la frecuencia de inicio preestablecida W inicio de la banda de frecuencia de extensión de ancho de banda y una frecuencia más alta fsuperior sfm de una señal de banda de frecuencia entre un ancho de banda de frecuencia entre fexc inicio y fexc fin. En la presente memoria, el cociente es la parte entera de n, y el resto/(fexc_fin-fexcjnicio) es la parte no entera de n. La parte entera de n y la parte no entera de n pueden calcularse primero de esta manera, y luego, la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia de inicio preestablecida W inicio de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda se predice de la manera anterior.
205. El dispositivo de decodificación predice la señal de excitación de la banda de frecuencia de extensión de ancho de banda según la señal de excitación dentro de un intervalo comprendido entre fexc inicio y fexc fin, W inicio y fúltima sfm, y ejecuta la etapa 206.
Por ejemplo, el dispositivo de decodificación puede hacer una copia de una señal de excitación desde el m-ésimo segmento de frecuencia por encima del segmento de frecuencia de inicio fexc inicio del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia hasta el segmento de frecuencia final fexc fin del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como señal de excitación entre la frecuencia más alta fúltima sfm, a la que se asigna un bit, de la señal del dominio de frecuencia y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, donde n es 0 o un número entero o un número no entero mayor que 0, y m es un valor de una cantidad de segmentos de frecuencia entre la frecuencia más alta fúltima sfm a la que se asigna un bit y la frecuencia de inicio preestablecida W inicio de la banda de frecuencia de extensión de ancho de banda.
Por ejemplo, cuando la predicción se inicia desde la frecuencia más alta fúltima sfm a la que se asigna un bit, el dispositivo de decodificación puede hacer secuencialmente una copia de la señal de excitación desde (fexc inicio (fúltima sfm-fbwe inicio)) hasta fexc fin dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y n copias de la señal de excitación dentro de un intervalo de banda de frecuencia de excitación desde fexc inicio hasta fexc fin, y utilizar las dos partes de señales de excitación como la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia más alta fúltima sfm a la que se asigna un bit y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, donde n es 0 o un número entero o un número no entero mayor que 0.
En una implementación específica, cuando la predicción se inicia desde la frecuencia más alta fúltima sfm a la que se asigna un bit, el dispositivo de decodificación puede hacer secuencialmente una copia de la señal de excitación desde (fexcjn¡c¡o+(fúlt¡ma_sfm-fbwejn¡c¡o)) hasta fexc_fin dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc ¡n¡c¡o hasta fexc fin de la señal de dominio de frecuencia, y copias no enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc ¡n¡c¡o hasta fexc fin de la señal de dominio de frecuencia, y utilizar las tres partes de señales de excitación como la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia más alta fúltima sfm a la que se asigna un bit y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, donde la parte no entera de n es menor que 1.
Alternativamente, cuando la predicción se inicia desde la frecuencia más alta fsuper¡or_sfm de la banda de frecuencia de extensión de ancho de banda, el dispositivo de decodificación puede hacer secuencialmente n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc ¡n¡c¡o hasta fexc fin de la señal de dominio de frecuencia y una copia de la señal de excitación desde (fexc ¡n¡c¡o+(fúlt¡ma sfm-fbwe inicio)) hasta fexc fin dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia más alta fúltima sfm a la que se asigna un bit y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, donde de forma similar, n es 0 o un número entero o un número no entero mayor que 0.
En una implementación específica, cuando la predicción se inicia desde la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, el dispositivo de decodificación puede realizar secuencialmente copias no enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc ¡n¡c¡o hasta fexc fin de la señal del dominio de frecuencia, copias enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc ¡n¡c¡o hasta fexc fin de la señal de dominio de frecuencia, y una copia de la señal de excitación desde (fexc ¡n¡c¡o+(fúlt¡ma sfm-fbwe inicio)) hasta fexc_f¡n dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las tres partes de señales de excitación como la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia más alta fúltima sfm a la que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, donde la parte no entera de n es menor que 1.
Cuando el dispositivo de decodificación realiza la predicción comenzando desde la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc ¡n¡c¡o hasta fexc fin de la señal de dominio de frecuencia, también pertenece a copiar por bloque. Una señal de excitación correspondiente a una frecuencia baja dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia se localiza en una frecuencia baja correspondiente en la banda de frecuencia de extensión de ancho de banda, y una señal de excitación correspondiente a una frecuencia alta dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia se localiza en una frecuencia alta correspondiente en la banda de frecuencia de extensión de ancho de banda. Para más detalles, remítase a los registros relacionados anteriores. Del mismo modo, las copias enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc ¡n¡c¡o hasta fexc fin de la señal de dominio de frecuencia también pueden ser copias secuenciales o copias en espejo. Para más detalles, remítase a los registros relacionados anteriores. Los detalles no se describen de nuevo en la presente memoria.
En las dos formas anteriores, independientemente de si se predice la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia más alta fúltima sfm a la que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda a partir de la frecuencia más alta fúltima sfm a la que se asigna un bit o a partir de la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda, los resultados de la señal de excitación que se obtienen finalmente por predicción y son de la banda de frecuencia de extensión de ancho de banda entre la frecuencia más alta fúltima sfm a la que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda son los mismos.
Además, en la solución anterior, cuando un ancho de banda desde (fexc ¡n¡c¡o+(fúlt¡ma sfm-fbwe inicio)) hasta fexc fin es mayor o igual que un ancho de banda entre la frecuencia más alta fúltima sfm a la que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, solo es necesario adquirir, en el ancho de banda comprend¡do entre (fexc inicio+(fúltima sfm-fbwe inicio )) y fexc fin y a part¡r de (fexc inicio+(fúltima sfm-fbwe iniciô una señal de excitación que es de una señal de banda de baja frecuencia y presenta un ancho de banda igual al existente entre la frecuencia más alta fúlt¡ma_sfm a la que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, y utilizar la señal de excitación como señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia más alta fúltima sfm a la que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda.
En un proceso de implementación de la solución anterior, un cociente y un resto pueden calcularse primero y adquirirse dividiendo una diferencia entre (fexc inicio+(fúltima sfm-fbwe inicio)) y el ancho de banda de frecuencia entre la frecuencia más alta fúltima sfm a la que se asigna un bit y una frecuencia más alta fsuperior sfm de una señal de banda de frecuencia entre el ancho de banda de frecuencia entre fexcjnicioy fexc_fin. En este caso, el cociente es la parte entera de n, y el resto/(fexc fin-fexc inicio) es la parte no entera de n. La parte entera de n y la parte no entera de n pueden calcularse primero de esta manera, y luego, la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia más alta fúltima sfm a la que se asigna un bit y la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda se predice de la manera anterior.
Por ejemplo, cuando la velocidad de codificación es de 24 kbps, la frecuencia de inicio preestablecida W inicio de la banda de frecuencia de extensión de ancho de banda es igual a 6.4 kHz, y fsuperior sfm es de 14 kHz. La señal de excitación de la banda de frecuencia de extensión de ancho de banda se predice de la siguiente manera: se asume que un intervalo de extensión preseleccionado de una señal de banda de baja frecuencia es de 0 kHz-4 kHz, y una frecuencia más alta fúltima sfm, a la que se asigna un bit, en la enésima trama es igual a 8 kHz; en este caso, fúltima sfm es mayor que W inicio. En primer lugar, el procesamiento de normalización autoadaptativa se realiza en una señal de excitación seleccionada que es de la señal de banda de baja frecuencia y dentro de un intervalo de banda de frecuencia de 0 kHz-4 kHz (Para un proceso específico de procesamiento de normalización autoadaptativa, remítase a los registros en la forma de realización anterior. Los detalles no se describen de nuevo en la presente memoria), y entonces, una señal de excitación de una banda de frecuencia de extensión de ancho de banda mayor de 8 kHz se predice a partir de la señal de excitación normalizada de la señal de banda de baja frecuencia. Según la manera de la forma de realización anterior, una secuencia para copiar la señal de excitación normalizada seleccionada de la banda de baja frecuencia es de la siguiente manera: en primer lugar, se copia una señal de excitación de (8 kHz-6.4 kHz) a 4 kHz dentro de un intervalo de banda de frecuencia predeterminado de una señal de dominio de frecuencia, a continuación, se realizan 0.9 copias de una señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin (0 kHz - 4 kHz) de la señal de dominio de frecuencia, es decir, una señal de excitación de 0 kHz a 3.6 kHz dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia se copia, y las dos partes de señales de excitación se utilizan como la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia más alta (fúltima_sfm=8 kHz) a la que se asigna un bit y la frecuencia más alta fsuperior_sfm (fsuperior_sfm=14 kHz) de la banda de frecuencia de extensión de ancho de banda. Si la frecuencia más alta fúltima sfm, a la que se asigna un bit, en la trama (N+l)ésima es menor o igual a 6.4 kHz (una frecuencia de inicio preestablecida W inicio de una banda de frecuencia de extensión de ancho de banda es igual a 6.4 kHz), el procesamiento de normalización autoadaptativa se realiza en una señal de excitación seleccionada que es de la señal de banda de baja frecuencia y dentro del intervalo de banda de frecuencia de 0 kHz - 4 kHz, y entonces, una señal de excitación de una banda de frecuencia de extensión de ancho de banda mayor que 6.4 kHz se predice a partir de la señal de excitación normalizada de la señal de banda de baja frecuencia. Según la manera de la forma de realización anterior, una secuencia para copiar la señal de excitación normalizada seleccionada de la señal de banda de baja frecuencia es la siguiente: en primer lugar, se realiza una copia de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de fexc inicio a fexc fin (0 kHz - 4 kHz) de la señal de dominio de frecuencia y, a continuación, se realizan 0.9 copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado desde fexc inicio hasta fexc fin (0 kHz - 4 kHz) de la señal de dominio de frecuencia, y las dos partes de las señales de excitación se utilizan como la señal de excitación de la banda de frecuencia de extensión de ancho de banda entre la frecuencia de inicio preestablecida ( W inicio =6.4 kHz) de la banda de frecuencia de extensión de ancho de banda y la frecuencia más alta fsuperior sfm (fsuperior sfm=14 kHz) de la banda de frecuencia de extensión de ancho de banda.
El segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda se determina en función de un tipo de señal de dominio de frecuencia. Por ejemplo, cuando el tipo de señal de dominio de frecuencia es una señal de banda ultraancha, la frecuencia más alta fsuperior sfm de la banda de frecuencia de extensión de ancho de banda es 14 kHz. Antes de comunicarse entre sí, por lo general, el dispositivo de codificación y el dispositivo de decodificación han determinado un tipo de señal del dominio de frecuencia que va a transmitirse; por tanto, puede considerarse determinada un segmento de frecuencia más alta de la señal de dominio de frecuencia.
206. El dispositivo de decodificación predice la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y una envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda.
De la predicción anterior de la señal de excitación de la banda de frecuencia de extensión de ancho de banda se desprende que, aunque los segmentos de frecuencia de inicio de la extensión de ancho de banda en la trama enésima y en la trama (N+l)ésima son diferentes, se predice una señal de excitación de una misma banda de frecuencia superior a 8 kHz a partir de una señal de excitación de una misma banda de frecuencia de la señal de banda de baja frecuencia; por tanto, se puede garantizar la continuidad entre tramas. A continuación, se utiliza la etapa 206, con el fin de implementar una predicción precisa de la banda de frecuencia de extensión de ancho de banda.
Mediante la utilización de las soluciones técnicas de la forma de realización anterior, se puede garantizar eficazmente la continuidad de las señales de excitación previstas que son de una señal de banda de frecuencia de extensión de ancho de banda y entre una trama anterior y una trama posterior, asegurando de este modo la calidad auditiva de una señal de banda de frecuencia de extensión de ancho de banda restaurada y mejorando la calidad auditiva de una señal de audio.
Un experto en la materia entenderá que todas o parte de las etapas de las formas de realización del método anterior pueden implementarse mediante un programa que instruya al hardware correspondiente. El programa puede almacenarse en un medio de almacenamiento legible por ordenador. Cuando el programa se ejecuta, se llevan a cabo las etapas de las formas de realización del método anterior. El medio de almacenamiento anterior incluye: cualquier medio que pueda almacenar código de programa, como una ROM, una RAM, un disco magnético o un disco óptico.
La figura 6 es un diagrama estructural esquemático de un dispositivo de decodificación según una forma de realización de la presente invención. Como se muestra en la figura 6, el dispositivo de decodificación en esta forma de realización incluye un módulo de decodificación 30, un módulo de determinación 31, un primer módulo de procesamiento 32, un segundo módulo de procesamiento 33 y un módulo de predicción 34.
El módulo de decodificación 30 está configurado para: demultiplexar un flujo de bits recibido, y decodificar el flujo de bits demultiplexado para obtener una señal en el dominio de frecuencia. El módulo de determinación 31 está conectado al módulo de decodificación 30, y el módulo de determinación 31 está configurado para determinar si un segmento de frecuencia más alta, al que se asigna un bit, de la señal de dominio de frecuencia obtenida por decodificación por el módulo de decodificación 30 es menor que un segmento de frecuencia de inicio preestablecido de una banda de frecuencia de extensión de ancho de banda. El primer módulo de procesamiento 32 está conectado al módulo de determinación 31, y el primer módulo de procesamiento 32 está configurado para: cuando el módulo de determinación 31 determina que el segmento de frecuencia más alta al que se asigna un bit es menor que el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, predecir una señal de excitación de la banda de frecuencia de extensión de ancho de banda según una señal de excitación dentro de un intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda. El segundo módulo de procesamiento 33 también está conectado al módulo de determinación 31, y el segundo módulo de procesamiento 33 está configurado para: cuando el módulo de determinación 31 determina que el segmento de frecuencia más alta al que se asigna un bit es mayor o igual que el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, predecir la señal de excitación de la banda de frecuencia de extensión de ancho de banda según la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta al que se asigna un bit. El módulo de predicción 34 está conectado al primer módulo de procesamiento 32 o al segundo módulo de procesamiento 33. Cuando el módulo de determinación 31 determina que el segmento de frecuencia más alta al que se asigna un bit es inferior al segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, el módulo de predicción 34 se conecta al primer módulo de procesamiento 32. Cuando el módulo de determinación 31 determina que el segmento de frecuencia más alta al que se asigna un bit es mayor o igual que el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, el módulo de predicción 34 se conecta al segundo módulo de procesamiento 33. El módulo de predicción 34 está configurado para predecir una señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación que es de la banda de frecuencia de extensión de ancho de banda y es predicha por el primer módulo de procesamiento 32 o el segundo módulo de procesamiento 33 y una envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda.
Según el dispositivo de decodificación en esta forma de realización, un proceso de implementación de utilización de los módulos anteriores para implementar la predicción de una señal de banda de frecuencia de extensión de ancho de banda es el mismo que un proceso de implementación en las formas de realización de métodos relacionados anteriores. Para más detalles, remítase a los registros de las anteriores formas de realización de métodos relacionados. Los detalles no se describen de nuevo en la presente memoria.
Según el dispositivo de decodificación en esta forma de realización, mediante la utilización de los módulos anteriores, se establece un segmento de frecuencia de inicio de extensión de ancho de banda, y un segmento de frecuencia más alta al que se decodifica una señal de dominio de frecuencia y el segmento de frecuencia de inicio se comparan, para llevar a cabo la restauración de excitación de una banda de frecuencia de extensión de ancho de banda, de modo que las señales de excitación extendidas son continuas entre tramas, y se mantiene un segmento de frecuencia de una señal de excitación decodificada, asegurando de este modo la calidad auditiva de una señal de banda de frecuencia de extensión de ancho de banda restaurada y mejorando la calidad auditiva de una señal de audio de salida.
La figura 7 es un diagrama estructural esquemático de un dispositivo de decodificación según otra realización de la presente invención. Como se muestra en la figura 7, en base a la forma de realización anterior mostrada en la figura 6, según el dispositivo de decodificación de esta forma de realización, las soluciones técnicas de la presente invención se presentan con más detalle.
Como se muestra en la figura 7, el primer módulo de procesamiento 32 está configurado específicamente para: hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las n copias de la señal de excitación como una señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y un segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, donde n es un número entero o no entero mayor que 0, y n es igual a la relación entre una cantidad de segmentos de frecuencia entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda y una cantidad de segmentos de frecuencia dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia.
Además opcionalmente, en esta forma de realización, el primer módulo de procesamiento 32 en el dispositivo de decodificación está configurado específicamente para: cuando la predicción se inicia desde el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, realizar secuencialmente copias enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y copias no enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como la señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, donde la parte no entera de n es menor que 1; o el primer módulo de procesamiento 32 está específicamente configurado para: cuando la predicción se inicia desde el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, realizar secuencialmente copias no enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y copias enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como la señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, donde la parte no entera de n es menor que 1.
Opcionalmente, en esta forma de realización, el segundo módulo de procesamiento 33 del dispositivo de decodificación está configurado específicamente para: hacer una copia de una señal de excitación desde el mésimo segmento de frecuencia por encima de un segmento de frecuencia de inicio fexc inicio del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia hasta un segmento de frecuencia final fexc fin del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como una señal de excitación entre el segmento de frecuencia más alta, al que se asigna un bit, de la señal de dominio de frecuencia y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, donde n es 0 o un número entero o un número no entero mayor que 0, y m es un valor de una cantidad de segmentos de frecuencia entre el segmento de frecuencia más alta al que se asigna un bit y el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda.
Además, opcionalmente, en esta forma de realización, el segundo módulo de procesamiento 33 del dispositivo de decodificación está configurado específicamente para: cuando la predicción se inicia desde el segmento de frecuencia más alta al que se asigna un bit, realizar secuencialmente una copia de una señal de excitación dentro de un intervalo de banda de frecuencia, desde fexc inicio+ (el segmento de frecuencia más alta al que se asigna un bit-el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda) hasta fexc fin, de la señal de dominio de frecuencia, copias enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia, y copias no enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia desde fexc inicio hasta fexc_fin de la señal del dominio de frecuencia, y utilizar las tres partes de señales de excitación como la señal de excitación entre el segmento de frecuencia más alta al que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, donde la parte no entera de n es menor que 1; o el segundo módulo de procesamiento 33 está específicamente configurado para: cuando la predicción se inicia desde el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, realizar secuencialmente copias no enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia, copias enteras en las n copias de la señal de excitación dentro del intervalo de banda de frecuencia desde fexc inicio hasta fexc fin de la señal de dominio de frecuencia, y una copia de una señal de excitación dentro de un intervalo de banda de frecuencia, desde fexcjnicio + (el segmento de frecuencia más alta al que se ha asignado un bit-el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión del ancho de banda) hasta fexc fin, de la señal de dominio de frecuencia, y utilizar las tres partes de señales de excitación como señal de excitación de alta frecuencia entre el segmento de frecuencia más alta al que se ha asignado un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, donde la parte no entera de n es inferior a 1.
Opcionalmente, en esta forma de realización, el módulo de decodificación 30 está configurado además para: antes de que el módulo de predicción 34 prediga la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, decodificar el flujo de bits para obtener la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda. En este caso, el correspondiente módulo de predicción 34 está conectado además al módulo de decodificación 30, y el módulo de predicción 34 está configurado para predecir la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación que es de la banda de frecuencia de extensión de ancho de banda y es predicha por el primer módulo de procesamiento 32 o el segundo módulo de procesamiento 33 y la envolvente de frecuencia que es de la banda de frecuencia de extensión de ancho de banda y es obtenida por decodificación por el módulo de decodificación 30.
Además, opcionalmente, en esta forma de realización, el dispositivo de decodificación incluye además un módulo de adquisición 35.
El módulo de decodificación 30 está configurado además para: antes de que el módulo de predicción 34 prediga la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, decodificar el flujo de bits para obtener un tipo de señal. El módulo de adquisición 35 está conectado al módulo de decodificación 30, y el módulo de adquisición 35 está configurado para adquirir la envolvente de frecuencia de la banda de frecuencias de extensión de ancho de banda según el tipo de señal obtenido mediante decodificación por el módulo de decodificación 30. En este caso, el módulo de predicción 34 correspondiente está conectado al módulo de adquisición 35, y el módulo de predicción 34 está configurado para predecir la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación que es de la banda de frecuencia de extensión de ancho de banda y es predicha por el primer módulo de procesamiento 32 o el segundo módulo de procesamiento 33 y la envolvente de frecuencia que es de la banda de frecuencia de extensión de ancho de banda y es obtenida por el módulo de adquisición 35.
Además, opcionalmente, el módulo de adquisición 35 está configurado específicamente para: cuando el tipo de señal obtenido por decodificación por el módulo de decodificación 30 es una señal no armónica, demultiplexar el flujo de bits recibido, y decodificar el flujo de bits demultiplexado para obtener la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda; o el módulo de adquisición 35 está configurado específicamente para: cuando el tipo de señal obtenida mediante decodificación por el módulo de decodificación 30 es una señal armónica, demultiplexar el flujo de bits recibido, y decodificar el flujo de bits demultiplexado para obtener una envolvente de frecuencia inicial de la banda de frecuencia de extensión de ancho de banda, y utilizar un valor que se obtiene realizando el cálculo de ponderación sobre la envolvente de frecuencia inicial y N envolventes de frecuencia inicial adyacentes como la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, donde N es mayor o igual a 1.
Según el dispositivo de decodificación en la forma de realización anterior, la presente invención se presenta mediante la utilización de todas las soluciones técnicas opcionales anteriores como ejemplos. En una aplicación real, todas las soluciones técnicas opcionales anteriores pueden combinarse aleatoriamente para formar una forma de realización opcional de la presente invención de una manera de combinación aleatoria. Los detalles no se describen de nuevo en la presente memoria.
Según el dispositivo de decodificación en la forma de realización anterior, un proceso de implementación de utilización de los módulos anteriores para implementar la predicción de una señal de banda de frecuencia de extensión de ancho de banda es el mismo que un proceso de implementación en las formas de realización de métodos relacionados anteriores. Para más detalles, remítase a los registros de las formas de realización de métodos relacionados anteriores. Los detalles no se describen de nuevo en la presente memoria.
Según el dispositivo de decodificación en la forma de realización anterior, mediante la utilización de los módulos anteriores, se establece un segmento de frecuencia de inicio de extensión de ancho de banda, y un segmento de frecuencia más alta en el que se decodifica una señal de dominio de frecuencia y el segmento de frecuencia de inicio se comparan, para realizar la restauración de excitación de una banda de frecuencia de extensión de ancho de banda, de modo que las señales de excitación extendidas son continuas entre tramas, y se mantiene un segmento de frecuencia de una señal de excitación decodificada, asegurando de este modo la calidad auditiva de una señal de banda de frecuencia de extensión de ancho de banda restaurada y mejorando la calidad auditiva de una señal de audio de salida.
Las funciones del dispositivo de decodificación mostrado en la figura 2 pueden ajustarse según los módulos de función anteriores, para obtener un diagrama de ejemplo del dispositivo de decodificación en esta forma de realización de la presente invención. Los detalles no se describen de nuevo en la presente memoria.
El dispositivo de decodificación en esta forma de realización de la presente invención puede ser utilizado junto con el dispositivo de codificación mostrado en la figura 1, para formar un sistema de predicción de una señal de banda de frecuencia de extensión de ancho de banda. Los detalles no se describen de nuevo en la presente memoria.
La figura 8 es un diagrama de bloques de un dispositivo de decodificación 80 según otra realización de la presente invención. El dispositivo de decodificación 80 de la figura 8 puede configurarse para implementar etapas y métodos en las formas de realización de método anteriores. El dispositivo de decodificación 80 puede aplicarse a una estación base o a un terminal en diversos sistemas de comunicaciones. En esta forma de realización de la figura 8, el dispositivo de decodificación 80 incluye un circuito de recepción 802, un procesador de decodificación 803, una unidad de procesamiento 804, una memoria 805, y una antena 801. La unidad de procesamiento 804 controla una operación de decodificación y una antena 801. La unidad de procesamiento 804 controla una operación del dispositivo de decodificación 80, y la unidad de procesamiento 804 también puede denominarse CPU (Central Processing Unit, unidad central de procesamiento). La memoria 805 puede incluir una memoria de solo lectura y una memoria de acceso aleatorio, y proporciona instrucciones y datos para la unidad de procesamiento 804. Una parte de la memoria 805 puede incluir además una memoria de acceso aleatorio no volátil (NVRAM). En una aplicación específica, un dispositivo de comunicaciones inalámbricas tal como un teléfono móvil puede estar incorporado en el dispositivo de decodificación 80, o el propio dispositivo de decodificación puede ser un dispositivo de comunicaciones inalámbricas, y el dispositivo de decodificación 80 puede incluir además una portadora que aloja el circuito de recepción 802, para permitir que el dispositivo de decodificación 80 reciba datos desde una ubicación remota. El circuito de recepción 802 puede estar acoplado a la antena 801. Los componentes del dispositivo de decodificación 80 se acoplan entre sí mediante un sistema de bus 806, donde además de un bus de datos, el sistema de bus 806 incluye además un bus de alimentación, un bus de control y un bus de señal de estado. Sin embargo, para claridad de descripción, varios buses están marcados como el sistema de bus 806 en la figura 8. El dispositivo de decodificación 80 puede incluir además la unidad de procesamiento 804 configurada para procesar una señal, y además, incluir adicionalmente el procesador de decodificación 803.
Los métodos divulgados en las anteriores formas de realización de la presente invención pueden aplicarse al procesador de decodificación 803, o ser implementados por el procesador de decodificación 803. El procesador de decodificación 803 puede ser un chip de circuito integrado con capacidad de procesamiento de señales. En un proceso de implementación, las etapas de las formas de realización de métodos anteriores pueden completarse utilizando un circuito lógico integrado de hardware en el procesador de decodificación 803 o instrucciones en forma de software. Estas instrucciones pueden implementarse y controlarse trabajando con la unidad de procesamiento 804. El procesador de decodificación anterior puede ser un procesador de propósito general, un procesador de señales digitales (DSP), un circuito integrado de aplicación específica (ASIC), una matriz de puertas programables en campo (FPGA) u otro componente lógico programable, una pasarela discreta o un componente lógico de transistor, o un componente de hardware discreto. Los métodos, etapas y diagramas de bloques lógicos dados a conocer en las formas de realización de la presente invención pueden implementarse o ejecutarse. El procesador de propósito general puede ser un microprocesador, o el procesador puede ser cualquier procesador convencional, traductor, o similar. Las etapas de los métodos dados a conocer con referencia a las formas de realización de la presente invención pueden ser directamente ejecutados y llevados a cabo por un procesador de decodificación incorporado como hardware, o pueden ser ejecutados y llevados a cabo mediante la utilización de una combinación de módulos de hardware y software en el procesador de decodificación. El módulo de software puede estar ubicado en un medio de almacenamiento habitual en la técnica, como una memoria de acceso aleatorio, una memoria flash, una memoria de solo lectura, una memoria de solo lectura programable, una memoria programable eléctricamente borrable o un registro. El medio de almacenamiento se encuentra en la memoria 805. El procesador de decodificación 803 lee información de la memoria 805, y completa las etapas de los métodos anteriores en combinación con el hardware.
Por ejemplo, el dispositivo de decodificación de señal en la figura 6 o la figura 7 puede ser implementado por el procesador de decodificación 803. Además, el módulo de decodificación 30, el módulo de determinación 31, el primer módulo de procesamiento 32, el segundo módulo de procesamiento 33, y el módulo de predicción 34 en la figura 6 pueden ser implementados por la unidad de procesamiento 804, o pueden ser implementados por el procesador de decodificación 803. Similarmente, cada módulo en la figura 7 puede ser implementado por la unidad de procesamiento 804, o puede ser implementado por el procesador de decodificación 803. Sin embargo, los ejemplos anteriores son meramente a modo de ejemplo, y no pretenden limitar las formas de realización de la presente invención a esta forma de implementación específica.
Específicamente, la memoria 805 almacena instrucciones para permitir que la unidad de procesamiento 804 o el procesador de decodificación 803 implemente las siguientes operaciones: demultiplexar un flujo de bits recibido, y decodificar el flujo de bits demultiplexado para obtener una señal de dominio de frecuencia; determinar si un segmento de frecuencia más alta, al que se asigna un bit, de la señal de dominio de frecuencia es menor que un segmento de frecuencia de inicio preestablecido de una banda de frecuencia de extensión de ancho de banda; cuando el segmento de frecuencia más alta al que se asigna un bit es menor que el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, predecir una señal de excitación de la banda de frecuencia de extensión de ancho de banda según una señal de excitación dentro de un intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda; cuando el segmento de frecuencia más alta al que se asigna un bit es mayor o igual que el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, predecir la señal de excitación de la banda de frecuencia de extensión de ancho de banda según la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta al que se asigna un bit; y predecir una señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y una envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda.
La forma de realización descrita del aparato es meramente ejemplificativa. Las unidades descritas como partes independientes pueden o no estar físicamente separadas, y las partes mostradas como unidades pueden o no ser unidades físicas, pueden estar situadas en una posición o pueden estar distribuidas en al menos dos unidades de red. Algunos o todos los módulos pueden seleccionarse en función de la necesidad real de alcanzar los objetivos de las soluciones de las formas de realización. Un experto habitual en la materia puede comprender y poner en práctica las formas de realización de la presente invención sin esfuerzos creativos.
Por último, cabe señalar que las formas de realización anteriores solo pretenden describir las soluciones técnicas de la presente invención, pero no limitarla. Aunque la presente invención se describe en detalle con referencia a las formas de realización anteriores, un experto habitual en la materia debe entender que todavía puede hacer modificaciones a las soluciones técnicas descritas en las formas de realización anteriores o hacer sustituciones equivalentes a algunas de sus características técnicas.

Claims (14)

REIVINDICACIONES
1. Método para predecir una señal de banda de frecuencia de extensión de ancho de banda, que comprende:
demultiplexar (100) un flujo de bits recibido, y decodificar el flujo de bits demultiplexado para obtener una señal en el dominio de frecuencia;
determinar (101) si un segmento de frecuencia más alta, al que se asigna un bit, de la señal del dominio de frecuencia es menor que un segmento de frecuencia de inicio preestablecido de una banda de frecuencia de extensión de ancho de banda;
predecir (102) una señal de excitación de la banda de frecuencias de extensión de ancho de banda de una trama actual, de modo que la señal de excitación predicha de la trama actual es continua con una señal de excitación predicha de una trama anterior:
(i) cuando el segmento de frecuencia más alta al que se asigna un bit es inferior al segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda,
la predicción (102) es según una señal de excitación dentro de un intervalo de banda de frecuencia predeterminado de la señal del dominio de frecuencia y el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, y la predicción comprende asimismo:
- realizar n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal en el dominio de frecuencia, y
- utilizar las n copias de la señal de excitación como una señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y un segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda,
- en el que n es un número entero o un número no entero mayor que 0, y n es igual a una relación de una cantidad de segmentos de frecuencia entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda con respecto a una cantidad de segmentos de frecuencia dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia;
(ii) cuando el segmento de frecuencia más alta al que se asigna un bit no es inferior al segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión del ancho de banda,
la predicción (102) es según la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal en el dominio de frecuencia, el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta al que se asigna un bit, y la predicción comprende asimismo:
- realizar, como una primera parte de las señales de excitación, una copia de una señal de excitación desde el m-ésimo segmento de frecuencia fexc inicio+ del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia por encima de un segmento de frecuencia de inicio fexc inicio del intervalo de banda de frecuencia predeterminado de la señal del dominio de frecuencia hasta un segmento de frecuencia final fexc fin del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y, como una segunda parte de señales de excitación, n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal del dominio de frecuencia, y
- utilizar las dos partes de señales de excitación como una señal de excitación entre el segmento de frecuencia más alta, al que se asigna un bit, de la señal de dominio de frecuencia y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda,
- en el que n es 0 o un número entero o no entero mayor que 0, y m es igual a un valor de una cantidad de segmentos de frecuencia entre el segmento de frecuencia más alta al que se asigna un bit y el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda; y
predecir (104) la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y una envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda.
2. Método según la reivindicación 1, en el que la realización de n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal del dominio de frecuencia, y la utilización de las n copias de la señal de excitación como una señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y un segmento de frecuencias más alta de la banda de frecuencia de extensión de ancho de banda comprende:
cuando la predicción se inicia a partir del segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, realizar copias enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y copias no enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como la señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, siendo la parte no entera de n menor que 1; o bien
cuando la predicción se inicia desde el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, realizar copias no enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y copias enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como la señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, siendo la parte no entera de n menor que 1.
3. Método según la reivindicación 1 o 2, en el que la realización de una copia de una señal de excitación desde el m-ésimo segmento de frecuencia fexc_inicio+ del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia por encima de un segmento de frecuencia inicial fexc inicio del intervalo de banda de frecuencia predeterminado de la señal del dominio de frecuencia hasta un segmento de frecuencia final fexc fin del intervalo de banda de frecuencia predeterminado de la señal del dominio de frecuencia y n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como una señal de excitación entre el segmento de frecuencia más alta, al que se asigna un bit, de la señal de dominio de frecuencia y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda comprende:
cuando la predicción se inicia a partir del segmento de frecuencia más alta al que se asigna un bit,
- realizar una copia de la señal de excitación desde fexc inicio+ hasta fexc fin,
- realizar copias enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia,
- realizar copias no enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y
- utilizar las tres partes de señales de excitación como la señal de excitación entre el segmento de frecuencia más alta al que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, siendo la parte no entera de n menor que 1;
o
cuando la predicción se inicia desde el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda,
- realizar copias no enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia,
- realizar copias enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia,
- realizar una copia de la señal de excitación desde fexc inicio+ hasta fexc fin, y
- utilizar las tres partes de señales de excitación como una señal de excitación de alta frecuencia entre el segmento de frecuencia más alta al que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, siendo la parte no entera de n menor que 1.
4. Método según una cualquiera de las reivindicaciones 1 a 3, en el que las copias se realizan por copia secuencial o por copia en espejo.
5. Método según una cualquiera de las reivindicaciones 1 a 4, en el que antes de la predicción de la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y una envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, el método comprende además:
decodificar el flujo de bits para obtener la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda.
6. Método según una cualquiera de las reivindicaciones 1 a 5, en el que antes de la predicción de la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y una envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, el método comprende además:
decodificar el flujo de bits para obtener un tipo de señal; y
adquirir la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda en función del tipo de señal.
7. Método según la reivindicación 6, en el que la adquisición de la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda según el tipo de señal comprende:
cuando el tipo de señal es una señal no armónica, demultiplexar el flujo de bits recibido, y decodificar el flujo de bits demultiplexado para obtener la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda; o bien
cuando el tipo de señal es una señal armónica, demultiplexar el flujo de bits recibido, decodificar el flujo de bits demultiplexado para obtener una envolvente de frecuencia inicial de la banda de frecuencia de extensión de ancho de banda, y utilizar un valor que se obtiene realizando un cálculo de ponderación sobre la envolvente de frecuencia inicial y N envolventes de frecuencia inicial adyacentes como la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, siendo N mayor o igual que 1.
8. Dispositivo de decodificación, que comprende:
un módulo de decodificación (30), configurado para: demultiplexar un flujo de bits recibido, y decodificar el flujo de bits demultiplexado para obtener una señal de dominio de frecuencia;
un módulo de determinación (31), configurado para determinar si un segmento de frecuencia más alta, al que se asigna un bit, de la señal de dominio de frecuencia es menor que un segmento de frecuencia de inicio preestablecido de una banda de frecuencia de extensión de ancho de banda;
un módulo de procesamiento, configurado para:
(i) cuando el módulo de determinación (31) determina que el segmento de frecuencia más alta al que se asigna un bit es inferior al segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda:
predecir una señal de excitación de la banda de frecuencia de extensión de ancho de banda de una trama actual de modo que la señal de excitación predicha de la trama actual es continua con una señal de excitación predicha de una trama anterior según una señal de excitación dentro de un intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, comprendiendo:
realizar n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y
utilizar las n copias de la señal de excitación como una señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y un segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda,
en el que n es un número entero o no entero mayor que 0, y n es igual a una relación de una cantidad de segmentos de frecuencia entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda con respecto a una cantidad de segmentos de frecuencia dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia.
(ii) cuando el módulo de determinación (31) determina que el segmento de frecuencia más alta al que se asigna un bit es mayor o igual que el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda:
predecir la señal de excitación de la banda de frecuencia de extensión de ancho de banda de la trama actual de modo que la señal de excitación predicha de la trama actual es continua con la señal de excitación predicha de la trama anterior según la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta al que se asigna un bit, comprendiendo:
realizar, como una primera parte de señales de excitación, una copia de una señal de excitación del m-ésimo segmento de frecuencia fexc inicio+ del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia por encima de un segmento de frecuencia inicial fexc inicio del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia hasta un segmento de frecuencia final fexc fin del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y, como una segunda parte de las señales de excitación, n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y
utilizar las dos partes de señales de excitación como una señal de excitación entre el segmento de frecuencia más alta, al que se asigna un bit, de la señal de dominio de frecuencia y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda,
en el que n es 0 o un número entero o no entero mayor que 0, y m es igual a un valor de una cantidad de segmentos de frecuencia entre el segmento de frecuencia más alta al que se asigna un bit y el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda; y
un módulo de predicción (34), configurado para predecir una señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y una envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda.
9. Dispositivo de decodificación según la reivindicación 8, en el que el módulo de procesamiento está configurado asimismo para:
cuando la predicción se inicia a partir del segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda, realizar copias enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y copias no enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como la señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, en el que la parte no entera de n es menor que 1; o bien
cuando la predicción se inicia desde el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, realizar copias no enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia y copias enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y utilizar las dos partes de señales de excitación como la señal de excitación entre el segmento de frecuencia de inicio preestablecido de la banda de frecuencia de extensión de ancho de banda y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, siendo la parte no entera de n menor que 1.
10. Dispositivo de decodificación según la reivindicación 8 o 9, en el que el módulo de procesamiento está configurado asimismo para:
cuando la predicción se inicia a partir del segmento de frecuencia más alta al que se asigna un bit,
realizar una copia de la señal de excitación desde fexc inicio+ hasta fexc fin,
realizar copias enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia,
realizar copias no enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia, y
utilizar las tres partes de señales de excitación como la señal de excitación entre el segmento de frecuencia más alta al que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, siendo la parte no entera de n menor que 1;
o
cuando la predicción se inicia desde el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda,
realizar copias no enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia,
realizar copias enteras de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado de la señal de dominio de frecuencia,
realizar una copia de la señal de excitación desde fexc inicio+ hasta fexc fin, y
utilizar las tres partes de señales de excitación como una señal de excitación de alta frecuencia entre el segmento de frecuencia más alta al que se asigna un bit y el segmento de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, siendo la parte no entera de n menor que 1.
11. Dispositivo de decodificación según una cualquiera de las reivindicaciones 8 a 10, en el que el módulo de procesamiento está configurado además para realizar las copias mediante copiado secuencial o copiado en espejo.
12. Dispositivo de decodificación según una cualquiera de las reivindicaciones 8 a 11, en el que el módulo de decodificación (30) está configurado asimismo para: antes de que el módulo de predicción (34) prediga la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, decodificar el flujo de bits para obtener la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda.
13. Dispositivo de decodificación según una cualquiera de las reivindicaciones 8 a 12, que comprende asimismo un módulo de adquisición (35); en el que
el módulo de decodificación (30) está configurado asimismo para: antes de que el módulo de predicción prediga la señal de banda de frecuencia de extensión de ancho de banda según la señal de excitación predicha de la banda de frecuencia de extensión de ancho de banda y la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, decodificar el flujo de bits para obtener un tipo de señal; y
el módulo de adquisición (35) está configurado para adquirir la envolvente de frecuencia de la banda de frecuencia de extensión del ancho de banda según el tipo de señal.
14. Dispositivo de decodificación según la reivindicación 13, en el que el módulo de adquisición está configurado asimismo para:
cuando el tipo de señal es una señal no armónica, demultiplexar el flujo de bits recibido, y decodificar el flujo de bits demultiplexado para obtener la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda; o bien
cuando el tipo de señal es una señal armónica, demultiplexar el flujo de bits recibido, decodificar el flujo de bits demultiplexado para obtener una envolvente de frecuencia inicial de la banda de frecuencia de extensión de ancho de banda, y utilizar un valor que se obtiene realizando el cálculo de ponderación sobre la envolvente de frecuencia inicial y N envolventes de frecuencia inicial adyacentes como la envolvente de frecuencia de la banda de frecuencia de extensión de ancho de banda, siendo N mayor o igual que 1.
ES20181460T 2013-01-29 2013-07-23 Method for predicting bandwith extension frequency band signal, and decoding device Active ES2997082T3 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310034240.9A CN103971694B (zh) 2013-01-29 2013-01-29 带宽扩展频带信号的预测方法、解码设备

Publications (1)

Publication Number Publication Date
ES2997082T3 true ES2997082T3 (en) 2025-02-14

Family

ID=51241110

Family Applications (3)

Application Number Title Priority Date Filing Date
ES20181460T Active ES2997082T3 (en) 2013-01-29 2013-07-23 Method for predicting bandwith extension frequency band signal, and decoding device
ES13873587T Active ES2813956T3 (es) 2013-01-29 2013-07-23 Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda
ES21194138T Active ES2988733T3 (es) 2013-01-29 2013-07-23 Método para predecir una señal de una banda de frecuencias de extensión de ancho de banda, y dispositivo de decodificación

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES13873587T Active ES2813956T3 (es) 2013-01-29 2013-07-23 Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda
ES21194138T Active ES2988733T3 (es) 2013-01-29 2013-07-23 Método para predecir una señal de una banda de frecuencias de extensión de ancho de banda, y dispositivo de decodificación

Country Status (9)

Country Link
US (4) US9361904B2 (es)
EP (4) EP3958258B1 (es)
JP (1) JP6202545B2 (es)
KR (1) KR101602264B1 (es)
CN (1) CN103971694B (es)
ES (3) ES2997082T3 (es)
PL (2) PL3764354T3 (es)
PT (1) PT3958258T (es)
WO (1) WO2014117484A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
WO2015108358A1 (ko) * 2014-01-15 2015-07-23 삼성전자 주식회사 선형 예측 부호화 계수를 양자화하기 위한 가중치 함수 결정 장치 및 방법
TWI879690B (zh) 2015-03-13 2025-04-01 瑞典商杜比國際公司 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體
JP6949970B2 (ja) 2016-10-11 2021-10-13 ゲノムシス エスアー バイオインフォマティクスデータを送信する方法及びシステム
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
CN107886966A (zh) * 2017-10-30 2018-04-06 捷开通讯(深圳)有限公司 终端及其优化语音命令的方法、存储装置
WO2020258227A1 (zh) * 2019-06-28 2020-12-30 瑞声声学科技(深圳)有限公司 致动器激励信号处理方法、装置、计算机设备及存储介质
CN113963703B (zh) * 2020-07-03 2025-05-02 华为技术有限公司 一种音频编码的方法和编解码设备
CN115552518B (zh) * 2021-11-02 2024-06-25 北京小米移动软件有限公司 一种信号编解码方法、装置、用户设备、网络侧设备及存储介质
CN114722861B (zh) * 2022-03-15 2025-04-04 南方海洋科学与工程广东省实验室(广州) 深反射地震数据最优频带选取方法、电子设备及存储介质
CN118215959B (zh) * 2022-09-05 2025-05-13 北京小米移动软件有限公司 一种音频信号频带扩展方法、装置、设备及存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3751225B2 (ja) * 2001-06-14 2006-03-01 松下電器産業株式会社 オーディオ帯域拡張装置
JP2003044098A (ja) 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
AU2005337961B2 (en) * 2005-11-04 2011-04-21 Nokia Technologies Oy Audio compression
CN101140759B (zh) 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101375582B1 (ko) * 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
DK2571024T3 (en) * 2007-08-27 2015-01-05 Ericsson Telefon Ab L M Adaptive transition frequency between the noise filling and bandwidth extension
KR100970446B1 (ko) 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US8423371B2 (en) 2007-12-21 2013-04-16 Panasonic Corporation Audio encoder, decoder, and encoding method thereof
RU2621965C2 (ru) * 2008-07-11 2017-06-08 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
PL4231295T3 (pl) * 2008-12-15 2024-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania powiększania szerokości pasma audio oraz program komputerowy
CN101853664B (zh) * 2009-03-31 2011-11-02 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
EP2663978A4 (en) * 2011-01-12 2016-04-06 Nokia Technologies Oy AUDIO CODING AND DECODING DEVICE
CN102610231B (zh) 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置

Also Published As

Publication number Publication date
EP2940685A1 (en) 2015-11-04
EP3764354A1 (en) 2021-01-13
KR101602264B1 (ko) 2016-03-10
US10388295B2 (en) 2019-08-20
US20190325884A1 (en) 2019-10-24
EP2940685A4 (en) 2016-08-10
US9875749B2 (en) 2018-01-23
WO2014117484A1 (zh) 2014-08-07
JP6202545B2 (ja) 2017-09-27
US20160247513A1 (en) 2016-08-25
EP4451268A3 (en) 2024-11-27
US10607621B2 (en) 2020-03-31
EP2940685B1 (en) 2020-06-24
CN103971694A (zh) 2014-08-06
EP3764354B1 (en) 2024-10-09
US9361904B2 (en) 2016-06-07
EP3958258B1 (en) 2024-06-26
ES2988733T3 (es) 2024-11-21
EP4451268A2 (en) 2024-10-23
EP2940685B8 (en) 2020-08-19
PT3958258T (pt) 2024-09-27
EP3958258A1 (en) 2022-02-23
PL3764354T3 (pl) 2025-02-03
ES2813956T3 (es) 2021-03-25
KR20150109460A (ko) 2015-10-01
PL3958258T3 (pl) 2024-10-21
EP3764354C0 (en) 2024-10-09
US20150332688A1 (en) 2015-11-19
JP2016507781A (ja) 2016-03-10
US20180122393A1 (en) 2018-05-03
CN103971694B (zh) 2016-12-28

Similar Documents

Publication Publication Date Title
ES2997082T3 (en) Method for predicting bandwith extension frequency band signal, and decoding device
ES2822607T3 (es) Método de predicción y dispositivo de codificación/decodificación para una señal de banda de alta frecuencia
CN106409299B (zh) 信号编码和解码的方法和设备
HK40110896A (en) Method for predicting bandwith extension frequency band signal, and decoding device