ES3033829T3 - Inter-channel phase difference parameter extraction method and apparatus - Google Patents

Inter-channel phase difference parameter extraction method and apparatus

Info

Publication number
ES3033829T3
ES3033829T3 ES23206156T ES23206156T ES3033829T3 ES 3033829 T3 ES3033829 T3 ES 3033829T3 ES 23206156 T ES23206156 T ES 23206156T ES 23206156 T ES23206156 T ES 23206156T ES 3033829 T3 ES3033829 T3 ES 3033829T3
Authority
ES
Spain
Prior art keywords
ipd
parameter
channel signal
current
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES23206156T
Other languages
English (en)
Inventor
Xingtao Zhang
Haiting Li
Zexin Liu
Lei Miao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES3033829T3 publication Critical patent/ES3033829T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Stereophonic System (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Se proporciona un método y un aparato para la extracción de parámetros de diferencia de fase entre canales. El método de extracción incluye: obtener un parámetro para determinar el método de extracción de información de la trama actual de una señal multicanal (S101); determinar el método de extracción del parámetro IPD para la trama actual de la señal multicanal basándose en el parámetro utilizado para determinar el método de extracción de información de la trama actual de la señal multicanal (S102), donde el método de extracción del parámetro IPD determinado para la trama actual de la señal multicanal es uno de al menos dos métodos preestablecidos; y extraer un parámetro IPD de la trama actual de la señal multicanal basándose en el método de extracción del parámetro IPD determinado para la trama actual de la señal multicanal (S103). Por lo tanto, se pueden enriquecer las opciones del método de extracción del parámetro IPD, se puede conservar mejor la información de fase y se puede mejorar la calidad de la codificación de audio. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Método y aparato de extracción de parámetros de diferencia de fase entre canales
Campo técnico
La presente invención se refiere al campo de las tecnologías de las comunicaciones y, en particular, a un método y un aparato de extracción y codificación de parámetros de diferencia de fase entre canales.
Antecedentes
Con la mejora de la calidad de vida, las personas tienen cada vez más demandas de audio de alta calidad. En comparación con el audio mono, el audio estéreo transmite una sensación de orientación y distribución de las fuentes de sonido, y puede hacer que la información de audio sea más clara y mejor comprendida y mejorar la sensación de presencia durante la reproducción de audio. Por lo tanto, el audio estéreo es altamente preferido por la gente.
La codificación estéreo paramétrica (Parametric Stereo, PS) es uno de los esquemas de codificación comunes para las tecnologías de procesamiento estéreo. La codificación PS significa que el procesamiento de codificación y decodificación se realiza en una señal estéreo (es decir, una señal multicanal) en función de una característica de percepción espacial, de modo que la codificación y la decodificación de la señal multicanal se convierten en una codificación y una decodificación de señales de audio mono y una codificación y una decodificación de un parámetro de percepción espacial. Los parámetros de percepción espacial en la codificación PS incluyen una coherencia entre canales (Inter-channel Coherence, IC), una diferencia de nivel entre canales (Inter-channel Level Difference, ILD), una diferencia de tiempo entre canales (Inter-channel Time Difference, ITD), una diferencia de fase entre canales (Interchannel Phase Difference, IPD) y similares. La ITD y la IPD son parámetros de percepción espacial que representan una orientación horizontal de una fuente de sonido. La ILD, la ITD y la IPD deciden cómo el oído humano percibe la ubicación de una fuente de sonido, lo que puede determinar efectivamente la ubicación de un campo de sonido y son importantes para la restauración de la señal estéreo. Por lo tanto, la determinación de parámetros tal como la IPD es importante para la restauración de la señal estéreo.
En la técnica anterior 1, para un parámetro IPD de cada trama de una señal estéreo, una señal en el dominio del tiempo se convierte en una señal en el dominio de la frecuencia, la señal en el dominio de la frecuencia se divide en una pluralidad de subbandas, se calcula un parámetro IPD para cada subbanda, y el parámetro IPD de cada subbanda se utiliza para la codificación de señales estéreo después de cuantificarse y codificarse. En la técnica anterior 1, para una señal en el dominio de la frecuencia en una pluralidad de subbandas, es necesario calcular un parámetro IPD para cada subbanda, ocupando una gran cantidad de recursos y provocando una tasa de codificación baja.
En la técnica anterior 2, para un parámetro IPD de cada trama de una señal estéreo, una señal en el dominio del tiempo se convierte en una señal en el dominio de la frecuencia, después se calcula un parámetro IPD de una trama en función de la señal en el dominio de la frecuencia, donde el parámetro IPD de una trama se denomina parámetro de diferencia de fase entre canales de grupo (IPD de Grupo) y, finalmente, el parámetro IPD de grupo se utiliza para la codificación de señales estéreo después de cuantificarse y codificarse. En la técnica anterior 2, solo se extrae un parámetro IPD (el parámetro IPD de grupo) y, por lo tanto, solo puede cuantificarse y codificarse un parámetro IPD. Aunque se ocupa una pequeña cantidad de recursos, la precisión de la información de fase extraída es baja y la calidad de codificación es deficiente.
El documento EP 2296142 A2 describe un método de codificación de audio en el que un codificador recibe una pluralidad de canales de entrada y genera uno o más canales de salida de audio y uno o más parámetros que describen unas relaciones espaciales deseadas entre una pluralidad de canales de audio que pueden obtenerse de los uno o más canales de salida de audio, que comprende detectar unos cambios en unas características de señal con respecto al tiempo en uno o más de la pluralidad de canales de entrada de audio, identificar como unos límites de evento auditivo unos cambios en las características de señal con respecto al tiempo en dichas una o más de la pluralidad de entradas de canales de audio, en donde un segmento de audio entre unos límites consecutivos constituye un evento auditivo en el canal o los canales, y generar todos o algunos de dichos uno o más parámetros al menos parcialmente en respuesta a los eventos auditivos y/o al grado de cambio en las características de señal asociadas con dichos límites de eventos auditivos.
Resumen
En esta solicitud se proporcionan un método y un aparato de extracción y codificación de parámetro de diferencia de fase entre canales, para enriquecer unas opciones de una forma de extracción de parámetros IPD, mantener mejor una información de fase y mejorar una calidad de codificación de audio.
La presente invención se define mediante las reivindicaciones independientes. Las características adicionales de la invención se presentan en las reivindicaciones dependientes. A continuación, las partes de la descripción y los dibujos que se refieren a las realizaciones que no cubren las reivindicaciones no se presentan como realizaciones de la invención, sino como ejemplos útiles para comprender la invención.
Según un primer aspecto, se proporciona un método de extracción y codificación de parámetros de diferencia de fase entre canales según la reivindicación 1.
Según el método proporcionado en esta solicitud, puede preestablecerse una pluralidad de formas de extracción de parámetros de diferencia de fase entre canales (IPD), de modo que, a la hora de determinarse la forma de extracción de parámetros IPD para la trama actual de señal multicanal, la forma de extracción de parámetros IPD para la trama actual de señal multicanal pueda determinarse en función del parámetro obtenido utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal y, después, el parámetro IPD de la trama actual de señal multicanal pueda extraerse en función de la forma de extracción de parámetros IPD determinada. En esta solicitud, las opciones de la forma de extracción de parámetros IPD para la trama actual de señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de señal multicanal se correlaciona con el parámetro utilizado para determinar la forma de extracción de información para la trama actual más estrechamente, de modo que la información de fase pueda mantenerse mejor y la calidad de codificación de la señal multicanal pueda mejorarse.
Con referencia al primer aspecto, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y
si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, la determinación de una forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
Según el método proporcionado en esta solicitud, cuando el valor de coherencia del canal izquierdo-derecho de la trama actual cumple una condición, y la varianza de IPD de subbanda de la trama actual también cumple una condición, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción, de modo que la primera forma de extracción se correlaciona con el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual de señal multicanal más estrechamente y se mejora la aplicabilidad de la forma de extracción de parámetros IPD para la trama actual de señal multicanal.
Con referencia a la primera implementación posible del primer aspecto, en una tercera implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual; y
si un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, la determinación de una forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
Según el método proporcionado en esta solicitud, cuando el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho cumple una condición, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción, de modo que se mejore la aplicabilidad de la forma de extracción de parámetros IPD para la trama actual de señal multicanal.
Con referencia a la segunda implementación posible del primer aspecto, en una cuarta implementación posible, el primer umbral es 0,75.
Con referencia a la primera implementación posible del primer aspecto, en una quinta implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, la determinación de una forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción.
Según el método provisto en esta solicitud, cuando la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual cumple con un requisito, y la clase de señal de cada una de las A tramas anteriores a la trama actual cumple con un requisito, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción, de modo que la primera forma de extracción se correlaciona más estrechamente con el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual, y puede mejorarse la precisión de la selección de la forma de extracción de parámetros IPD para la trama actual de señal multicanal.
Con referencia a la primera implementación posible del segundo aspecto, en una sexta implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual, y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, la determinación de una forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
Según el método proporcionado en esta solicitud, cuando los parámetros de característica de la señal, como el parámetro ITD y la varianza de IPD de subbanda de la trama actual, cumplen las condiciones, y la clase de señal de cada una de las A tramas anteriores a la trama actual cumple con un requisito, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción, de modo que la primera forma de extracción se correlaciona más estrechamente tanto con el parámetro de característica de la señal de la trama actual como con el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual, y puede mejorarse la aplicabilidad de la forma de extracción de parámetros IPD para la trama actual de señal multicanal.
Con referencia a una cualquiera de la segunda implementación posible del primer aspecto a la sexta implementación posible del primer aspecto, en una séptima implementación posible, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de señal multicanal, o no extraer ningún parámetro IPD de la trama actual de señal multicanal, o establecer el parámetro IPD de la trama actual de señal multicanal en 0.
En esta solicitud, se proporcionan dos implementaciones opcionales como la primera forma de extracción, de modo que se enriquecen las opciones de la forma de extracción de parámetros IPD para la trama actual de señal multicanal y se mejora la aplicabilidad del método de extracción de parámetros IPD para la trama actual de señal multicanal.
Con referencia a la séptima implementación posible del primer aspecto, en una octava implementación posible, cuando la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de señal multicanal, la extracción de un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinado para la trama actual de señal multicanal incluye:
extraer parámetros IPD de subbanda de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar una IPD de grupo de la trama actual de señal multicanal en función de los parámetros IPD de subbanda extraídos.
Según el método proporcionado en esta solicitud, cuando la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo, los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual puede extraerse, y el grupo IPD de la trama actual de señal multicanal puede determinarse en función de los parámetros IPD de subbanda extraídos, de modo que el grupo IPD de la trama actual de señal multicanal se correlacione con los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y pueda mejorarse la calidad de codificación de parámetros IPD. Cuando la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo, la codificación de parámetros IPD ocupa una cantidad relativamente pequeña de bits y pueden utilizarse más bits para codificar otros parámetros, mejorando así la calidad de la codificación de audio.
Con referencia a cualquiera de la segunda implementación posible del primer aspecto a la sexta implementación posible del primer aspecto, en una novena implementación posible, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, la determinación de una forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye además:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjunto de subbandas o extraer parámetros IPD de subbanda.
Con referencia a la novena implementación posible del primer aspecto, en una décima implementación posible, la segunda forma de extracción es extraer los parámetros iPd de conjunto de subbandas, y la determinación de que la forma de extracción de los parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción incluye:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas;
obtener una varianza de IPD de subbanda de cada conjunto de subbandas; y
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros iPd de conjunto de subbandas; y
la extracción de un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal incluye:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
Según el método proporcionado en esta solicitud, cuando se determina que el parámetro IPD de la trama actual de señal multicanal no es la primera forma de extracción, la forma de extracción de parámetros IPD para la trama actual de señal multicanal puede determinarse además en función de los IPD de subbanda de una pluralidad de conjuntos de subbandas obtenidos al clasificar las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Cuando la varianza de IPD de subbanda de cada subconjunto obtenido a través de la clasificación cumple una condición, y el valor de coherencia del canal izquierdo-derecho de la trama actual también cumple una condición, se determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer los parámetros IPD de conjunto de subbandas y, a continuación, puede calcularse el parámetro IPD de cada conjunto de subbandas, de modo que el parámetro IPD de cada conjunto de subbandas puede determinarse como el parámetro IPD de la trama actual de señal multicanal. En esta solicitud, pueden enriquecerse las elecciones de la forma de extracción de parámetros IPD para la trama actual de señal multicanal. Se utiliza una pluralidad de parámetros IPD como parámetro IPD de la trama actual de señal multicanal, de modo que la información de fase puede mantenerse mejor y puede mejorarse la precisión de la codificación de audio. Además, una cantidad de parámetros IPD extraídos después de que las subbandas se clasifican en conjuntos de subbandas es menor que la de los parámetros IPD extraídos para todas las subbandas, y pueden utilizarse más bits para codificar otros parámetros, mejorando así la calidad de codificación de audio.
Con referencia a la novena implementación posible del primer aspecto, en una undécima implementación posible, la segunda forma de extracción es extraer parámetros IPD de conjunto de subbandas, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción incluye:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; y
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
Con referencia a la novena implementación posible del primer aspecto, en una duodécima implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción incluye:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros IPD de subbanda; y
la extracción de un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal incluye:
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
Según el método proporcionado en esta solicitud, cuando se determina que el parámetro IPD de la trama actual de señal multicanal no es la primera forma de extracción, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer parámetros IPD de subbanda, y después pueden calcularse los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, de modo que se pueda determinar un parámetro IPD de cada subbanda como el parámetro IPD de la trama actual de señal multicanal. En esta solicitud, pueden enriquecerse las elecciones de la forma de extracción de parámetros IPD para la trama actual de señal multicanal. Los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual se utilizan como el parámetro IPD de la trama actual de señal multicanal, para que la información de fase se pueda mantener mejor, y pueda mejorarse la precisión de la codificación de audio.
Con referencia a la novena implementación posible del primer aspecto, en una decimotercera implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción incluye:
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
Con referencia a la primera implementación posible del primer aspecto, en una decimocuarta implementación posible, cuando el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual, la obtención de un parámetro utilizado para determinar una forma de extracción de información para una trama actual de una señal multicanal incluye:
obtener unas señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en unas señales en el dominio de la frecuencia de canal izquierdo y derecho; y
calcular el valor de coherencia del canal izquierdo-derecho de la trama actual de señal multicanal en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho.
Según el método proporcionado en esta solicitud, las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal pueden convertirse en señales en el dominio de la frecuencia de canal izquierdo y derecho, y el valor de coherencia del canal izquierdo-derecho de la trama actual puede calcularse en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho, para determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal, de modo que la determinación de la forma de extracción de parámetros IPD para que la trama actual de señal multicanal pueda correlacionarse más estrechamente con las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y puede mejorarse la precisión de la determinación de la forma de extracción de parámetros IPD.
Con referencia a la primera implementación posible del primer aspecto, en una decimoquinta implementación posible, cuando el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye la varianza de IPD de subbanda de la trama actual, un parámetro utilizado para determinar una forma de extracción de información para una trama actual de una señal multicanal incluye:
obtener unas señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en unas señales en el dominio de la frecuencia de canal izquierdo y derecho; y
dividir las señales en el dominio de la frecuencia de canal izquierdo y derecho en al menos dos subbandas, calcular una IPD de cada subbanda en función de una señal en el dominio de la frecuencia de cada subbanda y calcular la varianza de IPD de subbanda de la trama actual en función de la IPD de cada subbanda.
Según el método proporcionado en esta solicitud, las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal pueden convertirse en las señales en el dominio de la frecuencia de canal izquierdo y derecho, y la IPD de cada subbanda de la trama actual puede calcularse en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho, para calcular la varianza de IPD de subbanda de la trama actual, y después determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal, de modo que la determinación de la forma de extracción de parámetros IPD para la trama actual de señal multicanal puede correlacionarse más estrechamente con las señales en el dominio de la frecuencia del canal izquierdo y del canal derecho de la trama actual, y puede mejorarse la precisión de la determinación de la forma de extracción de parámetros IPD.
Según un segundo aspecto, se proporciona un aparato de extracción de parámetros de diferencia de fase entre canales, donde el aparato de extracción puede incluir:
un módulo de obtención, configurado para obtener un parámetro utilizado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
un módulo de determinación, configurado para determinar una forma de extracción de parámetros de diferencia de fase entre canales (IPD) para la trama actual de señal multicanal en función del parámetro que es obtenido por el módulo de obtención y que se utiliza para determinar la forma de extracción de información para la trama actual de señal multicanal, donde la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y
un módulo de extracción, configurado para extraer un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD que es para la trama actual de señal multicanal y que está determinada por el módulo de determinación.
Según el aparato de extracción proporcionado en esta solicitud, puede preestablecerse una pluralidad de formas de extracción de parámetros IPD de diferencia de fase entre canales, de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal, la forma de extracción de parámetros IPD para la trama actual de señal multicanal puede determinarse en función del parámetro obtenido utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal, y después el parámetro IPD de la trama actual de señal multicanal puede extraerse en función de la forma de extracción de parámetros IPD determinada. En esta solicitud, las opciones de la forma de extracción de parámetros IPD para la trama actual de señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de señal multicanal se correlaciona con el parámetro utilizado para determinar la forma de extracción de información para la trama actual más estrechamente, de modo que la información de fase pueda mantenerse mejor y la calidad de codificación de la señal multicanal pueda mejorarse.
Con referencia al segundo aspecto, en una primera implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye al menos uno de un parámetro de característica de la señal de la trama actual y un parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual, donde A es un número entero no menor que 1;
el parámetro de característica de la señal de la trama actual incluye al menos uno de un valor de coherencia del canal izquierdo-derecho de la trama actual, un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de señal de la trama actual y una diferencia de tiempo entre canales ITD de la trama actual;
el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de entre un valor de coherencia del canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, una ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
la clase de señal incluye trama de voz o trama de música.
Con referencia a la primera implementación posible del segundo aspecto, en una segunda implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y
si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
Con referencia a la primera implementación posible del segundo aspecto, en una tercera implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho; y
si un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que un primer umbral, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
Con referencia a la tercera implementación posible del segundo aspecto, en una cuarta implementación posible, el primer umbral es 0,75.
Con referencia a la primera implementación posible del segundo aspecto, en una quinta implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción.
Con referencia a la primera implementación posible del segundo aspecto, en una sexta implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual, y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
Con referencia a una cualquiera de la segunda implementación posible del primer aspecto a la sexta implementación posible del primer aspecto, en una séptima implementación posible, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de señal multicanal, o no extraer ningún parámetro IPD de la trama actual de señal multicanal, o establecer el parámetro IPD de la trama actual de señal multicanal en 0.
Con referencia a la séptima implementación posible del segundo aspecto, en una octava implementación posible, cuando el módulo de determinación determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo, el módulo de extracción está configurado específicamente para:
extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar una IPD de grupo de la trama actual de señal multicanal en función de los parámetros IPD de subbanda extraídos.
Con referencia a cualquiera de la segunda implementación posible del segundo aspecto a la quinta implementación posible del segundo aspecto, en una novena implementación posible, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjunto de subbandas o extraer parámetros IPD de subbanda.
Con referencia a la novena implementación posible del segundo aspecto, en una décima implementación posible, la segunda forma de extracción es extraer los parámetros IPD de conjunto de subbandas, y el módulo de determinación se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas;
obtener una varianza de IPD de subbanda de cada conjunto de subbandas; y
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros iPd de conjunto de subbandas; y
el módulo de extracción se configura específicamente para:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas determinados por el módulo de obtención.
Con referencia a la novena implementación posible del segundo aspecto, en una undécima implementación posible, la segunda forma de extracción es extraer los parámetros IPD de conjunto de subbandas, y el módulo de determinación se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas; y
el módulo de extracción se configura específicamente para:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas determinados por el módulo de obtención.
Con referencia a la décima implementación posible del segundo aspecto, en una duodécima implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el módulo de determinación se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros IPD de subbanda; y
el módulo de extracción se configura específicamente para:
calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual.
Con referencia a la décima implementación posible del segundo aspecto, en una decimotercera implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el módulo de extracción se configura específicamente para:
calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual.
Con referencia a la primera implementación posible del segundo aspecto, en una decimocuarta implementación posible, cuando el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual, el módulo de obtención se configura específicamente para:
obtener unas señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en unas señales en el dominio de la frecuencia de canal izquierdo y derecho; y
calcular el valor de coherencia del canal izquierdo-derecho de la trama actual en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho.
Con referencia a la primera implementación posible del segundo aspecto, en una decimoquinta implementación posible, cuando el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye la varianza de IPD de subbanda de la trama actual, la obtención del módulo está configurada específicamente para:
obtener unas señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en unas señales en el dominio de la frecuencia de canal izquierdo y derecho; y
dividir las señales en el dominio de la frecuencia de canal izquierdo y derecho en al menos dos subbandas, calcular una IPD de cada subbanda en función de una señal en el dominio de la frecuencia de cada subbanda y calcular la varianza de IPD de subbanda de la trama actual en función de la IPD de cada subbanda.
En esta solicitud, cuando la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo, la codificación de parámetros IPD ocupa una cantidad relativamente pequeña de bits y pueden utilizarse más bits para codificar otros parámetros, mejorando así calidad de codificación de audio. En esta solicitud, puede utilizarse una pluralidad de parámetros IPD como parámetro IPD de la trama actual de señal multicanal, de modo que la información de fase puede mantenerse mejor y la precisión de la codificación de audio puede mejorarse. Además, una cantidad de parámetros IPD extraídos después de que las subbandas se clasifican en conjuntos de subbandas es menor que la de los parámetros IPD extraídos para todas las subbandas, y pueden utilizarse más bits para codificar otros parámetros, mejorando así la calidad de codificación de audio.
Según un tercer aspecto, se proporciona un terminal, que incluye una memoria y un procesador, donde la memoria está conectada al procesador;
la memoria está configurada para almacenar un código de programa; y
el procesador está configurado para llamar al código de programa almacenado en la memoria, para realizar las siguientes operaciones:
obtener un parámetro utilizado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
determinar una forma de extracción de parámetros de diferencia de fase entre canales (IPD) para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal, donde la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y
extraer un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal.
Según el terminal proporcionado en esta solicitud, puede preestablecerse una pluralidad de formas de extracción de parámetros IPD de diferencia de fase entre canales, de modo que, al determinarse la forma de extracción de parámetros IPD para la trama actual de señal multicanal, la forma de extracción de parámetros IPD para la trama actual de señal multicanal puede determinarse en función del parámetro obtenido utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal y, después, el parámetro IPD de la trama actual de señal multicanal puede extraerse en función de la forma de extracción de parámetros IPD determinada. En esta solicitud, las opciones de la forma de extracción de parámetros IPD para la trama actual de señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de señal multicanal se correlaciona con el parámetro utilizado para determinar la forma de extracción de información para la trama actual más estrechamente, de modo que la información de fase pueda mantenerse mejor y la calidad de codificación de la señal multicanal pueda mejorarse.
Con referencia al tercer aspecto, en una primera implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye al menos uno de un parámetro de característica de la señal de la trama actual y un parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual, donde A es un número entero no menor que 1;
el parámetro de característica de la señal de la trama actual incluye al menos uno de entre un valor de coherencia del canal izquierdo-derecho de la trama actual, una varianza de IPD de subbanda de la trama actual, y una diferencia de tiempo entre canales (ITD) de la trama actual;
el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de un valor de coherencia del canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, una ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
la clase de señal incluye trama de voz o trama de música.
Con referencia a la primera implementación posible del tercer aspecto, en una segunda implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y
si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el procesador está configurado específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
Con referencia a la primera implementación posible del tercer aspecto, en una tercera implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye la forma de extracción del parámetro IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, el procesador se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción.
Con referencia a la primera implementación posible del tercer aspecto, en una cuarta implementación posible, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual, y la clase de señal de cada una de las A tramas anteriores a la trama actual; y si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, el procesador está configurado específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
Con referencia a cualquiera de la segunda implementación posible del tercer aspecto a la cuarta implementación posible del tercer aspecto, en una quinta implementación posible, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de señal multicanal, o no extraer ningún parámetro IPD de la trama actual de señal multicanal.
Con referencia a la quinta implementación posible del tercer aspecto, en una sexta implementación posible, cuando la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de señal multicanal, el procesador se configura específicamente para:
extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar una IPD de grupo de la trama actual de señal multicanal en función de los parámetros IPD de subbanda extraídos.
Con referencia a cualquiera de la segunda implementación posible del tercer aspecto a la cuarta implementación posible del tercer aspecto, en una séptima implementación posible, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el procesador se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjunto de subbandas o extraer parámetros IPD de subbanda.
Con referencia a la séptima implementación posible del tercer aspecto, en una octava implementación posible, la segunda forma de extracción es extraer los parámetros IPD de conjunto de subbandas, y el procesador se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas;
obtener una varianza de IPD de subbanda de cada conjunto de subbandas;
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros iPd de conjunto de subbandas; y
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
Con referencia a la octava implementación posible del tercer aspecto, en una novena implementación posible, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el procesador se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros IPD de subbanda; y
calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual.
Con referencia a la primera implementación posible del tercer aspecto, en una décima implementación posible, cuando el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual, el procesador se configura específicamente para:
obtener unas señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en unas señales en el dominio de la frecuencia de canal izquierdo y derecho; y
calcular el valor de coherencia del canal izquierdo-derecho de la trama actual en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho.
Con referencia a la primera implementación posible del tercer aspecto, en una undécima implementación posible, cuando el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye la varianza de IPD de subbanda de la trama actual, el procesador se configura específicamente para:
obtener unas señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en unas señales en el dominio de la frecuencia de canal izquierdo y derecho; y
dividir las señales en el dominio de la frecuencia de canal izquierdo y derecho en al menos dos subbandas, calcular una IPD de cada subbanda en función de una señal en el dominio de la frecuencia de cada subbanda y calcular la varianza de IPD de subbanda de la trama actual en función de la IPD de cada subbanda.
En esta solicitud, cuando la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo, la codificación de parámetros IPD ocupa una cantidad relativamente pequeña de bits y pueden utilizarse más bits para codificar otros parámetros, mejorando así calidad de codificación de audio. En esta solicitud, puede utilizarse una pluralidad de parámetros IPD como parámetro IPD de la trama actual de señal multicanal, de modo que la información de fase puede mantenerse mejor y la precisión de la codificación de audio puede mejorarse. Además, una cantidad de parámetros IPD extraídos después de que las subbandas se clasifican en conjuntos de subbandas es menor que la de los parámetros IPD extraídos para todas las subbandas, y pueden utilizarse más bits para codificar otros parámetros, mejorando así la calidad de codificación de audio.
Breve descripción de los dibujos
Para describir las soluciones técnicas en las realizaciones de la presente invención más claramente, a continuación se describen brevemente los dibujos adjuntos necesarios para describir las realizaciones. Aparentemente, los dibujos adjuntos en la siguiente descripción muestran simplemente algunas realizaciones de la presente invención, y un experto en la técnica aún puede obtener otros dibujos de estos dibujos adjuntos sin esfuerzos creativos.
La figura 1 es un diagrama de principio esquemático de codificación PS;
la figura 2 es un diagrama de principio esquemático de decodificación PS;
la figura 3 es un diagrama de flujo esquemático de un método de extracción de parámetros IPD según una realización de la presente invención;
la figura 4 es otro diagrama de flujo esquemático de un método de extracción de parámetros IPD según una realización de la presente invención;
la figura 5 es un diagrama esquemático de asignación de una cantidad total de bits utilizados para la codificación de señales multicanal;
la figura 6a es un espectrograma de señal original de una señal multicanal;
la figura 6b es un espectrograma de señal de audio obtenido decodificando un espectrograma de señal original; la figura 6c es otro espectrograma de señal de audio obtenido decodificando un espectrograma de señal original; la figura 7 es un diagrama estructural esquemático de un aparato de extracción de parámetros IPD según una realización de la presente invención; y
la figura 8 es un diagrama estructural esquemático de un terminal según una realización de la presente invención.Descripción de las realizaciones
Lo siguiente describe clara y completamente las soluciones técnicas en las realizaciones de la presente invención con referencia a los dibujos acompañantes en las realizaciones de la presente invención. Aparentemente, las realizaciones descritas son simplemente algunas, pero no todas las realizaciones de la presente invención. Todas las demás realizaciones obtenidas por un experto en la técnica en función de las realizaciones de la presente invención sin esfuerzos creativos se incluirán dentro del alcance de protección de la presente invención.
Refiriéndose a la figura 1, la figura 1 es un diagrama de principio esquemático de la codificación PS.
En la codificación PS, un codificador mezcla (mezcla), en una señal de audio mono, códigos de una señal estéreo introducida por una pluralidad de canales (por ejemplo, un canal x1 y un canal x2), extrae un parámetro de percepción espacial de la señal estéreo a través del análisis del parámetro de percepción espacial, después codifica la señal de audio mono para obtener un flujo de bits de audio mono, y codifica el parámetro de percepción espacial para obtener un flujo de bits del parámetro de percepción espacial. Además, el codificador obtiene un flujo de bits en el que se codifica la señal estéreo multiplexando el flujo de bits de audio mono y el flujo de bits del parámetro de percepción espacial.
Refiriéndose a la figura 2, la figura 2 es un diagrama de principio esquemático de la decodificación PS.
Un decodificador demultiplexa un flujo de bits en el que se codifica una señal estéreo para obtener un flujo de bits de audio mono y un flujo de bits de parámetros de percepción espacial, después realiza la decodificación de señal de audio mono en el flujo de bits de audio mono y realiza la decodificación de parámetros de percepción espacial en el flujo de bits de parámetros de percepción espacial. Además, el decodificador decodifica una señal de audio mono y después sintetiza y reconstruye la señal estéreo utilizando un parámetro de percepción espacial.
Durante la implementación específica, los parámetros de percepción espacial en la codificación PS y la decodificación PS incluyen un IC, una ILD, una ITD, una IPD y similares. El IC describe una coherencia entre canales. Este parámetro decide la percepción de un rango de campo de sonido y puede mejorar la sensación de espacio de una señal de audio y la estabilidad acústica. La ILD se utiliza para identificar un ángulo horizontal de una fuente estéreo y describe una diferencia de intensidad entre canales. Este parámetro afecta a todos los componentes de frecuencia de un espectro. La ITD y la IPD son parámetros de percepción espacial que representan una orientación horizontal de una fuente de sonido. La ILD, la ITD y la IPD deciden cómo el oído humano percibe la ubicación de una fuente de sonido, lo que puede determinar efectivamente la ubicación de un campo de sonido y son importantes para la restauración de la señal estéreo. Por lo tanto, la determinación de parámetros tal como la IPD es importante para la restauración de la señal estéreo.
Con referencia a la figura 3 a la figura 8, a continuación se describe en detalle un método y aparato de extracción de parámetros IPD proporcionados en las realizaciones de la presente invención.
Con referencia a la figura 3, la figura 3 es un diagrama de flujo esquemático de un método de tracción de parámetros IPD según una realización de la presente invención. El método proporcionado en esta realización de la presente invención incluye las siguientes etapas.
S101. Obtener un parámetro utilizado para determinar una forma de extracción de información para una trama actual de una señal multicanal.
Durante la implementación específica, el método de extracción de parámetros IPD proporcionado en esta realización de la presente invención puede ser ejecutado por un codificador para la codificación de señales multicanal. Después de extraer un parámetro IPD de la trama actual de señal multicanal según el método de extracción de parámetros IPD proporcionado en esta realización de la presente invención, el codificador puede cuantificar y codificar el parámetro IPD extraído. Después de obtener el parámetro IPD mediante decodificación, un decodificador puede utilizar el parámetro IPD obtenido mediante decodificación para realizar el procesamiento de síntesis estéreo. A continuación se describe en detalle el método de extracción de parámetros IPD proporcionado en esta realización de la presente invención.
En algunas implementaciones factibles, al extraer el parámetro IPD de la trama actual de señal multicanal, el codificador puede obtener primero el parámetro que se utiliza para determinar la forma de extracción de información para la trama actual de señal multicanal, y después puede determinar una forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual. En otras palabras, el parámetro utilizado para determinar la forma de extracción de información para la trama actual se utiliza para determinar una forma de extraer información tal como el parámetro IPD de la trama actual de señal multicanal. Durante la implementación específica, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye al menos uno de un parámetro de característica de la señal de la trama actual y un parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual. Para ser específico, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal puede incluir el parámetro de característica de la señal de la trama actual, o el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual, o el parámetro de característica de la señal de la trama actual y el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual, o similares. El parámetro puede determinarse específicamente según los escenarios de aplicación reales, y no se limita en la presente memoria. A es un número entero no menor que 1. Para ser específicos, las A tramas anteriores a la trama actual pueden ser, por ejemplo, una trama, dos tramas o tres A tramas anteriores a la trama actual. Esto no está limitado en la presente memoria.
Durante la implementación específica, el parámetro de característica de la señal de la trama actual puede incluir uno o más parámetros tales como un valor de coherencia del canal izquierdo-derecho de la trama actual, un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de señal de la trama actual y una ITD de la trama actual. El valor de coherencia del canal izquierdo-derecho de la trama actual, el parámetro que es de la trama actual y que representa la coherencia de canal izquierdo-derecho, y la varianza de IPD de subbanda de la trama actual pueden calcularse en función de las señales del dominio de frecuencia del canal izquierdo y derecho de la señal multicanal. El codificador puede determinar el parámetro ITD de la trama actual en función de una forma de extracción de parámetros ITD para la trama actual de señal multicanal. La forma de extracción del parámetro ITD para la trama actual puede incluir una forma de extracción proporcionada en un protocolo estándar, o una forma de extracción existente conocida por un experto en la técnica. Esto no está limitado en la presente memoria.
El parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de un valor de coherencia del canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, una ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada uno de las A tramas anteriores a la trama actual y una clase de señal de cada uno de las A tramas anteriores a la trama actual. Para ser específico, el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual puede incluir la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, o la clase de señal de cada una de las A tramas anteriores a la trama actual, o la forma de extracción de parámetros IPD y la clase de señal de cada una de las A tramas anteriores a la trama actual, o similares. El parámetro de la característica de la señal puede determinarse específicamente según los escenarios de aplicación reales, y no se limita en la presente memoria. La forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual puede incluir una forma de extracción de parámetros IPD que es para cada una de las A tramas anterior a la trama actual de señal multicanal y que está determinada por el codificador en función de un parámetro utilizado para determinar una forma de extracción de información para cada una de las A tramas antes de la trama actual de señal multicanal, o una forma de extracción de parámetros IPD proporcionada en el protocolo estándar, o una forma de extracción de parámetros IPD existente conocida por un persona experta en la técnica, o similar. Esto no está limitado en la presente memoria. La clase de señal puede incluir trama de voz o trama de música.
En algunas implementaciones factibles, el codificador puede realizar una conversión de tiempo a frecuencia en unas señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal, para obtener unas señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Específicamente, la conversión de tiempo a frecuencia puede implementarse a través de una transformación rápida de Fourier (Transformación Rápida de Fourier, FFT) o la transformación de coseno discreto modificado (Transformación de Coseno Discreto Modificado, MDCT), o de otra forma. Esto no está limitado en la presente memoria. La conversión de tiempo a frecuencia puede realizarse por trama o puede realizarse por subtrama. Por ejemplo, el codificador puede convertir las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal en las señales en el dominio de la frecuencia de canal izquierdo y derecho a través de FFT. Las fórmulas de transformación específicas pueden incluir:
L n i -I
donde
n es un valor de índice de señal en el dominio del tiempo, k es un valor de índice de señal en el dominio de la frecuencia,Longitudes una longitud de trama,Les una longitud de conversión de tiempo a frecuencia para convertir una señal en el dominio del tiempo en una señal en el dominio de la frecuencia,xi_(n)yxn(n)son, respectivamente, unas señales en el dominio del tiempo de canal izquierdo y derecho, yL(k)yR(k)son, respectivamente, unos k-ésimos valores de frecuencia de una señal en el dominio de la frecuencia de canal izquierdo y de una señal en el dominio de la frecuencia de canal derecho que se utilizan para calcular un parámetro IPD.
Un coeficiente de transformación de Fourier X(k) de una secuencia de números reales x(n) (incluidoxi_(n)o XR(n) es un número complejo. Una parte real de X(k) tiene simetría par y una parte imaginaria de X(k) tiene simetría impar. En otras palabras, X(k) tiene la siguiente simetría conjugada: Tanto X(0) como X(N/2) son números reales, y se cumplen las siguientes expresiones relacionales:
x(k) = x\N-k)y\ < k <L /2 - 1
Durante un cálculo de transformación discreta de Fourier, debido a la simetría conjugada, puede que no sea necesario calcular o almacenar X(k), L/2 1 <k< L-1, o unas partes imaginarias de X(0) y X(L/2), y solo es necesario calcular de X(0) a X(L/2).
Después de convertir las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual en las señales en el dominio de la frecuencia de canal izquierdo y derecho, el codificador puede calcular el valor de coherencia del canal izquierdo-derecho de la trama actual en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho. Específicamente, una expresión para el valor de coherencia del canal izquierdo-derecho es la siguiente:
donde
Les la longitud de conversión de tiempo a frecuencia para convertir la señal en el dominio del tiempo en la señal en el dominio de la frecuencia,L(k)yR(k)son, respectivamente, los k-ésimos valores de frecuencia de la señal del dominio de la frecuencia del canal izquierdo y la señal en el dominio de la frecuencia del canal derecho que se utilizan para calcular el parámetro IPD, y R*(k) es un conjugado de R(k), es decir, R*(k) es un conjugado del k-ésimo valor de frecuencia de la señal en el dominio de la frecuencia del canal derecho.
En algunas implementaciones factibles, después de convertir las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual en las señales en el dominio de la frecuencia de canal izquierdo-derecho por trama o por subtrama, el codificador puede calcular, en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho, el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho. Específicamente, las expresiones para el parámetro que representa la coherencia del canal izquierdo-derecho son las siguientes:
donde
L(k)yR(k)son, respectivamente, los k-ésimos valores de frecuencia de la señal en el dominio de la frecuencia del canal izquierdo y la señal en el dominio de la frecuencia del canal derecho,Lr(k)yRr(k)son, respectivamente, unas partes reales de los k-ésimos valores de frecuencia de la señal en el dominio de la frecuencia del canal izquierdo y la señal en el dominio de la frecuencia del canal derecho,L(k)yR(k)son, respectivamente, unas partes imaginarias de los k-ésimos valores de frecuencia de la señal en el dominio de la frecuencia del canal izquierdo y la señal en el dominio de la frecuencia del canal derecho, L es una cantidad de coeficientes espectrales de subbanda y N es una cantidad de subbandas.
Alternativamente, una expresión para el parámetro que representa la coherencia del canal izquierdo-derecho es la siguiente:
donde
L es una cantidad de coeficientes espectrales de todas o algunas bandas de frecuencia.
Alternativamente, una expresión para el parámetro que representa la coherencia del canal izquierdo-derecho es la siguiente:
En algunas implementaciones factibles, después de convertir las señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual en señales en el dominio de la frecuencia de canal izquierdo y derecho, el codificador puede calcular además la varianza de IPD de subbanda de la trama actual en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho. Específicamente, las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual pueden dividirse primero en al menos dos subbandas (es decir, una pluralidad de subbandas). Se supone que hay subbandas Nsubbanda, donde Nsubbanda es un número entero mayor que 2. Además, puede calcularse un parámetro IPD de cada subbanda en función de una señal en el dominio de la frecuencia de cada subbanda obtenida mediante división, y la varianza de IPD de subbanda de la trama actual puede calcularse en función del parámetro IPD de cada subbanda. Para una b-ésima subbanda, donde b es un entero mayor o igual que 0 y menor que N y la b-ésima subbanda incluye una frecuencia Ab-i ák< Ab -1 , un parámetro IPD de la b-ésima subbanda puede calcularse utilizando la siguiente expresión:
A» i
lPD(b) = arg £ « * > * '< * ) . 0 ^ b < N ^ M¡
donde
L(k)es el k-ésimo valor de frecuencia de la señal en el dominio de la frecuencia del canal izquierdo, yR’(k)es un conjugado del k-ésimo valor de frecuencia de la señal en el dominio de la frecuencia del canal derecho.
El codificador puede calcular el parámetro IPD de cada subbanda en función de la expresión anterior, y después calcular la varianza de IPD de subbanda de la trama actual en función del parámetro IPD de cada subbanda. La varianza de IPD de subbanda puede calcularse utilizando la siguiente expresión:
1^ s u b b a n d a^
var = - -------- (lPD(b) - a v r f
^subbandaí’-O1
donde
Una vez que el codificador obtiene el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual, si el codificador necesita determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual, el codificador puede determinar directamente la forma de extracción de parámetros IPD utilizando el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual.
Después de que el codificador determina el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual, si el codificador necesita determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual, el codificador puede determinar directamente la forma de extracción de parámetros IPD utilizando el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual.
5102. Determinar una forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal.
Durante la implementación específica, en el método de extracción de parámetros IPD proporcionado en esta realización de la presente invención, el codificador puede seleccionar adaptativamente la forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual, es decir, seleccionar una de una pluralidad de formas de extracción de parámetros IPD preestablecidas como la forma de extracción de parámetros IPD para la trama actual de señal multicanal. La pluralidad de formas de extracción de parámetros IPD preestablecidas puede incluir una primera forma de extracción y una segunda forma de extracción. La primera forma de extracción incluye extraer una IPD de grupo, o no extraer ningún parámetro IPD de la trama actual de señal multicanal, o establecer el parámetro IPD de la trama actual de señal multicanal en 0. La segunda forma de extracción incluye extraer parámetros IPD de conjunto de subbandas, extraer parámetros IPD de subbanda, o similares. En combinación con la etapa S103, a continuación se describen implementaciones para determinar la forma de extracción de parámetros IPD para la trama actual de la extracción de señal multicanal y de parámetros IPD correspondientes a varias formas de extracción de parámetros IPD.
5103. Extraer un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinado para la trama actual de señal multicanal.
En algunas implementaciones factibles, el codificador puede determinar primero, en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción. En caso afirmativo, en función de la extracción correspondiente, el codificador extrae una IPD de grupo de la trama actual de señal multicanal, o no extrae ningún parámetro IPD, o establece el parámetro IPD de la trama actual de señal multicanal en 0. De lo contrario, el codificador puede determinar directamente que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer parámetros IPD de conjunto de subbandas o extraer parámetros IPD de subbanda. En este caso, durante la aplicación real, puede haberse determinado que la segunda forma de extracción es una de las dos formas de extracción y, por lo tanto, cuál de las dos formas de extracción se utiliza específicamente se determina una vez que se determina el uso de la segunda forma de extracción. Alternativamente, el codificador puede determinar además, en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer el conjunto de subbandas IPD parámetros o extraer parámetros IPD de subbanda.
En algunas implementaciones factibles, si el parámetro que obtiene el codificador y que se utiliza para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual, el valor de coherencia del canal izquierdo-derecho de la trama actual puede compararse con un primer umbral predefinido, y la varianza de IPD de subbanda de la trama actual puede compararse con un segundo umbral predefinido. Un rango de valores del primer umbral predefinido es [0,6, 0,95] y un rango de valores del segundo umbral predefinido es [0,05, 0,5]. Durante la implementación específica, un valor del primer umbral puede ser 0,89, 0,8, 0,75 o similar. 0,89 puede ser un valor máximo, 0,8 puede ser un valor intermedio y 0,75 puede ser un valor mínimo. El primer umbral puede determinarse específicamente dependiendo de los escenarios de aplicación reales, y no se limita en la presente memoria. Un valor del segundo umbral puede ser 0,45, 0,25, 0,3 o similar. 0,45 puede ser un valor máximo, 0,3 puede ser un valor intermedio y 0,25 puede ser un valor mínimo. El segundo umbral puede determinarse específicamente dependiendo de los escenarios de aplicación reales, y no se limita en la presente memoria. Si se descubre mediante la comparación que el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral y la varianza de IPD de subbanda de la trama actual es menor que el segundo umbral, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción. De lo contrario, se determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción.
Opcionalmente, en algunas implementaciones factibles, si el parámetro que se obtiene por el codificador y que se utiliza para determinar la forma de extracción de información para la trama actual de señal multicanal es el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho, un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho puede compararse con un primer umbral predefinido. Si el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdoderecho es mayor que el primer umbral, se determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción, por ejemplo, puede establecerse el parámetro IPD de la trama actual de señal multicanal en 0, o puede extraerse una IPD de grupo, o puede extraerse ningún parámetro IPD de la trama actual de señal multicanal. Un rango de valores y un valor específico del primer umbral pueden ser los descritos anteriormente. Por ejemplo, el primer umbral puede ser 0,75.
Opcionalmente, en algunas implementaciones factibles, si el parámetro que se obtiene por el codificador y que se utiliza para determinar la forma de extracción de información para la trama actual de señal multicanal es el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual, incluyendo la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual, puede determinarse si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual son una forma de extracción de parámetros IPD preestablecida, y si la clase de señal de cada uno de las A tramas anteriores a la trama actual es una clase de señal preestablecida. Si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es la primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de música, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción.
Por ejemplo, cuando A=1, las A tramas anteriores a la trama actual son una trama anterior a la trama actual. Si una forma de extracción de parámetros IPD para la trama anterior a la trama actual es la primera forma de extracción, y una clase de señal de la trama anterior a la trama actual es una trama de música, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción. De lo contrario, se determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción.
Cuando A=2, las A tramas anteriores a la trama actual son dos A tramas anteriores a la trama actual. Si una forma de extracción de parámetros IPD para cada una de las dos A tramas anteriores a la trama actual es la primera forma de extracción, y una clase de señal de cada una de las dos A tramas anteriores a la trama actual es la trama de música, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción. De lo contrario, se determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción.
En algunas implementaciones factibles, si el parámetro que obtiene el codificador y que se utiliza para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro ITD de la trama actual, la varianza de IPD de subbanda de la trama actual, y la clase de señal de cada una de las A tramas anteriores a la trama actual, puede compararse un valor absoluto del parámetro ITD de la trama actual con un tercer umbral predefinido, y puede compararse la varianza de IPD de subbanda de la trama actual con un cuarto umbral predefinido. Puede determinarse además si la clase de señal de cada una de las A tramas anteriores a la trama actual es una clase de señal objetivo. Un valor del tercer umbral predefinido es [0, 4] y un rango de valores del cuarto umbral predefinido es [0,05, 0,4]. Un valor del tercer umbral puede ser 4, 2, 0 o similar. 4 puede ser un valor máximo, 2 puede ser un valor intermedio y 0 puede ser un valor mínimo. El tercer umbral puede determinarse específicamente en función de los escenarios de aplicación reales, y no se limita en la presente memoria. Un valor del cuarto umbral puede ser 0,4, 0,35, 0,25 o similar. 0,4 puede ser un valor máximo, 0,35 puede ser un valor intermedio y 0,25 puede ser un valor mínimo. El cuarto umbral puede determinarse específicamente dependiendo de los escenarios de aplicación reales, y no se limita en la presente memoria. La clase de señal de destino es la trama de voz. Si se aprende mediante comparación que el valor absoluto del parámetro ITD de la trama actual es mayor que el tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que el cuarto umbral y la clase de señal de cada una de las A tramas antes de la trama actual es la trama de voz, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción. De lo contrario, se determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción.
Las A tramas anteriores a la trama actual pueden incluir una trama anterior a la trama actual, dos A tramas anteriores a la trama actual, tres A tramas anteriores a la trama actual, o similares. Esto no está limitado en la presente memoria. Si las A tramas anteriores a la trama actual son una trama anterior a la trama actual, cuando un valor absoluto de un parámetro ITD de la trama anterior a la trama actual es mayor que el tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que el cuarto umbral, y una clase de señal de la trama anterior a la trama actual es la trama de voz, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo. Si las A tramas anteriores a la trama actual son una pluralidad de A tramas anteriores a la trama actual, cuando el valor absoluto del parámetro ITD de la trama actual es mayor que el tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que el cuarto umbral, y una clase de señal de cada una de la pluralidad de A tramas anteriores a la trama actual es la trama de voz, puede determinarse que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción.
En algunas implementaciones factibles, después de determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal, el codificador codifica un bit de marca de la forma de extracción de parámetros IPD para la trama actual de señal multicanal y después cuantifica el parámetro IPD de la trama actual de señal multicanal en función de diferentes formas de extracción de diferentes formas.
En algunas implementaciones factibles, después de determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción, el codificador puede extraer el parámetro IPD de la trama actual de señal multicanal en función de la primera forma de extracción. Específicamente, si la primera forma de extracción es no extraer ningún parámetro IPD de la trama actual de señal multicanal, no se realiza ninguna operación y finaliza un proceso correspondiente a la extracción del parámetro IPD de la trama actual. Si la primera forma de extracción es establecer el parámetro IPD de la trama actual de señal multicanal en 0, un valor del parámetro IPD extraído de la trama actual de señal multicanal se establece en 0. Si la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de señal multicanal, la IPD de grupo de la trama actual de señal multicanal puede extraerse en función de la forma de extraer un parámetro IPD de grupo. La IPD de grupo extraído de la trama actual de señal multicanal se utiliza como el parámetro IPD de la trama actual de señal multicanal. Específicamente, el codificador puede extraer parámetros IPD de al menos algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Las al menos algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual pueden incluir específicamente todas o algunas de las subbandas Nsubbanda obtenidas dividiendo las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Esto no está limitado en la presente memoria. Durante una implementación específica, un usuario puede determinar, en función de un requisito de codificación en una codificación de señales multicanal, por ejemplo, una tasa de codificación o calidad de codificación, unos rangos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual que se utilizan para extraer la IPD de grupo de la trama actual de señal multicanal de la señal multicanal, incluidas unas señales en el dominio de la frecuencia en todos los rangos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, es decir, unas señales en el dominio de la frecuencia de todas las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual; o unos rangos en el dominio de la frecuencia específicos de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, es decir, algunas tramas de unas señales en el dominio de la frecuencia en las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual. Las algunas tramas de las señales en el dominio de la frecuencia en las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual se incluyen en las señales en el dominio de la frecuencia de algunas subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho.
En algunas implementaciones factibles, si el codificador determina que los rangos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual que se utilizan para extraer una IPD de grupo de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual son los rangos en el dominio de la frecuencia completos de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, pueden extraerse unos parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual (es decir, las subbandas Nsubbanda de la trama actual), puede calcularse un promedio de todos los parámetros IPD extraídos de las subbandas y, después, el promedio obtenido de todos los parámetros IPD extraídos de las subbandas puede utilizarse como la IPD de grupo de la trama actual de señal multicanal. El grupo IPD de la trama actual de señal multicanal se extrae en función de la siguiente fórmula:
donde
G_IPD es la IPD de grupo de la trama actual de señal multicanal, e IPD(b) es un parámetro IPD de una b-ésima subbanda.
En algunas implementaciones factibles es factible que si el codificador determina que los rangos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual que se utilizan para extraer una IPD de grupo de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual son unos rangos específicos en el dominio de la frecuencia de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, por ejemplo, [k1, k2], es decir, las señales en el dominio de la frecuencia entre una k1-ésima frecuencia y una k2-ésima frecuencia, pueden extraerse unos parámetros IPD de algunas subbandas (es decir, unas subbandas a las que pertenecen las señales en el dominio de la frecuencia entre la k1-ésima frecuencia y la k2-ésima frecuencia) de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, puede calcularse un promedio de todos los parámetros IPD extraídos de las subbandas y, después, el promedio obtenido de todos los parámetros IPD de las subbandas puede utilizarse como la IPD de grupo de la trama actual de señal multicanal.
Durante una implementación específica, los parámetros IPD de las subbandas a las que pertenecen las señales en el dominio de la frecuencia entre la k1-ésima frecuencia y la k2-ésima frecuencia pueden estar predefinidos como unos parámetros IPD de todas las frecuencias. En este caso, el cálculo de los parámetros IPD de las subbandas puede reemplazarse con el cálculo de los parámetros IPD de todas las frecuencias, y se calcula un parámetro IPD de cada frecuencia como un parámetro IPD de cada subbanda, para calcular la IPD del grupo de la trama actual de señal multicanal. Los parámetros IPD de todas las frecuencias en el rango en el dominio de la frecuencia preestablecido [k1, k2] se calculan uno por uno de la siguiente forma:
IPD(k) = ZL(k)R*(k\ k , < k < k2
donde
L(k)es el k-ésimo valor de frecuencia de la señal en el dominio de la frecuencia del canal izquierdo, yR'(k)es el conjugado del k-ésimo valor de frecuencia de la señal en el dominio de la frecuencia del canal derecho.
Además, el procesamiento estadístico se realiza en IPD (k) en un rango preestablecido (una pluralidad de tramas, incluida la trama actual y las A tramas previos a la trama actual, de señales en una señal en el dominio de la frecuencia multicanal), para obtener el parámetro IPD de grupo.
Por ejemplo, si el rango en el dominio de la frecuencia específico [k1, k2] es un rango de selección de cada una de las seis tramas de señales en el dominio de la frecuencia de canal izquierdo y derecho, un promedio de los parámetros IPD de (k2-k1 1) frecuencias en puede calcularse cada uno de las seis tramas de señales en el dominio de la frecuencia de canal izquierdo y derecho. Una fórmula de cálculo es la siguiente:
Además, puede calcularse y utilizar un promedio de parámetros IPD de seis tramas consecutivas, incluida la trama actual, como IPD de grupo de la trama actual de señal multicanal:
M [-l] M [2]donde,FDes un promedio de unos parámetros IPD de una trama anterior adyacente a la trama actual,lpnes un promedio de unos parámetros IPD de dos tramas anteriores a la trama actual, y así sucesivamente.
En algunas implementaciones factibles, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, puede determinarse directamente que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer parámetros IPD de conjunto de subbandas o extrayendo parámetros IPD de subbanda.
En algunas implementaciones factibles, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el codificador puede determinar además la forma de extracción de parámetros IPD para la trama actual de señal multicanal. Específicamente, el codificador puede clasificar las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en al menos dos conjuntos de subbandas (es decir, una pluralidad de conjuntos de subbandas). Cada conjunto de subbandas incluye una o más subbandas. Además, el codificador puede obtener una varianza de IPD de subbanda de cada conjunto de subbandas. Si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral, el codificador puede determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer los parámetros IPD de conjunto de subbandas. Entonces, el codificador puede calcular un parámetro IPD de cada conjunto de subbandas y utilizar el parámetro IPD obtenido de cada conjunto de subbandas como el parámetro IPD de la trama actual de señal multicanal.
En algunas implementaciones factibles, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el codificador puede determinar además la forma de extracción de parámetros IPD para la trama actual de señal multicanal. Específicamente, el codificador puede clasificar las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en al menos dos conjuntos de subbandas (es decir, una pluralidad de conjuntos de subbandas). Cada conjunto de subbandas incluye una o más subbandas. Además, el codificador puede obtener una varianza de IPD de subbanda de cada conjunto de subbandas. Si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdoderecho es mayor que el primer umbral, el codificador puede determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer los parámetros IPD de conjunto de subbandas. Entonces, el codificador puede calcular un parámetro IPD de cada conjunto de subbandas y utilizar el parámetro IPD obtenido de cada conjunto de subbandas como el parámetro IPD de la trama actual de señal multicanal.
Por ejemplo, haciendo referencia a la figura 4, la figura 4 es otro diagrama de flujo esquemático de un método de extracción de parámetros IPD según una realización de la presente invención. El método incluye las siguientes etapas.
5201. Calcular un valor de coherencia del canal izquierdo-derecho de una trama actual y una varianza de IPD de subbanda de la trama actual.
En algunas implementaciones, la etapa S201 puede determinar un valor de un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual.
5202. Determinar si una forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción; y, si el resultado de la determinación es afirmativo, realizar una etapa S203; o, de lo contrario, realizar una etapa S205.
Un codificador puede determinar, en función del valor de coherencia del canal izquierdo-derecho entre las señales en el dominio de la frecuencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción. Para un método de determinación específico, consultar la realización anterior, y los detalles no se describen en la presente memoria nuevamente.
Alternativamente, el codificador puede determinar, en función del valor del parámetro que es de la trama actual y que representa la coherencia de canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción. Para un método de determinación específico, consultar la realización anterior, y los detalles no se describen en la presente memoria nuevamente.
5203. Extraer una IPD de grupo de la trama actual de señal multicanal.
5204. Cuantificar y codificar la IPD del grupo.
Si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo, el codificador puede extraer la IPD de grupo de la trama actual de señal multicanal. Para una forma de extracción específica, consultar la realización anterior, y los detalles no se describen en la presente memoria nuevamente. Después de extraer la IPD de grupo de la trama actual de señal multicanal, el codificador puede realizar operaciones tales como cuantificación y codificación en la IPD de grupo. Para una forma específica de cuantificación y codificación, consultar una implementación descrita en un protocolo estándar, y los detalles no se describen en la presente memoria.
5205. Calcular una varianza de IPD de subbanda de las subbandas P1 y una varianza de IPD de subbanda de las subbandas P2.
5206. Determinar si la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer dos parámetros IPD; y, si el resultado de la determinación es afirmativo, realizar una etapa S207; o, de lo contrario, realizar una etapa S209.
Si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no extrae una IPD de grupo, el codificador puede clasificar las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en dos conjuntos de subbandas que incluyen un conjunto de subbandas 1 (el conjunto de subbandas 1 incluye subbandas P1) y un conjunto de subbandas 2 (el conjunto de subbandas 2 incluye subbandas P2), y después puede calcularse una varianza de IPD de subbanda (se denomina primera varianza) del conjunto de subbandas 1 (es decir, las subbandas P1) y una varianza de IPD de subbanda (se denomina segunda varianza) del conjunto de subbandas 2 (es decir, las subbandas P2). Una suma de P1 y P2 es igual a Nsubbanda. Cuando el valor de coherencia del canal izquierdo-derecho entre las señales en el dominio de la frecuencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y tanto la primera varianza como la segunda varianza son menores que un segundo umbral, el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer dos parámetros IPD, es decir, extraer parámetros IPD de dos conjuntos de subbandas. Alternativamente, cuando el valor del parámetro que es de la trama actual y que representa la coherencia de canal izquierdo y canal derecho entre las señales en el dominio de frecuencia de canal izquierdo y derecho es mayor que un primer umbral, y tanto la primera varianza como la segunda varianza son menores que un segundo umbral, el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer dos parámetros IPD, es decir, extraer unos parámetros IPD de dos conjuntos de subbandas.
La primera varianza se calcula de la siguiente forma:
donde
La segunda varianza se calcula de la siguiente forma:
donde
5207. Calcular un primer parámetro IPD y un segundo parámetro IPD.
5208. Cuantificar y codificar el primer parámetro IPD y el segundo parámetro IPD.
Además, después de determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer dos parámetros IPD, el codificador puede calcular por separado el primer parámetro IPD correspondiente al conjunto de subbandas 1 y el segundo parámetro IPD correspondiente al conjunto de subbandas 2. Un método para calcular el primer parámetro IPD y un método para calcular el segundo parámetro IPD puede ser el mismo que el método anterior para calcular la IPD de grupo. Para obtener más detalles, consultar la realización anterior, y los detalles no se describen en la presente memoria nuevamente. Después de calcular el primer parámetro IPD y el segundo parámetro IPD, el codificador puede cuantificar y codificar el primer parámetro IPD y el segundo parámetro IPD. Para una forma específica de cuantificación y codificación, consultar una implementación descrita en un protocolo estándar, y los detalles no se describen en la presente memoria.
5209. Calcular una varianza de IPD de subbanda de las subbandas P3 y una varianza de IPD de subbanda de las subbandas P4.
5210. Determinar si la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer tres parámetros IPD; y, si el resultado de la determinación es afirmativo, realizar una etapa S211; o, de lo contrario, realizar una etapa S213.
Además, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal no extrae dos parámetros IPD, el conjunto de subbandas 1 puede dividirse para obtener conjuntos de subbandas más finos (por ejemplo, un conjunto de subbandas 3 y un conjunto de subbandas 4, donde el conjunto de subbandas 3 incluye subbandas P3, el conjunto de subbandas 4 incluye subbandas P4, y P3+P4=P1). A continuación, pueden calcularse las varianzas de IPD de subbanda de todos los conjuntos de subbandas (el conjunto de subbandas 2, el conjunto de subbandas 3 y el conjunto de subbandas 4). Las varianzas de IPD de subbanda incluyen una segunda varianza, una tercera varianza y una cuarta varianza. Para conocer las formas de calcular la tercera varianza (es decir, una varianza de IPD de subbanda de las subbandas P3) y la cuarta varianza (es decir, una varianza de IPD de subbanda de las subbandas P4), consultar las formas anteriores para calcular la primera varianza y la segunda varianza, y los detalles no se describen en la presente memoria nuevamente. Cuando el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral, y la segunda varianza, la tercera varianza y la cuarta varianza son todas menores que el segundo umbral, el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer tres parámetros IPD.
5211. Calcular un segundo parámetro IPD, un tercer parámetro IPD y un cuarto parámetro IPD.
S212. Cuantificar y codificar el segundo parámetro IPD, el tercer parámetro IPD y el cuarto parámetro IPD.
Después de determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer tres parámetros iPd , el codificador puede extraer por separado el segundo parámetro IPD correspondiente al conjunto de subbandas 2, el tercer parámetro IPD correspondiente al conjunto de subbandas 3, y el cuarto parámetro IPD correspondiente al conjunto de subbandas 4, y después puede cuantificar y codificar el segundo parámetro IPD, el tercer parámetro IPD y el cuarto parámetro IPD. Para una forma específica de cuantificación y codificación, consultar una implementación descrita en un protocolo estándar, y los detalles no se describen en la presente memoria. Los métodos para calcular el segundo parámetro IPD, el tercer parámetro IPD y el cuarto parámetro IPD pueden ser los mismos que el método anterior para calcular la IPD de grupo. Para obtener más detalles, consultar la realización anterior, y los detalles no se describen en la presente memoria nuevamente.
La tercera varianza se calcula de la siguiente forma:
) -avr,)2
donde
La cuarta varianza se calcula con el siguiente método:
var<4>“* 4 bX= P 3(//J/x/ó -m'o)2
donde
donde
1<P3, P4<P1y P3+P4=P1.
5213. Calcular los K parámetros IPD.
5214. Cuantificar y codificar los K parámetros IPD.
Cabe señalar que esta realización de la presente invención no se limita a la extracción del primer parámetro IPD, el segundo parámetro IPD, el tercer parámetro IPD y el cuarto parámetro IPD. Cuando cualquiera de la tercera varianza, la cuarta varianza y la segunda varianza no cumple una condición, puede reducirse aún más un rango de cálculo para calcular K parámetros IPD y cuantificar y codificar los K parámetros IPD. Finalmente se implementan los M métodos de extracción de IPD. Tanto K como M son números enteros mayores o iguales que 4 y menores o iguales que Nsubbanda.
Opcionalmente, en algunas implementaciones opcionales, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el codificador puede obtener unas varianzas de IPD de subbanda de todos los conjuntos de subbandas, y si una o más de las varianzas de IPD de subbanda obtenidas de todos los conjuntos de subbandas son mayores que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, el codificador puede determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una forma de extracción de parámetros IPD de conjunto de subbandas. Después, el codificador puede calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y utilizar los parámetros IPD extraídos de todas las subbandas como el parámetro iPd de la trama actual de señal multicanal. En otras palabras, después de determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el codificador puede calcular los parámetros IPD de todas las subbandas Nsubbanda de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual, y después determinar los parámetros IPD de las subbandas Nsubbanda como el parámetro IPD de la trama actual de señal multicanal. Para conocer una forma de calcular los parámetros IPD de todas las subbandas, consultar la implementación anterior, y los detalles no se describen en la presente memoria nuevamente.
Opcionalmente, en algunas implementaciones opcionales, si el codificador determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el codificador puede obtener unas varianzas de IPD de subbanda de todos los conjuntos de subbandas, y si una o más de las varianzas IPD de subbanda obtenidas de todos los conjuntos de subbandas son mayores que el segundo umbral, o el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo es menor o igual que el primer umbral, el codificador puede determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros<i>P<d>de conjunto de subbandas. Después, el codificador puede calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y utilizar los parámetros IPD extraídos de todas las subbandas como el parámetro IPD de la trama actual de señal multicanal. En otras palabras, después de determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el codificador puede calcular los parámetros IPD de todas las subbandas Nsubbanda de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual, y después determinar los parámetros IPD de las subbandas Nsubbanda como el parámetro IPD de la trama actual de señal multicanal. Para conocer una forma de calcular los parámetros IPD de todas las subbandas, consultar la implementación anterior, y los detalles no se describen en la presente memoria nuevamente.
Refiriéndose a la figura 5, la figura 5 es un diagrama esquemático de asignación de una cantidad total de bits utilizados para la codificación de señales multicanal. En esta realización de la presente invención, en un escenario de aplicación en el que no cambia la cantidad total de bits utilizados para la codificación de señales multicanal (es decir, N1 M1 = N2 M2), cuando se utiliza la forma de extracción de parámetros IPD de grupo, se puede reducir una cantidad de bits ocupados por una codificación de parámetros IPD, y se pueden utilizar más bits para la codificación de otros parámetros, reduciéndose así una tasa de codificación mientras se mantiene una calidad de codificación; cuando se utiliza la forma de extracción de parámetros IPD de subbanda (incluidas una extracción de parámetros IPD de conjunto de subbandas y una extracción de parámetros IPD de la subbanda), una cantidad de bits ocupados por la codificación de parámetros IPD es mayor que cuando se utiliza la forma de extraer un parámetro IPD de grupo, y se puede seleccionar adaptativamente una forma de extracción de parámetros IPD para mejorar una calidad de codificación mientras se mantiene una tasa de codificación. N1 es una cantidad de bits utilizados para codificar un parámetro IPD de subbanda, M1 es una cantidad de bits de la trama actual que se utilizan para codificar parámetros distintos del parámetro IPD de subbanda, N2 es una cantidad de bits utilizados para codificar un parámetro de grupo IPD, M2 es una cantidad de bits de la trama actual que se utilizan para la codificación de parámetros distintos del parámetro de grupo IPD, y N1, N2, M1 y M2 son números enteros positivos.
La figura 6a a la figura 6c muestran espectrogramas para comparar los efectos del método de extracción de parámetros IPD (conmutación adaptativa entre la forma de extraer un parámetro IPD de grupo y la forma de extraer los parámetros IPD de subbanda, donde una forma de extracción de parámetros IPD se determina adaptativamente en función de un parámetro utilizado para determinar una forma de extracción de información para una trama actual) proporcionada en esta realización de la presente invención y una tecnología existente (extracción de parámetros IPD de subbanda Nsubbanda) bajo la premisa de que la cantidad total de bits para codificación no cambia. La figura 6a es un espectrograma de señal original de una señal multicanal, donde la señal original es una señal armónica. La figura 6b es un espectrograma de señal de audio obtenido por decodificación, mediante un decodificador según un algoritmo de decodificación correspondiente, un parámetro IPD que se extrae utilizando una tecnología existente y que está codificado. Como se muestra en la figura 6b, un componente armónico de una parte de alta frecuencia (una parte circular) de la señal original no se restaura en una señal de audio obtenida por el decodificador al decodificar la señal original y, por lo tanto, la señal de audio provoca una sensación de ruido relativamente fuerte en audición, causando molestias al oído humano. La figura 6c es un espectrograma de señal de audio obtenido decodificando, mediante un decodificador en función de un algoritmo de decodificación correspondiente, un parámetro IPD que se extrae en el método proporcionado en esta realización de la presente invención y que está codificado. Como se muestra en la figura 6c, un componente armónico de una parte de alta frecuencia de la señal original se restaura bien en una señal de audio obtenida por el decodificador al decodificar la señal original y, por lo tanto, la señal de audio no produce ninguna sensación de ruido en la audición. Puede aprenderse de un resultado de comparación que, en el método proporcionado en esta realización de la presente invención, la calidad auditiva de una señal de salida final puede mejorarse manteniendo una fase de señal estéreo.
En esta realización de la presente invención, el codificador puede preestablecer una pluralidad de formas de extracción de parámetros IPD, de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal, el codificador puede determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro obtenido utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal, implementando así la selección adaptativa entre las formas de extracción de parámetros IPD, y después el codificador puede extraer el parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinada. En esta realización de la presente invención, las opciones de la forma de extracción de parámetros IPD para la trama actual de señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de señal multicanal se correlaciona con el parámetro utilizado para determinar la forma de extracción de información para la trama actual más estrechamente. En esta realización de la presente invención, partiendo de la premisa de que no cambia la cantidad total de bits utilizados para una codificación de señales multicanal, a través de una selección adaptativa entre las formas de extracción de parámetros IPD, cuando se utiliza la forma de extracción de parámetros IPD de grupo, se puede reducir una cantidad de bits ocupados por una codificación de parámetros IPD, y se pueden utilizar más bits para codificar otros parámetros, reduciéndose así una tasa de codificación y manteniéndose una calidad de codificación; cuando se utiliza la forma de extracción los parámetros IPD de subbanda (incluidas una extracción de parámetros IPD del conjunto de subbandas y una extracción de parámetros IPD de la subbanda uno a uno), una cantidad de bits ocupados por una codificación de parámetros IPD es mayor que cuando se utiliza la forma de extracción de parámetros IPD de grupo, y se puede seleccionar adaptativamente una forma de extracción de parámetros IPD para mejorar una calidad de codificación mientras se mantiene una tasa de codificación.
Con referencia a la figura 7, la figura 7 es un diagrama estructural esquemático de una realización de un aparato de extracción de parámetros IPD según las realizaciones de la presente invención. El aparato de extracción proporcionado en esta realización de la presente invención incluye:
un módulo de obtención 10, configurado para obtener un parámetro utilizado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
un módulo de determinación 20, configurado para determinar una forma de extracción de parámetros IPD de diferencia de fase entre canales para la trama actual de señal multicanal en función del parámetro que se obtiene mediante el módulo de obtención y que se utiliza para determinar la forma de extracción de información para la trama actual de señal multicanal, donde
la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y
un módulo de extracción 30, configurado para extraer un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD que es para la trama actual de señal multicanal y que está determinada por el módulo de determinación.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye al menos uno de un parámetro de característica de la señal de la trama actual y un parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual, donde A es un número entero no menor que 1;
el parámetro de característica de la señal de la trama actual incluye al menos uno de un valor de coherencia del canal izquierdo-derecho de la trama actual, un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, una clase de señal de la trama actual y una diferencia de tiempo entre canales ITD de la trama actual;
el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de entre un valor de coherencia del canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, una ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
la clase de señal incluye trama de voz o trama de música.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y
si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro que es de la trama actual y que representa una coherencia del canal izquierdo-derecho; y si el parámetro que es de la trama actual y que representa la coherencia de canal izquierdo-derecho es mayor que un primer umbral, el módulo de determinación está configurado específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción. Un valor del primer umbral puede ser el descrito anteriormente, y los detalles no se describen en la presente memoria nuevamente.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro iTd de la trama actual, la varianza de IPD de subbanda de la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, el módulo de determinación se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de señal multicanal, o no extraer ningún parámetro IPD de la trama actual de señal multicanal, o establecer el parámetro IPD de la trama actual de señal multicanal en 0.
En algunas implementaciones factibles, cuando el módulo de determinación determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo, el módulo de extracción se configura específicamente para:
extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar una IPD de grupo de la trama actual de señal multicanal en función de los parámetros IPD de subbanda extraídos.
En algunas implementaciones factibles, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el módulo de determinación se configura específicamente para: determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjunto de subbandas o extraer parámetros IPD de subbanda.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de conjunto de subbandas, y el módulo de determinación se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas;
obtener una varianza de IPD de subbanda de cada conjunto de subbandas; y
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros<i>P<d>de conjunto de subbandas; y
el módulo de extracción se configura específicamente para:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas determinados por el módulo de determinación.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de conjunto de subbandas, y el módulo de determinación se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas;
obtener una varianza de IPD de subbanda de cada conjunto de subbandas; y
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros IPD de conjunto de subbandas; y
el módulo de extracción se configura específicamente para:
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas determinados por el módulo de determinación.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de subbanda, y el módulo de determinación se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros IPD de subbanda; y
el módulo de extracción se configura específicamente para:
calcular los parámetros IPD de todas las subbandas de las señales en el dominio de la frecuencia del canal izquierdo y derecho de la trama actual.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de subbanda, y el módulo de determinación se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros<i>P<d>de subbanda; y
el módulo de extracción se configura específicamente para:
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
Durante la implementación específica, el aparato de extracción de parámetros IPD puede ser específicamente el codificador descrito en las realizaciones de la presente invención. El aparato de extracción puede realizar, utilizando los módulos incorporados en el aparato de extracción, implementaciones descritas en las etapas de la forma de extracción de parámetros IPD. Los detalles no se describen nuevamente en la presente memoria.
En esta realización de la presente invención, el codificador puede preestablecer una pluralidad de formas de extracción de parámetros IPD, de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal, el codificador puede determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro obtenido utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal, implementando así la selección adaptativa entre las formas de extracción de parámetros IPD, y después el codificador puede extraer el parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinada. En esta realización de la presente invención, las opciones de la forma de extracción de parámetros IPD para la trama actual de señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de señal multicanal se correlaciona con el parámetro utilizado para determinar la forma de extracción de información para la trama actual más estrechamente. En esta realización de la presente invención, partiendo de la premisa de que no cambia una cantidad total de bits utilizados para la codificación de señales multicanal, a través de una selección adaptativa entre las formas de extracción de parámetros IPD, cuando se utiliza la forma de extracción de parámetros IPD de grupo, se puede reducir una cantidad de bits ocupados por una codificación de parámetros IPD, y se pueden utilizar más bits para una codificación de otros parámetros, reduciéndose así una tasa de codificación y manteniéndose una calidad de codificación; cuando se utiliza una extracción de parámetros IPD de subbanda (incluidas una forma de extracción de parámetros IPD del conjunto de subbandas y una extracción de parámetros IPD de subbanda), una cantidad de bits ocupados por una codificación de parámetros IPD es mayor que cuando se utiliza la forma de extracción de parámetros IPD de grupo, y se puede seleccionar adaptativamente una forma de extracción de parámetros IPD para mejorar una calidad de codificación mientras se mantiene una tasa de codificación.
Con referencia a la figura 8, la figura 8 es un diagrama estructural esquemático de un terminal según una realización de la presente invención. El terminal proporcionado en esta realización de la presente invención incluye una memoria 1000 y un procesador 2000. La memoria 1000 está conectada al procesador 2000.
La memoria 1000 se configura para almacenar un conjunto de código de programa.
El procesador 2000 está configurado para llamar al código de programa almacenado en la memoria 1000, para realizar las siguientes operaciones:
obtener un parámetro utilizado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
determinar una forma de extracción de parámetros de diferencia de fase entre canales (IPD) para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal, donde la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas; y
extraer un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye al menos uno de un parámetro de característica de la señal de la trama actual y un parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual, donde A es un número entero no menor que 1;
el parámetro de característica de la señal de la trama actual incluye al menos uno de un valor de coherencia del canal izquierdo-derecho de la trama actual, un parámetro que es de la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de la trama actual, y una ITD de diferencia de tiempo entre canales de la trama actual;
el parámetro de característica de la señal de cada una de las A tramas anteriores a la trama actual incluye al menos uno de entre un valor de coherencia del canal izquierdo-derecho de cada una de las A tramas anteriores a la trama actual, un parámetro que es de cada una de las A tramas anteriores a la trama actual y que representa una coherencia de canal izquierdo-derecho, una varianza de IPD de subbanda de cada una de las A tramas anteriores a la trama actual, una ITD de cada una de las A tramas anteriores a la trama actual, una forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual, y una clase de señal de cada una de las A tramas anteriores a la trama actual; y
la clase de señal incluye trama de voz o trama de música.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual y la varianza de IPD de subbanda de la trama actual; y
si el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el procesador 2000 se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho y la varianza de IPD de subbanda de la trama actual; y
si un valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que un primer umbral, y la varianza de IPD de subbanda de la trama actual es menor que un segundo umbral, el procesador 2000 se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y si la forma de extracción de parámetros IPD para cada una de las A tramas anteriores a la trama actual es una primera forma de extracción, y la clase de señal de cada una de las A tramas anteriores a la trama actual es la trama de música, el procesador 2000 se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es la primera forma de extracción.
En algunas implementaciones factibles, el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el parámetro iTd de la trama actual, la varianza de IPD de subbanda de la trama actual y la clase de señal de cada una de las A tramas anteriores a la trama actual; y
si un valor del parámetro ITD de la trama actual es mayor que un tercer umbral, la varianza de IPD de subbanda de la trama actual es menor que un cuarto umbral, y la clase de señal de cada una de las A tramas anteriores a la trama actual es una trama de voz, el procesador 2000 se configura específicamente para:
determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
En algunas implementaciones factibles, la primera forma de extracción incluye extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de señal multicanal, o no extraer ningún parámetro IPD de la trama actual de señal multicanal.
En algunas implementaciones factibles, cuando la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de señal multicanal, el procesador 2000 se configura específicamente para:
extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar una IPD de grupo de la trama actual de señal multicanal en función de los parámetros IPD de subbanda extraídos.
En algunas implementaciones factibles, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, el procesador 2000 se configura específicamente para: determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción, donde
la segunda forma de extracción incluye extraer parámetros IPD de conjunto de subbandas o extraer parámetros IPD de subbanda.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de conjunto de subbandas, y el procesador 2000 se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas;
obtener una varianza de IPD de subbanda de cada conjunto de subbandas;
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor de coherencia del canal izquierdo-derecho de la trama actual es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros IPD de conjunto de subbandas; y
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
En algunas implementaciones factibles, la segunda forma de extracción es extraer los parámetros IPD de conjunto de subbandas, y el procesador 2000 se configura específicamente para:
clasificar las subbandas de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, donde cada conjunto de subbandas incluye al menos una subbanda, y al menos un conjunto de subbandas incluye al menos dos subbandas;
obtener una varianza de IPD de subbanda de cada conjunto de subbandas;
si la varianza de IPD de subbanda de cada conjunto de subbandas es menor que el segundo umbral, y el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es mayor que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros IPD de conjunto de subbandas; y
calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
En algunas implementaciones factibles, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el procesador 2000 se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor de coherencia del canal izquierdo-derecho de la trama actual es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros IPD de subbanda; y
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
En algunas implementaciones factibles, la segunda forma de extracción es extraer parámetros IPD de subbanda, y el procesador 2000 se configura específicamente para:
si una varianza de IPD de subbanda de al menos un conjunto de subbandas es mayor que el segundo umbral, o el valor del parámetro que es de la trama actual y que representa la coherencia del canal izquierdo-derecho es menor o igual que el primer umbral, determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer unos parámetros iPd de subbanda; y
calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
En algunas implementaciones factibles, cuando el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye el valor de coherencia del canal izquierdo-derecho de la trama actual, el procesador 2000 se configura específicamente para:
obtener unas señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en unas señales en el dominio de la frecuencia de canal izquierdo y derecho; y
calcular el valor de coherencia del canal izquierdo-derecho de la trama actual en función de las señales en el dominio de la frecuencia de canal izquierdo y derecho.
En algunas implementaciones factibles, cuando el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal incluye la varianza de IPD de subbanda de la trama actual, el procesador 2000 se configura específicamente para:
obtener unas señales en el dominio del tiempo de canal izquierdo y derecho de la trama actual de señal multicanal, y convertir las señales en el dominio del tiempo de canal izquierdo y derecho en unas señales en el dominio de la frecuencia de canal izquierdo y derecho; y
dividir las señales en el dominio de la frecuencia de canal izquierdo y derecho en al menos dos subbandas, calcular una IPD de cada subbanda en función de una señal en el dominio de la frecuencia de cada subbanda y calcular la varianza de IPD de subbanda de la trama actual en función de la IPD de cada subbanda.
En esta solicitud, pueden preestablecerse una pluralidad de formas de extracción de parámetros IPD, de modo que al determinar la forma de extracción de parámetros IPD para la trama actual de señal multicanal, la forma de extracción de parámetros IPD para la trama actual de señal multicanal puede determinarse en función del parámetro obtenido utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal, implementando así la selección adaptativa entre las formas de extracción de parámetros IPD, y después el parámetro IPD de la trama actual de señal multicanal puede extraerse en función de la forma de extracción de parámetros IPD determinada. En esta solicitud, las opciones de la forma de extracción de parámetros IPD para la trama actual de señal multicanal se enriquecen, y la forma de extracción de parámetros IPD para la trama actual de señal multicanal se correlaciona con el parámetro utilizado para determinar la forma de extracción de información para la trama actual más estrechamente. En esta solicitud, cuando la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo, la codificación de parámetros IPD ocupa una cantidad relativamente pequeña de bits y pueden utilizarse más bits para codificar otros parámetros, mejorando así calidad de codificación de audio. En esta solicitud, puede utilizarse una pluralidad de parámetros IPD como parámetro IPD de la trama actual de señal multicanal, de modo que la información de fase puede mantenerse mejor y la precisión de la codificación de audio puede mejorarse. Además, una cantidad de parámetros IPD extraídos después de que las subbandas se clasifican en conjuntos de subbandas es menor que la de los parámetros IPD extraídos para todas las subbandas, y pueden utilizarse más bits para codificar otros parámetros, mejorando así la calidad de codificación de audio.
Un experto en la técnica puede entender que todos o algunos de los procesos de los métodos en las realizaciones pueden ser implementados por un programa informático que ordene a un hardware relevante. El programa puede almacenarse en un medio de almacenamiento legible por ordenador. Cuando se ejecuta el programa, pueden realizarse los procesos de los métodos en las realizaciones. El medio de almacenamiento puede incluir: un disco magnético, un disco óptico, una memoria de solo lectura (Read-Only Memory, ROM), una memoria de acceso aleatorio (Random Access Memory, RAM), o similares.
En la memoria descriptiva, las reivindicaciones y los dibujos adjuntos de la presente invención, los términos “ primero” , “ segundo” , “ tercero” , “ cuarto” y similares están destinados a distinguir entre diferentes objetos, pero no indican un orden específico. Además, los términos “ contener” , “ incluir” o cualquier otra variante de los mismos están destinados a cubrir una inclusión no exclusiva. Por ejemplo, un proceso, un método, un sistema, un producto o un dispositivo que incluye una serie de etapas o unidades no se limitan a las etapas o unidades enumeradas, sino que opcionalmente incluye además una etapa o unidad no enumerada, u opcionalmente incluye además otra etapa o unidad inherente del proceso, el método, el producto o el dispositivo.
Lo que se describe anteriormente son meramente ejemplos de realizaciones de la presente invención, y ciertamente no se pretende limitar el alcance de protección de la presente invención.

Claims (13)

  1. REIVINDICACIONES
    i .Un método de codificación de una señal multicanal, que comprende:
    obtener (S101) un parámetro utilizado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
    determinar (S102) una forma de extracción de parámetros diferencia de fase entre canales, IPD, para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal, en donde la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas;
    extraer (S103) un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal; y
    cuantificar y codificar el parámetro IPD extraído;
    en donde el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal comprende un parámetro que es de la trama actual y que representa un coherencia del canal izquierdo-derecho; y si un valor del parámetro que es de la trama actual y que representa una coherencia del canal izquierdo-derecho es mayor que un primer umbral, la determinación de una forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal comprende:
    determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
  2. 2. El método según la reivindicación 1, en donde el primer umbral es 0,75.
  3. 3. El método según la reivindicación 1 o 2, en donde la primera forma de extracción comprende extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de señal multicanal, o no extraer ningún parámetro IPD de la trama actual de señal multicanal, o establecer el parámetro IPD de la trama actual de señal multicanal en 0.
  4. 4. El método según la reivindicación 3, en donde, cuando la primera forma de extracción es extraer un parámetro IPD de grupo de la trama actual de señal multicanal, la extracción de un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal comprende:
    extraer parámetros IPD de subbanda de señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar una IPD de grupo de la trama actual de señal multicanal en función de los parámetros IPD de subbanda extraídos.
  5. 5. El método según la reivindicación 1 o 2, en donde, si la forma de extracción de parámetros IPD para la trama actual de señal multicanal no es la primera forma de extracción, la determinación de una forma de extracción de parámetros IPD para la trama actual de señal multicanal en función del parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal comprende además:
    determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción, en donde
    la segunda forma de extracción incluye extraer unos parámetros IPD de conjunto de subbandas o extraer unos parámetros IPD de subbanda.
  6. 6. El método según la reivindicación 5, en donde la segunda forma de extracción es extraer unos parámetros IPD de subbanda, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción comprende:
    calcular los parámetros IPD de todas o algunas subbandas de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual.
  7. 7.El método según la reivindicación 5, en donde la segunda forma de extracción es extraer unos parámetros IPD de subbanda, y la determinación de que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una segunda forma de extracción comprende:
    clasificar unas subbandas de unas señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual de señal multicanal en al menos dos conjuntos de subbandas, en donde cada conjunto de subbandas comprende al menos una subbanda, y al menos un conjunto de subbandas comprende al menos dos subbandas; y
    calcular un parámetro IPD de cada uno de los al menos dos conjuntos de subbandas.
  8. 8. Un aparato de codificación de una señal multicanal, que comprende:
    un módulo (10) de obtención, configurado para obtener un parámetro utilizado para determinar una forma de extracción de información para una trama actual de una señal multicanal;
    un módulo (20) de determinación, configurado para determinar una forma de extracción de parámetros de diferencia de fase entre canales, IPD, para la trama actual de señal multicanal en función del parámetro que es obtenido por el módulo de obtención y que se utiliza para determinar la forma de extracción de información para la trama actual de señal multicanal, en donde la forma de extracción de parámetros IPD determinada para la trama actual de señal multicanal es una de al menos dos formas de extracción de parámetros IPD preestablecidas;
    un módulo (30) de extracción, configurado para extraer un parámetro IPD de la trama actual de señal multicanal en función de la forma de extracción de parámetros IPD que es para la trama actual de señal multicanal y que es determinada por el módulo de determinación; y
    un módulo configurado para cuantificar y codificar el parámetro IPD extraído;
    en donde el parámetro utilizado para determinar la forma de extracción de información para la trama actual de señal multicanal comprende un parámetro que es de la trama actual y que representa una coherencia del canal izquierdo-derecho; y
    si el parámetro que es de la trama actual y que representa la coherencia de canal izquierdo-derecho es mayor que un primer umbral, el módulo de determinación está configurado específicamente para:
    determinar que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es una primera forma de extracción.
  9. 9. El aparato de codificación según la reivindicación 8, en donde el primer umbral es 0,75.
  10. 10. El aparato de codificación según la reivindicación 8 o 9, en donde la primera forma de extracción comprende extraer un parámetro IPD de grupo de diferencia de fase entre canales de la trama actual de señal multicanal, o no extraer ningún parámetro IPD de la trama actual de señal multicanal, o establecer el parámetro IPD de la trama actual de señal multicanal en 0.
  11. 11. El aparato de codificación según la reivindicación 10, en donde, cuando el módulo de determinación determina que la forma de extracción de parámetros IPD para la trama actual de señal multicanal es extraer una IPD de grupo, el módulo de extracción está configurado específicamente para:
    extraer los parámetros IPD de subbanda de las señales en el dominio de la frecuencia de canal izquierdo y derecho de la trama actual, y determinar una IPD de grupo de la trama actual de señal multicanal en función de los parámetros IPD de subbanda extraídos.
  12. 12. Un producto de programa informático que comprende unas instrucciones que, cuando son ejecutadas por un procesador, hacen que el procesador lleve a cabo las etapas del método de una cualquiera de las reivindicaciones 1 a 7.
  13. 13. Un medio de almacenamiento legible por ordenador que comprende unas instrucciones que, cuando son ejecutadas por un procesador, hacen que el procesador lleve a cabo las etapas del método de una cualquiera de las reivindicaciones 1 a 7.
ES23206156T 2016-05-31 2017-05-25 Inter-channel phase difference parameter extraction method and apparatus Active ES3033829T3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610377800.4A CN107452387B (zh) 2016-05-31 2016-05-31 一种声道间相位差参数的提取方法及装置
PCT/CN2016/102128 WO2017206416A1 (zh) 2016-05-31 2016-10-14 一种声道间相位差参数的提取方法及装置

Publications (1)

Publication Number Publication Date
ES3033829T3 true ES3033829T3 (en) 2025-08-08

Family

ID=60478483

Family Applications (2)

Application Number Title Priority Date Filing Date
ES23206156T Active ES3033829T3 (en) 2016-05-31 2017-05-25 Inter-channel phase difference parameter extraction method and apparatus
ES17805739T Active ES2836682T3 (es) 2016-05-31 2017-05-25 Método y dispositivo para extraer parámetro de diferencia de fase entre canales

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES17805739T Active ES2836682T3 (es) 2016-05-31 2017-05-25 Método y dispositivo para extraer parámetro de diferencia de fase entre canales

Country Status (6)

Country Link
US (4) US11393480B2 (es)
EP (4) EP4336495B1 (es)
KR (2) KR102288841B1 (es)
CN (3) CN107452387B (es)
ES (2) ES3033829T3 (es)
WO (2) WO2017206416A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107452387B (zh) 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN109215668B (zh) 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN110556116B (zh) * 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
GB2582749A (en) 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
EP4061224A1 (en) * 2019-11-18 2022-09-28 Empatica Srl Wearable biosensing device
EP4383254A1 (en) * 2022-12-07 2024-06-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder comprising an inter-channel phase difference calculator device and method for operating such encoder

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
KR101108061B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
US20110206223A1 (en) * 2008-10-03 2011-08-25 Pasi Ojala Apparatus for Binaural Audio Coding
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
WO2011045548A1 (fr) * 2009-10-15 2011-04-21 France Telecom Codage/decodage parametrique bas debit optimise
US9112591B2 (en) * 2010-04-16 2015-08-18 Samsung Electronics Co., Ltd. Apparatus for encoding/decoding multichannel signal and method thereof
KR101033241B1 (ko) * 2010-07-23 2011-05-06 엘아이지넥스원 주식회사 위상 배열 안테나 시스템을 위한 신호 처리 장치 및 방법
CN103262159B (zh) * 2010-10-05 2016-06-08 华为技术有限公司 用于对多声道音频信号进行编码/解码的方法和装置
CN102844808B (zh) * 2010-11-03 2016-01-13 华为技术有限公司 用于编码多通道音频信号的参数编码器
CN102446507B (zh) 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
WO2013149671A1 (en) 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
JP2015517121A (ja) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
US9338573B2 (en) * 2013-07-30 2016-05-10 Dts, Inc. Matrix decoder with constant-power pairwise panning
CN104681029B (zh) 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
CN104053120B (zh) * 2014-06-13 2016-03-02 福建星网视易信息系统有限公司 一种立体声音频的处理方法和装置
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
US10217467B2 (en) * 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals

Also Published As

Publication number Publication date
EP4336495A2 (en) 2024-03-13
CN107452387A (zh) 2017-12-08
US20250363998A1 (en) 2025-11-27
US12367885B2 (en) 2025-07-22
EP3822967A1 (en) 2021-05-19
EP4336495A3 (en) 2024-05-01
EP3451331A4 (en) 2019-06-19
CN107452387B (zh) 2019-11-12
CN115662449A (zh) 2023-01-31
EP4336495B1 (en) 2025-04-23
KR20190009363A (ko) 2019-01-28
EP4607512A3 (en) 2025-10-15
US20190096411A1 (en) 2019-03-28
BR112018074333A2 (pt) 2019-03-06
CN108475509A (zh) 2018-08-31
KR20200145859A (ko) 2020-12-30
EP3822967B1 (en) 2023-12-27
US20240161755A1 (en) 2024-05-16
EP3451331A1 (en) 2019-03-06
US11393480B2 (en) 2022-07-19
ES2836682T3 (es) 2021-06-28
WO2017206416A1 (zh) 2017-12-07
US20220328053A1 (en) 2022-10-13
EP3451331B1 (en) 2020-10-21
WO2017206794A1 (zh) 2017-12-07
CN108475509B (zh) 2022-10-04
US11915709B2 (en) 2024-02-27
KR102288841B1 (ko) 2021-08-10
KR102196390B1 (ko) 2020-12-29
EP4607512A2 (en) 2025-08-27

Similar Documents

Publication Publication Date Title
US12543013B2 (en) Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder
ES3033829T3 (en) Inter-channel phase difference parameter extraction method and apparatus
BR112018074333B1 (pt) Método e aparelho de extração de parâmetro de diferença de fase intercanal
BR122023025938B1 (pt) Método e aparelho de extração de parâmetro de diferença de fase intercanal, e meio de armazenamento
BR122023025938A2 (pt) Método e aparelho de extração de parâmetro de diferença de fase intercanal, e meio de armazenamento