WO2012094952A1 - 一种信号处理方法和装置 - Google Patents

一种信号处理方法和装置 Download PDF

Info

Publication number
WO2012094952A1
WO2012094952A1 PCT/CN2011/085197 CN2011085197W WO2012094952A1 WO 2012094952 A1 WO2012094952 A1 WO 2012094952A1 CN 2011085197 W CN2011085197 W CN 2011085197W WO 2012094952 A1 WO2012094952 A1 WO 2012094952A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
rotation
factor
rotation compensation
compensation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/CN2011/085197
Other languages
English (en)
French (fr)
Inventor
张德明
李海婷
阿里斯⋅塔勒布
许剑峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to EP18203003.1A priority Critical patent/EP3518121B1/en
Priority to KR1020137019665A priority patent/KR101627900B1/ko
Priority to EP11855360.1A priority patent/EP2664995A4/en
Priority to EP25165186.5A priority patent/EP4550325A3/en
Priority to JP2013547798A priority patent/JP5783395B2/ja
Publication of WO2012094952A1 publication Critical patent/WO2012094952A1/zh
Priority to US13/938,834 priority patent/US9519619B2/en
Anticipated expiration legal-status Critical
Priority to US15/345,074 priority patent/US9792257B2/en
Priority to US15/696,091 priority patent/US9996503B2/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Definitions

  • the present invention relates to the field of digital signal processing technologies, and more particularly to a signal processing method and apparatus. Background technique
  • voice, image, audio, and video transmissions have a wide range of application requirements, such as mobile phone calls, audio and video conferencing, broadcast television, multimedia entertainment, and the like.
  • audio and video compression coding technology has emerged.
  • the technique of transforming the signal from the time domain to the frequency domain and then encoding the processing also known as the transform domain coding technology, has good compression characteristics. Got a very wide range of applications.
  • DFT Discrete Fourier Transform
  • DCT Discrete Cosine Transform
  • DST Discrete Sine Transform
  • MDCT Modified Discrete Cosine Transform
  • An object of the embodiments of the present invention is to provide a data processing method for reducing the storage amount of the time domain frequency domain transform processing in the audio and video encoding process.
  • a data processing method according to an embodiment of the invention comprising:
  • FFT Fast Fourier Transform
  • a time domain to frequency domain signal processing method includes: preprocessing time domain data to obtain preprocessed data;
  • a frequency domain to time domain signal processing method includes: preprocessing a frequency domain data to obtain preprocessed data;
  • the step of obtaining the time domain data further includes: a step of performing fixed rotation compensation by using a fixed rotation compensation factor; wherein c and d are constants, and the N is twice the frequency domain data length, wherein the N is .
  • a signal processing apparatus includes: - - a reorganization unit for recombining the input data to obtain the reconstructed data;
  • a transform unit configured to perform a Fast Fourier Transform (FFT) transform on the pre-rotation processed data, where L is the length of the input data;
  • FFT Fast Fourier Transform
  • a time domain to frequency domain signal processing apparatus includes: a preprocessing unit for preprocessing time domain data to obtain preprocessed data; and a pre-rotation unit for Pre-rotating the pre-processed data using a twiddle factor;
  • the method further includes:
  • a frequency domain to time domain signal processing apparatus includes: a preprocessing unit configured to perform preprocessing on frequency domain data to obtain preprocessed data; and a pre-rotation unit, configured to Pre-rotating the pre-processed data using a rotation factor e ⁇ W ⁇ +0 ' 5 ;
  • a transform unit that performs a fast Fourier transform of the pre-rotation processed data by N/4 points; and a post-rotation unit that performs the fast Fourier-transformed data using a rotation factor d' ⁇ w ⁇ 5 Rotation processing; wherein, it also includes:
  • the twiddle factors used in the pre-rotation and post-rotation steps have symmetry and can reduce the amount of data storage. At the same time, using FFT can speed up the transformation and reduce its computational complexity.
  • FIG. 1 is a schematic flow chart of an embodiment of a time domain to frequency domain DCT-IV conversion method provided by the present invention
  • FIG. 2 is a schematic flowchart of another embodiment of a DCT-IV conversion method in a time domain to a frequency domain according to the present invention
  • FIG. 3 is a schematic flow chart of another embodiment of a time domain to frequency domain DCT-IV conversion method provided by the present invention.
  • FIG. 4 is a schematic flow chart of an embodiment of a time domain to frequency domain MDCT transform method according to the present invention.
  • FIG. 5 is a schematic flow chart of an embodiment of a frequency domain to time domain MDCT transform method according to the present invention.
  • FIG. 6 is a schematic flow chart of another embodiment of a time domain to frequency domain MDCT transform method provided by the present invention.
  • FIG. 7 is a schematic flow chart of another embodiment of a frequency domain to time domain MDCT transform method provided by the present invention.
  • FIG. 8 is a schematic structural diagram of an embodiment of a signal processing apparatus according to the present invention.
  • FIG. 9 is a schematic structural diagram of an embodiment of a signal processing apparatus in a time domain to a frequency domain according to the present invention.
  • FIG. 10 is a schematic structural diagram of an embodiment of a frequency domain to time domain signal processing apparatus according to the present invention. detailed description
  • audio codecs and video codecs are widely used in various electronic devices, such as: mobile phones, wireless devices, personal data assistants (PDAs), handheld or portable computers, GPS receivers/navigators. , cameras, audio/video players, camcorders, video recorders, surveillance equipment, etc.
  • PDAs personal data assistants
  • audio/video players camcorders
  • video recorders surveillance equipment, etc.
  • an electronic device includes an audio encoder or an audio decoder, and the audio encoder or decoder may be directly implemented by a digital circuit or a chip such as a DSP (digital signal processor), or may be executed by a software code driven processor in the software code. The process is implemented.
  • DSP digital signal processor
  • an audio encoder first performs frame processing on the input signal to obtain time domain data of 20 ms-frame; then window processing the time domain data to obtain a windowed signal; and time-domain signal after windowing Performing a frequency domain transform, such as MDCT transform or DCT-IV type transform, transforming the signal from the time domain to the frequency domain; then performing banding processing on the frequency domain signal to obtain a frequency domain signal after the band division; and then for each subband The energy of the signal is calculated, and the sub-band energy is quantized and transmitted to the decoding end. Next, adaptive bit allocation based on the audited masking effect is performed according to the quantized sub-band energy value, and each sub-band is obtained for quantization coding. The number of bits is finally normalized.
  • a frequency domain transform such as MDCT transform or DCT-IV type transform
  • the frequency points in each sub-band are normalized. According to the number of coded bits allocated, vector quantization is used to vector quantize the frequency points in the sub-band normalized to obtain vector quantization.
  • the codebook index is encoded and transmitted to the decoder. After receiving the compressed code stream transmitted by the encoding end, the decoding end searches for the codebook index of each sub-band signal energy from the code stream according to the corresponding decoding step, and obtains the quantized value of the energy of each sub-band signal; These quantized values use the bit allocation technique consistent with the encoding end to obtain the number of bits allocated by each subband; the number of bits allocated according to each subband, and the vector quantized codebook of each subband obtained from the code stream Indexing, obtaining the normalized frequency domain coefficients quantized by each sub-band; denormalizing the normalized frequency domain coefficients quantized by each sub-band according to the quantized values of the energy of each sub-band signal to obtain a complete frequency domain Signal; performing inverse transformation corresponding to the transform used by the
  • DCT As a spatial transformation, DCT is characterized by energy compactness, which makes DCT-based coding systems have good compression performance.
  • Type 4 DCT (DCT-I V) is often used for audio and video data compression.
  • the formula for the DCT-IV transformation is: HU- 1, where k is an integer between 0 and L1. It can be seen that performing DCT-IV positive and inverse transformations directly according to the transformation formula leads to high computational complexity and storage. Due to the wide application of DCT-IV transform in the field of real-time communication, especially audio coding, reducing the storage capacity of the DCT-V conversion method has become an urgent need.
  • a signal processing method is used to implement a DCT-IV transform in a time domain to a frequency domain in an encoding process, which reduces the storage amount of a transform process, and the method includes the following steps:
  • the data needs to be subjected to DCT-IV type conversion, and the data may be data after a pre-processing step such as windowing. Reorganize the data to get the reorganized data z ( ⁇ :
  • Wl cos3 ⁇ 4tll—j sin ⁇ l)
  • the string data table a ⁇ ⁇ , 0,1,2..., 1 ⁇ 2 _ 1 is sufficient.
  • the product of a and b is equal to , such pre-rotation and back-spin
  • the twiddle factor has a symmetry characteristic, that is,
  • the method prior to obtaining the frequency domain data, further comprises: performing a fixed rotation compensation using a fixed rotation compensation factor. Since the fixed rotation compensation in the transformation formula is multiplied by the operation of other parts, according to the exchange characteristic of the multiplication, one fixed rotation compensation or multiple fixed rotation compensation can be performed, and the execution order of the fixed rotation compensation can be obtained in the frequency domain. Any order before the data step.
  • the fixed rotation compensation is performed with ⁇ 3 ; the step of the fixed rotation compensation may be performed before the pre-rotation or after the pre-rotation, or before the post-rotation or after the post-rotation.
  • the fixed rotation compensation factor can be ⁇ 3 . To further reduce computational complexity, some approximations can be used instead of fixed rotation compensation.
  • the fixed rotation compensation factors when two fixed rotation compensations are performed, the fixed rotation compensation factors may be ⁇ ⁇ 1 and ⁇ ", or may be approximate values thereof.
  • the compensation factor for the first fixed rotation compensation is any one of ⁇ and w ⁇ , and the compensation factor for the second fixed rotation compensation is the other of the sums.
  • the first fixed rotation compensation may be performed before the pre-rotation or after the pre-rotation, and the second fixed rotation compensation may be performed before the post-rotation or after the post-rotation.
  • some approximations such as Taylor series expansion can be used instead of or for fixed rotation compensation.
  • the first-order Taylor series is used to expand the result 1 + as an approximation of ⁇
  • the first-order Taylor series expansion result is used as an approximation of "".
  • each compensation factor is ⁇ 3 or at least one compensation factor is an approximation of at least one factor of the product.
  • the factor of fixed rotation compensation can also be 1.
  • the step of fixed rotation compensation since the step of fixed rotation compensation is added, it can be ensured that the data obtained after the transformation is consistent with the data obtained by the original DCT-IV type transformation, and the accuracy of the DCT-IV transformation is improved.
  • the inverse transform of DCT-IV is basically the same as the step of forward transform. The difference is that the inverse transform firstly reorganizes the frequency domain data, and the final transform is the time domain data, in the twiddle factor.
  • the constants a and b become constants c and d.
  • a signal processing method is used to implement a DCT-IV transform in a time domain to a frequency domain in an encoding process, and reduce the storage amount of the transform process.
  • the method includes the following steps:
  • the data needs to be subjected to DCT-IV type conversion, and the data may be data after a pre-processing step such as windowing. Reorganize the data to get the reorganized data z ( ⁇ :
  • a is a constant.
  • Wl cos3 ⁇ 4tll—j sin ⁇ l)
  • p 0,1,2, ⁇ , - 1
  • Fixed rotation compensation is performed on the pre-rotated data, and the fixed rotation compensation factor is .
  • some approximations such as Taylor series expansion can be used instead of fixed rotation compensation. For example, using a first-order Taylor series expansion result 1 + as an approximation for fixed rotation - - make up.
  • the data multiplied by the FFT transform fixed rotate compensation, or data after the FFT transform is multiplied by a fixed rotation compensation approximation, approximation can be obtained using a Taylor series expansion, such as a first-order Taylor series expansion result "7 ' ⁇ ) as an approximation.
  • the product of the constants c and d of the two rotation factors is 2 / can.
  • the product of a and b is equal to, and the product of c and d is also equal.
  • the product of a and b is equal to 1, and the product of c and d is equal to 2 / .
  • This pre- and post-rotation only needs to store a cosine data table with a % point. Just fine.
  • the real part of the data after the rotation is recorded as 2 ?), which is the odd frequency of the frequency domain data; - -
  • the opposite of the imaginary part of the following data is - ⁇ -3 ⁇ 4 , which is the even frequency of the frequency domain data.
  • step of using the fixed rotation compensation in the embodiment may be performed not only after the pre-rotation but also before the pre-rotation; the step of performing the fixed rotation compensation may be performed not only before the post-rotation but also After the rotation, it is carried out.
  • the conversion formula the relationship between the two fixed rotation compensations and the operation of the other parts is multiplied, and the exchange characteristics of the multiplication can be applied, so that the step of performing the fixed rotation compensation can be interchanged with the step of performing the fixed rotation compensation.
  • the two fixed rotation compensation steps are used to ensure that the input data of the FFT transform is consistent with the input data of the FFT in the original DCT-IV transform, and the data obtained after the transform and the original DCT-IV type transform can be obtained.
  • the data is consistent, improving the accuracy of the DCT-IV transformation.
  • the inverse transform of DCT-IV is basically the same as the step of forward transform. The difference is that the inverse transform firstly reorganizes the frequency domain data, and the final transform obtains the time domain data, the constant in the rotation factor. a and b become constants c and d.
  • a signal processing method according to an embodiment of the present invention is used to implement a DCT-IV transform in the time domain to the frequency domain in the encoding process, and reduce the storage amount of the transform process. , the method includes the following steps:
  • Wl cos3 ⁇ 4tll_j sin ⁇ l)
  • ⁇ 5 ⁇ ? 0,1,2 ⁇ , 3 ⁇ 4 - 1 condition, so in the specific implementation process only need to store a cosine data table a ' COs ⁇ ' ⁇ ' 1 ' 2 ... or sine data table a' Sin ⁇ H 1 ' 2 "' ⁇ —1 .
  • S304 Perform fixed rotation compensation.
  • the FFT-transformed data is multiplied by the fixed rotation compensation, or the FFT-transformed data is multiplied by the approximate value for fixed rotation compensation.
  • the approximate value can be obtained by using the Taylor series expansion, such as using the first-order Taylor series expansion result 1 + As an approximation.
  • the product of the constants a and b is 2 / can.
  • the product of a and b is equal to , so pre- and post-rotation only need to store a cosine data table with a % point Just fine.
  • the step of performing fixed rotation compensation in the embodiment can be performed not only before the post-rotation, but also before the pre-rotation or before or after the FFT transformation, because the fixed rotation compensation in the transformation formula is opposite to the operation of the other parts.
  • the multiplication relationship can be applied to the exchange characteristics of multiplication.
  • the inverse transform of DCT-IV is similar to the step of forward transform, except that when the input of the inverse transform is frequency and time domain data, that is, an embodiment of the inverse transform of DCT-IV.
  • the inverse transform and the forward transform of DCT-IV may be different in the order of performing fixed rotation compensation. For example, fixed rotation compensation can be performed after the post-rotation after the forward transformation, and fixed rotation compensation can be performed before the pre-rotation in the inverse transformation.
  • the MDCT transform is reduced by the use of time domain aliasing cancellation (TDAC) techniques.
  • TDAC time domain aliasing cancellation
  • a signal processing method is used to implement a time domain to frequency domain MDCT transform in an encoding process to reduce the storage amount of the transform process.
  • the method includes the following steps:
  • S403 Perform the first fixed rotation compensation.
  • the fixed rotation compensation is performed on the pre-rotated data, and the fixed rotation compensation factor is ⁇ -° 375 .
  • some approximate values such as Taylor series expansion can be used instead of ⁇ -° 375 for fixed rotation compensation. For example, using the first-order Taylor series expansion result 1 + ( ⁇ as an approximation for fixed rotation compensation.
  • S404 Perform ⁇ / 4 point FFT transformation on the fixed rotation compensated data.
  • the FFT-transformed data is multiplied by W 5 for fixed rotation compensation, or the FFT-transformed data is multiplied by an approximation of W 5 for fixed rotation compensation.
  • the approximate value can be obtained by using Taylor's series expansion of W 5 , such as using first-order Taylor.
  • the series expansion result 1 + is taken as an approximation of W 5 .
  • the real part of the data after the post-rotation is recorded as the odd frequency of the frequency domain data; the inverse of the imaginary part of the data after the post-rotation is denoted by ⁇ - ⁇ , which is the even frequency of the frequency domain data.
  • the step of using the first fixed rotation compensation in the embodiment can be performed not only after the pre-rotation but also before the pre-rotation; the step of using the ° 375 for the second fixed rotation compensation can be performed not only in the Execute before the rotation, or after the rotation.
  • the exchange characteristic of the multiplication can be applied, and one fixed rotation compensation or multiple fixed rotation compensation can be performed, and the execution order of the fixed rotation compensation can be obtained in the frequency. Any order before the domain data step.
  • the product of each compensation factor is an approximation of W or at least one factor of the product W.
  • the storage factor can be reduced by using a symmetry rotation factor, and the storage capacity of the improved method is N/ 2 points, and the improved method storage amount is NM points.
  • the step of fixed rotation compensation is added to improve the accuracy of the MDCT transformation, and the data obtained after the transformation is guaranteed to be consistent with the data obtained by the original MDCT transformation.
  • the original formula for fast transform of MDCT based on N/4 point FFT is:
  • This symmetry feature can be used to reduce the amount of storage.
  • W 5 performs fixed rotation compensation.
  • the first-order Taylor series is used to expand the result 1 + ( ⁇ as an approximation of W 5 .
  • a signal processing method for implementing a frequency domain to time domain MDCT transform in an encoding process to reduce the storage amount of the transform process.
  • the method includes the following steps:
  • S502 Perform pre-rotation processing on the recombined data using a symmetric rotation factor.
  • the fixed rotation compensation is performed on the pre-rotated data, and the fixed rotation compensation factor is ⁇ -° 375 .
  • some approximate values such as Taylor series expansion can be used instead of ⁇ -° 375 for fixed rotation compensation. For example, using the first-order Taylor series to expand the result 1 + ( ⁇ as an approximation of w 5 ⁇ ⁇ Fixed rotation compensation.
  • S504 Perform FFT transformation of N/ 4 points on the data after the fixed rotation compensation.
  • S505 Perform a second fixed rotation compensation.
  • the FFT-transformed data is multiplied by WS for fixed rotation compensation, or the FFT-transformed data is multiplied by the approximate value of W 5 for fixed rotation compensation.
  • the approximate value can be obtained by using Taylor's series expansion of W 5 , such as using the first-order Taylor level.
  • the number expansion result 1 is taken as an approximation of W 5 .
  • the step of using the ⁇ -° 375 for the first fixed rotation compensation in the embodiment may be performed not only after the pre-rotation, but also before the pre-rotation; using the ⁇ - ⁇ 37 ⁇ for the second fixed rotation -
  • the step of the compensation can be performed not only before the post-rotation but also after the post-rotation. Due to the switching characteristics of the multiplication, fixed rotation compensation of three or more times can also be performed, and the product of each compensation factor is an approximation of at least one factor of the product W 75 .
  • a signal processing method is configured to implement a time domain to frequency domain MDCT transform in an encoding process, and reduce a storage amount of a transform process, where the method includes the following steps.
  • n 0,1,2, ⁇ , _ 1
  • the fixed rotation compensation is performed on the pre-rotated data, and the fixed rotation compensation factor is ⁇ -° 75 .
  • some approximate values such as Taylor series expansion can be used instead of ⁇ -° 75 for fixed rotation compensation.
  • the first-order Taylor series expansion result 1 + is used as an approximation of W for fixed rotation compensation.
  • S604 Perform FFT transformation of N/ 4 points on the data after the fixed rotation compensation.
  • the real part of the data after the post-rotation is recorded as the odd frequency of the frequency domain data; the inverse of the imaginary part of the data after the post-rotation is denoted by Xn - , which is the even frequency of the frequency domain data.
  • Xn - the inverse of the imaginary part of the data after the post-rotation
  • Xn - the even frequency of the frequency domain data.
  • ⁇ ' k ° ⁇ 2 - ⁇ - 1 , which can be expressed as: 0,... , /— l 0,... , — l
  • a signal processing method is configured to implement a frequency domain to time domain MDCT transform in an encoding process, and reduce a storage amount of a transform process. The method includes the following steps:
  • S702 Perform pre-rotation processing on the recombined data using a symmetric rotation factor.
  • the fixed rotation compensation is performed on the pre-rotated data, and the fixed rotation compensation factor is ⁇ -° 75 .
  • the fixed rotation compensation factor is ⁇ -° 75 .
  • the first-order Taylor series expansion result 1 + is used as an approximation of W for fixed rotation compensation.
  • S704 Perform FFT transformation of N/ 4 points on the data after the fixed rotation compensation.
  • S705 The post-rotation processing is performed on the FFT transformed data by using a symmetry rotation factor. Perform post-rotation processing on the FFT transformed data, and the rotation factor is d 'W,
  • an embodiment of the signal processing apparatus of the present invention includes:
  • a reorganization unit 801 configured to reassemble input data to obtain recombined data
  • FFT Fourier Transform
  • the output unit 805 is configured to obtain output data.
  • the signal processing apparatus may be used to implement a time domain to frequency domain or a frequency domain to time domain DCT-IV transformation in a codec process, where the input data is time domain data and the output data is frequency domain data during the forward transformation; The input data is frequency domain data, and the output data is time domain data.
  • the signal processing apparatus further includes:
  • a fixed rotation compensation unit for performing fixed rotation compensation processing using a fixed rotation compensation factor is configured to perform at least one fixed rotation compensation, at least - - The product of the rotation compensation factor for one fixed rotation compensation is ⁇ .
  • the fixed rotation compensation unit is configured to perform at least one fixed rotation compensation
  • the rotation compensation factor of the at least one fixed rotation compensation is a first-order Taylor series expansion value of at least one factor of the product.
  • the product of a and b can be equal to .
  • the present invention provides an embodiment of a time domain to frequency domain signal processing apparatus for implementing a time domain to frequency domain MDCT transform in an encoding process, and reducing a storage amount of a transform process.
  • the signal processing apparatus includes :
  • the pre-processing unit 901 is configured to perform pre-rotation processing on the pre-processed time domain data by using a rotation factor a ⁇ C by performing pre-processing on the time domain data to obtain pre-processed data;
  • a transform unit 903 configured to perform fast Fourier transform of the N/4 point on the pre-rotation processed data
  • the post-rotation unit 904 is configured to perform a post-rotation process on the data after the discrete Fourier transform using the rotation factor b ' ⁇ +o 5 to obtain frequency domain data; wherein, the method further includes:
  • the fixed compensation unit 905 is configured to perform fixed rotation compensation processing by using a fixed rotation compensation factor; the a and b are constants, and the N is a time domain data length, and the value is eN .
  • the fixed rotation compensation unit is configured to perform at least one fixed rotation compensation, and the product of the rotation compensation factor of the at least one fixed rotation compensation is W.
  • the fixed rotation compensation unit is configured to perform at least one fixed rotation compensation, - -
  • the rotation compensation factor of at least one fixed rotation compensation is a first-order Taylor series expansion value of at least one factor of the product.
  • An embodiment of the frequency domain to time domain signal processing apparatus provided by the present invention is configured to implement a frequency domain to time domain MDCT transform in an encoding process, and reduce a storage amount of a transform process.
  • the signal processing apparatus includes :
  • the recombining unit 1001 is configured to recombine the frequency domain data to obtain the recombined data
  • the pre-rotating unit 1002 is configured to perform pre-rotation processing on the recombined frequency domain data by using a rotation factor e ⁇ W ⁇ +0 ' 5 ;
  • the transform unit 1003 performs a fast Fourier transform of the pre-rotation processed data by N/4 points; the post-rotation unit 1004 rotates the fast Fourier transformed data by using the rotation factor d ⁇ C Processing; wherein, it also includes:
  • the fixed rotation compensation unit is configured to perform at least one fixed rotation compensation, and the product of the rotation compensation factor of the at least one fixed rotation compensation is W.
  • the fixed rotation compensation unit is configured to perform at least one fixed rotation compensation, the rotation compensation factor of the at least one fixed rotation compensation being a first-order Taylor series expansion value of at least one factor of the product W.
  • Exemplary logic blocks, modules, and circuits described in association with the embodiments disclosed herein can be constructed or implemented by a general purpose processor, a digital signal processor (DSP), an application specific integrated circuit (ASIC), a field programmable gate array. (FPGA) or other programmable logic device, discrete gate or transistor logic, discrete _ _ Hardware components, or any combination thereof designed to implement the functions described above.
  • a general purpose processor may be a microprocessor, but in the alternative, the processor may be any conventional processor, controller, microcontroller or state machine.
  • the processor can also be constructed as a combination of computing devices, e.g., a combination of a DSP and a microprocessor, a plurality of microprocessors, a combination of one or more microprocessors and a DSP core, or any other such configuration.
  • a combination of computing devices e.g., a combination of a DSP and a microprocessor, a plurality of microprocessors, a combination of one or more microprocessors and a DSP core, or any other such configuration.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Discrete Mathematics (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Complex Calculations (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soil Working Implements (AREA)
  • Combined Means For Separation Of Solids (AREA)

Description

一 一 一种信号处理方法和装置
本申请要求于 2011 年 01 月 10 日提交中国专利局、 申请号为 201110004032.5、 发明名称为 "一种信号处理方法和装置" 的中国专利申请的 优先权, 其全部内容通过引用结合在本申请中。 技术领域
本发明涉及数字信号处理技术领域, 尤其是一种信号处理方法和装置。 背景技术
在数字通信领域, 语音、 图像、 音频、 视频的传输有着非常广泛的应用需 求, 如手机通话、 音视频会议、 广播电视、 多媒体娱乐等。 为了降低音视频信 号存储或者传输过程中占用的资源, 音视频压缩编码技术应运而生。音视频压 缩编码技术的发展中涌现出了很多不同的技术分支,其中将信号由时域变换到 频域后再进行编码处理的技术,又称为变换域编码技术由于具有很好的压缩特 性, 得到了非常广泛的应用。
变换域编码技术中将信号由时域变换到频域的方法有很多种, 其中傅立 叶变换 ( Discrete Fourier transform, DFT )、 离散余弦变换 ( Discrete Cosine Transform, DCT )、 离散正弦变换( Discrete sine transform, DST )以及修正离 散余弦变换( Modified Discrete Cosine Transform, MDCT )等时频变换有着广 泛的应用, 在频谱分析、 图像编码和语音编码等领域的应用尤其广泛。 信号经 过时频变换后可以使用量化技术进行压缩编码,也可以使用其他一些参数音频 编码的方法进行编码, 从而达到数据压缩的目的。
然而, 发明人发现, 直接根据变换公式进行 DCT-IV或 MDCT正变换与逆 变换会导致很高的计算复杂度和存储量,提供一种低存储量的时域频域变换方 法成为一种迫切的需要。 发明内容
本发明实施例的目的在于提供一种数据处理方法,减少音视频编码过程中 时域频域变换处理的存储量。 - - 根据本发明的一实施例, 一种数据处理方法, 包括:
对输入数据进行重组, 得到重组后的数据;
使用一个对称的旋转因子对重组后的数据进行预旋转, 旋转因子为 a-^ , P = 0, ..., L I 2 - l ^ a为常数;
对予贞旋转处理后的数据进行 2个点的†夬速傅里 ( Fast Fourier Transform, FFT ) 变换, L为输入数据的长度;
使用一个对称的旋转因子对 FFT变换后的数据进行后旋转处理, 旋转因子 为
Figure imgf000004_0001
H , b为常数; 获得输出数据。 根据本发明的另一实施例, 一种时域到频域的信号处理方法, 包括: 对时域数据进行预处理, 得到预处理后数据;
使用旋转因子 a ' ^ 对所述预处理后的数据进行预旋转处理;
对所述预旋转处理后的数据进行 N/4点的快速傅里叶变换;
使用旋转因子 b ' ^k+°'5对所述离散傅里叶变换后的数据进行后旋转处理, 获得频域数据;
其中,在获得频域数据之前还包括: 利用固定旋转补偿因子进 定旋转 补偿的步骤; 所述 a、 b为常数, 所述 N为时域数据长度, 所述 = e N。 根据本发明的另一实施例, 一种频域到时域的信号处理方法, 包括: 对频域数据进行进行预处理, 得到预处理后的数据;
使用旋转因子 e ' W^+0'5对所述预处理后的数据进行预旋转处理;
对所述预旋转处理后的数据进行 N/4点的快速傅里叶变换;
使用旋转因子 d · 。·5对所述快速傅里叶变换后的数据进行后旋转处理; 对所述后旋转处理后的数据进行后处理, 获得时域数据;
其中,在获得时域数据之前还包括: 利用固定旋转补偿因子进行固定旋转 补偿的步骤; 所述 c、 d为常数, 所述 N为两倍的频域数据长度, 所述 ] N。 根据本发明的另一实施例, 一种信号处理装置, 包括: - - 重组单元, 用于对输入数据进行重组, 得到重组后的数据;
预旋转单元, 用于使用一个对称的旋转因子对重组后的数据进行预旋转, 旋转因子为 a ^1, Ρ = 0,···,^/2_1, a为常数;
变换单元, 用于对预旋转处理后的数据进行 个点的快速傅里 (Fast Fourier Transform, FFT) 变换, L为输入数据的长度;
后旋转单元, 用于使用一个对称的旋转因子对 FFT变换后的数据进行后旋 转处理, 旋转因子为 b'^^ , ? = 0,…, /2-1, b为常数;
输出单元, 用于获得输出数据。 根据本发明的另一实施例, 一种时域到频域的信号处理装置, 包括: 预处理单元, 用于对时域数据进行预处理, 得到预处理后的数据; 预旋转单元, 用于使用旋转因子 对所述预处理后的数据进行预旋 转处理;
变换单元,用于对所述预旋转处理后的数据进行 N/4点的快速傅里叶变换; 后旋转单元, 用于使用旋转因子 b'^^+o5对所述离散傅里叶变换后的数据 进行后旋转处理, 获得频域数据; 其中, 还包括:
固定补偿单元, 用于利用固定旋转补偿因子进2行固定旋转补偿处理; 所述 a、 b为常数, 所述 N为时域数据长度, 所述 = 。 根据本发明的另一实施例, 一种频域到时域的信号处理装置, 包括: 预处理单元, 用于对频域数据进行预处理, 得到预处理后的数据; 预旋转单元, 用于使用旋转因子 e · W^+0'5对所述预处理后的数据进行预旋 转处理;
变换单元, 对所述预旋转处理后的数据进行 N/4点的快速傅里叶变换; 后旋转单元, 使用旋转因子 d'^w^5对所述快速傅里叶变换后的数据进行 后旋转处理; 其中, 还包括:
固定补偿单元, 用于利用固定旋转补偿因子进行固定旋转补偿处理; 所述 c、 d为常数, 所述 N为两倍的频域数据长度, 所述 =e— ^。 一 一 本发明实施例,预旋转和后旋转步骤使用的旋转因子具有对称性, 可以降 低数据存储量。 同时, 使用 FFT可以加快变换的速度, 降低其计算复杂度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地, 下面描述 中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲, 在不付 出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1为本发明提供的时域到频域的 DCT-IV变换方法一个实施例的流程示 意图;
图 2为本发明提供的时域到频域的 DCT-IV变换方法另一个实施例的流程 示意图;
图 3为本发明提供的时域到频域的 DCT-IV变换方法另一个实施例的流程 示意图;
图 4为本发明提供的时域到频域的 MDCT变换方法一个实施例的流程示意 图;
图 5为本发明提供的频域到时域的 MDCT变换方法一个实施例的流程示意 图;
图 6为本发明提供的时域到频域的 MDCT变换方法另一个实施例的流程示 意图;
图 7为本发明提供的频域到时域的 MDCT变换方法另一个实施例的流程示 意图;
图 8为本发明提供的信号处理装置一个实施例的结构示意图;
图 9为本发明提供的时域到频域的信号处理装置一个实施例的结构示意 图;
图 10为本发明提供的频域到时域的信号处理装置一个实施例的结构示意 图。 具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是 全部的实施例。基于本发明中的实施例, 本领域普通技术人员在没有作出创造 性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。
数字信号处理领域, 音频编解码器、视频编解码器广泛应用于各种电子设 备中, 例如: 移动电话, 无线装置, 个人数据助理(PDA ), 手持式或便携式 计算机, GPS接收机 /导航器, 照相机, 音频 /视频播放器, 摄像机, 录像机, 监控设备等。 通常, 这类电子设备中包括音频编码器或音频解码器, 音频编码 器或者解码器可以直接由数字电路或芯片例如 DSP ( digital signal processor )实 现, 或者由软件代码驱动处理器执行软件代码中的流程而实现。
例如一种音频编码器, 首先对输入信号进行分帧处理, 得到 20ms—帧的 时域数据; 然后对时域数据进行加窗处理, 得到加窗后的信号; 对加窗后的时 域信号进行频域变换, 例如 MDCT变换或者 DCT-IV型变换, 将信号由时域变 换到频域; 再对频域信号进行分带处理, 得到分带以后的频域信号; 然后对每 一个子带信号的能量进行计算, 并对子带能量进行量化编码, 传输到解码端; 接下来根据量化后的子带能量值进行基于听觉掩蔽效应的自适应比特分配,得 到各个子带用于量化编码的比特数; 最后对各个子带内的频点进行归一化处 理,根据所分配的编码比特数,使用矢量量化技术对子带内归一化处理后的频 点进行矢量量化, 得到矢量量化的码书索引, 编码后传输到解码端。 解码端接 收到由编码端传输出来的压缩码流以后,才艮据相应的解码步骤从码流中查找出 各子带信号能量的码书索引, 并得到各子带信号能量的量化值; 根据这些量化 值釆用和编码端一致的比特分配技术,得到各个子带所分配的比特数; 根据各 个子带所分配的比特数, 以及从码流中获取的各个子带的矢量量化的码书索 引,得到各个子带量化后的归一化频域系数; 根据各子带信号能量的量化值将 各个子带量化后的归一化频域系数进行去归一化处理, 得到完整的频域信号; 对解码的到的频域信号进行编码端所用变换相对应的逆变换,将信号由频域变 换到时域, 对时域信号进行后处理后得到合成信号, 即为解码端输出信号。 时 域到频域的信号处理方法又可称作正变换,频域到时域的信号处理方法又可称 一 一 作逆变换。
DCT作为一种空间变换, 其最大特点是具有能量紧致性, 这就使得以 DCT 为基础的编码系统会具有很好的压缩性能。第四型 DCT(DCT-I V)经常用于音频 和视频数据压缩。 DCT-IV变换的公式为:
Figure imgf000008_0001
HU-1其中, k为 0到 L-l间的整数。可见,直接根据变换公式进行 DCT-IV 正变换与逆变换会导致很高的计算复杂度和存储量。 由于 DCT-IV变换在实时 通信领域特别是音频编码中的广泛应用,减少 DCT-V变换方法的存储量成为一 种迫切的需要。
参考图 1, 本发明一个实施例提供的一种信号处理方法, 用于实现编码过 程中的时域到频域的 DCT-IV变换, 减少变换过程的存储量, 该方法包括如下 步骤:
S101: 对时域数据进行重组, 得到重组后的数据。
假设 为需要进行 DCT-IV型变换的数据,该数据可以是经过加窗等预处 理步骤后的数据。 对数据 进行重组, 得到重组后的数据 z (^:
P) = ^P) +j-x(L-\-2pXp = 0X2,- 2-\
S102: 使用一个对称的旋转因子对重组后的数据进行预旋转,旋转因子为 - = 0,l,2,…, /2— 1, a为常数。 将重组数据 Z(P)进行预旋转处理,旋转因子为 a'^ , P = 0,1,2,—, /2_1。 , a为常数。
Figure imgf000008_0002
由于旋转因子中的 项可以写成以下形式:
Wl = cos¾tll—j sin^l), p = 0,1,2, ···, - 1 满 足 COS^¾^ = COS^¾^ = Sin^½ = 0,l,2,...,¾- 1 和 sm
Figure imgf000008_0003
= 0,1,2,… - 1的条件, 因此具体的实现过 程中只需要存储一个%点的余弦数据表格 a' ^' ^^012…^— 1或者正 — — 弦数据表格 a · ^, = 0,1,2…, ½ _ 1即可。
S103: 对预旋转处理后的数据进行 /2个点的快速傅里叶变换 (Fast Fourier Transform, FFT )。
S104: 使用一个对称的旋转因子对 FFT变换后的数据进行后旋转处理, 旋 转因子为 b 4r , q = Q L/2-\, b为常数; 对 FFT变换后的数据进行后旋转处理, 旋转因子为 b'^ , ? = 0,1,2,〜,J/2_1 即 q 为 0 到 L/2-1 间 的 整 数 。 其 中 r4L ~C0S" 4L - sm^^ = 0,l,2,.,¾-l? b为常数。 由于旋 因子中的 项同样可以写成以下形式:
W
Figure imgf000009_0001
q = 0,1,2,…, - 1 因此具体的实现过程中只需要存储一个%点的余弦数据表格 b-oos^, = 0Λ2,···^- i或者正弦数据表格 b'sm^S^ = 0,1,2,···, ½_1即 可。 在正变换中两个旋转因子的常数 a、 b乘积与逆变换中两个旋转因子的常数 c、 d乘积等于 2/ 时, 以正变换的输出数据直接作为逆变换的输入数据, 逆变 换的结果可以完成完全重构, 即恢复获得进行正变换前的数据, 通常在实际操 作中并不一定需要实现完全重构。 关于常数 a和 b取值的选择, 为了实现完全重 构, 只要满足正变换 a与 b的乘积乘上反变换 c与 d的乘积为 2/ 即可。 在一个实
施例中, a和 b的乘积等于
Figure imgf000009_0002
, 这样预旋转与后旋
— cos2r(2p+1), π = 012 ··· L/-\
转只需要存储一个^点的余弦数据表格 4L " ' ' 2 即可。
S105: 获得频域数据。
后旋转之后的数据的实部记为 2?), 是频域数据的奇数频率; 后旋转之 后的数据的虚部的相反数记为 (^-1_2), 是频域数据的偶数频率(
2-1
Figure imgf000010_0001
为后旋转之后的数据 y(k) =
由 于原 始 DCT-IV 变换 的 公 式
Figure imgf000010_0002
Α· = 0,1,2,…, -1 :
Figure imgf000010_0003
其中
L/2-1
WL p,q = Q,...,LI2— \
z(p) = x(2 p) + jx(L
Figure imgf000010_0004
可以重新写为:
Figure imgf000010_0005
其中, 为了简化计算, 可以取^ 近似为 1, 近似为 1,
2-l
Figure imgf000010_0006
= x(2p) + jx(L-l- 2p), p = 0,1,2,… , J / 2— 1
Figure imgf000010_0007
: 2g(2pfl)
cos. _ _/· sin^^ , p = 0,1,2,…^― 1
旋转因子 具备对称性特征, 即 满足
2,(2(½1-¾)+1) = cos2,(L (2q+1J) = ^ = 0,1,2,···,¾-1 s.^ 2,(2(½-1-¾)+1) = s^ 2,(L-4(2q+1)) = cosi^iii , q = o,i,2,… — 1
同样旋转因子 也满足这样的对称性。 - - 本实施例中, 由于预旋转和后旋转步骤使用的旋转因子具有对称性, 实现 的时候, 只需要为 存储一个 /2个点的余弦表或一个 /2个点的正弦表, 从 而可以降低数据存储量。 同时, 使用 FFT可以加快 DCT-IV变换的速度, 降低其 计算复杂度。进一步地,省去固定旋转步骤可以在变换满足重构特性情况下进 一步降低计算复杂度。
在另一个实施例中,在获得频域数据之前还包括: 利用固定旋转补偿因子 进行固定旋转补偿的步骤。由于变换公式中固定旋转补偿与其他部分的操作是 相乘的关系,根据乘法的交换特性, 可以进行一次固定旋转补偿也可以进行多 次固定旋转补偿,固定旋转补偿的执行顺序可以在获得频域数据步骤之前的任 意顺序。
在一个实施例中, 釆用 ^ϊ3进行一次固定旋转补偿; 该固定旋转补偿的步 骤可以是在预旋转之前或者在预旋转之后进行,还可以在后旋转之前进行或者 在后旋转之后进行。 执行一次补偿时, 固定旋转补偿因子可以是 ^ϊ3。 为了进 一步降低计算复杂度, 可以用一些近似值来代替 的固定旋转补偿。
= e— Ί = ^, 因此可以泰勒级数展开进行近似, 例如用一阶泰勒级数展开结 果 作为 ^ϊ3的近似值, 其中, 1 +· '( )表示实部为 1虚部为 fe)的复数。
在另一个实施例中,执行两次固定旋转补偿时, 固定旋转补偿因子可以是 ^ϊ1和 ^」, 也可以是它们的近似值。 第一次固定旋转补偿的补偿因子是 ^―和 w^中的任何一个, 第二次固定旋转补偿的补偿因子是 和 ^―」中的另一个。 第一次固定旋转补偿可以是在预旋转之前或者在预旋转之后进行,第二次固定 旋转补偿可以在后旋转之前进行或者在后旋转之后进行。为了进一步降低计算 复杂度可以用一些近似值如泰勒级数展开来代替 或 进行固定旋转补偿。 例如用一阶泰勒级数展开结果 1 + 作为 ^―的近似值, 用一阶泰勒级数展开 结果 作为 」的近似值。
显然的, 由于乘法的交换特性, 可以进行三次及以上的固定旋转补偿, 各 补偿因子的乘积为 ^ϊ3或者至少一个补偿因子为乘积为 的至少一个因子的 近似值。 固定旋转补偿的因子也可以为 1。
本实施例中, 由于增加了固定旋转补偿的步骤, 可以保证变换后得到数据 与原始 DCT-IV型变换后得到的数据一致, 提高 DCT-IV变换的准确度。 - - 另外, DCT-IV的反变换与正变换的步骤是基本一致的, 不同的是, 逆变 换中首先是对频域数据进行重组, 而最终变换以后得到的是时域数据,旋转因 子中的常数 a和 b变为常数 c和 d。
参考图 2, 本发明一个实施例提供的一种信号处理方法, 用于实现编码过 程中的时域到频域的 DCT-IV变换, 减少变换过程的存储量, 该方法包括如下 步骤:
S201: 对时域数据进行重组, 得到重组后的数据。
假设 为需要进行 DCT-IV型变换的数据,该数据可以是经过加窗等预处 理步骤后的数据。 对数据 进行重组, 得到重组后的数据 z (^:
z(p) = x(2p)+j-x(L-\-2p\p = 0X --;L/2-\
S202: 使用一个对称的旋转因子对重组后的数据进行预旋转,旋转因子为 - = 0,l,2,…, /2— 1 , a为常数。 将重组数据 Z(P)进行预旋转处理,旋转因子为 a'^ , P = 0,1,2,—, /2_1。
a为常数。
Figure imgf000012_0001
由于旋转因子中的 项可以写成以下形式:
Wl = cos¾tll—j sin^l), p = 0,1,2, ···, - 1 满 足
Figure imgf000012_0002
和 s'^¾^ = s''"^ ^ = = 0,1,2,···,¾ _ 1的条件,因此具体的实现过程 中只需要存储一个%点的余弦数据表格 a'C°sl£^, :0'1'2-^-1或者正弦数 据表格 a'sinl£^' = 0'1'2·",¾_1即可。
S203: 进行第一次固定旋转补偿。
对预旋转后的数据进行固定旋转补偿, 固定旋转补偿因子为 。 为了进 一步降低计算复杂度可以用一些近似值如泰勒级数展开来代替 进行固定旋 转补偿。 例如用一阶泰勒级数展开结果 1 + 作为 的近似值进行固定旋转 — — 补偿。
S204: 对固定旋转补偿后的数据进行 个点的 FFT变换。
S205: 进行第二次固定旋转补偿。
将 FFT变换后的数据乘以 进行固定旋转补偿, 或者将 FFT变换后的数据 乘以 的近似值进行固定旋转补偿, 近似值可以使用 的泰勒级数展开获得, 如使用一阶泰勒级数展开结果 "7'^)作为 的近似值。
S206:对使用一个对称的旋转因子对固定旋转补偿后的数据进行后旋转处 理 , 旋 转 因 子 为 b^^1 , qH .,L/2-l 。 其 中 Wl
Figure imgf000013_0001
= ο,ΐ, 2, · · ·, ¾ - 1 ? b为常数。 由于旋转因子中的 ^ 1项同样可以写成以下形式:
Wl = cos^¾±ll—j sin^¾±ll, q = 0,1,2, ···, _ 1 因此具体的实现过程中只需要存储一个%点的余弦数据表格
0,1,2,··· - 1
Figure imgf000013_0002
即可。
关于常数 a和 b取值的选择, 为了实现完全重构, 只要满足正变换两个旋转 因子的常数 a与 b的乘积乘上反变换两个旋转因子的常数 c与 d的乘积为 2/ 即 可。 一个实施例中, a和 b的乘积等于 ,c和 d的乘积也等于 。 另一个实施 例中 a和 b的乘积等于 l,c和 d的乘积等于 2/ 。 另一个实施例中选取
Figure imgf000013_0003
这样预旋转与后旋转只 需要存储一个% 点的余弦数据表格
Figure imgf000013_0004
即可。
S207: 获得变换后的频域数据。
后旋转之后的数据的实部记为 2?), 是频域数据的奇数频率; 后旋转之 - - 后的数据的虚部的相反数记为 -ι-¾ , 是频域数据的偶数频率。
y(2q) = Re{Z(q)}
r— Λ -> Q- 0,1,2,…, /2— 1
y(L-\-2q) = -lm{Z(q)} 0".., /2— 1
, 或者 p,q = 0,...,L/2-l
Figure imgf000014_0001
,为后旋 转之后的数据。 值得注意的是, 实施例中的使用 进行固定旋转补偿的步骤不仅可以在 预旋转之后执行, 也可以在预旋转之前进行; 使用 进行固定旋转补偿的步 骤不仅可以在后旋转之前执行, 也可以在后旋转之后进行。 另外变换公式中两 个固定旋转补偿与其他部分的操作是相乘的关系, 可以适用乘法的交换特性, 因此使用 进行固定旋转补偿的步骤可以与使用 进行固定旋转补偿的步骤 互换。 本实施例中, 釆用两次固定旋转补偿步骤, 可以保证 FFT变换的输入数据 与原 DCT-IV变换中 FFT的输入数据一致,同时可以保证变换后得到数据与原始 DCT-IV型变换后得到的数据一致, 提高 DCT-IV变换的准确度。 另外, DCT-IV的反变换与正变换的步骤是基本一致的, 不同的是, 逆变 换中首先是对频域数据进行重组, 而最终变换以后得到的是时域数据,旋转因 子中的常数 a和 b变为常数 c和 d 参考图 3, 本发明一个实施例提供的一种信号处理方法, 用于实现编码过 程中的时域到频域的 DCT-IV变换, 减少变换过程的存储量, 该方法包括如下 步骤:
S301: 对时域数据进行重组, 得到重组后的数据。 — — 假设 为需要进行 DCT-IV型变换的数据,该数据可以是经过加窗等预处 理步骤后的数据。 对数据 进行重组, 得到重组后的数据
ζθ) = ¾:2/7) + j' (Z _ 1— 2/?) , = 0, 1,2,…^― 1
S302: 使用一个对称的旋转因子对重组后的数据进行预旋转,旋转因子为 - W = 0, …, /2_1, a为常数。 将重组数据 Z(W进行预旋转处理,旋转因子为 a'^ , P = 0 D /2-l。 其中 ffT=C。^-/Sin^ ^ = 0,l,2,''', -l, a为常数。 由于旋转因子中的 项可以写成以下形式:
Wl = cos¾tll—j sin^l), p = 0,1,2, ·■·, - 1 满 足 cos ^ _cos ^ _sm ,/4 i 和 £ =。Ο5^ ? = 0,1,2 ··,¾— 1的条件,因此具体的实现过程 中只需要存储一个 点的余弦数据表格 a'COs ^' ^'1'2… 或者正弦数 据表格 a'sin^H 1'2"'^— 1即可。
S303: 对预旋转处理后的数据进行 个点的快速傅里叶变换 (Fast Fourier Transform, FFT )。
S304: 进行固定旋转补偿。 将 FFT变换后的数据乘以 进行固定旋转补偿,或者将 FFT变换后的数据 乘以 的近似值进行固定旋转补偿, 近似值可以使用 的泰勒级数展开获 得, 如使用一阶泰勒级数展开结果 1 + 作为 的近似值。 S305: 使用一个对称的旋转因子对固定旋转补偿后的数据进行后旋转处 理 , 旋 转 因 子 为 b¾]+1 , ? = 0,1,2,…, /2-1 。 其 中 WT = cos^l -jsn^q = 0,1,2, ···, - 1 , b为常数。 — ~ 由于旋转因子中的 项同样可以写成以下形式:
Wl = cos^¾±ll—j sin^¾±ll, q = 0,1,2, ···, _ 1 因此具体的实现过程中只需要存储一个%点的余弦数据表格
0,1,2,··· - 1
Figure imgf000016_0001
即可。 关于常数 a和 b取值的选择, 为了实现完全重构, 只要满足正变换两个旋转 因子的常数 a与 b的乘积乘上反变换两个旋转因子的常数 c与 d的乘积为 2/ 即 可。 一个实施例中, a和 b的乘积等于
Figure imgf000016_0002
, 这 样预旋转与 后旋转只 需要存储一个 % 点 的 余弦数据表格
Figure imgf000016_0003
即可。
S306: 获得频域数据。 后旋转之后的数据的实部记为 2?), 是频域数据奇数频率; 后旋转之后 的数据的虚部的相反数记为 -ι-¾ , 是频域数据偶数频率。
Figure imgf000016_0004
「 ,
= ∑ ( + 7¾) * PY C' p,q = 0,...,L/2-l
或 。 L 」 ,为后旋转之后的数 据' - - 实施例中的进行固定旋转补偿的步骤不仅可以在后旋转之前执行,也可以 在预旋转之前或者 FFT变换之前或者后旋转之后进行, 因为变换公式中固定旋 转补偿与其他部分的操作是相乘的关系, 可以适用乘法的交换特性。
本实施例中, 由于增加了固定旋转补偿的步骤, 可以保证变换后得到数据 与原始 DCT-IV型变换后得到的数据一致, 提高 DCT-IV变换的准确度。
DCT-IV的反变换与正变换的步骤是类似的, 不同的是反变换的输入为频 和时域数据时, 即构成 DCT-IV的反变换的实施例。 另外, DCT-IV的反变换与 正变换在进行固定旋转补偿的顺序上可以不同。例如, 可以正变换时在后旋转 之后进行固定旋转补偿, 而逆变换时在预旋转之前进行固定旋转补偿。 语音 /音频编码中, MDCT变换由于利用了时域混叠消除( TDAC )技术减
"边界效应 " 也得到 了 广泛的应用 。 MDCT变换的公式为:
A = 0 1… i— l
N " , 其中, A是归一化因子, A 为常数。 可见, 直接根据变换公式进行 MDCT正变换与逆变换会导致很高的计 算复杂度和存储量, 特别是对于点数较大的 MDCT变换。 由于 MDCT变换在实 时通信领域特别是音频编码中的广泛应用,提供一种快速的 MDCT变换方法也 同样成为一种迫切的需要。
参考图 4, 本发明一个实施例提供的一种信号处理方法, 用于实现编码过 程中的时域到频域的 MDCT变换, 减少变换过程的存储量, 该方法包括如下步 骤:
S401 : 对时域数据进行预处理, 得到预处理后的数据。 - 假设 ^ "为需要进行 MDCT变换的数据,该数据可以是经过加窗等步骤处理 后的数据。 对数据 ^ "进行重组, 得到重组后的数据 M ":
= 02„ + jzN/i2 n = 0,1,2, ···, _ 1
Figure imgf000018_0001
或者表示成:
= ~y ¾— « = 0,1,2,···, ¾-l
= yn-% _ y « = ¾,¾ + !,···,¾-!
S402: 使用一
为 a-C" = 0,1,2, ··· /— 1。 将重组数据 M "进行预旋转处理, 旋转因子为 a'^ « = 0,1,2,···, ¾-l JL 中 =e =cos(^^)" sm(^^) , a为常数。
由于旋转因子中的 C项可以写成以下形式: y ^ =
满 足 COSe (" + 0.5)) = Sin ( (w/— 1— " + 0.5)) 和 sin(^(« + 0.5)) = ( (Υ + 0.5))的条件, 因此具体的实现过程中只需要存储 一个 Ν 点的余弦数据表格 a'c°s( (" + 5)), "^Ί'2···^-1或者正弦数据表格 a-sin( (w + 0.5)), « = 0,1,2,· -·,¾-1即可
S403: 进行第一次固定旋转补偿。 对预旋转后的数据进行固定旋转补偿, 固定旋转补偿因子为 ^^—° 375。 为了 进一步降低计算复杂度可以用一些近似值如泰勒级数展开来代替^^—° 375进行固 定旋转补偿。 例如用一阶泰勒级数展开结果 1 + (^作为 的近似值进行固 定旋转补偿。 S404: 对固定旋转补偿后的数据进行 Ν/4个点的 FFT变换。
S405: 进行第二次固定旋转补偿。
将 FFT变换后的数据乘以 W 5进行固定旋转补偿,或者将 FFT变换后的数 据乘以 W 5的近似值进行固定旋转补偿,近似值可以使用 W 5的泰勒级数展 开获得, 如使用一阶泰勒级数展开结果 1 + 作为 W 5的近似值。
S406: 釆用一个对称的旋转因子对固定旋转补偿后的数据进行后旋转处 理 , 旋 转 因 子 为 b 0.5 , k =
Figure imgf000019_0001
。 其 中
Wn = e = cos(^^)" sm(^^) , b为常数。
由于旋转因子中的^ 项同样可以写成以下形式: yy
因此具体的实现过程中只需要存储一个 N/4点的余弦数据表格 a-cos(^(^ + 0.5) k = 0X2,..,%-\ 或 者 正 弦 数 据 表 格 a · sin( + 0.5)), A: = 0,1,2, ···,%- 1即可。
S407: 获得频域数据。
后旋转之后的数据的实部记为 是频域数据的奇数频率; 后旋转之后 的数据的虚部的相反数记为 λ-^, 是频域数据的偶数频率。
频域数据也即最终的谱为 ^ ' k = °^2-^-ί , 可表述为:
X2k = = 0,1,2, ···,¾-! un · W-0 75 · a k = 0,1,2, ···,¾-!
Figure imgf000019_0002
ΈΜ»·(1 + · a · n 0,1,2,… , — 1
Figure imgf000019_0003
- -
X%-,-k = - Im (! + 》 · b ·
Figure imgf000020_0001
· + · a 5 ζ t = ο,ι,2,···, ¾-i
值得注意的是, 实施例中的使用 进行第一次固定旋转补偿的步骤不 仅可以在预旋转之后执行, 也可以在预旋转之前进行; 使用 ° 375进行第二次 固定旋转补偿的步骤不仅可以在后旋转之前执行, 也可以在后旋转之后进行。
由于变换公式中固定旋转补偿与其他部分的操作是相乘的关系,可以适用 乘法的交换特性, 可以进行一次固定旋转补偿也可以进行多次固定旋转补偿, 固定旋转补偿的执行顺序可以在获得频域数据步骤之前的任意顺序。各补偿因 子的乘积为 W 或者乘积为 W 的至少一个因子的近似值。
本实施例中, 釆用具有对称性的旋转因子可以减少存储量, 改进前的方法 的存储量为 N/2个点, 改进后的方法存储量为 NM个点。 同时增加固定旋转补 偿的步骤, 提高 MDCT变换的准确度, 保证变换后得到的数据与原始 MDCT变 换后得到的数据一致。 原始的基于 N/4点 FFT的 MDCT快速变换的公式为:
Figure imgf000020_0002
可以重新写为:
Figure imgf000020_0003
其中,
W;+0-5 =e'j ("+ft5^co 2g( +ft5^- Sm(2g("N +ft5)) = 0,1,2···,%— 1
Figure imgf000020_0004
很容易证明这个改写后的旋转因子具备对称性特征, 即 C满足: — ~ cos(^ (« + 0.5)) = sin(^ (¾— 1— w + 0.5)) .
sin( (w + 0.5)) = cos(^ ¾— 1— w + 0.5)). 同样^ 5也满足这样的对称性。
利用这个对称性特征可以减少存储量。 实现的时候, 只需要为^" 存储 一个 /4个点的余弦表或一个 /4个点的正弦表, 并在做 /4个点的 FFT变换 之前进行^^— ° 375的固定旋转补偿, 在做 N"个点的 FFT变换之后进行 ° 375的固 定旋转补偿。 可以证明这个变换也是完全重构的。
为了进一步降低计算复杂度可以用一些近似值如泰勒级数展开来代替
W 5进行固定旋转补偿。例如用一阶泰勒级数展开结果 1 + (^作为 W 5的近 似值。
参考图 5, 本发明一个实施例提供的一种信号处理方法, 用于实现编码过 程中的频域到时域的 MDCT变换, 减少变换过程的存储量, 该方法包括如下步 骤:
S501: 对频域数据进行重组, 得到重组数据。
数据重组后获取的中间变量为( m +jX^-^ , k = 0,1,2,···,%— 1。
S502: 使用一个对称的旋转因子对重组数据进行预旋转处理。
将重组数据( ^+^ ^)进行预旋转处理, 旋转因子为 c +。.5 , k = 0,l,2,---,¾-lo 其中^ ^^)— (^^) , c为常数。
S503: 进行第一次固定旋转补偿。
对预旋转后的数据进行固定旋转补偿, 固定旋转补偿因子为 ^^—° 375。 为了 进一步降低计算复杂度可以用一些近似值如泰勒级数展开来代替^^—° 375进行固 定旋转补偿。 例如用一阶泰勒级数展开结果 1 + (^作为 w 5的近似值进行固 ~ ~ 定旋转补偿。
S504: 对固定旋转补偿后的数据进行 N/4个点的 FFT变换。 S505: 进行第二次固定旋转补偿。
将 FFT变换后的数据乘以 W S进行固定旋转补偿,或者将 FFT变换后的数 据乘以 W 5的近似值进行固定旋转补偿,近似值可以使用 W 5的泰勒级数展 开获得, 如使用一阶泰勒级数展开结果 1 作为 W 5的近似值。
S506: 使用一个对称的旋转因子对固定旋转后的数据进行后旋转处理。 对固定旋转补偿后的数据进行后旋转处理, 旋转因子为 d'c, !
// = 0,1,2,···,¾-1ο 其中^ , d为常数。 S507: 获得时域数据。
得到时域数据 '" = GH — 1
Figure imgf000022_0001
¾-ι = ¾+2„ = Im{wn } « = 0,1,2,···, ¾-l
其中
Figure imgf000022_0002
, 值得注意的是, 关于常数 、 b、 c和 d取值的选择, 为了实现完全重构, 只 要满足正变换 a与 b的乘积乘上反变换 c与 d的乘积为 4/ 即可。本实施例中选取 a=h=c=d=^l
a" ~C~ , 这 只 需要存储一个 Ν/4 点 的余弦数据表格
Figure imgf000022_0003
即可。
同样的, 实施例中的使用 ^^—° 375进行第一次固定旋转补偿的步骤不仅可以 在预旋转之后执行, 也可以在预旋转之前进行; 使用^— ΰ37ί进行第二次固定旋 - . 转补偿的步骤不仅可以在后旋转之前执行,也可以在后旋转之后进行。 由于乘 法的交换特性,也可以进行三次及以上的固定旋转补偿, 各补偿因子的乘积为 或者乘积为 W 75的至少一个因子的近似值。
本实施例中, 釆用两次固定旋转补偿的步骤, 提高 MDCT变换准确度, 保 证变换后得到的数据与原始 MDCT变换后得到的数据一致。 参考图 6, 本发明一个实施例提供的一种信号处理方法, 用于实现编码过 程中的时域到频域的 MDCT变换, 减少变换过程的存储量, 该方法包括如下步
S601: 对时域数据进行预处理, 得到预处理后的数据 t 假设 ^ "为需要进行 MDCT变换的数据,该数据可以是经过加窗等步骤处理 后的数据。 对数据 ^ "进行重组, 得到重组后的数据 M ":
= 02„ + ¾-ι-2„) n = 0,1,2, ···, _ 1 其中:
Figure imgf000023_0001
或者表示成:
Figure imgf000023_0002
S602: 使用一
为 a +U5, " = 0,1,2,···,/— 1。 将重组数据 M "进行预旋转处理, 旋转因子为 ¾'^^+5, " = 0,1,2,···,%-1。 其 中 =e =cos(^^)" sm(^^) , a为常数。
由于旋转因子中的 项可以写成以下形式: - -
满 足 COSe (" + 0.5)) = Sin ( (w/— 1— " + 0.5)) 和
Figure imgf000024_0001
0.5))的条件, 因此具体的实现过程中只需要存储 一个 Ν 点的余弦数据表格 a'c°s( (" + 5)), "^Ί'2···^-1或者正弦数据表格 a-sin( (w + 0.5)), « = 0,1,2,· -·,¾-1即可
S603: 进行固定旋转补偿。
对预旋转后的数据进行固定旋转补偿, 固定旋转补偿因子为 ^—°75。 为了 进一步降低计算复杂度可以用一些近似值如泰勒级数展开来代替^^—°75进行固 定旋转补偿。 例如用一阶泰勒级数展开结果 1 + 作为 W 的近似值进行固 定旋转补偿。
S604: 对固定旋转补偿后的数据进行 N/4个点的 FFT变换。
S605: 釆用一个对称的旋转因子对 FFT变换后的数据进行后旋转处理。 对 FFT变换后的数据进行后旋转处理, 旋转因子为
Λ = 0,1,2,···,¾-1ο 其中^ ^^)— (^^) , b为常数。
由于旋转因子中的 项同样可以写成以下形式: 因此具体的实现过程中只需要存储一个 N/4点的余弦数据表格 a-cos(^(^ + 0.5) h = 0X2,..,%-\ 或 者 正 弦 数 据 表 格 a · sin( + 0.5)), A: = 0,1,2, ···,%- 1即可。
S606: 获得频域数据。
后旋转之后的数据的实部记为 是频域数据的奇数频率; 后旋转之后 的数据的虚部的相反数记为 Xn - , 是频域数据的偶数频率。 — ~ 频域数据也即最终的谱为 ^ ' k = °^2-^-1 , 可表述为: 0,… ,/— l 0,… , — l
Figure imgf000025_0001
或者
0,… ,/— l k = 0,-,y4-l
Figure imgf000025_0002
值得注意的是,实施例中的进行固定旋转补偿的步骤可以在预旋转之后或 者预旋转之前进行,也可以在后旋转之前或者后旋转之后进行, 因为变换公式 中固定旋转补偿与其他部分的操作是相乘的关系, 可以适用乘法的交换特性。 参考图 7, 本发明一个实施例提供的一种信号处理方法, 用于实现编码过 程中的频域到时域的 MDCT变换, 减少变换过程的存储量, 该方法包括如下步 骤:
S701: 对频域数据进行重组, 得到重组数据。
数据重组后获取的中间变量为 ∑lk +jX"A-^ , k = 0,l,2,-,¾-lo
S702: 使用一个对称的旋转因子对重组数据进行预旋转处理。
将重组数据( ^ +^ ^)进行预旋转处理, 旋转因子为 c +。.5 , k = 0,l,2,---,¾-lo 其中^ ^^)— (^^) , c为常数。
S703: 进行固定旋转补偿。
对预旋转后的数据进行固定旋转补偿, 固定旋转补偿因子为 ^—°75。 为了 - - 进一步降低计算复杂度可以用一些近似值如泰勒级数展开来代替^^—°75进行固 定旋转补偿。 例如用一阶泰勒级数展开结果 1 + 作为 W的近似值进行固 定旋转补偿。
S704: 对固定旋转补偿后的数据进行 N/4个点的 FFT变换。
S705: 釆用一个对称性的旋转因子对 FFT变换后的数据进行后旋转处理。 对 FFT变换后的数据进行后旋转处理, 旋转因子为 d'W,
+0.5 2π +0.5) 2π +0.5)
« = 0,1,2,···,¾-1ο 其中^ — (^^) , d为常数。
S706: 获得时域数据。 得到时域数据^'"^'1'2'…'^—1
Figure imgf000026_0001
¾-ι-2„ = ¾+2„ = lm } " = Ο,Ι,2, — 1
= ¾¾-i-2„ = lm } " = 1, ···,%- 1
_ /8 « = 0,1,2,· -·,¾-1
其中 ίΜ"+% = « ,
值得注意的是, 关于常数&、 b、 c和 d取值的选择, 为了实现完全重构, 只 要满足正变换 a与 b的乘积乘上反变换 c与 d的乘积为 4/ 即可。本实施例中选取
¾ C ^ , 这样只 需要存储一个 ΝΜ 点的余弦数据表格
^=cos(^(A + 0.5)), Λ = 0,1,2,···,¾-1
yJN 即可。 同样的,实施例中的进行固定旋转补偿的步骤可以在预旋转之后或者预旋 转之前进行,也可以在后旋转之前或者后旋转之后进行, 因为变换公式中固定 旋转补偿与其他部分的操作是相乘的关系, 可以适用乘法的交换特性。 - - 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算 机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。 其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random Access Memory, RAM)等。 参考图 8与上述方法实施例相关联, 本发明信号处理装置的一个实施例包 括:
重组单元 801, 用于对输入数据进行重组, 得到重组后的数据;
预旋转单元 802, 用于使用一个对称的旋转因子对重组后的数据进行预旋 转, 旋转因子为 a ^1, Ρ = υ - , a为常数;
Fourier Transform, FFT ) 变换, L为输入数据的长度;
后旋转单元 804, 用于使用一个对称的旋转因子对 FFT变换后的数据进行 后旋转处理, 旋转因子为 b'^^ , ? = 0,…, /2-1, b为常数;
输出单元 805, 用于获得输出数据。
上述信号处理装置可以用于实现编解码过程中的时域到频域或频域到时 域的 DCT-IV变换, 正变换时输入数据为时域数据, 输出数据为频域数据; 逆 变换时输入数据为频域数据, 输出数据为时域数据。
在另一个实施例中, 信号处理装置还包括:
固定旋转补偿单元, 用于利用固定旋转补偿因子进行固定旋转补偿处理。 一个实施例中, 固定旋转补偿单元用于进行至少一次固定旋转补偿, 至少 - - 一次固定旋转补偿的旋转补偿因子的乘积为^^。
另一个实施例中, 固定旋转补偿单元用于进行至少一次固定旋转补偿, 所 述至少一次固定旋转补偿的旋转补偿因子为乘积 的至少一个因子的一阶泰 勒级数展开值。 为了满足重构, a和 b的乘积可以等于
Figure imgf000028_0001
。 本发明提供的时域到频域的信号处理装置的一个实施例,用于实现编码过 程中的时域到频域的 MDCT变换, 减少变换过程的存储量, 参考图 9, 该信号 处理装置包括:
预处理单元 901 , 用于对时域数据进行预处理, 得到预处理后的数据; 预旋转单元 902, 用于使用旋转因子 a · C对所述预处理后的时域数据进 行预旋转处理;
变换单元 903 ,用于对所述预旋转处理后的数据进行 N/4点的快速傅里叶变 换;
后旋转单元 904, 用于使用旋转因子 b ' ^^+o5对所述离散傅里叶变换后的数 据进行后旋转处理, 获得频域数据; 其中, 还包括:
固定补偿单元 905 , 用于利用固定旋转补偿因子进行固定旋转补偿处理; 所述 a、 b为常数, 所述 N为时域数据长度, 所述 = e N
一个实施例中, 固定旋转补偿单元用于进行至少一次固定旋转补偿, 该至 少一次固定旋转补偿的旋转补偿因子的乘积为 W。
另一个实施例中, 固定旋转补偿单元用于进行至少一次固定旋转补偿, 该 - - 至少一次固定旋转补偿的旋转补偿因子为乘积为 的至少一个因子的一阶 泰勒级数展开值。
本发明提供的频域到时域的信号处理装置的一个实施例,用于实现编码过 程中的频域到时域的 MDCT变换, 减少变换过程的存储量, 参考图 10, 该信号 处理装置包括:
重组单元 1001 , 用于对频域数据进行重组, 得到重组后的数据; 预旋转单元 1002, 用于使用旋转因子 e · W^+0'5对所述重组后的频域数据进 行预旋转处理;
变换单元 1003 ,对所述预旋转处理后的数据进行 N/4点的快速傅里叶变换; 后旋转单元 1004, 使用旋转因子 d · C对所述快速傅里叶变换后的数据 进行后旋转处理; 其中, 还包括:
固定补偿单元 1005, 用于利用固定旋转补偿因子进行固定旋转补偿处理; 所述 c、 d为常数, 所述 N为两倍的频域数据长度, 所述 = e N
一个实施例中, 固定旋转补偿单元用于进行至少一次固定旋转补偿, 该至 少一次固定旋转补偿的旋转补偿因子的乘积为 W。
另一个实施例中, 固定旋转补偿单元用于进行至少一次固定旋转补偿, 该 至少一次固定旋转补偿的旋转补偿因子为乘积为 W的至少一个因子的一阶 泰勒级数展开值。 与本文所揭示实施例关联描述的中例示性逻辑块、模块及电路均可由下列 装置构建或实施:通用处理器、 数字信号处理器 (DSP)、 专用集成电路 (ASIC)、 场可编程门阵列 (FPGA)或其它可编程逻辑装置、 离散门或晶体管逻辑、 离散 _ _ 硬件组件、或其设计用于实施上文所述功能的任何组合。通用处理器可为微处 理器, 但另一选择为, 处理器也可为任何常规处理器、 控制器、 微控制器或状 态机。 处理器也可构建为计算装置的组合, 例如, DSP与微处理器的组合、 多 个微处理器的组合、 一个或一个以上微处理器与 DSP核心的联合, 或任一其它 此类配置。 以上所述仅为本发明的几个实施例,本领域的技术人员依据申请文件公开
+

Claims

权 利 要 求
1、 一种数据处理方法, 其特征在于, 包括:
对输入数据进行重组, 得到重组后的数据;
使用一个对称的旋转因子对重组后的数据进行预旋转, 旋转因子为 a-^ , P = , ..., L/2 - l ^ a为常数;
对予贞旋转处理后的数据进行 2个点的'! "夬速傅里 ( Fast Fourier Transform, FFT ) 变换, L为输入数据的长度;
使用一个对称的旋转因子对 FFT 变换后的数据进行后旋转处理, 旋转因 子为 b 4r , ? = 0,···, 2_1 , b为常数;
获得输出数据。
2、 根据权利要求 1所述的方法, 其特征在于, 在获得输出数据之前还包 括: 利用固定旋转补偿因子进行固定旋转补偿的步骤。
3、 根据权利要求 2所述的方法, 其特征在于, 利用固定旋转补偿因子进 行固定旋转补偿的步骤包括:
进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 的乘积为 ^ϊ3
4、 根据权利要求 2所述的方法, 其特征在于, 利用固定旋转补偿因子进 行固定旋转补偿的步骤包括:
进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 为乘积为 的至少一个因子的一阶泰勒级数展开值。
5、根据权利要求 1所述的方法,其特征在于,所述 a和 b的乘积等于 I。
6、 一种时域到频域的信号处理方法, 其特征在于, 包括:
对时域数据进行预处理, 得到预处理后数据;
使用旋转因子 a ' ^ 对所述预处理后的数据进行预旋转处理;
对所述预旋转处理后的数据进行 N/4点的快速傅里叶变换;
使用旋转因子 b ' ^k+°'5对所述离散傅里叶变换后的数据进行后旋转处理, 获得频域数据;
其中,在获得频域数据之前还包括: 利用固定旋转补偿因子进行固定旋转 补偿的步骤; 所述 a、 b为常数, 所述 N为时域数据长度, 所述 = e
7、 根据权利要求 6所述的方法, 其特征在于, 利用固定旋转补偿因子进 行固定旋转补偿的步骤包括:
进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 的乘积为^ 。
8、 根据权利要求 6所述的方法, 其特征在于, 利用固定旋转补偿因子进 行固定旋转补偿的步骤包括:
进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 为乘积为 w 75的至少一个因子的一阶泰勒级数展开值。
2 9、根据权利要求 1所述的方法,其特征在于,所述 a和 b的乘积等于 。
10、 一种频域到时域的信号处理方法, 其特征在于, 包括:
对频域数据进行进行重组, 得到重组后的数据;
使用旋转因子 e ' ^k+°'5对所述重组后的数据进行预旋转处理;
对所述预旋转处理后的数据进行 N/4点的快速傅里叶变换;
使用旋转因子 d · W 。.5对所述快速傅里叶变换后的数据进行后旋转处理; 对所述后旋转处理后的数据进行后处理, 获得时域数据;
其中,在获得时域数据之前还包括: 利用固定旋转补偿因子进行固定旋转 补偿的步骤;所述 c、 d为常数,所述 N为两倍的频域数据长度,所述 = e ' Ν
11、 根据权利要求 10所述的方法, 其特征在于, 利用固定旋转补偿因子 进行固定旋转补偿的步骤包括:
进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 的乘积为^ 。
12、 根据权利要求 10所述的方法, 其特征在于, 利用固定旋转补偿因子 进行固定旋转补偿的步骤包括:
进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 为乘积为 W 75的至少一个因子的一阶泰勒级数展开值。
13、 一种信号处理装置, 其特征在于, 包括: 重组单元, 用于对输入数据进行重组, 得到重组后的数据;
预旋转单元, 用于使用一个对称的旋转因子对重组后的数据进行预旋转, 旋转因子为 a ^1 , Ρ = 0,· · ·,^/2 _1 , a为常数;
变换单元, 用于对预旋转处理后的数据进行 个点的快速傅里 (Fast Fourier Transform, FFT ) 变换, L为输入数据的长度;
后旋转单元, 用于使用一个对称的旋转因子对 FFT 变换后的数据进行后 旋转处理, 旋转因子为 b '^^ , ? = 0,…, /2 -1 , b为常数;
输出单元, 用于获得输出数据。
14、 根据权利要求 13所述的装置, 其特征在于, 还包括:
固定旋转补偿单元, 用于利用固定旋转补偿因子进行固定旋转补偿处理。
15、 根据权利要求 14所述的装置, 其特征在于, 所述固定旋转补偿单元 用于进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 的乘积为 ^ϊ3
16、 根据权利要求 14所述的装置, 其特征在于, 所述固定旋转补偿单元 用于进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 为乘积为 的至少一个因子的一阶泰勒级数展开值。
17、根据权利要求 14所述的装置,其特征在于,所述 a和 b的乘积等于 。
18、 一种时域到频域的信号处理装置, 其特征在于, 包括:
预处理单元, 用于对时域数据进行预处理, 得到预处理后的数据; 预旋转单元, 用于使用旋转因子 对所述预处理后的数据进行预旋 转处理;
变换单元, 用于对所述预旋转处理后的数据进行 N/4 点的快速傅里叶变 换;
后旋转单元 , 用于使用旋转因子 b ' 对所述离散傅里叶变换后的数据 进行后旋转处理, 获得频域数据; 其中, 还包括:
固定补偿单元, 用于利用固定旋转补偿因子进行固定旋转补偿处理; 所述 a、 b为常数, 所述 N为时域数据长度, 所述 = ej r
19、 根据权利要求 18所述的装置, 其特征在于, 所述固定旋转补偿单元 用于进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 的乘积为^ 。
20、 根据权利要求 18所述的装置, 其特征在于, 所述固定旋转补偿单元 用于进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 为乘积为 W 75的至少一个因子的一阶泰勒级数展开值。
21、 一种频域到时域的信号处理装置, 其特征在于, 包括:
重组单元, 用于对频域数据进行重组, 得到重组后的数据;
预旋转单元, 用于使用旋转因子 e ' ^k+°'5对所述重组后的数据进行预旋转 处理;
变换单元, 对所述预旋转处理后的数据进行 N/4点的快速傅里叶变换; 后旋转单元, 使用旋转因子 d · W对所述快速傅里叶变换后的数据进行 后旋转处理; 其中, 还包括:
固定补偿单元, 用于利用固定旋转补偿因子进行固定旋转补偿处理; 所述 c、 d为常数, 所述 N为两倍的频域数据长度, 所述 = e N
22、 根据权利要求 21所述的装置, 其特征在于, 所述固定旋转补偿单元 用于进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 的乘积为^ 。
23、 根据权利要求 21所述的装置, 其特征在于, 所述固定旋转补偿单元 用于进行至少一次固定旋转补偿,所述至少一次固定旋转补偿的旋转补偿因子 为乘积为 W 的至少一个因子的一阶泰勒级数展开值。
PCT/CN2011/085197 2011-01-10 2011-12-31 一种信号处理方法和装置 Ceased WO2012094952A1 (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
EP18203003.1A EP3518121B1 (en) 2011-01-10 2011-12-31 Signal processing method and device
KR1020137019665A KR101627900B1 (ko) 2011-01-10 2011-12-31 신호 처리 방법 및 디바이스
EP11855360.1A EP2664995A4 (en) 2011-01-10 2011-12-31 SIGNAL PROCESSING METHOD AND DEVICE
EP25165186.5A EP4550325A3 (en) 2011-01-10 2011-12-31 Signal processing method and device
JP2013547798A JP5783395B2 (ja) 2011-01-10 2011-12-31 信号処理方法およびデバイス
US13/938,834 US9519619B2 (en) 2011-01-10 2013-07-10 Data processing method and device for processing speech signal or audio signal
US15/345,074 US9792257B2 (en) 2011-01-10 2016-11-07 Audio signal processing method and encoder
US15/696,091 US9996503B2 (en) 2011-01-10 2017-09-05 Signal processing method and device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110004032.5A CN102592601B (zh) 2011-01-10 2011-01-10 一种信号处理方法和装置
CN201110004032.5 2011-01-10

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US13/938,834 Continuation US9519619B2 (en) 2011-01-10 2013-07-10 Data processing method and device for processing speech signal or audio signal

Publications (1)

Publication Number Publication Date
WO2012094952A1 true WO2012094952A1 (zh) 2012-07-19

Family

ID=46481138

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/085197 Ceased WO2012094952A1 (zh) 2011-01-10 2011-12-31 一种信号处理方法和装置

Country Status (8)

Country Link
US (3) US9519619B2 (zh)
EP (3) EP4550325A3 (zh)
JP (1) JP5783395B2 (zh)
KR (1) KR101627900B1 (zh)
CN (1) CN102592601B (zh)
ES (1) ES3026524T3 (zh)
PL (1) PL3518121T3 (zh)
WO (1) WO2012094952A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324465A (zh) * 2013-05-10 2013-09-25 刘保国 多变量、复杂控制系统的并行算法及结构
CN104392727A (zh) * 2014-11-12 2015-03-04 华为技术有限公司 音频信号处理方法和相关装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202043A (zh) * 2007-12-28 2008-06-18 清华大学 音频信号的编码方法和系统与解码方法和系统
CN101354700A (zh) * 2008-09-16 2009-01-28 四川虹微技术有限公司 一种蝶形运算fft处理器
CN101521649A (zh) * 2009-03-25 2009-09-02 吕正德 可配置变换长度dft的频域补偿方法及装置
CN101582264A (zh) * 2009-06-12 2009-11-18 瑞声声学科技(深圳)有限公司 语音增强的方法及语音增加的声音采集系统
WO2010028440A1 (en) * 2008-09-10 2010-03-18 Co-Operative Research Centre For Advanced Automotive Technology Ltd Method and device for computing matrices for discrete fourier transform (dft) coefficients
CN101930425A (zh) * 2009-06-24 2010-12-29 华为技术有限公司 信号处理方法、数据处理方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2242823A1 (en) * 1995-11-17 1997-05-29 Teracom Ab Improvements in or relating to real-time pipeline fast fourier transform processors
US5845241A (en) * 1996-09-04 1998-12-01 Hughes Electronics Corporation High-accuracy, low-distortion time-frequency analysis of signals using rotated-window spectrograms
JP2001296343A (ja) 2000-04-11 2001-10-26 Nec Corp 音源方位設定装置及びそれを備えた撮像装置、送信システム
US20050015420A1 (en) * 2003-07-18 2005-01-20 Gibb Sean G. Recoded radix-2 pipeline FFT processor
US7685220B2 (en) * 2005-12-14 2010-03-23 Telefonaktiebolaget L M Ericsson (Publ) Circular fast fourier transform
JP2010124324A (ja) * 2008-11-20 2010-06-03 Mitsubishi Electric Corp 受信装置
US8694570B2 (en) * 2009-01-28 2014-04-08 Arun Mohanlal Patel Method and apparatus for evaluation of multi-dimensional discrete fourier transforms

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202043A (zh) * 2007-12-28 2008-06-18 清华大学 音频信号的编码方法和系统与解码方法和系统
WO2010028440A1 (en) * 2008-09-10 2010-03-18 Co-Operative Research Centre For Advanced Automotive Technology Ltd Method and device for computing matrices for discrete fourier transform (dft) coefficients
CN101354700A (zh) * 2008-09-16 2009-01-28 四川虹微技术有限公司 一种蝶形运算fft处理器
CN101521649A (zh) * 2009-03-25 2009-09-02 吕正德 可配置变换长度dft的频域补偿方法及装置
CN101582264A (zh) * 2009-06-12 2009-11-18 瑞声声学科技(深圳)有限公司 语音增强的方法及语音增加的声音采集系统
CN101930425A (zh) * 2009-06-24 2010-12-29 华为技术有限公司 信号处理方法、数据处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2664995A4 *

Also Published As

Publication number Publication date
EP2664995A4 (en) 2015-01-21
EP2664995A1 (en) 2013-11-20
KR20130116904A (ko) 2013-10-24
US9792257B2 (en) 2017-10-17
EP3518121C0 (en) 2025-04-02
PL3518121T3 (pl) 2025-07-28
JP5783395B2 (ja) 2015-09-24
EP4550325A3 (en) 2025-07-30
US9996503B2 (en) 2018-06-12
US9519619B2 (en) 2016-12-13
US20170075860A1 (en) 2017-03-16
KR101627900B1 (ko) 2016-06-07
US20170364479A1 (en) 2017-12-21
US20130304784A1 (en) 2013-11-14
ES3026524T3 (en) 2025-06-11
EP3518121B1 (en) 2025-04-02
EP3518121A1 (en) 2019-07-31
EP4550325A2 (en) 2025-05-07
JP2014503093A (ja) 2014-02-06
CN102592601A (zh) 2012-07-18
CN102592601B (zh) 2014-09-17

Similar Documents

Publication Publication Date Title
US8554818B2 (en) Signal processing method and data processing method and apparatus
CN103971693B (zh) 高频带信号的预测方法、编/解码设备
US10388295B2 (en) Method for predicting bandwidth extension frequency band signal, and decoding device
CN100416553C (zh) 用于转换为变换表示或对变换表示进行反转换的设备和方法
US8907822B2 (en) Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
CN104995673B (zh) 帧错误隐藏
WO2012094952A1 (zh) 一种信号处理方法和装置
WO2015000373A1 (zh) 信号编码和解码方法以及设备
HK40125792A (zh) 一种信号处理方法和装置
HK40110896A (zh) 带宽扩展频带信号的预测方法、解码设备
Sato et al. Range-constrained phase reconstruction for recovering time-domain signal from quantized amplitude and phase spectrogram
HK1199540B (zh) 高频带信号的预测方法、编/解码设备

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11855360

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2013547798

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 20137019665

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2011855360

Country of ref document: EP