WO2003096545A1 - Procede et dispositif de codage, ainsi que procede et dispositif de decodage - Google Patents

Procede et dispositif de codage, ainsi que procede et dispositif de decodage Download PDF

Info

Publication number
WO2003096545A1
WO2003096545A1 PCT/JP2003/005546 JP0305546W WO03096545A1 WO 2003096545 A1 WO2003096545 A1 WO 2003096545A1 JP 0305546 W JP0305546 W JP 0305546W WO 03096545 A1 WO03096545 A1 WO 03096545A1
Authority
WO
WIPO (PCT)
Prior art keywords
code string
encoding
group
string table
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2003/005546
Other languages
English (en)
French (fr)
Inventor
Keisuke Touyama
Shiro Suzuki
Minoru Tsuji
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to US10/483,105 priority Critical patent/US6930618B2/en
Priority to EP20030725719 priority patent/EP1503502B1/en
Priority to KR20047000176A priority patent/KR100968057B1/ko
Publication of WO2003096545A1 publication Critical patent/WO2003096545A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation

Definitions

  • the present invention relates to an encoding method and an apparatus, a decoding method and an apparatus, and a program and a recording medium, and particularly to digital data such as an audio signal and an audio signal.
  • the present invention relates to a program to be executed by a computer and a computer-readable recording medium on which such a program is recorded.
  • the audio signal on the time axis is divided into a plurality of frequency bands and encoded without being blocked.
  • a signal on the time axis is converted into a signal on the frequency axis (spectral conversion) and divided into a plurality of frequency bands, that is, coefficients obtained by spectrum conversion are obtained. Encoding is performed for each band, collectively for each predetermined frequency band.
  • a method of high-efficiency coding that combines the non-blocking frequency band division method and the block frequency band division method described above.
  • a law has also been proposed. According to this method, for example, after band division is performed by band division coding, a signal of each band is spectrally transformed into a signal on a frequency axis, and a code is produced for each band after the spectrum transformation. Is performed.
  • QMF Quadrature Mirror Filter
  • PQF Polyphase Quadrature Filter
  • the input audio signal is broken down into frames of a predetermined unit time, and discrete Fourier transform (DFT), discrete cosine transform (Discrete Cosine Transformation) is performed for each block.
  • DFT discrete Fourier transform
  • Discrete Cosine Transformation discrete Cosine Transformation
  • M DCT Modified Discrete Cosine Transformation
  • MDCT The details of MDCT are described in CASSP 1987, Subband / Transform Coding Usage Filter Bank Designs Based on Time Domain Aliasing Cancellation, JPP incen, ABBradley, Univ. Of Surrey Royal Melbourne Inst, of Tech.j, etc. Has been described.
  • each frequency band when performing band division is determined in consideration of, for example, human auditory characteristics. That is, in general, for example, the critical band
  • An audio signal may be divided into multiple (eg, 32 bands) bands, called bandwidths that are wider at higher frequencies.
  • a predetermined bit allocation is performed for each band, or adaptive bit allocation (bit allocation) is performed for each band. That is, for example, when the coefficient data obtained by the MDCT processing is encoded by bit allocation, the MDCT coefficient data of each band obtained by performing the MDCT processing on the signal for each block is calculated as follows. The number of bits is adaptively allocated and coding is performed.
  • bit allocation method for example, a method of performing bit allocation based on the signal magnitude of each band (hereinafter, appropriately referred to as a first bit allocation method) or an auditory masking method is used.
  • a method of obtaining a required signal-to-noise ratio for each band and performing fixed bit allocation hereinafter, appropriately referred to as a second bit allocation method and the like are known.
  • the first bit allocation method is described in, for example, ⁇ Adaptive Transform Coding of Speech Signals, R. Zelinski and P. Nol, IEEE Transactions of Accou ties, Speech and Signal Processing, vol. 25, No., August 1977 ”and the like.
  • the quantization noise spectrum becomes flat and the noise energy is minimized.
  • the masking effect is not used for the auditory sense, the actual auditory noise is not optimal.
  • the characteristic value is not so large because the bit allocation is fixed. Not a good value.
  • DFT or DCT When DFT or DCT is used as a method of converting a waveform signal into a spectrum, if a conversion is performed using a time cycle consisting of M samples, M independent real number data can be obtained. However, in order to reduce the connection distortion between time blocks (frames), usually, one pro- gram is configured to overlap each of the neighboring pro- Waits by a predetermined number M1 of samples. In an encoding method using DCT, M real data is quantized and encoded for an average of (M-Ml) samples.
  • the decoding device adds the waveform elements obtained by performing the inverse transform in each pro and the sock while interfering with each other from the code obtained by using the MDCT as described above, thereby obtaining a waveform signal. Is reconstructed.
  • quantization accuracy information which is information indicating a quantization step when performing quantization
  • each signal component are normalized.
  • a normalization coefficient which is information representing the coefficient used in the above, is encoded with a predetermined number of bits, and then the normalized and quantized vector signal is encoded.
  • 1993 '' describes a high-efficiency coding method in which the number of bits representing quantization accuracy information is set differently depending on the band. According to this, standardization is performed such that the number of bits representing quantization accuracy information becomes smaller as the frequency band becomes higher.
  • a method of encoding a spectrum signal using a variable length code such as a Huffman code is known.
  • the Huffman code is described in, for example, r Davia A. Huffman, "A Method for the Construction of Minimum-Redundancy Codes", Proceedings of the I.RE, ppl098-1101, Sep. 1952. Details are provided.
  • the number of bits for coding the spectrum information is 16 bits (48 bits). (Toe 32 bits) will be reduced.
  • the compression ratio increases by 16 bits or more due to the increase in the number of code string tables, but if it does not increase, the overall compression ratio will decrease. .
  • the present invention has been proposed in view of such a conventional situation, and an optimal code string table according to the signal characteristics for various input signals is obtained without reducing the compression ratio.
  • a selectable encoding method and apparatus a decoding method and apparatus for receiving or reproducing and decoding encoded data
  • a recording medium capable of performing encoding or decoding processing on a computer. The purpose is to do.
  • the encoding method and apparatus when encoding a digital signal using one code string table for each predetermined unit, divide the digital signal into a plurality of groups in advance. One group is selected from the obtained code sequence table group according to the characteristics of the digital signal, and one code sequence table is determined from the code sequence table group of the selected group. The digital signal is encoded using a column table.
  • the group when selecting one code string table group, the group can be selected according to, for example, the tonality of the digital signal.
  • the encoding method and apparatus when encoding a digital signal using one code sequence table for each predetermined unit, select a code sequence included in a code sequence table group.
  • the number of possible code sequence tables is set, one of the code sequence tables is selected from the code sequence table group, and the digital signal is encoded using the selected code sequence table.
  • the decoding method and apparatus provide the following in order to achieve the above object.
  • one group to be used is selected from a code string table group previously divided into a plurality of groups, and the selected group is selected.
  • One code string table to be used is determined from among the code string tables, and the digital signal is decoded using the determined code string table.
  • the same group as the group selected in accordance with the tonality of the digital signal is selected at the time of encoding ( decoding method and decoding method according to the present invention).
  • the apparatus sets the number of code string tables included in the code string table group when decoding a digital signal encoded using one code string table for each predetermined unit in order to achieve the above-described object.
  • One of the above code string tables is selected from the code string table group, and the digitized signal is decoded based on the selected code string table.
  • a program according to the present invention causes the above-described encoding processing or decoding processing to be executed at a convenient time
  • a recording medium according to the present invention includes a computer-readable recording medium storing such a program. It is.
  • FIG. 1A and FIG. 1B are diagrams for explaining an example of the spectrum.
  • FIG. 1A shows a tonic signal
  • FIG. 1B shows a noise signal.
  • FIG. 2 is a diagram for describing an example of encoding a tone characteristic spectrum.
  • FIG. 3 is a diagram illustrating an example of encoding a noise spectrum.
  • FIG. 4 is a diagram for explaining a specific example of the number of coded bits of the index and the spectrum of the conventional code string table.
  • FIG. 5 is a diagram illustrating a specific example of the index of the code string table and the number of coded bits of the spectrum according to the present embodiment.
  • FIG. 6 is a diagram illustrating an example of the ratio of selection probabilities in each code string table.
  • FIG. 6 is a diagram illustrating a specific example of an index of a code string table and the number of coded bits of a spectrum in the present invention.
  • Fig. 8 shows a specific example of the index of the code table and the number of coded bits of the spectrum when Huffman coding is applied to the coding of the index of the code table, with the number of code tables being four.
  • FIG. 9 is a diagram illustrating a schematic configuration of the encoding device according to the present embodiment.
  • FIG. 10 is a diagram illustrating a schematic configuration of a decoding device according to the present embodiment.
  • BEST MODE FOR CARRYING OUT THE INVENTION an encoding method and apparatus for transmitting the present invention by encoding digital data such as an audio signal with high efficiency, or recording on a recording medium, and receiving encoded data;
  • the present invention is applied to a decoding method for reproducing and decoding and an apparatus thereof.
  • the principle of the present invention will be described, and then, a configuration example of an encoding device and a decoding device to which the present invention is applied will be described.
  • audio signals can be broadly divided into two patterns, tone and noise.
  • FIGS. 1A and 1B show the spectrum of the tone signal and the noise signal.
  • the frequency-converted signal that is, the spectrum shape is significantly different between the tone signal and the noise signal, the appearance probability of the value of the quantization coefficient is obtained.
  • the appearance probability of the value of the quantization coefficient is obtained.
  • Tables 1 and 2 below show examples of Huffman code string tables for tone signals and noise signals.
  • the range of the value of the quantization coefficient is 3 to +3
  • FIG. 2 shows a specific example in the case of encoding a tone signal spectrum using the code string tables shown in Tables 1 and 2.
  • the values of the quantization coefficients are 0, 0, 3, 1, 2, 0, 0, 0 in this order.
  • the code length is 1, 1, 4, 4, 1, 1, 1: 1 in order, and the total is 14 bits.
  • the code length is 2, 2, 3, 3, 2, 2, 2, 2, 2 in order, and the total is It becomes 18 bits. That is, the tone signal In the case of a spectrum, it is possible to encode with a smaller number of bits by, for example, 4 bits by using a code sequence table for a tone signal than using a code table for a noise signal. Becomes
  • FIG. 3 shows a specific example in which the noise signal spectrum is encoded using the code string tables shown in Tables 1 and 2.
  • the values of the quantized coefficients are 3, 3, 11, 12, --3, --2, 3, 2 in this order.
  • the code lengths are 4, 4, 3, 4, 4, 4, 4, 4, in that order, and the total is 31 bits.
  • the code sequence table for the noisy signal shown in Table 2 is used, the code length is 3, 3, 3, 3, 3, 3, 3, 3, 3, 3 in order, and the total is 24 bits.
  • the number of bits is reduced by, for example, 7 bits by using the code table for the noise signal as compared with the case of using the code table for the tone signal. It is possible to encode with.
  • the Huffman code sequence table for encoding the S-child coefficient is not used for any signal, but for the characteristics of the input signal, for example, whether it is tonal or noise.
  • a high compression ratio can be realized by preparing and using optimized ones depending on whether there is any.
  • tone property and the noise property are mixed minutely for each band. In most cases, tone and noise are interchanged.
  • both a group of the code sequence table for the tone signal and a group of the code sequence table for the noise signal are prepared, and they are switched according to the properties of the input signal.
  • the coding efficiency is improved. For example, consider the case where the number of quantization units is 16.
  • the code string table is not switched, if the number of code string tables is 8, the number of bits for coding the index of the code string table is 48 bits (3 ⁇ 16).
  • the number of bits to be switched is 1 bit, and the coding bit in the code table is The total number of bits is 48 bits, for a total of 49 bits. This is one bit more than when the code string table is not switched.
  • the code string table is divided into two sets, one for a tone signal and the other for a noise signal, as in the present embodiment, and a case where a conventional code string table is used. Compare the number of coded bits, etc., when using only one of them.
  • Fig. 4 shows the number of coded bits when a conventional code string table is used.
  • the index of the code table is selected from 8 (3 bits) from 0 to 7, and the number of bits of the spectrum encoded using the code table is calculated. It is shown.
  • each code string table is represented by 3 bits and the number of quantization units is 16, so that the total number of bits in the code string table is 48 bits. Also, the number of encoded bits in the spectrum is 663 bits. Therefore, the total number of these bits is 711 bits.
  • the code string table is divided into two sets, a group for a tone signal and a group for a noise signal, and coding bits when only one of them is selected and used.
  • Figure 5 shows the numbers. It is assumed that eight code string tables are prepared for each of the tone signal and the noise signal. Since the index of the code string table is represented by three bits from 0 to 7, the total is 48 bits, but one bit is used to switch the set of the code string table depending on tone and noise. Therefore, the number of coding bits in the code string table is 49 bits in total. Also, when encoding is performed using a code sequence table for a tone signal, the number of coding bits of the spectrum is 640 bits, and coding is performed using a code sequence table for a noise signal.
  • the number of coding bits of the spectrum is 682 bits. Therefore, in the case of this example, the spectrum can be more efficiently compressed by using the code sequence table for the tone signal.
  • the total number of these bits is 689 bits, which is 22 bits less than the example in FIG. By redistributing these 22 bits to the spectrum, it is possible to further improve the sound quality.
  • the probability that each code string table is actually selected depends on how to learn the code string table, but is generally not uniformly distributed and often has some bias. Therefore, by using variable length coding adapted to the bias, it is possible to efficiently code the index of the code string table.
  • Fig. 6 shows an example of the selection probabilities of each code string table. As is evident from FIG. 6, the selection probabilities of each symbol 3 ⁇ 4; -column table are biased. Table 3 below shows the variable-length codes created to optimize the index coding efficiency from this bias. Note that the code string table shown in Table 3 is optimized for a tone signal. Table 3
  • FIG. 7 shows an example in which the variable length codes in Table 3 are applied to the specific example in FIG.
  • the number of bits in the code string table index is 40 bits by applying the variable length code to the code string table index, which is 8 bits compared to the case of FIG. I need less. By redistributing these 8 bits to spectrum coding, it is possible to further improve sound quality.
  • the encoding speed is increased by reducing the number of code string tables actually used for encoding. Can be manifested. It is to be noted that, instead of simply reducing the number of code string tables, using only a code string table having a high selection probability makes it possible to suppress a decrease in coding efficiency.
  • Such a setting may be performed by a user of the encoder, or may be performed on the encoder side by determining a state of an encoding resource or a processing speed.
  • the number of code table is four
  • the number of coding bits for coding the index of the code table is smaller than that in the case of eight.
  • Table 4 below shows an example of the Huffman code string table for the code string table index when the number of code string tables is four.
  • FIG. 8 shows an example in which the variable length codes in Table 4 are applied to the specific example in FIG. Since the number of code string tables becomes four, the quantization units 3, 5, 6, and 8 cannot select a code string table that encodes a spectrum with the least number of bits. The number of coded bits has increased slightly. However, as described above, four code string tables are used in the descending order of selection probability, and the four code tables cover about 80% of the pattern in the graph of FIG. It occurs only in about 20% of the cases.
  • the number of code strings in the code table itself is decreasing, it can be expected that the number of bits for coding the index of the code string table can be reduced.
  • the number of coding bits of the code string table index is 30 bits, which is 10 bits smaller than that of FIG. Note that, in the above specific example, when the number of code string tables used for encoding is changed from eight to four, for example, it is described that four are selected in descending order of selection probability, but the present invention is not limited to this. Instead, which code string table to select may be set in advance on the encoding side and the decoding side.
  • encoding apparatus 10 includes a spectrum conversion unit 11, a code sequence 3 ⁇ 4 group switching determination unit 12, a normalization unit 13, and B: It is composed of a decision unit 14, a quantization unit 15, a code string table index encoding unit 16, a code string table number switching determination unit 1 ⁇ , and a multiplexer 18.
  • the spectrum converter 11 receives an audio signal D 10 to be encoded, and performs spectrum conversion such as MDCT (Modified Discrete Cosine Transformation) on the audio signal D 10.
  • the signal on the time axis is converted into the spectrum signal D11 on the frequency axis.
  • the spectrum conversion section 11 converts the vector signal D 11 into a code string table group switching determination section 12, a normalization section 13, and a quantization precision determination for each predetermined time block (frame).
  • the code string table group switching determination unit 12 is configured to select one group from a plurality of code string table groups according to the property of the vector signal D 11 supplied from the spectrum conversion unit 11, for example, the tonality. And a group index D 12 indicating the group is supplied to the quantization unit 15 and the multiplexer 18.
  • the code string table group switching determination unit 12 checks the tonality of the spectrum signal D 11 and determines the tonality. If is larger than a predetermined threshold value, the code string table for toned signals is selected, and if smaller than the threshold value, the code string table for noise signals is selected. Then, the code string table group switching determination unit 12 supplies the group index D12 indicating the selected group to the quantization unit 15 and the multiplexer 18 as, for example, 1-bit information for each channel. It should be noted that the tone property / noise property may be determined independently for each of the divided frequency bands, and 1-bit information may be transmitted as the group index D 12 for each band.
  • the normalizing unit 13 calculates the absolute value of each signal component constituting the spectrum signal D 11 The dogs are extracted and the coefficient corresponding to this value is used as the normalization coefficient. Then, the normalizing unit 13 normalizes (divides) each signal component constituting the spectrum signal D 11 by a value corresponding to the normalization coefficient. Therefore, in this case, the normalized data D 13 obtained by normalization has a value in the range of 1.0 to 1.0.
  • the normalization unit 13 supplies the normalized data D 13 to the quantization unit 15 and supplies the normalization coefficient D 14 to the multiplexer 18. Note that the normalization unit 13 may perform predetermined encoding on the normalization coefficient D 14 as necessary, and then supply the result to the multiplexer 18.
  • the quantization accuracy determination unit 14 performs quantization when the normalized data D 13 is quantized based on the spectrum signal D 11 supplied from the spectrum conversion unit 11. Determine the steps. Then, the quantization accuracy determination unit 14 supplies the quantization accuracy information D15 corresponding to the quantization step to the quantization unit 15 and the multiplexer 18. Note that the quantization accuracy determination unit 14 may perform predetermined encoding on the quantization accuracy information D15 as necessary, and then supply the resultant to the multiplexer 18.
  • the quantization unit 15 quantizes the normalized data D 13 in a quantization step corresponding to the quantization accuracy information D 15 supplied from the quantization accuracy determination unit 14. Then, based on the group index D 12 supplied from the code sequence table group switching determination unit 12, the quantization unit 15 encodes the M child coefficients using the code sequence table of the selected group. I do. Specifically, coding is actually performed using the code string table included in the selected group, and the code string table with the smallest number of required bits is determined as the code string table to be used for coding. The quantization unit 15 supplies the determined code sequence table index D 16 to the code sequence table index encoding unit 16, and supplies the encoded coefficient data D 17 to the multiplexer 18.
  • the code sequence table index encoding unit 16 encodes the code sequence table index D 16 supplied from the quantization unit 15 and supplies the encoded code sequence table index D 18 to the multiplexer 18.
  • the code string table index encoding unit 16 generates the code of the code string table index.
  • the decoding bit number information Dl9 is supplied to the quantization unit 15. As a result, the quantization unit 15 can redistribute the number of bits obtained by the index coding to the spectrum.
  • the code string table number switch determination unit 17 switches the number of code string tables to be used among the code string tables included in the code string table group, and sets the code string table number index D 21 for each frame or bit stream.
  • the information is supplied to the quantizer 15, the code string table index encoder 16 and the multiplexer 18 as 1-bit information. That is, as described above, when the resources to be applied to the encoder are small and the sound quality has to be somewhat sacrificed in order to realize a practical encoding speed, etc., the code sequence table actually used for encoding is used. By reducing the number, it is possible to increase the encoding speed.
  • the switching operation of the code string table to be used may be performed based on a predetermined setting signal D 20 supplied from the outside according to the judgment of the user or the device itself, or another method may be used. .
  • the code string table number switch determination unit 17 converts the 1-bit code string table number index D 21 into the quantization unit 15, It is supplied to the code string table index coding unit 16 and the multiplexer 18.
  • the quantization unit 15 actually performs encoding using four predetermined code sequence tables out of the eight code sequence tables, and uses the code sequence table with the smallest number of required bits for encoding. Determined as a column table.
  • the quantization unit 15 supplies the determined code string table index D 16 to the code string table index coding unit 16.
  • the code sequence table index coding unit 16 reassigns the index of the code sequence table of the predetermined four code sequence tables, and corresponds to the code sequence table index D 16 supplied from the quantization unit 15. Encode a new index.
  • the multiplexer 18 converts the coefficient data D 17 supplied from the quantization unit 15 into a group index D 12, a normalization coefficient D 14, quantization accuracy information D 15, and a code string table index D. 18 and multiplexed with the code string table index D 21.
  • the multiplexer 18 transmits the encoded data D22 obtained as a result of the multiplexing via a transmission path, or records the encoded data D22 on a recording medium (not shown).
  • the code string table group switching determination unit 12 uses the spectrum signal D 11 The tonality of 1 was examined, and it was explained that one of the code sequence table for the tone signal and the code sequence for the noise signal was selected.However, the present invention is not limited to this. It is also possible to calculate the required number of bits by actually performing encoding in the column table and select the group with the smaller number of bits.
  • the decoding device 30 in the present embodiment includes a demultiplexer 31, a code string table index decoding unit 32, an inverse quantization unit 33, an inverse normalization unit 34, It is composed of a spectrum inverse transform unit 35.
  • the demultiplexer 31 decodes the input coded data D 30, and decodes the coefficient data D 31, the S child accuracy information D 32, the normalization coefficient D 33, the group index D 34, and the code string table index.
  • D 3 5 and c and the demultiplexer 3 1 separates the code sequence table number Indedzukusu D 3 6, as well as supplies the coefficient data D 3 1 Conversely g Coca 3 3, quantization accuracy information D 3 2 and normalization
  • the coefficient D33 is decoded as necessary and supplied to the inverse quantization unit 33 and the inverse normalization unit 34, respectively.
  • the demultiplexer 31 supplies the group index D34 and the code string table index D35 to the inverse quantization unit 33 and the code string table index decoding unit 32, respectively.
  • the demultiplexer 31 supplies the code sequence table index D36 to the code sequence table index decoding unit 32 and the inverse quantization unit 33.
  • the code sequence table index decoding unit 32 decodes the code sequence table index D 35 based on the code sequence table index D 36, and supplies the decoded index D 37 to the inverse quantization unit 33.
  • the inverse quantization unit 33 determines a code sequence table to be used based on the group index D 34, the code sequence table number index D 36 and the index D 37 supplied from the code sequence table index decoding unit 32, and Decode the coefficient data D 31 in the column table. Then, the inverse quantization unit 33 inversely quantizes the obtained quantization coefficient in a quantization step corresponding to the quantization accuracy information D 32 supplied from the demultiplexer 31, and outputs the normalized data D 3 Generate 8.
  • the inverse quantization unit 33 supplies the normalized data D 38 to the inverse normalization unit 34.
  • the denormalization unit 34 multiplies the normalized data D 38 by multiplying the normalized data D 38 by the value corresponding to the normalization coefficient D 33 supplied from the demultiplexer 31.
  • the decoded and obtained spectrum signal D39 is supplied to the spectrum inverse conversion unit 35.
  • the spectrum inverse transform section 35 is 1] ⁇ with respect to the spectrum signal D39 supplied from the inverse normalization section 34. .
  • Ding Inverse Modified Di screte Cos ine Transformation
  • Gyakusupeku torr transform such as, thereby, as described above c to restore the original audio signal D 4 0, the coding apparatus 1 0 of the present embodiment Selects one group from a plurality of code string table groups according to the nature of the spectrum signal D11, for example, tonality, and encodes the quantization coefficient using the code string table included in the group .
  • the encoding apparatus 10 has a small number of resources to be applied to the encoder, and when it is necessary to sacrifice some sound quality in order to realize a practical encoding speed, for example, the encoding apparatus 10 uses a code sequence table that is actually used for encoding. By reducing the number, the speed of the encoding speed can be increased.
  • decoding apparatus 30 in the present embodiment performs encoding based on group index D 34, code sequence table index D 35, and code sequence table number index D 36 included in encoded data D 30. By selecting the code string table corresponding to the side, the coefficient data D 31 can be decoded.
  • the hardware configuration has been described.
  • the present invention is not limited to this. Any processing may be implemented by causing a CPU (Central Processing Unit) to execute a computer program.
  • the program may be recorded on a recording medium and provided, or may be provided by being transmitted via the Internet or other transmission media.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

明細書 符号化方法及び装置、 並びに復号方法及び装置 技術分野 本発明は、 符号化方法及び装置、 復号方法及び装置、 並びにプログラム及び記 録媒体に関し、 特に、 音響信号や音声信号等のディジタルデータを高能率符号化 して伝送し、 又は記録媒体に記録する符号化方法及びその装置、 符号化データを 受信し、 又は再生して復号する復号方法及びその装置、 並びに符号化処理又は復 号処理をコンピュータに実行させるプログラム及びそのようなプログラムが記録 されたコンピュータ読み取り可能な記録媒体に関する。
本出願は、 日本国において 2 0 0 2年 5月 7日に出願された日本特許出願番号 2 0 0 2 - 1 3 2 1 8 9を基礎として優先権を主張するものであり、 この出願は 参照することにより、 本出願に援用される。 景技術 従来より、 音声等のオーディオ信号を高能率符号化する手法としては、 例えば 帯域分割符号化 (サブバンドコーディング) 等に代表される非ブロック化周波数 帯域分割方式や、 変換符号化等に代表されるプロック化周波数帯域分割方式など が知られている。
非ブロック化周波数帯域分割方式では、 時間軸上のオーディオ信号を、 ブロッ ク化せずに複数の周波数帯域に分割して符号化を行う。 また、 ブロック化周波数 帯域分割方式では、 時間軸上の信号を周波数軸上の信号に変換 (スペク トル変 換) して複数の周波数帯域に分割して、 すなわち、 スペクトル変換して得られる 係数を所定の周波数帯域毎にまとめて、 各帯域毎に符号化を行う。
また、 符号化効率をより向上させる手法として、 上述の非ブロック化周波数帯 域分割方式とプロック化周波数帯域分割方式とを組み合わせた高能率符号化の手 法も提案されている。 この手法によれば、 例えば、 帯域分割符号化で帯域分割を 行った後、 各帯域毎の信号を周波数軸上の信号にスペク トル変換し、 このスぺク トル変換された各帯域毎に符号化が行われる。
ここで、 周波数帯域分割を行う際には、 処理が簡単であり、 且つ、 折り返し歪 みが消去されることから、 例えば、 QMF (Quadrature Mirror Filter) が用い られることが多い。 なお、 QMFによる周波数帯域分割の詳細については、 「19 76R.E.Crochiere, Digital coding of speech in suboands, Bell Syst. Tech. J. Vol.55, No.8 1976」 等に記載されている。
また、 帯域分割を行う手法としてこの他に、 例えば、 等バンド幅のフィル夕分 割手法である PQF (Polyphase Quadrature Filter) 等がある。 この P Q Fの詳 細については、 CASSP 83 BOSTON, Polyphase Quadrature filters - A new s ubband coding technique, Joseph H. Rothweilerj 等 ίこ言 3載されて 、る。
一方、 上述したスペク トル変換としては、 例えば、 入力オーディオ信号を所定 単位時間のフレームでプロヅク化し、 ブロック毎に離散フ一リエ変換 (Discrete Fourier Transf ormation:DFT) 、 離散コサイン変換 (Discrete Cosine Transfo rmation:DCT) 、 改良 D C T変換 (Modified Discrete Cosine Transformation:M DCT) 等を行うことで時間軸信号を周波数軸信号に変換するものがある。
なお、 MDCTについては、 CASSP 1987, Subband/Transform Coding Usin g Filter Bank Designs Based on Time Domain Aliasing Cancellation, J.P.Pr incen, A.B.Bradley, Univ. of Surrey Royal Melbourne Inst, of Tech.j 等に、 その詳細が記載されている。
このようにフィル夕やスぺク トル変換によって得られる帯域毎の信号を量子化 することにより、 量子化雑音が発生する帯域を制御することができ、 これにより マスキング効果等の性質を利用して聴覚的により高能率な符号化を行うことがで きる。 また、 量子化を行う前に各帯域毎の信号成分を、 例えばその帯域における 信号成分の絶対値の最大値で正規化するようにすれば、 さらに高能率な符号化を 行うことができる。
帯域分割を行う際の各周波数帯域の幅は、 例えば、 人間の聴覚特性を考慮して 決定される。 すなわち一般的には、 例えば、 臨界帯域 (クリティカルバンド) と 呼ばれている、 高域ほど幅が広くなるような帯域幅で、 オーディオ信号を複数 (例えば 3 2バンドなど) の帯域に分割することがある。
また、 各帯域毎のデータを符号化する際には、 各帯域毎に所定のビッ ト配分、 或いは各帯域毎に適応的なビヅ ト割当 (ビッ トアロケーション) が行われる。 す なわち、 例えば、 M D C T処理されて得られた係数デ一夕をビッ トァロケーショ ンによって符号化する際には、 プロヅク毎の信号を M D C T処理して得られる各 帯域の M D C T係数データに対して、 適応的にビヅト数が割り当てられて符号化 が行われる。
ビッ ト割当手法としては、 例えば、 各帯域毎の信号の大きさに基づいてビッ ト 割当を行う手法 (以下、 適宜第 1のビッ ト割当手法という。 ) や、 聴覚マスキン グを利用することで各帯域毎に必要な信号対雑音比を得て固定的なビッ ト割当を 行う手法 (以下、 適宜第 2のビッ ト割当手法という。 ) 等が知られている。
なお、 第 1のビッ ト割当手法については、 例えば、 「Adaptive Transform Cod ing of Speech Signals, R. Ze l inski and P .Nol l , IEEE Transactions of Accou sti es, Speech and Signal Processing, vol . ASSP-25 , No . , August 1977」 等に その詳細が記載されている。
また、 第 2のビヅ ト割当手法については、 例えば、 「ICASSP 1980, The cr iti cal band coder digital encoding of the perceptual requirements of the au ditory system, M.A.Kransner MIT」 等にその詳細が記載されている。
第 1のビッ ト割当手法によれば、 量子化雑音スペク トルが平坦となり、 雑音ェ ネルギが最小となる。 しかしながら、 聴感覚的にはマスキング効果が利用されて いないために、 実際の聴感上の雑音感は最適にはならない。 また、 第 2のビッ ト 割当手法では、 ある周波数にエネルギが集中する場合、 例えば、 サイン波等を入 力した場合であっても、 ビッ ト割当が固定的であるために、 特性値がそれほど良 い値とはならない。
そこで、 ビッ ト割当に使用できる全ビヅ トを、 各小ブロック毎に予め定められ た固定ビッ ト割当パ夕一ン分と、 各ブロックの信号の大きさに依存したビヅ ト配 分を行う分とに分割して使用し、 その分割比を入力信号に関係する信号に依存さ せる、 すなわち、 例えば、 その信号のスペク トルが滑らかなほど固定ビッ ト割当 パターン分への分割比率を大きくする高能率符号化装置が提案されている。
この方法によれば、 サイン波入力のように特定のスぺク トルにエネルギが集中 する場合には、 そのスぺク トルを含むプロヅクに多くのビヅ トが割り当てられ、 これにより全体の信号対雑音特性を飛躍的に改善することができる。 一般に、 急 峻なスぺク トル成分を持つ信号に対して人間の聴覚は極めて敏感であるため、 上 述のようにして信号対雑音特性を改善することは、 単に測定上の数値を向上させ るばかりでなく、 聴感上の音質を改善するのにも有効である。
ビッ ト割当の方法としては、 この他にも数多くの方法が提案されており、 さら に聴覚に関するモデルが精緻化され、 符号化装置の能力が向上すれば、 聴覚的な 観点からより高能率な符号化が可能となる。
波形信号をスぺク トルに変換する方法として D F Tや D C Tを使用した場合に は、 M個のサンプルからなる時間プロヅクで変換を行うと、 M個の独立な実数デ —夕が得られる。 しかしながら通常は、 時間ブロック (フ レーム) 間の接続歪み を軽減するために、 1つのプロヅクは両隣のプロヅクとそれそれ所定の数 M 1個 のサンプルずつオーバーラップさせて構成されるので、 D F Tや D C Tを利用し た符号化方法では、 平均して (M— M l ) 個のサンプルに対して M個の実数デー 夕を量子化して符号化することになる。
また、 時間軸上の信号をスぺク トルに変換する方法として M D C Tを使用した 場合には、 両隣のプロヅクと M個ずつオーバ一ラヅプさせた 2 M個のサンプルか ら、 独立な M個の実数データが得られる。 したがってこの場合には、 平均して M 個のサンプルに対して M個の実数データを量子化して符号化することになる。 こ の場合、 復号装置においては、 上述のようにして M D C Tを用いて得られる符号 から、 各プロ、ソクにおいて逆変換を施して得られる波形要素を互いに干渉させな がら加え合わせることにより、 波形信号が再構成される。
一般に、 変換のための時間ブロック (フレーム) を長くすることによって、 ス ぺク トルの周波数分解能が高まり、 特定のスぺク トル成分にエネルギが集中する。 したがって、 両隣のプロヅクと半分ずつオーバーラヅプさせて長いプロック長で 変換を行い、 しかも得られたスぺク トル信号の個数が元の時間サンプルの個数に 対して增加しない M D C Tを使用する場合、 D F T D C Tを使用した場合より も効率のよい符号化を行うことが可能となる。 また、 隣接するブロック同士に充 分長いオーバラップを持たせることによって、 波形信号のブロック間歪みを軽減 することもできる。
実際の符号列を構成するに際しては、 先ず正規化及び量子化が行われる帯域毎 に、 量子化を行うときの量子化ステップを表す情報である量子化精度情報と各信 号成分を正規化するのに用いた係数を表す情報である正規化係数とを所定のビッ ト数で符号化し、 次に正規化及び量子化されたスぺク トル信号を符号化する。 ここで、 例えば、 D0/IEC 11172-3 : 1993(E) , 1993」 には、 帯域によって量子 化精度情報を表すビッ ト数が異なるように設定された高能率符号化方式が記述さ れており、 これによれば、 高域の帯域ほど量子化精度情報を表すビッ ト数が小さ くなるように規格化されている。
また、 スペク トル信号を符号化するに際しては、 例えばハフマン符号等の可変 長符号を用いる方法が知られている。 なお、 このハフマン符号については、 例え は、 rDavia A. Huffman, "A Method for the Construction of Minimum - Redu ndancy Codes" , Proceedings of the I .R.E. , ppl098- 1101, Sep . 1952」 等にそ の詳細が記載されている。
ところで、 一般に、 単一のハフマン符号表を用いるよりも、 複数種類用意して 適切なものを切り替えて用いることにより、 様々な入力信号に対して最適化した 符号列表を使うことができるため、 スぺク トル信号の圧縮効率を上げることが可 能となる。
しかしながら、 どの符号列表を用いたかを示す符号列表インデックスを量子化 ュニッ ト毎に符号化する場合、 符号列表の数が増えることでィンデツクスの符号 化ビッ ト数も増えてしまうといった問題が生じる。
例えば、 量子化ュニッ ト数が 1 6の場合、 量子化ュニッ ト毎にインデックスを 符号化すると、 符号列表の数が 4個 ( 2ビヅ ト) の場合はインデックスの符号化 ビヅ ト数は 3 2ビッ ト (= 2 ビヅ ト X 1 6ユニッ ト) となるが、 符号列表の数が 8個 ( 3ビッ ト) になるとィンデヅクスの符号化ビヅ ト数は 4 8ビヅ ト (= 3ビ ヅ ト X 1 6ユニッ ト) に増えてしまう。 これにより、 トータルのビヅ ト数が固定 の場合には、 スペク トル情報を符号化するためのビッ ト数が 1 6 ビッ ト (4 8 ビ ヅ トー 3 2ビヅ ト) 減ってしまうこととなる。 ここで、 符号列表の数が增ぇるこ とにより圧縮率が 1 6ビッ ト分以上上がれば問題にはならないが、 上がらない場 合には、 却って全体の圧縮率を落としてしまう結果となる。
すなわち、 符号列表の数を增やすことによりスぺク トル情報自体の圧縮率は上 がるが、 符号列表のインデックスの符号化ビヅ ト数が増えるため、 全体の圧縮率 が上がるとは一概には言えない。 発明の開示 本発明は、 このような従来の実情に鑑みて提案されたものであり、 圧縮率を落 とすことなく、 様々な入力信号に対して信号の性質に応じた最適な符号列表を選 択可能とする符号化方法及びその装置、 符号化データを受信し、 又は再生して復 号する復号方法及びその装置、 並びに符号化処理又は復号処理をコンピュー夕に 取り可能な記録媒体を提供することを目的とする。
本発明に係る符号化方法及び装置は、 上述した目的を達成するために、 所定単 位毎に 1つの符号列表を用いてディジ夕ル信号を符号化する際に、 予め複数のグ ループに分けられた符号列表群から、 上記ディジタル信号の性質に応じて 1つの グループを選択し、 当該選択されたグループの上記符号列表群の中から 1つの符 号列表を決定し、 この決定された上記符号列表を用いて上記ディジタル信号を符 号化する。
ここで、 1つの符号列表グループを選択する際には、 例えばディジタル信号の トーナリティに応じてグループを選択することができる。
また、 本発明に係る符号化方法及び装置は、 上述した目的を達成するために、 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する際に、 符号列 表群に含まれる選択可能な符号列表の数を設定し、 上記符号列表群の中から 1つ の上記符号列表を選択し、 選択された符号列表を用いて上記ディジタル信号を符 号化する。
また、 本発明に係る復号方法及び装置は、 上述した目的を達成するために、 所 定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号する際に、 予め複数のグループに分けられた符号列表群から、 使用する 1つのグループを選 択し、 選択されたグループの符号列表の中から使用する 1つの符号列表を決定し、 この決定された符号列表を用いて上記ディジ夕ル信号を復号する。
ここで、 1つの符号列表グループを選択する際には、 符号化の際に上記ディジ 夕ル信号のトーナリティに応じて選択されたグループと同じグループを選択する ( また、 本発明に係る復号方法及び装置は、 上述した目的を達成するために、 所 定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号する際に、 符号列表群に含まれる符号列表の数を設定し、 上記符号列表群の中から 1つの上 記符号列表を選択し、 選択された上記符号列表に基づいて上記ディジ夕ル信号を 復号する。
また、 本発明に係るプログラムは、 上述した符号化処理又は復号処理をコンビ ユー夕に実行させるものであり、 本発明に係る記録媒体は、 そのようなプログラ ムが記録されたコンピュータ読み取り可能なものである。
本発明の更に他の目的、 本発明によって得られる具体的な利点は、 以下に説明 される実施例の説明から一層明らかにされるであろう。 図面の簡単な説明 図 1 A及び図 1 Bは、 スペク トルの一例を説明する図であり、 図 1 Aは、 ト一 ン性信号を示し、 図 1 Bは、 ノイズ性信号を示す。
図 2は、 トーン性スぺク トルの符号化例を説明する図である。
図 3は、 ノイズ性スぺク トルの符号化例を説明する図である。
図 4は、 従来の符号列表のィンデックス及びスぺク トルの符号化ビッ ト数の具 体例を説明する図である。
図 5は、 本実施の形態における符号列表のインデックス及びスぺク トルの符号 化ビ ト数の具体例を説明する図である。
図 6は、 各符号列表の選択確率の割合の一例を説明する図である。
図 7は、 符号列表のィンデックスの符号化にハフマン符号化を適用した場合に おける符号列表のインデックス及びスぺク トルの符号化ビッ ト数の具体例を説明 する図である。
図 8は、 符号列表の数を 4個とし、 符号列表のインデックスの符号化にハフマ ン符号化を適用した場合における、 符号列表のインデックス及びスぺク トルの符 号化ビッ ト数の具体例を説明する図である。
図 9は、 本実施の形態における符^化装置の概略構成を説明する図である。 図 1 0は、 本実施の形態における復号装置の概略構成を説明する図である。 発明を実施するための最良の形態 以下、 本発明を適用した具体的な実施の形態について、 図面を参照しながら詳 細に説明する。 この実施の形態は、 本発明を、 オーディオ信号等のディジタルデ —夕を高能率符号化して伝送し、 又は記録媒体に記録する符号化方法及びその装 置、 並びに符号化データを受信し、 又は再生して復号する復号方法及びその装置 に適用したものである。 以下では、 先ず本発明の原理を説明し、 その後この発明 が適用される符号化装置及び復号装置の構成例について説明する。
一般に音響信号 (オーディオ信号) は、 大きく トーン性/ノイズ性の 2パター ンの信号に分けることができる。 トーン性の信号及びノイズ性の信号のスぺク ト ルを図 1 A、 図 I Bに示す。 この図 1 A、 図 1 Bからも分かるように、 トーン性 の信号とノイズ性の信号とでは、 周波数変換した信号、 すなわちスペク トルの形 状が大きく異なるため、 量子化係数の値の出現確率も大きく異なる。
例えば、 トーン性の信号の場合は、 量子化係数 (量子化後のスペク トル係数) の値が 0になる確率が高いため、 0に対応する符号に対して 1 ビッ ト等の短い符 号長のハフマン符号を割り当てることにより、 高い圧縮率を実現することができ る。 一方、 ノイズ性の信号の場合は、 量子化スペク トルのどの値も同程度の確率 で発生するため、 どの値に対しても同程度の符号長のハフマン符号を割り当てる ことが好ましい。
トーン性信号用及びノィズ性信号用のハフマン符号列表の一例をそれそれ以下 の表 1及び表 2に示す。 なお、 以下の説明において量子化係数の値の範囲は、 一 3〜 +3であるとする
表 1
表 2
Figure imgf000011_0001
この表 1、 表 2に示す符号列表を用いてトーン性信号スぺクトルを符号化する 場合の具体例を図 2に示す。 図 2に示すように、 量子化係数の値が順に 0 , 0 , 3, 一 2, 0, 0, 0, 0であるため、 これを表 1に示したトーン性信号用の符 号列表を用いて符号化すると、 その符号長は、 順に 1 , 1, 4 , 4, 1 , 1 , 1 : 1となり、 その合計は 14ビットとなる。 これに対して、 表 2に示したノィズ性 信号用の符号列表を用いて符号化すると、 その符号長は、 順に 2, 2 , 3, 3, 2 , 2 , 2, 2となり、 その合計は 1 8ビットとなる。 すなわち、 トーン性信号 スペク トルの場合には、 トーン性信号用の符号列表を用いることにより、 ノイズ 性信号用の符号列表を用いた場合と比較して例えば 4ビッ ト少ないビッ ト数で符 号化することが可能となる。
同様に、 表 1、 表 2に示す符号列表を用いてノイズ性信号スペク トルを符号化 する場合の具体例を図 3に示す。 図 3に示すように、 量子化係数の値が順に 3, 3, 一1, 2 , — 3 , — 2, 3, 2であるため、 これを表 1に示したトーン性信 号用の符号列表を用いて符号化すると、 その符号長は順に 4 , 4, 3 , 4 , 4, 4 , 4, 4となり、 その合計は 3 1 ビヅ トとなる。 これに対して、 表 2に示した ノイズ性信号用の符号列表を用いると、 その符号長は順に 3, 3, 3 , 3 , 3 , 3 , 3 , 3となり、 その合計は 2 4ビッ トとなる。 すなわち、 ノイズ性信号スぺ ク トルの場合には、 ノイズ性信号用の符号列表を用いることにより、 トーン性信 号用の符号列表を用いた場合と比較して例えば 7ビッ ト少ないビッ ト数で符号化 することが可能となる。
このように、 S子化係数を符号化するためのハフマン符号列表も、 どのような 信号に対しても共通のものを使うのではなく、 入力信号の性質、 例えばトーン性 であるかノィズ性であるかに応じて、 それそれ最適化したものを用意して使用す ることにより、 高い圧縮率を実現することができる。
ここで、 一般的な音響信号では、 帯域毎にトーン性とノイズ性とが細かく入り 混じることは少なく、 全帯域の信号が揃ってトーン性又はノイズ性となる場合や、 低域と高域とで トーン性とノィズ性とが入れ換わる場合が殆どである。
そこで本実施の形態では、 以下に説明するように、 トーン性信号用符号列表の グループとノィズ性信号用符号列表のグループとを両方用意しておき、 入力信号 の性質に応じてそれらを切り替えて用いることにより、 符号化効率を向上させる。 例えば量子化ュニッ ト数が 1 6個の場合を考える。 従来法では、 符号列表を切 り替えないため、 符号列表の数が 8個であれば符号列表のィンデックスを符号化 するビヅ ト数は 4 8 ビヅ ト (3 x 1 6 ) となる。 これに対して、 トーン性/ノィ ズ性の符号列表をそれそれ 8個ずつ用意しておき、 それを全帯域で切り替える場 合は、 切替ビッ ト数が 1 ビッ ト、 符号列表の符号化ビッ ト数が 4 8ビッ トの合計 4 9ビッ トとなる。 これは、 符号列表を切り替えない場合と比較して 1 ビヅ ト増 えるものの、 実質的に符号列表の数が 2倍になったのと等しいため、 スペク トル 情報の圧縮率が向上し、 これにより全体の圧縮率が向上することが期待できる。 具体的に、 図 4及び図 5を用いて、 従来の符号列表を用いる場合と、 本実施の 形態のように符号列表をトーン性信号用とノィズ性信号用との 2組に分け、 その 何れか一方のみを選択して用いる場合との符号化ビッ ト数等を比較する。
先ず、 従来の符号列表を用いる場合の符号化ビッ ト数等を図 4に示す。 この例 では、 各量子化ュニヅ トに対して符 列表のィンデヅクスが 0〜 7の 8個 ( 3ビ ッ ト) から選択され、 その符号列表を用いて符号化されたスペク トルのビッ ト数 が示されている。 ここで、 各符号列表は 3 ビッ トで表現され、 量子化ユニッ ト数 は 1 6個であるため、 符号列表のビヅ ト数の合計は 4 8ビッ トとなる。 また、 ス ぺク トルの符号化ビヅ ト数は 6 6 3 ビヅ トとなる。 したがって、 これらのビッ ト 数の合計は、 7 1 1 ビッ トとなる。
次に、 本実施の形態のように、 符号列表をトーン性信号用のグループとノイズ 性信号用のグループとの 2組に分け、 その何れか一方のみを選択して用いる場合 の符号化ビッ ト数等を図 5に示す。 なお、 符号列表は、 トーン性信号用とノイズ 性信号用とで 8個ずつ用意されるものとする。 符号列表のィンデヅクスは 0〜 7 の 3 ビヅ トで表現されるため、 その合計は 4 8 ビヅ トとなるが、 トーン性とノィ ズ性とで符号列表の組を切り替えるビッ トが 1 ビッ ト必要であるため、 符号列表 の符号化ビッ ト数は、 それらを合わせて 4 9 ビヅ トとなる。 また、 トーン性信号 用の符号列表を用いて符号化する場合のスぺク トルの符号化ビッ ト数は 6 4 0ビ ッ トであり、 ノイズ性信号用の符号列表を用いて符号化する場合のスぺク トルの 符号化ビヅ ト数は 6 8 2ビッ トである。 したがって、 この例の場合には、 トーン 性信号用符号列表を用いる方が効率よくスぺク トルが圧縮できることになる。 ト —ン性信号用符号列表を用いる場合には、 これらのビッ ト数の合計は 6 8 9 ビッ トとなり、 図 4の例と比較して 2 2ビッ ト少なくなつていることが分かる。 この 2 2ビッ トをスぺク トルに対して再配分することにより、 さらなる音質向上を図 ることが可能となる。
なお、 図 4の場合と比較して図 5ではスぺク トルビヅ ト数が小さくなつている が、 これは符号列表の数が多いことにより様々な信号に対応することができるよ うになるため、 スぺク トルの圧縮効率が向上したことによる。
ところで、 各符号列表が実際に選択される確率は、 符号列表の学習の仕方にも 依存するが、 一般的に一様には分布せず、 何らかの偏りがある場合が多い。 そこ で、 その偏りに適応した可変長符号化を用いることにより、 符号列表のインデッ クスをも効率的に符号化することが可能となる。
各符号列表の選択確率の一例を図 6に示す。 この図 6からも明らかなように、 各符 ¾;-列表の選択確率には偏りがある。 この偏りからィ ンデヅクスの符号化効率 が最適になるように作成した可変長符号を以下の表 3に示す。 なお、 この表 3に 示す符号列表は、 トーン性信号用に最適化されたものである。 表 3
Figure imgf000014_0001
図 5の具体例に対して表 3の可変長符号を適用した例を図 7に示す。 図 7から 分かるように、 符号列表のインデックスに対して可変長符号を適用することによ り、 符号列表ィンデヅクスのビッ ト数が 4 0ビッ トとなり、 図 5の場合と比較し て 8ビッ ト少なくてすむ。 この 8ビッ トをスぺク トルの符号化に再配分すること により、 さらなる音質向上の実現が可能となる。
また、 例えばハードウェア機器等の場合、 エンコーダにかけるリソースが少な いため、 実用的なエンコードスピードを実現するために、 多少音質を犠牲にせざ るを得ない場合がある。 このような場合、 以下に説明するように、 実際に符号化 に用いる符号列表の数を少なくすることによりエンコードスピードの高速化を実 現することができる。 なお、 単純に符号列表の数を少なくするのではなく、 選択 確率の高い符号列表だけを用いることにより、 符号化効率の低下を少なく抑える ことが可能となる。 このような設定は、 エンコーダの使用者が行ってもよく、 ま た、 エンコーダ側でエンコード用のリソースや処理スピ一ドなどの状態を判断し て行ってもよい。
具体的に、 符号列表を 4個だけ使う場合を考える。 図 6のような選択確率の場 合、 上位 4個の符号列表で全体の約 8割を占めるため、 8割のスペク トルは、 そ の圧縮効率を落とさずに符号化することが可能となる。
また、 符号列表の数が 4個になるため、 符号列表のインデックスを符号化する 符号化ビッ ト数も 8個の場合と比較して少なくてすむ。 符号列表の数が 4個の場 合における符号列表インデックス用ハフマン符号列表の一例を以下の表 4に示す 表 4
Figure imgf000015_0001
図 7の具体例に対して表 4の可変長符号を適用した例を図 8に示す。 符号列表 が 4個になることにより、 量子化ュニヅ ト 3, 5 , 6 , 8では、 最も少ないビヅ ト数でスぺク トルを符号化する符号列表を選択できなくなるため、 スぺク トルの 符号化ビッ ト数が若干増加している。 しかし、 上述したように、 選択確率の高い 順に 4個の符号列表を用いており、 その 4個は図 6のグラフより約 8割のパター ンをカバーするものであるため、 このような事態は約 2割の場合でしか発生しな い。
また、 符号列表の数自体が少なくなつているため、 符号列表のインデックスを 符号化するビッ ト数も少なくできることが期待できる。 図 8の例においても、 符 号列表ィンデヅクスの符号化ビヅ ト数は 3 0 ビヅ トと、 図 7の場合と比較して 1 0ビッ ト少なくなつている。 なお、 上述の具体例では、 符号化に用いる符号列表の数を例えば 8個から 4個 にする場合、 選択確率の高いものから順に 4個選択するものとして説明したが、 これに限定されるものではなく、 どの符号列表を選択するかを符号化側と復号側 とで予め設定しておくようにしても構わない。
以下、 本発明が適用される符号化装置及び復号装置の構成例について説明する。 図 9に示すように、 本実施の形態における符号化装置 1 0は、 スペク トル変換部 1 1 と、 符号列 ¾グループ切替判定部 1 2 と、 正規化部 1 3と、 B:子化精度決定 部 1 4と、 量子化部 1 5と、 符号列表インデックス符号化部 1 6 と、 符号列表数 切替判定部 1 Ί と、 マルチプレクサ 1 8とにより構成されている。
スぺク トル変換部 1 1は、 符号化すべきオーディオ信号 D 1 0を入力し、 この オーディオ信号 D 1 0に対して M D C T (Modif ied D iscrete Cos ine Transform ation) 等のスペク トル変換を行い、 時間軸上の信号を周波数軸上のスペク トル信 号 D 1 1に変換する。 そしてスぺク トル変換部 1 1は、 このスぺク トル信号 D 1 1を所定の時間ブロック (フレーム) 毎に符号列表グループ切替判定部 1 2、 正 規化部 1 3及び量子化精度決定部 1 4に供給する。
符号列表グループ切替判定部 1 2は、 スぺク トル変換部 1 1から供給されたス ベク トル信号 D 1 1の性質、 例えばトーナリティに応じて、 複数ある符号列表グ ループの中から 1つのグループを選択するとともに、 そのグループを示すグルー プインデックス D 1 2を量子化部 1 5及びマルチプレクサ 1 8に供給する。
例えば、 上述のように符号列表を トーン性信号用とノィズ性信号用との 2つの グループに分ける場合、 符号列表グループ切替判定部 1 2は、 スペク トル信号 D 1 1のトーナリティを調べ、 そのトーナリティが所定の閾値よりも大きければト —ン性信号用符号列表を選択し、 閾値よりも小さければノイズ性信号用符号列表 を選択する。 そして符号列表グループ切替判定部 1 2は、 選択したグループを示 すグループインデックス D 1 2を、 例えば 1チャンネル毎に 1 ビヅ トの情報とし て量子化部 1 5及びマルチプレクサ 1 8に供給する。 なお、 幾つかに分割した周 波数帯域毎に独立にトーン性/ノイズ性の判定を行い、 各帯域毎に 1 ビッ トの情 報をグループィ ンデヅクス D 1 2 として送るようにしても構わない。
正規化部 1 3は、 スぺク トル信号 D 1 1 を構成する各信号成分から絶対値が最 犬のものを抽出し、 この値に対応する係数を正規化係数とする。 そして、 正規化 部 1 3は、 スぺク トル信号 D 1 1 を構成する各信号成分を、 正規化係数に対応す る値でそれそれ正規化する (除算する) 。 したがって、 この場合、 正規化により 得られる被正規化データ D 1 3は、 一 1 . 0 ~ 1 . 0の範囲の値となる。 正規化 部 1 3は、 この被正規化データ D 1 3を量子化部 1 5に供給するとともに、 正規 化係数 D 1 4をマルチプレクサ 1 8に供給する。 なお、 正規化部 1 3は、 必要に 応じて正規化係数 D 1 4に対して所定の符号化を施した後、 マルチプレクサ 1 8 に供給するようにしても構わない。
量子化精度決定部 1 4は、 スぺク トル変換部 1 1から供給されたスぺク トル信 号 D 1 1に基づいて、 被正規化データ D 1 3を g子化する際の量子化ステップを 決定する。 そして量子化精度決定部 1 4は、 その量子化ステップに対応する量子 化精度情報 D 1 5を量子化部 1 5及びマルチプレクサ 1 8に供給する。 なお、 量 子化精度決定部 1 4は、 必要に応じて量子化精度情報 D 1 5に対して所定の符号 化を施した後、 マルチプレクサ 1 8に供給するようにしても構わない。
量子化部 1 5は、 量子化精度決定部 1 4から供給された量子化精度情報 D 1 5 に対応する量子化ステップで被正規化データ D 1 3を量子化する。 そして量子化 部 1 5は、 符号列表グループ切替判定部 1 2から供給されたグループィンデック ス D 1 2に基づいて、 選択されたグループの符号列表を用いて: M子化係数を符号 化する。 具体的には、 選択されたグループに含まれる符号列表で実際に符号化を 行い、 所要ビッ ト数が最も少ない符号列表を符号化に用いる符号列表として決定 する。 量子化部 1 5は、 その決定した符号列表ィンデックス D 1 6を符号列表ィ ンデツクス符号化部 1 6に供給するとともに、 符号化された係数データ D 1 7を マルチプレクサ 1 8に供給する。
符号列表インデックス符号化部 1 6は、 量子化部 1 5から供給された符号列表 インデヅクス D 1 6を符号化し、 その符号化された符号列表ィンデックス D 1 8 をマルチプレクサ 1 8に供給する。 ここで、 前述したように、 各符号列表の選択 確率に応じて符号列表のィンデックスを可変長符号化する場合には、 固定長で符 号化する場合と比較して符号化ビッ ト数を低減することができる。 そこで、 この ような場合、 符号列表インデックス符号化部 1 6は、 符号列表インデックスの符 号化ビッ ト数情報 D l 9を量子化部 1 5に供給する。 これにより、 量子化部 1 5 は、 ィンデックスの符号化で稼いだビヅ ト数をスぺク トルに対して再配分するこ とができる。
符号列表数切替判定部 1 7は、 符号列表グループに含まれる符号列表のうち、 使用する符号列表の数を切り替え、 その符号列表数インデックス D 2 1 を、 フレ ーム毎又はビッ トスト リーム毎に 1 ビッ トの情報として、 量子化部 1 5、 符号列 表インデヅクス符号化部 1 6及びマルチプレクサ 1 8に供給する。 すなわち、 上 述したように、 エンコーダにかけるリソースが少なく、 実用的なエンコードスピ 一ドを実現するために多少音質を犠牲にせざるを得ない場合等には、 実際に符号 化に用いる符号列表の数を少なくすることによりェンコ一ドスピードの高速化を 実現することができる。 なお、 使用する符号列表の切り替え動作は、 ユーザや機 器自身の判断により外部から供給される所定の設定用信号 D 2 0に基づいて行つ てもよく、 それ以外の方法を用いてもよい。
例えば、 上述のように使用する符号列表の数を 8個から 4個に切り替える場合、 符号列表数切替判定部 1 7は、 1 ビッ トの符号列表数インデックス D 2 1 を量子 化部 1 5、 符号列表ィンデヅクス符号化部 1 6及びマルチプレクサ 1 8に供給す る。 量子化部 1 5は、 8個ある符号列表のうち、 予め定められた 4個の符号列表 を用いて実際に符号化を行い、 所要ビツ ト数が最も少ない符号列表を符号化に用 いる符号列表として決定する。 量子化部 1 5は、 その決定した符号列表インデッ クス D 1 6を符号列表ィンデックス符号化部 1 6に供給する。 一方、 符号列表ィ ンデックス符号化部 1 6は、 予め定められた 4個の符号列表の符号列表のインデ ックスを振り直し、 量子化部 1 5から供給された符号列表ィンデックス D 1 6に 対応する新たなィンデックスを符号化する。
マルチプレクサ 1 8は、 量子化部 1 5から供給された係数デ一夕 D 1 7を、 グ ループインデックス D 1 2、 正規化係数 D 1 4、 量子化精度情報 D 1 5、 符号列 表インデックス D 1 8及び符号列表数ィンデックス D 2 1 とともに多重化する。 そして、 マルチプレクサ 1 8は、 多重化の結果得られる符号化デ一夕 D 2 2を伝 送路を介して伝送し、 或いは図示しない記録媒体に記録する。
なお、 上述の例では、 符号列表グループ切替判定部 1 2は、 スペク トル信号 D 1 1のトーナリティを調べて、 トーン性信号用の符号列表とノイズ性信号用の符 号列との何れかを選択するものとして説明したが、 これに限定されるものではな く、 両方の符号列表で実際に符号化を行って所要ビッ ト数を計算し、 ビッ ト数の 少ない方のグループを選択するようにしても構わない。
続いて、 符号化装置 1 0から出力される符号化データを復号する復号装置 3 0 の概略構成について、 図 1 0を用いて説明する。 図 1 0に示すように、 本実施の 形態における復号装置 3 0は、 デマルチプレクサ 3 1 と、 符号列表インデックス 復号部 3 2と、 逆量子化部 3 3と、 逆正規化部 3 4と、 スぺク トル逆変換部 3 5 とにより構成されている。
デマルチプレクサ 3 1は、 入力した符号化データ D 3 0を復号し、 係数データ D 3 1、 S子化精度情報 D 3 2、 正規化係数 D 3 3、 グループィ ンデックス D 3 4、 符号列表ィンデックス D 3 5及び符号列表数ィンデヅクス D 3 6に分離する c そしてデマルチプレクサ 3 1は、 係数データ D 3 1を逆 g子化部 3 3に供給する とともに、 量子化精度情報 D 3 2及び正規化係数 D 3 3を必要に応じて復号し、 それぞれ逆量子化部 3 3及び逆正規化部 3 4に供給する。 また、 デマルチプレク サ 3 1は、 グループインデックス D 3 4及び符号列表インデックス D 3 5を、 そ れそれ逆量子化部 3 3及び符号列表インデックス復号部 3 2に供給する。 さらに、 デマルチプレクサ 3 1は、 符号列表数ィンデヅクス D 3 6を符号列表ィンデヅク ス復号部 3 2及び逆量子化部 3 3に供給する。
符号列表ィンデックス復号部 3 2は、 符号列表数ィンデックス D 3 6に基づい て符号列表ィンデヅクス D 3 5を復号し、 復号したィンデヅクス D 3 7を逆量子 化部 3 3に供給する。
逆量子化部 3 3は、 グループインデックス D 3 4、 符号列表数インデックス D 3 6及び符号列表ィンデヅクス復号部 3 2から供給されたィンデヅクス D 3 7に 基づいて使用する符号列表を決定し、 この符号列表で係数データ D 3 1 を復号す る。 そして、 逆量子化部 3 3は、 得られた量子化係数をデマルチプレクサ 3 1か ら供給された量子化精度情報 D 3 2に対応した量子化ステップで逆量子化し、 被 正規化データ D 3 8を生成する。 逆量子化部 3 3は、 この被正規化データ D 3 8 を逆正規化部 3 4に供給する。 逆正規化部 3 4は、 被正規化デ一夕 D 3 8にデマルチプレクサ 3 1から供給さ れた正規化係数 D 3 3に対応する値を乗算することで被正規化データ D 3 8を復 号し、 得られたスぺク トル信号 D 3 9をスぺク トル逆変換部 3 5に供給する。 スぺク トル逆変換部 3 5は、 逆正規化部 3 4から供給されたスぺク トル信号 D 3 9に対して 1 ]^。。丁 ( Inverse Modified Di screte Cos ine Transformation) 等の逆スぺク トル変換を施し、 これにより元のオーディオ信号 D 4 0を復元する c 以上説明したように、 本実施の形態における符号化装置 1 0は、 スペク トル信 号 D 1 1の性質、 例えばトーナリティに応じて、 複数ある符号列表グループの中 から 1つのグループを選択し、 そのグループに含まれる符号列表を用いて量子化 係数を符号化する。 これにより、 符号列表のインデックスを符号化する符号化ビ ト数を増加させることなく、 様々な入力信号に対して信号の性質に応じた最適 な符号列表が選択可能とされる。 また、 符号化装置 1 0は、 エンコーダにかける リソースが少なく、 実用的なエンコードスピードを実現するために多少音質を犠 牲にせざるを得ない場合等には、 実際に符号化に用いる符号列表の数を少なくす ることによりエンコードスピ一ドの高速化を実現することができる。
一方、 本実施の形態における復号装置 3 0は、 符号化データ D 3 0に含まれる グループィンデックス D 3 4、 符号列表ィンデヅクス D 3 5及び符号列表数ィン デツクス D 3 6に基づいて符号化側と対応する符号列表を選択し、 係数デ一夕 D 3 1を復号することができる。
なお、 本発明は上述した実施の形態のみに限定されるものではなく、 本発明の 要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
例えば、 上述の実施の形態では、 ハードウェアの構成として説明したが、 これ に限定されるものではなく、 任意の処理を、 C P U ( Central Process ing Unit) にコンピュータプログラムを実行させることにより実現することも可能である。 この場合、 コンビュ一夕プログラムは、 記録媒体に記録して提供することも可能 であり、 また、 インターネットその他の伝送媒体を介して伝送することにより提 供することも可能である。
なお、 本発明は、 図面を参照して説明した上述の実施例に限定されるものでは なく、 添付の請求の範囲及びその主旨を逸脱することなく、 様々な変更、 置換又 はその同等のものを行うことができることは当業者にとって明らかである。 産業上の利用可能性 上述したような本発明を用いることにより、 符号列表のィンデックスを符号化 する符号化ビッ ト数を増加させることなく、 様々な入力信号に対して信号の性質、 例えばトーナリティに応じた最適な符号列表が選択可能とされる。

Claims

請求の範囲
1 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化方 法において、
予め複数のグループに分けられた符号列表群から、 上記ディジタル信号の性質 に応じて 1つのグループを選択する選択工程と、
上記選択工程にて選択されたグループの上記符号列表群の中から 1つの符号列 表を決定する決定工程と、
上記決定工程にて決定された上記符号列表を用いて上記ディジタル信号を符号 化する符号化工程と
を有することを特徴とする符号化方法。
2 . 請求の範囲第 1項記載の符号化方法であって、
上記デイジ夕ル信号は、 周波数変換された信号であることを特徴とする符号化 方法。
3 . 請求の範囲第 2項記載の符号化方法であって、
上記選択工程では、 上記ディジタル信号のトーナリティに応じて上記グループ が選択されることを特徴とする符号化方法。
4 . 請求の範囲第 1項記載の符号化方法であって、
上記選択工程では、 複数の上記所定単位毎に上記 1つのグループが選択される ことを特徴とする符号化方法。
5 . 請求の範囲第 1項記載の符号化方法であって、
上記符号化工程では、 上記選択工程にて選択されたグループを示すィ ンデック スがさらに符号化されることを特徴とする符号化方法。
6 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化方 法において、
符号列表群に含まれる選択可能な符号列表の数を設定する設定工程と、 上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、 上記選択工程にて選択された符号列表を用いて上記ディジタル信号を符号化す る符号化工程と を有することを特徴とする符号化方法。
7 . 請求の範囲第 6項記載の符号化方法であって、
上記符号化工程では、 上記選択工程にて選択された符号列表のィンデヅクスせ 可変長符号化されることを特徴とする符号化方法。
8 . 請求の範囲第 6項記載の符号化方法であって、
上記符号化工程では、 上記設定工程にて設定された上記選択可能な符号列表の 数がさらに符号化されることを特徴とする符 ¾化方法。
9 . 請求の範囲第 6項記載の符号化方法であって、
上記設定工程では、 所定の設定用信号に基づいて上記選択可能な符号列表の数 が設定されることを特徴とする符号化方法。
1 0 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化 装置において、
予め複数のグループに分けられた符号列表群から、 上記ディジ夕ル信号の性質 に応じて 1つのグループを選択する選択手段と、
上記選択手段によって選択されたグループの上記符号列表群の中から 1つの符 号列表を決定する決定手段と、
上記決定手段によって決定された上記符号列表を用いて上記ディジタル信号を 符号化する符号化手段と
を備えることを特徴とする符号化装置。
1 1 . 請求の範囲第 1 0項記載の符号化装置であって、
上記ディジタル信号は、 周波数変換された信号であることを特徴とする符号化
1 2 . 請求の範囲第 1 1項記載の符号化装置であって、
上記選択手段は、 上記ディジタル信号のトーナリティに応じて上記グループを 選択することを特徴とする符号化装置。
1 3 . 請求の範囲第 1 0項記載の符号化装置であって、
上記選択手段は、 複数の上記所定単位毎に上記 1つのグループを選択すること を特徴とする符号化装置。
1 4 . 請求の範囲第 1 0項記載の符号化装置であって、 上記符号化手段は、 上記選択手段によって選択されたグループを示すィンデッ クスをさらに符号化することを特徴とする符号化装置。
1 5 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化 装置において、
符号列表群に含まれる選択可能な符号列表の数を設定する設定手段と、 上記符号列表群の中から 1つの上記符号列表を選択する選択手段と、 上記選択手段によって選択された符号列表を用いて上記ディジタル信号を符号 化する符号化手段と
を備えることを特徴とする符号化装置。
1 6 . 請求の範囲第 1 5項記載の符号化装置であって、
上記符号化手段は、 上記選択手段によって選択された符号列表のィンデックス を可変長符号化することを特徴とする符号化装置。
1 7 . 請求の範囲第 1 5項記載の符号化装置であって、
上記符号化手段は、 上記設定手段によって設定された上記選択可能な符号列表 の数をさらに符号化することを特徴とする符号化装置。
1 8 . 請求の範囲第 1 5項記載の符号化装置であって、
上記設定手段は、 所定の設定用信号に基づいて上記選択可能な符号列表の数を 設定することを特徴とする符号化装置。
1 9 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化 処理をコンピュー夕に実行させるプログラムにおいて、
予め複数のグループに分けられた符号列表群から、 上記ディジタル信号の性質 に応じて 1つのグループを選択する選択工程と、
上記選択工程にて選択されたグループの上記符号列表群の中から 1つの符号列 表を決定する決定工程と、
上記決定工程にて決定された上記符号列表を用いて上記ディジ夕ル信号を符号 化する符号化工程と
を有することを特徴とするプログラム。
2 0 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化 処理をコンピュータに実行させるプログラムにおいて、 符号列表群に含まれる選択可能な符号列表の数を設定する設定工程と、 上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、 上記選択工程にて選択された符号列表を用いて上記ディジタル信号を符号化す る符号化工程と
を有することを特徴とするプログラム。
2 1 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化 処理をコンピュータに実行させるプログラムが記録されたコンピュータ読み取り 可能な記録媒体において、
予め複数のグループに分けられた符号列表群から、 上記ディジタル信号の性質 に応じて 1つのグループを選択する選択工程と、
上記選択工程にて選択されたグループの上記符号列表群の中から 1つの符号列 表を決定する決定工程と、
上記決定工程にて決定された上記符号列表を用いて上記ディジタル信号を符号 化する符号化工程と
を有することを特徴とするプログラムが記録された記録媒体。
2 2 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化 処理をコンピュータに実行させるプログラムが記録されたコンピュータ読み取り 可能な記録媒体において、
符号列表群に含まれる選択可能な符号列表の数を設定する設定工程と、 上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、 上記選択工程にて選択された符号列表を用いて上記ディジタル信号を符号化す る符号化工程と
を有することを特徴とするプログラムが記録された記録媒体。
2 3 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号 する復号方法において、
予め複数のグループに分けられた符号列表群から、 使用する 1つのグル一プを 選択する選択工程と、
上記選択工程にて選択されたグループの符号列表の中から使用する 1つの符号 列表を決定する決定工程と、 上記決定工程にて決定された符号列表を用いて上記ディジタル信号を復号する 復号工程と
を有することを特徴とする復号方法。
2 4 . 請求の範囲第 2 3項記載の復号方法であって、
上記ディジタル信号は、 周波数変換された信号であることを特徴とする復号方 法。
2 5 . 請求の範囲第 2 4項記載の復号方法であって、
上記選択工程では、 上記符号化の際に上記ディジタル信号の トーナリティに応 じて選択されたグループと同じグループが選択されることを特徴とする復号方法 ( 2 6 . 請求の範囲第 2 3項記載の復号方法であって、
上記選択工程では、 複数の上記所定単位毎に上記 1つのグループが選択される ことを特徴とする復号方法。
2 7 . 請求の範囲第 2 3項記載の復号方法であって、
上記選択工程では、 使用したグループを示すィンデックスに基づいて上記グル ープが選択されることを特徴とする復号方法。
2 8 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号 する復号方法において、
符号列表群に含まれる符号列表の数を設定する設定工程と、
上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、
上記選択工程にて選択された上記符号列表に基づいて上記ディジタル信号を復 号する復号工程と
を有することを特徴とする復号方法。
2 9 . 請求の範囲第 2 8項記載の復号方法であって、
上記選択工程では、 可変長符号化された上記符号列表のィンデックスに基づい て、 使用する符号列表が選択されることを特徴とする復号方法。
3 0 . 請求の範囲第 2 8項記載の復号方法であって、
上記設定工程では、 上記ディジタル信号とともに符号化された上記符号列表の 数に基づいて、 上記符号列表の数が設定されることを特徴とする復号方法。
3 1 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号 する復号装置において、
予め符号列表群毎に分けられた複数のグループから、 使用する 1つのグループ を選択する選択手段と、
上記選択手段によって選択されたグループの符号列表の中から使用する 1つの 符号列表を決定する決定手段と、
上記決定手段によって決定された符号列表を用いて上記ディジタル信号を復号 する復号手段と
を備えることを特徴とする復号装置。
3 2 . 請求の範囲第 3 1項記載の復号装置であって、
上記ディジタル信号は、 周波数変換された信号であることを特徴とする復号装 置。
3 3 . 請求の範囲第 3 2項記載の復号装置であって、
上記選択手段は、 上記符号化の際に上記ディジタル信号のトーナリティに応じ て選択されたグループと同じグループを選択することを特徴とする復号装置。 3 4 . 請求の範囲第 3 1項記載の復号装置であって、
上記選択手段は、 複数の上記所定単位毎に上記 1つのグループを選択すること を特徴とする復号装置。
3 5 . 請求の範囲第 3 1項記載の復号装置であって、
上記選択手段は、 使用したグループを示すインデックスに基づいて上記グルー プを選択することを特徴とする復号装置。
3 6 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号 する復号装置において、
符号列表群に含まれる符号列表の数を設定する設定手段と、
上記符号列表群の中から 1つの上記符号列表を選択する選択手段と、
上記選択手段によつて選択された上記符号列表に基づいて上記デイジ夕ル信号 を復号する復号工程と
を備えることを特徴とする復号装置。
3 7 . 請求の範囲第 3 6項記載の復号装置であって、
上記選択手段は、 可変長符号化された上記符号列表のィンデックスに基づいて、 使用する符号列表を選択することを特徴とする復号装置。
3 8 . 請求の範囲第 3 6項記載の復号装置であって、
上記設定手段は、 上記ディジタル信号とともに符号化された上記符号列表の数 に基づいて、 上記符号列表の数を設定することを特徴とする復号装置。
3 9 . 所定単位毎に 1つの符号列表を用いて符号化されたディジ夕ル信号を復号 する復号処理をコンピュー夕に実行させるプログラムにおいて、
予め複数のグループに分けられた符号列表群から、 使用する 1つのグループを 選択する選択工程と、
上記選択工程にて選択されたグループの符号列表の中から使用する 1つの符号 列表を決定する決定工程と、
上記決定工程にて決定された符号列表を用いて上記ディジタル信号を復号する 復号工程と
を有することを特徴とするプログラム。
4 0 . 所定単位毎に 1つの符号列表を用いて符号化されたディジ夕ル信号を復号 する復号処理をコンピュータに実行させるプログラムにおいて、
符号列表群に含まれる符号列表の数を設定する設定工程と、
上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、 上記選択工程にて選択された上記符号列表に基づいて上記ディジタル信号を復 号する復号工程と
を有することを特徴とするプログラム。
4 1 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号 する復号処理をコンピュータに実行させるプログラムが記録されたコンピュータ 読み取り可能な記録媒体において、
予め複数のグループに分けられた符号列表群から、 使用する 1つのグループを 選択する選択工程と、
上記選択工程にて選択されたグループの符号列表の中から使用する 1 'つの符号 列表を決定する決定工程と、
上記決定工程にて決定された符号列表を用いて上記ディジタル信号を復号する 復号工程と を有することを特徴とするプログラムが記録された記録媒体。
4 2 . 所定単位毎に 1つの符号列表を用いて符号化されたディジ夕ル信号を復号 する復号処理をコンピュータに実行させるプログラムが記録されたコンピュータ 読み取り可能な記録媒体において、
符号列表群に含まれる符号列表の数を設定する設定工程と、
上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、 上記選択工程にて選択された上記符号列表に基づいて上記デイジ夕ル信号を復 号する復号工程と
を有することを特徴とするプログラムが記録された記録媒体。
PCT/JP2003/005546 2002-05-07 2003-04-30 Procede et dispositif de codage, ainsi que procede et dispositif de decodage Ceased WO2003096545A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US10/483,105 US6930618B2 (en) 2002-05-07 2003-04-30 Encoding method and apparatus, and decoding method and apparatus
EP20030725719 EP1503502B1 (en) 2002-05-07 2003-04-30 Encoding method and device
KR20047000176A KR100968057B1 (ko) 2002-05-07 2003-04-30 부호화 방법 및 장치, 및 복호 방법 및 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002-132189 2002-05-07
JP2002132189A JP3900000B2 (ja) 2002-05-07 2002-05-07 符号化方法及び装置、復号方法及び装置、並びにプログラム

Publications (1)

Publication Number Publication Date
WO2003096545A1 true WO2003096545A1 (fr) 2003-11-20

Family

ID=29416631

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/005546 Ceased WO2003096545A1 (fr) 2002-05-07 2003-04-30 Procede et dispositif de codage, ainsi que procede et dispositif de decodage

Country Status (6)

Country Link
US (1) US6930618B2 (ja)
EP (1) EP1503502B1 (ja)
JP (1) JP3900000B2 (ja)
KR (1) KR100968057B1 (ja)
CN (1) CN100355210C (ja)
WO (1) WO2003096545A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100677378B1 (ko) * 2004-11-02 2007-02-02 엘지전자 주식회사 Wcdma 단말기의 영상 통화 데이터 인코딩 방법
CN100539437C (zh) * 2005-07-29 2009-09-09 上海杰得微电子有限公司 一种音频编解码器的实现方法
JP4907179B2 (ja) * 2006-01-27 2012-03-28 株式会社 日立ディスプレイズ 表示装置
CN1831940B (zh) * 2006-04-07 2010-06-23 安凯(广州)微电子技术有限公司 基于音频解码器的音调和节奏调节方法
US7852197B2 (en) * 2007-06-08 2010-12-14 Sensomatic Electronics, LLC System and method for inhibiting detection of deactivated labels using detection filters having an adaptive threshold
KR101282193B1 (ko) * 2009-11-10 2013-07-04 한국전자통신연구원 칼만 필터와 fir 필터를 사용한 동영상 인코더에서의 비트율 제어 방법
KR101668093B1 (ko) * 2010-06-17 2016-10-21 삼성전자주식회사 데이터 인코딩 및 디코딩 방법 및 장치
KR101383775B1 (ko) 2011-05-20 2014-04-14 주식회사 케이티 화면 내 예측 방법 및 장치
US8542135B2 (en) 2011-11-24 2013-09-24 International Business Machines Corporation Compression algorithm incorporating automatic generation of a bank of predefined huffman dictionaries
US8610606B2 (en) 2011-11-24 2013-12-17 International Business Machines Corporation Compression algorithm incorporating dynamic selection of a predefined huffman dictionary
US8610604B2 (en) 2011-11-24 2013-12-17 International Business Machines Corporation Compression algorithm incorporating a feedback loop for dynamic selection of a predefined Huffman dictionary
CN104041054A (zh) 2012-01-17 2014-09-10 索尼公司 编码设备及编码方法、解码设备及解码方法以及程序
WO2013141638A1 (ko) * 2012-03-21 2013-09-26 삼성전자 주식회사 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
US8593308B1 (en) 2012-05-31 2013-11-26 International Business Machines Corporation Method of accelerating dynamic Huffman decompaction within the inflate algorithm
KR102070622B1 (ko) * 2012-11-23 2020-01-29 삼성전자주식회사 동영상을 위한 양자화 테이블 추정 방법 및 장치
EP3614381A1 (en) * 2013-09-16 2020-02-26 Samsung Electronics Co., Ltd. Signal encoding method and device and signal decoding method and device
CN106664487B (zh) * 2014-07-24 2020-01-17 株式会社索思未来 信号处理装置以及信号处理方法
JP7368932B2 (ja) * 2017-12-28 2023-10-25 日本ルメンタム株式会社 光モジュール及び光伝送装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05130414A (ja) * 1991-10-31 1993-05-25 Canon Inc 画像処理装置
JPH08316846A (ja) * 1995-05-18 1996-11-29 Matsushita Electric Ind Co Ltd 画像符号化装置、画像復号化装置、画像符号化方法および画像復号化方法
JPH0936752A (ja) * 1995-07-13 1997-02-07 Fuji Xerox Co Ltd 符号化装置
JPH118771A (ja) * 1997-06-18 1999-01-12 Canon Inc 画像出力装置および画像出力方法およびコンピュータが読み出し可能なプログラムを格納した記憶媒体
WO2000016314A2 (en) 1998-09-16 2000-03-23 Telefonaktiebolaget Lm Ericsson Celp encoding/decoding method and apparatus
JP2002027472A (ja) * 2000-07-10 2002-01-25 Fuji Xerox Co Ltd 画像符号化装置および画像復号化装置、ならびに画像符号化方法および画像復号化方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2263619C3 (de) * 1972-12-27 1978-05-03 Siemens Ag, 1000 Berlin Und 8000 Muenchen Einrichtung zur fehlererkennenden und irrungsfreien Ablesung von eich- und Überwachungspflichtigen Vorrichtungen, insbesondere von Waagen
US4862167A (en) * 1987-02-24 1989-08-29 Hayes Microcomputer Products, Inc. Adaptive data compression method and apparatus
EP0806872B1 (en) * 1991-01-17 2000-04-12 Mitsubishi Denki Kabushiki Kaisha Video signal encoding apparatus using a block shuffling technique
JP3142310B2 (ja) 1991-07-05 2001-03-07 沖電気工業株式会社 半導体素子の製造方法
KR100368854B1 (ko) * 1993-06-30 2003-05-17 소니 가부시끼 가이샤 디지털신호의부호화장치,그의복호화장치및기록매체
JP3292221B2 (ja) * 1993-09-14 2002-06-17 ソニー株式会社 画像圧縮符号化方法
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
JP3274284B2 (ja) * 1994-08-08 2002-04-15 キヤノン株式会社 符号化装置およびその方法
US5884269A (en) * 1995-04-17 1999-03-16 Merging Technologies Lossless compression/decompression of digital audio data
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
JP2000013794A (ja) * 1998-06-23 2000-01-14 Mitsubishi Electric Corp 動画像符号化装置、動画像符号化方法、動画像復号装置、および動画像復号方法
JP3888597B2 (ja) * 1998-06-24 2007-03-07 日本ビクター株式会社 動き補償符号化装置、及び動き補償符号化復号化方法
JP3778087B2 (ja) * 2002-01-18 2006-05-24 富士ゼロックス株式会社 データ符号化装置及びデータ復号装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05130414A (ja) * 1991-10-31 1993-05-25 Canon Inc 画像処理装置
JPH08316846A (ja) * 1995-05-18 1996-11-29 Matsushita Electric Ind Co Ltd 画像符号化装置、画像復号化装置、画像符号化方法および画像復号化方法
JPH0936752A (ja) * 1995-07-13 1997-02-07 Fuji Xerox Co Ltd 符号化装置
JPH118771A (ja) * 1997-06-18 1999-01-12 Canon Inc 画像出力装置および画像出力方法およびコンピュータが読み出し可能なプログラムを格納した記憶媒体
WO2000016314A2 (en) 1998-09-16 2000-03-23 Telefonaktiebolaget Lm Ericsson Celp encoding/decoding method and apparatus
JP2002027472A (ja) * 2000-07-10 2002-01-25 Fuji Xerox Co Ltd 画像符号化装置および画像復号化装置、ならびに画像符号化方法および画像復号化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1503502A4

Also Published As

Publication number Publication date
KR20040103889A (ko) 2004-12-09
US20040164882A1 (en) 2004-08-26
CN100355210C (zh) 2007-12-12
KR100968057B1 (ko) 2010-07-08
EP1503502A1 (en) 2005-02-02
JP3900000B2 (ja) 2007-03-28
US6930618B2 (en) 2005-08-16
CN1524348A (zh) 2004-08-25
JP2003324355A (ja) 2003-11-14
EP1503502A4 (en) 2005-12-14
EP1503502B1 (en) 2011-09-28

Similar Documents

Publication Publication Date Title
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
JP3336617B2 (ja) 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体
WO2003096545A1 (fr) Procede et dispositif de codage, ainsi que procede et dispositif de decodage
JP3203657B2 (ja) 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体
EP0884850A2 (en) Scalable audio coding/decoding method and apparatus
JPH08186500A (ja) 高能率符号化方法及び装置、高能率復号化方法及び装置、並びに伝送媒体
WO2003096325A1 (fr) Procede de codage, dispositif de codage, procede de decodage et dispositif de decodage
WO1995001680A1 (en) Digital signal encoding device, its decoding device, and its recording medium
JPH05206866A (ja) 高能率符号化装置
JPWO1995027335A1 (ja) 情報符号化方法及び装置、情報復号化方法及び装置、情報伝送方法、並びに情報記録媒体
JP2003337598A (ja) 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
JPH10178350A (ja) 符号化音声データの符号化レート変換方法および装置
KR100330290B1 (ko) 신호부호화장치,신호복호화장치,및신호부호화방법
JP2004309921A (ja) 符号化装置、符号化方法及びプログラム
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
US6661923B1 (en) Coding device, coding method, decoding device, decoding method, program recording medium and data recording medium
JP3475985B2 (ja) 情報符号化装置および方法、情報復号化装置および方法
JP3685823B2 (ja) 信号符号化方法及び装置、並びに信号復号化方法及び装置
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JPH10149197A (ja) 符号化装置および方法
JPH09135173A (ja) 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
JP2002374171A (ja) 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
JP4534112B2 (ja) 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
JP3465698B2 (ja) 信号復号化方法及び装置
JPWO1999044291A1 (ja) 符号化装置及び符号化方法、復号装置及び復号方法、並びにプログラム記録媒体及びデータ記録媒体

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR

WWE Wipo information: entry into national phase

Ref document number: 2003725719

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 1020047000176

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 20038006219

Country of ref document: CN

Ref document number: 10483105

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 2003725719

Country of ref document: EP