JPH07221649A - INFORMATION ENCODING METHOD AND DEVICE, INFORMATION DECODING METHOD AND DEVICE, INFORMATION RECORDING MEDIUM, AND INFORMATION TRANSMISSION METHOD - Google Patents
INFORMATION ENCODING METHOD AND DEVICE, INFORMATION DECODING METHOD AND DEVICE, INFORMATION RECORDING MEDIUM, AND INFORMATION TRANSMISSION METHODInfo
- Publication number
- JPH07221649A JPH07221649A JP6032828A JP3282894A JPH07221649A JP H07221649 A JPH07221649 A JP H07221649A JP 6032828 A JP6032828 A JP 6032828A JP 3282894 A JP3282894 A JP 3282894A JP H07221649 A JPH07221649 A JP H07221649A
- Authority
- JP
- Japan
- Prior art keywords
- gain control
- information
- signal
- control correction
- frequency component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】
【目的】 アタック部の振幅変化の度合に応じたゲイン
制御により、より効率的でより音質の高い符号化、復号
化を行うと共に、プリエコー発生を防止する。
【構成】 (A)のアタック部の直前レベルがある程度
以上の信号波形SW1には、(B)に示すゲイン制御量
が比較的小さいゲイン制御関数G1を適用し、アタック
部直前のレベルが非常に低い信号波形SW2には、ゲイ
ン制御量が比較的大きいゲイン制御関数G2を適用して
ゲイン制御、ゲイン制御補正の処理を行う。このように
信号波形のアタック部における振幅変化の度合いに応じ
てゲイン制御量を変化させることによって、プリエコー
の発生と、周波数領域でのエネルギーの拡散による効率
低下とを回避している。
(57) [Abstract] [Purpose] By performing gain control according to the degree of amplitude change in the attack portion, more efficient encoding and decoding with higher sound quality are performed, and pre-echo generation is prevented. [Structure] (A) A gain control function G1 having a relatively small gain control amount shown in (B) is applied to a signal waveform SW1 having a level immediately above the attack part above a certain level, and the level immediately before the attack part is extremely high. A gain control function G2 having a relatively large gain control amount is applied to the low signal waveform SW2 to perform gain control and gain control correction processing. In this way, by changing the gain control amount according to the degree of amplitude change in the attack portion of the signal waveform, the occurrence of pre-echo and the decrease in efficiency due to the energy diffusion in the frequency domain are avoided.
Description
【0001】[0001]
【産業上の利用分野】本発明は、いわゆる高能率符号化
によって入力ディジタルデータの符号化を行ない、これ
を伝送、記録、再生し、復号化して再生信号を得るよう
な、情報符号化方法及び装置、情報復号化方法及び装置
並びに情報記録媒体及び情報伝送方法に関するものであ
る。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information coding method for coding input digital data by so-called high efficiency coding, and transmitting, recording, reproducing and decoding the input digital data to obtain a reproduced signal. The present invention relates to an apparatus, an information decoding method and apparatus, an information recording medium, and an information transmission method.
【0002】[0002]
【従来の技術】従来より、オーディオ或いは音声等の信
号の高能率符号化の手法は種々知られているが、例え
ば、時間軸上のオーディオ信号等をブロック化しない
で、複数の周波数帯域に分割して符号化する非ブロック
化周波数帯域分割方式である帯域分割符号化(サブバン
ド・コーディング:SBC)や、時間軸の信号を周波数
軸上の信号に変換(スペクトル変換)して複数の周波数
帯域に分割し、各帯域毎に符号化するブロック化周波数
帯域分割方式、いわゆる変換符号化等を挙げることがで
きる。また、上述の帯域分割符号化と変換符号化とを組
み合わせた高能率符号化の手法も考えられており、この
場合には、例えば、上記帯域分割符号化で帯域分割を行
った後、該各帯域毎の信号を周波数軸上の信号にスペク
トル変換し、このスペクトル変換された各帯域毎に符号
化が施される。2. Description of the Related Art Conventionally, various techniques for high-efficiency coding of signals such as audio and voice have been known. For example, audio signals on the time axis are not divided into blocks and divided into a plurality of frequency bands. Band division coding (sub-band coding: SBC), which is a non-blocking frequency band division method that performs encoding by using a plurality of frequency bands by converting a signal on the time axis into a signal on the frequency axis (spectral conversion). There is a blocking frequency band division method in which each frequency band is divided into, and so-called transform coding and the like. Further, a method of high efficiency coding in which the above band division coding and transform coding are combined is also considered, and in this case, for example, after performing band division by the band division coding, A signal for each band is spectrum-converted into a signal on the frequency axis, and each spectrum-converted band is encoded.
【0003】ここで、上述した帯域分割符号化において
用いられる帯域分割用フィルターとしては、例えばQM
Fフィルターがあり、このQMFフィルターは、文献
「ディジタル・コーディング・オブ・スピーチ・イン・
サブバンズ」(Digital codingof speech in subbands,
R.E.Crochiere, Bell Syst.Tech. J., Vol.55, No.819
76)に述べられている。Here, as a band division filter used in the above band division coding, for example, QM
There is an F filter, and this QMF filter is based on the document "Digital Coding of Speech in.
Subbands "(Digital coding of speech in subbands,
RE Crochiere, Bell Syst.Tech. J., Vol.55, No.819
76).
【0004】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」(Po
lyphase Quadrature filters -A new subband coding t
echnique, Joseph H. Rothweiler, ICASSP 83 BOSTON)
には、等バンド幅のフィルター分割手法が述べられてい
る。In addition, the document "Polyphase Quadrature Filters-New Band Division Coding Technology" (Po
lyphase Quadrature filters -A new subband coding t
echnique, Joseph H. Rothweiler, ICASSP 83 BOSTON)
Describes an equal bandwidth filter partitioning technique.
【0005】また、上述したスペクトル変換としては、
例えば、入力オーディオ信号を所定単位時間(フレー
ム)でブロック化し、当該ブロック毎に離散フーリエ変
換(DFT)、コサイン変換(DCT)、モディファイ
ドDCT変換(MDCT)等を行うことで時間軸を周波
数軸に変換するようなスペクトル変換がある。なお、上
記MDCTについては、文献「時間領域エリアシング・
キャンセルを基礎とするフィルタ・バンク設計を用いた
サブバンド/変換符号化」(Subband/TransformCoding
Using Filter Bank Designs Based on Time Domain Ali
asing Cancellation, J.P.Princen, A.B.Bradley, Uni
v. of Surrey, Royal Melbourne Inst.ofTech. ICASSP
1987)に述べられている。Further, as the above-mentioned spectrum conversion,
For example, an input audio signal is divided into blocks in a predetermined unit time (frame), and a discrete Fourier transform (DFT), a cosine transform (DCT), a modified DCT transform (MDCT), etc. are performed for each block to set a time axis as a frequency axis. There is a spectral transformation that transforms. Regarding the MDCT, refer to the document “Time Domain Aliasing.
Subband / Transform Coding with Cancellation-Based Filter Bank Design "
Using Filter Bank Designs Based on Time Domain Ali
asing Cancellation, JPPrincen, ABBradley, Uni
v. of Surrey, Royal Melbourne Inst.ofTech. ICASSP
1987).
【0006】このようにフィルターやスペクトル変換に
よって帯域毎に分割された信号を量子化することによ
り、量子化雑音が発生する帯域を制御することができ、
マスキング効果などの性質を利用して聴覚的により高能
率な符号化を行なうことができる。また、ここで量子化
を行なう前に、各帯域毎に、例えばその帯域における信
号成分の絶対値の最大値で正規化を行なうようにすれ
ば、さらに高能率な符号化を行なうことができる。As described above, by quantizing the signal divided into each band by the filter and the spectrum conversion, the band in which the quantization noise is generated can be controlled,
By utilizing the properties such as the masking effect, it is possible to perform more efficient audio coding. Further, if the normalization is performed for each band, for example, with the maximum value of the absolute value of the signal component in that band before the quantization is performed here, more efficient encoding can be performed.
【0007】ここで、周波数帯域分割された各周波数成
分を量子化する場合の周波数分割幅としては、例えば人
間の聴覚特性を考慮した帯域幅を用いることが多い。す
なわち、一般に高域ほど帯域幅が広くなるような臨界帯
域(クリティカルバンド)と呼ばれている帯域幅で、オ
ーディオ信号を複数(例えば25バント)の帯域に分割
することがある。また、この時の各帯域毎のデータを符
号化する際には、各帯域毎に所定のビット配分或いは、
各帯域毎に適応的なビット割当て(ビットアロケーシヨ
ン)による符号化が行われる。例えば、上記MDCT処
理されて得られた係数データを上記ビットアロケーシヨ
ンによって符号化する際には、上記各ブロック毎のMD
CT処理により得られる各帯域毎のMDCT係数データ
に対して、適応的な割当てビット数で符号化が行われる
ことになる。ビット割当手法としては、次の2手法が知
られている。Here, as the frequency division width in the case of quantizing each frequency component divided into frequency bands, for example, a bandwidth considering human auditory characteristics is often used. That is, an audio signal may be divided into a plurality of bands (for example, 25 bands) with a bandwidth generally called a critical band in which the bandwidth increases as the frequency band increases. Also, when encoding the data for each band at this time, a predetermined bit allocation for each band, or
Coding by adaptive bit allocation (bit allocation) is performed for each band. For example, when the coefficient data obtained by the MDCT processing is encoded by the bit allocation, the MD of each block is
The MDCT coefficient data for each band obtained by the CT process is encoded with the adaptive allocation bit number. The following two methods are known as bit allocation methods.
【0008】例えば、文献「音声信号の適応変換符号
化」(Adaptive Transform Coding ofSpeech Signals,
IEEE Transactions of Accoustics, Speech, and Signa
l Processing, vol.ASSP-25, No.4, August 1977 )で
は、各帯域毎の信号の大きさをもとに、ビット割当を行
なっている。この方式では、量子化雑音スペクトルが平
坦となり、雑音エネルギー最小となるが、聴感覚的には
マスキング効果が利用されていないために実際の雑音感
は最適ではない。For example, the document "Adaptive Transform Coding of Speech Signals,"
IEEE Transactions of Accoustics, Speech, and Signa
l Processing, vol.ASSP-25, No.4, August 1977), bit allocation is performed based on the signal size of each band. In this method, the quantization noise spectrum becomes flat and the noise energy becomes the minimum, but the actual noise feeling is not optimal because the masking effect is not used auditorily.
【0009】また、例えば文献「臨界帯域符号化器 −
ディジタル・エンコーディング・オブ・パーセプチュア
ル・リクワイアメンツ・オブ・ジ・オーディトリィ・シ
ステム」(The critical band coder --digital encodi
ng of the perceptual requirements of the auditory
system, M.A.Kransner MIT, ICASSP 1980)では、聴覚
マスキングを利用することで、各帯域毎に必要な信号対
雑音比を得て固定的なビット割当を行なう手法が述べら
れている。しかしこの手法では、サイン波入力で特性を
測定する場合でも、ビット割当が固定的であるために特
性値がそれほど良い値とならない。In addition, for example, the document "Critical band encoder-
Digital Encoding of Perceptual Requirements of the Auditory System "(The critical band coder --digital encodi
ng of the perceptual requirements of the auditory
system, MAKransner MIT, ICASSP 1980) describes a method of performing fixed bit allocation by using the auditory masking to obtain the required signal-to-noise ratio for each band. However, in this method, even when the characteristic is measured with a sine wave input, the characteristic value is not so good because the bit allocation is fixed.
【0010】これらの問題を解決するために、ビット割
当に使用できる全ビットが、各小ブロック毎にあらかじ
め定められた固定ビット割当パターン分と、各ブロック
の信号の大きさに依存したビット配分を行なう分に分割
使用され、その分割比を入力信号に関係する信号に依存
させ、前記信号のスペクトルが滑らかなほど前記固定ビ
ット割当パターン分への分割比率を大きくする高能率符
号化装置が提案されている。In order to solve these problems, all bits that can be used for bit allocation have a fixed bit allocation pattern predetermined for each small block and a bit allocation depending on the signal size of each block. A high-efficiency coding apparatus has been proposed which is used in a divided manner, and the division ratio depends on a signal related to an input signal, and the smoother the spectrum of the signal, the larger the division ratio into the fixed bit allocation pattern. ing.
【0011】この方法によれば、サイン波入力のよう
に、特定のスペクトルにエネルギーが集中する場合には
そのスペクトルを含むブロックに多くのビットを割り当
てる事により、全体の信号対雑音特性を著しく改善する
ことができる。一般に、急峻なスペクトル成分をもつ信
号に対して人間の聴覚は極めて敏感であるため、このよ
うな方法を用いる事により、信号対雑音特性を改善する
ことは、単に測定上の数値を向上させるばかりでなく、
聴感上、音質を改善するのに有効である。According to this method, when energy is concentrated on a specific spectrum such as a sine wave input, a large number of bits are allocated to a block including the spectrum, thereby significantly improving the overall signal-to-noise characteristic. can do. In general, human hearing is extremely sensitive to a signal having a steep spectrum component. Therefore, improving the signal-to-noise characteristic by using such a method does not only improve the numerical value in measurement. Not
It is effective for improving the sound quality in terms of hearing.
【0012】ビット割り当ての方法にはこの他にも数多
くのやり方が提案されており、さらに聴覚に関するモデ
ルが精緻化され、符号化装置の能力があがれば聴覚的に
みてより高能率な符号化が可能になる。Many other methods have been proposed for the bit allocation method. Further, if the model relating to hearing is further refined and the performance of the coding apparatus is improved, a more efficient coding can be achieved auditorily. It will be possible.
【0013】ところで、波形信号をスペクトルに変換す
る方法として上述のDFTやDCTを使用した場合に
は、M個のサンプルからなる時間ブロックで変換を行う
とM個の独立な実数データが得られる。時間ブロック間
の接続歪みを軽減するために、通常、両隣のブロックと
それぞれM1 個のサンプルずつオーバーラップさせるの
で、平均して、DFTやDCTでは(M−M1 )個のサ
ンプルに対してM個の実数データを量子化して符号化す
ることになる。By the way, when the above-described DFT or DCT is used as a method for converting a waveform signal into a spectrum, M pieces of independent real number data are obtained by performing conversion with a time block consisting of M pieces of samples. In order to reduce the connection distortion between time blocks, normally, since the overlapped by sample blocks and one M each neighboring, on average, in DFT or DCT (M-M 1) with respect to samples M pieces of real number data are quantized and coded.
【0014】これに対してスペクトルに変換する方法と
して上述のMDCTを使用した場合には、両隣の時間と
N個ずつオーバーラップさせた2M個のサンプルから、
独立なM個の実数データが得られるので平均して、MD
CTではM個のサンプルに対してM個の実数データを量
子化して符号化することになる。復号化装置において
は、このようにしてMDCTを用いて得られた符号から
各ブロックにおいて逆変換を施して得られた波形要素を
互いに干渉させながら加え合わせることにより、波形信
号を再構成することができる。On the other hand, when the above-mentioned MDCT is used as a method for converting into a spectrum, from 2M samples which are overlapped by N times on both adjacent times,
Since M independent real number data can be obtained, the average is MD
In CT, M pieces of real number data are quantized and coded for M pieces of samples. In the decoding device, the waveform signal can be reconstructed by adding the waveform elements obtained by performing the inverse transformation in each block from the code obtained by using the MDCT while interfering with each other. it can.
【0015】一般に変換のための時間ブロックを長くす
ることによって、スペクトルの周波数分解能が高まり特
定のスペクトル成分にエネルギーが集中する。したがっ
て、両隣のブロックと半分ずつオーバーラップさせて長
いブロック長で変換を行い、しかも得られたスペクトル
信号の個数が、元の時間サンプルの個数に対して増加し
ないMDCTを使用することにより、DFTやDCTを
使用した場合よりも効率の良い符号化を行うことが可能
となる。また、隣接するブロック同士に十分長いオーバ
ーラップを持たせることによって、波形信号のブロック
間歪みを軽減することもできる。Generally, by lengthening the time block for conversion, the frequency resolution of the spectrum is increased and the energy is concentrated on a specific spectral component. Therefore, DFT and DFT can be performed by using the MDCT in which the number of spectral signals obtained does not increase with respect to the number of original time samples, by performing the conversion with a long block length by overlapping the adjacent blocks by half. It is possible to perform encoding more efficiently than when using DCT. In addition, it is also possible to reduce the inter-block distortion of the waveform signal by allowing adjacent blocks to have a sufficiently long overlap.
【0016】このように、信号をいったん周波数成分に
分解し、その周波数成分を量子化して符号化する方法を
用いると、その周波数成分を復号化して合成して得られ
た波形信号にも量子化雑音が発生するが、もし、元々の
信号成分が急激に変化する場合には、波形信号上の量子
化雑音は必ずしも元の信号波形が大きくない部分でも大
きくなってしまい、この量子化雑音が同時マスキングに
よって隠蔽されないため聴感上の障害になる。音が急激
に大きくなるアタック部でこのようにして発生する量子
化雑音はプリエコーと呼ばれる。As described above, when a method of decomposing a signal into frequency components and quantizing and coding the frequency components is used, a waveform signal obtained by decoding and combining the frequency components is also quantized. Although noise is generated, if the original signal component changes abruptly, the quantization noise on the waveform signal becomes large even in the part where the original signal waveform is not large, and this quantization noise is Since it is not hidden by masking, it becomes a hearing problem. The quantization noise generated in this way at the attack portion where the sound abruptly increases is called a pre-echo.
【0017】特に、スペクトル変換を使用して多数の周
波数成分に分解した場合には、時間分解能が悪くなり、
長い期間にわたってプリエコーが発生してしまう。In particular, when the spectrum conversion is used to decompose into a large number of frequency components, the time resolution becomes poor,
Pre-echo occurs over a long period.
【0018】ここで、帯域分割の際にスペクトル変換を
使用した場合のプリエコーの発生の動作原理について、
図7を参照しながら説明する。Here, the operation principle of generation of pre-echo when spectrum conversion is used at the time of band division is as follows.
This will be described with reference to FIG.
【0019】図7の(A)に示す窓関数あるいはウィン
ドウ関数を用いて、入力波形信号SWに順スペクトル変
換を施したスペクトル信号に量子化雑音QNが加わった
場合に、この量子化雑音が加わったスペクトル信号に逆
スペクトル変換を施して再び時間軸上の波形信号に戻す
と、その量子化雑音は変換ブロック全体に拡がってしま
う。ここで、入力信号波形が(B)のように変換ブロッ
クの途中で急激に大きくなった場合には、元の信号波形
が小さい区間においては、量子化雑音QNが信号波形S
Wに対して大きくなってしまうため、同時マスキングが
効かず、プリエコーとして聴感上の障害になる。When quantization noise QN is added to a spectrum signal obtained by subjecting the input waveform signal SW to forward spectrum conversion using the window function or window function shown in FIG. 7A, this quantization noise is added. When the spectrum signal is subjected to the inverse spectrum conversion and is returned to the waveform signal on the time axis again, the quantization noise spreads over the entire conversion block. Here, when the input signal waveform suddenly increases in the middle of the conversion block as shown in (B), the quantization noise QN is reduced to the signal waveform S in the section where the original signal waveform is small.
Since it becomes large with respect to W, simultaneous masking does not work, and it becomes an auditory obstacle as a pre-echo.
【0020】ここで、スペクトル変換の変換長を短くす
れば上記の量子化雑音の発生期間も短くなるが、そうす
ると周波数分解能が悪くなり、準定常的な部分における
符号化効率が悪くなってしまう。このような問題を解決
する手段として、信号波形が急激に変化する部分におい
てのみ周波数分解能を犠牲にして変換長を短くする、と
いう方法が提案されている。Here, if the conversion length of the spectrum conversion is shortened, the generation period of the above-mentioned quantization noise is also shortened, but if so, the frequency resolution is deteriorated and the coding efficiency in the quasi-stationary part is deteriorated. As a means for solving such a problem, a method has been proposed in which the conversion length is shortened at the expense of the frequency resolution only in the portion where the signal waveform changes abruptly.
【0021】図8はこのようなプリエコーによる聴感上
の障害を軽減するために考案された従来技術の一例につ
いて説明するための図である。一般に、準定常的な信号
波形に対しては、変換ブロック長を長くした方が特定の
スペクトル係数に対してエネルギーが集中するので符号
化効率は高くなるが、音の大きさが急激に変化する部分
では変換ブロック長が長いと上述のプリエコーが問題に
なる。FIG. 8 is a view for explaining an example of a conventional technique devised to reduce the hearing loss caused by such pre-echo. In general, for a quasi-stationary signal waveform, a longer transform block length concentrates energy on a specific spectral coefficient, resulting in higher coding efficiency, but the sound volume changes rapidly. In the part, if the conversion block length is long, the above-mentioned pre-echo becomes a problem.
【0022】そこで、音の大きさが急激に変化する部
分、例えば図8の(B)に示すような入力信号波形SW
の振幅が急激に大きくなるところでは、図8の(A)に
示すように、変換ブロック長を短くするような短変換窓
関数あるいは短変換ウィンドウ関数を掛けるようにし、
これによって上記プリエコーの発生期間を十分短くすれ
ば、元の信号によるいわゆる逆向マスキングが効き、聴
感上の障害が無くなる。図8の方法ではこのことを利用
して信号波形の各部分の性質に応じて変換ブロック長を
選択的に切り替えている。Therefore, a portion where the loudness of the sound changes rapidly, for example, the input signal waveform SW as shown in FIG. 8B.
In the place where the amplitude of becomes sharply large, as shown in FIG. 8A, a short conversion window function or a short conversion window function for shortening the conversion block length is applied,
As a result, if the generation period of the pre-echo is sufficiently shortened, so-called reverse masking by the original signal is effective, and the hearing loss is eliminated. In the method of FIG. 8, this is used to selectively switch the conversion block length according to the property of each part of the signal waveform.
【0023】この方法を用いると、準定常部では十分な
周波数分解能が確保されると共に、アタック部における
プリエコーも発生期間が十分に短くなりいわゆる逆向マ
スキングにより隠蔽されるため、効率の良い符号化が可
能となる。When this method is used, sufficient frequency resolution is ensured in the quasi-stationary portion, and the pre-echo in the attack portion has a sufficiently short generation period and is concealed by so-called reverse masking, so that efficient coding is performed. It will be possible.
【0024】しかし、このように変換長を可変にする方
法では、異なる長さの変換に対応した変換手段を符号化
装置、符号化装置に設ける必要がある。さらにこの方法
では、変換によって得られるスペクトル成分の数は変換
長の長さに比例するため、各スペクトル成分が対応する
周波数帯域も変換長によって異なり、複数のスペクトル
を、例えば臨界帯域幅毎にまとめて符号化しようとした
場合に、各臨界帯域に含まれるスペクトルの数も異なっ
てしまい、符号化、復号化の処理が煩雑になってしま
う。このように、変換長を可変にするやり方では、符号
化装置、復号化装置とも複雑なものになってしまう、と
いう欠点がある。However, in the method of making the conversion length variable as described above, it is necessary to provide the encoding device and the encoding device with the conversion means corresponding to the conversion of different lengths. Furthermore, in this method, since the number of spectral components obtained by the conversion is proportional to the length of the conversion length, the frequency band corresponding to each spectral component also differs depending on the conversion length, and a plurality of spectra are collected, for example, for each critical bandwidth. However, the number of spectra included in each critical band also differs, and the encoding and decoding processes become complicated. As described above, the method of making the conversion length variable has a drawback that both the encoding device and the decoding device are complicated.
【0025】ところで、変換ブロック長を一定にしたま
まで上記プリエコーの問題を解決するための方法とし
て、特開平3−132228号公報には、入力された波
形信号に対して適応ゲイン制御を行った後、DFTやD
CTを用いてスペクトル信号に変換して符号化を行う方
法が述べられている。ここでゲイン制御とは、パワーレ
ベルの小さいところではそのゲインを大きく(振幅を増
幅)することである。By the way, as a method for solving the above-mentioned problem of pre-echo while keeping the conversion block length constant, Japanese Patent Laid-Open No. 132322/1993 performs adaptive gain control on an input waveform signal. After that, DFT and D
A method of converting a spectrum signal into a spectrum signal by using CT and performing encoding is described. Here, the gain control is to increase the gain (amplify the amplitude) at a low power level.
【0026】この方法においては、符号化装置はスペク
トル信号への変換を行う前に、アタック部ではゲインを
急激に下げたゲイン制御を行い、アタック部以外では減
衰に応じてそのゲインを再び上げて行くようゲイン制御
を行っており、復号化装置は、逆スペクトル変換して得
られた信号波形に対してゲイン制御を補正する逆ゲイン
制御を施した信号を出力する。このようにすると、マス
キング・レベルが低くなる小振幅の信号部分における量
子化雑音が抑圧される。また、変換長を常に一定にする
ことができるため、符号化装置、復号化装置の構成を簡
単にすることができる。In this method, the encoding device performs gain control in which the gain is drastically reduced in the attack portion before conversion into a spectrum signal, and the gain is increased again in the portions other than the attack portion according to the attenuation. The gain control is carried out so that the decoding device outputs the signal obtained by performing the inverse gain control for correcting the gain control on the signal waveform obtained by the inverse spectrum conversion. In this way, the quantization noise in the small amplitude signal portion where the masking level becomes low is suppressed. Moreover, since the conversion length can be made constant at all times, the configurations of the encoding device and the decoding device can be simplified.
【0027】しかしながら、 この方法では信号の減衰
時にもゲイン制御を行う必要がある。一般にゲイン制御
を行うことは元の信号波形を歪ませることになるので、
スペクトルに変換した場合にエネルギーの分布が分散さ
れ、効率的な符号化を行うことが困難になる。特に信号
の減衰時には、前の音が後に発生した発生した音をマス
クする順向マスキングが有効に作用するため、量子化雑
音の発生を時間的に制御するよりも雑音レベルそのもの
を下げることが重要である。また、常にゲイン制御の処
理を行うことは、演算処理量の面から見ても好ましくな
い。However, with this method, it is necessary to perform gain control even when the signal is attenuated. In general, performing gain control distorts the original signal waveform, so
When converted to a spectrum, the energy distribution is dispersed, making it difficult to perform efficient coding. Especially when the signal is attenuated, the forward masking that masks the sound generated after the previous sound works effectively, so it is important to lower the noise level itself rather than temporally controlling the generation of quantization noise. Is. Further, it is not preferable to always perform the gain control process from the viewpoint of the amount of calculation processing.
【0028】変換ブロック長を一定にしたままでプリエ
コーを防止する他の方法として、例えば特開昭61−2
01526号公報や特開昭63−7023号公報に示す
ような技術が知られている。これらの公報には、符号化
装置において、入力信号波形を時間ブロック毎に切り出
してウィンドウを掛けた後、アタック部を検出し、アタ
ック部直前の小振幅の波形を増幅してからDFTやDC
Tを用いてスペクトル信号に変換して符号化し、復号化
装置においては、復元されたスペクトル信号に逆DFT
(Inverse DFT:IDFT)や逆DCT(Inverse D
CT:IDCT)等の逆変換を施してから符号化装置で
アタック部直前の信号を増幅したことを補正する処理を
施すことにより、プリエコーを防止する方法が提案され
ている。この場合も、変換長を常に一定にでき、符号化
装置、復号化装置の構成を簡単にすることができる。Another method for preventing pre-echo while keeping the conversion block length constant is, for example, Japanese Patent Laid-Open No. 61-2.
Techniques such as those disclosed in JP-A-01526 and JP-A-63-7023 are known. In these publications, in an encoding device, an input signal waveform is cut out for each time block, a window is applied, an attack portion is detected, and a small amplitude waveform immediately before the attack portion is amplified, and then DFT or DC is applied.
A spectrum signal is converted into a spectrum signal by using T and encoded, and in the decoding device, an inverse DFT is applied to the restored spectrum signal.
(Inverse DFT: IDFT) and inverse DCT (Inverse DFT)
There has been proposed a method for preventing pre-echo by performing an inverse transformation such as CT: IDCT) and then performing a process of correcting that the signal immediately before the attack portion is amplified by the encoding device. Also in this case, the conversion length can be made constant and the configurations of the encoding device and the decoding device can be simplified.
【0029】ここで図9は、上記特開昭61−2015
26号公報や特開昭63−7023号公報において示さ
れているウィンドウ化処理技術を用いた符号化復号化に
ついての動作原理を説明したものであり、図10及び図
11は、この技術を用いた符号化装置及び復号化装置の
処理の流れを示したものである。FIG. 9 shows the above-mentioned Japanese Patent Laid-Open No. 61-2015.
No. 26 and Japanese Patent Laid-Open No. 63-7023 describe the principle of operation for encoding / decoding using the windowing processing technique. FIGS. 10 and 11 use this technique. 9 shows a processing flow of the encoding device and the decoding device.
【0030】図10の入力端子400には、例えば図9
の(A)に示すような信号波形が入力されており、ウィ
ンドウ回路401においては、時間的に順次連続しかつ
相互に重畳する時間窓を設定し時間波形信号を切り出す
ように、図9の(B)に示すウィンドウ関数(上記特開
昭61−201526号公報で言う特性カーブ)が掛け
合わされる。アタック部検出回路402は、入力信号の
振幅が急激に大きくなる箇所(アタック部)を検出す
る。ゲイン制御回路403においては、もしアタック部
が検出された場合には微小振幅部分を増幅するように処
理を行い、またアタック部が検出されなかった場合には
増幅処理を行わない。ゲイン制御回路403からの出力
は、順スペクトル変換回路404に送られてDFT、D
CT等によりスペクトル信号に変換される。こうして得
られたスペクトル信号は、正規化・量子化回路405に
て正規化および量子化された後、符号化回路406によ
って符号化され、出力端子407より符号列として取り
出される。The input terminal 400 shown in FIG.
(A) of FIG. 9 is input, and in the window circuit 401, the time waveform signal is cut out by setting a time window that is sequentially continuous in time and overlaps with each other. The window function shown in B) (the characteristic curve referred to in Japanese Patent Laid-Open No. 61-201526) is multiplied. The attack portion detection circuit 402 detects a portion (attack portion) where the amplitude of the input signal suddenly increases. In the gain control circuit 403, if an attack portion is detected, processing is performed so as to amplify the minute amplitude portion, and if no attack portion is detected, amplification processing is not performed. The output from the gain control circuit 403 is sent to the forward spectrum conversion circuit 404 and DFT, D
It is converted into a spectrum signal by CT or the like. The spectrum signal thus obtained is normalized and quantized by the normalization / quantization circuit 405, coded by the coding circuit 406, and taken out from the output terminal 407 as a code string.
【0031】また、図11に示す復号化装置において
は、入力端子410に供給された符号列信号に対して、
復号化回路411にて上記符号化回路406での符号化
の逆の復号化が施され、逆正規化・逆量子化回路412
に送られる。逆正規化・逆量子化回路412からの出力
は、逆スペクトル変換回路413でIDFTやIDCT
等により時間領域への逆変換が行われた後に、ゲイン制
御補正回路414に送られて、上記符号化装置で施され
たゲイン制御処理を補正する処理が施される。ゲイン制
御補正回路414からの出力は、隣接ブロック合成回路
415に送られて隣接ブロックとの合成がなされ、出力
端子416を介して取り出される。Further, in the decoding apparatus shown in FIG. 11, for the code string signal supplied to the input terminal 410,
The decoding circuit 411 performs the inverse decoding of the encoding in the encoding circuit 406, and the inverse normalization / inverse quantization circuit 412.
Sent to. The output from the inverse normalization / inverse quantization circuit 412 is output from the inverse spectrum conversion circuit 413 to IDFT or IDCT.
After being inversely transformed into the time domain by means such as the above, it is sent to the gain control correction circuit 414, and processing for correcting the gain control processing performed by the encoding device is performed. The output from the gain control correction circuit 414 is sent to the adjacent block synthesis circuit 415 to be synthesized with the adjacent block and is taken out via the output terminal 416.
【0032】この方法では、上述のようにウィンドウ関
数が施された後、変形された波形信号に対してアタック
部の検出処理が行われるので、ブロックの両端において
は大振幅の部分も緩和されてしまい、例えば図9に示す
ように、ブロックBL1においては、アタック部が検出
されず、次のブロックBL2においてのみアタック部が
検出されることが生じ得るが、スペクトル変換として上
記DFTやDCTを用いた場合には、順スペクトル変換
を施して得られたスペクトルに対して逆スペクトル変換
を施せば元の時系列ブロックが完全に復元されるため、
復号化装置においてブロック毎にゲイン制御の補正処理
を施せば問題は生じない。In this method, after the window function is applied as described above, the attack portion detection processing is performed on the deformed waveform signal, so that the large amplitude portion is also relaxed at both ends of the block. For example, as shown in FIG. 9, an attack part may not be detected in the block BL1 and an attack part may be detected only in the next block BL2. However, the DFT or DCT is used as the spectrum conversion. In this case, if the inverse spectrum transform is applied to the spectrum obtained by applying the forward spectrum transform, the original time series block is completely restored.
If the decoding device performs a gain control correction process for each block, no problem occurs.
【0033】[0033]
【発明が解決しようとする課題】しかしながら、これら
のゲイン制御を利用する方法の実施例で述べられている
方法においては、アタック部におけるゲイン制御量は固
定的で、アタック部の検出の有無によって所定の値のゲ
イン制御を行うか否かを決定するものであった。プリエ
コーは周波数領域で発生した量子化雑音が時間領域に変
換されたものであるので、符号化の圧縮率が上がり周波
数領域での量子化雑音が大きくなればプリエコーによる
音質劣化は大きくなるが、一方、必要以上のゲイン制御
を行うことは周波数領域でのエネルギー分布を拡散させ
ることになるので効率的な圧縮を行う上で望ましくな
い。したがって、従来のようにアタック部の検出の有無
によって所定の値のゲイン制御を行うか否かを二者択一
的に選択する方法では、特に圧縮率が高い場合には音質
の劣化を防止することが困難であった。However, in the method described in the embodiment of the method utilizing the gain control, the gain control amount in the attack portion is fixed and is determined depending on whether or not the attack portion is detected. It was decided whether or not to perform gain control of the value of. In the pre-echo, the quantization noise generated in the frequency domain is converted into the time domain.Therefore, if the compression rate of coding increases and the quantization noise in the frequency domain increases, the sound quality deterioration due to the pre-echo increases. However, performing the gain control more than necessary spreads the energy distribution in the frequency domain and is not desirable for efficient compression. Therefore, in the conventional method of selectively selecting whether or not to perform the gain control of the predetermined value depending on the presence or absence of the detection of the attack portion, the deterioration of the sound quality is prevented especially when the compression rate is high. Was difficult.
【0034】本発明は、このような実情に鑑みてなされ
たものであり、アタック部の振幅変化の度合に応じたゲ
イン制御を可能とし、より効率的でより音質の高い符号
化、復号化、記録あるいは伝送が行え、構成も簡単で、
効果的にプリエコー防止が行えるような情報符号化方法
及び装置、情報復号化方法及び装置並びに情報記録媒体
及び情報伝送方法の提供を目的とするものである。The present invention has been made in view of the above circumstances, and enables gain control in accordance with the degree of amplitude change of the attack portion, which enables more efficient encoding and decoding with higher sound quality. It can be recorded or transmitted, the configuration is simple,
An object of the present invention is to provide an information encoding method and device, an information decoding method and device, an information recording medium, and an information transmitting method, which can effectively prevent pre-echo.
【0035】[0035]
【課題を解決するための手段】本発明は、上述の課題を
解決するために、アタック部のゲイン制御量を波形信号
のレベル変化に応じて変化させることにより、圧縮率の
高い場合にも効果的にプリエコーを防止するものであ
る。In order to solve the above problems, the present invention is effective even when the compression ratio is high by changing the gain control amount of the attack portion according to the level change of the waveform signal. The purpose is to prevent pre-echo.
【0036】すなわち、本発明に係る情報符号化方法
は、入力信号を周波数成分に分解する周波数成分分解処
理と、上記周波数成分分解処理への入力波形信号のゲイ
ン制御処理と、上記周波数成分分解処理の出力情報およ
び上記ゲイン制御の制御情報の符号化処理とを行い、波
形信号が急激に大きくなる部分でのゲイン制御処理のゲ
イン制御量は複数種類の大きさから選択的に決定するよ
うにしたものである。That is, the information coding method according to the present invention is such that a frequency component decomposition process for decomposing an input signal into frequency components, a gain control process for the input waveform signal to the frequency component decomposition process, and the frequency component decomposition process. The output information and the control information of the gain control described above are encoded, and the gain control amount of the gain control process in the portion where the waveform signal suddenly increases is selectively determined from a plurality of sizes. It is a thing.
【0037】また、本発明に係る情報符号化装置は、入
力信号を周波数成分に分解する周波数成分分解処理手段
と、上記周波数成分分解処理手段への入力波形信号のゲ
イン制御処理を行うゲイン制御処理手段と、上記周波数
成分分解処理手段からの出力情報および上記ゲイン制御
の制御情報の符号化処理を行う符号化手段とを有し、波
形信号が急激に大きくなる部分でのゲイン制御処理のゲ
イン制御量は複数種類の大きさから選択的に決定するよ
うにしたものである。Further, the information coding apparatus according to the present invention comprises a frequency component decomposition processing means for decomposing an input signal into frequency components, and a gain control processing for performing gain control processing of the input waveform signal to the frequency component decomposition processing means. And a coding means for coding the output information from the frequency component decomposition processing means and the control information for the gain control, the gain control of the gain control processing in a portion where the waveform signal suddenly increases. The quantity is selectively determined from a plurality of sizes.
【0038】次に、本発明に係る情報復号化方法は、周
波数成分信号およびゲイン制御補正情報の復号化処理
と、波形信号合成処理と、上記波形信号合成処理の出力
波形信号のゲイン制御補正処理とを行い、波形信号が急
激に大きくなる部分でのゲイン制御補正処理のゲイン制
御補正量は上記ゲイン制御補正情報の内容に基づいて決
定される複数の大きさの中から選択されたものを用いる
ことである。Next, an information decoding method according to the present invention comprises a decoding process of frequency component signals and gain control correction information, a waveform signal combining process, and a gain control correcting process of an output waveform signal of the above waveform signal combining process. And the gain control correction amount of the gain control correction processing in the portion where the waveform signal suddenly increases is selected from a plurality of sizes determined based on the contents of the gain control correction information. That is.
【0039】また、本発明に係る情報復号化装置は、周
波数成分信号およびゲイン制御補正情報を復号化処理す
る復号化手段と、波形信号を合成する波形信号合成処理
手段と、上記波形信号合成処理手段からの出力波形信号
のゲイン制御補正処理を行うゲイン制御補正処理手段と
を有し、波形信号が急激に大きくなる部分でのゲイン制
御補正処理のゲイン制御補正量は上記ゲイン制御補正情
報の内容に基づいて決定される複数の大きさの中から選
択されたものとすることである。Further, the information decoding apparatus according to the present invention comprises a decoding means for decoding the frequency component signal and the gain control correction information, a waveform signal combining processing means for combining the waveform signals, and the above waveform signal combining processing. A gain control correction processing means for performing a gain control correction processing of an output waveform signal from the means, and the gain control correction amount of the gain control correction processing in a portion where the waveform signal suddenly increases is the content of the gain control correction information. It is to be selected from a plurality of sizes determined based on
【0040】さらに、本発明に係る情報記録媒体は、周
波数成分信号情報およびゲイン制御補正情報が記録さ
れ、上記ゲイン制御補正情報はゲイン制御補正量の情報
を含み、波形信号が急激に大きくなる部分でのゲイン制
御補正量は複数種類の中から選択されたものである。Further, the information recording medium according to the present invention has frequency component signal information and gain control correction information recorded therein, and the gain control correction information includes information on the gain control correction amount, and a portion where the waveform signal sharply increases. The gain control correction amount in is selected from a plurality of types.
【0041】またさらに、本発明に係る情報伝送方法
は、周波数成分信号情報およびゲイン制御補正情報が伝
送され、上記ゲイン制御補正情報はゲイン制御補正量の
情報を含み、波形信号が急激に大きくなる部分でのゲイ
ン制御補正量は複数種類の中から選択されたものであ
る。Furthermore, in the information transmission method according to the present invention, the frequency component signal information and the gain control correction information are transmitted, and the gain control correction information includes the information of the gain control correction amount, and the waveform signal rapidly increases. The gain control correction amount in the part is selected from a plurality of types.
【0042】これらの発明において、上記周波数成分分
解処理は、時間軸上の信号を周波数軸上の信号に変換す
るスペクトル変換処理を含むことが挙げられる。また、
上記入力信号又は出力信号は音響信号であることが挙げ
られる。In these inventions, the frequency component decomposition process may include a spectrum conversion process for converting a signal on the time axis into a signal on the frequency axis. Also,
The input signal or the output signal may be an acoustic signal.
【0043】[0043]
【作用】波形信号が急激に大きくなる部分でのゲイン制
御量として、複数種類の大きさから選択的に決定したも
のを用いることにより、アタック部の振幅変化の度合に
応じたゲイン制御が可能となり、より効率的でより音質
の高い符号化、復号化、記録、伝送が可能となる。By using a gain control amount that is selectively determined from a plurality of sizes as the gain control amount in the portion where the waveform signal suddenly increases, it is possible to perform gain control according to the degree of amplitude change in the attack portion. , Which enables more efficient encoding, decoding, recording and transmission with higher sound quality.
【0044】[0044]
【実施例】以下、本発明の好ましい実施例について、図
面を参照にしながら説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT A preferred embodiment of the present invention will be described below with reference to the drawings.
【0045】図1は本発明の情報符号化方法が適用され
る符号化装置の実施例のブロック回路図を示したもので
ある。この図1において、入力端子100を介して符号
化装置に入力されたオーディオ信号は、帯域分割回路1
01によって帯域分割される。この帯域分割回路101
における帯域分割手段としては、前述したQMF等のフ
ィルタによる分割手段を用いても、また、MDCT等の
スペクトル変換によって得られたスペクトルを帯域毎に
グループ化するという手段を用いてもよい。また、一
旦、フィルタによって幾つかの帯域に分割されたものに
対してスペクトル変換を行ない、これによって得られた
スペクトルを帯域毎にグループ化するという手段を用い
てもよい。さらに、この帯域分割による各帯域の幅は均
一であっても、例えば臨界帯域幅に合わせるように不均
一にとっても良い。なお、図1の例では四つの帯域に分
割されているが、もちろんこの数はさらに多くしても、
或いは少なくしてもよい。FIG. 1 is a block circuit diagram of an embodiment of an encoding device to which the information encoding method of the present invention is applied. In FIG. 1, the audio signal input to the encoding device via the input terminal 100 is the band division circuit 1
The band is divided by 01. This band division circuit 101
As the band dividing means in, the dividing means by the filter such as QMF described above may be used, or the means obtained by grouping the spectrum obtained by the spectrum conversion such as MDCT into each band may be used. Alternatively, a means may be used in which spectrum conversion is performed once on a band that has been divided into several bands by the filter, and the spectrum obtained by this is grouped for each band. Further, the width of each band resulting from this band division may be uniform, or may be non-uniform so as to match the critical bandwidth, for example. In addition, in the example of FIG. 1, although it is divided into four bands, of course, if this number is increased,
Alternatively, it may be reduced.
【0046】上記帯域分割回路101によって帯域分割
された信号は、ある時間ブロック毎に各帯域に対応する
正規化回路111,112,113,114によって正
規化が施され、ここでそれぞれ正規化係数と被正規化信
号に分解される。それぞれの被正規化信号は、それぞれ
量子化精度決定回路141の出力である量子化精度情報
に基づいて量子化回路121,122,123、124
によって量子化され、ここで被正規化・量子化信号へと
変換される。なお、図1においては、上記量子化精度決
定回路141からの各量子化回路121,122,12
3,124への量子化精度情報のうち、上記量子化回路
122へ送られる量子化精度情報は端子152を介し、
上記量子化回路123へ送られる量子化精度情報は端子
153を介し、上記量子化回路124へ送られる量子化
精度情報は端子154を介してそれぞれ対応する回路に
送られる。The signal band-divided by the band-dividing circuit 101 is normalized by the normalizing circuits 111, 112, 113, 114 corresponding to each band for each time block, and here, the normalizing coefficient and It is decomposed into a normalized signal. The respective to-be-normalized signals are quantized by the quantization circuits 121, 122, 123, 124 based on the quantization accuracy information output from the quantization accuracy determination circuit 141.
Are quantized by and converted into a normalized / quantized signal. In FIG. 1, the quantization circuits 121, 122, 12 from the quantization accuracy determination circuit 141 are
Among the quantization precision information to 3,124, the quantization precision information sent to the quantization circuit 122 is via the terminal 152,
The quantization precision information sent to the quantization circuit 123 is sent to the corresponding circuit via the terminal 153, and the quantization precision information sent to the quantization circuit 124 is sent to the corresponding circuit via the terminal 154.
【0047】上記量子化回路121,122,123,
124からの各被正規化・量子化信号と、上記正規化回
路111,112,113,114からの各正規化係数
と、上記量子化精度決定回路141からの各量子化精度
情報とは、マルチプレクサ131によって、順次符号列
とされ、この符号列が端子103から出力される。この
符号列は、その後、ディスク状やテープ状あるいは半導
体などの記録媒体に記録され、または伝送系から送信さ
れる。The quantizing circuits 121, 122, 123,
Each of the normalized / quantized signals from 124, the normalization coefficients from the normalization circuits 111, 112, 113, 114, and the quantization precision information from the quantization precision determination circuit 141 is a multiplexer. A code string is sequentially formed by 131, and this code string is output from the terminal 103. This code string is then recorded on a recording medium such as a disc, a tape or a semiconductor, or transmitted from a transmission system.
【0048】ここで、図1の例においては、上記量子化
精度決定回路141は上記帯域分割回路101によって
帯域分割された各信号に基づいて上記量子化精度を計算
しているが、帯域分割前の端子100を介した信号から
計算することも可能であり、また、各正規化回路11
1,112,113,114からの正規化係数に基づい
て計算することも可能である。さらに、当該量子化精度
決定回路141での計算は、マスキング効果等の聴覚現
象に基づいて行なうことができるものであり、上記各量
子化精度情報は上述したようにマルチプレクサ131を
介して出力されて後に復号化装置に送られるものであ
る。このため、復号化装置で使われる聴覚モデルは任意
に設定することができることになる。Here, in the example of FIG. 1, the quantization precision determination circuit 141 calculates the quantization precision based on each signal band-divided by the band division circuit 101, but before the band division. It is also possible to calculate from the signal through the terminal 100 of each normalizing circuit 11
It is also possible to calculate based on the normalization coefficient from 1,112,113,114. Further, the calculation in the quantization precision determination circuit 141 can be performed based on an auditory phenomenon such as a masking effect, and the respective quantization precision information is output via the multiplexer 131 as described above. It is later sent to the decoding device. Therefore, the auditory model used in the decoding device can be arbitrarily set.
【0049】一方、図2は本発明の情報復号化方法が適
用される図1の符号化装置に対応する復号化装置の実施
例のブロック回路図を示したものである。この図2にお
いて、本実施例の復号化装置の端子201に入力された
符号情報(前記符号列)は、デマルチプレクサ202に
送られ、ここで各帯域毎の量子化精度情報と、正規化係
数と、被正規化・量子化信号とに分離復元される。各帯
域毎の量子化精度情報、正規化係数、被正規化・量子化
信号は、それぞれ各帯域に対応する信号成分構成回路2
11,212,213,214に送られ、ここで各帯域
毎に信号成分が構成される。これら各信号成分構成回路
211,212,213,214からの信号成分は、帯
域合成回路221によって合成されてオーディオ信号と
なされて端子251から出力される。On the other hand, FIG. 2 shows a block circuit diagram of an embodiment of a decoding device corresponding to the coding device of FIG. 1 to which the information decoding method of the present invention is applied. In FIG. 2, the code information (the code string) input to the terminal 201 of the decoding apparatus according to the present embodiment is sent to the demultiplexer 202, where the quantization accuracy information for each band and the normalization coefficient are used. And the normalized and quantized signals are separated and restored. The quantization accuracy information for each band, the normalization coefficient, and the signal to be normalized / quantized are the signal component configuration circuits 2 corresponding to the respective bands.
11 to 212, 213 and 214, where signal components are formed for each band. The signal components from the respective signal component configuration circuits 211, 212, 213 and 214 are combined by the band combining circuit 221 into an audio signal and output from the terminal 251.
【0050】次に、図3は、本発明の実施例を適用した
場合のウィンドウ化処理時のゲイン制御動作について説
明するための図である。Next, FIG. 3 is a diagram for explaining the gain control operation during the windowing process when the embodiment of the present invention is applied.
【0051】ここで、前述した従来例において述べられ
ている方法では、アタック直前部を増幅させるゲイン制
御量は固定的である。例えば、特開昭63−7026号
公報においては、各ブロックをサブブロックに分割し、
二つのサブブロック間の振幅変動が所定の限界値(20
dB程度)を超える場合には、振幅が急変する以前の信
号の振幅を符号化手段で増幅し、それを復号化手段で補
正する方法が開示されている。Here, in the method described in the above-mentioned conventional example, the gain control amount for amplifying the part immediately before the attack is fixed. For example, in Japanese Patent Laid-Open No. 63-7026, each block is divided into sub blocks,
Amplitude fluctuation between two sub-blocks has a predetermined limit value (20
In the case where the amplitude exceeds about (dB), a method is disclosed in which the amplitude of the signal before the abrupt change in the amplitude is amplified by the encoding means and is corrected by the decoding means.
【0052】しかしながら、例えば、図3の(A)の信
号波形SW1、SW2は、どちらもアタック部を含むも
のの、その振幅の変化の仕方には大きな違いがある。す
なわち、信号波形SW1においては、アタック部の直前
にもあるレベル以上の波形信号があり、発生したプリエ
コーはこの元々の波形信号によってアタック部以後程で
はないもののある程度マスクされる。これに対して、信
号波形SW2においては、アタック部の直前の波形信号
のレベルは非常に低く、発生したプリエコーはほとんど
マスクされない。However, for example, although the signal waveforms SW1 and SW2 in FIG. 3A both include the attack portion, there is a big difference in the way of changing the amplitude. That is, in the signal waveform SW1, there is a waveform signal of a certain level or more immediately before the attack portion, and the generated pre-echo is masked to some extent by the original waveform signal, although not so much after the attack portion. On the other hand, in the signal waveform SW2, the level of the waveform signal immediately before the attack portion is very low, and the generated pre-echo is hardly masked.
【0053】ここで、このアタック部の検出を、レベル
変化のただ一つの限界値だけで識別し、同一のゲイン制
御・ゲイン制御補正を行おうとした場合、信号波形SW
1に対して最適なように限界値およびゲイン制御量を設
定すると、信号波形SW2に対してはプリエコーが聞こ
えてしまう。また、信号波形SW2に対して最適なよう
に限界値およびゲイン制御量を設定すると、信号波形S
W1に対しては必要以上のゲイン制御を行うことにな
り、周波数領域でエネルギーの拡散を招くため、符号化
効率が落ちてしまうことになる。Here, when the detection of the attack portion is identified by only one limit value of the level change and the same gain control / gain control correction is attempted, the signal waveform SW
If the limit value and the gain control amount are set optimally for 1, the pre-echo will be heard for the signal waveform SW2. Further, if the limit value and the gain control amount are set optimally for the signal waveform SW2, the signal waveform S
Unnecessary gain control is performed on W1, which causes energy diffusion in the frequency domain, resulting in a decrease in coding efficiency.
【0054】そこで本発明の方法では、信号波形のアタ
ック部における振幅変化の度合いに応じてゲイン制御量
を変化させることによってこの問題を解決している。Therefore, in the method of the present invention, this problem is solved by changing the gain control amount according to the degree of amplitude change in the attack portion of the signal waveform.
【0055】すなわち、本発明の方法では、図3の
(A)に示すように、信号波形SW1に対しては、図3
の(B)に示すゲイン制御量が比較的小さいゲイン制御
関数G1を適用してゲイン制御、ゲイン制御補正の処理
を行うのに対して、信号波形SW2に対しては、ゲイン
制御量が比較的大きいゲイン制御関数G2を適用してゲ
イン制御、ゲイン制御補正の処理を行う。That is, according to the method of the present invention, as shown in FIG.
In (B), the gain control function G1 having a relatively small gain control amount is applied to perform the gain control and the gain control correction, while the gain control amount is relatively small for the signal waveform SW2. A large gain control function G2 is applied to perform gain control and gain control correction processing.
【0056】図3の(C)は、このように処理を行った
場合のそれぞれの量子化雑音の発生の仕方を示したもの
である。この図3の(C)に示されているように、信号
波形SW1の量子化雑音のアタック部以前の量子化雑音
は、ゲイン制御補正処理による雑音抑圧作用が比較的小
さいため、信号波形SW2の量子化雑音のアタック部以
前の量子化雑音に比較して大きいが、全体を通しての量
子化雑音のエネルギーは小さくなっている。これに対し
て、信号波形SW2に対する全体を通しての量子化雑音
のエネルギーは比較的大きいが、アタック部以前の量子
化雑音は十分に低く押さえられている。プリエコーは聴
感上の大きな障害となるため、このように全体の雑音エ
ネルギーを低下させることに優先させて抑圧させること
が望ましい。FIG. 3C shows how each quantization noise is generated when the above processing is performed. As shown in (C) of FIG. 3, the quantization noise before the attack portion of the quantization noise of the signal waveform SW1 has a relatively small noise suppression effect by the gain control correction process, and therefore the signal waveform SW2 The quantization noise is larger than the quantization noise before the attack part, but the energy of the quantization noise is small throughout. On the other hand, the energy of the quantization noise throughout the signal waveform SW2 is relatively large, but the quantization noise before the attack portion is kept sufficiently low. Since the pre-echo is a great obstacle to hearing, it is desirable to suppress it by giving priority to reducing the total noise energy.
【0057】次に、図4は、本発明の実施例を実際に信
号の符号化に適用する場合に、アタック部を検出してゲ
イン制御関数を生成させる処理の流れの例を示したもの
である。例えば、この処理を、前記図10の符号化装置
のアタック部検出回路402に相当する処理に組み込む
ことによって、本発明の符号化方法を実現することがで
きる。Next, FIG. 4 shows an example of the flow of processing for detecting an attack part and generating a gain control function when the embodiment of the present invention is actually applied to signal coding. is there. For example, the encoding method of the present invention can be realized by incorporating this processing into the processing corresponding to the attack detection circuit 402 of the encoding apparatus of FIG.
【0058】この図4においては、例えば長さ2Mのブ
ロックをN個のサブブロックに分割し、I番サブブロッ
クにおける最大振幅値P[I] を、I番サブブロックまで
の連続するK個のサブブロックにおける最大振幅値Q
[I] と比較し、それが所定の比率以上になっている場合
にはアタック部が検出されたものとしている。また、最
終的に滑らかな過渡部をもつゲイン制御関数を構成し
て、スペクトルに変換した場合のエネルギーの拡散を防
いでいる。In FIG. 4, for example, a block having a length of 2M is divided into N sub-blocks, and the maximum amplitude value P [I] in the I-th sub-block is divided into K consecutive K-blocks up to the I-th sub-block. Maximum amplitude value Q in sub-block
Compared with [I], if it is equal to or higher than a predetermined ratio, it is considered that an attack portion is detected. Finally, a gain control function having a smooth transition is constructed to prevent energy diffusion when converted into a spectrum.
【0059】すなわち、図4の最初のステップS1にお
いては、1ブロックをN分割したサブブロックの内のI
番サブブロックまでの連続するK個のサブブロック、す
なわちI−K+1番サブブロックからI番サブブロック
までの最大振幅値Q[I] を求め、ステップS2では、I
番サブブロックにおける最大振幅値P[I] を求めてい
る。次のステップS3では、I=0とし、ステップS4
において、上記ゲイン制御量としてのRを、I番までの
K個のサブブロックの最大振幅Q[I] の、その直後のサ
ブブロックの最大振幅P[I+1] に対する比率で求めてい
る。次のステップS5のTは所定の閾値であり、上記R
がTより大きい場合に、アタック部が検出されたものと
して、ステップS9に進んでいる。NOのときにはステ
ップS6に進み、Iをインクリメントして、ステップS
7でIがブロック終端のサブブロック番号Nに達したか
否かを判別し、I=NとなるまでステップS4以降を繰
り返している。ステップS7でYESと判別されたとき
には、ステップS8でL=0、すなわちアタック無しと
し、R=1として、ステップS10に進む。上記ステッ
プS5でYES、すなわちアタックが見つかったときに
は、ステップS9に進んで、L=Iとし、Rには上記ス
テップS4で求められたRの値の整数値を代入する。す
なわち、このブロックにおけるアタック部以前の長さは
サブブロックL個分であると解釈され、この時のRの値
がゲイン制御量を表す。ステップS9の処理を終えて、
ステップS10に進む。That is, in the first step S1 in FIG. 4, I out of the sub-blocks obtained by dividing one block into N parts.
The maximum amplitude value Q [I] from K consecutive sub-blocks up to the # 1 sub-block, that is, from I-K + 1 sub-block to the I-th sub-block, is calculated.
The maximum amplitude value P [I] in the No. subblock is calculated. In the next step S3, I = 0 and step S4
In the above, R as the gain control amount is obtained by the ratio of the maximum amplitude Q [I] of the K sub-blocks up to the number I to the maximum amplitude P [I + 1] of the immediately following sub-block. In the next step S5, T is a predetermined threshold value,
When is larger than T, it is determined that the attack portion is detected, and the process proceeds to step S9. If NO, the process proceeds to step S6, I is incremented, and step S
In step 7, it is determined whether or not I has reached the sub-block number N at the end of the block, and step S4 and subsequent steps are repeated until I = N. When YES is determined in the step S7, L = 0 is set in the step S8, that is, there is no attack, and R = 1 is set, and the process proceeds to the step S10. If YES in step S5, that is, if an attack is found, the process proceeds to step S9, L = I is set, and R is an integer value of the value of R obtained in step S4. That is, the length before the attack part in this block is interpreted as L sub-blocks, and the value of R at this time represents the gain control amount. After finishing the process of step S9,
Go to step S10.
【0060】ステップS10では、アタック位置Lまで
のサブブロックのゲイン制御関数をRとし、残りを1に
すると共に、最終的に滑らかな過渡部を持つように補間
処理を行った後、処理を終了している。すなわち、この
ステップS10において、LとRの値に基づいてゲイン
制御関数g(n) が構成されるが、アタック部直前のサブ
ブロックでは関数値が滑らかに補間する。これは周波数
領域に変換した場合にエネルギー分布の拡散を防ぎ、効
率の良い符号化を可能にするためである。In step S10, the gain control function of the sub-block up to the attack position L is set to R, the rest is set to 1, and finally interpolation processing is performed so as to have a smooth transition part, and then the processing is terminated. is doing. That is, in this step S10, the gain control function g (n) is constructed based on the values of L and R, but the function value is smoothly interpolated in the sub-block immediately before the attack part. This is to prevent diffusion of the energy distribution when converted into the frequency domain and enable efficient coding.
【0061】このように、アタック部のゲイン制御量を
信号のレベルに応じて変化させることにより、圧縮率の
高い場合にも効果的にプリエコーを防止することができ
るという利点がある。As described above, by changing the gain control amount of the attack portion according to the signal level, there is an advantage that the pre-echo can be effectively prevented even when the compression rate is high.
【0062】なお、この例では、ゲイン制御はアタック
部の直前でのみ増幅されるようになされているが、これ
は既に説明したように、特に順向マスキングの効果を利
用したものである。ただしもちろん、減衰時に小振幅部
分で増幅がされるようにゲイン制御をすることも可能で
あり、例えばスペクトル変換のブロック長が極端に長
く、順向マスキング効果が十分期待できないような場合
には、減衰時に小振幅部分で増幅するようにしても良
い。また、検出するアタック部の数は、一つのブロック
に対して必ずしも一つである必要は無い。In this example, the gain control is amplified only immediately before the attack portion, but this is due to the use of the effect of forward masking, as described above. However, of course, it is also possible to perform gain control so that amplification is performed in the small amplitude portion at the time of attenuation. For example, when the block length of the spectrum conversion is extremely long and the forward masking effect cannot be expected sufficiently, Amplification may be performed in the small amplitude portion at the time of attenuation. Further, the number of attack parts to be detected does not necessarily have to be one for one block.
【0063】ゲイン制御関数としてステップ状に急激に
変化するものを使用すると、スペクトルに変換した場合
に、そのエネルギーが拡散してしまい、符号化の効率が
落ちる。そのため制御関数は、アタック部においてもあ
る程度滑らかに変化するような形状を持つことが望まし
い。ただし、その区間は十分に短くなければプリエコー
が聞こえてしまうので、人間の聴覚を考慮して、ゲイン
制御関数は1msec程度の過渡区間を持ち、その区間内で
例えばサイン波形状のように滑らかな変化をさせること
が望ましい。次ブロックの先頭にアタックが生じる場合
に備えて、アタック部の検出範囲を次ブロックの先頭の
サブブロックまで広げておくことによって、ゲイン制御
関数に滑らかな過渡部を持たせながら、上述の逆変換時
に隣接するブロック間で波形要素を干渉させることがで
きるための条件を充足させることが可能である。When a gain control function that changes abruptly in a stepwise manner is used, the energy is diffused when converted into a spectrum, and the coding efficiency decreases. Therefore, it is desirable that the control function has a shape that changes smoothly to some extent even in the attack portion. However, if that section is not sufficiently short, the pre-echo will be heard, so in consideration of human hearing, the gain control function has a transient section of about 1 msec, and within that section, for example, a sine wave shape is smooth. It is desirable to make changes. In case the attack occurs at the beginning of the next block, the detection range of the attack part is expanded to the sub-block at the beginning of the next block so that the gain control function has a smooth transition part and At times, it is possible to satisfy the condition for allowing waveform elements to interfere with each other between adjacent blocks.
【0064】このように、本発明の方法あるいは装置
は、音響波形をディジタル信号に変換したものを処理す
る装置に適用することも可能であるし、また、一旦ファ
イルになっている波形信号をコンピュータ等で処理する
場合に適用することもできる。また、このようにして得
られた符号を記録媒体に記録することも伝送することも
もちろん可能である。また本発明は、つねに一定のビッ
トレートで符号化を行う場合にも、割り当てられるビッ
ト数がブロック毎に異なるように時間的に変化するビッ
トレートで符号化を行う場合にも適用することが可能で
ある。As described above, the method or apparatus of the present invention can be applied to an apparatus for processing an audio waveform converted into a digital signal, and the waveform signal once filed can be processed by a computer. It can also be applied when processing by etc. Further, it is of course possible to record or transmit the code thus obtained on a recording medium. Further, the present invention can be applied to the case where the encoding is always performed at a constant bit rate, and the case where the encoding is performed at a bit rate that temporally changes so that the number of allocated bits differs for each block. Is.
【0065】以上の説明においては、符号化装置におい
てディジタル化された波形信号を直接スペクトル変換を
使ってスペクトル信号に変換する場合について述べた
が、もちろん、一旦帯域分割フィルタを使用して分割さ
れた帯域毎にスペクトル変換を使ってスペクトル信号に
変換する場合についても本発明の方法を適用することが
できる。In the above description, the case where the waveform signal digitized in the encoding device is converted into the spectrum signal by using the direct spectrum conversion has been described, but of course, it is once divided by using the band division filter. The method of the present invention can also be applied to the case where spectrum conversion is performed for each band using spectrum conversion.
【0066】次に、図5は、本発明の方法で符号化され
た情報を記録媒体に記録するときの記録フォーマットあ
るいは伝送するときの伝送フォーマットの例について示
したものである。Next, FIG. 5 shows an example of a recording format when recording information encoded by the method of the present invention on a recording medium or a transmission format when transmitting.
【0067】この図5に示す例において、各ブロックの
符号は、各ブロックの符号は、アタック部検出フラグと
スペクトル信号符号、及びアタック部検出フラグの内容
によっては、それらに加えて、アタック部位置情報とゲ
イン制御情報から成るゲイン制御補正関数生成情報とに
より構成されている。アタック位置情報としては、例え
ば、図4のLの値を記録すればよく、ゲイン制御量情報
としては、例えば図4のRの値を記録すればよい。実際
の音楽信号においてプリエコーが問題となるアタック部
の存在するブロックの割合は低いので、このようにアタ
ック位置情報とゲイン制御量情報は実際にアタック部の
存在するブロックだけに記録しておくと効率が良い。た
だし勿論、全てのブロックにおいてゲイン制御補正関数
生成情報を記録するようにしてもよく、この場合、実際
にアタック部の存在しないブロックにおいては、例え
ば、L=0、R=1として記録しておけばよい。In the example shown in FIG. 5, the code of each block is the attack part detection flag, the spectrum signal code, and the attack part position in addition to those depending on the contents of the attack part detection flag. It is constituted by information and gain control correction function generation information including gain control information. For example, the value of L in FIG. 4 may be recorded as the attack position information, and the value of R in FIG. 4 may be recorded as the gain control amount information. In the actual music signal, the proportion of blocks where the attack part where pre-echo is a problem exists is low, so it is efficient to record the attack position information and gain control amount information only in the block where the attack part actually exists. Is good. However, of course, the gain control correction function generation information may be recorded in all the blocks. In this case, in a block in which no attack portion actually exists, for example, L = 0 and R = 1 may be recorded. Good.
【0068】次に、図6は、上記図5に示される記録情
報から復号化手段がゲイン制御補正関数h(n) を生成す
る処理例を示したものである。Next, FIG. 6 shows an example of processing in which the decoding means generates the gain control correction function h (n) from the recording information shown in FIG.
【0069】例えば、この図6に示す処理を、前記図1
1の復号化装置のゲイン制御補正回路414に相当する
処理に組み込み、生成されたゲイン制御補正関数h(n)
を逆スペクトル変換回路413によって構成された波形
信号要素に乗じることによって、本発明による復号化方
法を実現することができる。もちろん、アタック部が検
出されていないブロックにおいては、実際にh(n) を乗
じる処理を省略するようにしても良い。For example, the process shown in FIG.
The gain control correction function h (n) generated by being incorporated into the process corresponding to the gain control correction circuit 414 of the first decoding device.
The decoding method according to the present invention can be realized by multiplying by the waveform signal element formed by the inverse spectrum conversion circuit 413. Of course, in the block in which the attack part is not detected, the process of actually multiplying by h (n) may be omitted.
【0070】この図6の例においては、ステップS21
で上記アタック検出フラグを検出し、フラグが0のと
き、すなわちアタックが検出されていないときには、ス
テップS22に進んで、ゲイン制御補正関数h(n) を1
にし、終了する。フラグが1のとき、すなわちアタック
が検出されているときには、ステップS23に進み、こ
のブロックの先頭からサブブロックL個分のゲイン制御
関数g(n) をRとし、上記補間処理を行って最終的なゲ
イン制御関数g(n) を求める。次のステップS24で
は、このゲイン制御関数g(n) の逆数1/g(n) を計算
してゲイン制御補正関数h(n) を求めている。In the example of FIG. 6, step S21
When the attack detection flag is detected in step S1, and the flag is 0, that is, when no attack is detected, the process proceeds to step S22, and the gain control correction function h (n) is set to 1
And finish. If the flag is 1, that is, if an attack is detected, the process proceeds to step S23, where L gain control functions g (n) for L sub blocks from the head of this block are set to R, and the above interpolation process is performed to finally obtain A new gain control function g (n). In the next step S24, the reciprocal 1 / g (n) of the gain control function g (n) is calculated to obtain the gain control correction function h (n).
【0071】なお、本発明の方法は、例えば前述した特
開平3−132228号公報に記載されている方法等に
適用することも勿論可能である。The method of the present invention can of course be applied to, for example, the method described in the above-mentioned JP-A-3-132228.
【0072】また、波形信号を直接スペクトル変換によ
って周波数成分に分解する場合だけでなく、例えば、一
旦、帯域分割フィルタによって帯域分割された波形信号
をスペクトル変換によって周波数成分分解する場合に
も、もちろん本発明の方法を適用することができる。さ
らに、フィルタによって波形信号を周波数成分に分解す
る場合にも適用することができる。本発明でいう周波数
成分とはこれらの処理によって得られるものをすべて含
むものであるが、プリエコーが特に大きな問題となるス
ペクトル変換を含む処理で得られる周波数成分に関連し
て適用される場合に、本発明の方法は特にその効果が大
きい。Further, not only when the waveform signal is decomposed into frequency components by direct spectrum conversion, but also when the waveform signal once band-divided by the band division filter is decomposed into frequency components by spectrum conversion, of course, The method of the invention can be applied. Further, it can be applied to the case where a waveform signal is decomposed into frequency components by a filter. The frequency component referred to in the present invention includes all those obtained by these processes, but when the pre-echo is applied in relation to the frequency component obtained by the process including the spectrum conversion which is a particularly serious problem, the present invention The method is particularly effective.
【0073】さらに、本発明の方法は、音響波形をディ
ジタル信号に変換したものを処理する装置に適用するこ
とも可能であるし、また、一旦ファイルになっている波
形信号をコンピュータ等で処理する場合に適用すること
もできる。また、このようにして得られた符号を記録媒
体に記録することも伝送することももちろん可能であ
る。また本発明の方法は、つねに一定のビットレートで
符号化を行う場合にも、割り当てられるビット数がブロ
ック毎に異なるように時間的に変化するビットレートで
符号化を行う場合にも適用することが可能である。Furthermore, the method of the present invention can be applied to an apparatus for processing an audio waveform converted into a digital signal, and the waveform signal once filed is processed by a computer or the like. It can also be applied in some cases. Further, it is of course possible to record or transmit the code thus obtained on a recording medium. Further, the method of the present invention can be applied to the case where the encoding is always performed at a constant bit rate, and the case where the encoding is performed at a bit rate that temporally changes so that the number of allocated bits differs for each block. Is possible.
【0074】以上、音響波形信号を量子化した場合の量
子化雑音を目立たなくさせる場合に関して説明を行なっ
たが、本発明の方法は他の種類の信号の量子化雑音の発
生を目立たせなくする上でも有効であり、例えば画像信
号にも適用することが可能である。しかし、音響信号に
おけるアタック部分でのプリエコーは聴感上の大きな障
害となるため、本発明を音響信号に適用することは非常
に有効である。また、本発明の方法はもちろん多チャネ
ルの音響信号に対して適用可能である。Although the above description has been made on the case where the quantization noise when the acoustic waveform signal is quantized is made inconspicuous, the method of the present invention makes the generation of the quantization noise of other kinds of signals inconspicuous. The above is also effective, and can be applied to an image signal, for example. However, since the pre-echo in the attack portion of the acoustic signal is a great obstacle to hearing, it is very effective to apply the present invention to the acoustic signal. Further, the method of the present invention can of course be applied to multi-channel acoustic signals.
【0075】[0075]
【発明の効果】以上の説明からも明らかなように、本発
明に係る情報符号化方法は、周波数成分分解処理への入
力波形信号のゲイン制御処理の際に、波形信号が急激に
大きくなる部分でのゲイン制御処理のゲイン制御量は複
数種類の大きさから選択的に決定するようにしたことに
より、アタック部の振幅変化の度合に応じたゲイン制御
が可能となり、より効率的でより音質の高い符号化が可
能となる。As is apparent from the above description, in the information coding method according to the present invention, in the gain control processing of the input waveform signal for the frequency component decomposition processing, the waveform signal becomes a portion where the waveform signal suddenly increases. Since the gain control amount of the gain control process is selectively determined from a plurality of sizes, gain control can be performed according to the degree of amplitude change of the attack part, resulting in more efficient and better sound quality. High coding is possible.
【0076】また、本発明に係る情報復号化方法は、波
形信号合成処理の出力波形信号のゲイン制御補正処理を
行う際に、波形信号が急激に大きくなる部分でのゲイン
制御補正処理のゲイン制御補正量は上記ゲイン制御補正
情報の内容に基づいて決定される複数の大きさの中から
選択されたものを用いることにより、効率的な処理が行
え、品質の高い信号を再生することができる。In the information decoding method according to the present invention, when the gain control correction process of the output waveform signal of the waveform signal synthesis process is performed, the gain control of the gain control correction process in the portion where the waveform signal sharply increases. By using a correction amount selected from a plurality of sizes determined based on the content of the gain control correction information, efficient processing can be performed and a high quality signal can be reproduced.
【0077】これらの効果は、情報符号化装置、情報復
号化装置においても同様にいえることである。These effects can be similarly applied to the information coding apparatus and the information decoding apparatus.
【0078】これを音響信号あるいはオーディオ信号に
適用することにより、効率的な処理と共に、プリエコー
の発生を防止することができる。By applying this to an acoustic signal or an audio signal, it is possible to prevent the occurrence of pre-echo as well as the efficient processing.
【0079】さらに、このような符号化方法あるいは装
置で符号化された信号を記録媒体に記録しあるいは伝送
することで、効率のよい記録あるいは伝送が可能であ
る。Further, by recording or transmitting the signal encoded by such an encoding method or device in a recording medium, efficient recording or transmission is possible.
【図1】本発明の実施例が適用される符号化装置の概略
構成を示すブロック回路図である。FIG. 1 is a block circuit diagram showing a schematic configuration of an encoding device to which an embodiment of the present invention is applied.
【図2】本発明の実施例が適用される復号化装置の概略
構成を示すブロック回路図である。FIG. 2 is a block circuit diagram showing a schematic configuration of a decoding device to which an embodiment of the present invention is applied.
【図3】本発明の実施例におけるウィンドウ化処理時の
ゲイン制御の動作を説明するための図である。FIG. 3 is a diagram for explaining the operation of gain control during windowing processing in the embodiment of the present invention.
【図4】本発明の実施例の符号化方法におけるゲイン制
御関数生成の処理手順の一例を概略的に示すフローチャ
ートである。FIG. 4 is a flowchart schematically showing an example of a processing procedure of gain control function generation in the encoding method according to the embodiment of the present invention.
【図5】本発明の実施例の符号化により得られた符号列
の記録状態を示す図である。FIG. 5 is a diagram showing a recording state of a code string obtained by encoding according to the embodiment of the present invention.
【図6】本発明の実施例の復号化方法の処理手順の一部
の例を概略的に示すフローチャートである。FIG. 6 is a flowchart schematically showing an example of part of the processing procedure of the decoding method according to the embodiment of the present invention.
【図7】変換符号化におけるプリエコー発生の動作原理
を説明するための図である。FIG. 7 is a diagram for explaining the operating principle of pre-echo generation in transform coding.
【図8】従来の変換窓長可変による符号化復号化技術の
動作原理を説明するための図である。[Fig. 8] Fig. 8 is a diagram for explaining an operation principle of a conventional encoding / decoding technique by changing a conversion window length.
【図9】従来のウィンドウ化処理技術を用いた符号化復
号化の動作原理を説明するための図である。FIG. 9 is a diagram for explaining an operation principle of encoding / decoding using a conventional windowing processing technique.
【図10】従来のウィンドウ化処理技術による符号化装
置の概略構成を示すブロック図である。[Fig. 10] Fig. 10 is a block diagram illustrating a schematic configuration of an encoding device according to a conventional windowing processing technique.
【図11】従来のウィンドウ化処理技術による復号化装
置の概略構成を示すブロック図である。FIG. 11 is a block diagram showing a schematic configuration of a decoding device according to a conventional windowing processing technique.
101 帯域分割手段 111〜114 正規化回路 121〜124 量子化回路 131 マルチプレクサ 141 量子化精度決定回路 202 デマルチプレクサ 211〜214 信号成分構成回路 221 帯域合成回路 101 band dividing means 111-114 normalization circuit 121-124 quantization circuit 131 multiplexer 141 quantization precision determination circuit 202 demultiplexer 211-214 signal component configuration circuit 221 band synthesis circuit
Claims (12)
成分分解処理と、上記周波数成分分解処理への入力波形
信号のゲイン制御処理と、上記周波数成分分解処理の出
力情報および上記ゲイン制御の制御情報の符号化処理と
を行い、波形信号が急激に大きくなる部分でのゲイン制
御処理のゲイン制御量は複数種類の大きさから選択的に
決定したものであることを特徴とする情報符号化方法。1. A frequency component decomposing process for decomposing an input signal into frequency components, a gain control process of an input waveform signal to the frequency component decomposing process, output information of the frequency component decomposing process, and control information for the gain control. And the gain control amount of the gain control process in a portion where the waveform signal suddenly increases, are selectively determined from a plurality of types of sizes.
信号を周波数軸上の信号に変換するスペクトル変換処理
を含むことを特徴とする請求項1記載の情報符号化方
法。2. The information encoding method according to claim 1, wherein the frequency component decomposition process includes a spectrum conversion process for converting a signal on the time axis into a signal on the frequency axis.
徴とする請求項1又は2記載の情報符号化方法。3. The information encoding method according to claim 1, wherein the input signal is an acoustic signal.
成分分解処理手段と、 上記周波数成分分解処理手段への入力波形信号のゲイン
制御処理を行うゲイン制御処理手段と、 上記周波数成分分解処理手段からの出力情報および上記
ゲイン制御の制御情報の符号化処理を行う符号化手段と
を有し、 波形信号が急激に大きくなる部分でのゲイン制御処理の
ゲイン制御量は複数種類の大きさから選択的に決定した
ものであることことを特徴とする情報符号化装置。4. A frequency component decomposition processing means for decomposing an input signal into frequency components, a gain control processing means for performing gain control processing of an input waveform signal to the frequency component decomposition processing means, and the frequency component decomposition processing means. Of the output information and the control information of the gain control described above, and the gain control amount of the gain control process in the portion where the waveform signal suddenly increases can be selected from a plurality of sizes. An information encoding device characterized by being determined according to 1.
報の復号化処理と、波形信号合成処理と、上記波形信号
合成処理の出力波形信号のゲイン制御補正処理とを行
い、波形信号が急激に大きくなる部分でのゲイン制御補
正処理のゲイン制御補正量は上記ゲイン制御補正情報の
内容に基づいて決定される複数の大きさの中から選択さ
れたものであることを特徴とする情報復号化方法。5. A waveform signal sharply increases by performing decoding processing of a frequency component signal and gain control correction information, waveform signal synthesis processing, and gain control correction processing of an output waveform signal of the waveform signal synthesis processing. The information decoding method, wherein the gain control correction amount of the gain control correction processing in the part is selected from a plurality of sizes determined based on the content of the gain control correction information.
の信号を時間軸上の信号に変換する逆スペクトル変換処
理を含むことを特徴とする請求項6記載の情報符号化方
法。6. The information encoding method according to claim 6, wherein the frequency component combining process includes an inverse spectrum conversion process for converting a signal on the frequency axis into a signal on the time axis.
徴とする請求項5又は6記載の情報符号化方法。7. The information encoding method according to claim 5, wherein the output signal is an acoustic signal.
報を復号化処理する復号化手段と、 波形信号を合成する波形信号合成処理手段と、 上記波形信号合成処理手段からの出力波形信号のゲイン
制御補正処理を行うゲイン制御補正処理手段とを有し、 波形信号が急激に大きくなる部分でのゲイン制御補正処
理のゲイン制御補正量は上記ゲイン制御補正情報の内容
に基づいて決定される複数の大きさの中から選択された
ものであることを特徴とする情報復号化装置。8. Decoding means for decoding a frequency component signal and gain control correction information, waveform signal synthesis processing means for synthesizing waveform signals, and gain control correction for an output waveform signal from the waveform signal synthesis processing means. A gain control correction processing means for performing processing, and the gain control correction amount of the gain control correction processing in a portion where the waveform signal suddenly increases becomes a plurality of magnitudes determined based on the contents of the gain control correction information. An information decoding device characterized by being selected from among.
正情報が記録され、上記ゲイン制御補正情報はゲイン制
御補正量の情報を含み、波形信号が急激に大きくなる部
分でのゲイン制御補正量は複数種類の中から選択された
ものであることを特徴とする情報記録媒体。9. Frequency component signal information and gain control correction information are recorded, the gain control correction information includes information on a gain control correction amount, and there are a plurality of types of gain control correction amounts in a portion where the waveform signal sharply increases. An information recording medium selected from the above.
を含む処理によって得られたものであることを特徴とす
る請求項9の範囲の情報記録媒体。10. The information recording medium according to claim 9, wherein the frequency component signal is obtained by a process including spectrum conversion.
る請求項9又は10記載の情報記録媒体。11. The information recording medium according to claim 9, wherein the signal is an acoustic signal.
補正情報が伝送され、上記ゲイン制御補正情報はゲイン
制御補正量の情報を含み、波形信号が急激に大きくなる
部分でのゲイン制御補正量は複数種類の中から選択され
たものであることを特徴とする情報伝送方法。12. Frequency component signal information and gain control correction information are transmitted, the gain control correction information includes information on a gain control correction amount, and there are a plurality of types of gain control correction amounts in a portion where the waveform signal sharply increases. An information transmission method characterized by being selected from among.
Priority Applications (8)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US08/532,721 US5731767A (en) | 1994-02-04 | 1994-02-03 | Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method |
| JP03282894A JP3341440B2 (en) | 1994-02-04 | 1994-02-04 | Information encoding method and apparatus, information decoding method and apparatus, and information recording medium |
| CN95190216.4A CN1130833C (en) | 1994-02-04 | 1995-02-03 | Information encoding/decoding method and device, information transmission method |
| EP95907835A EP0693828B1 (en) | 1994-02-04 | 1995-02-03 | Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method |
| AU15897/95A AU1589795A (en) | 1994-02-04 | 1995-02-03 | Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method |
| PCT/JP1995/000146 WO1995021489A1 (en) | 1994-02-04 | 1995-02-03 | Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method |
| CN02120438.1A CN1281006C (en) | 1994-02-04 | 1995-02-03 | Information coding/decoding method and apparatus, information recording medium and information transmission method |
| AU23853/99A AU719817B2 (en) | 1994-02-04 | 1999-04-19 | Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP03282894A JP3341440B2 (en) | 1994-02-04 | 1994-02-04 | Information encoding method and apparatus, information decoding method and apparatus, and information recording medium |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH07221649A true JPH07221649A (en) | 1995-08-18 |
| JP3341440B2 JP3341440B2 (en) | 2002-11-05 |
Family
ID=12369696
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP03282894A Expired - Lifetime JP3341440B2 (en) | 1994-02-04 | 1994-02-04 | Information encoding method and apparatus, information decoding method and apparatus, and information recording medium |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3341440B2 (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003096325A1 (en) * | 2002-05-07 | 2003-11-20 | Sony Corporation | Coding method, coding device, decoding method, and decoding device |
| US6850179B2 (en) | 2001-06-15 | 2005-02-01 | Sony Corporation | Encoding apparatus and encoding method |
| JP2009527773A (en) * | 2006-02-20 | 2009-07-30 | フランス テレコム | Method for trained discrimination and attenuation of echoes of digital signals in decoders and corresponding devices |
-
1994
- 1994-02-04 JP JP03282894A patent/JP3341440B2/en not_active Expired - Lifetime
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6850179B2 (en) | 2001-06-15 | 2005-02-01 | Sony Corporation | Encoding apparatus and encoding method |
| WO2003096325A1 (en) * | 2002-05-07 | 2003-11-20 | Sony Corporation | Coding method, coding device, decoding method, and decoding device |
| US7428489B2 (en) | 2002-05-07 | 2008-09-23 | Sony Corporation | Encoding method and apparatus, and decoding method and apparatus |
| JP2009527773A (en) * | 2006-02-20 | 2009-07-30 | フランス テレコム | Method for trained discrimination and attenuation of echoes of digital signals in decoders and corresponding devices |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3341440B2 (en) | 2002-11-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3186412B2 (en) | Information encoding method, information decoding method, and information transmission method | |
| JP3307138B2 (en) | Signal encoding method and apparatus, and signal decoding method and apparatus | |
| US5825320A (en) | Gain control method for audio encoding device | |
| JP3277692B2 (en) | Information encoding method, information decoding method, and information recording medium | |
| US5731767A (en) | Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method | |
| US7428489B2 (en) | Encoding method and apparatus, and decoding method and apparatus | |
| JP3277682B2 (en) | Information encoding method and apparatus, information decoding method and apparatus, and information recording medium and information transmission method | |
| JPH08223049A (en) | Signal coding method and apparatus, signal decoding method and apparatus, information recording medium, and information transmission method | |
| JPH1084284A (en) | Signal reproducing method and apparatus | |
| US5754127A (en) | Information encoding method and apparatus, and information decoding method and apparatus | |
| JP3557674B2 (en) | High efficiency coding method and apparatus | |
| US20040039568A1 (en) | Coding method, apparatus, decoding method and apparatus | |
| KR970002686B1 (en) | Audio signal transmission method | |
| JP3341440B2 (en) | Information encoding method and apparatus, information decoding method and apparatus, and information recording medium | |
| JP3336619B2 (en) | Signal processing device | |
| US6064698A (en) | Method and apparatus for coding | |
| JP3513178B2 (en) | Information encoding or decoding method and apparatus | |
| JP3413691B2 (en) | Information encoding method and device, information decoding method and device, and information recording medium and information transmission method | |
| JP3263881B2 (en) | Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method | |
| JP3230365B2 (en) | Information encoding method and apparatus, and information decoding method and apparatus | |
| JPH11330974A (en) | Encoding method, decoding method, encoding device, decoding device, digital signal recording method, digital signal recording device, recording medium, digital signal transmission method, and digital signal transmission device | |
| JP3513879B2 (en) | Information encoding method and information decoding method | |
| JP3134383B2 (en) | Method and apparatus for highly efficient encoding of digital data | |
| JPH09160593A (en) | Signal encoding method and apparatus | |
| JPH07106977A (en) | Information decoding device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20020319 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020723 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080823 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090823 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100823 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110823 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120823 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130823 Year of fee payment: 11 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| EXPY | Cancellation because of completion of term |