JP3141853B2 - オーディオ信号処理方法 - Google Patents
オーディオ信号処理方法Info
- Publication number
- JP3141853B2 JP3141853B2 JP10264698A JP26469898A JP3141853B2 JP 3141853 B2 JP3141853 B2 JP 3141853B2 JP 10264698 A JP10264698 A JP 10264698A JP 26469898 A JP26469898 A JP 26469898A JP 3141853 B2 JP3141853 B2 JP 3141853B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- signal
- block
- audio signal
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
いわゆるブロックフローティング処理して圧縮してなる
圧縮符号化信号からオーディオ信号を復元するオーディ
オ信号処理方法に関する。
て、オーディオ信号を圧縮して符号化する高能率符号化
技術には、例えば、入力オーディオ信号(ディジタルオ
ーディオデータ)を所定時間毎(所定時間フレーム毎)
に周波数軸上で複数のブロックに分割し、この各ブロッ
ク毎にいわゆるブロックフローティング処理を施すと共
に、各ブロック毎のデータを適応的なビット割り当てで
量子化するものがある。
は、基本的には、ブロック内の各ワードに共通の値を掛
けて大きくし、量子化時の精度を上げるものであるが、
具体的には、例えばブロック内の各ワードの絶対値の内
で最も大きなもの(最大絶対値)を探し出し、この最大
絶対値が飽和しないような当該ブロック内の全ワードに
対して共通のフローティング係数を用いてフローティン
グ処理を行うものが一例としてある。より簡易なものと
しては、ビットシフトを利用する6dB単位のフローテ
ィングもある。
理を行うオーディオ信号処理方法が適用されるシステム
のエンコーダ側では、通常、ブロックフローティング処
理に関連するパラメータBFとして、例えば、フローテ
ィング係数としてのスケールファクタSFの値と、上記
スケールファクタSFといわゆるマスキング効果を考慮
して各ブロック毎に求められる許容可能なノイズレベル
との差を示すワード長WLのデータとを、量子化された
ブロックのデータ(以下例えばメイン情報とする)と共
に媒体に記録若しくは伝送することが行われる。
覚特性により、ある音により他の音がマスクされて聞こ
えなくなる現象を言う。換言すれば、上記マスキングと
は、ある信号によって他の信号がマスクされて聞こえな
くなる現象をいうものであり、このマスキング効果に
は、時間軸上のオーディオ信号による時間軸マスキング
効果と、周波数軸上の信号による同時刻マスキング効果
とがある。これらのマスキング効果により、マスキング
される部分にノイズがあったとしても、このノイズは聞
こえないことになる。このため、実際のオーディオ信号
では、このマスキングされる範囲内のノイズは許容可能
なノイズとされる。
ィオ信号処理方法が適用されるシステムのエンコーダ側
では、上記記録又は伝送されるパラメータBFの個数は
すべての時間フレームに対して固定しておくものが一般
的である。図9は従来のオーディオ信号処理システムの
エンコーダ側での各時間フレーム内のデータの記録(或
いは伝送)の様子を示したものである。この図9の例の
場合、実際にはビットが割り振られないブロックに対し
てもそのパラメータBFの値を記録又は伝送する必要が
あり、したがって、その分だけ音声データに対して割り
当てられるビット数が少なくなり、特に、圧縮率が高い
場合(ビットレートが低い場合)には、上記エンコーダ
側に対応するデコーダ側(オーディオ信号処理システム
のデコーダ側)で十分な音質を確保することが困難であ
った。
ビットが割り振られないブロック (ワード長WL=0の
ブロック)に対しては上記スケールファクタSFの値を
記録又は伝送せずに、その分だけ音声データに多くのビ
ットを割り振るようにするシステムも提案されている。
この図10においては、ビットが割り当てられていない
ブロック(0ビット割り当てのブロック)4個の分だけ
記録されているスケールファクタSFの個数が減ってい
る。
ータは、常に記録又は伝送する必要がある。また、後の
デコーダ側で上記スケールファクタSFを読み込む時に
そのブロックのワード長WLが0でないかどうかブロッ
ク毎にチェックする必要がある。
キングを求めるための計算等により各ブロックのオーデ
ィオ信号を量子化するために必要なビット数を計算した
後、その時間フレームに割り当てられた総ビット数との
比較を行ない、各ブロックへのビット割り当ての調整を
行なうようになされる。ところが、このとき、上述のよ
うに各ブロックのビット割り当てによってそのブロック
のスケールファクタSFを記録するかどうかが変化する
と、それに伴い、上記メイン情報(音声データ)に割り
当てることのできるビットの総数も変化し、ビット割り
当ての調整が非常に複雑になる。したがって、後のデコ
ーダ側でも復号化のための処理が複雑になってしまう虞
がある。
みて提案されたものであり、エンコーダ側でのビット割
り当ての調整を比較的容易にしてビット割り当ての調整
を行ったとしても、デコード側にて音質を劣化させるこ
となく良好なオーディオ信号を復元することができるオ
ーディオ信号処理方法を提供することを目的とするもの
である。
処理方法は、上述の目的を達成するために提案されたも
のであり、オーディオ信号を所定の時間フレーム毎に周
波数軸上で複数分割した各ブロック毎にブロックフロー
ティング処理を施し当該各ブロック毎のデータを適応的
なビット割り当てで量子化した量子化信号と、ブロック
フローティング処理に関連する各ブロック毎のパラメー
タのうち時間フレーム毎に必要な帯域までのパラメータ
と、当該時間フレーム毎のパラメータの個数情報とを有
してなる符号化信号から、オーディオ信号を復元するオ
ーディオ信号処理方法であり、符号化信号からパラメー
タの個数情報を取り出し、パラメータの個数情報に応じ
て符号化信号からパラメータを取り出し、パラメータに
基づいて符号化信号から量子化信号を取り出し、パラメ
ータの個数情報及びパラメータに基づいて量子化信号か
らオーディオ信号を復元するようにしたものである。
は伝送されるオーディオ信号の帯域として、例えば、実
際に知覚され難い(耳に聞こえ難い)という理由から高
域の記録又は伝送を行わないようにした場合には、その
時間フレームの当該高域のブロックのパラメータ(スケ
ールファクタ,ワード長の値)を記録又は伝送しないよ
うにして、その分のビットを聴感上重要な低域のメイン
情報(ブロックの量子化されたデータ)のために割り振
るようにしている。この場合、記録又は伝送されるデー
タは、この低域のパラメータと当該メイン情報となる。
また、この場合は、時間フレーム毎に記録又は伝送され
るパラメータの個数も記録する(或いは伝送する)よう
にしている。したがって、これらパラメータの個数とパ
ラメータに基づいてメイン情報を復号化すれば、良好な
音質のオーディオ信号を再現できる。
方法によれば、符号化信号には、量子化信号と共に、各
ブロック毎のパラメータのうち時間フレーム毎に必要な
帯域までのパラメータと、当該パラメータの個数が含ま
れるため、この符号化信号に含まれるパラメータ及びパ
ラメータの個数を用いて量子化信号に復号化の処理を施
せば、高品質のオーディオ信号を復元できる。
を参照しながら説明する。
オ信号処理方法は、時系列の入力オーディオ信号TSを
所定の時間フレーム毎に周波数軸の信号(スペクトル信
号SP)に変換し、このスペクトル信号SPを帯域毎の
ブロックに分割し、各ブロック毎にブロックフローティ
ング処理を施し、各ブロック毎のデータを適応的なビッ
ト割り当てで量子化し、当該量子化されたオーディオ信
号を記録又は伝送すると共に、上記ブロックフローティ
ング処理に関連するパラメータBFとしてのフローティ
ング係数(スケールファクタSF)とワード長WLのデ
ータとを記録又は伝送するオーディオ信号処理方法であ
って、図1に示すように、上記ブロックフローティング
処理に関連する各ブロック毎のパラメータBFを上記時
間フレーム毎に当該パラメータBFが必要な帯域まで記
録又は伝送すると共に、当該記録又は伝送されるパラメ
ータBFの個数Nも記録又は伝送するようにしたもので
ある。
つの時間フレーム内の複数の周波数帯域のブロックを示
している。また、図1のメイン情報とは、量子化された
ブロックのデータ(当該オーディオ信号TSを周波数分
割した各ブロック毎のスペクトル信号SPの量子化され
た各ブロックのデータ)である。
うな事実に基づいている。
域では、人間の聴覚特性に基づく後述するいわゆる最小
可聴限が高く、また、低域信号による前記マスキング効
果が有効に作用するため、量子化ノイズがそれ以下の帯
域(例えば10kHz以下)と比較して、大きくなった
としても、音質劣化が耳に知覚されにくい。特に、特に
15kHz以下の帯域の信号成分を例えば削除してしま
っても(0ビット割り当て)、聴感上、差異がわからな
いケースが多い。
すように、上記ブロックフローティング処理に関連する
各ブロック毎のパラメータBFであるフローティング係
数としての上記スケールファクタSF及び量子化の際の
割り当てビット数に対応する上記ワード長WLのデータ
を、上記時間フレーム毎に当該パラメータBFを必要と
する帯域まで(すなわち聴感上重要な低域のみ)として
記録又は伝送するようにしている。これにより、聴感上
重要なため省略できない低域の符号に多くのビットを割
り当てることができるようになって、結果として音質が
向上するようになる。
対レベルがこの最小可聴限以下ならば該雑音は聞こえな
いことになる。この最小可聴限は、コーディングが同じ
であっても例えば再生時の再生ボリュームの違いで異な
るものとなるが、現実的なディジタルシステムでは、例
えば16ビットダイナミックレンジへの音楽のはいり方
にはさほど違いがないので、例えば4kHz付近の最も
耳に聞こえやすい周波数帯域の量子化雑音が聞こえない
とすれば、他の周波数帯域ではこの最小可聴カーブのレ
ベル以下の量子化雑音は聞こえないと考えられる。
タBFの個数は時間フレーム毎に変化するものとなるた
め、本実施の形態では、パラメータBFの個数Nを時間
フレーム毎に記録又は伝送するようにしている。この場
合、当該個数Nのデータ量は少ない。例えば、パラメー
タBFの個数が数十個程度であれば7ビットあれば十分
であり、また、当該時間フレームにおいて取りうる帯域
が2種類(ブロックが2個)ならば、1ビットあれば記
録又は伝送できることになる。
時間フレーム毎に実際に記録又は伝送されるオーディオ
信号の帯域として、例えば、実際に知覚し難い(耳に聞
こえ難い)という理由から高域の記録又は伝送がなされ
ない場合に、その時間フレームの高域のブロックのパラ
メータBF(スケールファクタSF,ワード長WLの
値)分のビットを低域のメイン情報のために割り振るよ
うにして、低域のパラメータBFと当該メイン情報を例
えば媒体に記録する(或いは伝送する)ようにしてい
る。また、その時間フレーム毎のパラメータBFの個数
Nも記録する(或いは伝送する)ようにしている。
の信号のレベルが非常に高いような場合には、高域の信
号を削除すると、それによる音質劣化の差異が知覚され
易くなる。したがってこの場合には、図2に示すよう
に、高域の信号及びパラメータBFも記録するようにし
て符号化する。
のオーディオ信号処理方法が適用されるオーディオ信号
処理システムの具体的構成を示す。
信号(波形データ)をバンド分割フィルタで分割し、こ
れを変更離散コサイン変換(MDCT)処理により周波
数軸の信号に変換したスペクトル信号(スペクトルデー
タ)SPを符号化する構成を示している。
入力端子1に供給される時系列の入力オーディオ信号
(ディジタルオーディオデータ)TSを所定の時間フレ
ーム毎に周波数軸上で複数のブロックに分割し、各ブロ
ック毎にブロックフローティング処理を施すと共に、各
ブロック毎のデータを適応的なビット割り当てで符号化
するものであって、上記ブロックフローティング処理に
関連する各ブロック毎のパラメータ(フローティング係
数としての前記スケールファクタSF及び、前記ビット
割り当て数に対応するワード長WL)BFを上記時間フ
レーム毎に当該パラメータBFを必要とする帯域まで記
録すると共に、当該記録されるパラメータの個数をも記
録するデータ記録回路19を有するものである。このデ
ータ記録回路19に記録されたデータが、後述する本発
明のオーディオ信号処理方法が適用されるデコーダ側の
構成に伝送される。
は、上記時間フレームを複数の周波数帯域に分割した各
ブロックの帯域を可変として、当該帯域が狭くなってい
る場合には、上述の実施の形態のようにして上記データ
記録回路19に記録するパラメータBFの個数を減ら
し、その減らした分のビットをメイン情報に対して(後
述するオーディオ信号TSを周波数分割した各ブロック
毎のスペクトル信号SPの量子化の際に)割り振るよう
にしている。
供給された上記所定の時間フレーム毎の時系列のオーデ
ィオ信号(波形データ)TSは、供給された時系列信号
をスペクトル信号に変換する時間/周波数変換回路11
によりスペクトル信号SPに変換される。当該時間/周
波数変換回路11は、例えば、図1,図2に示したよう
に、時系列の上記オーディオ信号TSを所定の時間フレ
ーム毎に区切ると共に各時間フレームを複数の周波数帯
域に分割してブロック化し、この各ブロックの帯域を可
変としている。
ロックの帯域を可変とする際には、上記ブロック幅とし
て、時間フレームを例えば人間の聴覚特性を考慮した帯
域分割により分割して得た各帯域をブロックとするよう
になされている。すなわち、一般に臨界帯域(クリティ
カルバンド)と呼ばれている高域程帯域幅が広くなるよ
うな帯域幅で、上記スペクトル信号SPを複数の帯域に
分割しており、本具体例では、大別して高域,中域,低
域の3つの帯域に分割している。なお、このクリティカ
ルバンドとは、人間の聴覚特性を考慮して分割された周
波数帯域であり、ある純音の周波数近傍の同じ強さの狭
帯域バンドノイズによって当該純音がマスクされるとき
のそのノイズの持つ帯域のことである。また、上記クリ
ティカルバンドでの分割としては、例えば、0〜20k
Hzの全周波数帯域を例えば25のクリティカルバンド
に分割することも可能である。
クトル信号SPは、スペクトル信号量子化回路15に送
られ量子化される。すなわち、当該スペクトル信号量子
化回路15は、供給された各ブロックのスペクトル信号
SPをブロックフローティング処理により正規化(ノー
マライズ)した後、いわゆるマスキング効果を考慮した
適応的な割り当てビット数で量子化する。
5で上記ブロックフローティング処理を行うためのフロ
ーティング係数(スケールファクタSF)は、スケール
ファクタ計算回路13から供給される。すなわち、上記
スケールファクタ計算回路13には上記スペクトル信号
SPが供給されており、このスケールファクタ計算回路
13から、上記時間フレーム毎の複数の周波数帯域のブ
ロック毎のスペクトル信号SPの例えばピーク或いは平
均値に所定の係数を乗算したフローティング係数(スケ
ールファクタSF)が出力されるようになっている。
で上記適応的な割り当てビット数の量子化を行うため
に、上記スペクトル信号SPはマスキング計算回路17
にも送られている。当該マスキング計算回路17では、
後述するようにして人間の聴覚特性に応じた各ブロック
毎のマスキング情報MSKI及び/又は任意の注目ブロ
ックに近接する他のブロックからのマスキング効果によ
る当該注目ブロックのマスキング情報MSKIが得られ
る。このマスキング計算回路17からのマスキング情報
MSKIは、ビットアロケーシヨン計算回路14に送ら
れ、当該ビットアロケーシヨン計算回路14で上記マス
キング情報MSKIに基づいた各ブロック毎のビット割
り当て情報としてのワード長WLのデータが求められ
る。すなわち、このワード長WLの情報に基づいて上記
スペクトル信号量子化回路15では、供給されたスペク
トル信号SPのブロック毎の適応的な量子化を行ってい
る。
ビットアロケーシヨン計算回路14での処理は具体的に
は以下のようになされている。
送られたスペクトル信号SPは、先ず上記ブロック毎に
エネルギが算出される。このブロック毎のエネルギ算出
の際には例えば上記クリティカルバンド(臨界帯域)毎
のエネルギが、例えば当該バンド内での各振幅値の総和
を計算すること等により求められる。この各バンド毎の
エネルギの代わりに、振幅値のピーク値、平均値等が用
いられることもある。このエネルギ算出により求められ
る各バンドの総和値のスペクトルは、一般にバークスペ
クトルと称されている。
上記バークスペクトルのいわゆるマスキングに於ける影
響を考慮するために、該バークスペクトルに所定の重み
付け関数を掛けて加算するような畳込み(コンボリュー
ション)処理を施す。この畳込み処理を行う構成として
は、例えば、入力データを順次遅延させる複数の遅延素
子と、これら遅延素子からの出力にフィルタ係数(重み
付け関数)を乗算する複数の乗算器(例えば各バンドに
対応する25個の乗算器)と、各乗算器出力の総和をと
る総和加算器とから構成されるものである。
ューション処理を行うことにより、マスキングスレッシ
ョールドが得られる。すなわちこのマスキングスレッシ
ョールドが許容可能なノイズスペクトルとなる。ここ
で、上記マスキングスレッショールドと、前記バークス
ペクトルとの減算を行うことで、当該バークスペクトル
が上記マスキングスレッショールドにより、マスキング
されるレベルが求められる。このマスキングレベルが上
記マスキング情報MSKIとしてビットアロケーシヨン
計算回路14に送られる。
る際には、例えば、人間の聴覚特性である上記最小可聴
限を示すデータと、上記マスキングスレッショールドと
を合成することができる。この最小可聴限においては、
前述したように、雑音絶対レベルがこの最小可聴限以下
ならば該雑音は聞こえないことになる。
は、例えば割当てビット数情報が予め記憶されたROM
等が設けられ、上記マスキング情報MSKIのマスキン
グレベルと各バンドのエネルギとの差分のレベルに応じ
て、当該ROM等から各バンド毎の割当ビット数情報が
求められる。更に、この各バンド毎の割り当てビット数
情報に基づいて、上記大別して高域,中域,低域の各ブ
ロック毎の割り当てビット数に対応するワード長WLの
データを求める。
14では、例えば等ラウドネスカーブの情報に基づい
て、上記マスキング情報MSKIに基づく許容雑音レベ
ルを補正することも可能である。ここで、等ラウドネス
カーブとは、人間の聴覚特性に関する特性曲線であり、
例えば1kHzの純音と同じ大きさに聞こえる各周波数
での音の音圧を求めて曲線で結んだもので、ラウドネス
の等感度曲線とも呼ばれる。なお、この等ラウドネス曲
線は、上記最小可聴限のカーブと略同じ曲線を描くもの
である。したがって、この等ラウドネス曲線において
は、例えば4kHz付近では1kHzのところより音圧
が8〜10dB下がっても1kHzと同じ大きさに聞こ
え、逆に、50kHz付近では1kHzでの音圧よりも
約15dB高くないと同じ大きさに聞こえない。このた
め、上記最小可聴カーブのレベルを越えた雑音(許容ノ
イズレベル)は、該等ラウドネス曲線に応じたカーブで
与えられる周波数特性を持つようにするのが良いことが
わかる。このようなことから、上記等ラウドネス曲線を
考慮して上記許容ノイズレベルを補正することは、人間
の聴覚特性に適合していることがわかる。
上記マスキング計算を行なう事により、上記スペクトル
信号量子化回路15でスペクトル信号SPを量子化して
データ記録回路19に記録する際に、記録すべき最高の
帯域HBがどの帯域となるかをも求めている。すなわ
ち、上記マスキング効果等を考慮することにより、記録
しなくても聴感上の音質に影響の少ない帯域と記録しな
ければ聴感上悪影響が現れる帯域とを分け、この記録す
べき帯域HBの情報を、ブロックフローティング処理の
パラメータBFの個数を計算するパラメータ個数計算回
路18に送っている。
記記録すべき帯域HBの情報に基づいて、各ブロックの
各パラメータBFのうち、当該記録すべき帯域HB以下
の帯域(すなわち記録すべき例えば低域)のパラメータ
BFの個数Nを算出している。或いは、当該記録すべき
帯域HB以上の帯域(すなわち記録しなくても良い例え
ば高域)のパラメータBFの個数を算出するようにして
もよい。
シヨン計算回路14に送られる。したがって、当該ビッ
トアロケーシヨン計算回路14では、前述したようなビ
ット割り当て数の計算処理と共に、上記個数Nの情報に
基づいて記録すべき帯域HB以上の帯域(すなわち記録
しなくても良い例えば高域)に対しては、ビットを割り
振らないようにしている。すなわち、上記ビットアロケ
ーシヨン計算回路14では、上記個数Nが得られれば、
上記メイン情報に割り当てることのできるビットの総数
が求まるので、当該個数Nに応じて余るビット数を上記
記録すべき最高の帯域HBまでの帯域のスペクトル信号
SPに割り振るようにしている。
ータBFの個数Nと、当該N個のパラメータBFと、量
子化されたスペクトル信号QSPとを記録する。
ングされたデータCDTは、出力端子2を介して出力さ
れる。
数変換回路11の具体的構成を示す。
タ等のバンド分割フィルタと、変更離散コサイン変換
(Modified Discrete Cosine Transform;MDCT)と
を組み合わせて、信号を圧縮するようにしている。な
お、上記QMFフィルタは、1976R.E Crochiere, Digit
al coding of speech in subbands, Bell Syst. Tech.
J.Vol.55, No.8 1976 に述べられている。また、ICAS
SP 83, BOSTON, PolyphaseQuadrature filter -A new s
ubband coding technique, Joseph H. Rothweilerに
は、等バンド幅のフィルタ分割手法が述べられている。
また、上記MDCTについては、ICASSP 1987 Subband/
Transform Coding Using Filter Bank DesignsBased on
Time Domain Aliasing Cancellation, J.P.Princen,
A.B.Bradley,Univ. of Surrey Royal Melbourne Inst.
of Tech.に述べられている。なお、上記MDCTの代わ
りに、例えば、高速フーリエ変換(FFT)、離散的コ
サイン変換(DCT)等を行うことで時間軸を周波数軸
に変換することも可能である。
等の入力オーディオ信号TSを、前述したように、人間
の聴覚特性を考慮したいわゆるクリティカルバンドに基
づいて高域程帯域幅が広くなるように周波数分割してい
る。本具体例では、上記臨界帯域を考慮し、大別して高
域,中域,低域の3つの帯域に分割している。なお、こ
の帯域分割としては、クリティカルバンド単位もしくは
高域では臨界帯域(クリティカルバンド)幅を更に細分
化したブロックとしてもよい。
例えば0〜20kHzのオーディオPCM信号である上
記入力オーディオ信号TSが供給されている。この入力
オーディオ信号TSは、例えばいわゆるQMFフィルタ
等の帯域分割フィルタ71により例えば0〜10kHz
帯域と10kHz〜20kHz帯域(高域)とに分割さ
れ、0〜10kHz帯域の信号は同じくいわゆるQMF
フィルタ等の帯域分割フィルタ72により例えば0〜5
kHz帯域(低域)と5kHz〜10kHz帯域(中
域)とに分割される。帯域分割フィルタ71からの高域
(10kHz〜20kHz帯域)の信号は、直交変換回
路の一例であるMDCT回路73に送られ、帯域分割フ
ィルタ72からの中域(5kHz〜10kHz帯域)の
信号はMDCT回路74に送られ、帯域分割フィルタ7
2からの低域(0〜5kHz帯域)の信号はMDCT回
路75に送られることにより、それぞれMDCT処理さ
れる。これらMDCT処理された高域の信号は端子76
を介して出力され、上記中域の信号は端子77を介し
て、上記低域の信号は端子78を介して出力される。
のブロックサイズは具体例には、高域側ほど周波数帯域
を広げると共に時間分解能を高め(ブロック長を短く
し)ている。すなわち、低域側の0〜5kHz帯域の信
号及び中域の5kHz〜10kHz帯域の信号に対して
は1ブロックのサンプル数を例えば256サンプルと
し、高域側の10kHz〜20kHz帯域の信号に対し
ては、1ブロックを上記低域及び中域側のブロックのそ
れぞれ1/2の長さとしてブロック化している。このよ
うにして各帯域の直交変換ブロックサンプル数を同じと
している。また、各々の帯域は、信号の時間的変化が大
きい場合を想定して更に1/2、1/4等の適応的なブ
ロック分割が可能である。
本発明のオーディオ信号処理方法が適用される実施の形
態のデコーダの構成を示す。
1には、上記コーディングされたデータCDTが供給さ
れる。このデータCDTは、当該データCDTから、量
子化スペクトル信号を読み込む(取り出す)量子化スペ
クトル信号読み込み回路54と、ブロックフローティン
グのパラメータBFの上記個数Nを読み込む(取り出
す)パラメータ個数読み込み回路52と、上記ブロック
フローティングのパラメータBFのデータを読み込む
(取り出す)パラメータ読み込み回路53に送られる。
上記量子化スペクトル信号読み込み回路54からの量子
化されたスペクトル信号QSPと、上記パラメータ個数
読み込み回路52からの個数Nのデータと、上記パラメ
ータ読み込み回路53からのパラメータBFすなわちス
ケールファクタSF及びワード長WLのデータとは、ス
ペクトル信号復元回路55に送られる。当該スペクトル
信号復元回路55は、供給された信号を用いて復号化処
理を施す。当該スペクトル信号復元回路55で復号化さ
れたスペクトル信号RSPは、周波数/時間変換回路5
6で時系列のオーディオ信号RTSとされ、出力端子5
7から出力される。
数/時間変換回路56の具体的構成を示す。
クトル信号RSPは、各端子61,62,63に与えら
れ、IMDCT(逆MDCT)回路64,65,66で
周波数軸上の信号が時間軸上の信号に変換される。これ
らの部分帯域の時間軸上の信号は、IQMF(逆QM
F)回路67,78により全帯域信号に復号化され、端
子69より取り出される。
信号処理のフローチャートを示す。
いて、ステップS1では、上記時間/周波数変換回路1
1により入力された時系列オーディオ信号TSがスペク
トル信号(スペクトルデータ)SPに変換される。この
ステップS1の後ステップS2に進み、上記スケールフ
ァクタ計算回路13により上記スケールファクタSFを
求めるための計算が行われる。ステップS3では上記マ
スキング計算回路17により上記マスキング計算処理が
行われ、ステップS4では上記パラメータ個数計算回路
18によりビットを割り当てるべき帯域の確定とブロッ
クフローティング処理のパラメータBFの個数Nの確定
がなされる。ステップS5ではビットアロケーシヨン計
算回路14によりビット割り当ての計算とワード長WL
の計算とが行われる。ステップS6では上記スペクトル
信号量子化回路15によりスペクトル信号(スペクトル
データ)の量子化処理が行われる。最後にステップS7
では、上記データ記録回路19により、上記個数Nのデ
ータの記録と、ブロックフローティング処理のパラメー
タBFの記録(記録すべき帯域のパラメータBFの記
録)と、上記量子化されたスペクトル信号(スペクトル
データ)QSPのデータの記録が行われる。
おける処理のフローチャートを示したものである。
て、先ず、ステップS11では上記パラメータ個数読み
込み回路52により最初にパラメータBFの個数Nを読
み出し、次に、ステップS12では上記パラメータ読み
込み回路53により上記個数Nの数だけのパラメータB
Fのデータを読み出す。続いて、ステップS13では上
記量子化スペクトル信号読み込み回路54により、上記
パラメータBFのうちのワード長WLに応じて、上記量
子化されたスペクトル信号QSPを読み出していく。ま
た、ステップS14では、上記スペクトル信号復元回路
55により、上記スケールファクタSFとワード長WL
に基づいて、上記読み出された量子化されたスペクトル
信号QSPが、元のスペクトル信号SPの近似値(上記
スペクトル信号RSP)として復元される。最後に、ス
テップS15では、周波数/時間変換回路57により、
上記スペクトル信号RSPに上記MDCTとは逆の処理
(逆MDCT)を行うと共に、帯域合成フィルターを通
すことにより、オーディオ信号RTSが復元される。
入力オーディオ信号TSをスペクトル信号SPに変換し
た信号を符号化するシステムについて説明を行なった
が、本発明は、この時系列信号をサブバンドに分割して
符号化を施す(いわゆるサブバンドコーディング)シス
テムにも適用することができる。
処理方法においては、符号化信号からパラメータの個数
情報を取り出し、パラメータの個数情報に応じて符号化
信号からパラメータを取り出し、パラメータに基づいて
符号化信号から量子化信号を取り出し、パラメータの個
数情報及びパラメータに基づいて量子化信号からオーデ
ィオ信号を復元するようにしたことにより、エンコーダ
側でのビット割り当ての調整を比較的容易にしてビット
割り当ての調整を行ったとしても、デコード側にて音質
を劣化させることなく良好なオーディオ信号を復元する
ことができる。
から、例えば高域の信号が記録されない場合にその高域
のパラメータ分のビットを低域のオーディオ信号の量子
化のために割り振ったとしても、デコード時に良好なオ
ーディオ信号を再現できる。また、高域にレベルの高い
信号が含まれる場合にも帯域を狭めることなく、デコー
ド時に良好なオーディオ信号を再現できる。更にこれら
の処理は、簡単な構成により実現することができる。
の信号が記録又は伝送されない場合)を説明するための
図である。
の信号も記録又は伝送される場合)を説明するための図
である。
ある。
成を示すブロック回路図である。
実施の形態のデコーダ側の構成の概略構成を示すブロッ
ク回路図である。
成を示すブロック回路図である。
ラメータの個数が一定のシステムの場合)を説明するた
めの図である。
(スケールファクタの個数が可変のシステムの場合)を
説明するための図である。
時間/周波数変換回路、 13 スケールファクタ計算
回路、 14 ビットアロケーシヨン計算回路、 15
スペクトル信号量子化回路、 17 マスキング計算
回路、 18パラメータ個数計算回路、 19 データ
記録回路
Claims (1)
- 【請求項1】 オーディオ信号を所定の時間フレーム毎
に周波数軸上で複数分割した各ブロック毎にブロックフ
ローティング処理を施し、当該各ブロック毎のデータを
適応的なビット割り当てで量子化した量子化信号と、上
記ブロックフローティング処理に関連する各ブロック毎
のパラメータのうち、上記時間フレーム毎に必要な帯域
までのパラメータと、当該時間フレーム毎のパラメータ
の個数情報とを有してなる符号化信号から、オーディオ
信号を復元するオーディオ信号処理方法であって、 上記符号化信号から上記パラメータの個数情報を取り出
し、 上記パラメータの個数情報に応じて、上記符号化信号か
ら上記パラメータを取り出し、 上記パラメータに基づいて、上記符号化信号から上記量
子化信号を取り出し、 上記パラメータの個数情報及び上記パラメータに基づい
て、上記量子化信号からオーディオ信号を復元すること
を特徴とするオーディオ信号処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10264698A JP3141853B2 (ja) | 1998-09-18 | 1998-09-18 | オーディオ信号処理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10264698A JP3141853B2 (ja) | 1998-09-18 | 1998-09-18 | オーディオ信号処理方法 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP27616891A Division JP3200886B2 (ja) | 1991-09-30 | 1991-09-30 | オーディオ信号処理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11196056A JPH11196056A (ja) | 1999-07-21 |
| JP3141853B2 true JP3141853B2 (ja) | 2001-03-07 |
Family
ID=17406953
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10264698A Expired - Lifetime JP3141853B2 (ja) | 1998-09-18 | 1998-09-18 | オーディオ信号処理方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3141853B2 (ja) |
-
1998
- 1998-09-18 JP JP10264698A patent/JP3141853B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH11196056A (ja) | 1999-07-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| USRE36683E (en) | Apparatus and method for audio data compression and expansion with reduced block floating overhead | |
| JP3131542B2 (ja) | 符号化復号化装置 | |
| US5553193A (en) | Bit allocation method and device for digital audio signals using aural characteristics and signal intensities | |
| US5737718A (en) | Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration | |
| JP3153933B2 (ja) | データ符号化装置及び方法並びにデータ復号化装置及び方法 | |
| JP3336618B2 (ja) | 高能率符号化方法及び高能率符号化信号の復号化方法 | |
| JP3765622B2 (ja) | オーディオ符号化復号化システム | |
| US20040162720A1 (en) | Audio data encoding apparatus and method | |
| KR100512208B1 (ko) | 디지탈신호처리방법,디지탈신호처리장치,디지탈신호기록방법,디지탈신호기록장치,기록매체,디지탈신호전송방법,및디지탈신호전송장치 | |
| JPH08190764A (ja) | ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体 | |
| JPH07160292A (ja) | 多層符号化装置 | |
| WO1995013660A1 (en) | Quantization apparatus, quantization method, high efficiency encoder, high efficiency encoding method, decoder, high efficiency encoder and recording media | |
| US5754127A (en) | Information encoding method and apparatus, and information decoding method and apparatus | |
| JP3557674B2 (ja) | 高能率符号化方法及び装置 | |
| JPH0846517A (ja) | 高能率符号化及び復号化システム | |
| US6064698A (en) | Method and apparatus for coding | |
| JP3141853B2 (ja) | オーディオ信号処理方法 | |
| JP3200886B2 (ja) | オーディオ信号処理方法 | |
| JPH08123488A (ja) | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 | |
| JPH11330974A (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
| JP3291948B2 (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
| JP3141451B2 (ja) | オーディオ信号処理方法 | |
| JP3227948B2 (ja) | 復号化装置 | |
| JP3227945B2 (ja) | 符号化装置 | |
| JP3527758B2 (ja) | 情報記録装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20001121 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071222 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081222 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091222 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091222 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101222 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101222 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111222 Year of fee payment: 11 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111222 Year of fee payment: 11 |