WO2003096545A1

WO2003096545A1 - Procede et dispositif de codage, ainsi que procede et dispositif de decodage

Info

Publication number: WO2003096545A1
Application number: PCT/JP2003/005546
Authority: WO
Inventors: Keisuke Touyama; Shiro Suzuki; Minoru Tsuji
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2002-05-07
Filing date: 2003-04-30
Publication date: 2003-11-20
Anticipated expiration: 2004-11-07
Also published as: KR20040103889A; US20040164882A1; CN100355210C; KR100968057B1; EP1503502A1; JP3900000B2; US6930618B2; CN1524348A; JP2003324355A; EP1503502A4; EP1503502B1

Description

明細書符号化方法及び装置、並びに復号方法及び装置技術分野本発明は、符号化方法及び装置、復号方法及び装置、並びにプログラム及び記録媒体に関し、特に、音響信号や音声信号等のディジタルデータを高能率符号化して伝送し、又は記録媒体に記録する符号化方法及びその装置、符号化データを受信し、又は再生して復号する復号方法及びその装置、並びに符号化処理又は復号処理をコンピュータに実行させるプログラム及びそのようなプログラムが記録されたコンピュータ読み取り可能な記録媒体に関する。

本出願は、日本国において 2 0 0 2年 5月 7日に出願された日本特許出願番号 2 0 0 2 - 1 3 2 1 8 9を基礎として優先権を主張するものであり、この出願は参照することにより、本出願に援用される。景技術従来より、音声等のオーディオ信号を高能率符号化する手法としては、例えば帯域分割符号化（サブバンドコーディング）等に代表される非ブロック化周波数帯域分割方式や、変換符号化等に代表されるプロック化周波数帯域分割方式などが知られている。

非ブロック化周波数帯域分割方式では、時間軸上のオーディオ信号を、ブロック化せずに複数の周波数帯域に分割して符号化を行う。また、ブロック化周波数帯域分割方式では、時間軸上の信号を周波数軸上の信号に変換（スペクトル変換）して複数の周波数帯域に分割して、すなわち、スペクトル変換して得られる係数を所定の周波数帯域毎にまとめて、各帯域毎に符号化を行う。

また、符号化効率をより向上させる手法として、上述の非ブロック化周波数帯域分割方式とプロック化周波数帯域分割方式とを組み合わせた高能率符号化の手法も提案されている。この手法によれば、例えば、帯域分割符号化で帯域分割を行った後、各帯域毎の信号を周波数軸上の信号にスペクトル変換し、このスぺクトル変換された各帯域毎に符号化が行われる。

ここで、周波数帯域分割を行う際には、処理が簡単であり、且つ、折り返し歪みが消去されることから、例えば、 QMF (Quadrature Mirror Filter) が用いられることが多い。なお、 QMFによる周波数帯域分割の詳細については、「19 76R.E.Crochiere, Digital coding of speech in suboands, Bell Syst. Tech. J. Vol.55, No.8 1976」等に記載されている。

また、帯域分割を行う手法としてこの他に、例えば、等バンド幅のフィル夕分割手法である PQF (Polyphase Quadrature Filter) 等がある。この P Q Fの詳細については、 CASSP 83 BOSTON, Polyphase Quadrature filters - A new s ubband coding technique, Joseph H. Rothweilerj 等 ίこ言 3載されて、る。

一方、上述したスペクトル変換としては、例えば、入力オーディオ信号を所定単位時間のフレームでプロヅク化し、ブロック毎に離散フ一リエ変換（Discrete Fourier Transf ormation:DFT) 、離散コサイン変換 (Discrete Cosine Transfo rmation:DCT) 、改良 D C T変換 (Modified Discrete Cosine Transformation:M DCT) 等を行うことで時間軸信号を周波数軸信号に変換するものがある。

なお、 MDCTについては、 CASSP 1987, Subband/Transform Coding Usin g Filter Bank Designs Based on Time Domain Aliasing Cancellation, J.P.Pr incen, A.B.Bradley, Univ. of Surrey Royal Melbourne Inst, of Tech.j 等に、その詳細が記載されている。

このようにフィル夕やスぺクトル変換によって得られる帯域毎の信号を量子化することにより、量子化雑音が発生する帯域を制御することができ、これによりマスキング効果等の性質を利用して聴覚的により高能率な符号化を行うことができる。また、量子化を行う前に各帯域毎の信号成分を、例えばその帯域における信号成分の絶対値の最大値で正規化するようにすれば、さらに高能率な符号化を行うことができる。

帯域分割を行う際の各周波数帯域の幅は、例えば、人間の聴覚特性を考慮して決定される。すなわち一般的には、例えば、臨界帯域（クリティカルバンド）と呼ばれている、高域ほど幅が広くなるような帯域幅で、オーディオ信号を複数 (例えば 3 2バンドなど）の帯域に分割することがある。

また、各帯域毎のデータを符号化する際には、各帯域毎に所定のビット配分、或いは各帯域毎に適応的なビヅト割当（ビットアロケーション）が行われる。すなわち、例えば、 M D C T処理されて得られた係数デ一夕をビットァロケーションによって符号化する際には、プロヅク毎の信号を M D C T処理して得られる各帯域の M D C T係数データに対して、適応的にビヅト数が割り当てられて符号化が行われる。

ビット割当手法としては、例えば、各帯域毎の信号の大きさに基づいてビット割当を行う手法（以下、適宜第 1のビット割当手法という。）や、聴覚マスキングを利用することで各帯域毎に必要な信号対雑音比を得て固定的なビット割当を行う手法（以下、適宜第 2のビット割当手法という。）等が知られている。

なお、第 1のビット割当手法については、例えば、「Adaptive Transform Cod ing of Speech Signals, R. Ze l inski and P .Nol l , IEEE Transactions of Accou sti es, Speech and Signal Processing, vol . ASSP-25 , No . , August 1977」等にその詳細が記載されている。

また、第 2のビヅト割当手法については、例えば、「ICASSP 1980, The cr iti cal band coder digital encoding of the perceptual requirements of the au ditory system, M.A.Kransner MIT」等にその詳細が記載されている。

第 1のビット割当手法によれば、量子化雑音スペクトルが平坦となり、雑音ェネルギが最小となる。しかしながら、聴感覚的にはマスキング効果が利用されていないために、実際の聴感上の雑音感は最適にはならない。また、第 2のビット割当手法では、ある周波数にエネルギが集中する場合、例えば、サイン波等を入力した場合であっても、ビット割当が固定的であるために、特性値がそれほど良い値とはならない。

そこで、ビット割当に使用できる全ビヅトを、各小ブロック毎に予め定められた固定ビット割当パ夕一ン分と、各ブロックの信号の大きさに依存したビヅト配分を行う分とに分割して使用し、その分割比を入力信号に関係する信号に依存させる、すなわち、例えば、その信号のスペクトルが滑らかなほど固定ビット割当パターン分への分割比率を大きくする高能率符号化装置が提案されている。

この方法によれば、サイン波入力のように特定のスぺクトルにエネルギが集中する場合には、そのスぺクトルを含むプロヅクに多くのビヅトが割り当てられ、これにより全体の信号対雑音特性を飛躍的に改善することができる。一般に、急峻なスぺクトル成分を持つ信号に対して人間の聴覚は極めて敏感であるため、上述のようにして信号対雑音特性を改善することは、単に測定上の数値を向上させるばかりでなく、聴感上の音質を改善するのにも有効である。

ビット割当の方法としては、この他にも数多くの方法が提案されており、さらに聴覚に関するモデルが精緻化され、符号化装置の能力が向上すれば、聴覚的な観点からより高能率な符号化が可能となる。

波形信号をスぺクトルに変換する方法として D F Tや D C Tを使用した場合には、 M個のサンプルからなる時間プロヅクで変換を行うと、 M個の独立な実数デ —夕が得られる。しかしながら通常は、時間ブロック（フレーム）間の接続歪みを軽減するために、 1つのプロヅクは両隣のプロヅクとそれそれ所定の数 M 1個のサンプルずつオーバーラップさせて構成されるので、 D F Tや D C Tを利用した符号化方法では、平均して（M— M l ) 個のサンプルに対して M個の実数デー夕を量子化して符号化することになる。

また、時間軸上の信号をスぺクトルに変換する方法として M D C Tを使用した場合には、両隣のプロヅクと M個ずつオーバ一ラヅプさせた 2 M個のサンプルから、独立な M個の実数データが得られる。したがってこの場合には、平均して M 個のサンプルに対して M個の実数データを量子化して符号化することになる。この場合、復号装置においては、上述のようにして M D C Tを用いて得られる符号から、各プロ、ソクにおいて逆変換を施して得られる波形要素を互いに干渉させながら加え合わせることにより、波形信号が再構成される。

一般に、変換のための時間ブロック（フレーム）を長くすることによって、スぺクトルの周波数分解能が高まり、特定のスぺクトル成分にエネルギが集中する。したがって、両隣のプロヅクと半分ずつオーバーラヅプさせて長いプロック長で変換を行い、しかも得られたスぺクトル信号の個数が元の時間サンプルの個数に対して增加しない M D C Tを使用する場合、 D F T D C Tを使用した場合よりも効率のよい符号化を行うことが可能となる。また、隣接するブロック同士に充分長いオーバラップを持たせることによって、波形信号のブロック間歪みを軽減することもできる。

実際の符号列を構成するに際しては、先ず正規化及び量子化が行われる帯域毎に、量子化を行うときの量子化ステップを表す情報である量子化精度情報と各信号成分を正規化するのに用いた係数を表す情報である正規化係数とを所定のビット数で符号化し、次に正規化及び量子化されたスぺクトル信号を符号化する。ここで、例えば、 D0/IEC 11172-3 : 1993(E) , 1993」には、帯域によって量子化精度情報を表すビット数が異なるように設定された高能率符号化方式が記述されており、これによれば、高域の帯域ほど量子化精度情報を表すビット数が小さくなるように規格化されている。

また、スペクトル信号を符号化するに際しては、例えばハフマン符号等の可変長符号を用いる方法が知られている。なお、このハフマン符号については、例えは、 ^rDavia A. Huffman, "A Method for the Construction of Minimum - Redu ndancy Codes" , Proceedings of the I .R.E. , ppl098- 1101， Sep . 1952」等にその詳細が記載されている。

ところで、一般に、単一のハフマン符号表を用いるよりも、複数種類用意して適切なものを切り替えて用いることにより、様々な入力信号に対して最適化した符号列表を使うことができるため、スぺクトル信号の圧縮効率を上げることが可能となる。

しかしながら、どの符号列表を用いたかを示す符号列表インデックスを量子化ュニット毎に符号化する場合、符号列表の数が増えることでィンデツクスの符号化ビット数も増えてしまうといった問題が生じる。

例えば、量子化ュニット数が 1 6の場合、量子化ュニット毎にインデックスを符号化すると、符号列表の数が 4個（ 2ビヅト）の場合はインデックスの符号化ビヅト数は 3 2ビット（= 2 ビヅト X 1 6ユニット）となるが、符号列表の数が 8個（ 3ビット）になるとィンデヅクスの符号化ビヅト数は 4 8ビヅト（= 3ビヅト X 1 6ユニット）に増えてしまう。これにより、トータルのビヅト数が固定の場合には、スペクトル情報を符号化するためのビット数が 1 6 ビット（4 8 ビヅトー 3 2ビヅト）減ってしまうこととなる。ここで、符号列表の数が增ぇることにより圧縮率が 1 6ビット分以上上がれば問題にはならないが、上がらない場合には、却って全体の圧縮率を落としてしまう結果となる。

すなわち、符号列表の数を增やすことによりスぺクトル情報自体の圧縮率は上がるが、符号列表のインデックスの符号化ビヅト数が増えるため、全体の圧縮率が上がるとは一概には言えない。発明の開示本発明は、このような従来の実情に鑑みて提案されたものであり、圧縮率を落とすことなく、様々な入力信号に対して信号の性質に応じた最適な符号列表を選択可能とする符号化方法及びその装置、符号化データを受信し、又は再生して復号する復号方法及びその装置、並びに符号化処理又は復号処理をコンピュー夕に取り可能な記録媒体を提供することを目的とする。

本発明に係る符号化方法及び装置は、上述した目的を達成するために、所定単位毎に 1つの符号列表を用いてディジ夕ル信号を符号化する際に、予め複数のグループに分けられた符号列表群から、上記ディジタル信号の性質に応じて 1つのグループを選択し、当該選択されたグループの上記符号列表群の中から 1つの符号列表を決定し、この決定された上記符号列表を用いて上記ディジタル信号を符号化する。

ここで、 1つの符号列表グループを選択する際には、例えばディジタル信号のトーナリティに応じてグループを選択することができる。

また、本発明に係る符号化方法及び装置は、上述した目的を達成するために、所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する際に、符号列表群に含まれる選択可能な符号列表の数を設定し、上記符号列表群の中から 1つの上記符号列表を選択し、選択された符号列表を用いて上記ディジタル信号を符号化する。

また、本発明に係る復号方法及び装置は、上述した目的を達成するために、所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号する際に、予め複数のグループに分けられた符号列表群から、使用する 1つのグループを選択し、選択されたグループの符号列表の中から使用する 1つの符号列表を決定し、この決定された符号列表を用いて上記ディジ夕ル信号を復号する。

ここで、 1つの符号列表グループを選択する際には、符号化の際に上記ディジ夕ル信号のトーナリティに応じて選択されたグループと同じグループを選択する ₍ また、本発明に係る復号方法及び装置は、上述した目的を達成するために、所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号する際に、符号列表群に含まれる符号列表の数を設定し、上記符号列表群の中から 1つの上記符号列表を選択し、選択された上記符号列表に基づいて上記ディジ夕ル信号を復号する。

また、本発明に係るプログラムは、上述した符号化処理又は復号処理をコンビユー夕に実行させるものであり、本発明に係る記録媒体は、そのようなプログラムが記録されたコンピュータ読み取り可能なものである。

本発明の更に他の目的、本発明によって得られる具体的な利点は、以下に説明される実施例の説明から一層明らかにされるであろう。図面の簡単な説明図 1 A及び図 1 Bは、スペクトルの一例を説明する図であり、図 1 Aは、ト一ン性信号を示し、図 1 Bは、ノイズ性信号を示す。

図 2は、トーン性スぺクトルの符号化例を説明する図である。

図 3は、ノイズ性スぺクトルの符号化例を説明する図である。

図 4は、従来の符号列表のィンデックス及びスぺクトルの符号化ビット数の具体例を説明する図である。

図 5は、本実施の形態における符号列表のインデックス及びスぺクトルの符号化ビト数の具体例を説明する図である。

図 6は、各符号列表の選択確率の割合の一例を説明する図である。

図 7は、符号列表のィンデックスの符号化にハフマン符号化を適用した場合における符号列表のインデックス及びスぺクトルの符号化ビット数の具体例を説明する図である。

図 8は、符号列表の数を 4個とし、符号列表のインデックスの符号化にハフマン符号化を適用した場合における、符号列表のインデックス及びスぺクトルの符号化ビット数の具体例を説明する図である。

図 9は、本実施の形態における符^化装置の概略構成を説明する図である。図 1 0は、本実施の形態における復号装置の概略構成を説明する図である。発明を実施するための最良の形態以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、オーディオ信号等のディジタルデ —夕を高能率符号化して伝送し、又は記録媒体に記録する符号化方法及びその装置、並びに符号化データを受信し、又は再生して復号する復号方法及びその装置に適用したものである。以下では、先ず本発明の原理を説明し、その後この発明が適用される符号化装置及び復号装置の構成例について説明する。

一般に音響信号（オーディオ信号）は、大きくトーン性/ノイズ性の 2パターンの信号に分けることができる。トーン性の信号及びノイズ性の信号のスぺクトルを図 1 A、図 I Bに示す。この図 1 A、図 1 Bからも分かるように、トーン性の信号とノイズ性の信号とでは、周波数変換した信号、すなわちスペクトルの形状が大きく異なるため、量子化係数の値の出現確率も大きく異なる。

例えば、トーン性の信号の場合は、量子化係数（量子化後のスペクトル係数）の値が 0になる確率が高いため、 0に対応する符号に対して 1 ビット等の短い符号長のハフマン符号を割り当てることにより、高い圧縮率を実現することができる。一方、ノイズ性の信号の場合は、量子化スペクトルのどの値も同程度の確率で発生するため、どの値に対しても同程度の符号長のハフマン符号を割り当てることが好ましい。

トーン性信号用及びノィズ性信号用のハフマン符号列表の一例をそれそれ以下の表 1及び表 2に示す。なお、以下の説明において量子化係数の値の範囲は、一 3〜 +3であるとする

表 1

表 2

この表 1、表 2に示す符号列表を用いてトーン性信号スぺクトルを符号化する場合の具体例を図 2に示す。図 2に示すように、量子化係数の値が順に 0 , 0 , 3，一 2， 0， 0， 0， 0であるため、これを表 1に示したトーン性信号用の符号列表を用いて符号化すると、その符号長は、順に 1 , 1， 4 , 4， 1 , 1 , 1 : 1となり、その合計は 14ビットとなる。これに対して、表 2に示したノィズ性信号用の符号列表を用いて符号化すると、その符号長は、順に 2， 2 , 3， 3， 2 , 2 , 2， 2となり、その合計は 1 8ビットとなる。すなわち、トーン性信号スペクトルの場合には、トーン性信号用の符号列表を用いることにより、ノイズ性信号用の符号列表を用いた場合と比較して例えば 4ビット少ないビット数で符号化することが可能となる。

同様に、表 1、表 2に示す符号列表を用いてノイズ性信号スペクトルを符号化する場合の具体例を図 3に示す。図 3に示すように、量子化係数の値が順に 3， 3，一1， 2 , — 3 , — 2， 3， 2であるため、これを表 1に示したトーン性信号用の符号列表を用いて符号化すると、その符号長は順に 4 , 4， 3 , 4 , 4， 4 , 4， 4となり、その合計は 3 1 ビヅトとなる。これに対して、表 2に示したノイズ性信号用の符号列表を用いると、その符号長は順に 3， 3， 3 , 3 , 3 , 3 , 3 , 3となり、その合計は 2 4ビットとなる。すなわち、ノイズ性信号スぺクトルの場合には、ノイズ性信号用の符号列表を用いることにより、トーン性信号用の符号列表を用いた場合と比較して例えば 7ビット少ないビット数で符号化することが可能となる。

このように、 S子化係数を符号化するためのハフマン符号列表も、どのような信号に対しても共通のものを使うのではなく、入力信号の性質、例えばトーン性であるかノィズ性であるかに応じて、それそれ最適化したものを用意して使用することにより、高い圧縮率を実現することができる。

ここで、一般的な音響信号では、帯域毎にトーン性とノイズ性とが細かく入り混じることは少なく、全帯域の信号が揃ってトーン性又はノイズ性となる場合や、低域と高域とでトーン性とノィズ性とが入れ換わる場合が殆どである。

そこで本実施の形態では、以下に説明するように、トーン性信号用符号列表のグループとノィズ性信号用符号列表のグループとを両方用意しておき、入力信号の性質に応じてそれらを切り替えて用いることにより、符号化効率を向上させる。例えば量子化ュニット数が 1 6個の場合を考える。従来法では、符号列表を切り替えないため、符号列表の数が 8個であれば符号列表のィンデックスを符号化するビヅト数は 4 8 ビヅト（3 x 1 6 ) となる。これに対して、トーン性/ノィズ性の符号列表をそれそれ 8個ずつ用意しておき、それを全帯域で切り替える場合は、切替ビット数が 1 ビット、符号列表の符号化ビット数が 4 8ビットの合計 4 9ビットとなる。これは、符号列表を切り替えない場合と比較して 1 ビヅト増えるものの、実質的に符号列表の数が 2倍になったのと等しいため、スペクトル情報の圧縮率が向上し、これにより全体の圧縮率が向上することが期待できる。具体的に、図 4及び図 5を用いて、従来の符号列表を用いる場合と、本実施の形態のように符号列表をトーン性信号用とノィズ性信号用との 2組に分け、その何れか一方のみを選択して用いる場合との符号化ビット数等を比較する。

先ず、従来の符号列表を用いる場合の符号化ビット数等を図 4に示す。この例では、各量子化ュニヅトに対して符列表のィンデヅクスが 0〜 7の 8個（ 3ビット）から選択され、その符号列表を用いて符号化されたスペクトルのビット数が示されている。ここで、各符号列表は 3 ビットで表現され、量子化ユニット数は 1 6個であるため、符号列表のビヅト数の合計は 4 8ビットとなる。また、スぺクトルの符号化ビヅト数は 6 6 3 ビヅトとなる。したがって、これらのビット数の合計は、 7 1 1 ビットとなる。

次に、本実施の形態のように、符号列表をトーン性信号用のグループとノイズ性信号用のグループとの 2組に分け、その何れか一方のみを選択して用いる場合の符号化ビット数等を図 5に示す。なお、符号列表は、トーン性信号用とノイズ性信号用とで 8個ずつ用意されるものとする。符号列表のィンデヅクスは 0〜 7 の 3 ビヅトで表現されるため、その合計は 4 8 ビヅトとなるが、トーン性とノィズ性とで符号列表の組を切り替えるビットが 1 ビット必要であるため、符号列表の符号化ビット数は、それらを合わせて 4 9 ビヅトとなる。また、トーン性信号用の符号列表を用いて符号化する場合のスぺクトルの符号化ビット数は 6 4 0ビットであり、ノイズ性信号用の符号列表を用いて符号化する場合のスぺクトルの符号化ビヅト数は 6 8 2ビットである。したがって、この例の場合には、トーン性信号用符号列表を用いる方が効率よくスぺクトルが圧縮できることになる。ト —ン性信号用符号列表を用いる場合には、これらのビット数の合計は 6 8 9 ビットとなり、図 4の例と比較して 2 2ビット少なくなつていることが分かる。この 2 2ビットをスぺクトルに対して再配分することにより、さらなる音質向上を図ることが可能となる。

なお、図 4の場合と比較して図 5ではスぺクトルビヅト数が小さくなつているが、これは符号列表の数が多いことにより様々な信号に対応することができるようになるため、スぺクトルの圧縮効率が向上したことによる。

ところで、各符号列表が実際に選択される確率は、符号列表の学習の仕方にも依存するが、一般的に一様には分布せず、何らかの偏りがある場合が多い。そこで、その偏りに適応した可変長符号化を用いることにより、符号列表のインデックスをも効率的に符号化することが可能となる。

各符号列表の選択確率の一例を図 6に示す。この図 6からも明らかなように、各符 ¾；-列表の選択確率には偏りがある。この偏りからィンデヅクスの符号化効率が最適になるように作成した可変長符号を以下の表 3に示す。なお、この表 3に示す符号列表は、トーン性信号用に最適化されたものである。表 3

図 5の具体例に対して表 3の可変長符号を適用した例を図 7に示す。図 7から分かるように、符号列表のインデックスに対して可変長符号を適用することにより、符号列表ィンデヅクスのビット数が 4 0ビットとなり、図 5の場合と比較して 8ビット少なくてすむ。この 8ビットをスぺクトルの符号化に再配分することにより、さらなる音質向上の実現が可能となる。

また、例えばハードウェア機器等の場合、エンコーダにかけるリソースが少ないため、実用的なエンコードスピードを実現するために、多少音質を犠牲にせざるを得ない場合がある。このような場合、以下に説明するように、実際に符号化に用いる符号列表の数を少なくすることによりエンコードスピードの高速化を実現することができる。なお、単純に符号列表の数を少なくするのではなく、選択確率の高い符号列表だけを用いることにより、符号化効率の低下を少なく抑えることが可能となる。このような設定は、エンコーダの使用者が行ってもよく、また、エンコーダ側でエンコード用のリソースや処理スピ一ドなどの状態を判断して行ってもよい。

具体的に、符号列表を 4個だけ使う場合を考える。図 6のような選択確率の場合、上位 4個の符号列表で全体の約 8割を占めるため、 8割のスペクトルは、その圧縮効率を落とさずに符号化することが可能となる。

また、符号列表の数が 4個になるため、符号列表のインデックスを符号化する符号化ビット数も 8個の場合と比較して少なくてすむ。符号列表の数が 4個の場合における符号列表インデックス用ハフマン符号列表の一例を以下の表 4に示す表 4

図 7の具体例に対して表 4の可変長符号を適用した例を図 8に示す。符号列表が 4個になることにより、量子化ュニヅト 3， 5 , 6 , 8では、最も少ないビヅト数でスぺクトルを符号化する符号列表を選択できなくなるため、スぺクトルの符号化ビット数が若干増加している。しかし、上述したように、選択確率の高い順に 4個の符号列表を用いており、その 4個は図 6のグラフより約 8割のパターンをカバーするものであるため、このような事態は約 2割の場合でしか発生しない。

また、符号列表の数自体が少なくなつているため、符号列表のインデックスを符号化するビット数も少なくできることが期待できる。図 8の例においても、符号列表ィンデヅクスの符号化ビヅト数は 3 0 ビヅトと、図 7の場合と比較して 1 0ビット少なくなつている。なお、上述の具体例では、符号化に用いる符号列表の数を例えば 8個から 4個にする場合、選択確率の高いものから順に 4個選択するものとして説明したが、これに限定されるものではなく、どの符号列表を選択するかを符号化側と復号側とで予め設定しておくようにしても構わない。

以下、本発明が適用される符号化装置及び復号装置の構成例について説明する。図 9に示すように、本実施の形態における符号化装置 1 0は、スペクトル変換部 1 1 と、符号列 ¾グループ切替判定部 1 2 と、正規化部 1 3と、 B:子化精度決定部 1 4と、量子化部 1 5と、符号列表インデックス符号化部 1 6 と、符号列表数切替判定部 1 Ί と、マルチプレクサ 1 8とにより構成されている。

スぺクトル変換部 1 1は、符号化すべきオーディオ信号 D 1 0を入力し、このオーディオ信号 D 1 0に対して M D C T (Modif ied D iscrete Cos ine Transform ation) 等のスペクトル変換を行い、時間軸上の信号を周波数軸上のスペクトル信号 D 1 1に変換する。そしてスぺクトル変換部 1 1は、このスぺクトル信号 D 1 1を所定の時間ブロック（フレーム）毎に符号列表グループ切替判定部 1 2、正規化部 1 3及び量子化精度決定部 1 4に供給する。

符号列表グループ切替判定部 1 2は、スぺクトル変換部 1 1から供給されたスベクトル信号 D 1 1の性質、例えばトーナリティに応じて、複数ある符号列表グループの中から 1つのグループを選択するとともに、そのグループを示すグループインデックス D 1 2を量子化部 1 5及びマルチプレクサ 1 8に供給する。

例えば、上述のように符号列表をトーン性信号用とノィズ性信号用との 2つのグループに分ける場合、符号列表グループ切替判定部 1 2は、スペクトル信号 D 1 1のトーナリティを調べ、そのトーナリティが所定の閾値よりも大きければト —ン性信号用符号列表を選択し、閾値よりも小さければノイズ性信号用符号列表を選択する。そして符号列表グループ切替判定部 1 2は、選択したグループを示すグループインデックス D 1 2を、例えば 1チャンネル毎に 1 ビヅトの情報として量子化部 1 5及びマルチプレクサ 1 8に供給する。なお、幾つかに分割した周波数帯域毎に独立にトーン性/ノイズ性の判定を行い、各帯域毎に 1 ビットの情報をグループィンデヅクス D 1 2 として送るようにしても構わない。

正規化部 1 3は、スぺクトル信号 D 1 1 を構成する各信号成分から絶対値が最犬のものを抽出し、この値に対応する係数を正規化係数とする。そして、正規化部 1 3は、スぺクトル信号 D 1 1 を構成する各信号成分を、正規化係数に対応する値でそれそれ正規化する（除算する）。したがって、この場合、正規化により得られる被正規化データ D 1 3は、一 1 . 0 ~ 1 . 0の範囲の値となる。正規化部 1 3は、この被正規化データ D 1 3を量子化部 1 5に供給するとともに、正規化係数 D 1 4をマルチプレクサ 1 8に供給する。なお、正規化部 1 3は、必要に応じて正規化係数 D 1 4に対して所定の符号化を施した後、マルチプレクサ 1 8 に供給するようにしても構わない。

量子化精度決定部 1 4は、スぺクトル変換部 1 1から供給されたスぺクトル信号 D 1 1に基づいて、被正規化データ D 1 3を g子化する際の量子化ステップを決定する。そして量子化精度決定部 1 4は、その量子化ステップに対応する量子化精度情報 D 1 5を量子化部 1 5及びマルチプレクサ 1 8に供給する。なお、量子化精度決定部 1 4は、必要に応じて量子化精度情報 D 1 5に対して所定の符号化を施した後、マルチプレクサ 1 8に供給するようにしても構わない。

量子化部 1 5は、量子化精度決定部 1 4から供給された量子化精度情報 D 1 5 に対応する量子化ステップで被正規化データ D 1 3を量子化する。そして量子化部 1 5は、符号列表グループ切替判定部 1 2から供給されたグループィンデックス D 1 2に基づいて、選択されたグループの符号列表を用いて: M子化係数を符号化する。具体的には、選択されたグループに含まれる符号列表で実際に符号化を行い、所要ビット数が最も少ない符号列表を符号化に用いる符号列表として決定する。量子化部 1 5は、その決定した符号列表ィンデックス D 1 6を符号列表ィンデツクス符号化部 1 6に供給するとともに、符号化された係数データ D 1 7をマルチプレクサ 1 8に供給する。

符号列表インデックス符号化部 1 6は、量子化部 1 5から供給された符号列表インデヅクス D 1 6を符号化し、その符号化された符号列表ィンデックス D 1 8 をマルチプレクサ 1 8に供給する。ここで、前述したように、各符号列表の選択確率に応じて符号列表のィンデックスを可変長符号化する場合には、固定長で符号化する場合と比較して符号化ビット数を低減することができる。そこで、このような場合、符号列表インデックス符号化部 1 6は、符号列表インデックスの符号化ビット数情報 D l 9を量子化部 1 5に供給する。これにより、量子化部 1 5 は、ィンデックスの符号化で稼いだビヅト数をスぺクトルに対して再配分することができる。

符号列表数切替判定部 1 7は、符号列表グループに含まれる符号列表のうち、使用する符号列表の数を切り替え、その符号列表数インデックス D 2 1 を、フレーム毎又はビットストリーム毎に 1 ビットの情報として、量子化部 1 5、符号列表インデヅクス符号化部 1 6及びマルチプレクサ 1 8に供給する。すなわち、上述したように、エンコーダにかけるリソースが少なく、実用的なエンコードスピ一ドを実現するために多少音質を犠牲にせざるを得ない場合等には、実際に符号化に用いる符号列表の数を少なくすることによりェンコ一ドスピードの高速化を実現することができる。なお、使用する符号列表の切り替え動作は、ユーザや機器自身の判断により外部から供給される所定の設定用信号 D 2 0に基づいて行つてもよく、それ以外の方法を用いてもよい。

例えば、上述のように使用する符号列表の数を 8個から 4個に切り替える場合、符号列表数切替判定部 1 7は、 1 ビットの符号列表数インデックス D 2 1 を量子化部 1 5、符号列表ィンデヅクス符号化部 1 6及びマルチプレクサ 1 8に供給する。量子化部 1 5は、 8個ある符号列表のうち、予め定められた 4個の符号列表を用いて実際に符号化を行い、所要ビツト数が最も少ない符号列表を符号化に用いる符号列表として決定する。量子化部 1 5は、その決定した符号列表インデックス D 1 6を符号列表ィンデックス符号化部 1 6に供給する。一方、符号列表ィンデックス符号化部 1 6は、予め定められた 4個の符号列表の符号列表のインデックスを振り直し、量子化部 1 5から供給された符号列表ィンデックス D 1 6に対応する新たなィンデックスを符号化する。

マルチプレクサ 1 8は、量子化部 1 5から供給された係数デ一夕 D 1 7を、グループインデックス D 1 2、正規化係数 D 1 4、量子化精度情報 D 1 5、符号列表インデックス D 1 8及び符号列表数ィンデックス D 2 1 とともに多重化する。そして、マルチプレクサ 1 8は、多重化の結果得られる符号化デ一夕 D 2 2を伝送路を介して伝送し、或いは図示しない記録媒体に記録する。

なお、上述の例では、符号列表グループ切替判定部 1 2は、スペクトル信号 D 1 1のトーナリティを調べて、トーン性信号用の符号列表とノイズ性信号用の符号列との何れかを選択するものとして説明したが、これに限定されるものではなく、両方の符号列表で実際に符号化を行って所要ビット数を計算し、ビット数の少ない方のグループを選択するようにしても構わない。

続いて、符号化装置 1 0から出力される符号化データを復号する復号装置 3 0 の概略構成について、図 1 0を用いて説明する。図 1 0に示すように、本実施の形態における復号装置 3 0は、デマルチプレクサ 3 1 と、符号列表インデックス復号部 3 2と、逆量子化部 3 3と、逆正規化部 3 4と、スぺクトル逆変換部 3 5 とにより構成されている。

デマルチプレクサ 3 1は、入力した符号化データ D 3 0を復号し、係数データ D 3 1、 S子化精度情報 D 3 2、正規化係数 D 3 3、グループィンデックス D 3 4、符号列表ィンデックス D 3 5及び符号列表数ィンデヅクス D 3 6に分離する _c そしてデマルチプレクサ 3 1は、係数データ D 3 1を逆 g子化部 3 3に供給するとともに、量子化精度情報 D 3 2及び正規化係数 D 3 3を必要に応じて復号し、それぞれ逆量子化部 3 3及び逆正規化部 3 4に供給する。また、デマルチプレクサ 3 1は、グループインデックス D 3 4及び符号列表インデックス D 3 5を、それそれ逆量子化部 3 3及び符号列表インデックス復号部 3 2に供給する。さらに、デマルチプレクサ 3 1は、符号列表数ィンデヅクス D 3 6を符号列表ィンデヅクス復号部 3 2及び逆量子化部 3 3に供給する。

符号列表ィンデックス復号部 3 2は、符号列表数ィンデックス D 3 6に基づいて符号列表ィンデヅクス D 3 5を復号し、復号したィンデヅクス D 3 7を逆量子化部 3 3に供給する。

逆量子化部 3 3は、グループインデックス D 3 4、符号列表数インデックス D 3 6及び符号列表ィンデヅクス復号部 3 2から供給されたィンデヅクス D 3 7に基づいて使用する符号列表を決定し、この符号列表で係数データ D 3 1 を復号する。そして、逆量子化部 3 3は、得られた量子化係数をデマルチプレクサ 3 1から供給された量子化精度情報 D 3 2に対応した量子化ステップで逆量子化し、被正規化データ D 3 8を生成する。逆量子化部 3 3は、この被正規化データ D 3 8 を逆正規化部 3 4に供給する。逆正規化部 3 4は、被正規化デ一夕 D 3 8にデマルチプレクサ 3 1から供給された正規化係数 D 3 3に対応する値を乗算することで被正規化データ D 3 8を復号し、得られたスぺクトル信号 D 3 9をスぺクトル逆変換部 3 5に供給する。スぺクトル逆変換部 3 5は、逆正規化部 3 4から供給されたスぺクトル信号 D 3 9に対して 1 ]^。。丁 ( Inverse Modified Di screte Cos ine Transformation) 等の逆スぺクトル変換を施し、これにより元のオーディオ信号 D 4 0を復元する _c 以上説明したように、本実施の形態における符号化装置 1 0は、スペクトル信号 D 1 1の性質、例えばトーナリティに応じて、複数ある符号列表グループの中から 1つのグループを選択し、そのグループに含まれる符号列表を用いて量子化係数を符号化する。これにより、符号列表のインデックスを符号化する符号化ビト数を増加させることなく、様々な入力信号に対して信号の性質に応じた最適な符号列表が選択可能とされる。また、符号化装置 1 0は、エンコーダにかけるリソースが少なく、実用的なエンコードスピードを実現するために多少音質を犠牲にせざるを得ない場合等には、実際に符号化に用いる符号列表の数を少なくすることによりエンコードスピ一ドの高速化を実現することができる。

一方、本実施の形態における復号装置 3 0は、符号化データ D 3 0に含まれるグループィンデックス D 3 4、符号列表ィンデヅクス D 3 5及び符号列表数ィンデツクス D 3 6に基づいて符号化側と対応する符号列表を選択し、係数デ一夕 D 3 1を復号することができる。

なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。

例えば、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、 C P U ( Central Process ing Unit) にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンビュ一夕プログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。

なお、本発明は、図面を参照して説明した上述の実施例に限定されるものではなく、添付の請求の範囲及びその主旨を逸脱することなく、様々な変更、置換又はその同等のものを行うことができることは当業者にとって明らかである。産業上の利用可能性上述したような本発明を用いることにより、符号列表のィンデックスを符号化する符号化ビット数を増加させることなく、様々な入力信号に対して信号の性質、例えばトーナリティに応じた最適な符号列表が選択可能とされる。

Claims

請求の範囲

1 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化方法において、

予め複数のグループに分けられた符号列表群から、上記ディジタル信号の性質に応じて 1つのグループを選択する選択工程と、

上記選択工程にて選択されたグループの上記符号列表群の中から 1つの符号列表を決定する決定工程と、

上記決定工程にて決定された上記符号列表を用いて上記ディジタル信号を符号化する符号化工程と

を有することを特徴とする符号化方法。

2 . 請求の範囲第 1項記載の符号化方法であって、

上記デイジ夕ル信号は、周波数変換された信号であることを特徴とする符号化方法。

3 . 請求の範囲第 2項記載の符号化方法であって、

上記選択工程では、上記ディジタル信号のトーナリティに応じて上記グループが選択されることを特徴とする符号化方法。

4 . 請求の範囲第 1項記載の符号化方法であって、

上記選択工程では、複数の上記所定単位毎に上記 1つのグループが選択されることを特徴とする符号化方法。

5 . 請求の範囲第 1項記載の符号化方法であって、

上記符号化工程では、上記選択工程にて選択されたグループを示すィンデックスがさらに符号化されることを特徴とする符号化方法。

6 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化方法において、

符号列表群に含まれる選択可能な符号列表の数を設定する設定工程と、上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、上記選択工程にて選択された符号列表を用いて上記ディジタル信号を符号化する符号化工程とを有することを特徴とする符号化方法。

7 . 請求の範囲第 6項記載の符号化方法であって、

上記符号化工程では、上記選択工程にて選択された符号列表のィンデヅクスせ可変長符号化されることを特徴とする符号化方法。

8 . 請求の範囲第 6項記載の符号化方法であって、

上記符号化工程では、上記設定工程にて設定された上記選択可能な符号列表の数がさらに符号化されることを特徴とする符 ¾化方法。

9 . 請求の範囲第 6項記載の符号化方法であって、

上記設定工程では、所定の設定用信号に基づいて上記選択可能な符号列表の数が設定されることを特徴とする符号化方法。

1 0 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化装置において、

予め複数のグループに分けられた符号列表群から、上記ディジ夕ル信号の性質に応じて 1つのグループを選択する選択手段と、

上記選択手段によって選択されたグループの上記符号列表群の中から 1つの符号列表を決定する決定手段と、

上記決定手段によって決定された上記符号列表を用いて上記ディジタル信号を符号化する符号化手段と

を備えることを特徴とする符号化装置。

1 1 . 請求の範囲第 1 0項記載の符号化装置であって、

上記ディジタル信号は、周波数変換された信号であることを特徴とする符号化

1 2 . 請求の範囲第 1 1項記載の符号化装置であって、

上記選択手段は、上記ディジタル信号のトーナリティに応じて上記グループを選択することを特徴とする符号化装置。

1 3 . 請求の範囲第 1 0項記載の符号化装置であって、

上記選択手段は、複数の上記所定単位毎に上記 1つのグループを選択することを特徴とする符号化装置。

1 4 . 請求の範囲第 1 0項記載の符号化装置であって、上記符号化手段は、上記選択手段によって選択されたグループを示すィンデックスをさらに符号化することを特徴とする符号化装置。

1 5 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化装置において、

符号列表群に含まれる選択可能な符号列表の数を設定する設定手段と、上記符号列表群の中から 1つの上記符号列表を選択する選択手段と、上記選択手段によって選択された符号列表を用いて上記ディジタル信号を符号化する符号化手段と

を備えることを特徴とする符号化装置。

1 6 . 請求の範囲第 1 5項記載の符号化装置であって、

上記符号化手段は、上記選択手段によって選択された符号列表のィンデックスを可変長符号化することを特徴とする符号化装置。

1 7 . 請求の範囲第 1 5項記載の符号化装置であって、

上記符号化手段は、上記設定手段によって設定された上記選択可能な符号列表の数をさらに符号化することを特徴とする符号化装置。

1 8 . 請求の範囲第 1 5項記載の符号化装置であって、

上記設定手段は、所定の設定用信号に基づいて上記選択可能な符号列表の数を設定することを特徴とする符号化装置。

1 9 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化処理をコンピュー夕に実行させるプログラムにおいて、

上記決定工程にて決定された上記符号列表を用いて上記ディジ夕ル信号を符号化する符号化工程と

を有することを特徴とするプログラム。

2 0 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化処理をコンピュータに実行させるプログラムにおいて、符号列表群に含まれる選択可能な符号列表の数を設定する設定工程と、上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、上記選択工程にて選択された符号列表を用いて上記ディジタル信号を符号化する符号化工程と

を有することを特徴とするプログラム。

2 1 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化処理をコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体において、

を有することを特徴とするプログラムが記録された記録媒体。

2 2 . 所定単位毎に 1つの符号列表を用いてディジタル信号を符号化する符号化処理をコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体において、

符号列表群に含まれる選択可能な符号列表の数を設定する設定工程と、上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、上記選択工程にて選択された符号列表を用いて上記ディジタル信号を符号化する符号化工程と

2 3 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号する復号方法において、

予め複数のグループに分けられた符号列表群から、使用する 1つのグル一プを選択する選択工程と、

上記選択工程にて選択されたグループの符号列表の中から使用する 1つの符号列表を決定する決定工程と、上記決定工程にて決定された符号列表を用いて上記ディジタル信号を復号する復号工程と

を有することを特徴とする復号方法。

2 4 . 請求の範囲第 2 3項記載の復号方法であって、

上記ディジタル信号は、周波数変換された信号であることを特徴とする復号方法。

2 5 . 請求の範囲第 2 4項記載の復号方法であって、

上記選択工程では、上記符号化の際に上記ディジタル信号のトーナリティに応じて選択されたグループと同じグループが選択されることを特徴とする復号方法 ₍ 2 6 . 請求の範囲第 2 3項記載の復号方法であって、

上記選択工程では、複数の上記所定単位毎に上記 1つのグループが選択されることを特徴とする復号方法。

2 7 . 請求の範囲第 2 3項記載の復号方法であって、

上記選択工程では、使用したグループを示すィンデックスに基づいて上記グループが選択されることを特徴とする復号方法。

2 8 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号する復号方法において、

符号列表群に含まれる符号列表の数を設定する設定工程と、

上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、

上記選択工程にて選択された上記符号列表に基づいて上記ディジタル信号を復号する復号工程と

を有することを特徴とする復号方法。

2 9 . 請求の範囲第 2 8項記載の復号方法であって、

上記選択工程では、可変長符号化された上記符号列表のィンデックスに基づいて、使用する符号列表が選択されることを特徴とする復号方法。

3 0 . 請求の範囲第 2 8項記載の復号方法であって、

上記設定工程では、上記ディジタル信号とともに符号化された上記符号列表の数に基づいて、上記符号列表の数が設定されることを特徴とする復号方法。

3 1 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号する復号装置において、

予め符号列表群毎に分けられた複数のグループから、使用する 1つのグループを選択する選択手段と、

上記選択手段によって選択されたグループの符号列表の中から使用する 1つの符号列表を決定する決定手段と、

上記決定手段によって決定された符号列表を用いて上記ディジタル信号を復号する復号手段と

を備えることを特徴とする復号装置。

3 2 . 請求の範囲第 3 1項記載の復号装置であって、

上記ディジタル信号は、周波数変換された信号であることを特徴とする復号装置。

3 3 . 請求の範囲第 3 2項記載の復号装置であって、

上記選択手段は、上記符号化の際に上記ディジタル信号のトーナリティに応じて選択されたグループと同じグループを選択することを特徴とする復号装置。 3 4 . 請求の範囲第 3 1項記載の復号装置であって、

上記選択手段は、複数の上記所定単位毎に上記 1つのグループを選択することを特徴とする復号装置。

3 5 . 請求の範囲第 3 1項記載の復号装置であって、

上記選択手段は、使用したグループを示すインデックスに基づいて上記グループを選択することを特徴とする復号装置。

3 6 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号する復号装置において、

符号列表群に含まれる符号列表の数を設定する設定手段と、

上記符号列表群の中から 1つの上記符号列表を選択する選択手段と、

上記選択手段によつて選択された上記符号列表に基づいて上記デイジ夕ル信号を復号する復号工程と

を備えることを特徴とする復号装置。

3 7 . 請求の範囲第 3 6項記載の復号装置であって、

上記選択手段は、可変長符号化された上記符号列表のィンデックスに基づいて、使用する符号列表を選択することを特徴とする復号装置。

3 8 . 請求の範囲第 3 6項記載の復号装置であって、

上記設定手段は、上記ディジタル信号とともに符号化された上記符号列表の数に基づいて、上記符号列表の数を設定することを特徴とする復号装置。

3 9 . 所定単位毎に 1つの符号列表を用いて符号化されたディジ夕ル信号を復号する復号処理をコンピュー夕に実行させるプログラムにおいて、

予め複数のグループに分けられた符号列表群から、使用する 1つのグループを選択する選択工程と、

上記選択工程にて選択されたグループの符号列表の中から使用する 1つの符号列表を決定する決定工程と、

上記決定工程にて決定された符号列表を用いて上記ディジタル信号を復号する復号工程と

を有することを特徴とするプログラム。

4 0 . 所定単位毎に 1つの符号列表を用いて符号化されたディジ夕ル信号を復号する復号処理をコンピュータに実行させるプログラムにおいて、

上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、上記選択工程にて選択された上記符号列表に基づいて上記ディジタル信号を復号する復号工程と

を有することを特徴とするプログラム。

4 1 . 所定単位毎に 1つの符号列表を用いて符号化されたディジタル信号を復号する復号処理をコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体において、

上記選択工程にて選択されたグループの符号列表の中から使用する 1 'つの符号列表を決定する決定工程と、

上記決定工程にて決定された符号列表を用いて上記ディジタル信号を復号する復号工程とを有することを特徴とするプログラムが記録された記録媒体。

4 2 . 所定単位毎に 1つの符号列表を用いて符号化されたディジ夕ル信号を復号する復号処理をコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体において、

上記符号列表群の中から 1つの上記符号列表を選択する選択工程と、上記選択工程にて選択された上記符号列表に基づいて上記デイジ夕ル信号を復号する復号工程と