JPH08123488A - 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 - Google Patents
高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法Info
- Publication number
- JPH08123488A JPH08123488A JP25783394A JP25783394A JPH08123488A JP H08123488 A JPH08123488 A JP H08123488A JP 25783394 A JP25783394 A JP 25783394A JP 25783394 A JP25783394 A JP 25783394A JP H08123488 A JPH08123488 A JP H08123488A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- high efficiency
- bit allocation
- bit
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【構成】 オーディオチャネルのビット割当機能部90
8で求められたビット量情報と、ビデオチャネルのビッ
ト割当機能部915で求められたビット量情報とがマス
タービット割当機能部909に送られて、ビデオとオー
ディオとで効率的な適応的ビット配分が求められ、オー
ディオチャネルのビット割当機能部923及びビデオチ
ャネルのビット割当機能部914に最終的なビット割当
情報が送られる。ビット割当を削減する場合には、オー
ディオのサラウンドチャネルを優先的にビット削減の対
象とする。 【効果】 ビットレートを可変としながら一定の最大値
以下に抑えることができるため、最短の録画録音時間を
保証でき、また、全体的な音質や画質の劣化を抑えるこ
とができる。
8で求められたビット量情報と、ビデオチャネルのビッ
ト割当機能部915で求められたビット量情報とがマス
タービット割当機能部909に送られて、ビデオとオー
ディオとで効率的な適応的ビット配分が求められ、オー
ディオチャネルのビット割当機能部923及びビデオチ
ャネルのビット割当機能部914に最終的なビット割当
情報が送られる。ビット割当を削減する場合には、オー
ディオのサラウンドチャネルを優先的にビット削減の対
象とする。 【効果】 ビットレートを可変としながら一定の最大値
以下に抑えることができるため、最短の録画録音時間を
保証でき、また、全体的な音質や画質の劣化を抑えるこ
とができる。
Description
【0001】
【産業上の利用分野】本発明は、いわゆる高能率符号化
によって動画像や静止画像などの画像情報とモノーラ
ル、ステレオもしくはさらにチャネル数の多いマルチチ
ャネルオーディオ情報を同時に記録再生もしくは伝送
し、復号化して再生信号を得る、ディジタルデータの高
能率符号化方法、高能率符号記録方法、高能率符号伝送
方法、高能率符号化装置、及び高能率符号復号化方法に
関するものである。
によって動画像や静止画像などの画像情報とモノーラ
ル、ステレオもしくはさらにチャネル数の多いマルチチ
ャネルオーディオ情報を同時に記録再生もしくは伝送
し、復号化して再生信号を得る、ディジタルデータの高
能率符号化方法、高能率符号記録方法、高能率符号伝送
方法、高能率符号化装置、及び高能率符号復号化方法に
関するものである。
【0002】
【従来の技術】従来より、オーディオ或いは音声等の信
号の高能率符号化の手法には種々あるが、例えば、時間
軸上のオーディオ信号等をブロック化あるいはフレーム
化しないで、複数の周波数帯域に分割して符号化するい
わゆる帯域分割符号化(サブ・バンド・コーディング:
SBC)や、時間軸の信号を所定時間単位でブロック化
あるいはフレーム化してこのフレーム毎の時間軸の信号
を周波数軸上の信号に変換(スペクトル変換)して複数
の周波数帯域に分割し、各帯域毎に符号化するいわゆる
変換符号化方式等を挙げることができる。また、上述の
帯域分割符号化と変換符号化とを組み合わせた高能率符
号化の手法も考えられており、この場合には、例えば、
上記帯域分割符号化で帯域分割を行った後、該各帯域毎
の信号を周波数軸上の信号に直交変換あるいはスペクト
ル変換し、このスペクトル変換された各帯域毎に符号化
が施される。
号の高能率符号化の手法には種々あるが、例えば、時間
軸上のオーディオ信号等をブロック化あるいはフレーム
化しないで、複数の周波数帯域に分割して符号化するい
わゆる帯域分割符号化(サブ・バンド・コーディング:
SBC)や、時間軸の信号を所定時間単位でブロック化
あるいはフレーム化してこのフレーム毎の時間軸の信号
を周波数軸上の信号に変換(スペクトル変換)して複数
の周波数帯域に分割し、各帯域毎に符号化するいわゆる
変換符号化方式等を挙げることができる。また、上述の
帯域分割符号化と変換符号化とを組み合わせた高能率符
号化の手法も考えられており、この場合には、例えば、
上記帯域分割符号化で帯域分割を行った後、該各帯域毎
の信号を周波数軸上の信号に直交変換あるいはスペクト
ル変換し、このスペクトル変換された各帯域毎に符号化
が施される。
【0003】ここで、上述した帯域分割符号化において
用いられる帯域分割用フィルタとしては、例えばクォド
ラチュアミラーフィルタ(QMF)等のフィルタがあ
り、このQMFのフィルタは、文献「ディジタル・コー
ディング・オブ・スピーチ・イン・サブバンズ」("Digi
tal coding of speech in subbands", R.E.Crochiere,B
ell Syst.Tech. J., Vol.55,No.8 1976) に述べられて
いる。
用いられる帯域分割用フィルタとしては、例えばクォド
ラチュアミラーフィルタ(QMF)等のフィルタがあ
り、このQMFのフィルタは、文献「ディジタル・コー
ディング・オブ・スピーチ・イン・サブバンズ」("Digi
tal coding of speech in subbands", R.E.Crochiere,B
ell Syst.Tech. J., Vol.55,No.8 1976) に述べられて
いる。
【0004】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
【0005】また、上述した直交変換あるいはスペクト
ル変換としては、例えば、入力オーディオ信号を所定単
位時間でブロック化あるいはフレーム化し、当該ブロッ
クあるいはフレーム毎に離散フーリエ変換(DFT)、
離散コサイン変換(DCT)、又はモディファイド離散
コサイン変換(MDCT)等を行うことで時間軸を周波
数軸に変換するようなスペクトル変換がある。
ル変換としては、例えば、入力オーディオ信号を所定単
位時間でブロック化あるいはフレーム化し、当該ブロッ
クあるいはフレーム毎に離散フーリエ変換(DFT)、
離散コサイン変換(DCT)、又はモディファイド離散
コサイン変換(MDCT)等を行うことで時間軸を周波
数軸に変換するようなスペクトル変換がある。
【0006】なお、上記MDCTについては、文献「時
間領域エリアシング・キャンセルを基礎とするフィルタ
・バンク設計を用いたサブバンド/変換符号化」("Subb
and/Transform Coding Using Filter Bank Designs Bas
ed on Time Domain AliasingCancellation," J.P.Princ
en A.B.Bradley, Univ. of Surrey Royal MelbourneIns
t. of Tech. ICASSP 1987)に述べられている。
間領域エリアシング・キャンセルを基礎とするフィルタ
・バンク設計を用いたサブバンド/変換符号化」("Subb
and/Transform Coding Using Filter Bank Designs Bas
ed on Time Domain AliasingCancellation," J.P.Princ
en A.B.Bradley, Univ. of Surrey Royal MelbourneIns
t. of Tech. ICASSP 1987)に述べられている。
【0007】ここで、周波数帯域分割された各周波数成
分を量子化する場合の周波数分割幅としては、例えば人
間の聴覚特性を考慮した帯域幅を用いることが多い。す
なわち、一般に高域ほど帯域幅が広くなるような臨界帯
域(クリティカルバンド)と呼ばれている帯域幅で、オ
ーディオ信号を複数(例えば25バント)の帯域に分割
することがある。また、この時の各帯域毎のデータを符
号化する際には、各帯域毎に所定のビット配分或いは、
各帯域毎に適応的なビット割当て(ビットアロケーショ
ン)による符号化が行われる。例えば、上記MDCT処
理されて得られた係数データを上記ビットアロケーショ
ンによって符号化する際には、上記各フレーム毎のMD
CT処理により得られる各帯域毎のMDCT係数データ
に対して、適応的な割当てビット数で符号化が行われる
ことになる。ビット割当手法としては、次の2手法が知
られている。
分を量子化する場合の周波数分割幅としては、例えば人
間の聴覚特性を考慮した帯域幅を用いることが多い。す
なわち、一般に高域ほど帯域幅が広くなるような臨界帯
域(クリティカルバンド)と呼ばれている帯域幅で、オ
ーディオ信号を複数(例えば25バント)の帯域に分割
することがある。また、この時の各帯域毎のデータを符
号化する際には、各帯域毎に所定のビット配分或いは、
各帯域毎に適応的なビット割当て(ビットアロケーショ
ン)による符号化が行われる。例えば、上記MDCT処
理されて得られた係数データを上記ビットアロケーショ
ンによって符号化する際には、上記各フレーム毎のMD
CT処理により得られる各帯域毎のMDCT係数データ
に対して、適応的な割当てビット数で符号化が行われる
ことになる。ビット割当手法としては、次の2手法が知
られている。
【0008】例えば、文献「音声信号の適応変換符号
化」( "Adaptive Transform Codingof Speech Signal
s", IEEE Transactions of Accoustics, Speech, and S
ignalProcessing, vol.ASSP-25, No.4, August 1977)
では、各帯域毎の信号の大きさをもとに、ビット割当を
行っている。この方式では、量子化雑音スペクトルが平
坦となり、雑音エネルギ最小となるが、聴感覚的にはマ
スキング効果が利用されていないために実際の雑音感は
最適ではない。
化」( "Adaptive Transform Codingof Speech Signal
s", IEEE Transactions of Accoustics, Speech, and S
ignalProcessing, vol.ASSP-25, No.4, August 1977)
では、各帯域毎の信号の大きさをもとに、ビット割当を
行っている。この方式では、量子化雑音スペクトルが平
坦となり、雑音エネルギ最小となるが、聴感覚的にはマ
スキング効果が利用されていないために実際の雑音感は
最適ではない。
【0009】また、例えば文献「臨界帯域符号化器 −
聴覚システムの知覚の要求に関するディジタル符号化」
( "The critical band coder --digital encoding of
theperceptual requirements of the auditory syste
m", M.A.Kransner MIT,ICASSP1980 )では、聴覚マスキ
ングを利用することで、各帯域毎に必要な信号対雑音比
を得て固定的なビット割当を行う手法が述べられてい
る。
聴覚システムの知覚の要求に関するディジタル符号化」
( "The critical band coder --digital encoding of
theperceptual requirements of the auditory syste
m", M.A.Kransner MIT,ICASSP1980 )では、聴覚マスキ
ングを利用することで、各帯域毎に必要な信号対雑音比
を得て固定的なビット割当を行う手法が述べられてい
る。
【0010】また画像情報に対してもオーディオ情報に
対すると同様に直交変換方式が多用されており、その代
表的なものとしては、離散コサイン変換(Discrete Cos
ineTransform:DCT)を用いる方法がある。例えば8
×8ピクセルの大きさのブロック毎にDCTをおこなっ
て変換係数を得、低域に重点をおいたビット配分を行な
う。効率を上げるためにエントロピー符号を用いること
が多い。このときのDCT変換のための入力情報はフレ
ーム間予測信号を使うことで利得を上げることができ
る。また、動き補償を行なうことで更にフレーム間予測
利得を上げることができる。
対すると同様に直交変換方式が多用されており、その代
表的なものとしては、離散コサイン変換(Discrete Cos
ineTransform:DCT)を用いる方法がある。例えば8
×8ピクセルの大きさのブロック毎にDCTをおこなっ
て変換係数を得、低域に重点をおいたビット配分を行な
う。効率を上げるためにエントロピー符号を用いること
が多い。このときのDCT変換のための入力情報はフレ
ーム間予測信号を使うことで利得を上げることができ
る。また、動き補償を行なうことで更にフレーム間予測
利得を上げることができる。
【0011】しかしながら、これらの手法ではオーディ
オ情報と画像情報に対して別々に固定的なビット配分を
行なうため、例えば、オーディオ情報がほとんど存在せ
ず、ビット配分を行なう必要がなく、これに反して画像
情報は大きな情報量を持つ場合でも、システムが持つビ
ットはオーディオと画像に固定的に配分されて有効なビ
ット利用が行なわれない。
オ情報と画像情報に対して別々に固定的なビット配分を
行なうため、例えば、オーディオ情報がほとんど存在せ
ず、ビット配分を行なう必要がなく、これに反して画像
情報は大きな情報量を持つ場合でも、システムが持つビ
ットはオーディオと画像に固定的に配分されて有効なビ
ット利用が行なわれない。
【0012】また、画像情報とオーディオ情報の一部が
入力情報に依存した固定的ではない可変ビットレート方
式でコーディングされていて、少しでもビットの有効利
用が計られていたとしても、システムが使う全ビットレ
ートが時間的に変動するときには、記録または伝送され
る情報が必要とする全ビット量が、一度エンコードを試
してみないとわからないため、記録容量が決まっている
ディスクやテープ等では、記録できる時間が一度のエン
コードではわからず、2回以上の試行が必要となる。こ
れは製作費の上昇となる。
入力情報に依存した固定的ではない可変ビットレート方
式でコーディングされていて、少しでもビットの有効利
用が計られていたとしても、システムが使う全ビットレ
ートが時間的に変動するときには、記録または伝送され
る情報が必要とする全ビット量が、一度エンコードを試
してみないとわからないため、記録容量が決まっている
ディスクやテープ等では、記録できる時間が一度のエン
コードではわからず、2回以上の試行が必要となる。こ
れは製作費の上昇となる。
【0013】
【発明が解決しようとする課題】このように、画像情報
とオーディオ情報を含んだマルチメディアあるいはマル
チ情報を同時に記録再生する場合には、個々の情報が単
独で高能率符号化されることによる冗長性は望ましくな
い。また、記録容量が決まっているメディアにおいて可
変ビットレート方式の高能率符号を用いた場合に、記録
可能時間を一度のエンコードも行なわない時点で確定で
きず、複数回のエンコードを必要とする。
とオーディオ情報を含んだマルチメディアあるいはマル
チ情報を同時に記録再生する場合には、個々の情報が単
独で高能率符号化されることによる冗長性は望ましくな
い。また、記録容量が決まっているメディアにおいて可
変ビットレート方式の高能率符号を用いた場合に、記録
可能時間を一度のエンコードも行なわない時点で確定で
きず、複数回のエンコードを必要とする。
【0014】本発明は、このような実情に鑑みてなされ
たものであり、マルチ情報の高能率符号化を行なう場合
に効率を更に上げ、かつ記録可能時間をエンコード前に
確定できるような良好なビット割当手法を用いた高能率
符号化方法、高能率符号記録方法、高能率符号伝送方
法、高能率符号化装置及び高能率符号復号化方法の提供
を目的とする。
たものであり、マルチ情報の高能率符号化を行なう場合
に効率を更に上げ、かつ記録可能時間をエンコード前に
確定できるような良好なビット割当手法を用いた高能率
符号化方法、高能率符号記録方法、高能率符号伝送方
法、高能率符号化装置及び高能率符号復号化方法の提供
を目的とする。
【0015】
【課題を解決するための手段】本発明に係る高能率符号
化方法は、画像情報チャネルと音響情報チャネルを持つ
システムにおいて、録音録画時間をできるかぎり長くす
るために、画像情報チャネルと音響情報チャネルの全て
のチャネルを合わせた総ビットレ−トを可変とし、かつ
一定の最大値を越えないようなビット配分を行なうこと
により、上述した課題を解決する。
化方法は、画像情報チャネルと音響情報チャネルを持つ
システムにおいて、録音録画時間をできるかぎり長くす
るために、画像情報チャネルと音響情報チャネルの全て
のチャネルを合わせた総ビットレ−トを可変とし、かつ
一定の最大値を越えないようなビット配分を行なうこと
により、上述した課題を解決する。
【0016】ここで、少なくとも1個の上記チャネルの
データは、入力信号に依存した可変ビットレート方式に
より圧縮されることが好ましい。また、全チャネルのた
めにビット量が不足する場合に、音響チャネルがサラウ
ンドチャネルを含む場合には優先的にサラウンドチャネ
ルのビット配分を削減する。この場合に最も優先して周
波数帯域を15kHz程度まで低下させる。次の優先順位
として、サラウンドチャネル以外のチャネルの周波数帯
域を15kHz程度まで低下させる。更にビット量が不足
する場合には、サラウンドチャネルから優先してビット
レートを削減する。また、各チャネルの情報信号に基づ
き、情報信号のエネルギ値、ピーク値又は平均値等の振
幅情報やその時間的変化により、チャネル間のビット割
当を変化させることが挙げられる。
データは、入力信号に依存した可変ビットレート方式に
より圧縮されることが好ましい。また、全チャネルのた
めにビット量が不足する場合に、音響チャネルがサラウ
ンドチャネルを含む場合には優先的にサラウンドチャネ
ルのビット配分を削減する。この場合に最も優先して周
波数帯域を15kHz程度まで低下させる。次の優先順位
として、サラウンドチャネル以外のチャネルの周波数帯
域を15kHz程度まで低下させる。更にビット量が不足
する場合には、サラウンドチャネルから優先してビット
レートを削減する。また、各チャネルの情報信号に基づ
き、情報信号のエネルギ値、ピーク値又は平均値等の振
幅情報やその時間的変化により、チャネル間のビット割
当を変化させることが挙げられる。
【0017】また、このような高能率符号化方法により
符号化された信号を記録媒体に記録いたり、伝送媒体を
介して伝送することができる。
符号化された信号を記録媒体に記録いたり、伝送媒体を
介して伝送することができる。
【0018】さらに、本発明に係る高能率符号化装置に
よれば、少なくとも1個の画像情報チャネルと少なくと
も1個の音響情報チャネルを有する信号を高能率符号化
する高能率符号化装置において、全チャネルを合わせた
総ビットレ−トを可変とすると共に一定の最大値を越え
ないように制御する制御手段を有することにより、上述
の課題を解決する。
よれば、少なくとも1個の画像情報チャネルと少なくと
も1個の音響情報チャネルを有する信号を高能率符号化
する高能率符号化装置において、全チャネルを合わせた
総ビットレ−トを可変とすると共に一定の最大値を越え
ないように制御する制御手段を有することにより、上述
の課題を解決する。
【0019】
【作用】本発明の高能率符号化方法によれば、画像情報
チャネルと音響情報チャネルの全てのチャネルを合わせ
た総ビットレ−トが可変でありながら、一定の最大値以
下となるように作動する。最低録音録画時間を必ず保証
でき、録音録画時間の不足のために1回きりの録音録画
チャンスを逃がしたり、何回もやりなおしたりする必要
がない。それと同時にビット配分をそれほど行なわなく
てもよい時間帯域にはビットを割り振る量を削減する。
録画録音時間を最大限長くすることが可能となる。これ
により追加の録画録音を行なうことが可能となる。ビッ
ト配分の要求量が配分できる一定の最大値を越えた場合
には、全チャネルの中で特にオーディオサラウンドチャ
ネルを優先的にビット削減の対象とする。
チャネルと音響情報チャネルの全てのチャネルを合わせ
た総ビットレ−トが可変でありながら、一定の最大値以
下となるように作動する。最低録音録画時間を必ず保証
でき、録音録画時間の不足のために1回きりの録音録画
チャンスを逃がしたり、何回もやりなおしたりする必要
がない。それと同時にビット配分をそれほど行なわなく
てもよい時間帯域にはビットを割り振る量を削減する。
録画録音時間を最大限長くすることが可能となる。これ
により追加の録画録音を行なうことが可能となる。ビッ
ト配分の要求量が配分できる一定の最大値を越えた場合
には、全チャネルの中で特にオーディオサラウンドチャ
ネルを優先的にビット削減の対象とする。
【0020】
【実施例】以下、本発明に係る好ましい実施例について
図面を参照しながら説明する。
図面を参照しながら説明する。
【0021】次の図1ないし図4に示す本発明の実施例
においては、画像及びオーディオPCM信号、音声信号
等の入力ディジタル信号を、 (1)帯域分割符号化(SBC)、 (2)適応変換符号化(ATC) (3)適応ビット割当て) (4)フレーム間予測 (5)動き補償 の各技術を用いて高能率符号化している。
においては、画像及びオーディオPCM信号、音声信号
等の入力ディジタル信号を、 (1)帯域分割符号化(SBC)、 (2)適応変換符号化(ATC) (3)適応ビット割当て) (4)フレーム間予測 (5)動き補償 の各技術を用いて高能率符号化している。
【0022】先ず、図1に示す具体的なオーディオ高能
率符号化装置においては、入力ディジタル信号をフィル
タ等により複数の周波数帯域に分割すると共に、各周波
数帯域毎に直交変換を行って、得られた周波数軸のスペ
クトルデータを、後述する人間の聴覚特性を考慮したい
わゆる臨界帯域幅(クリティカルバンド)毎に適応的に
ビット割当して符号化している。この時高域では臨界帯
域幅を更に分割した帯域を用いる。この例では全帯域を
等しい4分割をおこなっているが、もちろんフィルタ等
による非ブロッキングの周波数分割幅は不等分割幅とし
てもよい。さらに、本発明実施例においては、クリティ
カルバンド単位もしくは高域では臨界帯域幅(クリティ
カルバンド)を更に細分化したブロックでフローティン
グ処理を行っている。このクリティカルバンドとは、人
間の聴覚特性を考慮して分割された周波数帯域であり、
ある純音の周波数近傍の同じ強さの狭帯域バンドノイズ
によって当該純音がマスクされるときのそのノイズの持
つ帯域のことである。このクリティカルバンドは、高域
ほど帯域幅が広くなっており、例えば0〜20kHzある
いは0〜22kHzの全周波数帯域は例えば25のクリテ
ィカルバンドに分割されている。
率符号化装置においては、入力ディジタル信号をフィル
タ等により複数の周波数帯域に分割すると共に、各周波
数帯域毎に直交変換を行って、得られた周波数軸のスペ
クトルデータを、後述する人間の聴覚特性を考慮したい
わゆる臨界帯域幅(クリティカルバンド)毎に適応的に
ビット割当して符号化している。この時高域では臨界帯
域幅を更に分割した帯域を用いる。この例では全帯域を
等しい4分割をおこなっているが、もちろんフィルタ等
による非ブロッキングの周波数分割幅は不等分割幅とし
てもよい。さらに、本発明実施例においては、クリティ
カルバンド単位もしくは高域では臨界帯域幅(クリティ
カルバンド)を更に細分化したブロックでフローティン
グ処理を行っている。このクリティカルバンドとは、人
間の聴覚特性を考慮して分割された周波数帯域であり、
ある純音の周波数近傍の同じ強さの狭帯域バンドノイズ
によって当該純音がマスクされるときのそのノイズの持
つ帯域のことである。このクリティカルバンドは、高域
ほど帯域幅が広くなっており、例えば0〜20kHzある
いは0〜22kHzの全周波数帯域は例えば25のクリテ
ィカルバンドに分割されている。
【0023】すなわち図1において、入力端子10に
は、例えば0〜22kHzのオーディオPCM信号が供給
されている。この入力信号は、第1の周波数分割手段と
しての例えばいわゆるPQFフィルタ等の帯域分割フィ
ルタ11により0〜5.5kHz帯域、5.5k〜11k
Hz帯域、11k〜16.5kHz帯域及び16.5k〜2
2kHz帯域に分割され、各帯域の信号は第2の周波数分
割手段としての例えば直交変換回路の一例である改良離
散コサイン変換(MDCT:Modified DiscreteCosine
Transform)回路に送られる。
は、例えば0〜22kHzのオーディオPCM信号が供給
されている。この入力信号は、第1の周波数分割手段と
しての例えばいわゆるPQFフィルタ等の帯域分割フィ
ルタ11により0〜5.5kHz帯域、5.5k〜11k
Hz帯域、11k〜16.5kHz帯域及び16.5k〜2
2kHz帯域に分割され、各帯域の信号は第2の周波数分
割手段としての例えば直交変換回路の一例である改良離
散コサイン変換(MDCT:Modified DiscreteCosine
Transform)回路に送られる。
【0024】また帯域分割フィルタ11で分割された各
帯域について、0〜5.5kHz帯域の出力はMDCT回
路12へ、5.5k〜11kHz帯域の出力はMDCT回
路13へ、11k〜16.5kHz帯域の出力はMDCT
回路14へ、そして16.5k〜22kHz帯域の信号は
MDCT回路15に送られることにより、それぞれMD
CT処理される。
帯域について、0〜5.5kHz帯域の出力はMDCT回
路12へ、5.5k〜11kHz帯域の出力はMDCT回
路13へ、11k〜16.5kHz帯域の出力はMDCT
回路14へ、そして16.5k〜22kHz帯域の信号は
MDCT回路15に送られることにより、それぞれMD
CT処理される。
【0025】ここで、各MDCT回路12、13、1
4、15のブロックサイズの具体例を図2に示す。この
図2の具体例においては、4つのフィルタ出力は、同一
の直交変換ブロックサイズを持つ。すなわち、サンプリ
ング周波数が44.1kHzの場合について考えると2
3.2msec長に当たる256サンプルずつについての直
交変換を行なう。このとき隣接直交変換とのオーバーラ
ップを考えると、その2倍の512サンプルのウインド
ウが使用される。この様子を図3に示す。このとき、プ
リエコー(pre-echo)現象、つまり急激に小さなエネル
ギの信号から大きなエネルギの信号へと時間的に変化し
たときに生じる信号立ち上がり前の量子化雑音が聞こえ
る現象を防ぐために、直交変換長よりも短い時間単位で
エンコード時に振幅の圧縮を、デコード時に相補的な伸
張を行なう。
4、15のブロックサイズの具体例を図2に示す。この
図2の具体例においては、4つのフィルタ出力は、同一
の直交変換ブロックサイズを持つ。すなわち、サンプリ
ング周波数が44.1kHzの場合について考えると2
3.2msec長に当たる256サンプルずつについての直
交変換を行なう。このとき隣接直交変換とのオーバーラ
ップを考えると、その2倍の512サンプルのウインド
ウが使用される。この様子を図3に示す。このとき、プ
リエコー(pre-echo)現象、つまり急激に小さなエネル
ギの信号から大きなエネルギの信号へと時間的に変化し
たときに生じる信号立ち上がり前の量子化雑音が聞こえ
る現象を防ぐために、直交変換長よりも短い時間単位で
エンコード時に振幅の圧縮を、デコード時に相補的な伸
張を行なう。
【0026】図4のAは時間軸上で急激に立ち上がり急
激に減衰する音響信号の例を示しており、Bはこれに対
応して直交変換前に行なわれるゲイン調整を示してい
る。ゲインは音響信号が大きく立ち上がると急激に小さ
くなり、音響信号が再び小さくなると徐々に大きくなっ
ていく。
激に減衰する音響信号の例を示しており、Bはこれに対
応して直交変換前に行なわれるゲイン調整を示してい
る。ゲインは音響信号が大きく立ち上がると急激に小さ
くなり、音響信号が再び小さくなると徐々に大きくなっ
ていく。
【0027】図4のCは通常のウインドウを示してお
り、図4のDは、上記ゲイン調整量Bと通常のウィンド
ウCとの積をとることにより得られるゲイン調整された
ウィンドウを示している。図4のEはデコ−ド用のウイ
ンドウを示しており、プリエコー発生部分、すなわち音
響信号の立ち上がる直前でウインドウゲインが抑さえら
れるため、プリエコーが抑えられる。
り、図4のDは、上記ゲイン調整量Bと通常のウィンド
ウCとの積をとることにより得られるゲイン調整された
ウィンドウを示している。図4のEはデコ−ド用のウイ
ンドウを示しており、プリエコー発生部分、すなわち音
響信号の立ち上がる直前でウインドウゲインが抑さえら
れるため、プリエコーが抑えられる。
【0028】次に図5は、エンコ−ドされた信号をデコ
−ドするためのデコ−ド装置を示す。0〜5.5kHz帯
域、5.5k〜11kHz帯域、11k〜16.5kHz帯
域及び16.5k〜22kHz帯域の信号に相当するデ−
タがそれぞれ入力端子501、502、503、504
に与えられる。復号化ブロック505はエンコ−ド時に
行なわれた正規化を解除し最終的に周波数軸上のスペク
トル情報を与える。IMDCT回路506、507、5
08、509は、それぞれ0〜5.5kHz帯域、5.5
k〜11kHz帯域、11k〜16.5kHz帯域及び1
6.5k〜22kHz帯域のスペクトルを時間軸上に変換
する。時間軸上に変換された4帯域信号は合成フィルタ
510で全帯域信号に合成され、出力端子511より取
り出される。
−ドするためのデコ−ド装置を示す。0〜5.5kHz帯
域、5.5k〜11kHz帯域、11k〜16.5kHz帯
域及び16.5k〜22kHz帯域の信号に相当するデ−
タがそれぞれ入力端子501、502、503、504
に与えられる。復号化ブロック505はエンコ−ド時に
行なわれた正規化を解除し最終的に周波数軸上のスペク
トル情報を与える。IMDCT回路506、507、5
08、509は、それぞれ0〜5.5kHz帯域、5.5
k〜11kHz帯域、11k〜16.5kHz帯域及び1
6.5k〜22kHz帯域のスペクトルを時間軸上に変換
する。時間軸上に変換された4帯域信号は合成フィルタ
510で全帯域信号に合成され、出力端子511より取
り出される。
【0029】図6は、本システムがオーディオチャネル
とビデオチャネルとで構成されていることを示す図であ
る。すなわち、複数の入力端子601に供給された複数
のオーディオ信号は、複数のオーディオチャネル602
を介してマルチプレックス機能部603に送られ、また
複数の入力端子611に供給された複数のビデオ信号
は、複数のビデオチャネル612を介してマルチプレッ
クス機能部603に送られて合成され、出力端子604
より取り出される。
とビデオチャネルとで構成されていることを示す図であ
る。すなわち、複数の入力端子601に供給された複数
のオーディオ信号は、複数のオーディオチャネル602
を介してマルチプレックス機能部603に送られ、また
複数の入力端子611に供給された複数のビデオ信号
は、複数のビデオチャネル612を介してマルチプレッ
クス機能部603に送られて合成され、出力端子604
より取り出される。
【0030】ここでオーディオチャネルは、例えば図7
に示すように、右チャネル(Rightchannel )711、
左チャネル(Left Channel)712、中央チャネル(Ce
nterChannel)713、右中央チャネル(Right Center
Channel)714、左中央チャネル(Left Center Chann
el )715、サラウンド左チャネル(Surround Left c
hannel )716、サラウンド右チャネル(Surround Ri
ght channel)717、そしてサブウーハチャネル(Sub
Woofer Channel)718から構成されている。これら
の8チャネルの各チャネルは、再生側では図8に示す各
チャネル811〜818のように配置される。
に示すように、右チャネル(Rightchannel )711、
左チャネル(Left Channel)712、中央チャネル(Ce
nterChannel)713、右中央チャネル(Right Center
Channel)714、左中央チャネル(Left Center Chann
el )715、サラウンド左チャネル(Surround Left c
hannel )716、サラウンド右チャネル(Surround Ri
ght channel)717、そしてサブウーハチャネル(Sub
Woofer Channel)718から構成されている。これら
の8チャネルの各チャネルは、再生側では図8に示す各
チャネル811〜818のように配置される。
【0031】再び図1において、各MDCT回路12、
13、14、15にてMDCT処理されて得られた周波
数軸上のスペクトルデータあるいはMDCT係数データ
は、いわゆる臨界帯域(クリティカルバンド)毎に、又
は高域では更にクリティカルバンドを分割した帯域毎に
まとめられて、適応ビット割当符号化回路16に送られ
ている。
13、14、15にてMDCT処理されて得られた周波
数軸上のスペクトルデータあるいはMDCT係数データ
は、いわゆる臨界帯域(クリティカルバンド)毎に、又
は高域では更にクリティカルバンドを分割した帯域毎に
まとめられて、適応ビット割当符号化回路16に送られ
ている。
【0032】適応ビット割当符号化回路16により臨界
帯域(クリティカルバンド)又は高域では更にクリティ
カルバンドを分割した帯域毎に割り当てられたビット数
に応じて各スペクトルデータ(あるいはMDCT係数デ
ータ)を再量子化するようにしている。このようにして
符号化されたデータは、出力端子17、18、19、2
0を介して取り出される。このとき、どのような信号の
大きさに関する正規化がされたかを示すスケールファク
タと、どのようなビット長で量子化がされたかを示すビ
ット長情報が同時に送られる。
帯域(クリティカルバンド)又は高域では更にクリティ
カルバンドを分割した帯域毎に割り当てられたビット数
に応じて各スペクトルデータ(あるいはMDCT係数デ
ータ)を再量子化するようにしている。このようにして
符号化されたデータは、出力端子17、18、19、2
0を介して取り出される。このとき、どのような信号の
大きさに関する正規化がされたかを示すスケールファク
タと、どのようなビット長で量子化がされたかを示すビ
ット長情報が同時に送られる。
【0033】図1における各MDCT回路12、13、
14、15の出力から、上記臨界帯域(クリティカルバ
ンド)又は高域では、更にクリティカルバンドを分割し
た帯域毎のエネルギが、例えば当該バンド内での各振幅
値の2乗平均の平方根を計算すること等により求められ
る。これはビット割当の決定に用いられる。もちろんス
ケールファクタそのものを以後のビット割当の為に用い
てもよい。この場合には新たなエネルギ計算の演算が不
要のためハード規模の節約となる。つまり各バンド毎の
エネルギの代わりに、振幅値のピーク値、平均値等が用
いられることもある。
14、15の出力から、上記臨界帯域(クリティカルバ
ンド)又は高域では、更にクリティカルバンドを分割し
た帯域毎のエネルギが、例えば当該バンド内での各振幅
値の2乗平均の平方根を計算すること等により求められ
る。これはビット割当の決定に用いられる。もちろんス
ケールファクタそのものを以後のビット割当の為に用い
てもよい。この場合には新たなエネルギ計算の演算が不
要のためハード規模の節約となる。つまり各バンド毎の
エネルギの代わりに、振幅値のピーク値、平均値等が用
いられることもある。
【0034】次に、適応ビット割当符号化回路16の動
作について、図9を参照しながら説明する。この実施例
において、全チャネル数は、画像チャネル1、オーディ
オチャネル8チャネルの合計9チャネルである。
作について、図9を参照しながら説明する。この実施例
において、全チャネル数は、画像チャネル1、オーディ
オチャネル8チャネルの合計9チャネルである。
【0035】先ず、オーディオチャネルの各チャネルの
共通部分について任意の1つのチャネルを用いて説明す
ると、このチャネルの入力情報信号は入力端子901に
与えられる。この入力情報信号はマッピング機能部90
2により時間軸上の信号から周波数軸上に展開される。
この場合、フィルタによるマッピングを行なう場合には
サブバンド信号は時間軸上のサンプルとなり、直交変換
の場合には周波数軸上のサンプルが得られる。これらの
サンプルはブロック化機能部903により複数サンプル
毎にまとめられる。上記フィルタによる場合には時間軸
上の複数サンプルがまとめられ、上記直交変換の場合に
は周波数軸上の複数サンプルがまとめられる。
共通部分について任意の1つのチャネルを用いて説明す
ると、このチャネルの入力情報信号は入力端子901に
与えられる。この入力情報信号はマッピング機能部90
2により時間軸上の信号から周波数軸上に展開される。
この場合、フィルタによるマッピングを行なう場合には
サブバンド信号は時間軸上のサンプルとなり、直交変換
の場合には周波数軸上のサンプルが得られる。これらの
サンプルはブロック化機能部903により複数サンプル
毎にまとめられる。上記フィルタによる場合には時間軸
上の複数サンプルがまとめられ、上記直交変換の場合に
は周波数軸上の複数サンプルがまとめられる。
【0036】図9の実施例では、マッピングの途中のM
DCT入力時間軸上信号の時間変化を時間変化算出機能
部905により算出する。
DCT入力時間軸上信号の時間変化を時間変化算出機能
部905により算出する。
【0037】ブロック化機能部903により複数のサン
プル毎にブロックにまとめられたサンプルは、正規化機
能部904で正規化される。正規化のための係数である
スケールファクタは、スケ−ルファクタ算出機能部90
6で得られる。得られたスケールファクタからは同時に
トーナリティの大きさがトーナリティ算出機能部907
で算出される。以上で求められるパラメータは、ビット
割当機能部908でビット割当のために使用される。
プル毎にブロックにまとめられたサンプルは、正規化機
能部904で正規化される。正規化のための係数である
スケールファクタは、スケ−ルファクタ算出機能部90
6で得られる。得られたスケールファクタからは同時に
トーナリティの大きさがトーナリティ算出機能部907
で算出される。以上で求められるパラメータは、ビット
割当機能部908でビット割当のために使用される。
【0038】今、MDCT係数を表現して伝送又は記録
に使えるビット数を、全チャネルで800kbps とする
と、実施例では、(1)まずそのうち第1のビット割当
に使うべきビット量を確定する。そのためには(a)信号
情報のスペクトル情報のうちトーナリティ情報及び(b)
信号情報の時間変化情報を使用する。
に使えるビット数を、全チャネルで800kbps とする
と、実施例では、(1)まずそのうち第1のビット割当
に使うべきビット量を確定する。そのためには(a)信号
情報のスペクトル情報のうちトーナリティ情報及び(b)
信号情報の時間変化情報を使用する。
【0039】まずトーナリティ情報について説明する
と、指標としては、信号スペクトルの隣接値間の差の絶
対値の和を、信号スペクトル数で割った値を、指標とし
て用いている。図10に示すようにもっと簡単には、ブ
ロックフローティングの為のブロックごとのスケールフ
ァクタの、隣接スケールファクタ指標の間の差dの平均
値を用いる。スケールファクタ指標は、概略スケールフ
ァクタの対数値に対応している。
と、指標としては、信号スペクトルの隣接値間の差の絶
対値の和を、信号スペクトル数で割った値を、指標とし
て用いている。図10に示すようにもっと簡単には、ブ
ロックフローティングの為のブロックごとのスケールフ
ァクタの、隣接スケールファクタ指標の間の差dの平均
値を用いる。スケールファクタ指標は、概略スケールフ
ァクタの対数値に対応している。
【0040】本実施例では、第1のビット割当に使うべ
きビット量を、このトーナリティを表す値に対応させて
最大600kbps 、最小300kbps と設定している。
トーナリティ計算は次のように行なう。
きビット量を、このトーナリティを表す値に対応させて
最大600kbps 、最小300kbps と設定している。
トーナリティ計算は次のように行なう。
【0041】Tm=1/WLmax(ΣABS(SFn-SFn-1)) Tav=(1/Ch)ΣTm ここで、Tm:各チャネルのトーナリティ m:チャネル番号 WLmax:ワードレングス最大値=16 Ch:チャネル数 SFn:スケールファクタ指標で概略ピーク値の対数に対
応している。
応している。
【0042】n:ブロックフローティングバンド番号 Tav:チャネル平均トーナリティ このようにして求められたTavと第1のビット割当量と
は、図11に示すように対応付けられる。
は、図11に示すように対応付けられる。
【0043】これと共に本実施例では、第1のビット割
当パターンへの割当とそれに付加するその他の少なくと
も1つのビット割当との分割率は、情報信号の時間変化
特性に依存する。本実施例では、直交変換時間ブロック
サイズを更に分割した時間区間毎に信号情報のピーク値
を隣接ブロック毎に比較することにより情報信号の振幅
が急激に大きくなる時間領域を検出して、その大きくな
り方の程度により分割率を決定する。
当パターンへの割当とそれに付加するその他の少なくと
も1つのビット割当との分割率は、情報信号の時間変化
特性に依存する。本実施例では、直交変換時間ブロック
サイズを更に分割した時間区間毎に信号情報のピーク値
を隣接ブロック毎に比較することにより情報信号の振幅
が急激に大きくなる時間領域を検出して、その大きくな
り方の程度により分割率を決定する。
【0044】時間変化率計算は次のように行なう。
【0045】Vt=ΣVm Vav=(1/Vmax)*(1/Ch)Vt ここで Vt :各チャネルの時間サブブロックのピーク値の小か
ら大への変化をdB値で表したもののチャネルに関する
和 Vm :各チャネルの時間サブブロックのピーク値の小か
ら大への変化をdB値で表したもので一番大きいものの
大きさ。ただし最大値を39dBに制限し、Vmax であ
らわす。
ら大への変化をdB値で表したもののチャネルに関する
和 Vm :各チャネルの時間サブブロックのピーク値の小か
ら大への変化をdB値で表したもので一番大きいものの
大きさ。ただし最大値を39dBに制限し、Vmax であ
らわす。
【0046】m:チャネル番号 Ch:チャネル数 Vav:時間サブブロックのピーク値の小から大への変化
をdB値で表したもののチャネル平均 このようにして求められたVavと第1のビット割当量と
は、図12に示すように対応付けられる。
をdB値で表したもののチャネル平均 このようにして求められたVavと第1のビット割当量と
は、図12に示すように対応付けられる。
【0047】最終的に第1のビット割当量は次の式で求
められる。
められる。
【0048】B=1/2(Bf+Bt) ここで、B:最終的な第1のビット割当量 Bf:Tavより求められたビット割当量 Bt:Vavより求められたビット割当量 このようにして第1のビット割当に使用されるビット量
が決定されたら、第1のビット割当の各チャネルに対し
て割当が行なわれる。
が決定されたら、第1のビット割当の各チャネルに対し
て割当が行なわれる。
【0049】この場合信号の性質により、種々の選択を
することが出来る。もちろんスケールファクタの周波数
軸上の分布をみて適応的にビット割当を行なってもよ
い。この場合全チャネルのスケールファクタの周波数軸
上の分布をみて、チャネル間でのビット割当を行なうこ
とで、有効なビット割当を行なうことができる。この場
合、複数チャネルの信号情報がスピーカの場合のように
同一音場のなかで混合されて左右の耳に達するとする
と、全チャネル信号の加算されたものでマスキングがき
くと考えてよいから、各チャネルが同一のノイスレベル
になるようにビット割当を行なうことが有効である。こ
のためにはスケールファクタ指標の大きさに比例したビ
ット割当を行なえばよい。
することが出来る。もちろんスケールファクタの周波数
軸上の分布をみて適応的にビット割当を行なってもよ
い。この場合全チャネルのスケールファクタの周波数軸
上の分布をみて、チャネル間でのビット割当を行なうこ
とで、有効なビット割当を行なうことができる。この場
合、複数チャネルの信号情報がスピーカの場合のように
同一音場のなかで混合されて左右の耳に達するとする
と、全チャネル信号の加算されたものでマスキングがき
くと考えてよいから、各チャネルが同一のノイスレベル
になるようにビット割当を行なうことが有効である。こ
のためにはスケールファクタ指標の大きさに比例したビ
ット割当を行なえばよい。
【0050】Bm=B*ΣSFn/S S=Σ(ΣSFn) ここで、Bm:各チャネルへの第1のビット割当量 B:全チャネルへの第1のビット割当量 SFn:スケールファクタ指標で概略ピーク値の対数に対
応している。
応している。
【0051】n:ブロックフローティングバンド番号 m:チャネル番号 S:全チャネルのスケールファクタ指標の和 次に第1のビット割当で使われなかったビットについて
の割当に移る。ここでは多種のビット割当が行なわれ
る。
の割当に移る。ここでは多種のビット割当が行なわれ
る。
【0052】(1)全てのサンプル値に対する均一割当 この場合のビット割当に対する量子化雑音スペクトルを
図13に示す。全周波数帯域で均一の雑音レベル低減が
行える。
図13に示す。全周波数帯域で均一の雑音レベル低減が
行える。
【0053】(2)信号情報の周波数スペクトル及びレベ
ルに対する依存性を持たせた聴覚的な効果を得るための
ビット割当 この場合のビット割当に対する量子化雑音スペクトルの
一例を図14に示す。この例では情報信号のスペクトル
に依存させたビット割当を行っていて、特に、情報信号
のスペクトルの低域側にウェイトをおいたビット割当を
行い高域側に比して起きる低域側でのマスキング効果の
減少を補償している。これは、隣接臨界帯域間でのマス
キングを考慮してスペクトルの低域側を重視したマスキ
ングカーブの非対象性に基づいている。これらの図1
3、14において、曲線aが信号スペクトルを、破線の
曲線bが第1のビット割当による雑音レベルを、また破
線の曲線cが第2のビット割当による雑音レベルをそれ
ぞれ示している。さらに、それぞれのビット割当の様子
を図15、16に示す。
ルに対する依存性を持たせた聴覚的な効果を得るための
ビット割当 この場合のビット割当に対する量子化雑音スペクトルの
一例を図14に示す。この例では情報信号のスペクトル
に依存させたビット割当を行っていて、特に、情報信号
のスペクトルの低域側にウェイトをおいたビット割当を
行い高域側に比して起きる低域側でのマスキング効果の
減少を補償している。これは、隣接臨界帯域間でのマス
キングを考慮してスペクトルの低域側を重視したマスキ
ングカーブの非対象性に基づいている。これらの図1
3、14において、曲線aが信号スペクトルを、破線の
曲線bが第1のビット割当による雑音レベルを、また破
線の曲線cが第2のビット割当による雑音レベルをそれ
ぞれ示している。さらに、それぞれのビット割当の様子
を図15、16に示す。
【0054】図14、16では低域を重視した第2のビ
ット割当が行なわれている。本実施例では、第2のビッ
ト割当用として、短い時間のブロックのビット量を各周
波数に分布させた、種々のパターンを持つ。とくに本実
施例では、中低域と高域とのビット割当率を違えたパタ
ーンを複数個用意している。そして、信号の大きさが小
さいほど、高域への割当量が少ないパターンを選択する
ようにする。このようにして、小さい信号の時ほど高域
の感度が低下するラウドネス効果を生かせる。このとき
の信号の大きさとしては、全帯域の信号の大きさを使用
することも出来るが、さらにはフィルタなどが用いられ
ている、非ブロッキング周波数分割回路の出力、もしく
はMDCT出力を利用する。
ット割当が行なわれている。本実施例では、第2のビッ
ト割当用として、短い時間のブロックのビット量を各周
波数に分布させた、種々のパターンを持つ。とくに本実
施例では、中低域と高域とのビット割当率を違えたパタ
ーンを複数個用意している。そして、信号の大きさが小
さいほど、高域への割当量が少ないパターンを選択する
ようにする。このようにして、小さい信号の時ほど高域
の感度が低下するラウドネス効果を生かせる。このとき
の信号の大きさとしては、全帯域の信号の大きさを使用
することも出来るが、さらにはフィルタなどが用いられ
ている、非ブロッキング周波数分割回路の出力、もしく
はMDCT出力を利用する。
【0055】以上述べたビット割当機能をまとめたもの
が図17である。MDCT係数入力端子1701からの
MDCT係数が帯域毎のエネルギ算出機能部1703に
送られ、帯域毎のエネルギ算出機能部1703でスペク
トルの分布を算出し、スペクトルの滑らかさ算出機能部
1708ではスペクトル分布の形状の滑らかさ程度が算
出される。この図17では、使用可能総ビットは1チャ
ネル分として100kbps と設定してある。
が図17である。MDCT係数入力端子1701からの
MDCT係数が帯域毎のエネルギ算出機能部1703に
送られ、帯域毎のエネルギ算出機能部1703でスペク
トルの分布を算出し、スペクトルの滑らかさ算出機能部
1708ではスペクトル分布の形状の滑らかさ程度が算
出される。この図17では、使用可能総ビットは1チャ
ネル分として100kbps と設定してある。
【0056】マルチチャネルの場合にはチャネル拡張が
行なわれるため、それに相応したビット量の増加が設定
される。ビット分割率決定機能部1709は、チャネル
内ではスペクトルの滑らかさ算出機能部1708の出力
により分割率を決定するが、マルチチャネルの場合には
ビット分割率決定機能部1709はチャネル内のみでは
なく、帯域毎のエネルギ算出機能部1703の出力も考
え合わせたチャネル間のビット分割率の決定に関与す
る。帯域毎のエネルギ算出機能部1703の出力は、エ
ネルギ依存のビット配分演算機能部1704に与えられ
て、スペクトルの持つエネルギに比例した配分量が演算
される。エネルギ依存のビット配分演算機能部1704
と固定のビット配分設定機能部1705の出力は、それ
ぞれ掛け算機能部1711及び1712でビット分割率
決定機能部1709の出力との積を取られる。ビット分
割率決定機能部1709の2つの出力は、和が1となる
ように設定される。2つの掛け算機能部1711、17
12からの各出力は、加算機能部1706で加算されて
出力端子1707より取り出される。
行なわれるため、それに相応したビット量の増加が設定
される。ビット分割率決定機能部1709は、チャネル
内ではスペクトルの滑らかさ算出機能部1708の出力
により分割率を決定するが、マルチチャネルの場合には
ビット分割率決定機能部1709はチャネル内のみでは
なく、帯域毎のエネルギ算出機能部1703の出力も考
え合わせたチャネル間のビット分割率の決定に関与す
る。帯域毎のエネルギ算出機能部1703の出力は、エ
ネルギ依存のビット配分演算機能部1704に与えられ
て、スペクトルの持つエネルギに比例した配分量が演算
される。エネルギ依存のビット配分演算機能部1704
と固定のビット配分設定機能部1705の出力は、それ
ぞれ掛け算機能部1711及び1712でビット分割率
決定機能部1709の出力との積を取られる。ビット分
割率決定機能部1709の2つの出力は、和が1となる
ように設定される。2つの掛け算機能部1711、17
12からの各出力は、加算機能部1706で加算されて
出力端子1707より取り出される。
【0057】本発明では以上に加えて、各チャネルの信
号の時間変化特性を検出して、この指標によってチャネ
ル毎のビット割当量を変えるプロセスを持つ。この時間
変化を表す指標は次のようにして求められる。
号の時間変化特性を検出して、この指標によってチャネ
ル毎のビット割当量を変えるプロセスを持つ。この時間
変化を表す指標は次のようにして求められる。
【0058】図18に示すように、今オーディオチャネ
ルが8チャネルあると、それぞれのチャネルの情報入力
信号についてビット割当の時間単位であるビット割当時
間ブロックを時間的に4分割し、それぞれの時間ブロッ
クのピーク値を得る。そして各サブブロックのピーク値
が小から大へと変わる差分の大きさに応じてチャネル間
でビットを分け合う。今このビット割当のために8チャ
ネル合計でCビット使えるとき、各チャネルの各サブブ
ロックのピーク値が小から大へと変わる差分の大きさが
夫々a,b,c,d,e,f,g,hdBとすると、そ
れぞれC*a/T,C*b/T, ... ,C*h/T ビットと割り当て
ることができる。ここでT=a+b+c+d+e+f+
g+hである。信号情報が大きくなる程度が大であるほ
どそのチャネルに対してのビット割当量が大きくなる。
ルが8チャネルあると、それぞれのチャネルの情報入力
信号についてビット割当の時間単位であるビット割当時
間ブロックを時間的に4分割し、それぞれの時間ブロッ
クのピーク値を得る。そして各サブブロックのピーク値
が小から大へと変わる差分の大きさに応じてチャネル間
でビットを分け合う。今このビット割当のために8チャ
ネル合計でCビット使えるとき、各チャネルの各サブブ
ロックのピーク値が小から大へと変わる差分の大きさが
夫々a,b,c,d,e,f,g,hdBとすると、そ
れぞれC*a/T,C*b/T, ... ,C*h/T ビットと割り当て
ることができる。ここでT=a+b+c+d+e+f+
g+hである。信号情報が大きくなる程度が大であるほ
どそのチャネルに対してのビット割当量が大きくなる。
【0059】最終的なビット割当は以上の各ビット割当
の和として与えられる。
の和として与えられる。
【0060】次に画像高能率符号チャネルについて説明
する。図9において画像情報入力端子910からの画像
情報は、例えば輝度、色差信号で構成され別々の処理が
施される。端子910からの画像情報はローカルデコー
ダ出力との差分を得るための減算機能部911により時
間的に隣接したフレーム間での差分を得る。これにより
フレーム間で良く似た画像は情報量が少なくなる。差分
出力はマッピング機能部912で小エリアごとの直交変
換、よく使われる例としてはDCT変換、を受ける。変
換信号は信号スペクトルレベル検出機能部916でスペ
クトルの大きさが検出され、そのスペクトルの大きさに
応じたビット割当が計算される。マッピング機能部91
2の出力スペクトルは量子化機能部912で量子化され
た後逆量子化機能部922、逆マッピング機能部921
で差分再生信号が作られる。加算機能部920は逆マッ
ピング機能部921出力と予測信号917の和をとり新
たな予測信号とする。その過程で動き検出及び補正機能
部918によりフレーム間の動き方向及び領域及び動き
量が検出されて補正される。以上の用にして音響及び画
像の各チャネルでの要求ビット量が決定されるが音響及
び画像の全チャネルに与えるビット量をある一定量で制
限する。これによりメディアに記録できる時間長の最低
値が保証される。
する。図9において画像情報入力端子910からの画像
情報は、例えば輝度、色差信号で構成され別々の処理が
施される。端子910からの画像情報はローカルデコー
ダ出力との差分を得るための減算機能部911により時
間的に隣接したフレーム間での差分を得る。これにより
フレーム間で良く似た画像は情報量が少なくなる。差分
出力はマッピング機能部912で小エリアごとの直交変
換、よく使われる例としてはDCT変換、を受ける。変
換信号は信号スペクトルレベル検出機能部916でスペ
クトルの大きさが検出され、そのスペクトルの大きさに
応じたビット割当が計算される。マッピング機能部91
2の出力スペクトルは量子化機能部912で量子化され
た後逆量子化機能部922、逆マッピング機能部921
で差分再生信号が作られる。加算機能部920は逆マッ
ピング機能部921出力と予測信号917の和をとり新
たな予測信号とする。その過程で動き検出及び補正機能
部918によりフレーム間の動き方向及び領域及び動き
量が検出されて補正される。以上の用にして音響及び画
像の各チャネルでの要求ビット量が決定されるが音響及
び画像の全チャネルに与えるビット量をある一定量で制
限する。これによりメディアに記録できる時間長の最低
値が保証される。
【0061】図9において、任意の1チャネルのビット
割当機能部908の出力は各チャネルのビット割当機能
部からの各出力と共にマスタービット割当機能部909
に与えられる。マスタービット割当機能部909は、全
チャネルから得られたそれぞれのチャネルのビット割当
情報を元として、システムの全チャネルに与えることが
できるビット量を勘案して、不足の場合には、まず上記
サラウンドチャネルのビット量から削減をしていく。そ
の方法しては、まずサラウンドチャネルの帯域を22k
Hzから15kHzに狭めることから始める。これによ
る音質劣化は小さいものに留まる。次に15kHz以下
の帯域でのマルチチャネル符号化(multi channel codi
ng)を導入してビット削減を行なう。マルチチャネル符
号化は複数チャネルのスペクトルをひとまとめにしてコ
ーディングする方法であり、次のようなものがある。
割当機能部908の出力は各チャネルのビット割当機能
部からの各出力と共にマスタービット割当機能部909
に与えられる。マスタービット割当機能部909は、全
チャネルから得られたそれぞれのチャネルのビット割当
情報を元として、システムの全チャネルに与えることが
できるビット量を勘案して、不足の場合には、まず上記
サラウンドチャネルのビット量から削減をしていく。そ
の方法しては、まずサラウンドチャネルの帯域を22k
Hzから15kHzに狭めることから始める。これによ
る音質劣化は小さいものに留まる。次に15kHz以下
の帯域でのマルチチャネル符号化(multi channel codi
ng)を導入してビット削減を行なう。マルチチャネル符
号化は複数チャネルのスペクトルをひとまとめにしてコ
ーディングする方法であり、次のようなものがある。
【0062】図18において、今2つのチャネルの場合
について説明すると、2つの端子1801、1802か
らの各入力信号は、第1チャネル信号処理機能部180
3及び第2チャネル信号処理機能部1811に送られ、
各信号処理機能部1803、1811からは、それぞれ
一部がマルチプレックス機能部1808に、またそれぞ
れ他の一部が相関検出機能部1804に送られる。この
とき、それぞれ図9におけるブロック化機能部903の
周波数軸上のブロックごとに信号比較されて、スペクト
ルが似通っている場合には、信号ミックス機能部180
5によりミックスし平均化される。この時特に3〜5k
Hz以下の領域信号をミックスすることは定位感の劣化を
生ずるので、3〜5kHz以上の帯域に限ることとする。
について説明すると、2つの端子1801、1802か
らの各入力信号は、第1チャネル信号処理機能部180
3及び第2チャネル信号処理機能部1811に送られ、
各信号処理機能部1803、1811からは、それぞれ
一部がマルチプレックス機能部1808に、またそれぞ
れ他の一部が相関検出機能部1804に送られる。この
とき、それぞれ図9におけるブロック化機能部903の
周波数軸上のブロックごとに信号比較されて、スペクト
ルが似通っている場合には、信号ミックス機能部180
5によりミックスし平均化される。この時特に3〜5k
Hz以下の領域信号をミックスすることは定位感の劣化を
生ずるので、3〜5kHz以上の帯域に限ることとする。
【0063】この場合の再生時に使用されるレベル情報
としてスケールファクタが用いられる。以上により信号
路1806、1807にはチャネル独立の信号が得ら
れ、信号路1810にはチャネル間でミックス、平均化
された信号が得られる。このことによってチャネルごと
に信号伝送が必要でない帯域が得られビットの削減が達
成される。
としてスケールファクタが用いられる。以上により信号
路1806、1807にはチャネル独立の信号が得ら
れ、信号路1810にはチャネル間でミックス、平均化
された信号が得られる。このことによってチャネルごと
に信号伝送が必要でない帯域が得られビットの削減が達
成される。
【0064】これでもなおビット削減が必要な場合には
15kHzよりも帯域を狭くしてビット数を減らす。この
ようにして全チャネルのビット要求割当量がいかなる場
合でもある一定の量以上にしない。
15kHzよりも帯域を狭くしてビット数を減らす。この
ようにして全チャネルのビット要求割当量がいかなる場
合でもある一定の量以上にしない。
【0065】ビット要求量が増大していったときの帯域
削減の様子を図19に示す。この図19において、Aは
ビット削減を必要としないとき、Bは若干のビット削減
を必要とするとき、Cはさらにビット削減が必要なと
き、をそれぞれ示している。
削減の様子を図19に示す。この図19において、Aは
ビット削減を必要としないとき、Bは若干のビット削減
を必要とするとき、Cはさらにビット削減が必要なと
き、をそれぞれ示している。
【0066】次に図20にはオ−ディオ8チャネルが配
置される様子を示す。この図20において、Cは中央チ
ャネル、Lは左チャネル、Rは右チャネル、LCは左中
央チャネル、RCは右中央チャネル、SWはサブウーフ
ァチャネル、SLはサラウンド左チャネル、SRはサラ
ウンド右チャネルをそれぞれ示している。この図20の
例では、聴取者の前方に6チャネル背後に2チャネルが
配置される。
置される様子を示す。この図20において、Cは中央チ
ャネル、Lは左チャネル、Rは右チャネル、LCは左中
央チャネル、RCは右中央チャネル、SWはサブウーフ
ァチャネル、SLはサラウンド左チャネル、SRはサラ
ウンド右チャネルをそれぞれ示している。この図20の
例では、聴取者の前方に6チャネル背後に2チャネルが
配置される。
【0067】次に、時間と共に変わるビット要求量とビ
ット配分量の様子を図21に示している。画像ビット配
分量A、音響ビット配分量(フロントチャネル)B、音
響ビット配分量(サラウンドチャネル)Cは、時間と共
に変動する。時刻a以前及び時刻bから時刻cまでの間
は、全チャネルから要求されるビット量は前もって定め
た全チャネル最大ビット量よりも小さいので、要求ビッ
ト量がそのまま使用される。これに対して時刻aから時
刻b及び時刻c以降は、全チャネルから要求されるビッ
ト量は前もって定めた全チャネル最大ビット量よりも大
きくなってしまう。このとき全チャネル最大ビット量以
内にビット制限を加えるが、まず最初には音響ビット配
分量(サラウンドチャネル)Cが削減される。このため
には、帯域制限時にはステレオコ−ディングが用いられ
る。
ット配分量の様子を図21に示している。画像ビット配
分量A、音響ビット配分量(フロントチャネル)B、音
響ビット配分量(サラウンドチャネル)Cは、時間と共
に変動する。時刻a以前及び時刻bから時刻cまでの間
は、全チャネルから要求されるビット量は前もって定め
た全チャネル最大ビット量よりも小さいので、要求ビッ
ト量がそのまま使用される。これに対して時刻aから時
刻b及び時刻c以降は、全チャネルから要求されるビッ
ト量は前もって定めた全チャネル最大ビット量よりも大
きくなってしまう。このとき全チャネル最大ビット量以
内にビット制限を加えるが、まず最初には音響ビット配
分量(サラウンドチャネル)Cが削減される。このため
には、帯域制限時にはステレオコ−ディングが用いられ
る。
【0068】これでも無理なときは、フロント音響チャ
ネルの帯域幅制限、そしてマルチチャネル符号化(mult
i channel coding)、さらに帯域幅制限へと移行する。
ネルの帯域幅制限、そしてマルチチャネル符号化(mult
i channel coding)、さらに帯域幅制限へと移行する。
【0069】図22は、音響ビット配分量(フロントチ
ャネル)B、音響ビット配分量(サラウンドチャネル)
Cにそれぞれかならず割り当てる最小ビット割当量を規
定することで、大量のビット割当の要求があったときに
でも音響情報に最低限のビット割当を行なうものであ
る。図22では音響ビット配分量(フロントチャネル)
BにはB1が、音響ビット配分量(サラウンドチャネ
ル)CにはB2が保証される。この音響に対する最低限
のビット割当量は、フロントチャネルの最狭帯域に対し
て必要とされるビット割当て量となり、かなり小さいも
のが想定される。
ャネル)B、音響ビット配分量(サラウンドチャネル)
Cにそれぞれかならず割り当てる最小ビット割当量を規
定することで、大量のビット割当の要求があったときに
でも音響情報に最低限のビット割当を行なうものであ
る。図22では音響ビット配分量(フロントチャネル)
BにはB1が、音響ビット配分量(サラウンドチャネ
ル)CにはB2が保証される。この音響に対する最低限
のビット割当量は、フロントチャネルの最狭帯域に対し
て必要とされるビット割当て量となり、かなり小さいも
のが想定される。
【0070】図9に戻って、マスタービット割当て機能
部909及び第2のビット割当機能部923、924に
ついて説明する。マスタービット割当機能部909は全
チャネルで要求されるビット量を算出し割り当て可能な
最大量との関係を見る。もしも全チャネルで要求される
ビット量が割り当て可能な最大量よりも小さければ、第
2のビット割当機能部923、924に対して、第1の
ビット割当機能部908、915の結果をそのまま使う
ように指示する。これに対して、全チャネルで要求され
るビット量が割り当て可能な最大量よりも大きければ、
マスタービット割当機能部909は図21、22で説明
したように各チャネルに割り当てる割当量を調整する。
その結果が第2のビット割当機能部923、924に対
して与えられ、最終的な各チャネルのビット割当が得ら
れる。
部909及び第2のビット割当機能部923、924に
ついて説明する。マスタービット割当機能部909は全
チャネルで要求されるビット量を算出し割り当て可能な
最大量との関係を見る。もしも全チャネルで要求される
ビット量が割り当て可能な最大量よりも小さければ、第
2のビット割当機能部923、924に対して、第1の
ビット割当機能部908、915の結果をそのまま使う
ように指示する。これに対して、全チャネルで要求され
るビット量が割り当て可能な最大量よりも大きければ、
マスタービット割当機能部909は図21、22で説明
したように各チャネルに割り当てる割当量を調整する。
その結果が第2のビット割当機能部923、924に対
して与えられ、最終的な各チャネルのビット割当が得ら
れる。
【0071】図23は、以上のビット割当動作における
ビット量が不足したときの概略的なビット割当削減の手
順を示すフローチャートである。
ビット量が不足したときの概略的なビット割当削減の手
順を示すフローチャートである。
【0072】この図23に示すように、先ずステップS
1において、オーディオのサラウンド左右(SL、S
R)チャネルのビット割当量を削減し、次のステップS
2で、オーディオのフロントの左右及び中央(L、R、
C)チャネルのビット割当量を削減し、さらに削減が必
要とされるときは、ステップS3に進んで、オーディオ
及びビデオの全チャネルのビット割当量を削減してい
る。
1において、オーディオのサラウンド左右(SL、S
R)チャネルのビット割当量を削減し、次のステップS
2で、オーディオのフロントの左右及び中央(L、R、
C)チャネルのビット割当量を削減し、さらに削減が必
要とされるときは、ステップS3に進んで、オーディオ
及びビデオの全チャネルのビット割当量を削減してい
る。
【0073】このビット割当削減動作の主としてオーデ
ィオ成分についてのビット削減動作のより詳しい手順
を、図24のフローチャートに示している。
ィオ成分についてのビット削減動作のより詳しい手順
を、図24のフローチャートに示している。
【0074】すなわち、先ずステップS11にて各チャ
ネルの要求ビットレートを算出し、次のステップS12
で全チャネルの要求ビットレートを算出した後、ステッ
プS13で、この要求ビットレートと予め定められてい
る使用可能ビットレートとを比較する。要求ビットレー
トが使用可能ビットレートよりも小さいときはビット削
減を行わない。ステップS13で要求ビットレートが使
用可能ビットレートより大とされたときは、ステップS
14に進んで、オーディオのサラウンド左右(SL、S
R)チャネルの帯域15kHzまでのビット割当量を削減
し、次のステップS15で再び使用可能ビットレートと
比較する。ここでも使用可能ビットレートより大のとき
は、次のステップS16に進んで、オーディオのサラウ
ンド左右(SL、SR)チャネルをまとめて符号化する
マルチチャネル符号化あるいはステレオ符号化によりビ
ット削減を行う。次のステップS17で使用可能ビット
レートと比較して、使用可能ビットレートより大のとき
は、ステップS18によりオーディオのサラウンド左右
(SL、SR)チャネルの帯域5kHzまでのビット割当
量を削減する。さらに、ステップS19でも使用可能ビ
ットレートと比較して、使用可能ビットレートより要求
ビットレートが大のときは、ステップS20に進んで、
オーディオのフロントの左右及び中央(L、R、C)チ
ャネルのビット割当量を削減する。なお、ステップS1
5、17、19の比較時に、要求ビットレートが使用可
能ビットレートより小となれば、ビット割当量の削減を
終了して次の処理に移行することは勿論である。
ネルの要求ビットレートを算出し、次のステップS12
で全チャネルの要求ビットレートを算出した後、ステッ
プS13で、この要求ビットレートと予め定められてい
る使用可能ビットレートとを比較する。要求ビットレー
トが使用可能ビットレートよりも小さいときはビット削
減を行わない。ステップS13で要求ビットレートが使
用可能ビットレートより大とされたときは、ステップS
14に進んで、オーディオのサラウンド左右(SL、S
R)チャネルの帯域15kHzまでのビット割当量を削減
し、次のステップS15で再び使用可能ビットレートと
比較する。ここでも使用可能ビットレートより大のとき
は、次のステップS16に進んで、オーディオのサラウ
ンド左右(SL、SR)チャネルをまとめて符号化する
マルチチャネル符号化あるいはステレオ符号化によりビ
ット削減を行う。次のステップS17で使用可能ビット
レートと比較して、使用可能ビットレートより大のとき
は、ステップS18によりオーディオのサラウンド左右
(SL、SR)チャネルの帯域5kHzまでのビット割当
量を削減する。さらに、ステップS19でも使用可能ビ
ットレートと比較して、使用可能ビットレートより要求
ビットレートが大のときは、ステップS20に進んで、
オーディオのフロントの左右及び中央(L、R、C)チ
ャネルのビット割当量を削減する。なお、ステップS1
5、17、19の比較時に、要求ビットレートが使用可
能ビットレートより小となれば、ビット割当量の削減を
終了して次の処理に移行することは勿論である。
【0075】図5は、このようにして高能率符号化され
た信号を再び復号化するための復号回路を示している。
各帯域の量子化されたMDCT係数は、復号回路入力5
01、502、503及び504に与えられる。復号化
機能部505では適応ビット割当情報を用いてビット割
当を解除する。次にIMDCT回路506、507、5
08及び509で周波数軸上の信号が時間軸上の信号に
変換される。これらの部分帯域の時間軸上信号は、合成
フィルタ機能部510により、全周波数帯域信号に復号
化される。
た信号を再び復号化するための復号回路を示している。
各帯域の量子化されたMDCT係数は、復号回路入力5
01、502、503及び504に与えられる。復号化
機能部505では適応ビット割当情報を用いてビット割
当を解除する。次にIMDCT回路506、507、5
08及び509で周波数軸上の信号が時間軸上の信号に
変換される。これらの部分帯域の時間軸上信号は、合成
フィルタ機能部510により、全周波数帯域信号に復号
化される。
【0076】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、オーディオ信号やビデオ信号
のチャネル数、あるいは周波数分割帯域、総ビット数や
各信号への割当最大ビット数等は実施例の各値に限定さ
れず、また、直交変換もMDCTに限定されないもので
あることは勿論である。
るものではなく、例えば、オーディオ信号やビデオ信号
のチャネル数、あるいは周波数分割帯域、総ビット数や
各信号への割当最大ビット数等は実施例の各値に限定さ
れず、また、直交変換もMDCTに限定されないもので
あることは勿論である。
【0077】
【発明の効果】以上の説明からも明らかなように、本発
明に係る高能率符号化方法や装置によれば、画像情報チ
ャネルと音響情報チャネルを持つシステムにおいて、画
像情報チャネルと音響情報チャネルの全てのチャネルを
合わせた総ビットレ−トを可変とし、かつ一定の最大値
を越えないようなビット配分を行なわせることにより、
録音録画時間を必ず保証でき、録音録画時間の不足のた
めに1回きりの録音録画チャンスを逃がしたり何回もや
りなおしたりする必要がない。それと同時にビット配分
をそれほど行なわなくてもよい時間帯域にはビットを割
り振る量を削減するので録画録音時間を最大限長くする
ことが可能となる。これにより追加の録画録音を行なう
ことが可能となる。
明に係る高能率符号化方法や装置によれば、画像情報チ
ャネルと音響情報チャネルを持つシステムにおいて、画
像情報チャネルと音響情報チャネルの全てのチャネルを
合わせた総ビットレ−トを可変とし、かつ一定の最大値
を越えないようなビット配分を行なわせることにより、
録音録画時間を必ず保証でき、録音録画時間の不足のた
めに1回きりの録音録画チャンスを逃がしたり何回もや
りなおしたりする必要がない。それと同時にビット配分
をそれほど行なわなくてもよい時間帯域にはビットを割
り振る量を削減するので録画録音時間を最大限長くする
ことが可能となる。これにより追加の録画録音を行なう
ことが可能となる。
【0078】また、ビット配分の要求量が配分できる一
定の最大値を越えた場合には全チャネルの中で、特にオ
ーディオサラウンドチャネルを優先的にビット削減の対
象とする。これにより全体的な音質や画質の劣化を最低
に抑えながら、マルチ情報の高能率符号化を行なう場合
に効率を更に上げ、かつ記録可能時間をエンコード前に
確定できる。
定の最大値を越えた場合には全チャネルの中で、特にオ
ーディオサラウンドチャネルを優先的にビット削減の対
象とする。これにより全体的な音質や画質の劣化を最低
に抑えながら、マルチ情報の高能率符号化を行なう場合
に効率を更に上げ、かつ記録可能時間をエンコード前に
確定できる。
【0079】このような効果は、本発明に係る高能率符
号記録方法及び高能率符号伝送方法の場合も同様にいえ
ることである。
号記録方法及び高能率符号伝送方法の場合も同様にいえ
ることである。
【図1】本発明に係る高能率符号化方法の実施例に用い
られるチャネル毎の高能率符号化装置の構成例を示すブ
ロック回路図である。
られるチャネル毎の高能率符号化装置の構成例を示すブ
ロック回路図である。
【図2】該実施例装置の信号の周波数分割を示す図であ
る。
る。
【図3】該実施例装置の信号の周波数及び時間分割を示
す図である。
す図である。
【図4】可変ゲイン特性のウィンドウの働きを示す図で
ある。
ある。
【図5】本発明に係る高能率符号復号化方法の実施例に
用いられるチャネル毎の高能率復号化装置の構成例を示
すブロック回路図である。
用いられるチャネル毎の高能率復号化装置の構成例を示
すブロック回路図である。
【図6】本発明に係る高能率符号化方法の実施例の複数
のオーディオチャネルと複数の画像チャネルを表す図で
ある。
のオーディオチャネルと複数の画像チャネルを表す図で
ある。
【図7】複数のオーディオチャネル記録系の構成図であ
る。
る。
【図8】複数のオーディオチャネル再生系の構成図であ
る。
る。
【図9】本発明の実施例における複数のオーディオチャ
ネルと画像チャネルの間でのビット配分を含むエンコー
ダーの説明図である。
ネルと画像チャネルの間でのビット配分を含むエンコー
ダーの説明図である。
【図10】スペクトルのトーナリティ計算を説明するた
めの図である。
めの図である。
【図11】トーナリティとビット配分の関係を示す図で
ある。
ある。
【図12】信号時間変化率とビット配分の関係を示す図
である。
である。
【図13】第2のビット割当において。均一割当の時の
ノイズスペクトルを示す図である。
ノイズスペクトルを示す図である。
【図14】情報信号の周波数スペクトル及びレベルに対
する依存性を持たせた聴覚的な効果を得るためのビット
割当によるノイズスペクトルの例を示す図である。
する依存性を持たせた聴覚的な効果を得るためのビット
割当によるノイズスペクトルの例を示す図である。
【図15】第2のビット割当量が、均一なときのビット
割当の例を示す図である。
割当の例を示す図である。
【図16】第2のビット割当量が、情報信号の周波数ス
ペクトル及びレベルに対する依存性を持たした聴覚的な
効果を持つようにしたときのビット割当の例を示す図で
ある。
ペクトル及びレベルに対する依存性を持たした聴覚的な
効果を持つようにしたときのビット割当の例を示す図で
ある。
【図17】チャネル内ビット割当の例を示す図である。
【図18】ステレオコーディングの例を示す図である。
【図19】ビット割当制限による周波数帯域制限を示す
図である。
図である。
【図20】マルチチャネルオーディオ再生のスピーカー
配置を示す図である。
配置を示す図である。
【図21】オーディオチャネルと画像チャネル間でのビ
ット割当動作を示す図である。
ット割当動作を示す図である。
【図22】オーディオチャネルと画像チャネル間でのビ
ット割当動作の他の例を示す図である。
ット割当動作の他の例を示す図である。
【図23】ビット量が不足したときのビット割当を削減
して行く手順を示すフローチャートである。
して行く手順を示すフローチャートである。
【図24】ビット量が不足したときのビット割当を削減
して行く手順を示す詳細なフローチャートである。
して行く手順を示す詳細なフローチャートである。
【符号の説明】 10 高能率符号化回路入力端子 11 分割フィルタ 12、13、14、15 MDCT回路 16 適応ビット割当ブロック 17、18、19、20 符号化出力端子 501、502、503、504 高能率復号化回路入
力端子 505 復号化機能部 506、507、508、509 IMDCT回路 510 合成フィルタ 511 出力端子 901 音響入力端子 902 マッピング機能部 903 ブロック機能部 904 正規化機能部 905 信号時間変化検出機能部 906 スケールファクタ算出機能部 907 トーナリティ算出機能部 908 ビット割当機能部 909 マスタービット割当機能部 910 画像入力端子 911 減算機能部 912 マッピング機能部 913 量子化機能部 914、915 ビット割当機能部 916 スペクトルレベル検出機能部 917 帰還信号路 918 動き検出機能部 919 フレームメモリ機能部 920 加算機能部 921 逆マッピング機能部 922 逆量子化機能部 1700 ビット割当算出機能部 1701 MDCT回路出力供給端子 1702 使用可能総ビット 1703 帯域毎のエネルギ算出部 1704 エネルギ依存のビット配分部 1705 固定のビット配分部 1706 加算機能部 1707 出力端子 1708 スペクトルの滑らかさ算出機能部 1709 ビット分割率決定機能部 1801 第1チャネル入力端子 1802 第2チャネル入力端子 1803 第1チャネル信号処理機能部 1804 相関検出機能部 1805 信号ミックス機能部 1806 第1チャネル独立信号 1807 第2チャネル独立信号 1808 マルチプレックス機能部 1809 エンコード出力端子 1810 第1、第2チャネル共通信号 1811 第2チャネル信号処理機能部
力端子 505 復号化機能部 506、507、508、509 IMDCT回路 510 合成フィルタ 511 出力端子 901 音響入力端子 902 マッピング機能部 903 ブロック機能部 904 正規化機能部 905 信号時間変化検出機能部 906 スケールファクタ算出機能部 907 トーナリティ算出機能部 908 ビット割当機能部 909 マスタービット割当機能部 910 画像入力端子 911 減算機能部 912 マッピング機能部 913 量子化機能部 914、915 ビット割当機能部 916 スペクトルレベル検出機能部 917 帰還信号路 918 動き検出機能部 919 フレームメモリ機能部 920 加算機能部 921 逆マッピング機能部 922 逆量子化機能部 1700 ビット割当算出機能部 1701 MDCT回路出力供給端子 1702 使用可能総ビット 1703 帯域毎のエネルギ算出部 1704 エネルギ依存のビット配分部 1705 固定のビット配分部 1706 加算機能部 1707 出力端子 1708 スペクトルの滑らかさ算出機能部 1709 ビット分割率決定機能部 1801 第1チャネル入力端子 1802 第2チャネル入力端子 1803 第1チャネル信号処理機能部 1804 相関検出機能部 1805 信号ミックス機能部 1806 第1チャネル独立信号 1807 第2チャネル独立信号 1808 マルチプレックス機能部 1809 エンコード出力端子 1810 第1、第2チャネル共通信号 1811 第2チャネル信号処理機能部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H03M 7/30 Z 9382−5K H04N 5/92 7/24
Claims (44)
- 【請求項1】 少なくとも1個の画像情報チャネルと少
なくとも1個の音響情報チャネルを有し、全チャネルを
合わせた総ビットレ−トを、可変とすると共に一定の最
大値を越えないように制御することを特徴とする高能率
符号化方法。 - 【請求項2】 少なくとも1個の上記チャネルのデータ
は、入力信号に依存した可変ビットレート方式により圧
縮されることを特徴とする請求項1記載の高能率符号化
方法。 - 【請求項3】 上記音響情報チャネルは、サラウンドチ
ャネルを含むことを特徴とする請求項1又は2記載の高
能率符号化方法。 - 【請求項4】 上記音響情報チャネルは、サラウンドチ
ャネルを含み、全チャネルを合わせた総ビットレ−トが
一定の最大値を越えるときに上記音響情報サラウンドチ
ャネルのビットレートを他のチャネルよりも優先的に削
減することを特徴とする請求項3記載の高能率符号化方
法。 - 【請求項5】 上記ビットレート削減を、高域の帯域を
カットして行なうことを特徴とする請求項4記載の高能
率符号化方法。 - 【請求項6】 上記ビットレート削減を、マルチチャネ
ル符号化により行なうことを特徴とする請求項4記載の
高能率符号化方法。 - 【請求項7】 上記ビットレート削減の順序として、高
域の帯域を概略15kHz付近の帯域までカットして行な
った後に、マルチチャネル符号化により行なうことを特
徴とする請求項4記載の高能率符号化方法。 - 【請求項8】 上記ビットレート削減の順序として、高
域の帯域を概略15kHz付近の帯域までカットして行な
った後に、マルチチャネル符号化請求項5の方法により
概略最大3kHz付近まで行なうことを特徴とする請求項
4記載の高能率符号化方法。 - 【請求項9】 上記ビットレート削減の順序として、高
域の帯域を概略15kHz付近の帯域までカットして行な
った後に、マルチチャネル符号化請求項5の方法により
概略最大3kHz付近まで行ない、さらに、高域の帯域を
カットしてビット削減を行なうことを特徴とする請求項
4記載の高能率符号化方法。 - 【請求項10】 上記各チャネルの情報信号により、チ
ャネル間のビット割当を決めることを特徴とする請求項
1ないし9のいずれか1項に記載の高能率符号化方法。 - 【請求項11】 上記各チャネルの情報信号のエネルギ
値、ピーク値又は平均値などの振幅情報により、チャネ
ル間のビット割当を変化させることを特徴とする請求項
10記載の高能率符号化方法。 - 【請求項12】 上記各チャネルの情報信号のエネルギ
値、ピーク値又は平均値などの振幅情報の時間的変化に
より、チャネル間のビット割当を変化させることを加味
したことを特徴とする請求項11記載の高能率符号化方
法。 - 【請求項13】 上記各チャネルのスケールファクタに
より、チャネル間のビット割当を変化させることを特徴
とする請求項12記載の高能率符号化方法。 - 【請求項14】 上記各チャネルのスケールファクタ及
びチャネル内のビット割当結果によるワードレングスに
より、チャネル間のビット割当を変化させることを特徴
とする請求項13記載の高能率符号化方法。 - 【請求項15】 上記各チャネルごとに時間的に隣接し
た複数のブロックの振幅情報の時間的変化により、チャ
ネル内のビット割当を変化させることを特徴とする請求
項10ないし14のいずれか1項に記載の高能率符号化
方法。 - 【請求項16】 上記オ−ディオチャネルの各チャネル
でビット割当に使用できるビットが、時間と周波数につ
いて細分化された小ブロック中の信号の大きさを表す指
標のパターンに依存した第1のビット割当分と、前記第
1のビット割当に付加される聴覚上の効果のための少な
くとも一つのビット割当分に分割使用されることを特徴
とする請求項12記載の高能率符号化方法。 - 【請求項17】 上記ビット割当に使用できる全ビット
に関わる前記分割使用の分割比が情報信号により変更さ
れることを特徴とする請求項16記載の高能率符号化方
法。 - 【請求項18】 上記ビット割当に使用できる全ビット
に関わる前記分割使用の分割比が、情報信号の時間的変
化が大きいほど、前記時間と周波数について細分化され
た小ブロック中の信号の大きさを表す指標のパターンに
依存したビット割当分を減らすことを特徴とする請求項
17記載の高能率符号化方法。 - 【請求項19】 上記時間と周波数について細分化され
た小ブロック中のサンプルを、前記ブロック内では同一
の量子化をすることを特徴とする請求項18記載の高能
率符号化方法。 - 【請求項20】 上記時間と周波数について細分化され
た小ブロック中のサンプルを得るために、第1の周波数
分析を行なった後、前記第1の周波数分析の出力を第2
の周波数分析をすることを特徴とする請求項1ないし1
9のいずれか1項に記載の高能率符号化方法。 - 【請求項21】 上記第1の周波数分析の周波数帯域幅
が少なくとも最低域で同じであることを特徴とする請求
項20記載の高能率符号化方法。 - 【請求項22】 上記第1の周波数分析にはポリフェー
ズクォドラチュアフィルタを用いることを特徴とする請
求項20、21記載の高能率符号化方法。 - 【請求項23】 上記第1の周波数分析の周波数帯域幅
が少なくとも最高域で高域程広いことを特徴とする請求
項20記載の高能率符号化方法。 - 【請求項24】 上記第1の周波数分析にはクォドラチ
ュアミラーフィルタを用いることを特徴とする請求項2
0ないし23のいずれか1項に記載の高能率符号化方
法。 - 【請求項25】 上記第2の周波数分析には改良離散コ
サイン変換を用いることを特徴とする請求項20ないし
24のいずれか1項に記載の高能率符号化方法。 - 【請求項26】 上記第2の周波数分析は入力信号の時
間特性により適応的にそのブロックサイズを変更するこ
とを特徴とする請求項20ないし25のいずれか1項に
記載の高能率符号化方法。 - 【請求項27】 上記ブロックサイズの変更は少なくと
も2つの前記第1の周波数分析の出力帯域ごとに独立に
行なわれることを特徴とする請求項26記載の高能率符
号化方法。 - 【請求項28】 上記請求項1ないし27のいずれか1
項に記載の高能率符号化方法により圧縮符号化された情
報を記録媒体に記録したことを特徴とする高能率符号記
録方法。 - 【請求項29】 上記請求項1ないし27のいずれか1
項に記載の高能率符号化方法により圧縮符号化された情
報を伝送媒体を介して伝送することを特徴とする高能率
符号伝送方法。 - 【請求項30】 上記伝送媒体がディジタル情報伝送路
であることを特徴とする請求項29記載の高能率符号伝
送方法。 - 【請求項31】 少なくとも1個の画像情報チャネルと
少なくとも1個の音響情報チャネルを有する信号を高能
率符号化する高能率符号化装置において、全チャネルを
合わせた総ビットレ−トを可変とすると共に一定の最大
値を越えないように制御する制御手段を有することを特
徴とする高能率符号化装置。 - 【請求項32】 少なくとも1個の上記チャネルのデー
タは、入力信号に依存した可変ビットレート方式により
圧縮されることを特徴とする請求項31記載の高能率符
号化装置。 - 【請求項33】 上記音響情報チャネルは、サラウンド
チャネルを含むことを特徴とする請求項31又は32記
載の高能率符号化装置。 - 【請求項34】 上記音響情報チャネルは、サラウンド
チャネルを含み、全チャネルを合わせた総ビットレ−ト
が一定の最大値を越えるときに上記音響情報サラウンド
チャネルのビットレートを他のチャネルよりも優先的に
削減することを特徴とする請求項33記載の高能率符号
化装置。 - 【請求項35】 上記ビットレート削減を、高域の帯域
をカットして行なうことを特徴とする請求項34記載の
高能率符号化装置。 - 【請求項36】 上記ビットレート削減を、マルチチャ
ネル符号化により行なうことを特徴とする請求項34記
載の高能率符号化装置。 - 【請求項37】 上記各チャネルの情報信号により、チ
ャネル間のビット割当を決めることを特徴とする請求項
31ないし36のいずれか1項に記載の高能率符号化装
置。 - 【請求項38】 少なくとも1個の画像情報チャネルと
少なくとも1個の音響情報チャネルを有し、全チャネル
を合わせた総ビットレ−トを、可変とすると共に一定の
最大値を越えないように制御されて符号化された信号を
復号することを特徴とする高能率符号復号化方法。 - 【請求項39】 少なくとも1個の上記チャネルのデー
タは、入力信号に依存した可変ビットレート方式により
圧縮されることを特徴とする請求項38記載の高能率符
号復号化方法。 - 【請求項40】 上記音響情報チャネルは、サラウンド
チャネルを含むことを特徴とする請求項38又は39記
載の高能率符号復号化方法。 - 【請求項41】 上記音響情報チャネルは、サラウンド
チャネルを含み、全チャネルを合わせた総ビットレ−ト
が一定の最大値を越えるときに上記音響情報サラウンド
チャネルのビットレートを他のチャネルよりも優先的に
削減することを特徴とする請求項40記載の高能率符号
復号化方法。 - 【請求項42】 上記ビットレート削減を、高域の帯域
をカットして行なうことを特徴とする請求項41記載の
高能率符号復号化方法。 - 【請求項43】 上記ビットレート削減を、マルチチャ
ネル符号化により行なうことを特徴とする請求項41記
載の高能率符号復号化方法。 - 【請求項44】 上記各チャネルの情報信号により、チ
ャネル間のビット割当を決めることを特徴とする請求項
39ないし43のいずれか1項に記載の高能率符号復号
化方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP25783394A JPH08123488A (ja) | 1994-10-24 | 1994-10-24 | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP25783394A JPH08123488A (ja) | 1994-10-24 | 1994-10-24 | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08123488A true JPH08123488A (ja) | 1996-05-17 |
Family
ID=17311774
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP25783394A Pending JPH08123488A (ja) | 1994-10-24 | 1994-10-24 | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08123488A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2006019117A1 (ja) * | 2004-08-19 | 2006-02-23 | Nippon Telegraph And Telephone Corporation | 多チャネル信号符号化方法、その復号化方法、これらの装置、プログラム及びその記録媒体 |
| EP1840873A1 (en) | 2006-03-28 | 2007-10-03 | Sony Corporation | Audio signal encoding method, program of audio signal encoding method, recording medium having program of audio signal encoding method recorded thereon, and audio signal encoding device |
| JP2007316658A (ja) * | 1999-12-08 | 2007-12-06 | Fraunhofer-Ges Zur Foerderung Der Angewandten Forschung Ev | ステレオ音響信号の処理方法と装置 |
| WO2009057329A1 (ja) * | 2007-11-01 | 2009-05-07 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
| JP2011059685A (ja) * | 2009-09-04 | 2011-03-24 | Thomson Licensing | 基本層及び拡張層を有する音声信号を検出する方法 |
| JP2015520872A (ja) * | 2012-05-15 | 2015-07-23 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 複数サブストリームをもつマルチチャネル・オーディオ信号の効率的なエンコードおよびデコード |
-
1994
- 1994-10-24 JP JP25783394A patent/JPH08123488A/ja active Pending
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007316658A (ja) * | 1999-12-08 | 2007-12-06 | Fraunhofer-Ges Zur Foerderung Der Angewandten Forschung Ev | ステレオ音響信号の処理方法と装置 |
| WO2006019117A1 (ja) * | 2004-08-19 | 2006-02-23 | Nippon Telegraph And Telephone Corporation | 多チャネル信号符号化方法、その復号化方法、これらの装置、プログラム及びその記録媒体 |
| US7733973B2 (en) | 2004-08-19 | 2010-06-08 | The University Of Tokyo | Multichannel signal encoding method, its decoding method, devices for these, program, and its recording medium |
| CN1977309B (zh) | 2004-08-19 | 2010-11-10 | 日本电信电话株式会社 | 多信道信号编码方法、解码方法、用于该方法的装置和程序、以及其上存储程序的记录介质 |
| EP1840873A1 (en) | 2006-03-28 | 2007-10-03 | Sony Corporation | Audio signal encoding method, program of audio signal encoding method, recording medium having program of audio signal encoding method recorded thereon, and audio signal encoding device |
| JP2007264154A (ja) * | 2006-03-28 | 2007-10-11 | Sony Corp | オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置 |
| WO2009057329A1 (ja) * | 2007-11-01 | 2009-05-07 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
| US8352249B2 (en) | 2007-11-01 | 2013-01-08 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
| JP2011059685A (ja) * | 2009-09-04 | 2011-03-24 | Thomson Licensing | 基本層及び拡張層を有する音声信号を検出する方法 |
| JP2015520872A (ja) * | 2012-05-15 | 2015-07-23 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 複数サブストリームをもつマルチチャネル・オーディオ信号の効率的なエンコードおよびデコード |
| US9779738B2 (en) | 2012-05-15 | 2017-10-03 | Dolby Laboratories Licensing Corporation | Efficient encoding and decoding of multi-channel audio signal with multiple substreams |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3336618B2 (ja) | 高能率符号化方法及び高能率符号化信号の復号化方法 | |
| JP3134455B2 (ja) | 高能率符号化装置及び方法 | |
| JP3186292B2 (ja) | 高能率符号化方法及び装置 | |
| JP3278900B2 (ja) | データ符号化装置及び方法 | |
| US5774844A (en) | Methods and apparatus for quantizing, encoding and decoding and recording media therefor | |
| KR100295217B1 (ko) | 신호스펙트럼-의존양자화비트할당및노이즈스펙트럼-의존양자화비트할당으로서디지탈입력신호를압축하는장치 | |
| JP3277692B2 (ja) | 情報符号化方法、情報復号化方法及び情報記録媒体 | |
| JPWO1995002925A1 (ja) | 高能率符号化方法,高能率符号の復号化方法,高能率符号の符号化装置,高能率符号の復号化装置,高能率符号化・復号化システム,及び記録メディア | |
| JPH07160292A (ja) | 多層符号化装置 | |
| US5581654A (en) | Method and apparatus for information encoding and decoding | |
| PL182240B1 (pl) | Koder akustyczny wielokanalowy PL PL PL PL PL PL PL PL PL | |
| JPH06149292A (ja) | 高能率符号化方法及び装置 | |
| US7613609B2 (en) | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto | |
| JPH0846517A (ja) | 高能率符号化及び復号化システム | |
| JPH08123488A (ja) | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 | |
| WO1995016263A1 (en) | Information processing method, information processing device and media | |
| JP3291948B2 (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
| JP3227948B2 (ja) | 復号化装置 | |
| JP3227945B2 (ja) | 符号化装置 | |
| JPH06324093A (ja) | オーディオ信号のスペクトル表示装置 | |
| JPH07181996A (ja) | 情報処理方法、情報処理装置、及びメディア | |
| JPH07336231A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 | |
| KR100340368B1 (ko) | 고능률부호화장치,복호화장치및디지털데이터도출방법 | |
| JP3134384B2 (ja) | 符号化装置及び方法 | |
| JP3141853B2 (ja) | オーディオ信号処理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20031224 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040220 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040316 |
|
| A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20040416 |