JPH04177300A - 音声帯域分割符号化装置 - Google Patents

音声帯域分割符号化装置

Info

Publication number
JPH04177300A
JPH04177300A JP2305114A JP30511490A JPH04177300A JP H04177300 A JPH04177300 A JP H04177300A JP 2305114 A JP2305114 A JP 2305114A JP 30511490 A JP30511490 A JP 30511490A JP H04177300 A JPH04177300 A JP H04177300A
Authority
JP
Japan
Prior art keywords
subband
evaluation function
bit allocation
maximum value
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2305114A
Other languages
English (en)
Other versions
JP2906646B2 (ja
Inventor
Kiyotaka Nagai
永井 清隆
Koji Nakajima
康志 中嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2305114A priority Critical patent/JP2906646B2/ja
Priority to US07/786,798 priority patent/US5301255A/en
Publication of JPH04177300A publication Critical patent/JPH04177300A/ja
Application granted granted Critical
Publication of JP2906646B2 publication Critical patent/JP2906646B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、テープ、ディスク等の記録、再生系や通信、
放送等の伝送系の高能率符号化に用いられる音声帯域分
割符号化装置に関するものである。
従来の技術 近年、高品位音声信号の高能率符号化を実現する装置と
して、音声帯域分割符号化装置が注目を集めている。
従来の音声帯域分割符号化装置としては、例えばジー・
スイール(G、THFILE)等によりイー・ビー・ニ
ー・レビュー・テクニカル(EBU REvIEW−T
ECHNICAL)誌、 第230号、71頁〜94頁
、1988年8月に発表された「高品位音声信号の低ビ
ツトレート符号化 MASCAMシステムの紹介J  
(LOW  BIT−RATE  C0DING  O
F  HIGHQUALITY  AUDIO5IGN
ALS。
AN  lNTR0DUCTION  TOMASCA
M  SYSTEM)と題する論文(以下、文献1と呼
ぶ)や、アール・エヌ・ジエイ・フェルデユース(R,
N、J、VELDHUIS)等によりフィリップス・ジ
ャーナル・オブ・リサーチ(PHILIPS  JOU
RNAL  OF  RESEARCH)誌、 第44
巻、 273号、329頁〜343頁、  1989年
に発表された「デジタルオーディオ信号の帯域分割符号
化J  (SUBBAND  C0DING  OF 
 DIGITALAUDIO5IGNALS)と題する
論文(以下、文献2と呼ぶ)に記載されている。
以下図面を参照〔ながら、従来の音声帯域分割符号化装
置とその復号化装置について説明する。
第5図は、従来の音声帯域分割符号化装置のブロック図
を示すものである。
第5図において、51は分析フィルタ部、52は最大値
情報決定部、53は評価関数算出部、54はビット割当
決定部、55は量子化部、56は多重化部である。
以上のように構成された音声帯域分割符号化装置につい
て、以下その動作を説明する。
第5図において、分析フィルタ部51は、入力されたデ
ジタル音声信号を複数の部分帯域に分割するための複数
の帯域通過フィルタからなるフィルタ群である。デジタ
ル音声信号のサンプリング周波数が32kHzから48
kHzの場合、人間の聴覚特性の臨界帯域幅に対応して
16個から32個の部分帯域に分割される。分析フィル
タ部51はデジタルフィルタであり、例えばインチジャ
ーバンドフィルタバンク(I NTEGER−BAND
  FILTERBANK)によって構成される。イン
チジャーバンドフィルタバンクについては、エヌ・ニス
・ジャイアント(N、  S、  JAYANT) と
ピーー/ル(P、N0LL) によF)プレンティス・
ホール(PRENTI CB−HALL)社から198
4年に出版された「波形のデジタル符号化J  (DI
GITAL  C0DINGOF  WAVEFORM
S)と題する本の第11章(以下、文献3と呼ぶ)に記
載されている。
インチジャーバンドフィルタバンクでは、全帯域幅の部
分帯域の帯域幅に対する比が整数であり、この比で間引
きを行うことにより、帯域通過信号を低域周波数信号に
周波数変換することができる。
しかしながら間引きによって帯域の境界で折返し歪が発
生する。分析フィルタによって発生するこの折返し歪を
合成フィルタでキャンセルすることができるフィルタと
してクオドラチャミラーフィルタ(QUADRATUR
E  MIRRORFILTER,以下、QMFと呼ぶ
)が広く用いられている。QMFでは隣接する部分帯域
の信号の蛋子化幅が同一であるときには折返し歪をキャ
ンセルすることができる。分析フィルタ部51で複数の
部分帯域に分割された信号は5msから20m5の所定
の時間ををする区間に区切られる。
最大値情報決定部52は、分析フィルタ部51から各部
分帯域毎に区間内の信号の絶対値の最大値を求め、最大
値情報を出力する。最大値情報としては、例えば最大値
を6ビツトで対数量子化したものが用いられる。
評価関数算出部53は、聴覚のマスキング規則に基づい
て、ビット割当決定部54で最適なビット割当を行うた
めに必要な評価関数を算出する。
すなわち、部分帯域分割数をN1部分帯域番号をi (
低周波数から高周波数に順に番号をつける。
1≦i≦N)1部分帯域番号lの最大値情報をPll 
 信号のパワーをSi、信号によってマスクされるパワ
ー(以下、マスクドパワーと呼ぶ)をMi、1区間内の
間引き後のサンプル数をLi+  割当ビット数をBt
、1区間内でサンプル情報に割当可能な全ビット数をB
qとすると、部分帯域番号iの量子化雑音パワーは次式
で求められる。
(2P i / 2θ’) 2/ 12したがって、全
帯域の量子化雑音パワ一対マスクドパワー比(NOIS
E−To−MASK  RAT I O,以下、NMR
と呼ぶ)は次式で与えられる。
Σ (2P  i/ 2”) 2/(12M i)1 
露1 ビット割当決定部54は、次式に示す固定ビットレート
の条件の下でNMRを最小化するビット割当を行う。
このために評価関数算出部53は、部分帯域番号iの評
価関数Eiとして次式を計算し、出力する。
Ei=log2(Pi/Mi”2) =log2Pi  (log2Mi)/2第6図は評価
関数算出部53のフローチャートである。評価関数算出
部53では、最初に分析フィルタ部51からの各部分帯
域の信号を用い、各部分帯域の信号のパワーを算出する
。次に、各部分帯域の信号のパワーとマスキング規則と
に基づいて、帯域内の信号によってまた隣接帯域の信号
によってマスキングされて人間の耳には聞こえないマス
クドパワーを算出する。マスクドパワーの算出法につい
ては、例えば文献2の334頁〜338頁に記載されて
いる。次に、各部分帯域毎に、最大値情報決定部52か
らの最大値情報の2を底とする対数から、マスクドパワ
ーの2を底とする対数に2分の1を掛けたものを引くこ
とにより評価関数を求め、出力する。
第7図はビット割当決定部54のフローチャートである
。ビット割当決定部54は、ステップ1で初期化処理を
行った後、ステップ2とステップ3を繰り返すことによ
り、NMRを最小にする部分帯域番号iの割当ビット数
Biを決定し、出力する。
ステップ1では、割当可能なピント数BをBqに、Bi
(1≦i ≦N)を0に設定する。
ステップ2では、評価関数Eiを最大とする部分帯域番
号kを見い出す。
ステップ3では、割当可能なビット数BからLkを引く
。Bが0以上の場合、この部分帯域に割り当てるビット
数Bkを1増加させ、かつ評価関数Ekから1を引く。
Bが負の場合、ビット割当処理を終了する。
量子化部55は、分析フィルタ部51からの各部分帯域
の各区間の信号を最大値情報決定部52からの最大値情
報を用いて正規化し、ビット割当決定部54からのビッ
ト割当情報にしたがって各部分帯域の信号を量子化し、
サンプル情報として出力する。多重化部56は、量子化
部55からの各部分帯域のサンプル情報と最大値情報決
定部52からの各部分帯域の最大値情報とビット割当決
定部54からの各部分帯域のビット割当情報とを多重化
し、符号化信号を出力する。
最大値情報決定部52と評価関数算出部53とビット割
当決定部54と量子化部55と多重化部56はマイクロ
プロセッサで構成できる。
第8図は従来の音声帯域分割復号化装置のブロック図を
示すものである。
第8図において、81は逆多重化部、82は逆量子化部
、83は合成フィルタ部である。
以上のように構成された音声帯域分割復号化装置につい
て、以下その動作を説明する。
第8図において、逆多重化部81は、入力された符号化
信号を各区間に分離し、各区間の信号を各部分帯域毎の
サンプル情報と最大値情報とビット割当情報とに分離し
、出力する。逆量子化部82は、各部分帯域毎に、逆多
重化部81からのサンプル情報をピント割当情報を用い
て逆量子化を行い、次に最大値情報を用いて逆正規化し
、各部分帯域の各区間の信号を再生する。逆多重化部8
1と逆量子化部82はマイクロプロセッサで構成できる
。合成フィルタ部83は、複数の帯域通過フィルタから
なるフィルタ群であり、逆量子化部82からの各部分帯
域の各区間の信号を合成してデジタル音声信号を再生し
、出力する。合成フィルタ部83の各帯域通過フィルタ
は分析フィルタ51とペアをなすデジタルフィルタによ
って構成される。
発明が解決しようとする課題 しかしながら、上記従来の音声帯域分割符号化装置では
、マスキング規則を適用する際の近似誤差によりマスク
ドパワーに誤差を生じ、誤差を含んだ評価関数に基づい
てビット割当を行うので音声信号の品質が劣化するとい
う問題点を宵していた。文献2に記載されている音声帯
域分割符号化装置では、マスキング規則の適用時に分析
フィルタの間引きによって発生する折返し歪の影響を考
慮していないので、特に低域の部分帯域で折返し歪が発
生し、音質を劣化させることがある。低域の部分帯域で
折返し歪の影響が大きい理由は、分析および合成フィル
タの実現上の課題から低域では部分帯域の帯域幅が臨界
帯域幅より大きく、マスキング効果が小さいことによる
。また、オリジナルの高品位音声信号との透明性(トラ
ンスペアレンジ−)を確保するためにビットレートを上
げたときにも前記誤差の影響によってビット割当が最適
とならないという問題点があった。
本発明は上記従来の問題点を解決するもので、分析フィ
ルタの折返し歪に代表されるマスキング規則適用時の誤
差を減少させビット割当の最適化を図ることにより、音
声信号の品質が向上した音声帯域分割符号化装置を提供
することを目的とする。
課題を解決するための手段 この目的を達成するために本発明の音声帯域分割符号化
装置は、音声信号を複数の部分帯域に分割し、各部分帯
域の信号を所定の時間を有する区間に分割する分析フィ
ルタ部と、各部分帯域毎に、前記区間内の信号の絶対値
の最大値を表わす最大値情報を決定し、出力する最大値
情報決定部と、各部分帯域毎に、前記最大値情報決定部
からの最大値情報の対数から、前記分析フィルタ部から
の部分帯域の信号と聴覚のマスキング規則とに基づいて
算出した各部分帯域のマスクされるパワーの平方根の対
数に重み付け係数を掛けたものを引くことにより重み付
け評価関数を求め、出力する重み付け評価関数算出部と
、前記重み付け評価関数算出部からの重み付け評価関数
を用いて各部分帯域に割り当てるビット数を決定し、ビ
ット割当情報を出力するビット割当決定部と、各部分帯
域毎に、前記分析フィルタ部からの部分帯域の信号を、
前記最大値情報決定部からの最大値情報と前記ビット割
当決定部からのビット割当情報とに基づいて量子化し、
サンプル情報を出力する量子化部とを備えたものである
また本発明の音声帯域分割符号化装置は、音声信号を複
数の部分帯域に分割し、各部分帯域の信号を所定の時間
を仔する区間に分割する分析フィルタ部と、各部分帯域
毎に、前記区間内の信号の絶対値の最大値を表わす最大
値情報を決定し、出力する最大値情報決定部と、各部分
帯域毎に、前記最大値情報決定部からの最大値情報の対
数から、前記分析フィルタ部からの部分帯域の信号と聴
覚のマスキング規則とに基づいて算出した各部分帯域の
マスクされるパワーの平方根の対数に複数の重み付け係
数を掛けたものを引くことにより複数の重み付け評価関
数を求め、出力する重み付け評価関数算出部と、前記重
み付け評価関数から既に割り当てられたビット数を引い
た値に応して前記複数の重み付け評価関数を選択して、
各部分帯域に割り当・でるビット数を決定し、ビット割
当情報を出力するビット割当決定部と、各部分帯域毎に
、前記分析フィルタ部からの部分帯域の信号を、前記最
大値情報決定部からの最大値情報と前記ビット割当決定
部からのビット割当情報とに基づいて量子化し、サンプ
ル情報を出力する量子化部とを備えたものである 作用 本発明は上記した構成により、重み付け係数の値によっ
てマスキング効果と波形歪の貢献度を可変することが可
能な重み付け評価関数を用いてマスキング効果が小さく
折返し歪の影響の大きい部分帯域では波形歪の貢献度を
大きくするように部分帯域毎に重み付け係数を設定し、
重み付け評価関数算出部で前記重み付け係数を用いて重
み付け評価関数を算出し、ビット割当決定部で前記重み
付け評価関数を用いて各部分帯域に割り当てるビット数
を決定することによって最適なビット割当を行い、折返
し歪の影響を軽減し、音声信号の品質を向上することが
できる。
また本発明は上記した構成により、重み付け評価関数算
出部で複数の重み付け評価関数を算出し、ビット割当決
定部で重み付け評価関数から既に割り当てられたビット
数を引いた値に応じて前記複数の重み付け評価関数を選
択して各部分帯域に割り当てるビット数を決定すること
によって、割り当てられたビット数による量子化雑音の
マスキング量に応じてマスキング効果と波形歪のビット
割当に及ぼす貢献度を変化した重み付け評価関数を選択
し、割当ビット数が小さいときには、マスキング効果を
活用して効率的にビットを割り当て、割当ビット数が大
きくなり、量子化雑音のマスキング量が一定の閾値以上
となったときには、波形歪に基づいてビットを割り当て
ることによって、最適なビット割当を行い、マスキング
規則適用時の誤差の影響を軽減し、音声信号の品質、特
に透明性を向上することができる。
実施例 以下、本発明の実施例について、図面を参照しながら説
明する。
第1図は、本発明の実施例における音声帯域分割符号化
装置のブロック図を示すものである。
第1図において、11は分析フィルタ部、12は最大値
情報決定部、13は重み付け評価関数算出部、14′は
ビット割当決定部、15は量子化部、16は多重化部で
ある。
以上のように構成された音声帯域分割符号化装置につい
て、以下その動作を説明する。
本実施例では、音声帯域分割復号化装置としては従来例
と同じものを用いることかできる。また、本発明の実施
例のブロック図を表わす第1図において、11. 12
. 15. 16は、それぞれ第5図に示す従来例の5
1.52,55.56と同一の構成要素である。
以下、本発明の2つの実施例についてその動作説明する
。2つの実施例のブロック図はともに第1図であり、同
一であるが、重み付け評価関数算出部13とビット割当
決定部14の動作が異なる。
最初に、第1の実施例について図面を参照しながらその
動作を説明する。
第1図において、分析フィルタ部11は入力されたデジ
タル音声信号を複数の部分帯域に分割するための複数の
帯域通過フィルタからなるフィルタ群である。分析フィ
ルタ部11はデジタルフィルタであり、例えばツリー構
成のQMFで構成できる。分析フィルタ部11で複数の
部分帯域に分割された信号は、5msがら20m5の所
定の時間を有する区間に区切られる。最大値情報決定部
12は、分析フィルタ部11から各部分帯域毎に区間内
の信号の絶対値の最大値を求め、最大値情報を出力する
。最大値情報としては、例えば最大値を6ビツトで対数
量子化したものが用いられる。
重み付け評価関数算出部13は、ビット割当決定部14
で最適なビット割当を行うために必要な重み付け評価関
数を算出する。第2図は、第1の実施例における重み付
け評価関数算出部13のフローチャートである。本実施
例における変数の意味は従来例と同一である。重み付け
評価関数算出部13では、最初に分析フィルタ部11か
らの各部分帯域の信号を用いて部分帯域番号iの信号の
パワーSiを算出する。次に、各部分帯域の信号のパワ
ーとマスキング規則とに基づいて、帯域内の信号によっ
てまた隣接帯域の信号によってマスキングされて人間の
耳には聞こえないマスクドパワーMiを算出する。マス
クドパワーの算出法については、例えば文献2に記載さ
れている方法による。次に、各部分帯域毎に次式で与え
られる重み付け評価関数Eiを算出する。
Ei=log2(Pi/Mi’・′2)=log2Pi
−(10g2Mi)Wi/2すなわち、最大値情報決定
部12からの最大値情報Piの2を底とする対数から、
マスクドパワーの2を底とする対数に重み付け係数Wi
の2分の1を掛けたものを引くことにより重み付け評価
関数Eiを求め出力する。
ここで、重み付け評価関数Eiの意味について説明する
。重み付け係数WiがOのときは、E i = l o
 g2P i となる。これは次式で与えられる全帯域の量子化雑音パ
ワーを最小にするための、すなわち波形歪を最小にする
ための評価関数である。
一方、重み付け係数Wiが1のときは、Ei=log2
Pi −(log2Mi)/2となり、従来例で述べた
評価関数と一致する。すなわち、重み付け評価関数はN
MRを最小にするための評価関数となる。以上のように
重み付け評価関数は、重み付け係数Wiの値によってマ
スキング効果と波形歪の貢献度を可変することが可能な
評価関数である。
第1の実施例では、マスキング効果が小さく折返し歪の
影響の大きい部分帯域では波形歪の貢献度が大きくなる
ように部分帯域毎に重み付け係数を設定し、重み付け評
価関数を算出する。
ビット割当決定部14は、従来例と同一の動作をする。
すなわち、ビット割当決定部14のフローチャートは第
7図によって示される。ビット割当決定部14は、ステ
ップ1で初期化処理を行った後、重み付け評価関数を用
いてステップ2とステップ3を繰り返すことにより部分
帯域番号iの割当ビット数81を決定し、出力する。
ステップ1では、割当可能なビット数BをBqに、Bi
(1≦i≦N)を0に設定する。
ステップ2では、重み付け評価関数Eiを最大とする部
分帯域番号kを見い出す。
ステップ3では、割当可能なビット数BからLkを引く
。Bが0以上の場合、この部分帯域に割り当てるビット
数Bkを1増加させ、かつ重み付け評価関数Ekから1
を引く。Bが負の場合、ビット割当処理を終了する。
量子化部15は分析フィルタ部11からの各部分帯域の
各区間の信号を最大値情報決定部12からの最大値情報
を用いて正規化し、ビット割当決定部14からのビット
割当情報にしたがって各部分帯域の信号を量子化し、サ
ンプル情報として出力する。多重化部16は量子化部1
5からの各部分帯域のサンプル情報と最大値情報決定部
12からの各部分帯域の最大値情報とビット割当決定部
14からの各部分帯域のビット割当情報とを多重化し、
符号化信号を出力する。
最大値情報決定部12と重み付け評価関数算出部13と
ビット割当決定部14と量子化部15と多重化部16は
マイクロプロセッサで構成できる。
以上のように第1の実施例によれば、重み付け係数の値
によってマスキング効果と波形歪の貢献度を可変するこ
とが可能な重み付け評価関数を算出する重み付け評価関
数算出部と、重み付け評価関数算出部からの重み付け評
価関数を用いて各部分帯域に割り当てるビット数を決定
するビット割当決定部とを設け、分析フィルタ部の折返
し歪のマスキング量に応じて各部分帯域毎に重み付け係
数を設定することにより、最適なビット割当を行い、折
返し歪の影響を軽減し、音声信号の品質を向上させるこ
とができる。
次に、本発明の第2の実施例について図面を参照しなが
らその動作を説明する。
第2の実施例においては、分析フィルタ部11゜最大値
情報決定部12.量子化部15.多重化部16について
はその動作は第1の実施例と同一であり、説明を省略す
る。以下、第1の実施例と動作が異なる重み付け評価関
数算出部13とビット割当決定部14についてその動作
を説明する。
重み付け評価関数算出部13は聴覚のマスキング効果と
波形歪とに基づいて、ビット割当決定部14で最適なビ
ット割当を行うために必要な複数の重み付け評価関数を
算出する。第3図は、第2の実施例における重み付け評
価関数算出部13のフローチャートである。重み付け評
価関数算出部13では、最初に分析フィルタ部11から
の各部分帯域の信号を用いて部分帯域番号lの信号のパ
ワーSiを算出する。次に、各部分帯域の信号のパワー
とマスキング規則とに基づいて、帯域内の信号によって
また隣接帯域の信号によってマスキングされて人間の耳
には聞こえないマスクドパワーMiを算出する。次に、
各部分帯域毎に、第1の重み付け係数W i 1 (1
≦i≦N)を有する重み付け評価関数Eilを算出する
。第2の実施例では、第1の重み付け係数W i Iを
すべて1に設定し、マスキング効果のビット割当におよ
ぼす貢献度を最大にしている。Eilは次式によって算
出される。
Eil:10g2Pi −(1og2Mi)/2すなわ
ち、最大値情報決定部12からの最大値情報Piの2を
底とする対数からマスクドパワーの2を底とする対数に
2分の1を掛けたものを引くことにより重み付け評価関
数Eilを求める。次に、各部分帯域毎に第2の重み付
け係数W i 2 (1≦i≦N)を有する重み付け評
価関数Ei2を算出する。
第2の実施例では、第2の重み付け係数W i 2 (
1≦1≦N)をOに設定し、波形歪のビット割当におよ
ぼす貢献度を最大にしている。Ei2は次式によって算
出される。
Ei2=log2Pi すなわち、最大値情報決定部12からの最大値情報Pi
の2を底とする対数を算出することにより、第2の重み
付け評価関数Ei2を求める。重み付け評価関数算出部
13は以上のようにして求めた第1と第2の重み付け評
価関数をビット割当決定部14に出力する。
第4図は第2の実施例におけるビット割当決定部14の
フローチャートである。ビット割当決定部14は、ステ
ップ1で初期化処理を行った後、重み付け評価関数を用
いてステップ2とステップ3を繰り返すことにより部分
帯域番号iの割当ビット数Biを決定し、出力する。
ステップ1では、jを1に設定し、第1の重み°付け評
価関数を選択する。割当可能なビット数BをBqに、B
i(1≦1≦N)をOに設定する。
ステップ2ては、重み付け評価関数Eijを最大とする
部分帯域番号kを見い出す。
ステ・ツブ3ては、jが1のときはステップ2で見つけ
た重み付け評価関数の最大値Emaxと閾値Tを比較し
、閾値以下のときはJを2に設定しステップ2に戻る。
jが1でないときおよび重み付け評価関数の最大値が閾
値より大きいときには、割当可能なビット数BからLk
を引く。Bが0以上の場合、この部分帯域に割り当てる
ビット数Bkを1増加させ、かつ2つの重み付け評価関
数EklとEk2から1を引く。Bが負の場合、ビット
割当処理を終了する。
重み付け評価関数算出部13とビット割当決定部14は
マイクロプロセッサで構成できる。
以上のように第2の実施例によれば、複数の重み付け係
数を宵する重み付け評価関数算出部とビット割当決定部
とを設けることにより、割当ビット数が小さいときには
マスキング効果を活用して効率的にビットを割り当て、
割当ビット数が太きくなり、量子化雑音のマスキング量
か一定の閾値以上となったときには、波形歪に基づいて
ビットを割り当てることによって最適なビット割当を行
い、マスキング規則適用時の誤差の影響を軽減し、音声
信号の品質、特に透明性を向上させることができる。
なお、第1および第2の実施例において、ビットレート
は固定としたが、ビットレートを可変とし、ビットレー
トに応じて重み付け係数あるいは閾値を設定してもよい
また、第1および第2の実施例において、マスクドパワ
ーの算出には分析フィルタ部からの部分帯域の信号を用
いたが、マスキング規則のより精度の高い適用を目的と
してFFT分析器のような周波数分解能の高い分析器を
設け、その出力を用いてマスクドパワーの算出を行って
もよい。
発明の効果 以上のように本発明は、重み付け係数の値によってマス
キング効果と波形歪の貢献度を可変することが可能な重
み付け評価関数を算出する重み付け評価関数算出部と、
重み付け評価関数算出部からの重み付け評価関数を用い
て各部分帯域に割り当てるビット数を決定すると7)割
当決定部とを設け、分析フィルタ部の折返し歪のマスキ
ング量に応じて各部分帯域毎に重み付け係数を設定する
ことにより最適なビット割当を行い、折返し歪の影響を
軽減し、音声信号の品質を向上させることができる。
また本発明は、複数の重み付け評価関数を算出する重み
付け評価関数算出部と、重み付け評価関数から割当ビッ
ト数を引いた値に応じて、重み付け評価関数算出部から
の複数の重み付け評価関数を選択して各部分帯域に割り
当てるビット数を決定するビット割当決定部とを設け、
割当ビy)数が小さいときには、マスキング効果を活用
してビットを割り当て、割当ビット数が大きくなり量子
化雑音のマスキング量が一定の閾値以上となったときに
は、波形歪に基づいてビットを割り当てることによって
最適なビット割当を行い、マスキング規則適用時の誤差
の影響を軽減し、音声信号の品質、特に透明性を向上さ
せることができる。
【図面の簡単な説明】
第1図は本発明の実施例における音声帯域分割符号化装
置の構成を示すブロック図、第2図は本発明の第1の実
施例における重み付け評価関数算出部のフローチャート
、第3図は本発明の第2の実施例における重み付け評価
関数算出部のフローチャート、第4図は本発明の第2の
実施例におけるビット割当決定部のフローチャート、第
5図は従来の音声帯域分割符号化装置の構成を示すブロ
ック図、第6図は従来の評価関数算出部のフローチャー
ト、第7図は従来のビット割当決定部のフローチャート
、第8図は従来の音声帯域分割復号化装置の構成を示す
ブロック図である。 11・・・分析フィルタ部、  12・・・最大値情報
決定部、  13・・・重み付け評価関数算出部、14
・・・ビット割当決定部、  15・・・量子化部、1
6・・・多重化部。 代理人の氏名 弁理士 小鍜冶 明 ほか2名Cq  
                         
             −、ビ

Claims (4)

    【特許請求の範囲】
  1. (1)音声信号を複数の部分帯域に分割し、各部分帯域
    の信号を所定の時間を有する区間に分割する分析フィル
    タ部と、 各部分帯域毎に、前記区間内の信号の絶対値の最大値を
    表わす最大値情報を決定し、出力する最大値情報決定部
    と、 各部分帯域毎に、前記最大値情報決定部からの最大値情
    報の対数から、前記分析フィルタ部からの部分帯域の信
    号と聴覚のマスキング規則とに基づいて算出した各部分
    帯域のマスクされるパワーの平方根の対数に重み付け係
    数を掛けたものを引くことにより重み付け評価関数を求
    め、出力する重み付け評価関数算出部と、 前記重み付け評価関数算出部からの重み付け評価関数を
    用いて各部分帯域に割り当てるビット数を決定し、ビッ
    ト割当情報を出力するビット割当決定部と、 各部分帯域毎に、前記分析フィルタ部からの部分帯域の
    信号を前記最大値情報決定部からの最大値情報と前記ビ
    ット割当決定部からのビット割当情報とに基づいて量子
    化し、サンプル情報を出力する量子化部とを具備した音
    声帯域分割符号化装置。
  2. (2)分析フィルタ部の折返し歪のマスキング量に応じ
    て各部分帯域毎に重み付け係数を設定する重み付け評価
    関数算出部を有する請求項1記載の帯域分割符号化装置
  3. (3)音声信号を複数の部分帯域に分割し、各部分帯域
    の信号を所定の時間を有する区間に分割する分析フィル
    タ部と、 各部分帯域毎に、前記区間内の信号の絶対値の最大値を
    表わす最大値情報を決定し、出力する最大値情報決定部
    と、 各部分帯域毎に、前記最大値情報決定部からの最大値情
    報の対数から前記分析フィルタ部からの部分帯域の信号
    と聴覚のマスキング規則とに基づいて算出した各部分帯
    域のマスクされるパワーの平方根の対数に複数の重み付
    け係数を掛けたものを引くことにより複数の重み付け評
    価関数を求め、出力する重み付け評価関数算出部と、 前記重み付け評価関数から既に割り当てられたビット数
    を引いた値に応じて前記複数の重み付け評価関数を選択
    して、各部分帯域に割り当てるビット数を決定し、ビッ
    ト割当情報を出力するビット割当決定部と、 各部分帯域毎に、前記分析フィルタ部からの部分帯域の
    信号を、前記最大値情報決定部からの最大値情報と前記
    ビット割当決定部からのビット割当情報とに基づいて量
    子化し、サンプル情報を出力する量子化部とを具備した
    音声帯域分割符号化装置。
  4. (4)重み付け評価関数から割当ビット数を引いた値が
    、閾値より大きいときには重み付け係数の値が1の重み
    付け評価関数を選択し、閾値以下のときには重み付け係
    数の値が0の重み付け評価関数を選択するビット割当決
    定部を有する請求項3記載の帯域分割符号化装置。
JP2305114A 1990-11-09 1990-11-09 音声帯域分割符号化装置 Expired - Fee Related JP2906646B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2305114A JP2906646B2 (ja) 1990-11-09 1990-11-09 音声帯域分割符号化装置
US07/786,798 US5301255A (en) 1990-11-09 1991-11-05 Audio signal subband encoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2305114A JP2906646B2 (ja) 1990-11-09 1990-11-09 音声帯域分割符号化装置

Publications (2)

Publication Number Publication Date
JPH04177300A true JPH04177300A (ja) 1992-06-24
JP2906646B2 JP2906646B2 (ja) 1999-06-21

Family

ID=17941271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2305114A Expired - Fee Related JP2906646B2 (ja) 1990-11-09 1990-11-09 音声帯域分割符号化装置

Country Status (2)

Country Link
US (1) US5301255A (ja)
JP (1) JP2906646B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995002929A1 (en) * 1993-07-16 1995-01-26 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH07160295A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声符号化装置
JPH07234695A (ja) * 1993-12-29 1995-09-05 Hyundai Electron Ind Co Ltd 音声信号の最適ビット割り振り方法
EP0581435A3 (en) * 1992-07-29 1996-09-04 Sony Corp Audio data coding methods and apparatus
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JP2008203891A (ja) * 1996-06-07 2008-09-04 That Corp Btscエンコーダ
US8908872B2 (en) 1996-06-07 2014-12-09 That Corporation BTSC encoder

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR950008637B1 (ko) * 1993-04-08 1995-08-03 삼성전자주식회사 부밴드 코딩시스템의 신호처리장치
KR100269213B1 (ko) * 1993-10-30 2000-10-16 윤종용 오디오신호의부호화방법
JP3024468B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声復号装置
CA2137756C (en) * 1993-12-10 2000-02-01 Kazunori Ozawa Voice coder and a method for searching codebooks
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
KR0134318B1 (ko) * 1994-01-28 1998-04-29 김광호 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치
KR100193196B1 (ko) * 1994-02-17 1999-06-15 모토로라 인크 신호를 그룹 엔코딩하기 위한 방법 및 장치
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
JP2778482B2 (ja) * 1994-09-26 1998-07-23 日本電気株式会社 帯域分割符号化装置
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
EP0722225A3 (de) * 1994-11-17 2000-06-07 Deutsche Thomson-Brandt Gmbh Audiosignalkodierung mittels Kurzzeitspektren und einem psychoakustischen Modell
TW316302B (ja) * 1995-05-02 1997-09-21 Nippon Steel Corp
US5913186A (en) * 1996-03-25 1999-06-15 Prometheus, Inc. Discrete one dimensional signal processing apparatus and method using energy spreading coding
FR2749723B1 (fr) * 1996-06-06 1998-09-04 France Telecom Procede et dispositif de codage en compression d'un signal numerique
WO1999009650A1 (en) * 1997-08-21 1999-02-25 Data Fusion Corporation Method and apparatus for acquiring wide-band pseudorandom noise encoded waveforms
US6091773A (en) * 1997-11-12 2000-07-18 Sydorenko; Mark R. Data compression method and apparatus
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
GB2349054A (en) * 1999-04-16 2000-10-18 Nds Ltd Digital audio signal encoders
US7030863B2 (en) * 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US7003449B1 (en) * 1999-10-30 2006-02-21 Stmicroelectronics Asia Pacific Pte Ltd. Method of encoding an audio signal using a quality value for bit allocation
DE19959037B4 (de) * 1999-12-08 2004-04-29 Robert Bosch Gmbh Verfahren zur Dekodierung von digitalen Audiodaten
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
DE60202881T2 (de) 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US20040002859A1 (en) * 2002-06-26 2004-01-01 Chi-Min Liu Method and architecture of digital conding for transmitting and packing audio signals
US7058571B2 (en) * 2002-08-01 2006-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing suppression
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
ATE318405T1 (de) * 2002-09-19 2006-03-15 Matsushita Electric Industrial Co Ltd Audiodecodierungsvorrichtung und -verfahren
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
DE102004024855A1 (de) * 2004-05-19 2005-12-15 Océ Document Technologies GmbH Verfahren und Vorrichtung zur Interpolation und Korrektur eines Bildes
JP2006119723A (ja) * 2004-10-19 2006-05-11 Canon Inc 画像処理装置、画像処理方法
DE102005002195A1 (de) * 2005-01-17 2006-07-27 Siemens Ag Verfahren und Anordnung zur Regeneration eines optischen Datensignals
US8781822B2 (en) * 2009-12-22 2014-07-15 Qualcomm Incorporated Audio and speech processing with optimal bit-allocation for constant bit rate applications
US10003377B1 (en) * 2016-12-19 2018-06-19 Cisco Technology, Inc. Spread spectrum acoustic communication techniques
US10404319B1 (en) 2018-07-09 2019-09-03 Cisco Technology, Inc. Fast correlation of prometheus orthonormal sets (PONS) for communications
US10396846B1 (en) 2018-10-12 2019-08-27 Cisco Technology, Inc. Adaptive decoding of spread spectrum signals using multiple correlator peaks
US10601459B1 (en) 2018-11-02 2020-03-24 Cisco Technology, Inc. Efficient handling of clock offset in spread spectrum decoders

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0435123A (ja) * 1990-05-25 1992-02-05 Sony Corp ディジタル信号符号化装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4291405A (en) * 1979-09-07 1981-09-22 Bell Telephone Laboratories, Incorporated Error reduction speech communication system
FR2481026B1 (ja) * 1980-04-21 1984-06-15 France Etat
GB8330885D0 (en) * 1983-11-18 1983-12-29 British Telecomm Data transmission
US4817146A (en) * 1984-10-17 1989-03-28 General Electric Company Cryptographic digital signal transceiver method and apparatus
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus
CA1220282A (en) * 1985-04-03 1987-04-07 Northern Telecom Limited Transmission of wideband speech signals
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
JPH0636158B2 (ja) * 1986-12-04 1994-05-11 沖電気工業株式会社 音声分析合成方法及び装置
DE3703143A1 (de) * 1987-02-03 1988-08-11 Thomson Brandt Gmbh Verfahren zur uebertragung eines audiosignals
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4805193A (en) * 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US4982283A (en) * 1988-05-06 1991-01-01 General Electric Company Line-sequential pyramid processing of a plurality of raster-scanned image variables
US4964166A (en) * 1988-05-26 1990-10-16 Pacific Communication Science, Inc. Adaptive transform coder having minimal bit allocation processing
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US4987480A (en) * 1989-07-11 1991-01-22 Massachusetts Institute Of Technology Multiscale coding of images
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0435123A (ja) * 1990-05-25 1992-02-05 Sony Corp ディジタル信号符号化装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0581435A3 (en) * 1992-07-29 1996-09-04 Sony Corp Audio data coding methods and apparatus
US5642383A (en) * 1992-07-29 1997-06-24 Sony Corporation Audio data coding method and audio data coding apparatus
WO1995002929A1 (en) * 1993-07-16 1995-01-26 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH07160295A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声符号化装置
JPH07234695A (ja) * 1993-12-29 1995-09-05 Hyundai Electron Ind Co Ltd 音声信号の最適ビット割り振り方法
JP2008203891A (ja) * 1996-06-07 2008-09-04 That Corp Btscエンコーダ
US8284954B2 (en) 1996-06-07 2012-10-09 That Corporation BTSC encoder
US8908872B2 (en) 1996-06-07 2014-12-09 That Corporation BTSC encoder

Also Published As

Publication number Publication date
JP2906646B2 (ja) 1999-06-21
US5301255A (en) 1994-04-05

Similar Documents

Publication Publication Date Title
JPH04177300A (ja) 音声帯域分割符号化装置
EP0720307B1 (en) Digital audio signal coding and/or decoding method
JP3134455B2 (ja) 高能率符号化装置及び方法
US5737718A (en) Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration
JP3093179B2 (ja) 高品質オーディオ用短時間遅延変換エンコーダ及びデコーダ
US6681204B2 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
JPWO1995001680A1 (ja) ディジタル信号の符号化装置及びその復号化装置並びに記録媒体
EP0709005A1 (en) EFFICIENT ADAPTIVE BIT ALLOCATION FOR CODING METHODS AND CODING DEVICE IN COMPUTER EFFICIENCY
US5758020A (en) Methods and apparatus for encoding and decoding signals, methods for transmitting signals, and an information recording medium
JPWO1994028633A1 (ja) 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体
WO1995001680A1 (en) Digital signal encoding device, its decoding device, and its recording medium
JP3297240B2 (ja) 適応的符号化システム
JPH06232761A (ja) 高能率符号化又は復号化方法及び装置
JP2001142498A (ja) ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
US5781586A (en) Method and apparatus for encoding the information, method and apparatus for decoding the information and information recording medium
EP0693829A1 (en) Method and device for encoding information and method and device for decoding information
JP3277699B2 (ja) 信号符号化方法及び装置並びに信号復号化方法及び装置
WO1995012920A1 (en) Signal encoder, signal decoder, recording medium and signal encoding method
US6995699B2 (en) Encoding method, and encoding apparatus, and decoding method and decoding apparatus
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
JPH09135173A (ja) 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
KR100340368B1 (ko) 고능률부호화장치,복호화장치및디지털데이터도출방법
JPH08167851A (ja) 高能率符号化方法及び装置、並びに伝送媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees