JPH09172376A - 量子化ビット割当て装置 - Google Patents

量子化ビット割当て装置

Info

Publication number
JPH09172376A
JPH09172376A JP7331477A JP33147795A JPH09172376A JP H09172376 A JPH09172376 A JP H09172376A JP 7331477 A JP7331477 A JP 7331477A JP 33147795 A JP33147795 A JP 33147795A JP H09172376 A JPH09172376 A JP H09172376A
Authority
JP
Japan
Prior art keywords
subband
sub
band
quantization
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7331477A
Other languages
English (en)
Inventor
Yasuhiro Akiyama
靖浩 秋山
Tadashi Onishi
忠志 大西
Kiyoshi Aiki
清 愛木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7331477A priority Critical patent/JPH09172376A/ja
Publication of JPH09172376A publication Critical patent/JPH09172376A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】音声等のディジタル信号の量子化ビット割当て
において、本来量子化ビット量を最も必要とするサブバ
ンドの音質を高める。 【解決手段】サブバンド検出手段から出力される高周波
数帯域側および低周波数帯域側の二つのサブバンド情報
のうち、選択制御手段が高周波数帯域側のサブバンド情
報を優先的に選択する手段を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ディジタル音声信
号を幾つかの周波数帯域毎に分割し、人の聴覚特性を利
用して情報の圧縮を行うための符号化装置に係り、特
に、ICレコーダ等を用いた音声案内サービスで使用さ
れるディジタル音声信号に対して符号化処理を施すため
に好適な量子化ビット割当て装置に関する。
【0002】
【従来の技術】従来よりディジタルの音声信号を圧縮す
る方法として、音声信号の周波数成分を複数個のサブバ
ンドに分割して符号化する方法が知られている。また、
人が聞きやすい周波数帯域の信号劣化を最小にし、逆に
人が聞き取れない、または聞き取りづらい周波数の信号
成分は積極的に間引くといった様な人の聴覚特性を利用
した心理聴覚分析と呼ばれる信号処理アルゴリズムと組
み合わせて、音声信号を圧縮する方法も提案されてい
る。
【0003】人の聴覚特性の代表的な例として、ある周
波数の音が近接する周波数のより大きなパワーを待った
音にマスクされて実際には人には聞こえないというマス
キング効果がある。また、人の聴覚には、周波数の低い
音ほど敏感に反応し、逆に周波数の高い音ほど知覚され
にくいという特徴があることが一般に知られている。こ
れらの特性を利用した圧縮方法では、各サブバンド毎に
分割された音声信号に対して、マスキング効果等による
各サブバンド間での信号相互の影響を考慮した上で、信
号振幅を量子化するために最も適切なビット量の割当て
が実施される。
【0004】しかし、サブバンド全体で単位時間当たり
に割当てることのできる量子化ビット量の総和は、転送
ビットレートによって制限され、必ずしも全ての条件を
満足するビット配分ができない場合が多い。従って、決
められた量子化ビット量の総和内で音質の劣化を極力抑
えるようなビット配分を実施する必要がある。
【0005】従来技術の一例として特開平6−216861 号
公報には、各サブバンド毎に必要な割当てビット量を計
算した後、全体の割当てビット量の総和内に収まるま
で、割当てビット量の最も大きなサブバンドから1ビッ
トずつ、ビット量を減らす処理を繰り返す方法が記載さ
れている。
【0006】また、特開平7−50589号公報には、人の聴
覚のマスキング効果を利用したビット割当て処理におい
て、マスキングしきい値レベルから理論的にその帯域に
必要なビット量を算出する処理を省くために、圧縮しよ
うとする音声信号とは異なる試験信号を用いてビット割
当ての実験を行い、その結果から作成したビット割当て
テーブルとマスキングしきい値レベルと各帯域の信号の
電力レベルの関係から、各帯域のビット配分を求める方
法が記載されている。なお、ここで言うマスキングしき
い値レベルとは、ある周波数の信号に対して、人の聴覚
上、聞こえなくなる最下限の信号レベルを指す。
【0007】
【発明が解決しようとする課題】特開平6−216861 号公
報による方法では、ビット配分の増減基準が、単に最初
に決定したビット割当て量の大小関係のみに基づいてい
るため、本来量子化ビット量を最も必要とするサブバン
ドの音質劣化が著しくなることがある。また、ビット割
当て量を調整する時の増減量も1ビットずつであるた
め、最終的なビット配分が決定するまでの処理負荷が増
大する。
【0008】一方、特開平7−50589号公報による方法に
おいて、ビット配分の際に使用されるビット割当てテー
ブルは、本来圧縮しようとする信号とは全く異なる試験
信号を元に作成されたテーブルであり、あくまで所定の
条件下でのビット割当ての結果を統計的に表現したもの
である。従って、常に適切なビット配分が実施されると
は限らない。また、この方法によるビット割当てにおい
て、良好なビット配分の結果を得るためには膨大な情報
量のテーブルが必要になる。
【0009】
【課題を解決するための手段】各サブバンドの量子化レ
ベルから導かれる量子化ビット数の総和が、転送ビット
レートから算出される単位時間当たりのビット量の総和
内に収まるまで、量子化レベルの最適化を行う量子化ビ
ット割当て処理において、割当てビット量を調整するサ
ブバンドを決定するために、人の聴覚が周波数の高い音
ほど知覚されにくいという特性を利用して、選択制御手
段がサブバンド検出手段から出力される高周波数帯域側
および低周波数帯域側の二つのサブバンド情報のうち、
高周波数帯域側のサブバンド情報を優先的に選択する手
段を備える。
【0010】さらに、サブバンド検出手段から出力され
る低周波数帯域側および高周波数帯域側の二つのサブバ
ンド情報は、音声情報に対して量子化を実施した際に音
質劣化への影響が最も少ない(マスク対雑音比が最も大
きい)サブバンド情報を選択して出力する手段を備え
る。
【0011】
【発明の実施の形態】図1は本発明による量子化ビット
割当て装置の実施の形態の一例を示したブロック図であ
る。まず、各サブバンドの量子化レベル100を記憶す
る部分には、ディジタル音声信号から各サブバンド毎に
量子化に最低限必要なビット数を計算し、そのビット数
に相当する量子化レベル(初期値1)を各サブバンド毎
に格納する。また、各サブバンドの信号対マスク比10
1を格納する部分には、各サブバンド毎の入力信号とマ
スキングしきい値レベルとの比率を計算した値(初期値
2)を格納する。
【0012】信号対マスク比101は、人の聴覚特性を
利用した心理聴覚分析と呼ばれる信号処理アルゴリズム
を使用して求められ、比の値が小さい程、信号が音とし
て知覚されにくいことが知られている。
【0013】サブバンド検出部102では、各サブバン
ドの量子化レベル100および信号対マスク比101の
関係から、各サブバンド毎のマスク対雑音比を求め、そ
の中からあるサブバンドを境界にした時の、高周波数帯
域側のサブバンドの中で最大のマスク対雑音比を持つサ
ブバンドを検索して、そのサブバンド情報をSBm1に
格納する。また同時に、低周波数帯域側のサブバンドの
中で最大のマスク対雑音比を持つサブバンドを検索して
SBm2に格納する。マスク対雑音比については図4の
説明にて述べる。
【0014】選択制御部105では、SBm1とSBm
2のうち、高周波数帯域側のサブバンド情報であるSB
m1を優先的に選択し、SBmに格納する。もし、SB
m1に該当するサブバンドの量子化レベルが0の場合
は、SBm2をSBmに格納する。調整部107では、
SBmに該当するサブバンドの量子化レベル100を1
レベル下げる処理を行う。これら一連の処理は、各サブ
バンドの量子化レベルから設定される量子化ビット数の
総和が転送ビットレートから算出される単位時間当たり
のビット量の総和内に収まるまで繰り返される。
【0015】図2は量子化レベルの数値とそれに対応す
る量子化ビット数の関係の一例を示す図である。同図
は、量子化レベルを0から15までの16段階に分けた
場合の例であり、例えば、あるサブバンドの量子化レベ
ルが15である時は、そのサブバンドの音声信号に対す
る量子化ビットは16ビットであることを表している。
また、量子化レベルが0のサブバンドは、音声信号に対
する量子化ビットが0ビットであることを表し、そのサ
ブバンドの音声信号は削除されることを意味する。
【0016】図3は各サブバンド毎の量子化ビット数の
配分の一例を示した図である。サブバンド全体の量子化
ビット数の総和は、各サブバンドの量子化レベルに対応
する量子化ビット数と、該当するサブバンドの音声信号
のサンプル数との積の総和である。わかり易く説明する
ために同図(a)において、10個に分割したサブバン
ドで、それぞれ10個の音声信号のサンプルを持ち、サ
ブバンド全体の割当て可能な量子化ビット数が1,00
0 ビットであると仮定する。また、各サブバンドの量
子化レベルが全て11(図2より各サブバンド毎の量子
化ビットは12ビット)であると仮定すると、各サブバ
ンド毎の量子化ビット数(301〜310)は、各々12
0ビットとなる。従って、全体の割当てビット数は12
00ビットとなり、この段階ではサブバンド全体で割当
て可能な量子化ビット数である1,000 ビットを越え
ている。そこで、全体の割当てビット数を1,000 ビ
ットに等しくするか、またはそれ以下にするために図1
を用いて説明した処理を実施する。
【0017】前述したように、各サブバンドをある所定
のサブバンドを境界にして低周波数帯域側と高周波数帯
域側に分け、周波数の高い音ほど知覚されにくいという
人の聴覚特性を利用して、高周波数帯域側のサブバンド
の量子化ビットから優先して減らすように処理する。同
図(b)に、その一例を示す。今、サブバンドの8番目
319(sb8)を境界として設定したとすると、サブ
バンドの8番目319(sb8)とサブバンドの9番目
320(sb9)の量子化ビット数を優先して減らすよ
うに処理する。この結果、二つのサブバンドの量子化ビ
ット数は20ビットまで減少するが、それ以外のサブバ
ンドの量子化ビット数は120ビットのまま確保され
る。
【0018】このような人の聴覚特性を考慮した量子化
ビット配分の最適化によって、高周波帯域の音質は多少
劣化するが、最も人に知覚され易い周波数帯域での音質
劣化は最小限に抑えることができる。
【0019】図4はサブバンド検出部102の詳細な実
施の形態の一例を示すブロック図である。図1の説明で
も述べたようにサブバンド検出部102は、各サブバン
ドの量子化レベル100および信号対マスク比101の
関係から、各サブバンド毎のマスク対雑音比を求め、そ
の中からある所定のサブバンドを境界にした時の、低周
波数帯域側と高周波数帯域側のサブバンドの中で最大の
マスク対雑音比を持つ二つのサブバンドを検索する部分
である。
【0020】まず、各サブバンドの量子化レベル100
から換算した信号対雑音比と各サブバンドの信号対マス
ク比、および演算処理の際に低周波数帯域側と高周波数
帯域側を区別するために任意に設定するサブバンドSB
nを演算制御部401に入力する。ここでの信号対雑音
比とは、音声信号を量子化する際の信号成分と雑音成分
の比率を表したものであり、それは量子化ビット数にほ
ぼ比例することが一般的に知られている。
【0021】演算制御部401は、サブバンドSBnを
境界にして、サブバンドSBnを含むそれ以上のサブバ
ンドとサブバンドSBn以下の2種類のマスク対雑音比
を計算し、前者をマスク対雑音比403,後者をマスク
対雑音比404にそれぞれ格納する。検出部405は、
マスク対雑音比403の中で最も大きな値を持つサブバ
ンドを検出してSBm1に格納する。同様に検出部40
6は、マスク対雑音比404の中で最も大きな値を持つ
サブバンドを検出してSBm2に格納する。
【0022】本発明による量子化ビット割当て装置の詳
細な実施の形態の一例を、図5に示すブロック図および
図6に示すフローチャートを用いて説明する。まず、サ
ブバンド全体の量子化ビットの総数がTBITに設定さ
れる(フローチャート601)。次に、各サブバンド毎の
量子化レベル100と各サブバンド毎の信号対マスク比
101の初期値がそれぞれ入力制御部501,502を
介して設定される(フローチャート602,603)。
量子化レベル100は、それぞれ対応する量子化ビット
数から各サブバンドの信号対雑音比400に換算し、そ
れと前記の信号対マスク比101から各サブバンド毎の
マスク対雑音比を計算する(フローチャート604)。
この時、任意に設定されるサブバンドSBnを境界にし
て、高周波数帯域側と低周波数帯域側の二つの帯域に分
割して計算し、前者をマスク対雑音比403,後者をマ
スク対雑音比404に格納する(フローチャート60
5,606)。
【0023】検出部405および406では、各々の中
で最も大きなマスク対雑音比を持つ該当サブバンドを検
出して、それぞれSBm1,SBm2に格納する(フロ
ーチャート607,608)。選択制御部105では、
SBm1の量子化レベルが0であるかどうかを検査する
(フローチャート609)。SBm1の量子化レベル≠
0であれば、検出部405で検出したSBm1をSBm
に格納する(フローチャート610)。一方、SBm1
の量子化レベル=0の時は、検出部406で検出したS
Bm2をSBmに格納する(フローチャート611)。
【0024】調整部107では、SBmに該当するサブ
バンドの量子化レベル100を1レベル下げる処理を行
う(フローチャート612)。この後、この段階の各サ
ブバンドの量子化レベル100からサブバンド全体の量
子化ビット割当ての総数を計算し、NBITに格納する
(フローチャート613)。終了判定部500では、こ
のNBITと先に設定したTBITを比較し、TBIT
≧NBITが成立した段階で、その時点の各サブバンド
の量子化レベル100の値を出力制御部503を介して
出力する(フローチャート614)。もしも、TBIT
≧NBITが成立しなければ、成立するまでフローチャ
ート604からフローチャート614の間の処理を引き
続き繰り返す。
【0025】図7は、本発明による量子化ビット割当て
装置の詳細な実施の形態の別の一例を示す図である。こ
れまでの説明では、演算制御部401で、高周波数帯域
側と低周波数帯域側の二つの帯域の境界のとなるサブバ
ンドSBnは、任意の値を固定値として設定する様にし
ていた。圧縮するディジタル音声信号が、本発明を使用
した装置の主な使用目的である音声案内サービスに限定
されるなど、ディジタル音声信号の周波数特性の特徴が
類似しているものであれば、これまで説明した実施の形
態の量子化ビット割当て装置で充分対応可能である。さ
らに、同図に示した様にサブバンドSBnの設定を、周
波数特性解析部701が各サブバンドにおける音声信号
分布の出現頻度の割合を解析するなどして、高周波数帯
域側と低周波数帯域側の二つの帯域の境界のとなる最適
なサブバンドSBnを決定するようにすれば、圧縮しよ
うとするディジタル音声信号の分類を特に考慮せずと
も、常に最適な量子化ビット割当てを実現することが可
能となる。
【0026】
【発明の効果】本発明によれば、ディジタル音声信号を
圧縮する課程において、人が聞きやすい周波数帯域の音
質劣化を最小限に抑えつつ、各サブバンドに対して最適
な量子化ビットの配分が可能な量子化ビット割当て装置
を提供することができる。
【図面の簡単な説明】
【図1】本発明による量子化ビット割当て装置の一実施
例のブロック図。
【図2】量子化レベルとそれに対応する量子化ビット数
の関係の一例を示す説明図。
【図3】各サブバンド毎の量子化ビット数の割当て配分
の一例を示す説明図。
【図4】サブバンド検出部の一実施例のブロック図。
【図5】量子化ビット割当て装置の一実施例のブロック
図。
【図6】量子化ビット割当て装置の処理手順のフローチ
ャート。
【図7】量子化ビット割当て装置の第二実施例のブロッ
ク図。
【符号の説明】
100…各サブバンドの量子化レベル、101…各サブ
バンドの信号対マスク比、102…サブバンド検出部、
103…高周波数帯域側から求めたサブバンド情報、1
04…低周波数帯域側から求めたサブバンド情報、10
5…選択制御部、106…サブバンド情報、107…調
整部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】音声等のディジタル信号の周波数成分をN
    個のサブバンドに分割し、前記各サブバンドの音声信号
    に対応するN個の量子化レベルを格納する手段と、人の
    聴覚特性を利用した信号処理手順から算出した各サブバ
    ンド毎に対応するN個の信号対マスク比を格納する手段
    と、所定のサブバンドを境界にして低周波数帯域側にお
    けるマスク対雑音比の最も大きなサブバンド、および高
    周波数帯域側におけるマスク対雑音比の最も大きなサブ
    バンドを検出して所定のメモリに格納するサブバンド検
    出手段と、前記二つのサブバンド情報のうち、いずれか
    一方のサブバンド情報を選択して所定のメモリに格納す
    る選択制御手段と、前記サブバンド情報と一致する周波
    数帯域の量子化レベルに対して所定のレベル調整を行う
    ための手段を備え、前記各サブバンドの量子化レベルか
    ら導かれる量子化ビット数の総和が、転送ビットレート
    から算出される単位時間当たりのビット量の総和内に収
    まるまで、量子化レベルの最適化を行う量子化ビット割
    当て処理において、前記選択制御手段がサブバンド検出
    手段から出力される二つのサブバンド情報のうち、高周
    波数帯域側のサブバンド情報を優先的に選択することを
    特徴とする量子化ビット割当て装置。
JP7331477A 1995-12-20 1995-12-20 量子化ビット割当て装置 Pending JPH09172376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7331477A JPH09172376A (ja) 1995-12-20 1995-12-20 量子化ビット割当て装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7331477A JPH09172376A (ja) 1995-12-20 1995-12-20 量子化ビット割当て装置

Publications (1)

Publication Number Publication Date
JPH09172376A true JPH09172376A (ja) 1997-06-30

Family

ID=18244091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7331477A Pending JPH09172376A (ja) 1995-12-20 1995-12-20 量子化ビット割当て装置

Country Status (1)

Country Link
JP (1) JPH09172376A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999003096A1 (en) * 1997-07-11 1999-01-21 Sony Corporation Information decoder and decoding method, information encoder and encoding method, and distribution medium
JP2014510938A (ja) * 2011-02-09 2014-05-01 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオ信号の効率的なエンコーディング/デコーディング
JP2018185530A (ja) * 2000-11-15 2018-11-22 ドルビー・インターナショナル・アクチボラゲットDolby International Ab 高周波数の再構成方法を使用するコーディング・システムの性能拡大方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999003096A1 (en) * 1997-07-11 1999-01-21 Sony Corporation Information decoder and decoding method, information encoder and encoding method, and distribution medium
US6415251B1 (en) 1997-07-11 2002-07-02 Sony Corporation Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
JP2018185530A (ja) * 2000-11-15 2018-11-22 ドルビー・インターナショナル・アクチボラゲットDolby International Ab 高周波数の再構成方法を使用するコーディング・システムの性能拡大方法
JP2014510938A (ja) * 2011-02-09 2014-05-01 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオ信号の効率的なエンコーディング/デコーディング
US9280980B2 (en) 2011-02-09 2016-03-08 Telefonaktiebolaget L M Ericsson (Publ) Efficient encoding/decoding of audio signals

Similar Documents

Publication Publication Date Title
KR100896737B1 (ko) 오디오 신호의 견고한 분류를 위한 장치 및 방법, 오디오신호 데이터베이스를 설정 및 운영하는 방법, 및 컴퓨터프로그램
KR100288460B1 (ko) 신호가중된 양자화비트할당을 사용하는 데이타 압축 장치 및 방법
KR101164937B1 (ko) 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램
US6098039A (en) Audio encoding apparatus which splits a signal, allocates and transmits bits, and quantitizes the signal based on bits
JP2904472B2 (ja) ディジタル・オーディオ信号を効率的に圧縮するための方法、データ処理システムおよび装置
US10966033B2 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
KR100273071B1 (ko) 신호 코딩 방법 및 아날로그 신호 변조 방법
JP2841765B2 (ja) 適応ビット割当て方法及び装置
JP3186292B2 (ja) 高能率符号化方法及び装置
EP3598442B1 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
JPH06149292A (ja) 高能率符号化方法及び装置
WO2020016440A1 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
US6772111B2 (en) Digital audio coding apparatus, method and computer readable medium
JP4551215B2 (ja) 音声の聴覚明瞭度分析を実施する方法
JPH09134200A (ja) ディジタル・オーディオ符号化方法及びその装置
EP0612160A2 (en) A bit allocation method for transform coder
US7650278B2 (en) Digital signal encoding method and apparatus using plural lookup tables
JPH09172376A (ja) 量子化ビット割当て装置
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
EP0899892A2 (en) Signal processing apparatus and method, and information recording apparatus
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JPH08211899A (ja) 音声符号化方法及びその装置
JP4173209B2 (ja) ディジタル化されたオーディオ信号の符号化方法及び装置
JPH07295594A (ja) オーディオ信号符号化方法