JPH0375700A - ベクトル量子化方式 - Google Patents
ベクトル量子化方式Info
- Publication number
- JPH0375700A JPH0375700A JP1211311A JP21131189A JPH0375700A JP H0375700 A JPH0375700 A JP H0375700A JP 1211311 A JP1211311 A JP 1211311A JP 21131189 A JP21131189 A JP 21131189A JP H0375700 A JPH0375700 A JP H0375700A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- quantization method
- vector quantization
- code
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は信号の量子化方式に係り、特に高品質な低ビツ
トレート音声符号化に好適なベクトル量子化方式に関す
る。
トレート音声符号化に好適なベクトル量子化方式に関す
る。
従来、音声高能率符号化方式には、様々な方式が提案さ
れてきた1例えば、中田和男著「ディジタル情報圧縮」
(廣済堂産報出版、電子科学シリーズ100)には、
様々な方式がわかりゃすく解説されており、波形符号化
方式や情報源符号化方式(パラメータ符号化方式)に関
する多数の方式が示されている。
れてきた1例えば、中田和男著「ディジタル情報圧縮」
(廣済堂産報出版、電子科学シリーズ100)には、
様々な方式がわかりゃすく解説されており、波形符号化
方式や情報源符号化方式(パラメータ符号化方式)に関
する多数の方式が示されている。
これら諸方式のうち、波形符号化方式は音質が良好なも
のの、情報圧縮効率をあげることが困難であり、パラメ
ータ符号化方式は、情報圧縮効率は高いものの、逆に情
報量をましでも音質に上限が生じ、十分な品質が得られ
ないという欠点があり、特に両者の得意な帯域の中間情
報圧縮(10kbps付近)は谷間の帯域となっている
。これに対し、両方式の長所を組合せたハイブリッド方
式として、マルチパルス方式(たとえば、 B、 S。
のの、情報圧縮効率をあげることが困難であり、パラメ
ータ符号化方式は、情報圧縮効率は高いものの、逆に情
報量をましでも音質に上限が生じ、十分な品質が得られ
ないという欠点があり、特に両者の得意な帯域の中間情
報圧縮(10kbps付近)は谷間の帯域となっている
。これに対し、両方式の長所を組合せたハイブリッド方
式として、マルチパルス方式(たとえば、 B、 S。
Atal et al、 ”A new model
of LPCexcitationfor produ
cing natural−sounding 5pe
ech at lowbit rates”Proc、
rcAssP 82. S−5,10,(1982)
など)や、TOR方式(A、 Ichikawa et
al、 ”Aspeech coding meth
od using thinned−outresid
ual”Proc、 ICASSP 85.25.7(
1985))等が近似提案され、各種の検討がなされて
いるが、音質の点から見ても、処理に要するコストの面
から見ても不十分な状況にある。
of LPCexcitationfor produ
cing natural−sounding 5pe
ech at lowbit rates”Proc、
rcAssP 82. S−5,10,(1982)
など)や、TOR方式(A、 Ichikawa et
al、 ”Aspeech coding meth
od using thinned−outresid
ual”Proc、 ICASSP 85.25.7(
1985))等が近似提案され、各種の検討がなされて
いるが、音質の点から見ても、処理に要するコストの面
から見ても不十分な状況にある。
一般に、各種高能率符号化方式は、音声の情報の存在が
偏っている点に注目し、情報の存在している部分に符号
の割当を厚くすることにより実現している。この点をさ
らに積極的に推し進め、複数のパラメータの組合せとし
ての情報の偏りに注目し、パラメータの組合せセット(
ベクトルと呼ぶ)に対し、音声情報の存在している部分
に符号に対し、音声情報の存在している部分に符号の割
当てを厚くする方式(ベクトル量子化と呼ぶ)(たとえ
ば、 S、 Roucos et al、、 ”Seg
mentquantization for very
−1ow−rate 5peech coding”P
roc、 ICASSP 82. p、1553(19
82))が注目されている。
偏っている点に注目し、情報の存在している部分に符号
の割当を厚くすることにより実現している。この点をさ
らに積極的に推し進め、複数のパラメータの組合せとし
ての情報の偏りに注目し、パラメータの組合せセット(
ベクトルと呼ぶ)に対し、音声情報の存在している部分
に符号に対し、音声情報の存在している部分に符号の割
当てを厚くする方式(ベクトル量子化と呼ぶ)(たとえ
ば、 S、 Roucos et al、、 ”Seg
mentquantization for very
−1ow−rate 5peech coding”P
roc、 ICASSP 82. p、1553(19
82))が注目されている。
ベクトル量子化方式では、ベクトルとコード(符号)を
対応付ける表をコードブックと呼ぶが、高品質の音声符
号化を実現するためには、事前に良質のコードブックを
作っておく必要がある。量子化特性の向上には量子化歪
を小さくすることが基オであるが、量子化歪はコードブ
ックを大きくするほど小さくなる。しかし、大規模のコ
ードブックの作業には極めて大量の音声データを用いな
ければならなず、かつ、膨大な処理量を要する。
対応付ける表をコードブックと呼ぶが、高品質の音声符
号化を実現するためには、事前に良質のコードブックを
作っておく必要がある。量子化特性の向上には量子化歪
を小さくすることが基オであるが、量子化歪はコードブ
ックを大きくするほど小さくなる。しかし、大規模のコ
ードブックの作業には極めて大量の音声データを用いな
ければならなず、かつ、膨大な処理量を要する。
また、メモリ容量や探索処理量といった制約から、コー
ドブックのサイズには限度がある。
ドブックのサイズには限度がある。
同一のコードブックを用いて、通常のベクトル量子化よ
りも量子化歪を小さくできる方法として、ファジィベク
トル量子化がある。これは、入力ベクトルとコードブッ
ク内のすべてのコードベクトルに対する級関数を用いて
内挿するものである(たとえば、H,P、 Tseng
at al、、 ”Fuzzy vectorqua
ntization applied to hidd
en Markovmodeling”ICASSP
137.4(1987))、 Lかし、各コードベクト
ルとの類似性の情報である級関数(メンバシップ関数)
情報が大量に必要となるため、コードブックの質やサイ
ズに比して音質の向上は期待されるものの、伝送用の技
術としては用いられてはいなかった。
りも量子化歪を小さくできる方法として、ファジィベク
トル量子化がある。これは、入力ベクトルとコードブッ
ク内のすべてのコードベクトルに対する級関数を用いて
内挿するものである(たとえば、H,P、 Tseng
at al、、 ”Fuzzy vectorqua
ntization applied to hidd
en Markovmodeling”ICASSP
137.4(1987))、 Lかし、各コードベクト
ルとの類似性の情報である級関数(メンバシップ関数)
情報が大量に必要となるため、コードブックの質やサイ
ズに比して音質の向上は期待されるものの、伝送用の技
術としては用いられてはいなかった。
最近傍コードベクトルと、事前にテーブルに登録されて
いるその近傍ベクトルを用いてファジィベクトル量子化
するものであり、ビットレートを8kbps以下にする
ことができる。また、常に量子化06 に)=傘t)、 しかしながら、使用されないコードベ
クトルの級関数(値はOとする)も伝送する必要があり
、伝送情報量に占める級関数の比率が大きいという問題
があった。したがって、更にビットレートを低減するた
めには級関数の情報量の削減が必要である。
いるその近傍ベクトルを用いてファジィベクトル量子化
するものであり、ビットレートを8kbps以下にする
ことができる。また、常に量子化06 に)=傘t)、 しかしながら、使用されないコードベ
クトルの級関数(値はOとする)も伝送する必要があり
、伝送情報量に占める級関数の比率が大きいという問題
があった。したがって、更にビットレートを低減するた
めには級関数の情報量の削減が必要である。
一方、特開昭63−285599には複数個のコードブ
ックを用い、各コードブックから1こずつのコードベク
トルを選択して伝送し、伝送路符号誤りに対する耐性を
向上させる方法が提案されている。しかしながら、与え
られた情報量で複数個のフードブックを用意するため、
全体としてコードベクトル数は小さくなり、量子化歪も
必ずしも減少しない。
ックを用い、各コードブックから1こずつのコードベク
トルを選択して伝送し、伝送路符号誤りに対する耐性を
向上させる方法が提案されている。しかしながら、与え
られた情報量で複数個のフードブックを用意するため、
全体としてコードベクトル数は小さくなり、量子化歪も
必ずしも減少しない。
本発明の目的は、ファジィベクトル量子化において、量
子化歪の低減を保証した上で、情報量を大幅に低減する
方法を提供することにある。
子化歪の低減を保証した上で、情報量を大幅に低減する
方法を提供することにある。
上記目的を達成するために、通常のベクトル量子化手段
(コードブック、入力ベクトルをコードベクトルと比較
する手段、最も近いコードベクトルを選択する手段)の
ほかに、入力ベクトルをコードブック中の複数個の代表
ベクトル(以下、コードベクトルと呼ぶ)の関数として
近似する手段を設ける。この関数近似手段は、あらかじ
め定めた評価基準に基づいて複数個のコードベクトルを
選択する手段と、関数のパラメータを算出する手段から
なる。
(コードブック、入力ベクトルをコードベクトルと比較
する手段、最も近いコードベクトルを選択する手段)の
ほかに、入力ベクトルをコードブック中の複数個の代表
ベクトル(以下、コードベクトルと呼ぶ)の関数として
近似する手段を設ける。この関数近似手段は、あらかじ
め定めた評価基準に基づいて複数個のコードベクトルを
選択する手段と、関数のパラメータを算出する手段から
なる。
本発明には種々の変形が考えられるが、その中の代表的
な手順について、その作用を説明する。
な手順について、その作用を説明する。
伝送したい音声が入力されると、分析部において特徴ベ
クトルが抽出され、j頃次コードブッグ中のコードベク
トルと比較され、最も近いベクトルが選択される。この
時の入力ベクトルとコードベクトルとの距離が通常のベ
クトル量子化における量子化歪に相当する。
クトルが抽出され、j頃次コードブッグ中のコードベク
トルと比較され、最も近いベクトルが選択される。この
時の入力ベクトルとコードベクトルとの距離が通常のベ
クトル量子化における量子化歪に相当する。
次に最近傍ベクトルと組合せるコードベクトルを選択す
る。組合せるベクトルの候補は各コードベクトルごとに
あらかじめ登録しである(通常はそのベクトルの近傍ベ
クトル)、具体的には、最近傍ベクトルに登録しである
候補コードベクトルを順次取り出し、最近傍ベクトルと
組合せて、線形結合として入力ベクトルを近似する。
る。組合せるベクトルの候補は各コードベクトルごとに
あらかじめ登録しである(通常はそのベクトルの近傍ベ
クトル)、具体的には、最近傍ベクトルに登録しである
候補コードベクトルを順次取り出し、最近傍ベクトルと
組合せて、線形結合として入力ベクトルを近似する。
この時近似度が最良となるように線形結合の係数を決定
する(従来は、ファジィベクトル量子化の級関数の定義
式に基づいて計算していた)。各候補ベクトルごとに近
似誤差(量子化歪に相当する)を算出し、誤差が最小と
なる候補ベグ1〜ルを選択する。
する(従来は、ファジィベクトル量子化の級関数の定義
式に基づいて計算していた)。各候補ベクトルごとに近
似誤差(量子化歪に相当する)を算出し、誤差が最小と
なる候補ベグ1〜ルを選択する。
伝送パラメータは、最近分ベクトルと選択されたコード
ベクトルのコード(指標)と線形結合の係数である。受
信側ではこれらの情報から入力ベクトルを指定されたコ
ードベクトルの線形結合として再合成(逆量子化)する
。
ベクトルのコード(指標)と線形結合の係数である。受
信側ではこれらの情報から入力ベクトルを指定されたコ
ードベクトルの線形結合として再合成(逆量子化)する
。
最近傍ベクトルの指標の情報量は、コードブックサイズ
に相当するビット数が必要であるが、組合せるコードベ
クトルの指標は、候補ベクトルとして登録されている数
に相当するビット数でよい。
に相当するビット数が必要であるが、組合せるコードベ
クトルの指標は、候補ベクトルとして登録されている数
に相当するビット数でよい。
また、線形結合の係数はスカラ量子化するが、組合せる
コードベクトルの個数(通常は1個)だけでよい、した
がって本発明によれば、むだな情報量を伝送する必要が
ないので、従来方式に比べ大幅な情報圧縮が可能である
。
コードベクトルの個数(通常は1個)だけでよい、した
がって本発明によれば、むだな情報量を伝送する必要が
ないので、従来方式に比べ大幅な情報圧縮が可能である
。
以下、本発明の実施例を図面を用いて説明する。
第2図は本発明の一実施例を説明するためのブロック図
である。送信側と受信側を対にした一方向のみを示して
おり、逆方向への通信路は1図が複雑になるため省略し
である。
である。送信側と受信側を対にした一方向のみを示して
おり、逆方向への通信路は1図が複雑になるため省略し
である。
第2図において、入力音声101はアナログ・ディジタ
ル(A/D)変換器102を経て、2面構成のバッファ
メモリ103に入力される。このメモリは以下の処理の
時間調整と、入力音声の中断を防止するために設けられ
ている。バッファメモリ103からの音声は分析部10
4に入力され、ピッチ情報107、スペクトル情報10
6.レベル情報105が求められる。スペクトル情報1
06は本発明のベクトル量子化部108に加えられ、ベ
クトルコード109と関数のパラメータ(係数)110
を得る。ベクトルコード109、パラメータ110.ピ
ッチ情報107、レベル情報105は送信部111.伝
送路112を経て受信部113に送られる。受信側では
受信部で受けたベクトルコード109’、パラメータ1
10’ピツチ情報107′ レベル情報105′はベ
クトル逆量子化部114に加えられ、スペクトル情報1
15が復元され、ピッチ情報107’、レベル情報10
5′と共に合或部116に加えられる。
ル(A/D)変換器102を経て、2面構成のバッファ
メモリ103に入力される。このメモリは以下の処理の
時間調整と、入力音声の中断を防止するために設けられ
ている。バッファメモリ103からの音声は分析部10
4に入力され、ピッチ情報107、スペクトル情報10
6.レベル情報105が求められる。スペクトル情報1
06は本発明のベクトル量子化部108に加えられ、ベ
クトルコード109と関数のパラメータ(係数)110
を得る。ベクトルコード109、パラメータ110.ピ
ッチ情報107、レベル情報105は送信部111.伝
送路112を経て受信部113に送られる。受信側では
受信部で受けたベクトルコード109’、パラメータ1
10’ピツチ情報107′ レベル情報105′はベ
クトル逆量子化部114に加えられ、スペクトル情報1
15が復元され、ピッチ情報107’、レベル情報10
5′と共に合或部116に加えられる。
合或部116では音声波形に復号され、出力用の2面バ
ッファメモリ117を経て、ディジタル・アナログ(D
/A)変換路118によりアナログ信号に変換され、出
力音声119として再生される。
ッファメモリ117を経て、ディジタル・アナログ(D
/A)変換路118によりアナログ信号に変換され、出
力音声119として再生される。
以下、各部分を詳細に説明する。
第3図は分析部104を説明するための図である0本実
施例では、分析部はパワスペクトル包絡(PSE)分析
法による。PSE分析法は、中島等の論文パパワースペ
クトル包M(PSE)音声分析・合戊系″、日本音響学
合釘44巻11号(昭63−11)に詳細に述べられて
いる。ここではその概要を述べる。
施例では、分析部はパワスペクトル包絡(PSE)分析
法による。PSE分析法は、中島等の論文パパワースペ
クトル包M(PSE)音声分析・合戊系″、日本音響学
合釘44巻11号(昭63−11)に詳細に述べられて
いる。ここではその概要を述べる。
第3図において、ピッチ抽出部201は入力音声のピッ
チ情報(ピッチ周波数またはピッチ周期)を抽出する。
チ情報(ピッチ周波数またはピッチ周期)を抽出する。
ピッチ油出の方法は、相関法やAMDF法など公知の方
法を用いれば良い。波形切り出し部203は入力音声か
らスペクトル情報を分析するための波形区間を切り出す
ものであり、20〜60m5程度の区間を切り出す。固
定長の区間とすることが多いが、ピッチ周期に依存し、
その3倍程度の可変長にすることもある。切り出された
波形は、フーリエ変換部204に送られ、フーリエ級数
に変換される。このとき、切り出された波形にハミング
窓等、通常用いられる窓関数を掛けた後、前後に零デー
タを埋め込み。
法を用いれば良い。波形切り出し部203は入力音声か
らスペクトル情報を分析するための波形区間を切り出す
ものであり、20〜60m5程度の区間を切り出す。固
定長の区間とすることが多いが、ピッチ周期に依存し、
その3倍程度の可変長にすることもある。切り出された
波形は、フーリエ変換部204に送られ、フーリエ級数
に変換される。このとき、切り出された波形にハミング
窓等、通常用いられる窓関数を掛けた後、前後に零デー
タを埋め込み。
2048点をデータとし、高速フーリエ変換(FFT)
を用いることで、高速かつ周波数分解能の高いデータが
得られる。フーリエ係数を絶対値で表示したものが切り
出し波形の周波数成分、すなわちスペクトルとなる。切
り出し波形が周期構造を有する場合は、スペクトルはピ
ッチの高調波による線スペクトル構造を有する。
を用いることで、高速かつ周波数分解能の高いデータが
得られる。フーリエ係数を絶対値で表示したものが切り
出し波形の周波数成分、すなわちスペクトルとなる。切
り出し波形が周期構造を有する場合は、スペクトルはピ
ッチの高調波による線スペクトル構造を有する。
ピッチ再標本化部205では、FETにより得られたス
ペクトル情報の中から、ピッチ周波数の高調波成分(線
スペクトル成分)のみを取り出す。
ペクトル情報の中から、ピッチ周波数の高調波成分(線
スペクトル成分)のみを取り出す。
このようにして取り出したデータは、後述の余弦級数展
開時の周期冗に対応付けて、以下考える。
開時の周期冗に対応付けて、以下考える。
パワスペクトル化部206は、スペクトルの各成分を自
乗し、パワスペクトルに変換する。さらに、対数化部2
07は、各成分を対数化し、対数パワスペクトルを得る
。
乗し、パワスペクトルに変換する。さらに、対数化部2
07は、各成分を対数化し、対数パワスペクトルを得る
。
レベル正規化部208は入力音声の大きさに基づくレベ
ル変動を吸収するものであるが、次の余弦変換部209
において、まとめて抽出しても良い。
ル変動を吸収するものであるが、次の余弦変換部209
において、まとめて抽出しても良い。
余弦変換部209は対数パワスペクトルを再標本化した
データを用いて、有限項の余弦級数で近似的に表現する
ものである。項数mは1通常25程度に設定する。パワ
スペクトル包絡を次のように表現する。
データを用いて、有限項の余弦級数で近似的に表現する
ものである。項数mは1通常25程度に設定する。パワ
スペクトル包絡を次のように表現する。
Y = A、 +A、cosλ+A、cos2λ+・・
・・・・+Amcosmλ (
1)係数Aは、再標本化されたパワスペクトルデータと
、(1)式によるYとの2乗誤差が最小となるように求
められる。係数の第0項A0は入力のレベルを表わして
いるのでレベル情報105として、A□、・・・、Aヨ
をスペクトル情報106として出力する。
・・・・+Amcosmλ (
1)係数Aは、再標本化されたパワスペクトルデータと
、(1)式によるYとの2乗誤差が最小となるように求
められる。係数の第0項A0は入力のレベルを表わして
いるのでレベル情報105として、A□、・・・、Aヨ
をスペクトル情報106として出力する。
次に第1図を用いて本発明のベクトル量子化部を説明す
る。第1図において、コードブック401にはコードベ
クトルの要素の値とそのコードが記憶されている。また
、後述の候補ベクトル選択のため、各コードベクトルご
とにその近傍ベクトルのコードが記憶されている(本実
施例で用いるコードブックの構造を第4図に示す)。
る。第1図において、コードブック401にはコードベ
クトルの要素の値とそのコードが記憶されている。また
、後述の候補ベクトル選択のため、各コードベクトルご
とにその近傍ベクトルのコードが記憶されている(本実
施例で用いるコードブックの構造を第4図に示す)。
照合部402において、スペクトル情報(入力ベクトル
)106が入力されると、コードブック401から各コ
ードベクトルが読みだされ、入力ベクトル106との距
離が計算される。ここで距離尺度は、ベクトルの各要素
に重み付けしたユークリッド距離であるが、他の適当な
尺度を用し)ても良いことは言うまでもない。全数探索
の場合はコードブック中の全てのコードベクトルに対し
て距離値が計算され、距離値が最小となるコードベクト
ル(最近傍ベクトル)のコード403を出力する。なお
、ピッチ情報107などを利用して。
)106が入力されると、コードブック401から各コ
ードベクトルが読みだされ、入力ベクトル106との距
離が計算される。ここで距離尺度は、ベクトルの各要素
に重み付けしたユークリッド距離であるが、他の適当な
尺度を用し)ても良いことは言うまでもない。全数探索
の場合はコードブック中の全てのコードベクトルに対し
て距離値が計算され、距離値が最小となるコードベクト
ル(最近傍ベクトル)のコード403を出力する。なお
、ピッチ情報107などを利用して。
照合の対象とするコードベクトルの範囲を限定すること
も可能である。
も可能である。
候補ベクトル選択部404において、最近傍ベクトルと
組合せ、入力ベクトルを近似するコードベクトル(以下
、相補ベクトルと呼ぶ)の候補となるコードベクトルを
選択する。ここでは、最近傍ベクトルのコード403に
基づいて、コードブック401に登録しである近傍ベク
トルのコードを読みだし、候補ベクトルコード405と
して出力する。また、コードブック401の全コードベ
クトルを候補ベクトルとする場合には、本候補ベクトル
選択部は不要である。この場合の候補ベクトルコード4
05は、最近傍ベクトルコードを除、全コードベクトル
のコードである。
組合せ、入力ベクトルを近似するコードベクトル(以下
、相補ベクトルと呼ぶ)の候補となるコードベクトルを
選択する。ここでは、最近傍ベクトルのコード403に
基づいて、コードブック401に登録しである近傍ベク
トルのコードを読みだし、候補ベクトルコード405と
して出力する。また、コードブック401の全コードベ
クトルを候補ベクトルとする場合には、本候補ベクトル
選択部は不要である。この場合の候補ベクトルコード4
05は、最近傍ベクトルコードを除、全コードベクトル
のコードである。
関数近似部406では、入力ベクトルを複数個のコード
ベクトルで近似する。関数形は種々考えられるが、ここ
では2個のコードベクトルの線形結合で近似する場合に
ついて説明する。また、2個のコードベクトルのうち1
個は最近傍ベクトルとする。
ベクトルで近似する。関数形は種々考えられるが、ここ
では2個のコードベクトルの線形結合で近似する場合に
ついて説明する。また、2個のコードベクトルのうち1
個は最近傍ベクトルとする。
入力ベクトルを2個のコードベクトルの線形結合で近似
する原理を第5図で説明する。同図では簡単のため、2
次元のベクトルとして表示しである。
する原理を第5図で説明する。同図では簡単のため、2
次元のベクトルとして表示しである。
線形結合で合成されるベクトル(近似ベクトル)は、2
個のベクトルu、vを通る直線上に合成される。重み係
数の符号と大きさにより、u、vの内分点、または外分
点となる。線形結合の重みは、近似誤差(合成ベクトル
と人力ベクトルの距離。
個のベクトルu、vを通る直線上に合成される。重み係
数の符号と大きさにより、u、vの内分点、または外分
点となる。線形結合の重みは、近似誤差(合成ベクトル
と人力ベクトルの距離。
すなわち量子化歪)を最小化するように決定すればよい
。図から明らかなように、入力ベクトルを2個のコード
ベクトルで近似することにより、量子化歪を低減できる
ことがわかる。
。図から明らかなように、入力ベクトルを2個のコード
ベクトルで近似することにより、量子化歪を低減できる
ことがわかる。
2個のコードベクトルはすべてのコードベクトルの組み
合わせから選択すればよいが、その内の1個は最近傍ベ
クトルが選ばれる確率が高い。そこであらかじめ1つは
最近傍ベクトルに固定しても問題ない。このようにして
も、fi量子化歪減少度合いは全組み合わせから選択す
る場合とほとんど変わらず、また、選択処理量は大幅に
減少する(対象とするコードベクトル数をmとすると、
処理量は27 mとなる。) 一般に、ベクトルの次元を此とする。入力ベクトルをx
= (x、、x、、・・・・・・xl)、最近傍ベクト
ルをu=(u工、u8.・・・un)、相補ベクトルを
v= (vi、 v、、・・・vm)とする。線形結合
の係数をw、(1−w)とすれば、近似ベクトルy”
(3’iy Vzt・・・y、)はy=wu+ (1
−w)v (2)と表される。ここ
で近似誤差1x−ylが最小になるように係数Wを定め
る。2乗誤差をQo”とすると 立 となる。これをWで偏微分し、Oと置いて整理すれば、
係数Wは次のように求まる。
合わせから選択すればよいが、その内の1個は最近傍ベ
クトルが選ばれる確率が高い。そこであらかじめ1つは
最近傍ベクトルに固定しても問題ない。このようにして
も、fi量子化歪減少度合いは全組み合わせから選択す
る場合とほとんど変わらず、また、選択処理量は大幅に
減少する(対象とするコードベクトル数をmとすると、
処理量は27 mとなる。) 一般に、ベクトルの次元を此とする。入力ベクトルをx
= (x、、x、、・・・・・・xl)、最近傍ベクト
ルをu=(u工、u8.・・・un)、相補ベクトルを
v= (vi、 v、、・・・vm)とする。線形結合
の係数をw、(1−w)とすれば、近似ベクトルy”
(3’iy Vzt・・・y、)はy=wu+ (1
−w)v (2)と表される。ここ
で近似誤差1x−ylが最小になるように係数Wを定め
る。2乗誤差をQo”とすると 立 となる。これをWで偏微分し、Oと置いて整理すれば、
係数Wは次のように求まる。
Σ (u i+ xt)(u l vt)i=1
以上はコードベクトルを2個用いる場合であるが、3個
以上の場合も、まったく同様に係数の組(Wl、W、、
・・・)を求めることができる。また、処理量に余裕が
ある場合には、最近傍ベクトルを用いることにこだわら
ず、全組み合わせから選択すればよい。さらに、以上の
説明ではコードブックは1つと仮定しているが、複数個
の独立した、または従属したコードブックを用い、そこ
からコードベクトルを選択するようにしてもよいことは
、いうまでもない。
以上の場合も、まったく同様に係数の組(Wl、W、、
・・・)を求めることができる。また、処理量に余裕が
ある場合には、最近傍ベクトルを用いることにこだわら
ず、全組み合わせから選択すればよい。さらに、以上の
説明ではコードブックは1つと仮定しているが、複数個
の独立した、または従属したコードブックを用い、そこ
からコードベクトルを選択するようにしてもよいことは
、いうまでもない。
第1図に戻り、ベクトル量子化部の後半について説明す
る0因数近似部の出力は、最近傍ベクトルと組合せた候
補ベクトルのコード407、近似誤差を最小にする係数
408.そのとき近似誤差(量子化歪に相当)409で
ある。これらと最近傍ベクトルのコード403が相補ベ
クトル決定部410に入力される。相補ベクトル決定部
410では、近似誤差が最小さなる候補ベクトルのコー
ドを最近傍ベクトルのコードとともにベクトルコード1
09として出力する。さらにその時の係数110を出力
する。
る0因数近似部の出力は、最近傍ベクトルと組合せた候
補ベクトルのコード407、近似誤差を最小にする係数
408.そのとき近似誤差(量子化歪に相当)409で
ある。これらと最近傍ベクトルのコード403が相補ベ
クトル決定部410に入力される。相補ベクトル決定部
410では、近似誤差が最小さなる候補ベクトルのコー
ドを最近傍ベクトルのコードとともにベクトルコード1
09として出力する。さらにその時の係数110を出力
する。
以上の例では、入力ベクトルを複数個の線形結合として
近似し、その係数は近似誤差を最小化するという規範で
決定した6他の例として、ファジィベクトル量子化の考
えに基づいて決定することもできる。
近似し、その係数は近似誤差を最小化するという規範で
決定した6他の例として、ファジィベクトル量子化の考
えに基づいて決定することもできる。
ファジィベクトル量子化については、中村等の文献「フ
ァジィベクトル量子化を用いたスペクトグラムの正規化
」 (日本音響学会誌45巻2号(1989))及びそ
こで引用されている文献に詳しく述べられているので、
ここではその概要を説明する。
ァジィベクトル量子化を用いたスペクトグラムの正規化
」 (日本音響学会誌45巻2号(1989))及びそ
こで引用されている文献に詳しく述べられているので、
ここではその概要を説明する。
ファジィベクトル量子化では、入力ベクトルを複数個の
コードベクトルに対する帰属度によって表現する。帰属
度は級関数(メンバシップ関数)により、数値化される
。級関数の求め方の一例を次式に示す。
コードベクトルに対する帰属度によって表現する。帰属
度は級関数(メンバシップ関数)により、数値化される
。級関数の求め方の一例を次式に示す。
今、0個のコードベクトル(vl、・・・、 vc)を
対象とするとき、入力ベクトルxkとコードベクトルv
1と距離をdikとする。入力ベクトルがどのコードベ
クトルにも一致しない場合は、各コードベクトルに対す
る級関数ulkは次式によって求まる。
対象とするとき、入力ベクトルxkとコードベクトルv
1と距離をdikとする。入力ベクトルがどのコードベ
クトルにも一致しない場合は、各コードベクトルに対す
る級関数ulkは次式によって求まる。
ここに、pはファジィネスと呼ぶパラメータで、通常1
.58度の値とする。もし、入力ベクトルがコードベク
トルのいずれかに一致したときは、そのコードベクトル
に対する級関数の値を1とし。
.58度の値とする。もし、入力ベクトルがコードベク
トルのいずれかに一致したときは、そのコードベクトル
に対する級関数の値を1とし。
他を0とする。
次に、級関数からベクトルを再生する(′a、量子化操
作)について説明する。再生ベクトルyはコードベクト
ルの線形結合で表わされる。
作)について説明する。再生ベクトルyはコードベクト
ルの線形結合で表わされる。
入力ベクトルxkと再生ベクトルyとの誤差(距離)が
ファジィベクトル量子化による量子化歪である。ファジ
ィベクトル量子化に基づく場合は、関数のパラメータは
級関数(メンバシップ関数)である1級関数はその性質
上、総和は1となるので、入力ベクトルを近似するコー
ドベクトルの数より1少ない個数だけ出力すれば良い。
ファジィベクトル量子化による量子化歪である。ファジ
ィベクトル量子化に基づく場合は、関数のパラメータは
級関数(メンバシップ関数)である1級関数はその性質
上、総和は1となるので、入力ベクトルを近似するコー
ドベクトルの数より1少ない個数だけ出力すれば良い。
以上は、相補ベクトルの選択基準として量子化歪を用い
た例である。これ以外に1局所後号器を持つことにより
、入力信号と同じ次元での誤差尺度を評価基準として、
ベクトルを選択することもできる。
た例である。これ以外に1局所後号器を持つことにより
、入力信号と同じ次元での誤差尺度を評価基準として、
ベクトルを選択することもできる。
次の復号側(受信側)について説明する。
第6図はベクトル逆量子化部114を説明するための図
である。ベクトルコード109′が受信されると、コー
ドブック701から対応するコードベクトルが読みださ
れる。これと受信された係数(または係数の組)110
’ を用いて、ベクトル再生部702において、前述の
(2)式(ファジィベクトル量子化の場合は(4)式)
によりベクトルを再生する。なお、受信側のコードブッ
ク701は送信側のコードブック401と同一の内容で
あることは言うまでもない。再生ベトクルy= (Aエ
j Am’ l・・・、A、’ )はスペクトル情報
115として合成部116に送られる。
である。ベクトルコード109′が受信されると、コー
ドブック701から対応するコードベクトルが読みださ
れる。これと受信された係数(または係数の組)110
’ を用いて、ベクトル再生部702において、前述の
(2)式(ファジィベクトル量子化の場合は(4)式)
によりベクトルを再生する。なお、受信側のコードブッ
ク701は送信側のコードブック401と同一の内容で
あることは言うまでもない。再生ベトクルy= (Aエ
j Am’ l・・・、A、’ )はスペクトル情報
115として合成部116に送られる。
次に1合成部116を第7図を用いて説明する。
同図において、対数パワスペクトル再生部801では、
伝送されたレベル情報A、’105’ と再生ベクトル
(スペクトル情報115)の各要素A1’、A2′
・・・A m ’ を用いて対数パワスペクトルY’
802を次式にしたがって得る。
伝送されたレベル情報A、’105’ と再生ベクトル
(スペクトル情報115)の各要素A1’、A2′
・・・A m ’ を用いて対数パワスペクトルY’
802を次式にしたがって得る。
Y’ =A、’ +A□’cosλ+A、’cos
2λ+−+ A a’ cos mλ
(5)再生された対数パワスペクトルY’802は
逆対数変換部803で変換(1/ 2 ) log−’
を行い、零位相化スペクトル804を得、逆フーリエ変
換部805へ送られる。逆フーリエ変換部805では高
速フーリエ逆変換(IFFT)により音声素片806が
得られる。音声素片806は波形合成部807でピッチ
情報107′にしたがって順次ピッチ間隔だけずらしな
がら加えあわせられ、再生音声808として出力される
。
2λ+−+ A a’ cos mλ
(5)再生された対数パワスペクトルY’802は
逆対数変換部803で変換(1/ 2 ) log−’
を行い、零位相化スペクトル804を得、逆フーリエ変
換部805へ送られる。逆フーリエ変換部805では高
速フーリエ逆変換(IFFT)により音声素片806が
得られる。音声素片806は波形合成部807でピッチ
情報107′にしたがって順次ピッチ間隔だけずらしな
がら加えあわせられ、再生音声808として出力される
。
実施例における変発明の効果を第8図に示す。
コードブックサイズに対する量子化歪の関係をプロット
したものであり、本発明のベクトル量子化を用いると、
従来のベクトル量子化で約4倍のコードブックを用いた
のと同程度の量子化歪となる。
したものであり、本発明のベクトル量子化を用いると、
従来のベクトル量子化で約4倍のコードブックを用いた
のと同程度の量子化歪となる。
本発明によれば、同一のコードブックを用いた場合、量
子化歪を従来のベクトル量子化よりも常ても、情報量を
削減できる。
子化歪を従来のベクトル量子化よりも常ても、情報量を
削減できる。
なお、本発明の説明では、対象は全て音声を例にしてい
るが、類似の構造の情報をもつものに利用できることは
言うまでもない。
るが、類似の構造の情報をもつものに利用できることは
言うまでもない。
第1図は本発明のベクトル量子化部を説明する図、第2
図は本発明の一実施例のシステム構成を説明するブロッ
ク図、第3図は分析部を説明する図、第4図はコードブ
ックの構成を示す図、第5図は線形結合による入力ベク
トル近似の説明図、第6図はベクトル逆量子化部を説明
する図、第7図は合成部を説明する図、第8図は実施例
の効果を説明する図である。 符号の説明 101・・・入力音声、103,117・・・バッファ
メモリ、104・・・分析部、106,115・・・ス
ペクトル情報、107,107’・・・ピッチ情報。 108・・・ベクトル量子化部、109,109’・・
・ベクトルインデクス、110,110′・・・級関数
、(114・・・ベクトル逆量子化部、116・・・合
成部、120・・・出力音声。 ・1 忰
図は本発明の一実施例のシステム構成を説明するブロッ
ク図、第3図は分析部を説明する図、第4図はコードブ
ックの構成を示す図、第5図は線形結合による入力ベク
トル近似の説明図、第6図はベクトル逆量子化部を説明
する図、第7図は合成部を説明する図、第8図は実施例
の効果を説明する図である。 符号の説明 101・・・入力音声、103,117・・・バッファ
メモリ、104・・・分析部、106,115・・・ス
ペクトル情報、107,107’・・・ピッチ情報。 108・・・ベクトル量子化部、109,109’・・
・ベクトルインデクス、110,110′・・・級関数
、(114・・・ベクトル逆量子化部、116・・・合
成部、120・・・出力音声。 ・1 忰
Claims (1)
- 【特許請求の範囲】 1、入力信号の特徴を複数個のパラメータの組(ベクト
ル)として分析する手段と、信号の特徴空間を相異なる
コード(指標)を付与した複数個のクラスタに分割し、
各クラスタを代表するパラメータの組(コードベクトル
、代表ベクトル、またはコードワードともいう)、と前
記コードとを対応付けて記憶するコードブックと、前記
分析手段により得られた入力信号の特徴を表わすベクト
ルと前記コードブック内の各クラスタの代表ベクトルを
比較する手段を少なくとも有してなり、入力信号のベク
トル(以下、入力ベクトルという)を前記複数個のコー
ドベクトルの関数として近似する手段を有し、前記入力
ベクトルを前記複数個のコードベクトルを特定するコー
ドと前記関数のパラメータで表現することを特徴とする
ベクトル量子化方式。 2、ベクトル量子化方式であって、入力ベクトルを複数
個のコードベクトルから合成されるベクトルに量子化す
ることを特徴とするベトクル量子化方式。 3、ベクトル量子化方式であって、入力ベクトルと複数
個のコードベクトルとの関係(類似性等)を数値化する
手段を有し、該数値を前記入力ベクトルの量子化に用い
ることを特徴とするベクトル量子化方式。 4、ベクトル量子化方式であって、入力ベクトルを複数
個のコードベクトルの線形結合で近似し、該線形結合の
係数をパラメータとすることを特徴とする、特許請求の
範囲第1項記載のベクトル量子化方式。 5、ベクトル量子化方式であって、入力ベクトルを近似
する関数のパラメータは、前記入力ベクトルの近似度を
最良とする(量子化歪を最小とする)ような規範で定め
ることを特徴とする、特許請求の範囲第1項及び第4項
記載のベクトル量子化方式。 6、ベクトル量子化方式であって、入力ベクトルを複数
個のコードベクトルからなるファジィベクトル量子化に
よって近似し、該ファジィベクトル量子化の級関数をパ
ラメータとすることを特徴とする、特許請求の範囲第1
項記載のベクトル量子化方式。 7、ベクトル量子化方式であって、1個または複数個の
コードブックを有し、入力ベクトルの量子化に用いる複
数個のコードベクトルは前記1個または複数個のコード
ブックのうちのいずれか一個のコードブックから選択す
ることを特徴とする、特許請求の範囲第1項ないし第6
項記載のベクトル量子化方式。 8、ベクトル量子化方式であって、複数個のコードブッ
クを有し、入力ベクトルの量子化に用いる複数個のコー
ドベクトルは前記複数個のコードブックのうち少なくと
も2個以上のコードブックから選択することを特徴とす
る、特許請求の範囲第1項ないし第6項記載のベクトル
量子化方式。 9、入力ベクトルを複数個のコードベクトルの関数で近
似するベクトル量子化方式であって、前記複数個のコー
ドベクトルは前記入ベクトルの近似度が最良となる(量
子化歪が最小となる)ように選択することを特徴とする
、特許請求の範囲第1項ないし第8項記載のベクトル量
子化方式。 10、入力ベクトルを複数個のコードベクトルの関数で
近似するベクトル量子化方式であって、前記複数個のコ
ードベクトルのうち1個は前記入力ベクトルとの距離が
最小(または、類似度が最大)のコードベクトルである
ことを特徴とする、特許請求の範囲第1項ないし第9項
のベクトル量子化方式。 11、音声信号の特徴を表すLPCパラメータ、または
LPCパラメータから導出されるパラメータ(PARC
OR、LSP等)の量子化に、特許請求の範囲第1項な
いし第10項のベクトル量子化方式を用いる音声処理装
置。 12、音声信号の特徴を表すPSEパラメータの量子化
に、特許請求の範囲第1項ないし第10項のベクトル量
子化方式を用いる音声処理装置。 13、音声信号の特徴を表すQSSパラメータの量子化
に、特許請求の範囲第1項ないし第10項のベクトル量
子化方式を用いる音声処理装置。 14、特許請求の範囲第1項ないし第10項のベクトル
量子化方式を用いる、音声符号化システム。 15、特許請求の範囲第1項ないし第10項のベクトル
量子化方式を用いる、ボイスメールシステム。 16、特許請求の範囲第1項ないし第10項のベクトル
量子化方式を用いる、音声データ多重化システム。 17、特許請求の範囲第1項ないし第10項のベクトル
量子化方式を用いる、秘話システム。 18、特許請求の範囲第1項ないし第10項のベクトル
量子化方式を用いる、移動無線システム。 19、特許請求の範囲第1項ないし第10項のベクトル
量子化方式を用いる、音声認識応答システム。
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1211311A JPH0375700A (ja) | 1989-08-18 | 1989-08-18 | ベクトル量子化方式 |
| CA000613182A CA1321645C (en) | 1988-09-28 | 1989-09-26 | Method and system for voice coding based on vector quantization |
| US07/412,987 US5077798A (en) | 1988-09-28 | 1989-09-26 | Method and system for voice coding based on vector quantization |
| EP19890117857 EP0361443A3 (en) | 1988-09-28 | 1989-09-27 | Method and system for voice coding based on vector quantization |
| US07/776,842 US5384891A (en) | 1988-09-28 | 1991-10-15 | Vector quantizing apparatus and speech analysis-synthesis system using the apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1211311A JPH0375700A (ja) | 1989-08-18 | 1989-08-18 | ベクトル量子化方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0375700A true JPH0375700A (ja) | 1991-03-29 |
Family
ID=16603840
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1211311A Pending JPH0375700A (ja) | 1988-09-28 | 1989-08-18 | ベクトル量子化方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0375700A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1993025007A1 (fr) * | 1992-05-29 | 1993-12-09 | Studio Gen Inc. | Procede pour comprimer des informations audio, et appareil pour reproduire des informations audio |
-
1989
- 1989-08-18 JP JP1211311A patent/JPH0375700A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1993025007A1 (fr) * | 1992-05-29 | 1993-12-09 | Studio Gen Inc. | Procede pour comprimer des informations audio, et appareil pour reproduire des informations audio |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5495555A (en) | High quality low bit rate celp-based speech codec | |
| US5878387A (en) | Coding apparatus having adaptive coding at different bit rates and pitch emphasis | |
| US6078880A (en) | Speech coding system and method including voicing cut off frequency analyzer | |
| US6098036A (en) | Speech coding system and method including spectral formant enhancer | |
| JP2779886B2 (ja) | 広帯域音声信号復元方法 | |
| JP4064236B2 (ja) | 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法 | |
| US6081776A (en) | Speech coding system and method including adaptive finite impulse response filter | |
| EP0770989B1 (en) | Speech encoding method and apparatus | |
| US6067511A (en) | LPC speech synthesis using harmonic excitation generator with phase modulator for voiced speech | |
| JP4005154B2 (ja) | 音声復号化方法及び装置 | |
| US6138092A (en) | CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency | |
| US6119082A (en) | Speech coding system and method including harmonic generator having an adaptive phase off-setter | |
| US5077798A (en) | Method and system for voice coding based on vector quantization | |
| US6094629A (en) | Speech coding system and method including spectral quantizer | |
| EP0838804A2 (en) | Audio bandwidth extending system and method | |
| US20080126084A1 (en) | Method, apparatus and system for encoding and decoding broadband voice signal | |
| JPH10154000A (ja) | 音声符号化復号方式 | |
| EP1353323A1 (en) | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound | |
| JP3344962B2 (ja) | オーディオ信号符号化装置、及びオーディオ信号復号化装置 | |
| KR19990077753A (ko) | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 | |
| JPH0395600A (ja) | 音声コーディング装置及び音声エンコーディング方法 | |
| JP2003323199A (ja) | 符号化装置、復号化装置及び符号化方法、復号化方法 | |
| US5651026A (en) | Robust vector quantization of line spectral frequencies | |
| EP0926659B1 (en) | Speech encoding and decoding method | |
| JP4857468B2 (ja) | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |