JPH0455899A - 音声信号符号化方式 - Google Patents
音声信号符号化方式Info
- Publication number
- JPH0455899A JPH0455899A JP2166239A JP16623990A JPH0455899A JP H0455899 A JPH0455899 A JP H0455899A JP 2166239 A JP2166239 A JP 2166239A JP 16623990 A JP16623990 A JP 16623990A JP H0455899 A JPH0455899 A JP H0455899A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio signal
- lsp
- sound source
- codebook
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003595 spectral effect Effects 0.000 claims abstract description 35
- 230000005236 sound signal Effects 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 40
- 238000013139 quantization Methods 0.000 abstract description 44
- 239000013598 vector Substances 0.000 abstract description 41
- 230000004044 response Effects 0.000 abstract description 11
- 230000003044 adaptive effect Effects 0.000 abstract description 10
- 230000009466 transformation Effects 0.000 abstract description 8
- 230000035807 sensation Effects 0.000 abstract 2
- 238000004364 calculation method Methods 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- ZVQOOHYFBIDMTQ-UHFFFAOYSA-N [methyl(oxido){1-[6-(trifluoromethyl)pyridin-3-yl]ethyl}-lambda(6)-sulfanylidene]cyanamide Chemical compound N#CN=S(C)(=O)C(C)C1=CC=C(C(F)(F)F)N=C1 ZVQOOHYFBIDMTQ-UHFFFAOYSA-N 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
C産業上の利用分野〕
本発明は、音声信号を低いビットレート、特に8〜4.
8kb/s程度で高品質に符号化するための音声信号符
号化方式に関する。
8kb/s程度で高品質に符号化するための音声信号符
号化方式に関する。
C従来の技術〕
音声信号を8〜4.8kb/s程度のビットレートで符
号化する方式としては、例えば、M、 5chroed
erand B、Ata1氏による”Code−exc
ited 1inear predi−ction:
High quality 5peech at ve
ry low bitrates” (Proc、 I
CASSP、 pp、937−940.1985年)と
題した論文(文献1)等に記載されているCELP(C
ode Excited LPCCoding)符号化
方式や、B、Ata1氏らによるA new mode
l of LPCexcitation pro−du
cing natural−sounding 5pe
ech at low bit ra−tes”と題し
た論文(文献2)等に記載されたマルチパルス符号化方
式が知られている。
号化する方式としては、例えば、M、 5chroed
erand B、Ata1氏による”Code−exc
ited 1inear predi−ction:
High quality 5peech at ve
ry low bitrates” (Proc、 I
CASSP、 pp、937−940.1985年)と
題した論文(文献1)等に記載されているCELP(C
ode Excited LPCCoding)符号化
方式や、B、Ata1氏らによるA new mode
l of LPCexcitation pro−du
cing natural−sounding 5pe
ech at low bit ra−tes”と題し
た論文(文献2)等に記載されたマルチパルス符号化方
式が知られている。
前者の方式では、送信側では、フレーム毎(例えば2抛
S)に音声信号から音声信号のスペクトル特性を全極(
All−pole)モデルで近似し、スペクトル特性を
表すスペクトルパラメータ(例えばPARCOR係数や
I、SP係数)を抽出する。次にフレームをさらに小区
間サブフレーム(例えば5m5)4::分割し、サブフ
レーム毎に過去の音源信号をもとに長時間相関(ピッチ
相関)を表すピッチパラメータ(適応コードブックとも
呼ばれる)を抽出し、ピッチパラメータによりサブフレ
ームの音声信号を長期予測し、長期予測して求めた残差
信号に対して、予め定められた種類の雑音信号から構成
されたコードブックから選択した信号により合成した信
号と、音声信号との誤差電力を最小化するように一種類
の雑音信号を選択するとともに、最適なゲインを計算す
る。そして選択された雑音信号の種類を表すインデクス
とゲイン、ならびにスペクトルパラメータとピッチパラ
メータを伝送する。
S)に音声信号から音声信号のスペクトル特性を全極(
All−pole)モデルで近似し、スペクトル特性を
表すスペクトルパラメータ(例えばPARCOR係数や
I、SP係数)を抽出する。次にフレームをさらに小区
間サブフレーム(例えば5m5)4::分割し、サブフ
レーム毎に過去の音源信号をもとに長時間相関(ピッチ
相関)を表すピッチパラメータ(適応コードブックとも
呼ばれる)を抽出し、ピッチパラメータによりサブフレ
ームの音声信号を長期予測し、長期予測して求めた残差
信号に対して、予め定められた種類の雑音信号から構成
されたコードブックから選択した信号により合成した信
号と、音声信号との誤差電力を最小化するように一種類
の雑音信号を選択するとともに、最適なゲインを計算す
る。そして選択された雑音信号の種類を表すインデクス
とゲイン、ならびにスペクトルパラメータとピッチパラ
メータを伝送する。
上述した文献lに記載の従来方式では、高音質を得るた
めには、音声信号のスペクトル特性をスペクトルパラメ
ータにより良好に表すことが必要である。スペクトルパ
ラメータは、送信側から伝送するために量子化が施され
る。効率的な量子化法としては、例えばLSPSP係数
するベクトルースカラ量子化法が知られている。具体的
な方法は例えば、T、Moriya氏らによる”Tra
nsform CodjBof 5peech u
sing a Weighted Vector
Quantizer。
めには、音声信号のスペクトル特性をスペクトルパラメ
ータにより良好に表すことが必要である。スペクトルパ
ラメータは、送信側から伝送するために量子化が施され
る。効率的な量子化法としては、例えばLSPSP係数
するベクトルースカラ量子化法が知られている。具体的
な方法は例えば、T、Moriya氏らによる”Tra
nsform CodjBof 5peech u
sing a Weighted Vector
Quantizer。
と題した論文(IEEE J、 Set、^reas、
Comn+un、。
Comn+un、。
pp、425−431.1988年)(文献3)等を参
照できる。
照できる。
この方法では、スペクトルパラメータとして、フレーム
毎に求めたLSPSP係数め構成したベクトル量子化コ
ードブックにより、−旦量子化復号化した後に、元のL
SPと量子化復号化したLSPとの誤差信号をスカラ量
子化する。ここでベクトル量子化コードブックは、多量
のスペクトルパラメータデータベースに対して、あらが
しめ2B種類(Bはスペクトルパラメータ量子化のため
のビット数)のコードベクトルからなるコードブックを
トレーニングにより構成しておく。コードブックのトレ
ーニング法は、例えばLinde氏らによる“An
Algorithm for Vector Q
uantization Designと題した論文
(IEEE Trans、 C0M−28,pp、84
−95゜1980年)(文献4)等を参照できる。
毎に求めたLSPSP係数め構成したベクトル量子化コ
ードブックにより、−旦量子化復号化した後に、元のL
SPと量子化復号化したLSPとの誤差信号をスカラ量
子化する。ここでベクトル量子化コードブックは、多量
のスペクトルパラメータデータベースに対して、あらが
しめ2B種類(Bはスペクトルパラメータ量子化のため
のビット数)のコードベクトルからなるコードブックを
トレーニングにより構成しておく。コードブックのトレ
ーニング法は、例えばLinde氏らによる“An
Algorithm for Vector Q
uantization Designと題した論文
(IEEE Trans、 C0M−28,pp、84
−95゜1980年)(文献4)等を参照できる。
4.8kb/s以下の音声符号化方式を実現するために
は、スペクトルパラメータ量子化による歪を聴覚的な知
覚限以下におさえながら、スペクトルパラメータの量子
化ビット数をフレーム当り2oビツト以下に低減する必
要がある。このためには従来の方式では不十分で、量子
化ピント数を20ビツト以下に低減すると、音質は大き
く劣化していた。
は、スペクトルパラメータ量子化による歪を聴覚的な知
覚限以下におさえながら、スペクトルパラメータの量子
化ビット数をフレーム当り2oビツト以下に低減する必
要がある。このためには従来の方式では不十分で、量子
化ピント数を20ビツト以下に低減すると、音質は大き
く劣化していた。
本発明の目的は、上述した問題点を解決し、比較的少な
い演算量及びメモリ量により、4.8kb/s以下で音
質が良好な音声信号符号化方式を提供することにある。
い演算量及びメモリ量により、4.8kb/s以下で音
質が良好な音声信号符号化方式を提供することにある。
第1の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号を全極形
モデルにより近似して前記音声信号のスペクトル包絡を
表すスペクトルパラメータを求め、前記フレームを予め
定められた時間長の小区間に分割し、過去の音源信号を
もとに再生した信号が前記音声信号に近くなるようにピ
ッチパラメータを求め、前記音声信号の音源信号を予め
構成されたコードブックあるいはマルチパルスにより表
して出力する音声符号化方式において、前記スペクトル
パラメータを聴覚の特性に対応するように非線形変換し
、予め構成したコードブツクにより表して出力すること
を特徴とする。
れた時間長のフレームに分割し、前記音声信号を全極形
モデルにより近似して前記音声信号のスペクトル包絡を
表すスペクトルパラメータを求め、前記フレームを予め
定められた時間長の小区間に分割し、過去の音源信号を
もとに再生した信号が前記音声信号に近くなるようにピ
ッチパラメータを求め、前記音声信号の音源信号を予め
構成されたコードブックあるいはマルチパルスにより表
して出力する音声符号化方式において、前記スペクトル
パラメータを聴覚の特性に対応するように非線形変換し
、予め構成したコードブツクにより表して出力すること
を特徴とする。
第2の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号を全極形
モデルにより近僚して前記音声信号のスペクトル包絡を
表すスペクトルパラメータを求め、前記フレームを予め
定められた時間長の小区間に分割し、過去の音源信号を
もとに再生した信号が前記音声信号に近くなるようにピ
ンチパラメータを求め、前記音声信号の音源信号を予め
構成されたコードブックあるいはマルチパルスにより表
して出力する音声符号化方式において、前記スペクトル
パラメータを聴覚の特性に対応するように非線形変換し
、非線形変換したスペクトルパラメータについてフレー
ム間での差分あるいは予測誤差、あるいは同一フレーム
でのパラメータ間での差分あるいは予測誤差を予め構成
したコードブックにより表して出力することを特徴とす
る。
れた時間長のフレームに分割し、前記音声信号を全極形
モデルにより近僚して前記音声信号のスペクトル包絡を
表すスペクトルパラメータを求め、前記フレームを予め
定められた時間長の小区間に分割し、過去の音源信号を
もとに再生した信号が前記音声信号に近くなるようにピ
ンチパラメータを求め、前記音声信号の音源信号を予め
構成されたコードブックあるいはマルチパルスにより表
して出力する音声符号化方式において、前記スペクトル
パラメータを聴覚の特性に対応するように非線形変換し
、非線形変換したスペクトルパラメータについてフレー
ム間での差分あるいは予測誤差、あるいは同一フレーム
でのパラメータ間での差分あるいは予測誤差を予め構成
したコードブックにより表して出力することを特徴とす
る。
本発明による音声信号符号化方式の作用を説明する。
以下の説明では、スペクトルパラメータとして、LSP
を用いることとして説明を行うが、他の周知なパラメー
タ、例えば、PARCOR,ケプストラム。
を用いることとして説明を行うが、他の周知なパラメー
タ、例えば、PARCOR,ケプストラム。
メルケプストラムなども同様にして用いることができる
。LSPの求め方等は、Sugat*ura氏らによる
“Quantizer design in LSP
5peech analysis−synthesis
″と題した論文(IEEE、 J、 Se1. Are
as。
。LSPの求め方等は、Sugat*ura氏らによる
“Quantizer design in LSP
5peech analysis−synthesis
″と題した論文(IEEE、 J、 Se1. Are
as。
Commun、、 pp、432−440.1988年
)(文献5)等を参照できる。
)(文献5)等を参照できる。
第1の発明では、聴覚の特性に対応するように非線形変
換したLSPパラメータを求める。ここで聴覚の特性は
、周波数軸が非線形であり、低域はど分解能が高く、高
域はど分解能が低いことが知られている。このような特
性に合うような非線形変換としては、メル変換などが知
られている。スペクトルパラメータのメル変換について
は、パワスペクトルから変換する方法や、自己相関関数
から変換する方法が知られている。これらの方法の詳細
は、例えば、5trube氏による”Linear p
redic−tion on a warped fr
equency 5cale″と題した論文(J、 A
coust、 Soc、^―、、 pp、1071−1
076、1980)(文献6)等を参照できる。
換したLSPパラメータを求める。ここで聴覚の特性は
、周波数軸が非線形であり、低域はど分解能が高く、高
域はど分解能が低いことが知られている。このような特
性に合うような非線形変換としては、メル変換などが知
られている。スペクトルパラメータのメル変換について
は、パワスペクトルから変換する方法や、自己相関関数
から変換する方法が知られている。これらの方法の詳細
は、例えば、5trube氏による”Linear p
redic−tion on a warped fr
equency 5cale″と題した論文(J、 A
coust、 Soc、^―、、 pp、1071−1
076、1980)(文献6)等を参照できる。
上述の方法により、非線形変換したLSPに対して予め
ベクトル量子化コードブックをトレーニングにより構成
する。ベクトル量子化コードブックの構成法は、前述の
文献4等を参照できる。下式を用いてLSPをベクトル
量子化する。
ベクトル量子化コードブックをトレーニングにより構成
する。ベクトル量子化コードブックの構成法は、前述の
文献4等を参照できる。下式を用いてLSPをベクトル
量子化する。
つまり、コードベクトルを2”[!類探索して、(1)
式の距離を最小にするコードベクトルを選択する。
式の距離を最小にするコードベクトルを選択する。
ここでLSP’ i jは、ベクトル量子化コードブッ
クのj番目のコードベクトル、PはLSPの次数である
。
クのj番目のコードベクトル、PはLSPの次数である
。
(1)式では非線形変換したLSP上の2乗距離を用い
てコードベクトルの探索を行ったが、他の方法として、
非線形変換したLSPを例えばメルケブストラムc、
(n)等に変換して、(2)式のようにメルケブストラ
ム上の2乗距離を用いてコードベクトルの探索をしても
よい。メルケブストラムは非線形変換した対数スペクト
ルに対応しているので、この方が良好な音質が得られる
。
てコードベクトルの探索を行ったが、他の方法として、
非線形変換したLSPを例えばメルケブストラムc、
(n)等に変換して、(2)式のようにメルケブストラ
ム上の2乗距離を用いてコードベクトルの探索をしても
よい。メルケブストラムは非線形変換した対数スペクト
ルに対応しているので、この方が良好な音質が得られる
。
また、2乗距離の代わりに、次式のような重み付け2乗
距離を用いることもできる。
距離を用いることもできる。
(j=1〜2 m ) (3
)ここで、w、(n)は重み付は用のメルケプストラム
うなメルケプストラムを用いることができる。ここで、
δは聴感重み付けの度合を決める重み付は係数であり、
0〈δ〈1の値をとる。
)ここで、w、(n)は重み付は用のメルケプストラム
うなメルケプストラムを用いることができる。ここで、
δは聴感重み付けの度合を決める重み付は係数であり、
0〈δ〈1の値をとる。
なお、パワスペクトルからメルケブストラムへの変換法
は、例えば、北村氏らによる“メルケブストラムを用い
る音声の情報圧縮”と題した論文(電子通信学会論文誌
、pp、1092−1093.1984年)(文献7)
等を参照できる。
は、例えば、北村氏らによる“メルケブストラムを用い
る音声の情報圧縮”と題した論文(電子通信学会論文誌
、pp、1092−1093.1984年)(文献7)
等を参照できる。
なお、メルLSPのコードベクトルに対応したメルケプ
ストラムの計算は、メルLSPをベクトル量子化する際
に計算してもよいし、メルLSPのコードベクトルに対
応したメルケプストラムを予め計算してメルケプストラ
ムコードブックとして有しておいてもよい。後者の方が
演算量を大幅に低減できる。
ストラムの計算は、メルLSPをベクトル量子化する際
に計算してもよいし、メルLSPのコードベクトルに対
応したメルケプストラムを予め計算してメルケプストラ
ムコードブックとして有しておいてもよい。後者の方が
演算量を大幅に低減できる。
第2の発明においては、非線形変換したLSPを次式の
ようにフレーム間で差分を求め、この差分についてベク
トル量子化コードブックを作成する。
ようにフレーム間で差分を求め、この差分についてベク
トル量子化コードブックを作成する。
LSP、1a−LSP、ILQLSP’−i’−’
(4)ここで、LSP、、L、 QLSP’
い、L刊は、それぞれ第Lフレームでのi次目のメルL
SP 、第L−1フレームでのi次目の量子化復号化し
たメルLSPを示す。
(4)ここで、LSP、、L、 QLSP’
い、L刊は、それぞれ第Lフレームでのi次目のメルL
SP 、第L−1フレームでのi次目の量子化復号化し
たメルLSPを示す。
また、フレーム間差分ではなく、同一フレームでの次数
間の差分を求め、これに対するベクトル量子化コードブ
ックを作成してもよい。
間の差分を求め、これに対するベクトル量子化コードブ
ックを作成してもよい。
DLSPIIH=LSP、fLLSP−ffi−+L(
但しLSPIIO= 0 )・ ・ ・(5) また、上記(4)式、(5)式においては、差分てはな
く予測誤差を求めてもよい。予測のための予測係数は、
固定でもよいし、予測係数のコードブックを予め構成し
ておき、最適なものを探索してもよい。
但しLSPIIO= 0 )・ ・ ・(5) また、上記(4)式、(5)式においては、差分てはな
く予測誤差を求めてもよい。予測のための予測係数は、
固定でもよいし、予測係数のコードブックを予め構成し
ておき、最適なものを探索してもよい。
第1図は第1の発明による音声符号化方式を実施する音
声信号符号化装置を示すブロック図である。
声信号符号化装置を示すブロック図である。
入力端子100から音声信号を入力し、1フレ一ム分(
例えば2hs)の音声信号をバッファメモリ110に格
納する。
例えば2hs)の音声信号をバッファメモリ110に格
納する。
LPG分析回路130は、フレームの音声信号のスペク
トル特性を表すパラメータとして、線形予測係数α1を
フレームの音声信号から周知のLPG分析を行いあらか
じめ定められた次数Pだけ計算する。
トル特性を表すパラメータとして、線形予測係数α1を
フレームの音声信号から周知のLPG分析を行いあらか
じめ定められた次数Pだけ計算する。
LSP量子化回路140は、メルLSPのベクトルース
カラ量子化を行う。第2図に処理の流れを示すように、
線形予測係数α、をLPCケプストラムに一旦変換しく
ステップ311) 、LPCケプストラムからさらにメ
ルケプストラムCい(n)に変換する(ステップ512
)。線形予測係数α、からLPCケプストラムへの変換
は、Ata1氏による“Effective〜ness
of 1inear prediction cha
racteristics ofthe 5peech
5ave for automatic 5peak
er 1denti−ficationand ver
ification” (J、Acoust、Soc、
^m。
カラ量子化を行う。第2図に処理の流れを示すように、
線形予測係数α、をLPCケプストラムに一旦変換しく
ステップ311) 、LPCケプストラムからさらにメ
ルケプストラムCい(n)に変換する(ステップ512
)。線形予測係数α、からLPCケプストラムへの変換
は、Ata1氏による“Effective〜ness
of 1inear prediction cha
racteristics ofthe 5peech
5ave for automatic 5peak
er 1denti−ficationand ver
ification” (J、Acoust、Soc、
^m。
pp、1304−1312.1974年)と題した論文
(文献8)等を参照できる。また、ケプストラムからメ
ルケブストラムclI(n)への変換は前記文献7を参
照できる。さらにメルケブストラムからメルLPCケプ
ストラムへ逆変換してメル線形予測係数へ逆変換する(
ステップ513)。さらにこれをLSPに変換すること
によりメルLSP(LSP、、)を計算する(ステップ
514)、メルLSPに対して、予め構成したコードブ
ック145を用いてまずベクトル量子化を行う(ステッ
プ515)。ここでベクトル量子化コードブックの探索
は、作用の項で述べたように、ノルケプストラム上での
2乗距離あるいは重み付は距離を用いる。つまり、入力
音声から求めたメルLSPに対応したメルケプストラム
CJれ)と、メルLSPコードブック145の各コード
ベクトルに対応したメルケブストラムコードブック14
6中のメルケブストラムCmj’ (n) との距離を
(2)式あるいは(3)式により求め、これを最小にす
るコードベクトルjを選択する。そして選択されたコー
ドベクトルc、j(n)に対応するメルLSPコードベ
クトルLSP’ 、、 。
(文献8)等を参照できる。また、ケプストラムからメ
ルケブストラムclI(n)への変換は前記文献7を参
照できる。さらにメルケブストラムからメルLPCケプ
ストラムへ逆変換してメル線形予測係数へ逆変換する(
ステップ513)。さらにこれをLSPに変換すること
によりメルLSP(LSP、、)を計算する(ステップ
514)、メルLSPに対して、予め構成したコードブ
ック145を用いてまずベクトル量子化を行う(ステッ
プ515)。ここでベクトル量子化コードブックの探索
は、作用の項で述べたように、ノルケプストラム上での
2乗距離あるいは重み付は距離を用いる。つまり、入力
音声から求めたメルLSPに対応したメルケプストラム
CJれ)と、メルLSPコードブック145の各コード
ベクトルに対応したメルケブストラムコードブック14
6中のメルケブストラムCmj’ (n) との距離を
(2)式あるいは(3)式により求め、これを最小にす
るコードベクトルjを選択する。そして選択されたコー
ドベクトルc、j(n)に対応するメルLSPコードベ
クトルLSP’ 、、 。
をLSPコードブック145から選択する。
次に、入力のメルLSPとベクトル量子化されたメルL
SPの誤差を次式により計算する(ステップ516)。
SPの誤差を次式により計算する(ステップ516)。
ΔLSP、、=LSP、、−LSP’、、、
(6)誤差ΔLSP、、を、次数i毎に定めら
れたビット数のスカラ量子化器によりスカラ量子化する
(ステップ517)。ここでスカラ量子化器の量子化の
範囲(最小値、最大値)は、多量のトレーニング用誤差
信号ΔLSP、、を用いて予め決定してお(。
(6)誤差ΔLSP、、を、次数i毎に定めら
れたビット数のスカラ量子化器によりスカラ量子化する
(ステップ517)。ここでスカラ量子化器の量子化の
範囲(最小値、最大値)は、多量のトレーニング用誤差
信号ΔLSP、、を用いて予め決定してお(。
さらに、メルLSP係数が次式の関係を有していること
を利用して、スカラ量子化の範囲を制限する。
を利用して、スカラ量子化の範囲を制限する。
具体的な方法については、特願平2−42955号明細
書(文献9)等を参照できる。
書(文献9)等を参照できる。
LSP□〈・・・・・・<LSpHr
(7)ベクトル量子化、スカラ量子化により得
られた符号をマルチプレクサ260へ出力するとともに
、復号化メルLSP (QLSP□)を次式により求め
る。
(7)ベクトル量子化、スカラ量子化により得
られた符号をマルチプレクサ260へ出力するとともに
、復号化メルLSP (QLSP□)を次式により求め
る。
QLSP、、 = LSP’□、+Δt、sp’11.
(8)ここで、ΔLSP’□は、ス
カラ量子化により復号化した誤差信号である。そして口
LSP、、を復号化線形予測係数、1.’(1,=l〜
P)に逆変換する。逆変換は、前述の線形予測係数から
メルLSPへの変換を逆にたどればよい。復号化線形予
測係数a、′ はインパルス応答計算回fWI70へ出
力する。
(8)ここで、ΔLSP’□は、ス
カラ量子化により復号化した誤差信号である。そして口
LSP、、を復号化線形予測係数、1.’(1,=l〜
P)に逆変換する。逆変換は、前述の線形予測係数から
メルLSPへの変換を逆にたどればよい。復号化線形予
測係数a、′ はインパルス応答計算回fWI70へ出
力する。
サブフレーム分割回路150は、フレームの入力音声信
号をサブフレームに分割する。ここで例えばフレーム長
は20Ims、サブフレーム長は5a+sとする。
号をサブフレームに分割する。ここで例えばフレーム長
は20Ims、サブフレーム長は5a+sとする。
重み付は回路200は、サブフレームに分割した信号に
対して周知の聴感重み付けを行う。聴感重み付は関数の
詳細は前記文献lを参照できる。
対して周知の聴感重み付けを行う。聴感重み付は関数の
詳細は前記文献lを参照できる。
減算器190は、重み付は信号から合成フィルタ281
の出力を減算して出力する。
の出力を減算して出力する。
適応コードブック210は、合成フィルタ281の入力
信号v(n)を遅延回路206を介して入力し、さらに
インパルス応答出力回路170から重み付はインパルス
応答り、(n) 、減算器190からの信号を人力し、
長期相関に基づくピッチ予測を行い、ビ。
信号v(n)を遅延回路206を介して入力し、さらに
インパルス応答出力回路170から重み付はインパルス
応答り、(n) 、減算器190からの信号を人力し、
長期相関に基づくピッチ予測を行い、ビ。
チパラメータとして遅延Mとゲインβを計算する。
以下の説明では適応コードブックの予測次数は1とする
が、2次以上の高次とすることもできる。
が、2次以上の高次とすることもできる。
1次の適応コードブックにおける遅延M、ゲインβの計
算法は、Kleijn ”Improved 5pee
ch qualityand efffcient v
ector quantization in 5EL
P’と題した論文(ICASSP、 pp、155−1
58.1988年)(文献10)等を参照できる。さら
に求めたゲインβをあらかじめ定められた量子化ビット
数で量子化復号化し、ゲインβ′を求め、これを用いて
次式により予測信号L(n)を計算し減算器205に出
力する。マタゲインβ′、遅延Mをマルチプレクサ26
0へ出力する。
算法は、Kleijn ”Improved 5pee
ch qualityand efffcient v
ector quantization in 5EL
P’と題した論文(ICASSP、 pp、155−1
58.1988年)(文献10)等を参照できる。さら
に求めたゲインβをあらかじめ定められた量子化ビット
数で量子化復号化し、ゲインβ′を求め、これを用いて
次式により予測信号L(n)を計算し減算器205に出
力する。マタゲインβ′、遅延Mをマルチプレクサ26
0へ出力する。
L(n) = β’ −v(n−M)* h、
(r+) (9)
(9)式でν(n−M)は過去の音源信号で、合成フィ
ルタ281の入力信号である。h、(n)はインパルス
応答計算回路170で求めた重み付はインパルス応答で
ある。
(r+) (9)
(9)式でν(n−M)は過去の音源信号で、合成フィ
ルタ281の入力信号である。h、(n)はインパルス
応答計算回路170で求めた重み付はインパルス応答で
ある。
遅延回路206は、合成フィルタ入力信号v (n)を
1サブフレ一ム分遅延させて適応コードブック210へ
出力する。
1サブフレ一ム分遅延させて適応コードブック210へ
出力する。
減算器205ば、減算器190の出力信号から適応コー
ドブック210の出力を次式に従い減算し、残差信号e
、、1(n)を音源コードブック探索回路23oに出力
する。
ドブック210の出力を次式に従い減算し、残差信号e
、、1(n)を音源コードブック探索回路23oに出力
する。
e、(n) =x、(n)−札(n)0ωインパルス応
答計算回路170は、聴感重み付けした合成フィルタの
インパルス応答hw(n)を予め定められたサンプル数
りだけ計算する。具体的な計算法は、前記文献1等を参
照できる。
答計算回路170は、聴感重み付けした合成フィルタの
インパルス応答hw(n)を予め定められたサンプル数
りだけ計算する。具体的な計算法は、前記文献1等を参
照できる。
音源コードブック探索回路230は、ガウス性雑音信号
あるいは多量の音声信号に対して学習して構成した音源
コードブック235を探索し、最適なコードベクトルc
r J(n>を探索する。ここでガウス性雑音信号か
らなるコードブックの構成法は前記文献1等を参照でき
る。また、学習によりコードブックを構成する方法は、
前記文献4や、文献9等を参照できる。また、最適なコ
ードベクトルの探索法、最適なゲインγの計算法は前記
文献1や、文献9等を参照できる。
あるいは多量の音声信号に対して学習して構成した音源
コードブック235を探索し、最適なコードベクトルc
r J(n>を探索する。ここでガウス性雑音信号か
らなるコードブックの構成法は前記文献1等を参照でき
る。また、学習によりコードブックを構成する方法は、
前記文献4や、文献9等を参照できる。また、最適なコ
ードベクトルの探索法、最適なゲインγの計算法は前記
文献1や、文献9等を参照できる。
さらにコードブック探索回路230では、求めたゲイン
を予め定められた量子化ビット数で量子化し、選択され
た最適コードベクトルCj (n)に量子化ゲインT′
を下式により乗して音源信号q(n)を求め加算器29
0へ出力する。
を予め定められた量子化ビット数で量子化し、選択され
た最適コードベクトルCj (n)に量子化ゲインT′
を下式により乗して音源信号q(n)を求め加算器29
0へ出力する。
q(n)−γ’cJ(n)
00加算器290は、適応コードブック210の出方
音源信号とコードブック探索回路の出方音源信号とを下
式により加算し、合成フィルタ281に出方する。
00加算器290は、適応コードブック210の出方
音源信号とコードブック探索回路の出方音源信号とを下
式により加算し、合成フィルタ281に出方する。
v(n)=β’v(n−M) + 7 cj(n)
02)合成フィルタ281は、加算器2
90の出力v (n)を入力し、下式により合成音声を
1フレーム分求め、さらにもう1フレ一ム分はOの系列
をフィルタに入力して応答信号系列を求め、1フレ一ム
分の応答信号系列を減算器190に出力する。
02)合成フィルタ281は、加算器2
90の出力v (n)を入力し、下式により合成音声を
1フレーム分求め、さらにもう1フレ一ム分はOの系列
をフィルタに入力して応答信号系列を求め、1フレ一ム
分の応答信号系列を減算器190に出力する。
ただし、
0式において、δは聴感重み付は回路200における聴
感重み付けの度合を決める聴感重み付は係数であり、0
〈δ〈1の値をとる。
感重み付けの度合を決める聴感重み付は係数であり、0
〈δ〈1の値をとる。
マルチプレクサ260は、LSP量子化器140.適応
コードブック21O1音源コードブツク探索回路230
の出力符号系列を組み合わせて出力する。
コードブック21O1音源コードブツク探索回路230
の出力符号系列を組み合わせて出力する。
第2の発明の音声信号符号化方式を実施する音声信号符
号化装置を示すブロック図を第3図に示す。図において
、第1図と同一の番号を付した構成要素は、第1図と同
様の動作をするので説明は省略する。第3図では、LS
P@子化回路340. LSPコードブック345.メ
ルケプストラムコードブック346が第1図と異なる。
号化装置を示すブロック図を第3図に示す。図において
、第1図と同一の番号を付した構成要素は、第1図と同
様の動作をするので説明は省略する。第3図では、LS
P@子化回路340. LSPコードブック345.メ
ルケプストラムコードブック346が第1図と異なる。
第4図はLSP量子化回路340の処理の流れを示す図
である。
である。
第4図において、線形予測係数α、をLPCケプストラ
ムに一旦変換しくステップ521) 、LPCケプスト
ラムからさらにメルケプストラムに変換する(ステップ
522)。さらにメルケプストラムからメルLPCケプ
ストラムへ逆変換してメル線形予測係数へ逆変換する(
ステップ523)。さらにこれをLSPに変換すること
により、メルLSP (LSP、 i )を計算する(
ステップ524)。
ムに一旦変換しくステップ521) 、LPCケプスト
ラムからさらにメルケプストラムに変換する(ステップ
522)。さらにメルケプストラムからメルLPCケプ
ストラムへ逆変換してメル線形予測係数へ逆変換する(
ステップ523)。さらにこれをLSPに変換すること
により、メルLSP (LSP、 i )を計算する(
ステップ524)。
メルLSPに対して、(4)式あるいは、(5)式に基
づき、フレーム間の差分あるいは、次数間のメルLSP
の差分を計算する(ステップ525)。以下では、同一
のフレームにおいて次数間で差分信号を求める場合につ
いて説明する。そして、多量の差分信号に対して予め学
習して構成したメルLSPコードブック345を用いて
、差分信号に対してベクトル量子化を行う(ステップ5
26)。ここでベクトル量子化コードブックの探索は、
前記作用の項で述べたように、メルケブストラム上での
2乗距離あるいは、重み付け2乗距離を用いる。つまり
、入力音声から求めたメルLSPに対応したメルケプス
トラムC,(n) と、メルLSPコードブック34
5の各コードベクトルに対応したノルケプストラムコー
ドブック346中のメルケブストラムCIIj’ (n
) との距離を(2)式あるいは(3)式により求め
、これを最小にするコードベクトルjを選択する。そし
て選択されたコードベクトルC+*j (n)に対応す
るメルLSPコードベクトルLSP’□jをLSPコー
ドブック345から選択する。そして次式によりメルL
SPを復号化する(ステップ527)。
づき、フレーム間の差分あるいは、次数間のメルLSP
の差分を計算する(ステップ525)。以下では、同一
のフレームにおいて次数間で差分信号を求める場合につ
いて説明する。そして、多量の差分信号に対して予め学
習して構成したメルLSPコードブック345を用いて
、差分信号に対してベクトル量子化を行う(ステップ5
26)。ここでベクトル量子化コードブックの探索は、
前記作用の項で述べたように、メルケブストラム上での
2乗距離あるいは、重み付け2乗距離を用いる。つまり
、入力音声から求めたメルLSPに対応したメルケプス
トラムC,(n) と、メルLSPコードブック34
5の各コードベクトルに対応したノルケプストラムコー
ドブック346中のメルケブストラムCIIj’ (n
) との距離を(2)式あるいは(3)式により求め
、これを最小にするコードベクトルjを選択する。そし
て選択されたコードベクトルC+*j (n)に対応す
るメルLSPコードベクトルLSP’□jをLSPコー
ドブック345から選択する。そして次式によりメルL
SPを復号化する(ステップ527)。
LSP’、1=LSP’、i−1+Δt、sp’、、、
Q5)ここでΔt、sp’、、、は、
メルLSPコードブック345において選択されたコー
ドベクトルである。
Q5)ここでΔt、sp’、、、は、
メルLSPコードブック345において選択されたコー
ドベクトルである。
次に、入力のメルLSPと、ベクトル量子化復号化され
たメルLSPの誤差を求め(ステップ528)、第1図
のLSP量子化回路140と同様にスカラ量子化して出
力する(ステップ529)。
たメルLSPの誤差を求め(ステップ528)、第1図
のLSP量子化回路140と同様にスカラ量子化して出
力する(ステップ529)。
上述の各実施例では、文献1のCELP方式に通用する
例について説明したが、これ以外の周知な方式に適用す
ることもできる。例えば、音源信号を2種類の異なるコ
ードブックで表す改良CELPに適用することもできる
。改良CELP方式は、前記文献9等を参照できる。さ
らに、前記文献2等に記されたマルチパルス方式に適用
することもできる。
例について説明したが、これ以外の周知な方式に適用す
ることもできる。例えば、音源信号を2種類の異なるコ
ードブックで表す改良CELPに適用することもできる
。改良CELP方式は、前記文献9等を参照できる。さ
らに、前記文献2等に記されたマルチパルス方式に適用
することもできる。
また、各実施例では、スペクトルパラメータを聴覚領域
でベクトルースカラ量子化する例について説明したが、
スペクトルパラメータを聴覚領域でベクトル量子化し、
原パラメータとベクトル量子化復号化したパラメータと
の差分を、例えば予め定められた統計的性質を有する乱
数コードブックを用いてベクトル量子化することもでき
る。このようにすると、さらに量子化ビット数を低減す
ることが可能となる。
でベクトルースカラ量子化する例について説明したが、
スペクトルパラメータを聴覚領域でベクトル量子化し、
原パラメータとベクトル量子化復号化したパラメータと
の差分を、例えば予め定められた統計的性質を有する乱
数コードブックを用いてベクトル量子化することもでき
る。このようにすると、さらに量子化ビット数を低減す
ることが可能となる。
また、メルLSPの量子化法としては、さらに効率のよ
いマトリクス量子化や、トレリス量子化。
いマトリクス量子化や、トレリス量子化。
有限状態ベクトル量子化法などを適用できるにれらの量
子化法の詳細については、Gray氏による@Vect
or quantization” と題した論文(J
EERASSPMag、、 pp、4−29.1984
) (文献11)等に記載されている。
子化法の詳細については、Gray氏による@Vect
or quantization” と題した論文(J
EERASSPMag、、 pp、4−29.1984
) (文献11)等に記載されている。
また、メモリ量低減のためには、メルケブストラムコー
ドブック146.346を除去し、メルLSPのベクト
ル量子化の際に、メルLSPコードベクトルをメルケプ
ストラムに変換するようにしてもよい。
ドブック146.346を除去し、メルLSPのベクト
ル量子化の際に、メルLSPコードベクトルをメルケプ
ストラムに変換するようにしてもよい。
さらに、メルLSP上でコードブック探索を行ってもよ
い。
い。
以上述べたように、本発明によれば、音声信号のスペク
トルパラメータを聴覚の特性に対応した非線形交換を施
してベクトル量子化を行うか、あるいは、非線形変換を
施したパラメータにおいて、フレーム間あるいは同一フ
レーム内で次数間の差分を求めこの差分をベクトル量子
化しているので、きわめて効率的な量子化が可能となり
、低ビツトレートでも音質の良好な音声符号化方式を提
供できるという効果がある。
トルパラメータを聴覚の特性に対応した非線形交換を施
してベクトル量子化を行うか、あるいは、非線形変換を
施したパラメータにおいて、フレーム間あるいは同一フ
レーム内で次数間の差分を求めこの差分をベクトル量子
化しているので、きわめて効率的な量子化が可能となり
、低ビツトレートでも音質の良好な音声符号化方式を提
供できるという効果がある。
第1図は第1の発明による音声信号符号化方式を実施す
る音声信号符号化装置を示すブロック図、第2図は第1
図のLSP量子化回路の処理の流れを示すブロック図、 第3図は第2の発明による音声信号符号化方式を実施す
る音声信号符号化装置を示すブロック図、第4図は第3
図のLSP量子化回路の処理の流れを示す図である。 110 ・・・・・ 130 ・・・・・ 140、340・・・ 145、345・・・ 146、346・・・ バッファメモリ LPG計算回路 LSPii子化回路 LSPコードブック メルケプストラムコードブッ ク サブフレーム分割回路 インパルス応答計算@路 減算器 重み付は回路 遅延回路 適応コードブック 音源コードブック探索回路 音源コードブック 合成フィルタ 190゜ 200 ・ 206 ・ 210 ・ 230 ・ 235 ・ 281 ・ 260 ・・・・・マルチプレクサ
る音声信号符号化装置を示すブロック図、第2図は第1
図のLSP量子化回路の処理の流れを示すブロック図、 第3図は第2の発明による音声信号符号化方式を実施す
る音声信号符号化装置を示すブロック図、第4図は第3
図のLSP量子化回路の処理の流れを示す図である。 110 ・・・・・ 130 ・・・・・ 140、340・・・ 145、345・・・ 146、346・・・ バッファメモリ LPG計算回路 LSPii子化回路 LSPコードブック メルケプストラムコードブッ ク サブフレーム分割回路 インパルス応答計算@路 減算器 重み付は回路 遅延回路 適応コードブック 音源コードブック探索回路 音源コードブック 合成フィルタ 190゜ 200 ・ 206 ・ 210 ・ 230 ・ 235 ・ 281 ・ 260 ・・・・・マルチプレクサ
Claims (2)
- (1)入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号を全極形モデルに
より近似して前記音声信号のスペクトル包絡を表すスペ
クトルパラメータを求め、前記フレームを予め定められ
た時間長の小区間に分割し、過去の音源信号をもとに再
生した信号が前記音声信号に近くなるようにピッチパラ
メータを求め、前記音声信号の音源信号を予め構成され
たコードブックあるいはマルチパルスにより表して出力
する音声符号化方式において、 前記スペクトルパラメータを聴覚の特性に対応するよう
に非線形変換し、予め構成したコードブックにより表し
て出力することを特徴とする音声信号符号化方式。 - (2)入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号を全極形モデルに
より近似して前記音声信号のスペクトル包絡を表すスペ
クトルパラメータを求め、前記フレームを予め定められ
た時間長の小区間に分割し、過去の音源信号をもとに再
生した信号が前記音声信号に近くなるようにピッチパラ
メータを求め、前記音声信号の音源信号を予め構成され
たコードブックあるいはマルチパルスにより表して出力
する音声符号化方式において、 前記スペクトルパラメータを聴覚の特性に対応するよう
に非線形変換し、非線形変換したスペクトルパラメータ
についてフレーム間での差分あるいは予測誤差、あるい
は同一フレームでのパラメータ間での差分あるいは予測
誤差を予め構成したコードブックにより表して出力する
ことを特徴とする音声信号符号化方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2166239A JPH0455899A (ja) | 1990-06-25 | 1990-06-25 | 音声信号符号化方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2166239A JPH0455899A (ja) | 1990-06-25 | 1990-06-25 | 音声信号符号化方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0455899A true JPH0455899A (ja) | 1992-02-24 |
Family
ID=15827690
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2166239A Pending JPH0455899A (ja) | 1990-06-25 | 1990-06-25 | 音声信号符号化方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0455899A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5864794A (en) * | 1994-03-18 | 1999-01-26 | Mitsubishi Denki Kabushiki Kaisha | Signal encoding and decoding system using auditory parameters and bark spectrum |
| USRE43099E1 (en) | 1996-12-19 | 2012-01-10 | Alcatel Lucent | Speech coder methods and systems |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02170199A (ja) * | 1988-12-23 | 1990-06-29 | Nec Corp | 音声符号化復号化方式 |
-
1990
- 1990-06-25 JP JP2166239A patent/JPH0455899A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02170199A (ja) * | 1988-12-23 | 1990-06-29 | Nec Corp | 音声符号化復号化方式 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5864794A (en) * | 1994-03-18 | 1999-01-26 | Mitsubishi Denki Kabushiki Kaisha | Signal encoding and decoding system using auditory parameters and bark spectrum |
| USRE43099E1 (en) | 1996-12-19 | 2012-01-10 | Alcatel Lucent | Speech coder methods and systems |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3042886B2 (ja) | ベクトル量子化器の方法および装置 | |
| JP3196595B2 (ja) | 音声符号化装置 | |
| JPH0353300A (ja) | 音声符号化装置 | |
| JP3143956B2 (ja) | 音声パラメータ符号化方式 | |
| JPH10124092A (ja) | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 | |
| JP3357795B2 (ja) | 音声符号化方法および装置 | |
| JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
| JPH0944195A (ja) | 音声符号化装置 | |
| JP3095133B2 (ja) | 音響信号符号化方法 | |
| JP3308764B2 (ja) | 音声符号化装置 | |
| JPH0854898A (ja) | 音声符号化装置 | |
| JP3003531B2 (ja) | 音声符号化装置 | |
| JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
| JPH0455899A (ja) | 音声信号符号化方式 | |
| JP3153075B2 (ja) | 音声符号化装置 | |
| JP3256215B2 (ja) | 音声符号化装置 | |
| JP3232701B2 (ja) | 音声符号化方法 | |
| JP3194930B2 (ja) | 音声符号化装置 | |
| JP3102017B2 (ja) | 音声符号化方法 | |
| JP3192051B2 (ja) | 音声符号化装置 | |
| JP3089967B2 (ja) | 音声符号化装置 | |
| JP2808841B2 (ja) | 音声符号化方式 | |
| JP3024467B2 (ja) | 音声符号化装置 | |
| JP2002221998A (ja) | 音響パラメータ符号化、復号化方法、装置及びプログラム、音声符号化、復号化方法、装置及びプログラム | |
| JP2658794B2 (ja) | 音声符号化方式 |