JPH03116199A - 音声信号符号化装置 - Google Patents
音声信号符号化装置Info
- Publication number
- JPH03116199A JPH03116199A JP1254458A JP25445889A JPH03116199A JP H03116199 A JPH03116199 A JP H03116199A JP 1254458 A JP1254458 A JP 1254458A JP 25445889 A JP25445889 A JP 25445889A JP H03116199 A JPH03116199 A JP H03116199A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- circuit
- sound source
- encoding
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 38
- 238000005314 correlation function Methods 0.000 claims abstract description 34
- 238000005311 autocorrelation function Methods 0.000 claims abstract description 31
- 238000001228 spectrum Methods 0.000 claims abstract description 18
- 238000004364 calculation method Methods 0.000 claims description 63
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 25
- 230000003595 spectral effect Effects 0.000 claims description 23
- 230000005284 excitation Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 description 37
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 30
- 238000000034 method Methods 0.000 description 29
- 230000015572 biosynthetic process Effects 0.000 description 24
- 230000007774 longterm Effects 0.000 description 24
- 238000003786 synthesis reaction Methods 0.000 description 24
- 238000007781 pre-processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 102100034339 Guanine nucleotide-binding protein G(olf) subunit alpha Human genes 0.000 description 1
- 101000997083 Homo sapiens Guanine nucleotide-binding protein G(olf) subunit alpha Proteins 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、音声信号の低ビツトレート波形符号化方式に
よる音声符号化装置に利用され、特に、伝送情報量を1
6 k bps以下とする音声信号符号化装置に関する
。
よる音声符号化装置に利用され、特に、伝送情報量を1
6 k bps以下とする音声信号符号化装置に関する
。
本発明は、音声信号系列を符号化して出力する音声信号
符号化装置において、 前記音声信号系列の振幅系列の符号化を、インパルス応
答系列の自己相関関数列と、前記音声信母系列と前記イ
ンパルス応答列に応じた相関関数列と、駆動音源信号の
初期位相とを用いて行うようにすることにより、 品質の向上を図ったものである。
符号化装置において、 前記音声信号系列の振幅系列の符号化を、インパルス応
答系列の自己相関関数列と、前記音声信母系列と前記イ
ンパルス応答列に応じた相関関数列と、駆動音源信号の
初期位相とを用いて行うようにすることにより、 品質の向上を図ったものである。
音声信号を15kbps程度で少ない演算量で符号化す
る方法として、声道の特性をディジタルフィルタで表し
、音源を等間隔のパルス列の組合せで比較的良好に表す
レギュラーパルス音声符号化法(Regular Pu
1se Excitation−Long Term
Prediction−Liner Predicti
ve Coder)が知られている。この方法では、フ
ィルタの係数と音源パルスの情報(パルスの初期位相、
振幅)を20m5程度のフレームごとに求めて伝送する
。この方式の詳細については、例えば、「08Mフルレ
ートスピーチトランスコーディング」、rGMs Pt
1LL RATB 5PEECHTRANSCODIN
GJ欧州郵便・通信監理委員会(CEPT/CCH/G
MS RECOMMεNDATION O6,10FE
B、 151988) (文献1)に詳細に説明されて
いるので、ここでは簡単に説明する。
る方法として、声道の特性をディジタルフィルタで表し
、音源を等間隔のパルス列の組合せで比較的良好に表す
レギュラーパルス音声符号化法(Regular Pu
1se Excitation−Long Term
Prediction−Liner Predicti
ve Coder)が知られている。この方法では、フ
ィルタの係数と音源パルスの情報(パルスの初期位相、
振幅)を20m5程度のフレームごとに求めて伝送する
。この方式の詳細については、例えば、「08Mフルレ
ートスピーチトランスコーディング」、rGMs Pt
1LL RATB 5PEECHTRANSCODIN
GJ欧州郵便・通信監理委員会(CEPT/CCH/G
MS RECOMMεNDATION O6,10FE
B、 151988) (文献1)に詳細に説明されて
いるので、ここでは簡単に説明する。
第4図は前記文献1に記載された従来方式による符号化
装置を示すブロック構成図である。第4図において、1
00は入力端子を示し、アナログディジタル変換された
音声入力系列が1フレーム(例えば8 KHzサンプリ
ングの場合でフレーム長を29m5とすると160 サ
ンプル)ごとに入力される。
装置を示すブロック構成図である。第4図において、1
00は入力端子を示し、アナログディジタル変換された
音声入力系列が1フレーム(例えば8 KHzサンプリ
ングの場合でフレーム長を29m5とすると160 サ
ンプル)ごとに入力される。
110は前処理回路であり、オフセット補正およびプリ
エンファシスを行う。前処理回路110の出力系列はL
PG分析回路120と短時間分析回路130に入力され
る。LPG分析回路120は、前処理回路110の出力
値を用いてLPG (線形予測)分析を行い、フレーム
ごとの音声信号のスペクトル包絡ヲ表スレフレクション
・コニフィシエラ(REFLH−CTION C0EF
FICI巳NTS)を8次分求め、次にログ・エリア・
レシオ(LOG−AREA RATIONS 、以下、
LARという。)に変換復符号化する。そして、前記L
ARを短時間分析回路130 とマルチプレクサ200
とに出力する。短時間分析回路130は、LARを復号
化シレフレクション・コエフィシエンツに逆変換スる。
エンファシスを行う。前処理回路110の出力系列はL
PG分析回路120と短時間分析回路130に入力され
る。LPG分析回路120は、前処理回路110の出力
値を用いてLPG (線形予測)分析を行い、フレーム
ごとの音声信号のスペクトル包絡ヲ表スレフレクション
・コニフィシエラ(REFLH−CTION C0EF
FICI巳NTS)を8次分求め、次にログ・エリア・
レシオ(LOG−AREA RATIONS 、以下、
LARという。)に変換復符号化する。そして、前記L
ARを短時間分析回路130 とマルチプレクサ200
とに出力する。短時間分析回路130は、LARを復号
化シレフレクション・コエフィシエンツに逆変換スる。
レフレクション・コエフィシェンツを用いて構成される
短時間分析フィルタに前処理回路110の出力系列を入
力し短時間分析フィルタの予測残差を得る。ここで、短
時間分析はスペクトル包絡分析と同義である。前記予測
残差は、減算回路140 と長時間分析回路160とに
入力される。
短時間分析フィルタに前処理回路110の出力系列を入
力し短時間分析フィルタの予測残差を得る。ここで、短
時間分析はスペクトル包絡分析と同義である。前記予測
残差は、減算回路140 と長時間分析回路160とに
入力される。
長時間分析回路160は、前記短時間スペクトルの予測
残差と後述する加算回路180の出力系列をもとに、音
声のピッチ構造に由来するLTPラグとLTPゲインを
サブフレーム(文献1では5 ms)ごとに求め符号化
し、長時間分析フィルタ回路150に出力する。なお、
以下の処理は文献1では、サブフレームごとに行ってい
る。ここで、長時間分析はピッチ分析と同義であり、前
記LTPラグはピッチ周期に、LTPゲインはピッチゲ
インに相当する。
残差と後述する加算回路180の出力系列をもとに、音
声のピッチ構造に由来するLTPラグとLTPゲインを
サブフレーム(文献1では5 ms)ごとに求め符号化
し、長時間分析フィルタ回路150に出力する。なお、
以下の処理は文献1では、サブフレームごとに行ってい
る。ここで、長時間分析はピッチ分析と同義であり、前
記LTPラグはピッチ周期に、LTPゲインはピッチゲ
インに相当する。
減算回路140は、短時間分析フィルタの予測残差から
ピッチ構造に由来する成分を減算し、パルス系列計算回
路170に出力する。
ピッチ構造に由来する成分を減算し、パルス系列計算回
路170に出力する。
パルス系列計算回路170は、減算回路140の出力系
列をもとに駆動音源パルスの初期位相とパルス振幅系列
とを求め符号化し、その符号をマルチプレクサ200
とパルス系列発生回路190に出力する。ここで、フレ
ーム内の3番目のパルスの位置mJ は次の(1)式で
与えられる。
列をもとに駆動音源パルスの初期位相とパルス振幅系列
とを求め符号化し、その符号をマルチプレクサ200
とパルス系列発生回路190に出力する。ここで、フレ
ーム内の3番目のパルスの位置mJ は次の(1)式で
与えられる。
mj=p“j+q
(0≦j≦N/p−1,0≦q≦p)(1)なお、pは
あらかじめ定められたパルスの間隔〈文献1では3〉、
qは駆動音源パルスの初期位相、Nはサブフレーム内の
サンプル数である。減算回路140の出力系列をX J
(D とすれば、駆動音源パルスの初期位相qは、 E =max”L’−’ X J”(1) ・j +
q ) (2)qJ嘩0 として求めることができる。また、音源パルス系列の振
幅はm」の位置XJ(mj)を量子化することにより得
られる。
あらかじめ定められたパルスの間隔〈文献1では3〉、
qは駆動音源パルスの初期位相、Nはサブフレーム内の
サンプル数である。減算回路140の出力系列をX J
(D とすれば、駆動音源パルスの初期位相qは、 E =max”L’−’ X J”(1) ・j +
q ) (2)qJ嘩0 として求めることができる。また、音源パルス系列の振
幅はm」の位置XJ(mj)を量子化することにより得
られる。
パルス系列発生回路190は、パルス系列計算回路17
0において求められた符号を復号化し駆動音源信号を求
め、加算回路180に出力する。加算回路180はパル
ス系列発生回路190によって求められた駆動音源信号
と長時間分析フィルタ150からの出力系列との和を計
算し、長時間分析フィルタ回路150と長時間分析回路
160とに出力する。長時間分析フィルタ回路150は
、長時間分析回路160で得られたLTPラグとLTP
ゲインをもとに長時間分析フィルタを構成し、加算回路
180の出力系列を長時間分析フィルタ150に入力す
る。長時間分析フィルタ150の出力系列は加算回路1
80にフィードバックされ、また減算回路140に出力
される。
0において求められた符号を復号化し駆動音源信号を求
め、加算回路180に出力する。加算回路180はパル
ス系列発生回路190によって求められた駆動音源信号
と長時間分析フィルタ150からの出力系列との和を計
算し、長時間分析フィルタ回路150と長時間分析回路
160とに出力する。長時間分析フィルタ回路150は
、長時間分析回路160で得られたLTPラグとLTP
ゲインをもとに長時間分析フィルタを構成し、加算回路
180の出力系列を長時間分析フィルタ150に入力す
る。長時間分析フィルタ150の出力系列は加算回路1
80にフィードバックされ、また減算回路140に出力
される。
マルチプレクサ200 は、LPC分析回路120の出
力符号と、パルス系列計算回路170の出力符号と、長
時間分析回路160の出力符号とを入力し、これらを組
み合わせて出力端子210より通信路へ出力する。
力符号と、パルス系列計算回路170の出力符号と、長
時間分析回路160の出力符号とを入力し、これらを組
み合わせて出力端子210より通信路へ出力する。
しかし、前記従来の音声信号符号化装置は、演算量が少
ないものの再生音声の品質が低いという欠点がある。こ
れは、音源パルス系列の振幅を簡略な方法により求めて
いることに起因している。
ないものの再生音声の品質が低いという欠点がある。こ
れは、音源パルス系列の振幅を簡略な方法により求めて
いることに起因している。
つまり従来の音声信号符号化装置では、まず、前処理回
路の出力信号系列をスペクトル包絡に由来する短時間分
析フィルタの予測残差を求め、さらにピッチ構造に由来
する成分を減算した予測残差を得る。得られたこの予測
残差を初期位相だけずらし、あらかじめ定められたサン
プル数ごとに前記予測残差をそのまま量子化するという
方法によっている。
路の出力信号系列をスペクトル包絡に由来する短時間分
析フィルタの予測残差を求め、さらにピッチ構造に由来
する成分を減算した予測残差を得る。得られたこの予測
残差を初期位相だけずらし、あらかじめ定められたサン
プル数ごとに前記予測残差をそのまま量子化するという
方法によっている。
さらにこの従来法によれば、再生音声の聴感上の量子化
歪が大きいという欠点があった。これは、1Qkbps
程度のビットレートでは音源パルス振幅の量子化ビット
数が少なくなるため量子化歪が大きくなるという理由に
よる。
歪が大きいという欠点があった。これは、1Qkbps
程度のビットレートでは音源パルス振幅の量子化ビット
数が少なくなるため量子化歪が大きくなるという理由に
よる。
本発明の目的は、前記の欠点を除去することにより、良
好な音質が得られる音声信号符号化装置を提供すること
にある。
好な音質が得られる音声信号符号化装置を提供すること
にある。
本発明は、離散的な音声信号系列を入力しピッチの微細
構造を含む短時間スペクトルを表すスペクトルパラメー
タを抽出し符号化するスペクトルパラメータ符号化手段
を備えた音声信号符号化装置において、前記スペクトル
パラメータをもとにインパルス応答系列の自己相関関数
列を計算する自己相関関数算出手段と、前記音声信号系
列と前記インパルス応答系列に応じた相互相関関数列を
計算する相互相関係数算出手段と、前記相互相関関数列
を用いて駆動音源信号の初期位相とを求めて符号化し、
前記自己相関関数列と前記相互相関関数列と前記駆動音
源信号の初期位相とを用いて前記音声信号系列に対しあ
らかじめ定められた時間間隔ごとに前記駆動音源信号の
振幅系列を求めて符号化する振幅系列符号化手段と、前
記スペクトルパラメータを表す符号と前記駆動音源信号
の初期位相を表す符号と前記駆動音源信号の振幅系列を
表す符号とを組み合わせて出力する出力手段とを備えた
ことを特徴とする。
構造を含む短時間スペクトルを表すスペクトルパラメー
タを抽出し符号化するスペクトルパラメータ符号化手段
を備えた音声信号符号化装置において、前記スペクトル
パラメータをもとにインパルス応答系列の自己相関関数
列を計算する自己相関関数算出手段と、前記音声信号系
列と前記インパルス応答系列に応じた相互相関関数列を
計算する相互相関係数算出手段と、前記相互相関関数列
を用いて駆動音源信号の初期位相とを求めて符号化し、
前記自己相関関数列と前記相互相関関数列と前記駆動音
源信号の初期位相とを用いて前記音声信号系列に対しあ
らかじめ定められた時間間隔ごとに前記駆動音源信号の
振幅系列を求めて符号化する振幅系列符号化手段と、前
記スペクトルパラメータを表す符号と前記駆動音源信号
の初期位相を表す符号と前記駆動音源信号の振幅系列を
表す符号とを組み合わせて出力する出力手段とを備えた
ことを特徴とする。
本発明に用いる音声信号符号化方法は、音源パルス系列
の位置の求め方は前記文献1と同じであるが、振幅を計
算するアルゴリズムに特徴がある。
の位置の求め方は前記文献1と同じであるが、振幅を計
算するアルゴリズムに特徴がある。
従って、以下ではこのアルゴリズムを詳細に説明するこ
とにする。
とにする。
まず、前記文献1に示したレギュラーパルス音声符号化
法の場合には、k番目のパルスの位置m。
法の場合には、k番目のパルスの位置m。
は、
mk=p−j+q (0≦J≦N/p−1)(3
) で求められる。ここでpはあらかじめ定められた駆動音
源パルスの間隔、qは初期位相である。初期位相qの求
め方は後述する。
) で求められる。ここでpはあらかじめ定められた駆動音
源パルスの間隔、qは初期位相である。初期位相qの求
め方は後述する。
次に、パルスの振幅の求め方を以下で示す。1フレーム
内の任意の時刻nにおける音源パルス系列d (n)を
次式で表す。
内の任意の時刻nにおける音源パルス系列d (n)を
次式で表す。
ここで、δn、miはクロネッ力−のδ関数を表し、n
=m1の場合に1で、n)m、の場合は0である。また
、glは位置muのパルスの振幅を表し、Kは1フレー
ム内のパルス数を表す。
=m1の場合に1で、n)m、の場合は0である。また
、glは位置muのパルスの振幅を表し、Kは1フレー
ム内のパルス数を表す。
次に、合成フィルタをピッチの微細構造も含めた音声信
号のスペクトル構造を表し得るフィルタとして、長時間
予測フィルタと短時間予測フィル夕との縦続接続フィル
タを考える。ここで、長時間予測フィルタはピッチ構造
を表し、短時間予測フィルタはスペクトル包絡特性を表
す。ブロック構成図を第2図に示す。
号のスペクトル構造を表し得るフィルタとして、長時間
予測フィルタと短時間予測フィル夕との縦続接続フィル
タを考える。ここで、長時間予測フィルタはピッチ構造
を表し、短時間予測フィルタはスペクトル包絡特性を表
す。ブロック構成図を第2図に示す。
合成フィルタ300は、長時間予測フィルタ310と、
短時間予測フィルタ320とを含んでいる。長時間予測
フィルタ310としては、1次の場合と高次の場合とが
考えられるが、ここでは説明の簡略化のために1次の長
時間予測フィルタを用いた場合について考える。
短時間予測フィルタ320とを含んでいる。長時間予測
フィルタ310としては、1次の場合と高次の場合とが
考えられるが、ここでは説明の簡略化のために1次の長
時間予測フィルタを用いた場合について考える。
音源パルス列d (n)によって、長時間予測フィルタ
310と短時間予測フィルタ320との継続接続からな
る合成フィルタを駆動して得られる再生信号x (n)
は次式のように書き表すことができる。
310と短時間予測フィルタ320との継続接続からな
る合成フィルタを駆動して得られる再生信号x (n)
は次式のように書き表すことができる。
x(n)=d(n)+β・xa(n −Md)十’L”
ai−マ(。−1 −1 ここでβは長時間予測フィルタ310のタップ係数を表
すLTPゲインを示し、M、は入力信号のピッチ周期を
表すLTPラグを示す。Xd (n)は長時間予測フィ
ルタ310の出力信号を表す。また、Npは短時間予測
フィルタ320の予測次数であり、as (1≦i≦
N、)は、短時間予測フィルタ320の予測係数を示す
。長時間予測フィルタ310のLTPゲインβおよびL
TPラグM、の算出法は前述の文献1の方法を使うこと
ができる。また、他の方法としては、例えば入力音声信
号の自己相関関数列のピーク振幅およびその位置を抽出
する方法がよく知られている。この方法の詳細について
は、ビー・ニス・アタール(B、 S、 ATAL)、
エム・アール・シュレーダー(M、 R,5CHROE
DER)氏によるベル・システム・テクニカル・ジャー
ナル(BELL SYSTEM TECHNICAL
JOURNAL)誌、1970年10月号、1973〜
1986ページに掲載の「アダプチブ・ブリデクチブ・
コーアンダ・オブ・スピーチ・シグナルズ」(rADA
PTIVE PRE!DICTIVE C0DIN
G OF SPE巳CH5IGNALSJ ) と
題した論文(文献2)に詳細に説明されているのでここ
では説明を省略する。
ai−マ(。−1 −1 ここでβは長時間予測フィルタ310のタップ係数を表
すLTPゲインを示し、M、は入力信号のピッチ周期を
表すLTPラグを示す。Xd (n)は長時間予測フィ
ルタ310の出力信号を表す。また、Npは短時間予測
フィルタ320の予測次数であり、as (1≦i≦
N、)は、短時間予測フィルタ320の予測係数を示す
。長時間予測フィルタ310のLTPゲインβおよびL
TPラグM、の算出法は前述の文献1の方法を使うこと
ができる。また、他の方法としては、例えば入力音声信
号の自己相関関数列のピーク振幅およびその位置を抽出
する方法がよく知られている。この方法の詳細について
は、ビー・ニス・アタール(B、 S、 ATAL)、
エム・アール・シュレーダー(M、 R,5CHROE
DER)氏によるベル・システム・テクニカル・ジャー
ナル(BELL SYSTEM TECHNICAL
JOURNAL)誌、1970年10月号、1973〜
1986ページに掲載の「アダプチブ・ブリデクチブ・
コーアンダ・オブ・スピーチ・シグナルズ」(rADA
PTIVE PRE!DICTIVE C0DIN
G OF SPE巳CH5IGNALSJ ) と
題した論文(文献2)に詳細に説明されているのでここ
では説明を省略する。
いま、長時間予測フィルタ310と短時間予測フィルタ
320 とからなる合成フィルタ300 のインパルス
応答を、Mをインパルス応答の継続サンプル数として、 h(i) (0≦i≦M−1) とすると、再生信号x (n)は次式のように書くこと
ができる。
320 とからなる合成フィルタ300 のインパルス
応答を、Mをインパルス応答の継続サンプル数として、 h(i) (0≦i≦M−1) とすると、再生信号x (n)は次式のように書くこと
ができる。
x (n) = d (n) * h (n)
−(6)ここで、*は畳み込み積分を表す。
−(6)ここで、*は畳み込み積分を表す。
次に、入力音声信号x (n)と再生信号x (n)と
の1フレーム内の重み付け2乗誤差Jは次のように書け
る。
の1フレーム内の重み付け2乗誤差Jは次のように書け
る。
また、Nは1フレームのサンプル数を示す。ここで重み
付は関数ω(n)は、周波数軸上で重み付けを行うもの
であり、そのZ変換値をW (Z)とすると、合成フィ
ルタ300の予測パラメータaiを用いて次式により表
される。
付は関数ω(n)は、周波数軸上で重み付けを行うもの
であり、そのZ変換値をW (Z)とすると、合成フィ
ルタ300の予測パラメータaiを用いて次式により表
される。
W(Z)=(1’L’atZ−’)/(1’L’a+r
’Z−’)−1 〔8〕 (8)式でrはO≦r≦1の定数であり、W (Z)の
周波数特性を決定する。つまり、r=1とすると、W(
Z)=1となり、その周波数特性は平坦となる。一方、
r=Qとすると、W (Z)は合成フィルタ3000周
波数特性の逆特性となる。従って、rの値によってW
(Z)の特性を変えることができる。また、(8)式で
示したようにW (Z)を合成フィルタ300の周波数
特性に依存させて決めているのは聴感的なマスク効果を
利用しているためである。つまり入力音声信号のスペク
トルのパワーが大きなところではく例えばフォルマント
の近傍)再生信号のスペクトルとの誤差が多少大きくて
も、その誤差は耳につき難いという聴感的な性質による
。
’Z−’)−1 〔8〕 (8)式でrはO≦r≦1の定数であり、W (Z)の
周波数特性を決定する。つまり、r=1とすると、W(
Z)=1となり、その周波数特性は平坦となる。一方、
r=Qとすると、W (Z)は合成フィルタ3000周
波数特性の逆特性となる。従って、rの値によってW
(Z)の特性を変えることができる。また、(8)式で
示したようにW (Z)を合成フィルタ300の周波数
特性に依存させて決めているのは聴感的なマスク効果を
利用しているためである。つまり入力音声信号のスペク
トルのパワーが大きなところではく例えばフォルマント
の近傍)再生信号のスペクトルとの誤差が多少大きくて
も、その誤差は耳につき難いという聴感的な性質による
。
(7)式で示した重み付けられた2乗誤差Jを最小化ス
る音源パルス列を計算するためのアルゴリズムを算出す
る。(7)式はさらに次式のように変形できる。
る音源パルス列を計算するためのアルゴリズムを算出す
る。(7)式はさらに次式のように変形できる。
ここでx (n) *ω(n)の項は次式に従って変形
される。
される。
x (n) −x (n) * ω(n)
−αQとおく。(7)式の両辺をZ変換すると、Xw(
Z)=X(Z)・W(Z)01)と書ける。X (Z)
はさらに次のように書ける。
−αQとおく。(7)式の両辺をZ変換すると、Xw(
Z)=X(Z)・W(Z)01)と書ける。X (Z)
はさらに次のように書ける。
X(Z)=H(Z)・D(Z) −1ここでD
(Z)は音源パルス系列(4)式のZ変換を示し、H
(Z)は合成フィルタのインパルス応答のZ変換値を示
す。αり式を09式に代入すると、xw(z) = H
(z) −D (Z) ・W(Z ) ・・・Q3)と
なり、 H,(Z) = H(Z) ・W(Z )とおき、Q3
)式を逆Z変換し、H,(Z)の逆Z変換値をhw(n
)とすると次式を得る。
(Z)は音源パルス系列(4)式のZ変換を示し、H
(Z)は合成フィルタのインパルス応答のZ変換値を示
す。αり式を09式に代入すると、xw(z) = H
(z) −D (Z) ・W(Z ) ・・・Q3)と
なり、 H,(Z) = H(Z) ・W(Z )とおき、Q3
)式を逆Z変換し、H,(Z)の逆Z変換値をhw(n
)とすると次式を得る。
xw(n) = d (n) * hw(n )
−00ここで、h、(n)は合成フィルタと重み付
は回路の縦続接続フィルタのインパルス応答を示す。
−00ここで、h、(n)は合成フィルタと重み付
は回路の縦続接続フィルタのインパルス応答を示す。
04)式に(4)式を代入して次式を得る。
ここではKは1フレームにたてるパルス数を示す。
00式、09式を(9)式に代入すれば、J=’n (
X、(n)−2g +・by(n−m、))’−・−α
ω を書ける。従って、(7〕式は00式のように表せるこ
とになる。αω式を最小とするような音源パルス系列の
振幅gkで偏微分して0とおくことによって、次式が導
かれる。
X、(n)−2g +・by(n−m、))’−・−α
ω を書ける。従って、(7〕式は00式のように表せるこ
とになる。αω式を最小とするような音源パルス系列の
振幅gkで偏微分して0とおくことによって、次式が導
かれる。
gh(mh)=
φhh(ml、mk)
071
ここでφ、(・)はx、(n)とhjn)とから計算し
た相互相関関数列を、φhh (・)はhjn)の自己
相関関数列をそれぞれ表し、次式のように表せる。なお
、φhh (・)は音声信号処理の分野では共分散関数
と呼ばれることが多い。
た相互相関関数列を、φhh (・)はhjn)の自己
相関関数列をそれぞれ表し、次式のように表せる。なお
、φhh (・)は音声信号処理の分野では共分散関数
と呼ばれることが多い。
φ、lh(−mk)=ΣX、l (n) hw (n−
+nb) =φhx(mk)(1≦mk≦N) ・−α
の (1≦mlSmk≦N) −0g1 07)式によれば、音源パルス系列の振幅gkはそのパ
ルスの位置mkの関数となっており、位置m。
+nb) =φhx(mk)(1≦mk≦N) ・−α
の (1≦mlSmk≦N) −0g1 07)式によれば、音源パルス系列の振幅gkはそのパ
ルスの位置mkの関数となっており、位置m。
にパルスを立てる場合に最適な振幅gkを計算すること
ができる。
ができる。
ここで、入力音声信号系列が定常であると仮定すれば、
aIID式で示した共分散関数φ、イ(mi、l’nk
)は次式のように、遅れ1mISmk 1に依存した自
己相関関数 Rhh (・)に等しいとおける。
aIID式で示した共分散関数φ、イ(mi、l’nk
)は次式のように、遅れ1mISmk 1に依存した自
己相関関数 Rhh (・)に等しいとおける。
φon(mt、mk) = Rhh ((ml−mk
) −[11ここでRhh (・)はhw(n)の自
己相関関数を表し、次式のようにかける。
) −[11ここでRhh (・)はhw(n)の自
己相関関数を表し、次式のようにかける。
Rhh ((mt−mk> =
(1≦m、−mk≦N) ・・(21)従って、Q7
)式は(21)式を用いて次式のように修正できる。
)式は(21)式を用いて次式のように修正できる。
gk
1・Rhh
(
mk−、−mk
)
次に、初期位相qは、(18)式で求めた相互相関関数
を用いて下式のように求めることができる。
を用いて下式のように求めることができる。
E=max”f了φxh(p j + q)q J
−Q ・・ (23) とするようなqとして決定できる。
−Q ・・ (23) とするようなqとして決定できる。
すなわち、本発明においては、(22)式を用いて駆動
音源信号の振幅系列を精細に求めることができるので、
再生音質の品質の向上を図ることが可能となる。
音源信号の振幅系列を精細に求めることができるので、
再生音質の品質の向上を図ることが可能となる。
以下、本発明の実施例について図面を参照して説明する
。
。
第1図は本発明の一実施例を示すブロック構成図である
。
。
本実施例は、入力端子10より離散的な音声信号系列を
入力しピッチの微細構造を含む短時間スペクトルを表す
スペクトルパラメータを抽出し符号化するスペクトルパ
ラメータ符号化手段としての、前処理回路11、LPG
分析回路12、LAR係数符号化回路13、ピッチ分析
回路14およびピッチ符号化回路15を備えた音声信号
符号化装置において、本発明の特徴とするところの、前
記スペクトルパラメータをもとにインパルス応答系列の
自己相関関数列を計算する自己相関関数計算手段とじて
のインパルス応答計算回路19および自己相関関数計算
回路20と、前記音声信号系列と前記インパルス応答系
列に応じた相互相関関数列を計算する相互相関量数計算
出手段としての相互相関関数計算回路18と、前記相互
相関関数列を用いて駆動音源信号の初期位相を求めて符
号化し、前記自己相関関数列と前記相互相関関数列と前
記駆動音源信号の初期位相を用いて前記音声信号系列に
対しあらかじめ定められた時間間隔ごとに前記駆動音源
信号の振幅系列を求めて符号化する振幅系列符号化手段
としての初期位相計算回路21およびパルス振幅計算回
路22と、前記スペクトルパラメータを表す符号と前記
駆動音源信号の初期位相を表す符号と前記駆動音源信号
の振幅系列を表す符号とを選択組み合わせて出力端子3
0に出力する出力手段としてのマルチプレクサ27とを
備え、さらに、減算回路16、重み付は回路17、判別
回路23、切替回路24、ゲート回路25、パルス符号
化回路26、パルス系列発生回路28および合成フィル
タ回路29を備えている。
入力しピッチの微細構造を含む短時間スペクトルを表す
スペクトルパラメータを抽出し符号化するスペクトルパ
ラメータ符号化手段としての、前処理回路11、LPG
分析回路12、LAR係数符号化回路13、ピッチ分析
回路14およびピッチ符号化回路15を備えた音声信号
符号化装置において、本発明の特徴とするところの、前
記スペクトルパラメータをもとにインパルス応答系列の
自己相関関数列を計算する自己相関関数計算手段とじて
のインパルス応答計算回路19および自己相関関数計算
回路20と、前記音声信号系列と前記インパルス応答系
列に応じた相互相関関数列を計算する相互相関量数計算
出手段としての相互相関関数計算回路18と、前記相互
相関関数列を用いて駆動音源信号の初期位相を求めて符
号化し、前記自己相関関数列と前記相互相関関数列と前
記駆動音源信号の初期位相を用いて前記音声信号系列に
対しあらかじめ定められた時間間隔ごとに前記駆動音源
信号の振幅系列を求めて符号化する振幅系列符号化手段
としての初期位相計算回路21およびパルス振幅計算回
路22と、前記スペクトルパラメータを表す符号と前記
駆動音源信号の初期位相を表す符号と前記駆動音源信号
の振幅系列を表す符号とを選択組み合わせて出力端子3
0に出力する出力手段としてのマルチプレクサ27とを
備え、さらに、減算回路16、重み付は回路17、判別
回路23、切替回路24、ゲート回路25、パルス符号
化回路26、パルス系列発生回路28および合成フィル
タ回路29を備えている。
次に、本実施例の動作について説明する。
あらかじめ定められたサンプル数(文献1では160サ
ンプル)に区切られた離散的な音声信号系列が入力端子
10を通じて前処理回路11に入力される。前処理回路
11ではオフセット補正およびプリエンファシスフィル
タを用いて入力された音声信号系列を処理する。この方
法については文献1を参照することができる。
ンプル)に区切られた離散的な音声信号系列が入力端子
10を通じて前処理回路11に入力される。前処理回路
11ではオフセット補正およびプリエンファシスフィル
タを用いて入力された音声信号系列を処理する。この方
法については文献1を参照することができる。
次に、LPG分析回路12は、前処理回路11の出力系
列により公知の方法によりLPG分析してLAR係数L
A RIをあらかじめ定められた次数だけ求め、LA
R符号化回路13に出力する。この方法は例えば前述の
文献1を参照することができる。
列により公知の方法によりLPG分析してLAR係数L
A RIをあらかじめ定められた次数だけ求め、LA
R符号化回路13に出力する。この方法は例えば前述の
文献1を参照することができる。
LAR係数符号化回路13は、LAR係数を例えばあら
かじめ定められた量子ビット数に基づいてL A Ri
を符号化し、符号βLARIをゲート回路25へ出力す
る。また、LAR符号化回路13は、’LARiを復号
化して得たL A Rrを、インパルス応答計算回路1
9と重み付は回路17と合成フィルタ回路29とに出力
する。
かじめ定められた量子ビット数に基づいてL A Ri
を符号化し、符号βLARIをゲート回路25へ出力す
る。また、LAR符号化回路13は、’LARiを復号
化して得たL A Rrを、インパルス応答計算回路1
9と重み付は回路17と合成フィルタ回路29とに出力
する。
次に、ピッチ分析回路14は、前処理回路11の出力系
列を入力し、例えば前述の文献2に記載の方法にしたが
って、LTPラグM、およびLTPゲインβを計算し、
ピッチ符号化回路15へ出力する。
列を入力し、例えば前述の文献2に記載の方法にしたが
って、LTPラグM、およびLTPゲインβを計算し、
ピッチ符号化回路15へ出力する。
ピッチ符号化回路15は、あらかじめ定められたビット
数でLTPラグM、1およびLTPゲインβを符号化し
て得た符号l、およびlBをゲート回路25へ出力する
。ピッチ符号化回路15は、l、およびI!、を復号化
して得たM、およびβ′をインパルス応答計算回路19
と重み付は回路17と合成フィルタ回路29とへ出力す
る。
数でLTPラグM、1およびLTPゲインβを符号化し
て得た符号l、およびlBをゲート回路25へ出力する
。ピッチ符号化回路15は、l、およびI!、を復号化
して得たM、およびβ′をインパルス応答計算回路19
と重み付は回路17と合成フィルタ回路29とへ出力す
る。
インパルス応答計算回路19は、LARパラメータの復
号値LAR:をLARパラメータ符号化回路13から入
力し、また、LTPラグおよびLTPゲインの復号化値
M5およびβ′をピッチ符号化回路15から入力する。
号値LAR:をLARパラメータ符号化回路13から入
力し、また、LTPラグおよびLTPゲインの復号化値
M5およびβ′をピッチ符号化回路15から入力する。
そして、インパルス応答計算回路19は2種類のインパ
ルス応答を計算する。
ルス応答を計算する。
まず、始めに、LARパラメータ復号値LAR<のみと
用いて第2図に示した合成フィルタ300のうち、短時
間予測フィルタ320のみの場合の重み付けられたイン
パルス応答h 1wを、あらかじめ定められたサンプル
数だけ計算し、求まったhew(n)を自己相関関数計
算回路20と、相互相関関数計算回路18とへ出力する
。次にLARパラメータ復号値LARrとピッチ情報(
LTPゲインβ′およびLTPラグMx)とを用いて、
長時間予測フィルタ310と短時間予測フィルタ320
とからなる合成フィルタ3000重み付けられたインパ
ルス応答h2w(n)をあらかじめ定められたサンプル
数だけ計算し、hew (n)による相関演算処理が終
了したのちに、自己相関関数計算回路20と相互相関関
数計算回路18とに出力する。
用いて第2図に示した合成フィルタ300のうち、短時
間予測フィルタ320のみの場合の重み付けられたイン
パルス応答h 1wを、あらかじめ定められたサンプル
数だけ計算し、求まったhew(n)を自己相関関数計
算回路20と、相互相関関数計算回路18とへ出力する
。次にLARパラメータ復号値LARrとピッチ情報(
LTPゲインβ′およびLTPラグMx)とを用いて、
長時間予測フィルタ310と短時間予測フィルタ320
とからなる合成フィルタ3000重み付けられたインパ
ルス応答h2w(n)をあらかじめ定められたサンプル
数だけ計算し、hew (n)による相関演算処理が終
了したのちに、自己相関関数計算回路20と相互相関関
数計算回路18とに出力する。
自己相関関数計算回路20は、インパルス応答h +w
(n)を入力し、前述の(21)式に従ってh+、(n
)の自己相関関数Rhb+(mt mk l)を計算
し、これをパルス振幅計算回路22に出力する。続いて
、前述の計算が終了した後に、インパルス応答F12w
(n)を入力し、h2−(n)の自己相関関数Rh h
2(ml mk )を計算し、これをパルス振幅計算
回路22に出力する。
(n)を入力し、前述の(21)式に従ってh+、(n
)の自己相関関数Rhb+(mt mk l)を計算
し、これをパルス振幅計算回路22に出力する。続いて
、前述の計算が終了した後に、インパルス応答F12w
(n)を入力し、h2−(n)の自己相関関数Rh h
2(ml mk )を計算し、これをパルス振幅計算
回路22に出力する。
次に、減算器16は、前処理回路11から音声信号系列
x (n)を入力し、これから合成フィルタ回路29の
出力系列を1フレームサンプル分減算し、減算結果を重
み付は回路17へ出力する。ここで合成フィルタ回路2
9には後述するように現フレームより1フレーム過去の
音源パルス系列を駆動信号として応答系列を求め、その
後、駆動信号をOとして現フレームに延ばした信号系列
が1フレ一ム分蓄積されている。つまりこれは、合成フ
ィルタのインパルス応答の意味のあるサンプル数が高々
2フレ一ム程度であるとすれば、現フレームの音声信号
系列は1フレーム過去の音源パルスによって駆動された
合成フィルタ出力信号をその後、駆動音源信号を0とし
て、現フレームへ延ばした信号系列と、現フレームの音
源パルス系列との和によって表現できるという考えに基
づいている。
x (n)を入力し、これから合成フィルタ回路29の
出力系列を1フレームサンプル分減算し、減算結果を重
み付は回路17へ出力する。ここで合成フィルタ回路2
9には後述するように現フレームより1フレーム過去の
音源パルス系列を駆動信号として応答系列を求め、その
後、駆動信号をOとして現フレームに延ばした信号系列
が1フレ一ム分蓄積されている。つまりこれは、合成フ
ィルタのインパルス応答の意味のあるサンプル数が高々
2フレ一ム程度であるとすれば、現フレームの音声信号
系列は1フレーム過去の音源パルスによって駆動された
合成フィルタ出力信号をその後、駆動音源信号を0とし
て、現フレームへ延ばした信号系列と、現フレームの音
源パルス系列との和によって表現できるという考えに基
づいている。
重み付は回路17はLAR係数符号化回路13からL
A Rrを入力し、重み付は関数ω(Tl)をそのZ変
換値が(8)式となるように計算する。これは他の周波
数重み付は方法を用いて計算してもよい。
A Rrを入力し、重み付は関数ω(Tl)をそのZ変
換値が(8)式となるように計算する。これは他の周波
数重み付は方法を用いて計算してもよい。
また、重み付は回路17は減算器16の減算結果を入力
し、これとω(n)との畳み込み積分計算を行い、得ら
れたx、(n )を相互相関関数計算回路18に出力す
る。
し、これとω(n)との畳み込み積分計算を行い、得ら
れたx、(n )を相互相関関数計算回路18に出力す
る。
相互相関関数計算回路18は、インパルス応答計算回路
19からインパルス応答h+w(n)を入力し、hlw
(n)と前述したx、(n )とを用いて、第一の相
互相関関数、 φXh+(mk) (1≦mk≦N)を計算し、これ
を初期位相計算回路21およびパルス振幅計算回路22
に出力する。続いて、インパルス応答h2.(n)を入
力し、h2.(n> とx、(n)とを用いて、第2の
相互相関関数、 φxh2(mk) (1≦m2≦N)を計算し、これ
を初期位相計算回路21およびパルス振幅計算回路22
に出力する。
19からインパルス応答h+w(n)を入力し、hlw
(n)と前述したx、(n )とを用いて、第一の相
互相関関数、 φXh+(mk) (1≦mk≦N)を計算し、これ
を初期位相計算回路21およびパルス振幅計算回路22
に出力する。続いて、インパルス応答h2.(n)を入
力し、h2.(n> とx、(n)とを用いて、第2の
相互相関関数、 φxh2(mk) (1≦m2≦N)を計算し、これ
を初期位相計算回路21およびパルス振幅計算回路22
に出力する。
初期位相計算回路21は、前述の第一の相互相関関数、
φxh+(−mk)(1≦mk≦N)
を用いて前述の(23)式に従って初期位相q1を計算
し、これをパルス振幅計算回路22に出力する。
し、これをパルス振幅計算回路22に出力する。
次に、初期位相計算回路21は前述の第二の相互相聞関
数、 φxh2(mk) (1≦mk≦N)を用いて前述の
(23)式に従って初期位相q2を計算し、これをパル
ス振幅計算回路22に出力する。
数、 φxh2(mk) (1≦mk≦N)を用いて前述の
(23)式に従って初期位相q2を計算し、これをパル
ス振幅計算回路22に出力する。
パルス振幅計算回路22は、相互相関関数と自己相関関
数と初期位相とを同期して入力する。つまり、あらかじ
め定められたフレーム周期内ではじめに、第一の相互相
関関数φxhl(mk)と自己相関関数Rhh+(l
mt mkl )と初期位相q1とを同期して入力し
、前述の音源パルス計算式(22を用いて、第一の音源
パルスの初期位相q1 と振幅列g、とを計算する。次
に、前述の処理が終了した後にパルス振幅計算回路22
は、第二の相互相関関数φXh2(−mk)と自己相関
関数Rhhz(l ml−m、l)と初期位相q2とを
同期して入力し、前述の音源パルス計算式(22)を用
いて、第二の音源パルスの初期位相q2と振幅列g1と
を計算する。さらに、パルス振幅計算回路22は、入力
音声と再生信号との間の誤差信号のパワーを、第一の音
源パルス列と第二の音源パルス列の各々に対し上式は(
9)式に(15)式および(22)式を代入することに
よって求められる。ここで、R,、(0) は重み付
は回路17の出力値x、(n)のパワーを示す。
数と初期位相とを同期して入力する。つまり、あらかじ
め定められたフレーム周期内ではじめに、第一の相互相
関関数φxhl(mk)と自己相関関数Rhh+(l
mt mkl )と初期位相q1とを同期して入力し
、前述の音源パルス計算式(22を用いて、第一の音源
パルスの初期位相q1 と振幅列g、とを計算する。次
に、前述の処理が終了した後にパルス振幅計算回路22
は、第二の相互相関関数φXh2(−mk)と自己相関
関数Rhhz(l ml−m、l)と初期位相q2とを
同期して入力し、前述の音源パルス計算式(22)を用
いて、第二の音源パルスの初期位相q2と振幅列g1と
を計算する。さらに、パルス振幅計算回路22は、入力
音声と再生信号との間の誤差信号のパワーを、第一の音
源パルス列と第二の音源パルス列の各々に対し上式は(
9)式に(15)式および(22)式を代入することに
よって求められる。ここで、R,、(0) は重み付
は回路17の出力値x、(n)のパワーを示す。
第一の音源パルス列と第二の音源パルス列について計算
された誤差信号パワーは、判別回路23に出力される。
された誤差信号パワーは、判別回路23に出力される。
なお、(24)式の代わりに、音源パルス列を計算した
結果、得られる相互相関関数の誤差を用いて、誤差信号
のパワーを次の(25)式に従い近似的に計算すること
もできる。
結果、得られる相互相関関数の誤差を用いて、誤差信号
のパワーを次の(25)式に従い近似的に計算すること
もできる。
次に、判別回路23は、第一の音源パルス列と第二の音
源パルス列の内で、入力信号をより忠実に表し得る音源
パルス列を選択する目的を持っている。従って判別回路
23は、パルス振幅計算回路22から入力したおのおの
の音源パルス列に対する誤差信号のパワーを比較する。
源パルス列の内で、入力信号をより忠実に表し得る音源
パルス列を選択する目的を持っている。従って判別回路
23は、パルス振幅計算回路22から入力したおのおの
の音源パルス列に対する誤差信号のパワーを比較する。
もし第一の音源パルス列に対する値が第二の音源パルス
列に対する値より小さい場合は、第一の音源パルス列を
用いた方が第二の音源パルス列を用いるよりも特性がよ
いと判断する。第一の音源パルス列は、ピッチ情報を用
いない(つまりβ′=0、M5−〇とした)第一のイン
パルス応答から計算したものであるため、判別回路23
は、切替回路24に対して第一の音源パルス列を符号化
回路26へ出力させるようにする。また、判別回路23
は、ゲート回路25に対して、LAR係数の符号1LA
Riをマルチプレクサ27に出力させる。また、ピッチ
情報を表す符号(β、および1戸は、ゲート回路25に
おいて、あらかじめ定められた符号がセットされ、マル
チプレクサ27へ出力される。逆の場合には、第二の音
源パルス列を用いた方が第一の音源パルスを用いるより
も特性がよいと判断する。第二の音源パルス列は、スペ
クトル包絡情報とピッチ情報とを用いた第二のインパル
ス応答から計算したものであるため、判別回路23は、
切替回路24に対して、第二の音源パルス列を符号化回
路26へ出力させるようにする。
列に対する値より小さい場合は、第一の音源パルス列を
用いた方が第二の音源パルス列を用いるよりも特性がよ
いと判断する。第一の音源パルス列は、ピッチ情報を用
いない(つまりβ′=0、M5−〇とした)第一のイン
パルス応答から計算したものであるため、判別回路23
は、切替回路24に対して第一の音源パルス列を符号化
回路26へ出力させるようにする。また、判別回路23
は、ゲート回路25に対して、LAR係数の符号1LA
Riをマルチプレクサ27に出力させる。また、ピッチ
情報を表す符号(β、および1戸は、ゲート回路25に
おいて、あらかじめ定められた符号がセットされ、マル
チプレクサ27へ出力される。逆の場合には、第二の音
源パルス列を用いた方が第一の音源パルスを用いるより
も特性がよいと判断する。第二の音源パルス列は、スペ
クトル包絡情報とピッチ情報とを用いた第二のインパル
ス応答から計算したものであるため、判別回路23は、
切替回路24に対して、第二の音源パルス列を符号化回
路26へ出力させるようにする。
また、判別回路23は、ゲート回路25に対して、LA
Rパラメータ符号βLAR1およびピッチ情報を表す符
号βd、fBをマルチプレクサ27へ出力させる。
Rパラメータ符号βLAR1およびピッチ情報を表す符
号βd、fBをマルチプレクサ27へ出力させる。
パルス符号化回路26は、切替回路24から音源パルス
系列の初期位相、および振幅を入力しこれらを正規化係
数を用いて符号化する。また、正規化係数にも符号化を
施し、正規化係数、音源パルスの初期位相、およびパル
ス列の振幅を表す符号をマルチプレクサ27に出力する
。またパルス符号化回路26は正規化係数、音源パルス
の初期位相ならびにパルス列の振幅の復号化値Q’、g
kをパルス系列発生回路28へ出力する。この方法は例
えば文献1を参照することができる。
系列の初期位相、および振幅を入力しこれらを正規化係
数を用いて符号化する。また、正規化係数にも符号化を
施し、正規化係数、音源パルスの初期位相、およびパル
ス列の振幅を表す符号をマルチプレクサ27に出力する
。またパルス符号化回路26は正規化係数、音源パルス
の初期位相ならびにパルス列の振幅の復号化値Q’、g
kをパルス系列発生回路28へ出力する。この方法は例
えば文献1を参照することができる。
パルス系列発生回路28は、入力したパルス列の振幅の
復号値q’、g、;を用いて、m【の位置に振幅gwを
持つ音源パルス系列を1フレーム長Nにわたって計算し
これを駆動信号として、合成フィルタ回路29に出力す
る。
復号値q’、g、;を用いて、m【の位置に振幅gwを
持つ音源パルス系列を1フレーム長Nにわたって計算し
これを駆動信号として、合成フィルタ回路29に出力す
る。
合成フィルタ回路29は、LAR符号化回路13からL
AR係数の復号値LAR’、を入力する。また、ピッチ
符号化回路15から、ピッチ情報(LTPラグ復号値M
二およびLTPゲイン復号値β′を入力する。LARパ
ラメータ復号値L A R;を予測パラメータaL (
1≦i≦N )に公知の方法を用いて変換しておく。ま
た、判別回路23から、判別情報を入力する。前述の第
一の条件が成立する場合には、判別回路23から、判別
情報を入力する。
AR係数の復号値LAR’、を入力する。また、ピッチ
符号化回路15から、ピッチ情報(LTPラグ復号値M
二およびLTPゲイン復号値β′を入力する。LARパ
ラメータ復号値L A R;を予測パラメータaL (
1≦i≦N )に公知の方法を用いて変換しておく。ま
た、判別回路23から、判別情報を入力する。前述の第
一の条件が成立する場合には、判別回路23から、判別
情報を入力する。
前述の第一の条件が成立する場合には、ピッチ情報は0
とする。次に合成フィルタ回路29は、パルス系列発生
回路28から1フレ一ム分の駆動音源振動を入力して、
この1フレ一ム分の信号に、さらに1分析フレーム分0
を付加し、この2フレームの信号に対する応答信号系列
x (n)を求める。
とする。次に合成フィルタ回路29は、パルス系列発生
回路28から1フレ一ム分の駆動音源振動を入力して、
この1フレ一ム分の信号に、さらに1分析フレーム分0
を付加し、この2フレームの信号に対する応答信号系列
x (n)を求める。
次式のこのことを示す。
x (n) = d (n)+β・xd(n−Md)+
’L’ a t−x(n −i) −(26)−1 ここで駆動音源信号d (n)は、 1≦n≦N では、パルス系列発生回路28から出力されたパルス系
列を表し、 N+1≦n≦2N では、すべて00系列を表す。また、 N十り≦n≦2N 時刻において、(26)式で用いるa 、 Ma 、β
は現フレーム時刻に求めた値を使ってもよいし、次のフ
レーム時刻で求まる値を使ってもよい。(26)式%式
%) の値が減算器16に出力される。
’L’ a t−x(n −i) −(26)−1 ここで駆動音源信号d (n)は、 1≦n≦N では、パルス系列発生回路28から出力されたパルス系
列を表し、 N+1≦n≦2N では、すべて00系列を表す。また、 N十り≦n≦2N 時刻において、(26)式で用いるa 、 Ma 、β
は現フレーム時刻に求めた値を使ってもよいし、次のフ
レーム時刻で求まる値を使ってもよい。(26)式%式
%) の値が減算器16に出力される。
次に、マルチプレクサ27は、ゲート回路25の出力符
号と、パルス符号化回路26の出力符号とを入力し、こ
れらを組み合わせて、出力端子30から通信路へ出力す
る。
号と、パルス符号化回路26の出力符号とを入力し、こ
れらを組み合わせて、出力端子30から通信路へ出力す
る。
前述した実施例はあくまで本発明の一実施例に過ぎずそ
の変形例も種々考えられる。
の変形例も種々考えられる。
前述の実施例においては、ピッチ周期、ゲイン計算およ
びパルス系列の計算はフレーム単位で行ったが、フレー
ムをいくつかのサブフレームに分割し、そのサブフレー
ムごとに計算するような構成にしてもよい。もちろん、
同等の特性は得られる。
びパルス系列の計算はフレーム単位で行ったが、フレー
ムをいくつかのサブフレームに分割し、そのサブフレー
ムごとに計算するような構成にしてもよい。もちろん、
同等の特性は得られる。
前述の実施例においては、スペクトルパラメータのみを
用いて計算した音源パルス列と、ピッチパラメータを用
いて計算した音源パルス列とを比較し、入力信号をより
忠実に再現できるパルス列を伝送しているが、より簡便
な方法として、ピッチパラメータのピッチゲインβを用
いて判別するような構成とすることも考えられる。例え
ば、ピッチゲインβを計算した後に、ピッチゲインβを
あらかじめ定められた闇値と比較して、ピッチゲインβ
が閾値以下であればピッチゲインβを強制的に0とする
。この場合では、スペクトルパラメータのみを用いて音
源パルスを計算することになる。このような構成にする
ことによって、音源パルス系列を比較判別するための判
別回路23および前述の(24)式あるいは(25)式
の演算が不要となり演算量を低減することができる。
用いて計算した音源パルス列と、ピッチパラメータを用
いて計算した音源パルス列とを比較し、入力信号をより
忠実に再現できるパルス列を伝送しているが、より簡便
な方法として、ピッチパラメータのピッチゲインβを用
いて判別するような構成とすることも考えられる。例え
ば、ピッチゲインβを計算した後に、ピッチゲインβを
あらかじめ定められた闇値と比較して、ピッチゲインβ
が閾値以下であればピッチゲインβを強制的に0とする
。この場合では、スペクトルパラメータのみを用いて音
源パルスを計算することになる。このような構成にする
ことによって、音源パルス系列を比較判別するための判
別回路23および前述の(24)式あるいは(25)式
の演算が不要となり演算量を低減することができる。
また、(22)式に示した音源パルス計算法において準
最適なパルスを一つずつ計算していた。この方法におい
ては、次のパルスを計算する際に、これより過去に求め
られた複数個のパルスの振幅を調整するような方法を用
いることもできる。この方法によれば、各パルスに独立
性が成立しない場合とくに効果的である。また、他の音
源パルス振幅計算法として、種々のものが考えられる。
最適なパルスを一つずつ計算していた。この方法におい
ては、次のパルスを計算する際に、これより過去に求め
られた複数個のパルスの振幅を調整するような方法を用
いることもできる。この方法によれば、各パルスに独立
性が成立しない場合とくに効果的である。また、他の音
源パルス振幅計算法として、種々のものが考えられる。
例えば、1フレーム内のすべてのパルスが求まった後に
、全てのパルスの振幅を再調整するような方法を用いる
こともできる。
、全てのパルスの振幅を再調整するような方法を用いる
こともできる。
また、本発明の実施例の構成によれば、重み付は回路1
7において、重み付けを行っているが、この重み付けは
スペクトル包絡に関する重み付けであり、ピッチ構造を
利用した重み付けは含まれていない。従って、次式に示
すスペクトル包絡とピッチ構造の両方を利用した重み付
けは含まれていない。従って、次式に示すスペクトル包
絡とピッチ構造の両方を利用した重み付は関数W o
(n )を用いることによって、より効果的な重み付け
がされ、より効果的な重み付けをすることができる。
7において、重み付けを行っているが、この重み付けは
スペクトル包絡に関する重み付けであり、ピッチ構造を
利用した重み付けは含まれていない。従って、次式に示
すスペクトル包絡とピッチ構造の両方を利用した重み付
けは含まれていない。従って、次式に示すスペクトル包
絡とピッチ構造の両方を利用した重み付は関数W o
(n )を用いることによって、より効果的な重み付け
がされ、より効果的な重み付けをすることができる。
(1−’I’a+−t、−゛> (1−β−z −”)
−1 Wo(Z)” (1−’L’at・r’Z−’) (1−β・r’ ・
l−”)−1 (27) ここでW。(Z)は、重み付は関数ωp(n)のZ変換
表現であり、rおよびr′は重み付は係数であり、Q<
r、r’ <lの値が選ばれる。
−1 Wo(Z)” (1−’L’at・r’Z−’) (1−β・r’ ・
l−”)−1 (27) ここでW。(Z)は、重み付は関数ωp(n)のZ変換
表現であり、rおよびr′は重み付は係数であり、Q<
r、r’ <lの値が選ばれる。
また、本発明によれば、判別回路23において、2種の
音源パルス列の内、どちらのパルス列を用いれば特性が
良好かを判別する場合に、(24)式および(25)式
で求めた重み付けられた誤差信号のパワーを判断の基準
にした。この判断基準としては、他の最良な方法を用い
ることができる。例えば、長時間予測を行った場合の予
測ゲインを計算し、それらの値とあらかじめ定められた
閾値とを比較して判断基準とするような構成にしてもよ
い。
音源パルス列の内、どちらのパルス列を用いれば特性が
良好かを判別する場合に、(24)式および(25)式
で求めた重み付けられた誤差信号のパワーを判断の基準
にした。この判断基準としては、他の最良な方法を用い
ることができる。例えば、長時間予測を行った場合の予
測ゲインを計算し、それらの値とあらかじめ定められた
閾値とを比較して判断基準とするような構成にしてもよ
い。
また、本発明においては、短時間スペクトル構造を表す
インパルス応用系列の自己相関関数列を計算する際に、
インパルス応答計算回路19によって、LAR係数復号
値およびピッチ情報とを用いて、インパルス応答系列を
計算した後に、このインパルス応答系列を用いて自己相
関関数列を計算していた。ディジタル信号処理の分野で
よく知られているようにインパルス応答系列の自己相関
関数列は、短時間スペクトルのパワースペクトルと対応
関係にある。従って、LAR係数復号値およびピッチ情
報を用いて、短時間スペクトルのパワースペクトルを求
め自己相関関数列を計算するような構成としてもよい。
インパルス応用系列の自己相関関数列を計算する際に、
インパルス応答計算回路19によって、LAR係数復号
値およびピッチ情報とを用いて、インパルス応答系列を
計算した後に、このインパルス応答系列を用いて自己相
関関数列を計算していた。ディジタル信号処理の分野で
よく知られているようにインパルス応答系列の自己相関
関数列は、短時間スペクトルのパワースペクトルと対応
関係にある。従って、LAR係数復号値およびピッチ情
報を用いて、短時間スペクトルのパワースペクトルを求
め自己相関関数列を計算するような構成としてもよい。
一方、音声信号系列と短時間スペクトル包絡を表すイン
パルス応答系列との相互相関関数列を計算する際に、本
実施例の構成では、重み付は回路17の出力値である信
号系列x、(n)と、インパルス応答計算回路17で求
めたインパルス応答系列を用いて、相互相関関数計算回
路18にて相互相関関数を計算していた。よく知られて
いるように、相互相関関数は、クロスパワースペクトル
と対応関係にある。この関係を用いて音声信号系列とL
AR復号値およびピッチ情報とを用いてクロスパワ−ス
ペクトルを求めて相互相関関数列を計算するような構成
としてもよい。なお、パワースペクトルと自己相関関数
列との対応関係、およびクロスパワースペクトルと相互
相関関数列との対応関係については、ニー・ブイ・オッ
ペンハイム(A、V、OFPENHEIM)氏らによる
「ディジタル信号処理J rollGITAL 5I
GNAL PROCESSING J Prentie
−Hall(1975) <文献3)の第8章にて詳細
に説明されているのでここでは説明を省略する。
パルス応答系列との相互相関関数列を計算する際に、本
実施例の構成では、重み付は回路17の出力値である信
号系列x、(n)と、インパルス応答計算回路17で求
めたインパルス応答系列を用いて、相互相関関数計算回
路18にて相互相関関数を計算していた。よく知られて
いるように、相互相関関数は、クロスパワースペクトル
と対応関係にある。この関係を用いて音声信号系列とL
AR復号値およびピッチ情報とを用いてクロスパワ−ス
ペクトルを求めて相互相関関数列を計算するような構成
としてもよい。なお、パワースペクトルと自己相関関数
列との対応関係、およびクロスパワースペクトルと相互
相関関数列との対応関係については、ニー・ブイ・オッ
ペンハイム(A、V、OFPENHEIM)氏らによる
「ディジタル信号処理J rollGITAL 5I
GNAL PROCESSING J Prentie
−Hall(1975) <文献3)の第8章にて詳細
に説明されているのでここでは説明を省略する。
また、前述の本発明の実施例においては、1フレーム内
の音源パルスの系列の符号化は、パルス系列がすべて求
められたのちに、第1図のパルス符号化回路26によっ
て符号化を施したが、符号化をパルス系列の計算に含め
て、パルスを一つ計算するごとに符号化を行い、次のパ
ルスを計算するという構成にしてもよい。このような構
成をとることによって、符号化の歪をも含めた誤差を最
小とするようなパルス系列が求まるので、さらに品質を
向上させることができる。
の音源パルスの系列の符号化は、パルス系列がすべて求
められたのちに、第1図のパルス符号化回路26によっ
て符号化を施したが、符号化をパルス系列の計算に含め
て、パルスを一つ計算するごとに符号化を行い、次のパ
ルスを計算するという構成にしてもよい。このような構
成をとることによって、符号化の歪をも含めた誤差を最
小とするようなパルス系列が求まるので、さらに品質を
向上させることができる。
また、本実施例においては、フレーム境界での再生波形
の不連続に起因する品質劣化を防ぐために、現フレーム
より1フレーム過去の音源パルスに由来した応用信号系
列を計算し、現フレームの入力音声からこの応答信号を
減算したのちに、駆動音源パルスを計算したが、第3図
に示すように、音源パルス計算に用いるデータとして、
パルスを伝送するフレームのデータおよびそれよりも過
去のデータを含むような構成にしてもよい。第3図で、
NTはパルスを伝送するフレームを示し、Nは音源パル
スを計算するフレームを示す。このような構成とするこ
とによって、1フレーム過去の音源パルスに由来した応
用信号系列を計算する必要がなくなる効果がある。
の不連続に起因する品質劣化を防ぐために、現フレーム
より1フレーム過去の音源パルスに由来した応用信号系
列を計算し、現フレームの入力音声からこの応答信号を
減算したのちに、駆動音源パルスを計算したが、第3図
に示すように、音源パルス計算に用いるデータとして、
パルスを伝送するフレームのデータおよびそれよりも過
去のデータを含むような構成にしてもよい。第3図で、
NTはパルスを伝送するフレームを示し、Nは音源パル
スを計算するフレームを示す。このような構成とするこ
とによって、1フレーム過去の音源パルスに由来した応
用信号系列を計算する必要がなくなる効果がある。
以上述べたように、本発明によれば、同一の伝送情報量
の場合に、より良好な品質を得ることができる音声信号
符号化装置を実現することができ、その効果は大である
。
の場合に、より良好な品質を得ることができる音声信号
符号化装置を実現することができ、その効果は大である
。
第1図は本発明の一実施例を示すブロック構成図。
第2図は本発明による音源パルス計算アルゴリズムの説
明に用いる合成フィルタの一例を示すブロック構成図。 第3図はパルス伝送フレームと音源パルス計算フレーム
との一関係を示す説明図。 第4図は従来例を示すブロック構成図。 10.100・・・入力端子、11.110・・・前処
理回路、12.120・・・LPC分析回路、13・・
・LAR係数符号化回路、14・・・ピッチ分析回路、
15・・・ピッチ符号化回路、16.140・・・減算
回路、17・・・重み付は回路、18・・・相互相関関
数計算回路、19・・・インパルス応答計算回路、20
・・・自己相関関数計算回路、21・・・初期位相計算
回路、22・・・パルス振幅計算回路、23・・・判別
回路、24・・・切替回路、25・・・ゲート回路、2
6・・・パルス符号化回路、27.200・・・マルチ
プレクサ、28.190・・・パルス系列発生回路、2
9・・・合成フィルタ回路、30.210・・・出力端
子、130・・・短時間分析回路、・・・長時間分析フ
ィルタ、160・・・長時間分折回170・・・パルス
系列計算回路、180・・・加算回路、・・・合成フィ
ルタ、310・・・長時間予測フィルタ、・・・短時間
予測フィルタ。
明に用いる合成フィルタの一例を示すブロック構成図。 第3図はパルス伝送フレームと音源パルス計算フレーム
との一関係を示す説明図。 第4図は従来例を示すブロック構成図。 10.100・・・入力端子、11.110・・・前処
理回路、12.120・・・LPC分析回路、13・・
・LAR係数符号化回路、14・・・ピッチ分析回路、
15・・・ピッチ符号化回路、16.140・・・減算
回路、17・・・重み付は回路、18・・・相互相関関
数計算回路、19・・・インパルス応答計算回路、20
・・・自己相関関数計算回路、21・・・初期位相計算
回路、22・・・パルス振幅計算回路、23・・・判別
回路、24・・・切替回路、25・・・ゲート回路、2
6・・・パルス符号化回路、27.200・・・マルチ
プレクサ、28.190・・・パルス系列発生回路、2
9・・・合成フィルタ回路、30.210・・・出力端
子、130・・・短時間分析回路、・・・長時間分析フ
ィルタ、160・・・長時間分折回170・・・パルス
系列計算回路、180・・・加算回路、・・・合成フィ
ルタ、310・・・長時間予測フィルタ、・・・短時間
予測フィルタ。
Claims (1)
- 【特許請求の範囲】 1、離散的な音声信号系列を入力しピッチの微細構造を
含む短時間スペクトルを表すスペクトルパラメータを抽
出し符号化するスペクトルパラメータ符号化手段を備え
た音声信号符号化装置において、 前記スペクトルパラメータをもとにインパルス応答系列
の自己相関関数列を計算する自己相関関数算出手段と、 前記音声信号系列と前記インパルス応答系列に応じた相
互相関関数列を計算する相互相関係数算出手段と、 前記相互相関関数列を用いて駆動音源信号の初期位相を
求めて符号化し、前記自己相関関数列と前記相互相関関
数列と前記駆動音源信号の初期位相とを用いて前記音声
信号系列に対しあらかじめ定められた時間間隔ごとに前
記駆動音源信号の振幅系列を求めて符号化する振幅系列
符号化手段と、前記スペクトルパラメータを表す符号と
前記駆動音源信号の初期位相を表す符号と前記駆動音源
信号の振幅系列を表す符号とを組み合わせて出力する出
力手段と を備えたことを特徴とする音声信号符号化装置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1254458A JP2900431B2 (ja) | 1989-09-29 | 1989-09-29 | 音声信号符号化装置 |
| DE1990631749 DE69031749T2 (de) | 1989-06-14 | 1990-06-15 | Einrichtung und Verfahren zur Sprachkodierung mit Regular-Pulsanregung |
| EP19900111360 EP0402947B1 (en) | 1989-06-14 | 1990-06-15 | Arrangement and method for encoding speech signal using regular pulse excitation scheme |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1254458A JP2900431B2 (ja) | 1989-09-29 | 1989-09-29 | 音声信号符号化装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03116199A true JPH03116199A (ja) | 1991-05-17 |
| JP2900431B2 JP2900431B2 (ja) | 1999-06-02 |
Family
ID=17265302
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1254458A Expired - Fee Related JP2900431B2 (ja) | 1989-06-14 | 1989-09-29 | 音声信号符号化装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2900431B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08328600A (ja) * | 1995-06-01 | 1996-12-13 | Sony Corp | 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置 |
| US6049814A (en) * | 1996-12-27 | 2000-04-11 | Nec Corporation | Spectrum feature parameter extracting system based on frequency weight estimation function |
| US6807524B1 (en) | 1998-10-27 | 2004-10-19 | Voiceage Corporation | Perceptual weighting device and method for efficient coding of wideband signals |
-
1989
- 1989-09-29 JP JP1254458A patent/JP2900431B2/ja not_active Expired - Fee Related
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08328600A (ja) * | 1995-06-01 | 1996-12-13 | Sony Corp | 音声信号符号化方法及び装置、並びに音声信号符号化復号化装置 |
| US6049814A (en) * | 1996-12-27 | 2000-04-11 | Nec Corporation | Spectrum feature parameter extracting system based on frequency weight estimation function |
| US6807524B1 (en) | 1998-10-27 | 2004-10-19 | Voiceage Corporation | Perceptual weighting device and method for efficient coding of wideband signals |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2900431B2 (ja) | 1999-06-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5867814A (en) | Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method | |
| US20020095285A1 (en) | Apparatus for encoding and apparatus for decoding speech and musical signals | |
| Edler et al. | Audio coding using a psychoacoustic pre-and post-filter | |
| JPH10187196A (ja) | 低ビットレートピッチ遅れコーダ | |
| EP2187390B1 (en) | Speech signal decoding | |
| JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
| JP3266178B2 (ja) | 音声符号化装置 | |
| JP3616432B2 (ja) | 音声符号化装置 | |
| EP1103953B1 (en) | Method for concealing erased speech frames | |
| KR20040045586A (ko) | 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의상호부호화 장치 및 그 방법 | |
| JPH09319398A (ja) | 信号符号化装置 | |
| JPH03116199A (ja) | 音声信号符号化装置 | |
| US7133823B2 (en) | System for an adaptive excitation pattern for speech coding | |
| JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
| JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
| US7295974B1 (en) | Encoding in speech compression | |
| EP1035538B1 (en) | Multimode quantizing of the prediction residual in a speech coder | |
| JP3006790B2 (ja) | 音声符号化復号化方法及びその装置 | |
| JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
| Drygajilo | Speech Coding Techniques and Standards | |
| JPH0481199B2 (ja) | ||
| JPH01258000A (ja) | 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置 | |
| JPH01233499A (ja) | 音声信号符号化復号化方法及びその装置 | |
| JP3144244B2 (ja) | 音声符号化装置 | |
| Du | Coding of speech LSP parameters using context information |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |