JPH02120895A - 音声符号化復号化方式とその装置 - Google Patents
音声符号化復号化方式とその装置Info
- Publication number
- JPH02120895A JPH02120895A JP63276508A JP27650888A JPH02120895A JP H02120895 A JPH02120895 A JP H02120895A JP 63276508 A JP63276508 A JP 63276508A JP 27650888 A JP27650888 A JP 27650888A JP H02120895 A JPH02120895 A JP H02120895A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- parameter
- prediction parameter
- audio signal
- linear prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 claims description 56
- 238000000034 method Methods 0.000 claims description 11
- 238000005311 autocorrelation function Methods 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 9
- 238000005314 correlation function Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、離散音声信号を線形予測パラメータとピッチ
予測パラメータと特性区間の音源パラメータと音源信号
のピッチ周期毎の振幅特性とで表す音声符号化復号化方
式に関する。
予測パラメータと特性区間の音源パラメータと音源信号
のピッチ周期毎の振幅特性とで表す音声符号化復号化方
式に関する。
(従来の技術)
音声信号をそのスペクトル包絡を表すパラメータと音源
信号を表すパラメータとで符号化する方式として、適応
予測符号化方式やマルチパルス音声符号化方式などが良
く知られている。これらの音声符号化方式をより低ビツ
トレートで適用するためには、音源パラメータの符号化
に要する情報量(ビット数)を削減する必要がある。こ
の音源パラメータ情報を圧縮するための基本的な発想は
、音源パラメータを特定の区間にだけ定め、残りの区間
は予め定めた適当な方法で合成させるというものである
。これまで、前記残りの区間の合成法としては、特定区
間の音源パラメータをピッチ周期毎に繰り返す、或は、
特定区に囲まれた区間の音源パラメータは該当する音源
パラメータ同士の(線形)補間によって合成させるとい
う方法が収られている。
信号を表すパラメータとで符号化する方式として、適応
予測符号化方式やマルチパルス音声符号化方式などが良
く知られている。これらの音声符号化方式をより低ビツ
トレートで適用するためには、音源パラメータの符号化
に要する情報量(ビット数)を削減する必要がある。こ
の音源パラメータ情報を圧縮するための基本的な発想は
、音源パラメータを特定の区間にだけ定め、残りの区間
は予め定めた適当な方法で合成させるというものである
。これまで、前記残りの区間の合成法としては、特定区
間の音源パラメータをピッチ周期毎に繰り返す、或は、
特定区に囲まれた区間の音源パラメータは該当する音源
パラメータ同士の(線形)補間によって合成させるとい
う方法が収られている。
(発明が解決しようとする課題)
前述の従来方法は情報の圧縮には確かにつながるが、音
声信号の局所的時間特性に追随できず、高い品質の再生
音声信号を生成できないという欠点がある。この欠点は
、特定区間の位置を音声信号の特性に適応的に変えても
本質的には回避できない欠点である。また、前記従来法
では、特定区間の音源パラメータを求める際に、フレー
ム全体に渡る誤差を評価しておらず、特定区間外におけ
る音源パラメータの適合性は保証されないという欠点を
もつ。
声信号の局所的時間特性に追随できず、高い品質の再生
音声信号を生成できないという欠点がある。この欠点は
、特定区間の位置を音声信号の特性に適応的に変えても
本質的には回避できない欠点である。また、前記従来法
では、特定区間の音源パラメータを求める際に、フレー
ム全体に渡る誤差を評価しておらず、特定区間外におけ
る音源パラメータの適合性は保証されないという欠点を
もつ。
本発明の目的は、音声信号のフレーム全体に渡る局所的
時間構造に適応できるように、ピッチ周期毎或は予め定
めた周期などの適当な周期毎に音源信号の振幅特性を補
正する構成を導入することにより、比較的低ビットレー
トで高い品質を持つ音声符号化復号化方式を提供するこ
とにある。
時間構造に適応できるように、ピッチ周期毎或は予め定
めた周期などの適当な周期毎に音源信号の振幅特性を補
正する構成を導入することにより、比較的低ビットレー
トで高い品質を持つ音声符号化復号化方式を提供するこ
とにある。
(課題を解決するための手段)
本発明の音声符号化復号化方式は、符号化側では、一定
間隔のフレームに分割された音声信号を入力し、前記入
力した音声信号から線形予測パラメータとピッチ予測パ
ラメータとを抽出し、前記入力音声信号と前記線形予測
パラメータとピッチ予測パラメータとを基に前記入力音
声信号の特性によって定まる特定区間の音源パラメータ
を抽出し、前記入力音声信号と前記線形予測パラメータ
とを基に前記音源パラメータと前記ピッチ予測パラメー
タとで定まるフレーム全体に渡る音源信号の適当な周期
毎の振幅特性を求め、前記線形予測パラメータと前記ピ
ッチ予測パラメータと前記特定区間の音源パラメータと
前記適当な周期毎の振幅特性とを符号化し、復号化側で
は、前記線形予測パラメータと前記ピッチ予測パラメー
タと前記特定区間の音源パラメータと前記適当な周期毎
の音源信号の振幅特性とを復号し、前記復号化されたピ
ッチ予測パラメータと前記復号化された特定区間の音源
パラメータと前記復号化された適当な周期毎の振幅特性
とから音源信号を再生し、前記再生された音源信号と前
記復号化された線形予測パラメータとで再生音声信号を
生成する。
間隔のフレームに分割された音声信号を入力し、前記入
力した音声信号から線形予測パラメータとピッチ予測パ
ラメータとを抽出し、前記入力音声信号と前記線形予測
パラメータとピッチ予測パラメータとを基に前記入力音
声信号の特性によって定まる特定区間の音源パラメータ
を抽出し、前記入力音声信号と前記線形予測パラメータ
とを基に前記音源パラメータと前記ピッチ予測パラメー
タとで定まるフレーム全体に渡る音源信号の適当な周期
毎の振幅特性を求め、前記線形予測パラメータと前記ピ
ッチ予測パラメータと前記特定区間の音源パラメータと
前記適当な周期毎の振幅特性とを符号化し、復号化側で
は、前記線形予測パラメータと前記ピッチ予測パラメー
タと前記特定区間の音源パラメータと前記適当な周期毎
の音源信号の振幅特性とを復号し、前記復号化されたピ
ッチ予測パラメータと前記復号化された特定区間の音源
パラメータと前記復号化された適当な周期毎の振幅特性
とから音源信号を再生し、前記再生された音源信号と前
記復号化された線形予測パラメータとで再生音声信号を
生成する。
また、本発明の音声符号化装置は、一定間隔のフレーム
に分割された音声信号を入力する手段と、この入力手段
で入力した前記音声信号から線形予測パラメータを抽出
する手段と、前記入力手段で入力した前記音声信号から
ピッチ予測パラメータを抽出する手段と、前記入力音声
信号と前記線形予測パラメータとピッチ予測パラメータ
とから前記入力音声信号の特性によって定まる特定区間
の音源パラメータを抽出する手段と、前記音源パラメー
タと前記ピッチ予測パラメータとで定まるフレーム全体
に渡る音源信号の適当な周期毎の振幅特性を前記入力音
声信号と前記線形予測パラメータとを基に求める手段と
、前記線形予測パラメータと前記ピッチ予測パラメータ
と前記特定区間の音源パラメータと前記適当な周期毎の
振幅特性を符号化する手段とを有して構成される。
に分割された音声信号を入力する手段と、この入力手段
で入力した前記音声信号から線形予測パラメータを抽出
する手段と、前記入力手段で入力した前記音声信号から
ピッチ予測パラメータを抽出する手段と、前記入力音声
信号と前記線形予測パラメータとピッチ予測パラメータ
とから前記入力音声信号の特性によって定まる特定区間
の音源パラメータを抽出する手段と、前記音源パラメー
タと前記ピッチ予測パラメータとで定まるフレーム全体
に渡る音源信号の適当な周期毎の振幅特性を前記入力音
声信号と前記線形予測パラメータとを基に求める手段と
、前記線形予測パラメータと前記ピッチ予測パラメータ
と前記特定区間の音源パラメータと前記適当な周期毎の
振幅特性を符号化する手段とを有して構成される。
更に、本発明の音声復号化装置は、一定間隔のフレーム
に分割された音声信号に関する線形予測パラメータを表
す符号とピッチ予測パラメータを表す符号と特定区間の
音源パラメータを表す符号と適当な周期毎の振幅特性を
表す符号とでなる符号列を入力する手段と、この入力手
段で入力した前記符号列から前記線形予測パラメータを
表す符号と前記ピッチ予測パラメータを表す符号と前記
特定区間の音源パラメータを表す符号と前記適当な周期
毎の振幅特性を表す符号とを復号する手段と、この復号
手段で復号された前記ピッチ予測パラメータと前記特定
区間の音源パラメータと前記適当な周期毎の振幅特性と
から音源信号を再生する手段と、この再生手段で再生さ
れた前記音源信号と前記復号手段で復号された前記線形
予測パラメータとから再生音声信号を生成する手段とを
有して構成される。
に分割された音声信号に関する線形予測パラメータを表
す符号とピッチ予測パラメータを表す符号と特定区間の
音源パラメータを表す符号と適当な周期毎の振幅特性を
表す符号とでなる符号列を入力する手段と、この入力手
段で入力した前記符号列から前記線形予測パラメータを
表す符号と前記ピッチ予測パラメータを表す符号と前記
特定区間の音源パラメータを表す符号と前記適当な周期
毎の振幅特性を表す符号とを復号する手段と、この復号
手段で復号された前記ピッチ予測パラメータと前記特定
区間の音源パラメータと前記適当な周期毎の振幅特性と
から音源信号を再生する手段と、この再生手段で再生さ
れた前記音源信号と前記復号手段で復号された前記線形
予測パラメータとから再生音声信号を生成する手段とを
有して構成される。
(作用)
第1図は本発明の作用を示すブロック図である。
以下に本図を参照して本発明の詳細な説明する。
入力端子10から入力される音声信号s (n)は入力
バッファ1に−フレームNサンプル分蓄えられる。線形
予測分析部2は入力バッファ1から入力される音声信号
の自己相関関数を計算しそれを基に線形予測係数或はP
ARCOR係数などの線形予測パラメータを決定する。
バッファ1に−フレームNサンプル分蓄えられる。線形
予測分析部2は入力バッファ1から入力される音声信号
の自己相関関数を計算しそれを基に線形予測係数或はP
ARCOR係数などの線形予測パラメータを決定する。
決定された線形予測パラメータは音源パラメータ抽出部
4と振幅補正部5と線形予測符号器8とに送られる。ピ
ッチ予測分析部3は入カバッファエから入力される入力
音声信号の自己相関関数から基本周期(ピッチ周期)を
、またピッチ周期の遅延に対応する自己相関係数の値か
らピッチ予測係数を求める。求めたピッチ周期とピッチ
予測係数は音源パラメータ抽出部4と振幅補正部5とピ
ッチ予測符号器9とに送られる。音源パラメータ抽出部
では、線形予測分析部2とピッチ予測分析部3から入力
される線形予測係数並びにピッチ予i11!l数とピッ
チ周期と入カバ・ツファ1から入力される入力音声信号
から特定区間の音源パラメータを求める。いま、線形予
測係数(aklk=1.・・・、にとピッチ周期Tとピ
ッチ予測係数すとで作られ、インパルス応答をh (n
)とすると、 と与えられる。このインパルス応答を基底信号として、
特定区間[LO,Lllに位置する音源パラメータを求
める。そのときの評価関数はである。ここで、e (n
)は線形予測とピッチ予測を行なった後の予測誤差信号
で、v(n)はn≦LO,Ll≦nで0となる音源パラ
メータから生成される音源信号である。尚、*は畳み込
みを表す記号である。音源信号のパラメータ表現として
は、ベクトル量子化やマルチパルス音源、或はその組合
せなどが考えられる。ベクトル量子化のときは、評価関
数は となる。ここでCI (n)はコードブックに蓄えられ
たインデックスlを持つ標準バタンで、最適な標準パタ
ンのインデックスは、 と決定される。一方、マルチパルス音源を採用するとそ
の評価関数は、 となる、第6式を小さくするパルスパラメータ(gll
mI)l=1.・・・1Mを求めるアルゴリズムは、数
々提案されており、例えば文献1「S。
4と振幅補正部5と線形予測符号器8とに送られる。ピ
ッチ予測分析部3は入カバッファエから入力される入力
音声信号の自己相関関数から基本周期(ピッチ周期)を
、またピッチ周期の遅延に対応する自己相関係数の値か
らピッチ予測係数を求める。求めたピッチ周期とピッチ
予測係数は音源パラメータ抽出部4と振幅補正部5とピ
ッチ予測符号器9とに送られる。音源パラメータ抽出部
では、線形予測分析部2とピッチ予測分析部3から入力
される線形予測係数並びにピッチ予i11!l数とピッ
チ周期と入カバ・ツファ1から入力される入力音声信号
から特定区間の音源パラメータを求める。いま、線形予
測係数(aklk=1.・・・、にとピッチ周期Tとピ
ッチ予測係数すとで作られ、インパルス応答をh (n
)とすると、 と与えられる。このインパルス応答を基底信号として、
特定区間[LO,Lllに位置する音源パラメータを求
める。そのときの評価関数はである。ここで、e (n
)は線形予測とピッチ予測を行なった後の予測誤差信号
で、v(n)はn≦LO,Ll≦nで0となる音源パラ
メータから生成される音源信号である。尚、*は畳み込
みを表す記号である。音源信号のパラメータ表現として
は、ベクトル量子化やマルチパルス音源、或はその組合
せなどが考えられる。ベクトル量子化のときは、評価関
数は となる。ここでCI (n)はコードブックに蓄えられ
たインデックスlを持つ標準バタンで、最適な標準パタ
ンのインデックスは、 と決定される。一方、マルチパルス音源を採用するとそ
の評価関数は、 となる、第6式を小さくするパルスパラメータ(gll
mI)l=1.・・・1Mを求めるアルゴリズムは、数
々提案されており、例えば文献1「S。
Ono、 at al、 ”Improved Pu1
se 5earch^Igorithmfor mul
ti−Pulse Excited 5peech C
oder、” Proc。
se 5earch^Igorithmfor mul
ti−Pulse Excited 5peech C
oder、” Proc。
GLQBCOH84,9,8,1984,、に詳しい、
さらに、ベクトル量子化とマルチパルス音源の輯合せで
あればそのときの評価関数は、 となる、抽出された音源パラメータは振幅補正部5と音
源パラメータ符号部6とに出力される。振幅補正部5は
、音源パラメータ抽出部4から供給される区間[LO,
Lllにある音源信号v(n>と、ピッチ予測分析器3
から供給されるピッチ周期Tとピッチ予測係数すとから
一フレームに渡す音源信号q(n)を生成し、その振幅
を特定周期り毎に補正する。−フレームの音源信号はq
(n)=bq(n−T)+v(n)、 O≦ n
≦N−1(8)と生成できるれ、このq (n)に対
して、となる信号セットを考えると、求める補正振幅(
Z」)J=1.・・・、Jは次の評価関数から定まる。
さらに、ベクトル量子化とマルチパルス音源の輯合せで
あればそのときの評価関数は、 となる、抽出された音源パラメータは振幅補正部5と音
源パラメータ符号部6とに出力される。振幅補正部5は
、音源パラメータ抽出部4から供給される区間[LO,
Lllにある音源信号v(n>と、ピッチ予測分析器3
から供給されるピッチ周期Tとピッチ予測係数すとから
一フレームに渡す音源信号q(n)を生成し、その振幅
を特定周期り毎に補正する。−フレームの音源信号はq
(n)=bq(n−T)+v(n)、 O≦ n
≦N−1(8)と生成できるれ、このq (n)に対
して、となる信号セットを考えると、求める補正振幅(
Z」)J=1.・・・、Jは次の評価関数から定まる。
二二で+ y (n)は線形予測係fi(ak)がさだ
まるインパルス応答で、 y(n)= Σ ahV(n−k)十δ(n)
(11)と計算される。(Z、)
は、まず第10式の両辺をzkで偏微分して零と置いた
、 る、音源再生部15では、先ず、音源パラメータ復号部
11から供給される音源パラメータで再生される音源信
号v (n>とピッチ予測復号部13とから供給される
ピッチ周期Tとピッチ予測係数すとから、 q(n)=bq(n−T)+v(n)
(13)と−フレーム分の音源信号を生成する
0次に、なる連立方程式から決定される。これは、対称
行列であるので高速なアルゴリズムを適用して解くこと
ができる。決定された振幅補正項(z、1J=1・・・
、Jは振幅補正符号器7へ出力される。音源パラメータ
符号部6で符号化された音源パラメータは音源パラメー
タ復号部11で、振幅補正符号部7で符号化された振幅
補正項は振幅補正復号部12で、ピッチ予1111狩号
部8で符号化されたピッチ予測パラメータはピッチ予測
復号部13で、線形予測符号部9で符号化された線形予
測パラメータは線形予測復号部14で、それぞれ復号さ
れなる信号セットを考え、それと振幅補正復号部12か
ら供給される補正項(ZJIJ=1.・・・Jとq (
n)とを用い、所望の音源信号p(n)を次式のように
定める。
まるインパルス応答で、 y(n)= Σ ahV(n−k)十δ(n)
(11)と計算される。(Z、)
は、まず第10式の両辺をzkで偏微分して零と置いた
、 る、音源再生部15では、先ず、音源パラメータ復号部
11から供給される音源パラメータで再生される音源信
号v (n>とピッチ予測復号部13とから供給される
ピッチ周期Tとピッチ予測係数すとから、 q(n)=bq(n−T)+v(n)
(13)と−フレーム分の音源信号を生成する
0次に、なる連立方程式から決定される。これは、対称
行列であるので高速なアルゴリズムを適用して解くこと
ができる。決定された振幅補正項(z、1J=1・・・
、Jは振幅補正符号器7へ出力される。音源パラメータ
符号部6で符号化された音源パラメータは音源パラメー
タ復号部11で、振幅補正符号部7で符号化された振幅
補正項は振幅補正復号部12で、ピッチ予1111狩号
部8で符号化されたピッチ予測パラメータはピッチ予測
復号部13で、線形予測符号部9で符号化された線形予
測パラメータは線形予測復号部14で、それぞれ復号さ
れなる信号セットを考え、それと振幅補正復号部12か
ら供給される補正項(ZJIJ=1.・・・Jとq (
n)とを用い、所望の音源信号p(n)を次式のように
定める。
再生された音源信号p (n)は、再生音声生成部16
へ出力される。再生音声生成部16では、音源再生部1
5から供給される再生音源信号p (n)と、線形予測
復号部14から供給される線形予測係数(ai+ l
k= 1 、・・・、にとを用いて、再生音声信号s
(n)を次の漸化式に従って計算する。
へ出力される。再生音声生成部16では、音源再生部1
5から供給される再生音源信号p (n)と、線形予測
復号部14から供給される線形予測係数(ai+ l
k= 1 、・・・、にとを用いて、再生音声信号s
(n)を次の漸化式に従って計算する。
再生された音声信号は出力バッファ17へ出力される。
出力バッファ17は一フレーム分の再生音声信号を蓄え
るもので、過去に再生されたサングルから順に出力端子
18を介して外部に出力される。
るもので、過去に再生されたサングルから順に出力端子
18を介して外部に出力される。
尚、以上作用の説明において、評価関数は全て平均二乗
誤差を用いたが、これは、他の距離尺度または重み関数
を掛けたものを用いても良い。
誤差を用いたが、これは、他の距離尺度または重み関数
を掛けたものを用いても良い。
(実施例)
第2図は、本発明の音声符号化復号化方式を適用してな
る音声符号化復号化装置の一実施例を示すブロック図で
ある。
る音声符号化復号化装置の一実施例を示すブロック図で
ある。
図において、音声信号は入力端子100を介して入力バ
ッファ110に−フレーム分Nサンプル蓄えられる。−
フレーム分の音声信号(s (n> 1n=0.・・・
、N−1は線形予測分析器120とピッチ予測分析器1
30と相互相関関数計算器150とへ出力される。線形
予測分析器120は、入力音声信号の自己相関関数を基
に線形予測係数或はPARCOR係数を求め、それを予
め定められたビット数で量子化したあと、自己相関間数
計算器140と相互相関関数計算器150と線形予測符
号器84とへ出力する。ピッチ予測分析器130は、入
力音声信号の自己相関関数から基本周期(ピッチ周期)
Tを求める。自己相関関数計算器140は、線形予測分
析器120がら入力される線形予測係数(ak)k=1
.・・・、K或はPARCOR係数を基に、インパルス
応答y(n)= Σ amV(n−k)+δ(n)
(17)の自己相関関数r (n
)を φ (τ)= Σ y(n)y(n−τ)
(18)と計算して、振幅補正器170とパルス
探索部160とへ出力される。相互相関関数計算器15
0は入力バッファ110から供給される線形予測係数或
はPARCOR係数から、 ψ (τ)= Σ 5(n)y(n−τ)
<19)を計算して、それをパルス探索部16
0へ出力する。パルス探索部160は、自己相関関数計
算器140から供給される自己相関間数φ(1:)と相
互相関関数計算器150から供給される相互相間間数ψ
(τ)とピッチ予測分析130から供給されるピッチ周
期Tとから、 φ、(n)・φ(n)+bφ(n−T)ψ、(n)=
ψ(n)+bψ(n−T)なる関数を計算し、 なる評価式をkに関して逐次計算することにより、マル
チパルス音源に対する音源パラメータ(g+ 。
ッファ110に−フレーム分Nサンプル蓄えられる。−
フレーム分の音声信号(s (n> 1n=0.・・・
、N−1は線形予測分析器120とピッチ予測分析器1
30と相互相関関数計算器150とへ出力される。線形
予測分析器120は、入力音声信号の自己相関関数を基
に線形予測係数或はPARCOR係数を求め、それを予
め定められたビット数で量子化したあと、自己相関間数
計算器140と相互相関関数計算器150と線形予測符
号器84とへ出力する。ピッチ予測分析器130は、入
力音声信号の自己相関関数から基本周期(ピッチ周期)
Tを求める。自己相関関数計算器140は、線形予測分
析器120がら入力される線形予測係数(ak)k=1
.・・・、K或はPARCOR係数を基に、インパルス
応答y(n)= Σ amV(n−k)+δ(n)
(17)の自己相関関数r (n
)を φ (τ)= Σ y(n)y(n−τ)
(18)と計算して、振幅補正器170とパルス
探索部160とへ出力される。相互相関関数計算器15
0は入力バッファ110から供給される線形予測係数或
はPARCOR係数から、 ψ (τ)= Σ 5(n)y(n−τ)
<19)を計算して、それをパルス探索部16
0へ出力する。パルス探索部160は、自己相関関数計
算器140から供給される自己相関間数φ(1:)と相
互相関関数計算器150から供給される相互相間間数ψ
(τ)とピッチ予測分析130から供給されるピッチ周
期Tとから、 φ、(n)・φ(n)+bφ(n−T)ψ、(n)=
ψ(n)+bψ(n−T)なる関数を計算し、 なる評価式をkに関して逐次計算することにより、マル
チパルス音源に対する音源パラメータ(g+ 。
m、) i=l、・・・9Mなるパラメータを求める。
但し、(m+ lの存在する区間は特性区間LO≦m
+ = L 1に限られている。求めたマルチパルス音
源パラメータは@幅補正器170とパルス符号器83と
へ出力される。@幅袖正器170は、パラメータ探索器
160から供給される音源パラメータ(g I+ m
t )とピッチ予測分析器130から供給されるピッチ
周期Tとから、−フレームに渡る音源信号q (n)を
再生する。即ち、である、この音源信号に対して固定周
期り毎に振幅を補正する。ここで、Lはピッチ周期に取
ってもよいが、ピッチ周期にすると補正項の数Jがフレ
ーム毎、話者の性質によって変化するため、固定の情報
で符号化することが難しくなる。従って、本実施例では
、Lは予め定められた長さとする。
+ = L 1に限られている。求めたマルチパルス音
源パラメータは@幅補正器170とパルス符号器83と
へ出力される。@幅袖正器170は、パラメータ探索器
160から供給される音源パラメータ(g I+ m
t )とピッチ予測分析器130から供給されるピッチ
周期Tとから、−フレームに渡る音源信号q (n)を
再生する。即ち、である、この音源信号に対して固定周
期り毎に振幅を補正する。ここで、Lはピッチ周期に取
ってもよいが、ピッチ周期にすると補正項の数Jがフレ
ーム毎、話者の性質によって変化するため、固定の情報
で符号化することが難しくなる。従って、本実施例では
、Lは予め定められた長さとする。
このq (n)とLに対して、
なる信号セットを考え、補正振幅(’zt)j=1゜・
・・、Jを定めることを考える。いま評価関数として、 なるものを考える。ここで、y (n>は線形予測係数
(a、)かさだまるインパルス応答であるので、評価間
数Ezを最小にする(2.)j−1,・・・、Jは、第
10式の両辺をZkで偏微分して零と置いた式、 なる連立方程式を解くことで決定される。ここで、φ(
n>は自己相関関数計算器140から入力される前記第
18式で示す自己相関関数である。
・・、Jを定めることを考える。いま評価関数として、 なるものを考える。ここで、y (n>は線形予測係数
(a、)かさだまるインパルス応答であるので、評価間
数Ezを最小にする(2.)j−1,・・・、Jは、第
10式の両辺をZkで偏微分して零と置いた式、 なる連立方程式を解くことで決定される。ここで、φ(
n>は自己相関関数計算器140から入力される前記第
18式で示す自己相関関数である。
φ(n)は相互相関量数計3!器150か八人力される
前記19式で示す相互相関関数である。前記第30式の
連立方程式の左辺は行列表示すると対称行列であるので
高速なアルゴリズムを適用して解くことができる。これ
は例えばチョレスキー(Cholesky)分解などが
有効である。決定された振幅補正項(zJ)j=1.・
・・、Jは量子化された後、振幅補正符号器82へ出力
される。線形予測符号器84は線形予測分析器120で
抽出された線形予測係数或はPARCOR係数などの線
形予測パラメータを符号に変換して、マルチプレクサ1
80へ出力する。ピッチ予測符号器81は、ピッチ予測
分析器130から供給されるピッチ周期を符号に変換し
て、マルチプレクサ180へ出力する。パルス符号器8
4は、パルス探索器160から供給されるマルチパルス
パラメータ(g、。
前記19式で示す相互相関関数である。前記第30式の
連立方程式の左辺は行列表示すると対称行列であるので
高速なアルゴリズムを適用して解くことができる。これ
は例えばチョレスキー(Cholesky)分解などが
有効である。決定された振幅補正項(zJ)j=1.・
・・、Jは量子化された後、振幅補正符号器82へ出力
される。線形予測符号器84は線形予測分析器120で
抽出された線形予測係数或はPARCOR係数などの線
形予測パラメータを符号に変換して、マルチプレクサ1
80へ出力する。ピッチ予測符号器81は、ピッチ予測
分析器130から供給されるピッチ周期を符号に変換し
て、マルチプレクサ180へ出力する。パルス符号器8
4は、パルス探索器160から供給されるマルチパルス
パラメータ(g、。
malを符号に変換して、マルチプレクサ180へ出力
する。補正値符号器82は、振幅補正器170から供給
される補正項(z、)を符号に変換しマルチプレクサ1
80へ出力する。マルチプレクサ180は、線形予測符
号器84とピッチ周期符号器81と補正値符号器82と
パルス符号器83とから供給される符号を多重化して、
符号出力端子190を介して符号列を復号側に伝送する
。
する。補正値符号器82は、振幅補正器170から供給
される補正項(z、)を符号に変換しマルチプレクサ1
80へ出力する。マルチプレクサ180は、線形予測符
号器84とピッチ周期符号器81と補正値符号器82と
パルス符号器83とから供給される符号を多重化して、
符号出力端子190を介して符号列を復号側に伝送する
。
符号入力端子200は、符号化側から多重化された符号
列を入力する符号入力端子である。多重化された符号列
はデマルチプレクサ210で分解され、線形予測係数或
はPARCOR係数を表す符号は線形予測復号器94へ
、ピッチ周期を表す符号はピッチ周期復号器93へ、マ
ルチパルスパラメータを表す符号はパルス復号器92へ
、補正項を表す符号は補正値復号器91へそれぞれ出力
される。線形予測復号器94は、デマルチプレクサ21
0より入力する線形予測係数或はPARCOR係数を表
す符号列を復号して、線形予測係数(am ) k=
1 、・・・、Kを再生し、それを再生音声信号生成器
240へ出力する。ピッチ周期復号器93はピッチ周期
Tを表す符号を復号して音源信号再生部220へ出力す
る。パルス符号器92は、マルチパルスパラメータ(g
I。
列を入力する符号入力端子である。多重化された符号列
はデマルチプレクサ210で分解され、線形予測係数或
はPARCOR係数を表す符号は線形予測復号器94へ
、ピッチ周期を表す符号はピッチ周期復号器93へ、マ
ルチパルスパラメータを表す符号はパルス復号器92へ
、補正項を表す符号は補正値復号器91へそれぞれ出力
される。線形予測復号器94は、デマルチプレクサ21
0より入力する線形予測係数或はPARCOR係数を表
す符号列を復号して、線形予測係数(am ) k=
1 、・・・、Kを再生し、それを再生音声信号生成器
240へ出力する。ピッチ周期復号器93はピッチ周期
Tを表す符号を復号して音源信号再生部220へ出力す
る。パルス符号器92は、マルチパルスパラメータ(g
I。
ml lを表す符号を復号して、音源信号再生器220
へ出力する。補正値復号器91は補正項(zJlを表す
符号を復号して、それらを音源信号振幅補正器230へ
出力する。音源信号再生器220は、パルス復号器92
とピッチ周期復号器93から供給されるピッチ周期Tと
特定区間のマルチパルスパラメータ(gI 、 T11
+ lとから一フレームに渡る音源信号q (n>を次
のように再生する。
へ出力する。補正値復号器91は補正項(zJlを表す
符号を復号して、それらを音源信号振幅補正器230へ
出力する。音源信号再生器220は、パルス復号器92
とピッチ周期復号器93から供給されるピッチ周期Tと
特定区間のマルチパルスパラメータ(gI 、 T11
+ lとから一フレームに渡る音源信号q (n>を次
のように再生する。
q(n)=q(n−T)十 Σ 9tδfn−m、)
(31)再生された音源信号
q(n)は音源信号振幅補正器230へ出力される。音
源信号振幅補正器230は、音源信号再生器220から
供給されるーフレーム分の音源信号q (n>の周期り
毎の振幅と補正値復号器91から供給される補正項(z
+1j=1.・・・、Jを用いて補正する。いま、なる
信号セ・yトを用いると所望の音源信号p (n)は次
のように計算することができる。
(31)再生された音源信号
q(n)は音源信号振幅補正器230へ出力される。音
源信号振幅補正器230は、音源信号再生器220から
供給されるーフレーム分の音源信号q (n>の周期り
毎の振幅と補正値復号器91から供給される補正項(z
+1j=1.・・・、Jを用いて補正する。いま、なる
信号セ・yトを用いると所望の音源信号p (n)は次
のように計算することができる。
再生された音源信号p (n)は、再生音声生成部24
0へ出力される。再生音声信号生成部240では、音源
信号振幅補正器230から供給される再生音源信号p
(n)と、線形予測16では、音源再生部15から供給
される音源信号p (n)と、線形予測復号器94から
供給される線形予測係数t ak l k= 1 、・
・・、にと用いて、次のように再生音声信号s (n)
を計算する。
0へ出力される。再生音声信号生成部240では、音源
信号振幅補正器230から供給される再生音源信号p
(n)と、線形予測16では、音源再生部15から供給
される音源信号p (n)と、線形予測復号器94から
供給される線形予測係数t ak l k= 1 、・
・・、にと用いて、次のように再生音声信号s (n)
を計算する。
再生された音声信号は出力バッファ250へ出力される
。出力バッファ250は−フレーム分の再生音声信号を
蓄えるもので、過去に再生されたサンプルから順に出力
端子260を介して外部に出力される。
。出力バッファ250は−フレーム分の再生音声信号を
蓄えるもので、過去に再生されたサンプルから順に出力
端子260を介して外部に出力される。
(発明の効果)
以上に説明したように、本発明では、音声信号を線形予
測パラメータと特定区間の音源パラメータとで表す音声
符号化復号化方式において、特定区間の音源パラメータ
を入力音声信号と再生音声信号とのフレーム全体に渡る
誤差が小さくなるように求め、さらに、音声信号の局所
的時間構造に適応できるように、ピッチ周期毎或は予め
定めた周期などの適当な周期毎に音源信号の振幅特性を
補正する構成を導入されている。したがって、本発明は
、特定区間における再生音声信号は入力音声信号に適応
できても、フレーム全体に渡る局所的な変動に追随でき
ないという前記従来法に比べ、比較的低ビットレートで
高い品質の再生音声が提供できるという効果がある。
測パラメータと特定区間の音源パラメータとで表す音声
符号化復号化方式において、特定区間の音源パラメータ
を入力音声信号と再生音声信号とのフレーム全体に渡る
誤差が小さくなるように求め、さらに、音声信号の局所
的時間構造に適応できるように、ピッチ周期毎或は予め
定めた周期などの適当な周期毎に音源信号の振幅特性を
補正する構成を導入されている。したがって、本発明は
、特定区間における再生音声信号は入力音声信号に適応
できても、フレーム全体に渡る局所的な変動に追随でき
ないという前記従来法に比べ、比較的低ビットレートで
高い品質の再生音声が提供できるという効果がある。
第1図は本発明の詳細な説明するためのブロック図、第
2図は本発明の一実施例を表す音声符号化復号化装置の
ブロック図である。 1・・・入力バッファ、2・・・線形予測分析部、3・
・・ピッチ予測分析部、4・・・音源パラメータ抽出部
、5・・・振幅補正部、6・・・音源パラメータ符号部
、7・・・振幅補正符号部、8・・・線形予測符号部、
9・・・ピッチ予測符号部、10・・・入力端子、11
・・・音源パラメータ復号部、12・・・振幅補正復号
部、13・・・ピッチ予測復号部、14・・・線形予測
復号部、15・・・音源再生部、16・・・再生音声生
成部、17・・・出力バッファ、18・・・出力端子、
81・・・ピッチ周期符号器、82・・・補正値符号器
、83・・・パルス符号器、84・・・線形予測符号器
、91・・・補正値復号器、92・・・パルス復号器、
93・・・ピッチ周期復号器、94・・・線形予測復号
器、100・・・入力端子、110・・・入力バッファ
、120・・・線形予測分析器、130・・・ピッチ予
測分析器、140・・・自己相関関数計算器、150・
・・相互相関関数計算器、160・・・パルス探索器、
170・・・振幅補正器、180・・・マルチプレクサ
、190・・・符号出力端子、200・・・符号入力端
子、210・・・デマルチブレフサ、220・・・音源
信号再生器、230・・・音源信号振幅補正器、240
・・・再生音声信号生成器、250・・・出力バッファ
、260・・・出力端子。
2図は本発明の一実施例を表す音声符号化復号化装置の
ブロック図である。 1・・・入力バッファ、2・・・線形予測分析部、3・
・・ピッチ予測分析部、4・・・音源パラメータ抽出部
、5・・・振幅補正部、6・・・音源パラメータ符号部
、7・・・振幅補正符号部、8・・・線形予測符号部、
9・・・ピッチ予測符号部、10・・・入力端子、11
・・・音源パラメータ復号部、12・・・振幅補正復号
部、13・・・ピッチ予測復号部、14・・・線形予測
復号部、15・・・音源再生部、16・・・再生音声生
成部、17・・・出力バッファ、18・・・出力端子、
81・・・ピッチ周期符号器、82・・・補正値符号器
、83・・・パルス符号器、84・・・線形予測符号器
、91・・・補正値復号器、92・・・パルス復号器、
93・・・ピッチ周期復号器、94・・・線形予測復号
器、100・・・入力端子、110・・・入力バッファ
、120・・・線形予測分析器、130・・・ピッチ予
測分析器、140・・・自己相関関数計算器、150・
・・相互相関関数計算器、160・・・パルス探索器、
170・・・振幅補正器、180・・・マルチプレクサ
、190・・・符号出力端子、200・・・符号入力端
子、210・・・デマルチブレフサ、220・・・音源
信号再生器、230・・・音源信号振幅補正器、240
・・・再生音声信号生成器、250・・・出力バッファ
、260・・・出力端子。
Claims (3)
- (1)符号化側では、一定間隔のフレームに分割された
音声信号を入力し、前記入力した音声信号から線形予測
パラメータとピッチ予測パラメータとを抽出し、前記入
力音声信号と前記線形予測パラメータとピッチ予測パラ
メータとを基に前記入力音声信号の特性によって定まる
特定区間の音源パラメータを抽出し、前記入力音声信号
と前記線形予測パラメータとを基に前記音源パラメータ
と前記ピッチ予測パラメータとで定まるフレーム全体に
渡る音源信号の適当な周期毎の振幅特性を求め、前記線
形予測パラメータと前記ピッチ予測パラメータと前記特
定区間の音源パラメータと前記適当な周期毎の振幅特性
とを符号化し、 復号化側では、前記線形予測パラメータと前記ピッチ予
測パラメータと前記特定区間の音源パラメータと前記適
当な周期毎の音源信号の振幅特性とを復号し、前記復号
化されたピッチ予測パラメータと前記復号化された特定
区間の音源パラメータと前記復号化された適当な周期毎
の振幅特性とから音源信号を再生し、前記再生された音
源信号と前記復号化された線形予測パラメータとで再生
音声信号を生成する ことを特徴とする音声符号化復号化方式。 - (2)一定間隔のフレームに分割された音声信号を入力
する手段と、この入力手段で入力した前記音声信号から
線形予測パラメータを抽出する手段と、前記入力手段で
入力した前記音声信号からピッチ予測パラメータを抽出
する手段と、前記入力手段で入力した前記音声信号と前
記線形予測パラメータとピッチ予測パラメータとから前
記入力音声信号の特性によって定まる特定区間の音源パ
ラメータを抽出する手段と、前記音源パラメータと前記
ピッチ予測パラメータとで定まるフレーム全体に渡る音
源信号の適当な周期毎の振幅特性を前記入力音声信号と
前記線形予測パラメータとを基に求める手段と、前記線
形予測パラメータと前記ピッチ予測パラメータと前記特
定区間の音源パラメータと前記適当な周期毎の振幅特性
を符号化する手段とを有することを特徴とする音声符号
化装置。 - (3)一定間隔のフレームに分割された音声信号に関す
る線形予測パラメータを表す符号とピッチ予測パラメー
タを表す符号と特定区間の音源パラメータを表す符号と
適当な周期毎の振幅特性を表す符号とでなる符号列を入
力する手段と、この入力手段で入力した前記符号列から
前記線形予測パラメータを表す符号と前記ピッチ予測パ
ラメータを表す符号と前記特定区間の音源パラメータを
表す符号と前記適当な周期毎の振幅特性を表す符号とを
復号する手段と、この復号手段で復号された前記ピッチ
予測パラメータと前記特定区間の音源パラメータと前記
適当な周期毎の振幅特性とから音源信号を再生する手段
と、この再生手段で再生された前記音源信号と前記復号
手段で復号された前記線形予測パラメータとから再生音
声信号を生成する手段とを有することを特徴とする音声
復号化装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63276508A JPH02120895A (ja) | 1988-10-31 | 1988-10-31 | 音声符号化復号化方式とその装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63276508A JPH02120895A (ja) | 1988-10-31 | 1988-10-31 | 音声符号化復号化方式とその装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02120895A true JPH02120895A (ja) | 1990-05-08 |
Family
ID=17570446
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63276508A Pending JPH02120895A (ja) | 1988-10-31 | 1988-10-31 | 音声符号化復号化方式とその装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02120895A (ja) |
-
1988
- 1988-10-31 JP JP63276508A patent/JPH02120895A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0409239B1 (en) | Speech coding/decoding method | |
| KR100304682B1 (ko) | 음성 코더용 고속 여기 코딩 | |
| JPH04134400A (ja) | 音声符号化装置 | |
| JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
| JPH09152896A (ja) | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 | |
| JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
| JPH0341500A (ja) | 低遅延低ビツトレート音声コーダ | |
| JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
| JP2615548B2 (ja) | 高能率音声符号化方式とその装置 | |
| JP3050978B2 (ja) | 音声符号化方法 | |
| JPH02120895A (ja) | 音声符号化復号化方式とその装置 | |
| KR100556278B1 (ko) | 벡터탐색방법 | |
| JP3232701B2 (ja) | 音声符号化方法 | |
| JPH0283600A (ja) | 音声符号化・復号化方式 | |
| JP2000298500A (ja) | 音声符号化方法 | |
| JPH0573097A (ja) | 低遅延符号駆動形予測符号化方法 | |
| JP2946528B2 (ja) | 音声符号化復号化方法及びその装置 | |
| JP2853170B2 (ja) | 音声符号化復号化方式 | |
| JP3192051B2 (ja) | 音声符号化装置 | |
| JPH0990997A (ja) | 音声符号化装置、音声復号化装置、音声符号化復号化方法および複合ディジタルフィルタ | |
| JP3071800B2 (ja) | 適応ポストフィルタ | |
| JPH0612097A (ja) | 音声の予測符号化方法および装置 | |
| JP2775533B2 (ja) | 音声の長期予測装置 | |
| JPH10232697A (ja) | 音声符号化方法および復号化方法 | |
| JPH0426119B2 (ja) |