JPH0934498A - 音響信号符号化方法 - Google Patents
音響信号符号化方法Info
- Publication number
- JPH0934498A JPH0934498A JP7185625A JP18562595A JPH0934498A JP H0934498 A JPH0934498 A JP H0934498A JP 7185625 A JP7185625 A JP 7185625A JP 18562595 A JP18562595 A JP 18562595A JP H0934498 A JPH0934498 A JP H0934498A
- Authority
- JP
- Japan
- Prior art keywords
- excitation signal
- noise
- signal
- noise excitation
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 雑音励振信号の選択演算量を減少する。
【解決手段】 ピッチ励振信号pを選択後に、合成フィ
ルタのインパルス応答を要素とする行列HとHt H=R
を算出部31で求め、そのH,Rと、前記pと入力音声
sとからΨを算出部32で求め、予備選択部33〜37
でグループ0〜4における各8つのパルス位置lj とそ
の極性aj についてΨのベクトル要素ψ(i)について
aj ψ(lj )をそれぞれ算出し、aj ψ(lj )の値
の大きな順に、例えば3個のパルス位置をそれぞれ予備
選択し、これらグループ0〜4中の3位置から各1つを
選択した5パルスの雑音励振信号cを候補作成部38で
作成し、その各cについてΨcの算出、更にsに対する
歪を算出し、最適雑音励振信号を選択する。
ルタのインパルス応答を要素とする行列HとHt H=R
を算出部31で求め、そのH,Rと、前記pと入力音声
sとからΨを算出部32で求め、予備選択部33〜37
でグループ0〜4における各8つのパルス位置lj とそ
の極性aj についてΨのベクトル要素ψ(i)について
aj ψ(lj )をそれぞれ算出し、aj ψ(lj )の値
の大きな順に、例えば3個のパルス位置をそれぞれ予備
選択し、これらグループ0〜4中の3位置から各1つを
選択した5パルスの雑音励振信号cを候補作成部38で
作成し、その各cについてΨcの算出、更にsに対する
歪を算出し、最適雑音励振信号を選択する。
Description
【0001】
【発明の属する技術分野】この発明は音声や音楽などの
音響信号を、ピッチ成分を表現するピッチ励振信号と雑
音成分を表現する雑音励振信号の合成フィルタを駆動し
て音響信号を再生することを利用して音響信号を符号化
する方法に関する。
音響信号を、ピッチ成分を表現するピッチ励振信号と雑
音成分を表現する雑音励振信号の合成フィルタを駆動し
て音響信号を再生することを利用して音響信号を符号化
する方法に関する。
【0002】
【従来の技術】2個の励振信号を用いて合成フィルタを
駆動する音響信号符号化方法としてはVSELP、CS
−CELPその他の方法が知られている。これらは、I.
A. Gerson and M. A. Jasiuk:“Vector Sum Excited L
inear Prediction (VSELP) Speech Coding at 8kb/s",
Proc. IEEE ICASSP '90, pp.461-464 (1990)(文献1)
あるいは A. Kataoka, T. Moriya and S. Hayashi:“An
8-kbit/s Speech CoderBasedon Conjugate Structure
CELP", Proc. IEEE ICASSP '93, pp.592-595 (1993)
(文献2)その他の文献に開示されている。
駆動する音響信号符号化方法としてはVSELP、CS
−CELPその他の方法が知られている。これらは、I.
A. Gerson and M. A. Jasiuk:“Vector Sum Excited L
inear Prediction (VSELP) Speech Coding at 8kb/s",
Proc. IEEE ICASSP '90, pp.461-464 (1990)(文献1)
あるいは A. Kataoka, T. Moriya and S. Hayashi:“An
8-kbit/s Speech CoderBasedon Conjugate Structure
CELP", Proc. IEEE ICASSP '93, pp.592-595 (1993)
(文献2)その他の文献に開示されている。
【0003】ここで、図3を参照してこの種の音声符号
化方法の従来例を説明する。ただし同図は説明の簡単の
ため主な信号の流れのみを記載したものである。まず、
入力端子1から入力される入力音声波形のサンプリング
値系列がフィルタ係数決定部2に供給され、ここにおい
て線形予測分析などによりフィルタ係数が計算される。
フィルタ係数決定部2において計算されたフィルタ係数
は、次いでフィルタ係数量子化部3に供給され、フィル
タ係数はここにおいて量子化され、量子化されたフィル
タ係数は合成フィルタ4に供給され、ここに合成フィル
タ4のフィルタ係数が設定される。
化方法の従来例を説明する。ただし同図は説明の簡単の
ため主な信号の流れのみを記載したものである。まず、
入力端子1から入力される入力音声波形のサンプリング
値系列がフィルタ係数決定部2に供給され、ここにおい
て線形予測分析などによりフィルタ係数が計算される。
フィルタ係数決定部2において計算されたフィルタ係数
は、次いでフィルタ係数量子化部3に供給され、フィル
タ係数はここにおいて量子化され、量子化されたフィル
タ係数は合成フィルタ4に供給され、ここに合成フィル
タ4のフィルタ係数が設定される。
【0004】この合成フィルタ4を駆動する励振信号は
2個の励振信号より成る。励振信号のうちの一方はピッ
チ符号帳11の出力であり、他方は雑音符号帳21の出
力である。このピッチ符号帳11は合成フィルタ4に対
する過去の励振信号について複数のピッチ周期で取出さ
れた成分であり、選択されたピッチ周期成分候補はピッ
チ利得乗算部12においてピッチ利得が乗算されて出力
される。雑音符号帳21は複数の雑音波形成分より成
り、選択された雑音波形候補は雑音利得乗算部22にお
いて雑音利得が乗算されて出力される。合成フィルタ4
はピッチ利得乗算部12の出力と雑音利得乗算部22の
出力とを加算部8で加算したものにより励振駆動され
る。
2個の励振信号より成る。励振信号のうちの一方はピッ
チ符号帳11の出力であり、他方は雑音符号帳21の出
力である。このピッチ符号帳11は合成フィルタ4に対
する過去の励振信号について複数のピッチ周期で取出さ
れた成分であり、選択されたピッチ周期成分候補はピッ
チ利得乗算部12においてピッチ利得が乗算されて出力
される。雑音符号帳21は複数の雑音波形成分より成
り、選択された雑音波形候補は雑音利得乗算部22にお
いて雑音利得が乗算されて出力される。合成フィルタ4
はピッチ利得乗算部12の出力と雑音利得乗算部22の
出力とを加算部8で加算したものにより励振駆動され
る。
【0005】歪計算部5は、入力端子1を介して入力さ
れる入力音声信号と合成フィルタ4から出力される合成
音声信号との間の差が減算部9でとられ、その差である
歪が最も小さくなるように両符号帳11,21中の各励
振成分候補を選択し、同時に各励振成分候補に対して最
適な利得を設定する。符号出力部6は、フィルタ係数量
子化部3から供給される量子化されたフィルタ係数、歪
計算部5において選択された各符号帳11,21の選択
された各候補利得部12,22の利得をそれぞれ符号化
して出力する。これらの符号は出力端子7を介して伝送
又は蓄積される。通常はピッチ励振信号を選択した後、
雑音波形励振信号を選択する。
れる入力音声信号と合成フィルタ4から出力される合成
音声信号との間の差が減算部9でとられ、その差である
歪が最も小さくなるように両符号帳11,21中の各励
振成分候補を選択し、同時に各励振成分候補に対して最
適な利得を設定する。符号出力部6は、フィルタ係数量
子化部3から供給される量子化されたフィルタ係数、歪
計算部5において選択された各符号帳11,21の選択
された各候補利得部12,22の利得をそれぞれ符号化
して出力する。これらの符号は出力端子7を介して伝送
又は蓄積される。通常はピッチ励振信号を選択した後、
雑音波形励振信号を選択する。
【0006】ところで、前記雑音符号帳21よりの雑音
波形成分を、複数のパルスにより表現した音声符号化方
法として、ACELPが知られている。これは文献 R.
Salami, C. Laflamme and J-P. Adoul: "ACELP Speech
Coderat 8kbit/s with 10msFrame: A Candidate for CC
ITT Standardization", Proc. IEEE Workshop on Speec
h Coding, pp. 23-24(1993)(文献3)その他の文献に
開示されている。この方法は5msの時間長の雑音励振
信号を4ないし5個の振幅一定のパルス列により表現
し、雑音励振信号はこれらのパルスの位置およびその極
性により特定するものであり、雑音励振波形の候補の格
納に必要とされるメモリを不要としている。
波形成分を、複数のパルスにより表現した音声符号化方
法として、ACELPが知られている。これは文献 R.
Salami, C. Laflamme and J-P. Adoul: "ACELP Speech
Coderat 8kbit/s with 10msFrame: A Candidate for CC
ITT Standardization", Proc. IEEE Workshop on Speec
h Coding, pp. 23-24(1993)(文献3)その他の文献に
開示されている。この方法は5msの時間長の雑音励振
信号を4ないし5個の振幅一定のパルス列により表現
し、雑音励振信号はこれらのパルスの位置およびその極
性により特定するものであり、雑音励振波形の候補の格
納に必要とされるメモリを不要としている。
【0007】図4を用いて従来の雑音励振信号としての
パルスを選択する方法を説明する。図3に示した場合と
同様にして選択されたピッチ励振信号が端子13から加
算部8に入力され、雑音励振作成部14から雑音励振信
号候補として複数のパルスの組み合わせが加算部8へ供
給され、その出力が、図3の量子化部3よりのフィルタ
係数が端子15を通じて設定されている合成フィルタ4
に通され、その出力と入力音声信号との差が歪計算部5
へ供給され誤差信号のパワーが最小になるように雑音励
振作成部14が制御され、誤差パワーが最小となるパル
ス位置、その各極性を符号化して出力する。
パルスを選択する方法を説明する。図3に示した場合と
同様にして選択されたピッチ励振信号が端子13から加
算部8に入力され、雑音励振作成部14から雑音励振信
号候補として複数のパルスの組み合わせが加算部8へ供
給され、その出力が、図3の量子化部3よりのフィルタ
係数が端子15を通じて設定されている合成フィルタ4
に通され、その出力と入力音声信号との差が歪計算部5
へ供給され誤差信号のパワーが最小になるように雑音励
振作成部14が制御され、誤差パワーが最小となるパル
ス位置、その各極性を符号化して出力する。
【0008】ところが、この方法は複数のパルスの組み
合わせで雑音励振波形を表現するため非常に多くの雑音
励振信号候補が存在し、最適な雑音励振信号候補を決定
するためには多数回の演算処理を必要とする。即ち図4
に於いて雑音励振信号作成、合成フィルタ、誤差パワー
算出の処理を全ての雑音励振信号候補について行う必要
があり、このため多くの演算処理が必要となる。
合わせで雑音励振波形を表現するため非常に多くの雑音
励振信号候補が存在し、最適な雑音励振信号候補を決定
するためには多数回の演算処理を必要とする。即ち図4
に於いて雑音励振信号作成、合成フィルタ、誤差パワー
算出の処理を全ての雑音励振信号候補について行う必要
があり、このため多くの演算処理が必要となる。
【0009】さらに、雑音励振信号を特定する際に、各
雑音励振信号候補を、事前に決定されたピッチ励振信号
に対して直交化して選択する方法が知られている。この
方法は雑音励振信号の特定に際して事前に決定したピッ
チ励振信号の影響をゼロとすることができ、より高精度
に雑音励振信号の特定を可能にする。これは I. A. Ger
son and M. A. Jasiuk; “Vector Sum Excited Linear
Prediction (VSELP) Speech Coding at 8kb/s", Proc.
IEEE ICASSP '90, pp.461-464(1990)(文献4)その他の
文献に開示されている。
雑音励振信号候補を、事前に決定されたピッチ励振信号
に対して直交化して選択する方法が知られている。この
方法は雑音励振信号の特定に際して事前に決定したピッ
チ励振信号の影響をゼロとすることができ、より高精度
に雑音励振信号の特定を可能にする。これは I. A. Ger
son and M. A. Jasiuk; “Vector Sum Excited Linear
Prediction (VSELP) Speech Coding at 8kb/s", Proc.
IEEE ICASSP '90, pp.461-464(1990)(文献4)その他の
文献に開示されている。
【0010】図5を用いてこの従来の雑音励振信号の直
交化選択を、図4と同様に選択したピッチ励振信号を用
いて雑音励振信号を選択する場合について説明する。端
子15からフィルタ係数が合成フィルタ4a,4bに設
定され、端子13から選択されたピッチ励振信号が合成
フィルタ4aに入力され、雑音符号帳17から選択され
た複数のパルスよりなる雑音励振信号が合成フィルタ4
bに入力される。合成フィルタ4a,4bより各合成信
号は直交化部18で直交化処理されて歪計算部19に入
力され、端子1からの音声信号に対する誤差パワーが最
小になるように雑音符号帳17の選択が行われる。
交化選択を、図4と同様に選択したピッチ励振信号を用
いて雑音励振信号を選択する場合について説明する。端
子15からフィルタ係数が合成フィルタ4a,4bに設
定され、端子13から選択されたピッチ励振信号が合成
フィルタ4aに入力され、雑音符号帳17から選択され
た複数のパルスよりなる雑音励振信号が合成フィルタ4
bに入力される。合成フィルタ4a,4bより各合成信
号は直交化部18で直交化処理されて歪計算部19に入
力され、端子1からの音声信号に対する誤差パワーが最
小になるように雑音符号帳17の選択が行われる。
【0011】直交化部18で合成雑音成分は、合成ピッ
チ成分と無相関とされているから、歪計算部19では、
この直交化された合成雑音成分と入力音声中の雑音成分
との誤差パワーが最小となる雑音励振信号を選択するこ
とになる。選択されたピッチ励振信号をp、雑音励振信
号候補をc、合成フィルタ4a,4bのインパルス応答
を要素とする行列をHとすると、直交化部18の出力中
の合成雑音成分C0 は前記文献4に示すように、次式で
表わされる。
チ成分と無相関とされているから、歪計算部19では、
この直交化された合成雑音成分と入力音声中の雑音成分
との誤差パワーが最小となる雑音励振信号を選択するこ
とになる。選択されたピッチ励振信号をp、雑音励振信
号候補をc、合成フィルタ4a,4bのインパルス応答
を要素とする行列をHとすると、直交化部18の出力中
の合成雑音成分C0 は前記文献4に示すように、次式で
表わされる。
【0012】C0 =Hc−〔(pt Ht Hc)/(pt
Ht Hp)〕Hp Ht はHの転置を示す。この合成雑音成分C0 と入力音
声信号の時系列ベクトルsの歪みDは次式で求められ
る。 D={s−γc C0 }t {s−γc C0 } この歪Dを最小とする雑音励振信号候補cは次式を最大
にする候補cと等価である。
Ht Hp)〕Hp Ht はHの転置を示す。この合成雑音成分C0 と入力音
声信号の時系列ベクトルsの歪みDは次式で求められ
る。 D={s−γc C0 }t {s−γc C0 } この歪Dを最小とする雑音励振信号候補cは次式を最大
にする候補cと等価である。
【0013】Dsu=(Ψc)2 /{(cRc)(pR
p)−(pRc)2 } R=Ht H Ψ=(pt Rp)st H−(st Hp)pt R 最適雑音励振信号の選択はDsuが最大となるcを求める
ことになる。これらのことは前記文献4に示されてい
る。すべての座音励振信号cについてDsuを計算するこ
とにより最適な雑音励振信号を選択する。
p)−(pRc)2 } R=Ht H Ψ=(pt Rp)st H−(st Hp)pt R 最適雑音励振信号の選択はDsuが最大となるcを求める
ことになる。これらのことは前記文献4に示されてい
る。すべての座音励振信号cについてDsuを計算するこ
とにより最適な雑音励振信号を選択する。
【0014】
【発明が解決しようとする課題】例えば雑音励振信号の
継続時間長(フレーム長)を5msとし、各雑音励振信
号を5個のパルスで表現し、図6に示すように、グルー
プ0〜4はそれぞれフレーム中における決められた8つ
のパルス位置の何れかしかとることができないとされ、
各グループ0〜4からそれぞれその8つのパルス位置の
何れか1つを取出して、5つのパルスよりなる雑音励振
信号とする。その場合、各パルスは+1又は−1の何れ
かの極性をとる。このようにして雑音励振信号が作成さ
れるため、その数は著しく大であり、その各雑音励振信
号についてDsuの式を演算する必要があり、その演算量
が著しく多くなり、時間も長くなる。
継続時間長(フレーム長)を5msとし、各雑音励振信
号を5個のパルスで表現し、図6に示すように、グルー
プ0〜4はそれぞれフレーム中における決められた8つ
のパルス位置の何れかしかとることができないとされ、
各グループ0〜4からそれぞれその8つのパルス位置の
何れか1つを取出して、5つのパルスよりなる雑音励振
信号とする。その場合、各パルスは+1又は−1の何れ
かの極性をとる。このようにして雑音励振信号が作成さ
れるため、その数は著しく大であり、その各雑音励振信
号についてDsuの式を演算する必要があり、その演算量
が著しく多くなり、時間も長くなる。
【0015】この発明は、ピッチ成分を表現するピッチ
励振信号および雑音成分を表現する雑音励振信号の2個
の励振信号を使用して合成フィルタを駆動する音響信号
符号化方法において、雑音励振信号として複数のパルス
で構成される雑音励振信号を用い、少ない演算量で実行
可能な雑音励振信号を選択することができる音響信号符
号化方法を提供することを目的とする。
励振信号および雑音成分を表現する雑音励振信号の2個
の励振信号を使用して合成フィルタを駆動する音響信号
符号化方法において、雑音励振信号として複数のパルス
で構成される雑音励振信号を用い、少ない演算量で実行
可能な雑音励振信号を選択することができる音響信号符
号化方法を提供することを目的とする。
【0016】
【課題を解決するための手段】請求項1の発明によれ
ば、雑音励振信号、入力音響信号、ピッチ励振信号及び
合成フィルタ係数から求められる値を利用して、雑音励
振信号の候補を予備的に複数選択し、これら選択された
各雑音励振信号の候補で合成フィルタを駆動して得られ
る各合成音響信号と入力音響信号との間の歪を求め、そ
の歪を最小とする雑音励振信号を一つ選択する。
ば、雑音励振信号、入力音響信号、ピッチ励振信号及び
合成フィルタ係数から求められる値を利用して、雑音励
振信号の候補を予備的に複数選択し、これら選択された
各雑音励振信号の候補で合成フィルタを駆動して得られ
る各合成音響信号と入力音響信号との間の歪を求め、そ
の歪を最小とする雑音励振信号を一つ選択する。
【0017】請求項2の発明によれば、雑音励振信号、
入力音響信号、ピッチ励振信号及び合成フィルタ係数か
ら求められる値を利用して雑音励振信号を構成するパル
スの位置及び振幅の候補を予備的に複数選択し、これら
選択されたパルス位置により構成される各雑音励振信号
で合成フィルタを駆動して得られる各合成音響信号と入
力音響信号との間の歪を求め、その歪を最小とする雑音
励振信号を一つ選択する。
入力音響信号、ピッチ励振信号及び合成フィルタ係数か
ら求められる値を利用して雑音励振信号を構成するパル
スの位置及び振幅の候補を予備的に複数選択し、これら
選択されたパルス位置により構成される各雑音励振信号
で合成フィルタを駆動して得られる各合成音響信号と入
力音響信号との間の歪を求め、その歪を最小とする雑音
励振信号を一つ選択する。
【0018】更に具体的に述べると、ピッチ成分を表現
するピッチ励振信号および雑音成分を表現する雑音励振
信号の2個の励振信号を使用して合成フィルタを駆動し
て音響信号を再生し、その入力音響信号との歪が最小と
なるピッチ励振信号および雑音励振信号を選択すること
により符号化し、その際に上記雑音励振信号を複数のパ
ルスで表現し、上記合成フィルタの特性を表わす行列
と、ピッチ励振信号と、入力音響信号と、雑音励振信号
とを用いた演算の結果が最大となる雑音励振信号を選択
する方法において、請求項1の発明では上記演算の分子
と対応する項を演算し、その演算結果の大きいものから
順に予め決めた数の雑音励振信号を予備選択し、その予
備選択した雑音励振信号について上記演算の結果の最大
となるものを選択する。
するピッチ励振信号および雑音成分を表現する雑音励振
信号の2個の励振信号を使用して合成フィルタを駆動し
て音響信号を再生し、その入力音響信号との歪が最小と
なるピッチ励振信号および雑音励振信号を選択すること
により符号化し、その際に上記雑音励振信号を複数のパ
ルスで表現し、上記合成フィルタの特性を表わす行列
と、ピッチ励振信号と、入力音響信号と、雑音励振信号
とを用いた演算の結果が最大となる雑音励振信号を選択
する方法において、請求項1の発明では上記演算の分子
と対応する項を演算し、その演算結果の大きいものから
順に予め決めた数の雑音励振信号を予備選択し、その予
備選択した雑音励振信号について上記演算の結果の最大
となるものを選択する。
【0019】請求項2の発明では請求項1の発明におけ
る雑音励振信号の作成を、それぞれパルスのとり得るフ
レーム上の位置が複数個所予め決められた複数のグルー
プから、その各1つのパルス位置を選択し、かつ極性を
与えて作成し、予備選択を、各グループにおけるパルス
位置について、前記最大となる演算の分子と対応する演
算を行い、その各グループにおける演算結果のうち、大
きな順に所定数を選択して行い、その選択されたパルス
位置を、各グループから選択して作成した雑音励振信号
について上記演算の結果が最大となるものを求める。
る雑音励振信号の作成を、それぞれパルスのとり得るフ
レーム上の位置が複数個所予め決められた複数のグルー
プから、その各1つのパルス位置を選択し、かつ極性を
与えて作成し、予備選択を、各グループにおけるパルス
位置について、前記最大となる演算の分子と対応する演
算を行い、その各グループにおける演算結果のうち、大
きな順に所定数を選択して行い、その選択されたパルス
位置を、各グループから選択して作成した雑音励振信号
について上記演算の結果が最大となるものを求める。
【0020】
【発明の実施の形態】簡単のため、入力音声のサンプリ
ング周波数を8000Hz、雑音励振信号の継続時間長
(フレーム長)を5msとし、雑音励振信号を5個のパ
ルスで表現し、かつその第0〜第4パルスは図6に示し
た第0〜第4グループごとにそれぞれ規定されるフレー
ム上の位置にのみ存在することを可能とする。つまり雑
音励振信号はこれら第0〜第4グループから一つづつパ
ルス位置を選択し、さらに各パルスに極性を設定するこ
とにより構成する。ピッチ励振信号の選択は例えば図3
について述べたと同様に行う。この発明では雑音励振信
号の選択に特徴があり、この選択は従来技術の項で説明
したDsuの演算が最大となるものを求めるが、請求項1
の発明では、まず図1Aに示すように、Dsuの式の分子
のΨの算出を、合成フィルタのインパルス応答を要素と
する行列Hと、入力音声信号の時系列ベクトルsと、ピ
ッチ励振信号(ベクトル)pとにより行う(S1 )。次
にこのΨと、図6から求められる全ての雑音励振信号
(ベクトル)cの積を求める(S2 )。Ψのベクトルの
第i要素(i=0,1,2,…39)をψ(i)とし、
雑音励振信号cの5つのパルスの極性をa0 〜a4 、パ
ルス位置をl0 〜l4 とすると、Ψcは次式の演算とな
る。
ング周波数を8000Hz、雑音励振信号の継続時間長
(フレーム長)を5msとし、雑音励振信号を5個のパ
ルスで表現し、かつその第0〜第4パルスは図6に示し
た第0〜第4グループごとにそれぞれ規定されるフレー
ム上の位置にのみ存在することを可能とする。つまり雑
音励振信号はこれら第0〜第4グループから一つづつパ
ルス位置を選択し、さらに各パルスに極性を設定するこ
とにより構成する。ピッチ励振信号の選択は例えば図3
について述べたと同様に行う。この発明では雑音励振信
号の選択に特徴があり、この選択は従来技術の項で説明
したDsuの演算が最大となるものを求めるが、請求項1
の発明では、まず図1Aに示すように、Dsuの式の分子
のΨの算出を、合成フィルタのインパルス応答を要素と
する行列Hと、入力音声信号の時系列ベクトルsと、ピ
ッチ励振信号(ベクトル)pとにより行う(S1 )。次
にこのΨと、図6から求められる全ての雑音励振信号
(ベクトル)cの積を求める(S2 )。Ψのベクトルの
第i要素(i=0,1,2,…39)をψ(i)とし、
雑音励振信号cの5つのパルスの極性をa0 〜a4 、パ
ルス位置をl0 〜l4 とすると、Ψcは次式の演算とな
る。
【0021】Ψc=a0 ψ(l0 )+a1 ψ(l1 )+
…+a4 ψ(l4 ) この演算を各雑音励振信号について実行する。これらΨ
cの値の大きなものから順に、例えば30個程度を予備
選択する(S3 )。この予備選択した雑音励振信号につ
いて前記Dsuの演算をそれぞれ行い(S4 )、最大のD
suとなった雑音励振信号を選択する(S5 )。このよう
に予備選択を行うがDsuの値が大きなものはその分子の
Ψcも大きな値と考えられ、この予備選択によってもそ
の数を適当に選ぶことによって最適の雑音励振信号を落
すおそれはない。
…+a4 ψ(l4 ) この演算を各雑音励振信号について実行する。これらΨ
cの値の大きなものから順に、例えば30個程度を予備
選択する(S3 )。この予備選択した雑音励振信号につ
いて前記Dsuの演算をそれぞれ行い(S4 )、最大のD
suとなった雑音励振信号を選択する(S5 )。このよう
に予備選択を行うがDsuの値が大きなものはその分子の
Ψcも大きな値と考えられ、この予備選択によってもそ
の数を適当に選ぶことによって最適の雑音励振信号を落
すおそれはない。
【0022】次に請求項2の発明の実施例を説明する。
この発明においても雑音励振信号の選択に特徴があり、
この実施例においても、図1Bに示すようにまずΨの演
算を行う(S1 )。この演算は図1Aのそれと同様に行
う。次に図6中の各グループ0〜4ごとに、そのグルー
プに属する、この例では各8つのパルス位置lj (0,
1,…,7)についてそのaj ,lj を用いてΨの要素
aj ψ(lj )を演算する(S2 )。これら各グループ
ごとにaj ψ(lj )の演算結果から大きな順に1乃至
複数個のaj ,lj を取出す(S3 )。これら取出され
たaj ,lj を各グループごとから1つづつ取出して、
作り得る雑音励振信号cを作成する(S 4 )。このよう
にして図6に示したものから作り得る雑音励振信号より
予備選択がなされたことになる。この予備選択された雑
音励振信号を用いてDsuの演算を行い(C5 )、その演
算結果が最大となった雑音励振信号を選択する
(S6 )。
この発明においても雑音励振信号の選択に特徴があり、
この実施例においても、図1Bに示すようにまずΨの演
算を行う(S1 )。この演算は図1Aのそれと同様に行
う。次に図6中の各グループ0〜4ごとに、そのグルー
プに属する、この例では各8つのパルス位置lj (0,
1,…,7)についてそのaj ,lj を用いてΨの要素
aj ψ(lj )を演算する(S2 )。これら各グループ
ごとにaj ψ(lj )の演算結果から大きな順に1乃至
複数個のaj ,lj を取出す(S3 )。これら取出され
たaj ,lj を各グループごとから1つづつ取出して、
作り得る雑音励振信号cを作成する(S 4 )。このよう
にして図6に示したものから作り得る雑音励振信号より
予備選択がなされたことになる。この予備選択された雑
音励振信号を用いてDsuの演算を行い(C5 )、その演
算結果が最大となった雑音励振信号を選択する
(S6 )。
【0023】この図1Bに示した実施例を機能的に示す
と図2のようになる。つまり端子15からの合成フィル
タ係数によりR,H算出部31でHとRが算出され、こ
れらと端子1からの入力音声s及び端子13からのピッ
チ励振信号pとからΨ算出部32でΨが算出される。予
備選択部33〜37でそれぞれグループ0〜4における
各aj ψ(lj )の値が算出され、各グループにおいて
aj ψ(lj )の値の大きい順にaj ,lj をそれぞれ
例えば3個づつ選択する。
と図2のようになる。つまり端子15からの合成フィル
タ係数によりR,H算出部31でHとRが算出され、こ
れらと端子1からの入力音声s及び端子13からのピッ
チ励振信号pとからΨ算出部32でΨが算出される。予
備選択部33〜37でそれぞれグループ0〜4における
各aj ψ(lj )の値が算出され、各グループにおいて
aj ψ(lj )の値の大きい順にaj ,lj をそれぞれ
例えば3個づつ選択する。
【0024】雑音励振信号候補作成部38で予備選択部
33〜37でそれぞれ選択されたa j ,lj から1つず
つ取出して、その全ての組み合せを作り、これらを雑音
励振信号候補とし、これらのそれぞれに対し、Ψ算出部
32で得たΨをΨc算出部39で乗算し、これら各Ψc
の乗算結果と、Rとpと雑音励振信号候補作成部38で
作成された対応するcとにより歪算出部41でそれぞれ
Dsuの演算がなされ、その演算結果が最大となった雑音
励振信号候補を最適励振信号候補選択部42で選択して
出力する。
33〜37でそれぞれ選択されたa j ,lj から1つず
つ取出して、その全ての組み合せを作り、これらを雑音
励振信号候補とし、これらのそれぞれに対し、Ψ算出部
32で得たΨをΨc算出部39で乗算し、これら各Ψc
の乗算結果と、Rとpと雑音励振信号候補作成部38で
作成された対応するcとにより歪算出部41でそれぞれ
Dsuの演算がなされ、その演算結果が最大となった雑音
励振信号候補を最適励振信号候補選択部42で選択して
出力する。
【0025】この請求項2の発明において請求項1の発
明の場合と同様に、Ψcが大きいことはその構成要素a
0 ψ(l0 ),a1 ψ(l1 ),…,a4 ψ(l4 )の
それぞれも大きいはずであるから、各グループからaj
ψ(lj )が大きな値となるものを予備選択しても、正
しく最適な雑音励振信号を選択することができる。
明の場合と同様に、Ψcが大きいことはその構成要素a
0 ψ(l0 ),a1 ψ(l1 ),…,a4 ψ(l4 )の
それぞれも大きいはずであるから、各グループからaj
ψ(lj )が大きな値となるものを予備選択しても、正
しく最適な雑音励振信号を選択することができる。
【0026】
【発明の効果】以上述べたように請求項1の発明によれ
ばΨcを演算し、それが大きな値となるcを予備選択
し、その予備選択したcについてのみDsuを演算するた
め、全てのcについてDsuを演算するより演算量が少な
くなる。請求項2の発明によれば、aj ψ(lj )を演
算し、各グループ中のaj ,l j の数を減少させて、こ
れより作成した雑音励振信号cについてDsuを演算する
ため、すべてのcについてDsuを演算するよりも演算量
が少なくなる。例えば各グループから3個のパルス位置
を予備選択する場合はこれらより作られる雑音励振信号
の数は35 =243個であり、この予備選択をしない場
合の数85 個よりも著しく少なくなり、処理量が多い歪
算出(Dsuの演算)回数がそれだけ減少し、その効果は
著しい。
ばΨcを演算し、それが大きな値となるcを予備選択
し、その予備選択したcについてのみDsuを演算するた
め、全てのcについてDsuを演算するより演算量が少な
くなる。請求項2の発明によれば、aj ψ(lj )を演
算し、各グループ中のaj ,l j の数を減少させて、こ
れより作成した雑音励振信号cについてDsuを演算する
ため、すべてのcについてDsuを演算するよりも演算量
が少なくなる。例えば各グループから3個のパルス位置
を予備選択する場合はこれらより作られる雑音励振信号
の数は35 =243個であり、この予備選択をしない場
合の数85 個よりも著しく少なくなり、処理量が多い歪
算出(Dsuの演算)回数がそれだけ減少し、その効果は
著しい。
【0027】図7に、各グループよりのパルス位置選択
数を変化させた時の、雑音励振信号選択に必要な演算量
と、再生音声の品質とを示す。選択数が1の場合は作成
される雑音励振信号は1個であり、それが選択された雑
音励振信号となる。選択数が8の場合は、予備選択を行
わない従来の手法であり、この場合、演算量が著しく多
くなっている。再生音声品質は値が大きい程、よいこと
を示し、従って本来は選択数が多くなる程、良くなるべ
きであるが、それ程変化がなかった。このことは、この
予備選択は可なり正しく行われることを示しているとも
言える。
数を変化させた時の、雑音励振信号選択に必要な演算量
と、再生音声の品質とを示す。選択数が1の場合は作成
される雑音励振信号は1個であり、それが選択された雑
音励振信号となる。選択数が8の場合は、予備選択を行
わない従来の手法であり、この場合、演算量が著しく多
くなっている。再生音声品質は値が大きい程、よいこと
を示し、従って本来は選択数が多くなる程、良くなるべ
きであるが、それ程変化がなかった。このことは、この
予備選択は可なり正しく行われることを示しているとも
言える。
【0028】上述ではこの発明を音声信号の符号化に適
用したが、音響信号の符号化にも適用できる。
用したが、音響信号の符号化にも適用できる。
【図1】Aは請求項1の発明の実施例の要部を示す流れ
図、Bは請求項2の発明の実施例の要部を示す流れ図で
ある。
図、Bは請求項2の発明の実施例の要部を示す流れ図で
ある。
【図2】請求項2の発明の実施例の要部を機能的に示し
たブロック図。
たブロック図。
【図3】従来のCELP符号化法を機能的に示すブロッ
ク図。
ク図。
【図4】従来のACELP符号化法の一部を機能的に示
すブロック図。
すブロック図。
【図5】雑音励振信号をピッチ励振信号に対して直交化
し雑音励振信号を選択する従来の手法を機能的に示すブ
ロック図。
し雑音励振信号を選択する従来の手法を機能的に示すブ
ロック図。
【図6】雑音励振信号作用の各グループのパルス位置の
例を示す図。
例を示す図。
【図7】グループからの予備選択数と演算量と再生音声
品質との関係を示す図。
品質との関係を示す図。
Claims (2)
- 【請求項1】 入力音響信号から得た量子化フィルタ係
数の設定された合成フィルタを、ピッチ成分を表現する
ピッチ励振信号と雑音成分を表現する雑音励振信号の2
個の励振信号からなる時系列ベクトル成分によりフレー
ム単位ごとに駆動して音響信号を再生することを利用し
て音響信号を符号化し、かつ前記雑音励振信号を少数の
パルスで表現し、その各パルスの位置及び振幅を符号化
する音響信号符号化方法において、 前記雑音励振信号、前記入力音響信号、前記ピッチ励振
信号及び前記合成フィルタ係数から求められる値を利用
して前記雑音励振信号の候補を予備的に複数選択し、 さらにここで選択された前記各雑音励振信号の候補で前
記合成フィルタを駆動して得られる各合成音響信号と入
力音響信号との間の歪を求め、 前記歪を最小とする雑音励振信号を唯一つ選択すること
を特徴とする音響信号符号化方法。 - 【請求項2】 入力音響信号から得た量子化フィルタ係
数の設定された合成フィルタを、ピッチ成分を表現する
ピッチ励振信号と雑音成分を表現する雑音励振信号の2
個の励振信号からなる時系列ベクトル成分によりフレー
ム単位ごとに駆動して音響信号を再生することを利用し
て音響信号を符号化し、かつ前記雑音励振信号を少数の
パルスで表現し、その各パルスの位置及び振幅を符号化
する音響信号符号化方法において、 前記雑音励振信号、前記入力音響信号、前記ピッチ励振
信号及び前記合成フィルタ係数から求められる値を利用
して前記雑音励振信号を構成するパルスの位置及び振幅
の候補を予備的に複数選択し、 さらにここで選択されたパルス位置により構成される前
記各雑音励振信号で前記合成フィルタを駆動して得られ
る各合成音響信号と入力音響信号との間の歪を求め、前
記歪を最小とする雑音励振信号を一つ選択することを特
徴とする音響信号符号化方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7185625A JPH0934498A (ja) | 1995-07-21 | 1995-07-21 | 音響信号符号化方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7185625A JPH0934498A (ja) | 1995-07-21 | 1995-07-21 | 音響信号符号化方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0934498A true JPH0934498A (ja) | 1997-02-07 |
Family
ID=16174068
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7185625A Pending JPH0934498A (ja) | 1995-07-21 | 1995-07-21 | 音響信号符号化方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0934498A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6415254B1 (en) | 1997-10-22 | 2002-07-02 | Matsushita Electric Industrial Co., Ltd. | Sound encoder and sound decoder |
-
1995
- 1995-07-21 JP JP7185625A patent/JPH0934498A/ja active Pending
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6415254B1 (en) | 1997-10-22 | 2002-07-02 | Matsushita Electric Industrial Co., Ltd. | Sound encoder and sound decoder |
| US7024356B2 (en) | 1997-10-22 | 2006-04-04 | Matsushita Electric Industrial Co., Ltd. | Speech coder and speech decoder |
| US7373295B2 (en) | 1997-10-22 | 2008-05-13 | Matsushita Electric Industrial Co., Ltd. | Speech coder and speech decoder |
| US7499854B2 (en) | 1997-10-22 | 2009-03-03 | Panasonic Corporation | Speech coder and speech decoder |
| US7533016B2 (en) | 1997-10-22 | 2009-05-12 | Panasonic Corporation | Speech coder and speech decoder |
| US7546239B2 (en) | 1997-10-22 | 2009-06-09 | Panasonic Corporation | Speech coder and speech decoder |
| US7590527B2 (en) | 1997-10-22 | 2009-09-15 | Panasonic Corporation | Speech coder using an orthogonal search and an orthogonal search method |
| US7925501B2 (en) | 1997-10-22 | 2011-04-12 | Panasonic Corporation | Speech coder using an orthogonal search and an orthogonal search method |
| US8332214B2 (en) | 1997-10-22 | 2012-12-11 | Panasonic Corporation | Speech coder and speech decoder |
| US8352253B2 (en) | 1997-10-22 | 2013-01-08 | Panasonic Corporation | Speech coder and speech decoder |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3112681B2 (ja) | 音声符号化方式 | |
| US6208957B1 (en) | Voice coding and decoding system | |
| JP3094908B2 (ja) | 音声符号化装置 | |
| JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
| US6408268B1 (en) | Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method | |
| US6094630A (en) | Sequential searching speech coding device | |
| JP3095133B2 (ja) | 音響信号符号化方法 | |
| CA1305796C (en) | Method and apparatus for multi-pulse speech coding | |
| JPH0934498A (ja) | 音響信号符号化方法 | |
| JP3303580B2 (ja) | 音声符号化装置 | |
| JP2538450B2 (ja) | 音声の励振信号符号化・復号化方法 | |
| JP2956068B2 (ja) | 音声符号化復号化方式 | |
| JP3583945B2 (ja) | 音声符号化方法 | |
| JP2943983B1 (ja) | 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳 | |
| JP4510977B2 (ja) | 音声符号化方法および音声復号化方法とその装置 | |
| JP4191502B2 (ja) | 信号符号化方法、およびこれらの装置、並びに信号符号化プログラム | |
| JPH02282800A (ja) | 音声符号化方式 | |
| JP3192051B2 (ja) | 音声符号化装置 | |
| JP2947788B1 (ja) | 音声および音響信号の高速な符号化方法および装置および記録媒体 | |
| JPH09146599A (ja) | 音声符号化装置 | |
| JP3192999B2 (ja) | 音声符号化方法および音声符号化方法 | |
| JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
| JP3103108B2 (ja) | 音声符号化装置 | |
| JP3229784B2 (ja) | 音声符号化復号化装置及び音声復号化装置 | |
| JP3236850B2 (ja) | 音源ベクトル生成装置及び音源ベクトル生成方法 |