JPH02280200A - 音声符号化復号化方式 - Google Patents
音声符号化復号化方式Info
- Publication number
- JPH02280200A JPH02280200A JP1100113A JP10011389A JPH02280200A JP H02280200 A JPH02280200 A JP H02280200A JP 1100113 A JP1100113 A JP 1100113A JP 10011389 A JP10011389 A JP 10011389A JP H02280200 A JPH02280200 A JP H02280200A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- sound source
- source signal
- amplitude
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 18
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 18
- 238000001228 spectrum Methods 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 38
- 230000003595 spectral effect Effects 0.000 claims description 34
- 230000005236 sound signal Effects 0.000 claims description 27
- 238000012937 correction Methods 0.000 claims description 19
- 239000002131 composite material Substances 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 32
- 230000004044 response Effects 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 8
- 238000005311 autocorrelation function Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 241001494479 Pecora Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、音声信号を低いビットレート、特に4.8k
b/s程度で、比較的少ない演算量により高品質に符号
化し復号化するための音声符号化復号化方式に関する。
b/s程度で、比較的少ない演算量により高品質に符号
化し復号化するための音声符号化復号化方式に関する。
音声信号を4.8kb/s程度の低いピントレートで符
号化する方式としては、例えば特願昭59−27243
5号明細書(文献1)や特願昭60−178911号明
細書(文献2)等に記載されているピッチ補間マルチパ
ルス法が知られている。この方法によれば、送信側では
、フレーム毎の音声信号から音声信号のスペクトル特性
を表すスペクトルパラメータとピッチを表すピンチパラ
メータとを抽出し、音声信号の有声区間では、1フレー
ムの音源信号を、1フレームをピッチ区間毎に分割した
複数個のピッチ区間のうちの一つのピッチ区間(代表区
間)についてマルチパルスで表し、代表区間におけるマ
ルチパルスの振幅1位相と、スペクトル、ピッチパラメ
ータを伝送する。また無声区間では、1フレームの音源
を少数のマルチパルスと雑音信号で表し、マルチパルス
の振幅1位相と、雑音信号のゲイン、インデックスを伝
送する。
号化する方式としては、例えば特願昭59−27243
5号明細書(文献1)や特願昭60−178911号明
細書(文献2)等に記載されているピッチ補間マルチパ
ルス法が知られている。この方法によれば、送信側では
、フレーム毎の音声信号から音声信号のスペクトル特性
を表すスペクトルパラメータとピッチを表すピンチパラ
メータとを抽出し、音声信号の有声区間では、1フレー
ムの音源信号を、1フレームをピッチ区間毎に分割した
複数個のピッチ区間のうちの一つのピッチ区間(代表区
間)についてマルチパルスで表し、代表区間におけるマ
ルチパルスの振幅1位相と、スペクトル、ピッチパラメ
ータを伝送する。また無声区間では、1フレームの音源
を少数のマルチパルスと雑音信号で表し、マルチパルス
の振幅1位相と、雑音信号のゲイン、インデックスを伝
送する。
受信側においては、有声区間では、現フレームの代表区
間のマルチパルスと隣接フレームの代表区間のマルチパ
ルスとを用いてマルチパルス同士の振幅と位相を補間し
て、代表区間以外のピッチ区間のマルチパルスを復元し
フレームの駆動音源信号を復元す乞。また、無声区間で
は、マルチパルスと雑音信号のインデンクス、ゲインを
用いてフレームの駆動音源信号を復元する。さらに、復
元した駆動音源信号を、スペクトルパラメータを用いた
合成フィルタに入力して合成音声信号を出力する。
間のマルチパルスと隣接フレームの代表区間のマルチパ
ルスとを用いてマルチパルス同士の振幅と位相を補間し
て、代表区間以外のピッチ区間のマルチパルスを復元し
フレームの駆動音源信号を復元す乞。また、無声区間で
は、マルチパルスと雑音信号のインデンクス、ゲインを
用いてフレームの駆動音源信号を復元する。さらに、復
元した駆動音源信号を、スペクトルパラメータを用いた
合成フィルタに入力して合成音声信号を出力する。
(発明が解決しようとする課題)
上述した従来方式によれば、有声区間では代表区間にた
てた少数のマルチパルスと隣接フレームの代表区間にお
けるマルチパルスとを補間して音源信号を表していた。
てた少数のマルチパルスと隣接フレームの代表区間にお
けるマルチパルスとを補間して音源信号を表していた。
しかるにマルチパルスの振幅2位相を符号化するのに、
1パルス当り合計で10ビット程度のビット数が必要で
ある。従って、4.8kb/s程度のピントレートに適
用するためには代表区間のマルチパルスの個数を通常4
個程度と少なくする必要がある。従ってこのように少な
い個数では音源信号の近似度が十分ではなく、特にピッ
チ周期の長い男性話者では音質が劣化するという問題点
があった。さらに従来方式では、代表区間以外のピッチ
区間は代表区間のパルス同士を線形補間して音源信号を
復元していたが、パルスには振幅と位相の2種のパラメ
ータがあり相互に関係しているため、これらを独立に補
間すると特性が低下するという問題点があった。
1パルス当り合計で10ビット程度のビット数が必要で
ある。従って、4.8kb/s程度のピントレートに適
用するためには代表区間のマルチパルスの個数を通常4
個程度と少なくする必要がある。従ってこのように少な
い個数では音源信号の近似度が十分ではなく、特にピッ
チ周期の長い男性話者では音質が劣化するという問題点
があった。さらに従来方式では、代表区間以外のピッチ
区間は代表区間のパルス同士を線形補間して音源信号を
復元していたが、パルスには振幅と位相の2種のパラメ
ータがあり相互に関係しているため、これらを独立に補
間すると特性が低下するという問題点があった。
本発明の目的は、上述した問題点を解決し、比較的少な
い演算量により4.8kb/s程度で音質の良好な音声
符号化復号化方式を提供することにある。
い演算量により4.8kb/s程度で音質の良好な音声
符号化復号化方式を提供することにある。
第1の発明である音声符号化復号化方式は、送信側では
、人力した離散的な音声信号から、スペクトル包絡を表
すスペクトルパラメータとピンチを表すピッチパラメー
タとを予め定められた時間長のフレーム毎に求め、前記
フレームのF声ff 号を前記ピッチパラメータから求
めたピッチ周期に応じたピッチ区間毎に分割し、前記ピ
ッチ区間の内の1つのピッチ区間の音源信号を少数のパ
ルスと前記音源信号の特性を表すコードブックとで表し
、前記音声信号と前記パルスと前記コードブックにより
得られる合成信号との誤差を小さくするように前記パル
スの振幅と位相を求め、前記コードブックからΔつのコ
ードワードを選択し、前記ピンチパラメータと前記スペ
クトルパラメータと前記パルスの振幅1位相と前記コー
ドワードを表すインデックスとを出力し、受信側では、
前記バルスの振幅1位相と前記インデックスとを用いて
前記ピッチ区間の音源信号を発生し、さらに補間により
他のピッチ区間の音源信号を復元し、前記スペクトルパ
ラメータを用いて構成した合成フィルタを駆動して合成
音声を求め出力することを特徴とする。
、人力した離散的な音声信号から、スペクトル包絡を表
すスペクトルパラメータとピンチを表すピッチパラメー
タとを予め定められた時間長のフレーム毎に求め、前記
フレームのF声ff 号を前記ピッチパラメータから求
めたピッチ周期に応じたピッチ区間毎に分割し、前記ピ
ッチ区間の内の1つのピッチ区間の音源信号を少数のパ
ルスと前記音源信号の特性を表すコードブックとで表し
、前記音声信号と前記パルスと前記コードブックにより
得られる合成信号との誤差を小さくするように前記パル
スの振幅と位相を求め、前記コードブックからΔつのコ
ードワードを選択し、前記ピンチパラメータと前記スペ
クトルパラメータと前記パルスの振幅1位相と前記コー
ドワードを表すインデックスとを出力し、受信側では、
前記バルスの振幅1位相と前記インデックスとを用いて
前記ピッチ区間の音源信号を発生し、さらに補間により
他のピッチ区間の音源信号を復元し、前記スペクトルパ
ラメータを用いて構成した合成フィルタを駆動して合成
音声を求め出力することを特徴とする。
第2の発明である音声符号化復号化方式は、送信側では
、入力した離散的な音声信号から、スペクトル包絡を表
すスペクトルパラメータとピッチを表すピッチパラメー
タとを予め定められた時間長のフレーム毎に求め、前記
フレームの音声信号を前記ピッチパラメータから求めた
ピッチ周期に応じたピッチ区間毎に分割し、前記ピッチ
区間の内の1つのピッチ区間の音源信号を少数のパルス
と前記音源信号の特性を表すコードブックとで表し、さ
らに前記ピッチ区間以外の他のピッチ区間では前記パル
スの振幅1位相の少なくとも一方を補正する補正係数を
求め、前記ピッチパラメータと前記スペクトルパラメー
タと前記パルスの振幅。
、入力した離散的な音声信号から、スペクトル包絡を表
すスペクトルパラメータとピッチを表すピッチパラメー
タとを予め定められた時間長のフレーム毎に求め、前記
フレームの音声信号を前記ピッチパラメータから求めた
ピッチ周期に応じたピッチ区間毎に分割し、前記ピッチ
区間の内の1つのピッチ区間の音源信号を少数のパルス
と前記音源信号の特性を表すコードブックとで表し、さ
らに前記ピッチ区間以外の他のピッチ区間では前記パル
スの振幅1位相の少なくとも一方を補正する補正係数を
求め、前記ピッチパラメータと前記スペクトルパラメー
タと前記パルスの振幅。
位相と前記コードブックの選択されたコードワードを表
すインデックスと前記補正係数を出力し、受信側では、
前記パルスの振幅1位相と前記コードワードのインデッ
クスとを用いて前記ピッチ区間の音源信号を発生し、さ
らに他のピッチ区間では前記ピッチ区間の音源信号と前
記補正係数を用いて音源信号を復元し、前記復元した音
源信号により前記スペクトルパラメータを用いて構成し
た合成フィルタを駆動して合成音声を求めて出力するこ
とを特徴とする。
すインデックスと前記補正係数を出力し、受信側では、
前記パルスの振幅1位相と前記コードワードのインデッ
クスとを用いて前記ピッチ区間の音源信号を発生し、さ
らに他のピッチ区間では前記ピッチ区間の音源信号と前
記補正係数を用いて音源信号を復元し、前記復元した音
源信号により前記スペクトルパラメータを用いて構成し
た合成フィルタを駆動して合成音声を求めて出力するこ
とを特徴とする。
本発明による音声符号化復号化方式は、有声区間におい
て、第3図のブロック図に示すように、フレーム(通常
20m5程度)内のピッチ区間の音源信号を、振幅及び
位相を与えるための少数のパルスを発生するパルス発生
部700と、音源信号のスペクトル包絡を表すフィルタ
のインパルス応答、あるいはフィル汐の係数のコードブ
ック720から一つを選択して音源信号を形成する音源
信号形成部710により表すことを特徴とする。さらに
このようにして表した音源信号により合成フィルタ73
0を駆動して再生音声を得る。
て、第3図のブロック図に示すように、フレーム(通常
20m5程度)内のピッチ区間の音源信号を、振幅及び
位相を与えるための少数のパルスを発生するパルス発生
部700と、音源信号のスペクトル包絡を表すフィルタ
のインパルス応答、あるいはフィル汐の係数のコードブ
ック720から一つを選択して音源信号を形成する音源
信号形成部710により表すことを特徴とする。さらに
このようにして表した音源信号により合成フィルタ73
0を駆動して再生音声を得る。
今、−例として前記パルスの個数を1とする。
コードブックには、音源信号のスペクトル包絡を表すフ
ィルタのインパルス応答の集合からなるコードブックを
用いる。これをhi(n)(J=12M)とする。この
インパルス応答は種々の方法により求めることができる
。例えば、音声信号をLPG分析して得た予測残差信号
のフレーム毎の予め定められたサンプル数をFFT (
高速フーリエ変換)して絶対値スペクトルを求め、さら
に逆FFTするとインパルス応答が求まる。別の方法と
しては、前記予測残差信号を周知のLPC分析して合成
フィルタの係数を求め、このフィルタのインパルス応答
を求める。以上の他、周知の方法を用いることができる
。
ィルタのインパルス応答の集合からなるコードブックを
用いる。これをhi(n)(J=12M)とする。この
インパルス応答は種々の方法により求めることができる
。例えば、音声信号をLPG分析して得た予測残差信号
のフレーム毎の予め定められたサンプル数をFFT (
高速フーリエ変換)して絶対値スペクトルを求め、さら
に逆FFTするとインパルス応答が求まる。別の方法と
しては、前記予測残差信号を周知のLPC分析して合成
フィルタの係数を求め、このフィルタのインパルス応答
を求める。以上の他、周知の方法を用いることができる
。
前記パルスの振幅g1位相m、コードブックは次のよう
に求める。第4図(a)に成るフレームの音声波形を示
す。フレームをピッチ周期T毎のピンチ区間に区切り、
一つのピッチ区間(代表区間)に着目する(第4図(b
))。この区間での音声信号をxk(n)とする。この
区間におけるパルスの振幅g1位相m、コードブックか
らの最適なコードワードの選択は、次式で示す重みづけ
誤差電力を最小化するように行う。重みづけ誤差電力E
、は、 Ek−Σ((xk(n)−xk(n−m):1*w (
n) ) ” ・ ・ ・(1)た
だし Xk (n −m) =g −tz (n −m) *
hs (n)・ ・ ・(2) ココテ、w (n)は聴惑重みづけフィルタのインパル
ス応答を示す。具体的な構成例は、Ata1氏らによる
”A New Model of LPCExcita
tion for Producing Natura
l Sounding 5peech at low
BitRates ” 、 Proc、 ICASSP
、 pp、 614−617.1982゜文献3)を参
照することができる。ただ巳、このフィルタはなくても
よい。x−(n)は、パルスとコードブックから選択し
たj番目のコードワードとを用いて音源信号を表し、さ
らにこれを合成フィルタに通して再生した再生音声を示
す。またh、(n)は音声を合成するための合成フィル
タのインパルス応答を示す。(2)式を(1)式に代入
してgで偏微分してOとおき次式を得る。
に求める。第4図(a)に成るフレームの音声波形を示
す。フレームをピッチ周期T毎のピンチ区間に区切り、
一つのピッチ区間(代表区間)に着目する(第4図(b
))。この区間での音声信号をxk(n)とする。この
区間におけるパルスの振幅g1位相m、コードブックか
らの最適なコードワードの選択は、次式で示す重みづけ
誤差電力を最小化するように行う。重みづけ誤差電力E
、は、 Ek−Σ((xk(n)−xk(n−m):1*w (
n) ) ” ・ ・ ・(1)た
だし Xk (n −m) =g −tz (n −m) *
hs (n)・ ・ ・(2) ココテ、w (n)は聴惑重みづけフィルタのインパル
ス応答を示す。具体的な構成例は、Ata1氏らによる
”A New Model of LPCExcita
tion for Producing Natura
l Sounding 5peech at low
BitRates ” 、 Proc、 ICASSP
、 pp、 614−617.1982゜文献3)を参
照することができる。ただ巳、このフィルタはなくても
よい。x−(n)は、パルスとコードブックから選択し
たj番目のコードワードとを用いて音源信号を表し、さ
らにこれを合成フィルタに通して再生した再生音声を示
す。またh、(n)は音声を合成するための合成フィル
タのインパルス応答を示す。(2)式を(1)式に代入
してgで偏微分してOとおき次式を得る。
g −Σ X wk (n ) X ’ wk
(n m )/ΣX’ wk (n m) X
’ iik (n m)・・・(3) ここで、 x、k(n)=xk(n)*w (n)x ” wk
(n m) −h、(n−m)*h、(n)*w (
n)・ ・ ・(4) である。(1)式を最小化する最適なg、 m、
hJの組は次のように求められる。インパルス応答系列
h、としてまず成るコードワードを用いて(3)式を計
算し、(1)式を最小化するようにg、 mを求める
。
(n m )/ΣX’ wk (n m) X
’ iik (n m)・・・(3) ここで、 x、k(n)=xk(n)*w (n)x ” wk
(n m) −h、(n−m)*h、(n)*w (
n)・ ・ ・(4) である。(1)式を最小化する最適なg、 m、
hJの組は次のように求められる。インパルス応答系列
h、としてまず成るコードワードを用いて(3)式を計
算し、(1)式を最小化するようにg、 mを求める
。
これには、
g’ΣXwk (n) x 、に’ (n−m
)/ΣX’ wk (n m) X’ ww (n
m)を最大化するg、 mを求めればよい。以上の
処理を全てのjについて行い、 g・ΣXwk (n ) X ’ wk (n m
)/ΣX’ wll(n m)X’ wk(n
m)の値が最も大きいg、 m、 jの組が求める
組である。
)/ΣX’ wk (n m) X’ ww (n
m)を最大化するg、 mを求めればよい。以上の
処理を全てのjについて行い、 g・ΣXwk (n ) X ’ wk (n m
)/ΣX’ wll(n m)X’ wk(n
m)の値が最も大きいg、 m、 jの組が求める
組である。
以上の処理により、着目するピッチ区間においてパルス
の振幅1位相、コードワードが求まる。
の振幅1位相、コードワードが求まる。
第4図(C)、(d)に、求めたパルス、求めたパルス
と選択したコードワードにより発生した代表区間の音源
信号により合成フィルタを駆動して得た合成波形をそれ
ぞれ示す。以上の処理はフレーム内の全てのピンチ区間
で行ってもよいし、つのピッチ区間(代表区間)につい
てのみ行ってもよい。
と選択したコードワードにより発生した代表区間の音源
信号により合成フィルタを駆動して得た合成波形をそれ
ぞれ示す。以上の処理はフレーム内の全てのピンチ区間
で行ってもよいし、つのピッチ区間(代表区間)につい
てのみ行ってもよい。
一方、無声区間では、1フレ一ム全体の音源信号を従来
のマルチパルスや乱数コードブック信号などを用いて表
すことができる。後者の方法に関しては、例えば、シュ
レーダ、アタル氏らによる”Code−excited
1inear prediction (CELP)
: H4ghquality 5peech at v
ery、 low bit rates” と題した論
文(ICASSP、 937−940.198乳文献4
)等を参照できる。
のマルチパルスや乱数コードブック信号などを用いて表
すことができる。後者の方法に関しては、例えば、シュ
レーダ、アタル氏らによる”Code−excited
1inear prediction (CELP)
: H4ghquality 5peech at v
ery、 low bit rates” と題した論
文(ICASSP、 937−940.198乳文献4
)等を参照できる。
第1図(a)、(b)は、第1の本発明による音声符号
化復号化方式を実施する音声符号化装置および音声復号
化装置をそれぞれ示す。
化復号化方式を実施する音声符号化装置および音声復号
化装置をそれぞれ示す。
まず、送信側での音声符号化方式について説明する。第
1図(a)において、入力端子100から音声信号を入
力し、1フレ一ム分(例えば20m5 )の音声信号x
(n)をバッファメモ1月10に格納する。
1図(a)において、入力端子100から音声信号を入
力し、1フレ一ム分(例えば20m5 )の音声信号x
(n)をバッファメモ1月10に格納する。
Kパラメータ計算回路140は、フレームの音声信号の
スペクトル特性を表すスペクトルパラメータとして、K
パラメータを前記フレームの音声信号から周知のLPG
分析を行い、予め定められた次数Mだけ計算する。この
具体的な計算方法については前記文献1.2のにパラメ
ータ計算回路を参照することができる。なお、Kパラメ
ータはPARCOR係数と同一のものである。
スペクトル特性を表すスペクトルパラメータとして、K
パラメータを前記フレームの音声信号から周知のLPG
分析を行い、予め定められた次数Mだけ計算する。この
具体的な計算方法については前記文献1.2のにパラメ
ータ計算回路を参照することができる。なお、Kパラメ
ータはPARCOR係数と同一のものである。
Kパラメータ符号化回路160は、Kパラメータを予め
定められた量子化ビット数で量子化して得た符号lkを
マルチプレクサ260へ出力するとともに、これを復号
化してさらに線形予測係数a。
定められた量子化ビット数で量子化して得た符号lkを
マルチプレクサ260へ出力するとともに、これを復号
化してさらに線形予測係数a。
(i=1〜M)に変換して重みづけ回路200.インパ
ルス応答計算回路170へ出力する。Kパラメータの符
号化、Kパラメータから線形予測係数への変換の方法に
ついては、J、Malhou1氏らによる”t、1ne
ar Prediction of 5peech ”
と題した刊行物(文献5)等や前記文献1.2等を参照
することができる。
ルス応答計算回路170へ出力する。Kパラメータの符
号化、Kパラメータから線形予測係数への変換の方法に
ついては、J、Malhou1氏らによる”t、1ne
ar Prediction of 5peech ”
と題した刊行物(文献5)等や前記文献1.2等を参照
することができる。
ピッチ計算回路130は、フレームの音声信号から平均
ピッチ周期Tを計算する。この方法としては例えば自己
相関法にもとづく方法が知られており、詳細は前記文献
1.2のピッチ抽出回路を参照することができる。また
、この方法以外にも他の周知な方法(例えば、ケプスト
ラム法、5TFT法、変相開法など)を用いる゛ことが
できる。
ピッチ周期Tを計算する。この方法としては例えば自己
相関法にもとづく方法が知られており、詳細は前記文献
1.2のピッチ抽出回路を参照することができる。また
、この方法以外にも他の周知な方法(例えば、ケプスト
ラム法、5TFT法、変相開法など)を用いる゛ことが
できる。
ピッチ符号化回路150は、平均ピッチ周BH”を予め
定められたビット数で量子化して得た符号をマルチプレ
クサ260°へ出力するとともに、これを復号化して得
た復号ピッチ周期T′をピンチ分別回路205.音源信
号計算回路220へ出力する。
定められたビット数で量子化して得た符号をマルチプレ
クサ260°へ出力するとともに、これを復号化して得
た復号ピッチ周期T′をピンチ分別回路205.音源信
号計算回路220へ出力する。
コードブック175は、残差信号のスペクトル包絡を表
すフィルタのインパルス応答の系列h (n)(n=1
−L)の集合(コードブック)を2M種類格納している
。ここでコードブックは予め多量の音声信号の予測残差
信号から分析した、残差信号のスペクトル包絡を表すフ
ィルタのインパルス応答データから学習により作成して
おく。この学習の方法としては、ベクトル量子化の学習
法が知られており、例えばMakhou1氏らによる“
Vec、tor口uantization in
5peech Coding、 (Proc、
IEEE。
すフィルタのインパルス応答の系列h (n)(n=1
−L)の集合(コードブック)を2M種類格納している
。ここでコードブックは予め多量の音声信号の予測残差
信号から分析した、残差信号のスペクトル包絡を表すフ
ィルタのインパルス応答データから学習により作成して
おく。この学習の方法としては、ベクトル量子化の学習
法が知られており、例えばMakhou1氏らによる“
Vec、tor口uantization in
5peech Coding、 (Proc、
IEEE。
vol、?3. LL 15511588.1985.
文献6)等を参照することができる。また、残差信号の
スペクトル包絡を表すフィルタの特性の求め方としては
、周知の種々の方法を用いることができる。例えば、残
差信号に対してLPG分析、共分散分析、改良ケプスト
ラム分析などを用いることができる。LPG分析、共分
散分析については、Rabiner andSchaf
er氏らによる”Digital Processin
g ofSpeech Signals”と題した刊行
物(Prentice−Hall著1978年1文献7
)を参照できる。改良ケプストラム分析については、今
井氏らによる゛改良ケプストラム法によるスペクトル包
絡の抽出” (電子通信学会論文誌、 J62−A、
21?−233頁、 1979年1文献8)等を参照で
きる。コードブック175は、2′4個のインパルス応
答系列hj(n)(j=1−2’)について、j=1か
ら順にj=2Mまで一つずつインパルス応答計算回路1
70へ出力する。
文献6)等を参照することができる。また、残差信号の
スペクトル包絡を表すフィルタの特性の求め方としては
、周知の種々の方法を用いることができる。例えば、残
差信号に対してLPG分析、共分散分析、改良ケプスト
ラム分析などを用いることができる。LPG分析、共分
散分析については、Rabiner andSchaf
er氏らによる”Digital Processin
g ofSpeech Signals”と題した刊行
物(Prentice−Hall著1978年1文献7
)を参照できる。改良ケプストラム分析については、今
井氏らによる゛改良ケプストラム法によるスペクトル包
絡の抽出” (電子通信学会論文誌、 J62−A、
21?−233頁、 1979年1文献8)等を参照で
きる。コードブック175は、2′4個のインパルス応
答系列hj(n)(j=1−2’)について、j=1か
ら順にj=2Mまで一つずつインパルス応答計算回路1
70へ出力する。
インパルス応答計算回路170は、Kパラメータ符号化
回路160からの線形予測係数a、′を用いて、聴感重
みづけを行った合成フィルタのインパルス応答hw(n
)を計算し、さらにコードブック175からの出力hJ
(n)と(4)式に従いたたみこみ計算を行って得たイ
ンパルス応答X′、、k(nm)を、自己相関関数計算
回路180へ出力する。
回路160からの線形予測係数a、′を用いて、聴感重
みづけを行った合成フィルタのインパルス応答hw(n
)を計算し、さらにコードブック175からの出力hJ
(n)と(4)式に従いたたみこみ計算を行って得たイ
ンパルス応答X′、、k(nm)を、自己相関関数計算
回路180へ出力する。
自己相関関数計算回路180ば、インパルス応答xwk
’(n−m)の自己相関関数Rhh(n)を予め定めら
れた遅れ時間まで計算して出力する。自己相関関数計算
回路180の動作は前記文献1,2等を参照することが
できる。
’(n−m)の自己相関関数Rhh(n)を予め定めら
れた遅れ時間まで計算して出力する。自己相関関数計算
回路180の動作は前記文献1,2等を参照することが
できる。
減算器190は、フレームの音声信号X(n)から合成
フィルタ281の出力を1フレーム分減算し、減算結果
を重みづけ回路200へ出力する。
フィルタ281の出力を1フレーム分減算し、減算結果
を重みづけ回路200へ出力する。
重みづけ回路200は、前記減算結果をインパルス応答
がw (n)で表される聴感重みづけフィルタに通し、
重みづけ信号x、(n)を得てこれを出力する。重みづ
けの方法は前記文献1.2等を参照できる。
がw (n)で表される聴感重みづけフィルタに通し、
重みづけ信号x、(n)を得てこれを出力する。重みづ
けの方法は前記文献1.2等を参照できる。
ピッチ分割回路205は、フレームの音声信号を復号化
されたピッチ周期T′を用いてT′毎に分割する。
されたピッチ周期T′を用いてT′毎に分割する。
相互相関関数計算回路210は、重みづけ信号x、、(
n)とインパルス応答X’wk(nm)を入力して相互
相関間数φ、を予め定められた遅れ時間まで計算し出力
する。この計算法は前記文献1.2等を参照できる。
n)とインパルス応答X’wk(nm)を入力して相互
相関間数φ、を予め定められた遅れ時間まで計算し出力
する。この計算法は前記文献1.2等を参照できる。
音源信号計算回路220では、フレーム内の代表的なl
ピッチ区間(代表区間)について、コードブック出力h
=(n)を用いたときの1個のパルスの振幅gと位相m
を求める。このときg、mの計算には前記(3)式を用
いる。次に前記作用の項で述べたように、J (n)と
して2′″種類についてコードブック175から出力し
以上の処理を繰り返し行い、(1)弐の誤差電力を最小
化するg、m。
ピッチ区間(代表区間)について、コードブック出力h
=(n)を用いたときの1個のパルスの振幅gと位相m
を求める。このときg、mの計算には前記(3)式を用
いる。次に前記作用の項で述べたように、J (n)と
して2′″種類についてコードブック175から出力し
以上の処理を繰り返し行い、(1)弐の誤差電力を最小
化するg、m。
J (n)の組を求める。そして選択されたコードブッ
クのインデックスを示す符号をマルチプレクサ260に
出力し、g、mを符号器230へ出力する。
クのインデックスを示す符号をマルチプレクサ260に
出力し、g、mを符号器230へ出力する。
符号器230は、代表区間のパルスの振幅g1位相mを
予め定められたビット数で符号化して出力する。また、
代表区間のサブフレーム位置を示す情報P、を予め定め
られたビット数で符号化してマルチプレクサ260へ出
力する。さらに、これらを復号化して駆動信号復元回路
283へ出力する。
予め定められたビット数で符号化して出力する。また、
代表区間のサブフレーム位置を示す情報P、を予め定め
られたビット数で符号化してマルチプレクサ260へ出
力する。さらに、これらを復号化して駆動信号復元回路
283へ出力する。
駆動信号復元回路283は、代表区間において求めたパ
ルスの振幅1位相、選択したコードワードを用いて代表
区間において音源信号を発生する。
ルスの振幅1位相、選択したコードワードを用いて代表
区間において音源信号を発生する。
他のピッチ区間においては、前後のフレームの代表区間
におけるパルスの振幅を用いて振幅同士を線形補間して
、他のピッチ区間のパルスを求める。
におけるパルスの振幅を用いて振幅同士を線形補間して
、他のピッチ区間のパルスを求める。
また、選択したコードワードに対しては、代表区間のコ
ードワード同士を線形補間して、他のピッチ区間におけ
る残差信号のスペクトル包絡を表すインパルス応答を求
める。以上の処理によりフレームの音源信号を復元して
発生する。
ードワード同士を線形補間して、他のピッチ区間におけ
る残差信号のスペクトル包絡を表すインパルス応答を求
める。以上の処理によりフレームの音源信号を復元して
発生する。
合成フィルタ281は、前記復元された音源信号を入力
し、Kパラメータ符号化回路160からの線形予測係数
a、′を重みづけ回路200を介して入力して1フレ一
ム分の合成音声信号を求めると共に、次のフレームへの
影響信号を1フレーム分計算し、これを減算器190へ
出力する。なお、影響信号の計算法は特願昭57−23
1605号明細書(文献9)等を参照できる。
し、Kパラメータ符号化回路160からの線形予測係数
a、′を重みづけ回路200を介して入力して1フレ一
ム分の合成音声信号を求めると共に、次のフレームへの
影響信号を1フレーム分計算し、これを減算器190へ
出力する。なお、影響信号の計算法は特願昭57−23
1605号明細書(文献9)等を参照できる。
マルチプレクサ260は、代表区間におけるパルスの振
幅9位相を表す符号、代表区間の位置を表す符号、Kパ
ラメータを表す符号、ピッチ周期を表す符号、選択され
たコードワードを表す符号を組み合わせて出力する。
幅9位相を表す符号、代表区間の位置を表す符号、Kパ
ラメータを表す符号、ピッチ周期を表す符号、選択され
たコードワードを表す符号を組み合わせて出力する。
次に、受信側での音声復号化方式について説明する。第
1図(b)において、受信側では、デマルチプレクサ3
00は受信した信号を分離して出力する。
1図(b)において、受信側では、デマルチプレクサ3
00は受信した信号を分離して出力する。
復号器310は代表区間におけるパルスの振幅。
位相を復号して出力する。
パラメータ復号器320は、Kパラメータを表す符号を
復号し、さらに復号したにパラメータを線形予測係数a
i’に変換して出力する。また、ピンチ周期を表す符号
を復号し、復号したピッチ周期T′を出力する。
復号し、さらに復号したにパラメータを線形予測係数a
i’に変換して出力する。また、ピンチ周期を表す符号
を復号し、復号したピッチ周期T′を出力する。
駆動信号復元回路340は、送信側における駆動信号復
元回路283と同一の動作を行い、フレームの音源信号
を復元する。またコードブック350は、送信側のコー
ドブック175と同一のコードワードを格納している。
元回路283と同一の動作を行い、フレームの音源信号
を復元する。またコードブック350は、送信側のコー
ドブック175と同一のコードワードを格納している。
合成フィルタ360は、フレームの音源信号を入力し合
成音声を求めた端子380°から出力する。
成音声を求めた端子380°から出力する。
以上のように本実施例によれば、送信側では、入力した
離散的な音声信号から、スペクトル包絡を表すスペクト
ルパラメータとピッチを表すピッチパラメータとを予め
定められた時間長のフレーム毎に求め、前記フレームの
音声信号を前記ピッチパラメータから求めたピッチ周期
に応じたピッチ区間毎に分割し、前記ピッチ区間の内の
1つのピッチ区間の音源信号を少数のパルスと前記音源
信号の特性を表すコードブックとで表し、前記音声信号
と前記パルスと前記コードブックにより得られる合成信
号との誤差を小さくするように前記パルスの振幅と位相
を求め、前記コードブックから一つのコードワードを選
択し、前記ピッチパラメータと前記スペクトルパラメー
タと前記パルスの振幅2位相と前記コードワードを表す
インデックスとを出力し、受信側では、前記パルスの振
幅。
離散的な音声信号から、スペクトル包絡を表すスペクト
ルパラメータとピッチを表すピッチパラメータとを予め
定められた時間長のフレーム毎に求め、前記フレームの
音声信号を前記ピッチパラメータから求めたピッチ周期
に応じたピッチ区間毎に分割し、前記ピッチ区間の内の
1つのピッチ区間の音源信号を少数のパルスと前記音源
信号の特性を表すコードブックとで表し、前記音声信号
と前記パルスと前記コードブックにより得られる合成信
号との誤差を小さくするように前記パルスの振幅と位相
を求め、前記コードブックから一つのコードワードを選
択し、前記ピッチパラメータと前記スペクトルパラメー
タと前記パルスの振幅2位相と前記コードワードを表す
インデックスとを出力し、受信側では、前記パルスの振
幅。
位相と前記インデックスとを用いて前記ピッチ区間の音
源信号を発生し、さらに補間により他のピンチ区間の音
源信号を復元し、前記スペクトルパラメータを用いて構
成した合成フィルタを駆動して合成音声を求め出力する
。
源信号を発生し、さらに補間により他のピンチ区間の音
源信号を復元し、前記スペクトルパラメータを用いて構
成した合成フィルタを駆動して合成音声を求め出力する
。
第2図(a)、(b)は、第2の本発明による音声符号
化復号化方式を実施する音声符号化装置および音声復号
化装置をそれぞれ示す。図において第1図(a)、(b
)と同一の参照番号を付した構成要素は第1図(a)、
(b)と同様の動作をするので説明は省略する。
化復号化方式を実施する音声符号化装置および音声復号
化装置をそれぞれ示す。図において第1図(a)、(b
)と同一の参照番号を付した構成要素は第1図(a)、
(b)と同様の動作をするので説明は省略する。
第2図(a)において、225は振幅・位相補正計算回
路である。振幅・位相補正計算回路225では、同一フ
レーム内の代表区間以外のビ・ンチ区間において代表区
間のパルスの振幅1位相を補正するための補正係数を各
ピ・ノチ区間毎に計算する。
路である。振幅・位相補正計算回路225では、同一フ
レーム内の代表区間以外のビ・ンチ区間において代表区
間のパルスの振幅1位相を補正するための補正係数を各
ピ・ノチ区間毎に計算する。
具体的には次のように求める。第i番目のピ・ソチ区間
における入力音声、振幅補正係数1位相補正係数を、そ
れぞれX、(n)、Ct、d、とする。
における入力音声、振幅補正係数1位相補正係数を、そ
れぞれX、(n)、Ct、d、とする。
第i番目のピッチ区間における入力音声と代表区間のパ
ルスの振幅1位相を補正して合成フィルりに通して再生
した再生信号x= (n)との聴感重みづけ誤差電力は
次のように書ける。
ルスの振幅1位相を補正して合成フィルりに通して再生
した再生信号x= (n)との聴感重みづけ誤差電力は
次のように書ける。
E、、、=ΣNX、(n)−c、
i6 (n−T’−d、))*w (n)3”・ ・
・(5) 振幅1位相補正係数c;、d=は上式を最小化するよう
に求めることができる。上式を振幅補正係数C6で偏微
分して0とおき次式を得る。
・(5) 振幅1位相補正係数c;、d=は上式を最小化するよう
に求めることができる。上式を振幅補正係数C6で偏微
分して0とおき次式を得る。
Ci=ΣXwi (n) Mwt (n T’ d
H) 72Mwt (n T’ di ) Mwt
(n T’ dl・・・(6) 種々の位相補正係数d、について上式を計算し、上式を
最大化するc、、d、の組を求めればよい。
H) 72Mwt (n T’ di ) Mwt
(n T’ dl・・・(6) 種々の位相補正係数d、について上式を計算し、上式を
最大化するc、、d、の組を求めればよい。
以上の処理をフレーム内の代表区間以外の全てのピッチ
区間について行い、各区間の振幅・位相補正係数を符号
器230へ出力する。
区間について行い、各区間の振幅・位相補正係数を符号
器230へ出力する。
駆動信号復元回路285は、フレームの代表区間ではパ
ルスの振幅8位相及び選ばれたコードワードを用いて音
源信号を発生させる。また同一フレーム内の代表区間以
外のi番目のピッチ区間においては、代表区間の音源信
号v (n)を振幅1位相補正係数c4.d、を用いて
次式に従い補正して音源信号d、(n)を発生させる。
ルスの振幅8位相及び選ばれたコードワードを用いて音
源信号を発生させる。また同一フレーム内の代表区間以
外のi番目のピッチ区間においては、代表区間の音源信
号v (n)を振幅1位相補正係数c4.d、を用いて
次式に従い補正して音源信号d、(n)を発生させる。
d、(n)=c、 ・v (n−T’−d、)・ ・
(7) ただし v (n) =g−h; (n−m) ・・・
(8)ここでhJ(n)、g+ mはコードブックの
コードワード、パルスの振幅、パルスの位相である。
(7) ただし v (n) =g−h; (n−m) ・・・
(8)ここでhJ(n)、g+ mはコードブックの
コードワード、パルスの振幅、パルスの位相である。
第2図(b)に示す受信側の復号化装置において、駆動
信号復元回路342は送信側の駆動信号復元回路285
と同一の動きを行う。
信号復元回路342は送信側の駆動信号復元回路285
と同一の動きを行う。
以上のように本実施例によれば、送信側では、入力した
離散的な音声信号から、スペクトル包絡を表すスペクト
ルパラメータとピッチを表すピッチパラメータとを予め
定められた時間長のフレーム毎に求め、前記フレームの
音声信号を前記ピッチパラメータから求めたピッチ周期
に応じたピッチ区間毎に分割し、前記ピッチ区間の内の
1つのピッチ区間の音源信号を少数のパルスと前記音源
信号の特性を表すコードブックとで表し、さらに前記ピ
ッチ区間以外の他のピッチ区間では前記パルスの振幅1
位相を補正する補正係数を求め、前記ピッチパラメータ
と前記スペクトルパラメータと前記パルスの振幅1位相
と前記コードブックの選択されたコードワードを表すイ
ンデックスと前記補正係数を出力し、受信側では前記パ
ルスの振幅1位相と前記コードワードのインデックスと
を用いて前記ピッチ区間の音源信号を発生し、さらに他
のピッチ区間では前記ピッチ区間の音源信号と前記補正
係数とを用いて音源信号を復元し、前記復元した音源信
号により前記スペクトルパラメータを用いて構成した合
成フィルタを駆動して合成音声を求めて出力する。
離散的な音声信号から、スペクトル包絡を表すスペクト
ルパラメータとピッチを表すピッチパラメータとを予め
定められた時間長のフレーム毎に求め、前記フレームの
音声信号を前記ピッチパラメータから求めたピッチ周期
に応じたピッチ区間毎に分割し、前記ピッチ区間の内の
1つのピッチ区間の音源信号を少数のパルスと前記音源
信号の特性を表すコードブックとで表し、さらに前記ピ
ッチ区間以外の他のピッチ区間では前記パルスの振幅1
位相を補正する補正係数を求め、前記ピッチパラメータ
と前記スペクトルパラメータと前記パルスの振幅1位相
と前記コードブックの選択されたコードワードを表すイ
ンデックスと前記補正係数を出力し、受信側では前記パ
ルスの振幅1位相と前記コードワードのインデックスと
を用いて前記ピッチ区間の音源信号を発生し、さらに他
のピッチ区間では前記ピッチ区間の音源信号と前記補正
係数とを用いて音源信号を復元し、前記復元した音源信
号により前記スペクトルパラメータを用いて構成した合
成フィルタを駆動して合成音声を求めて出力する。
上述した各実施例はあくまで本発明の一例に過ぎず、そ
の変形例も種々考えられる。
の変形例も種々考えられる。
例えば、パルスの振幅9位相の計算及びコードワードの
選択を代表区間のみではなくフレーム内の全ピッチ区間
において行うようにしてもよい。
選択を代表区間のみではなくフレーム内の全ピッチ区間
において行うようにしてもよい。
このような構成とすると、音源情報の伝送に必要な情報
量は増大するが特性は向上する。
量は増大するが特性は向上する。
また、代表区間は例えばフレームの中央部というように
フレーム内で固定的に決めてもよいし、最もよい区間を
探索して求めてもよい。後者の具体的な方法については
前記文献1を参照できる。
フレーム内で固定的に決めてもよいし、最もよい区間を
探索して求めてもよい。後者の具体的な方法については
前記文献1を参照できる。
また、代表区間のパルスの個数は2以上でもよいが、伝
送情報量が増大する。
送情報量が増大する。
また、コードワードに関しては代表区間以外の他のピッ
チ区間においては線形補間してもよいし、しなくてもよ
い。
チ区間においては線形補間してもよいし、しなくてもよ
い。
また、コードブックとして、音声信号の予測残差信号の
スペクトル包絡を表すフィルタのインパルス応答とした
が、フィルタの係数としてもよい。
スペクトル包絡を表すフィルタのインパルス応答とした
が、フィルタの係数としてもよい。
このような構成のときはフィルタ係数からインパルス応
答に変換する必要がある。係数としては具体的には、線
形予測係数、にパラメータ、対数断面積比、ケプストラ
ム、メルケプストラムなど周知の係数を用いることがで
きる。
答に変換する必要がある。係数としては具体的には、線
形予測係数、にパラメータ、対数断面積比、ケプストラ
ム、メルケプストラムなど周知の係数を用いることがで
きる。
また、本実施例では、スペクトルパラメータとしてにパ
ラメータを符号化し、その分析法としてLPG分析を用
いたが、スペクトルパラメータとしては他の周知なパラ
メータ、例えばLSP、LPCケプストラム、ケプスト
ラ゛ム、改良ケプストラム、一般化ケプストラム、メル
ケプストラムなどを用いることもできる。また各パラメ
ータに最適な分析法を用いることができる。
ラメータを符号化し、その分析法としてLPG分析を用
いたが、スペクトルパラメータとしては他の周知なパラ
メータ、例えばLSP、LPCケプストラム、ケプスト
ラ゛ム、改良ケプストラム、一般化ケプストラム、メル
ケプストラムなどを用いることもできる。また各パラメ
ータに最適な分析法を用いることができる。
また、演算量を低減するために、影響信号の計算を省略
することもできる。これによって、駆動信号復元回路2
831合成フ合成フィルタ、減算器190は不要となり
演算量低減が可能となるが、音質は低下する。
することもできる。これによって、駆動信号復元回路2
831合成フ合成フィルタ、減算器190は不要となり
演算量低減が可能となるが、音質は低下する。
なお、デジタル信号処理の分野でよく知られているよう
に、自己相関関数は周波数軸上でパワスペクトルに、相
互相関関数はクロスパワスペクトルに対応しているので
、これらから計算することもできる。これらの計算法に
ついては、Oppenheim氏らによる”Digit
al Signal Processing” (Pr
entice−Hall、 1975)と題した刊行物
を参照できる。
に、自己相関関数は周波数軸上でパワスペクトルに、相
互相関関数はクロスパワスペクトルに対応しているので
、これらから計算することもできる。これらの計算法に
ついては、Oppenheim氏らによる”Digit
al Signal Processing” (Pr
entice−Hall、 1975)と題した刊行物
を参照できる。
(発明の効果〕
以上述べたように、本発明によれば、lピッチ区間の音
源信号(代表区間)を、振幅2位相を与える少数のパル
スと音源信号の特性を表すコードブックとを用いて表し
ているので、4.8kb/s程度のビットレートでは従
来方式に比べ音源信号の近似度が高く良好な合成音声を
得ることができるという大きな効果がある。
源信号(代表区間)を、振幅2位相を与える少数のパル
スと音源信号の特性を表すコードブックとを用いて表し
ているので、4.8kb/s程度のビットレートでは従
来方式に比べ音源信号の近似度が高く良好な合成音声を
得ることができるという大きな効果がある。
第1図は第1の発明による音声符号化復号化方式の一実
施例を説明するための音声符号化装置及び音声復号化装
置のブロック図、 第2図は第2の発明による音声符号化復号化方式の一実
施例を説明するための音声符号化装置及び音声復号化装
置のブロック図、 第3図及び第4図は本発明の詳細な説明するための図で
ある。 110 ・・ 130 ・・ 140 ・・ 150 ・・ 160 ・・ 170 ・・ 175、350゜ 180 ・・ 205 ・・ 210 ・・ 220 ・・ 225 ・・ バッファメモリ ピッチ計算回路 にパラメータ計算回路 ピッチ符号化回路 にパラメータ符号化回路 インパルス応答計算回路 ・・・コードブック 自己相関関数計算回路 ピッチ分割回路 相互相関関数計算回路 音源信号計算回路 振幅・位相補正計算回路 230 ・ ・ ・ ・ ・ 260 ・ ・ ・ ・ ・ 28L 360,730 283、 285. 340゜ 300 ・ ・ ・ ・ ・ 符号器 マルチプレクサ ・・・合成フィルタ 342・・・駆動信号復元回路 デマルチプレクサ
施例を説明するための音声符号化装置及び音声復号化装
置のブロック図、 第2図は第2の発明による音声符号化復号化方式の一実
施例を説明するための音声符号化装置及び音声復号化装
置のブロック図、 第3図及び第4図は本発明の詳細な説明するための図で
ある。 110 ・・ 130 ・・ 140 ・・ 150 ・・ 160 ・・ 170 ・・ 175、350゜ 180 ・・ 205 ・・ 210 ・・ 220 ・・ 225 ・・ バッファメモリ ピッチ計算回路 にパラメータ計算回路 ピッチ符号化回路 にパラメータ符号化回路 インパルス応答計算回路 ・・・コードブック 自己相関関数計算回路 ピッチ分割回路 相互相関関数計算回路 音源信号計算回路 振幅・位相補正計算回路 230 ・ ・ ・ ・ ・ 260 ・ ・ ・ ・ ・ 28L 360,730 283、 285. 340゜ 300 ・ ・ ・ ・ ・ 符号器 マルチプレクサ ・・・合成フィルタ 342・・・駆動信号復元回路 デマルチプレクサ
Claims (2)
- (1)送信側では、入力した離散的な音声信号から、ス
ペクトル包絡を表すスペクトルパラメータとピッチを表
すピッチパラメータとを予め定められた時間長のフレー
ム毎に求め、前記フレームの音声信号を前記ピッチパラ
メータから求めたピッチ周期に応じたピッチ区間毎に分
割し、前記ピッチ区間の内の1つのピッチ区間の音源信
号を少数のパルスと前記音源信号の特性を表すコードブ
ックとで表し、前記音声信号と前記パルスと前記コード
ブックにより得られる合成信号との誤差を小さくするよ
うに前記パルスの振幅と位相を求め、前記コードブック
から一つのコードワードを選択し、前記ピッチパラメー
タと前記スペクトルパラメータと前記パルスの振幅、位
相と前記コードワードを表すインデックスとを出力し、
受信側では、前記パルスの振幅、位相と前記インデック
スとを用いて前記ピッチ区間の音源信号を発生し、さら
に補間により他のピッチ区間の音源信号を復元し、前記
スペクトルパラメータを用いて構成した合成フィルタを
駆動して合成音声を求め出力する音声符号化復号化方式
。 - (2)送信側では、入力した離散的な音声信号から、ス
ペクトル包絡を表すスペクトルパラメータとピッチを表
すピッチパラメータとを予め定められた時間長のフレー
ム毎に求め、前記フレームの音声信号を前記ピッチパラ
メータから求めたピッチ周期に応じたピッチ区間毎に分
割し、前記ピッチ区間の内の1つのピッチ区間の音源信
号を少数のパルスと前記音源信号の特性を表すコードブ
ックとで表し、さらに前記ピッチ区間以外の他のピッチ
区間では前記パルスの振幅、位相の少なくとも一方を補
正する補正係数を求め、前記ピッチパラメータと前記ス
ペクトルパラメータと前記パルスの振幅、位相と前記コ
ードブックの選択されたコードワードを表すインデック
スと前記補正係数を出力し、受信側では、前記パルスの
振幅、位相と前記コードワードのインデックスとを用い
て前記ピッチ区間の音源信号を発生し、さらに他のピッ
チ区間では前記ピッチ区間の音源信号と前記補正係数を
用いて音源信号を復元し、前記復元した音源信号により
前記スペクトルパラメータを用いて構成した合成フィル
タを駆動して合成音声を求めて出力する音声符号化復号
化方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1100113A JP2956068B2 (ja) | 1989-04-21 | 1989-04-21 | 音声符号化復号化方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1100113A JP2956068B2 (ja) | 1989-04-21 | 1989-04-21 | 音声符号化復号化方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH02280200A true JPH02280200A (ja) | 1990-11-16 |
| JP2956068B2 JP2956068B2 (ja) | 1999-10-04 |
Family
ID=14265315
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1100113A Expired - Lifetime JP2956068B2 (ja) | 1989-04-21 | 1989-04-21 | 音声符号化復号化方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2956068B2 (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1999021174A1 (en) * | 1997-10-22 | 1999-04-29 | Matsushita Electric Industrial Co., Ltd. | Sound encoder and sound decoder |
| JP2008020840A (ja) * | 2006-07-14 | 2008-01-31 | Sharp Corp | 音声合成装置、音声合成方法およびコンピュータを音声合成装置として機能させるためのプログラム、ならびに、フィルタ生成装置、フィルタ生成方法およびコンピュータをフィルタ生成装置として機能させるためのプログラム |
| CN100367347C (zh) * | 1997-02-13 | 2008-02-06 | 松下电器产业株式会社 | 话音信号编码器和话音信号解码器 |
| KR100955126B1 (ko) * | 1997-10-22 | 2010-04-28 | 파나소닉 주식회사 | 벡터 양자화 장치 |
| CN101202047B (zh) | 1997-10-22 | 2012-04-25 | 松下电器产业株式会社 | 话音信号编码器和话音信号解码器 |
-
1989
- 1989-04-21 JP JP1100113A patent/JP2956068B2/ja not_active Expired - Lifetime
Cited By (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN100367347C (zh) * | 1997-02-13 | 2008-02-06 | 松下电器产业株式会社 | 话音信号编码器和话音信号解码器 |
| US7499854B2 (en) | 1997-10-22 | 2009-03-03 | Panasonic Corporation | Speech coder and speech decoder |
| US7546239B2 (en) | 1997-10-22 | 2009-06-09 | Panasonic Corporation | Speech coder and speech decoder |
| KR100651438B1 (ko) * | 1997-10-22 | 2006-11-28 | 마츠시타 덴끼 산교 가부시키가이샤 | 음성 부호화 장치, celp 음성 부호화 방법, 대수적 구조 음원의 직교화 탐색 방법 |
| CN100349208C (zh) * | 1997-10-22 | 2007-11-14 | 松下电器产业株式会社 | 扩散矢量生成方法及扩散矢量生成装置 |
| US8352253B2 (en) | 1997-10-22 | 2013-01-08 | Panasonic Corporation | Speech coder and speech decoder |
| US6415254B1 (en) | 1997-10-22 | 2002-07-02 | Matsushita Electric Industrial Co., Ltd. | Sound encoder and sound decoder |
| US7373295B2 (en) | 1997-10-22 | 2008-05-13 | Matsushita Electric Industrial Co., Ltd. | Speech coder and speech decoder |
| WO1999021174A1 (en) * | 1997-10-22 | 1999-04-29 | Matsushita Electric Industrial Co., Ltd. | Sound encoder and sound decoder |
| US7024356B2 (en) | 1997-10-22 | 2006-04-04 | Matsushita Electric Industrial Co., Ltd. | Speech coder and speech decoder |
| US7590527B2 (en) | 1997-10-22 | 2009-09-15 | Panasonic Corporation | Speech coder using an orthogonal search and an orthogonal search method |
| US7533016B2 (en) | 1997-10-22 | 2009-05-12 | Panasonic Corporation | Speech coder and speech decoder |
| KR100925084B1 (ko) * | 1997-10-22 | 2009-11-05 | 파나소닉 주식회사 | 음성 부호화기 및 음성 부호화 방법 |
| KR100955126B1 (ko) * | 1997-10-22 | 2010-04-28 | 파나소닉 주식회사 | 벡터 양자화 장치 |
| US7925501B2 (en) | 1997-10-22 | 2011-04-12 | Panasonic Corporation | Speech coder using an orthogonal search and an orthogonal search method |
| CN101202047B (zh) | 1997-10-22 | 2012-04-25 | 松下电器产业株式会社 | 话音信号编码器和话音信号解码器 |
| US8332214B2 (en) | 1997-10-22 | 2012-12-11 | Panasonic Corporation | Speech coder and speech decoder |
| JP2008020840A (ja) * | 2006-07-14 | 2008-01-31 | Sharp Corp | 音声合成装置、音声合成方法およびコンピュータを音声合成装置として機能させるためのプログラム、ならびに、フィルタ生成装置、フィルタ生成方法およびコンピュータをフィルタ生成装置として機能させるためのプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2956068B2 (ja) | 1999-10-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2940005B2 (ja) | 音声符号化装置 | |
| JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
| JP4008607B2 (ja) | 音声符号化/復号化方法 | |
| JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
| JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
| JPH02280200A (ja) | 音声符号化復号化方式 | |
| JP2615548B2 (ja) | 高能率音声符号化方式とその装置 | |
| JP2946525B2 (ja) | 音声符号化方式 | |
| JPH0854898A (ja) | 音声符号化装置 | |
| JP3303580B2 (ja) | 音声符号化装置 | |
| JP2829978B2 (ja) | 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 | |
| JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
| JP3583945B2 (ja) | 音声符号化方法 | |
| JP3299099B2 (ja) | 音声符号化装置 | |
| JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
| JP2947788B1 (ja) | 音声および音響信号の高速な符号化方法および装置および記録媒体 | |
| JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
| JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
| JP3192051B2 (ja) | 音声符号化装置 | |
| JP3274451B2 (ja) | 適応ポストフィルタ及び適応ポストフィルタリング方法 | |
| JP2658438B2 (ja) | 音声符号化方法とその装置 | |
| JP2508002B2 (ja) | 音声符号化方法とその装置 | |
| JP3071800B2 (ja) | 適応ポストフィルタ | |
| JPH03243999A (ja) | 音声符号化装置 | |
| JP3144244B2 (ja) | 音声符号化装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070723 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080723 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090723 Year of fee payment: 10 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090723 Year of fee payment: 10 |