JPH0258100A - 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 - Google Patents

音声符号化復号化方法及び音声符号化装置並びに音声復号化装置

Info

Publication number
JPH0258100A
JPH0258100A JP63208201A JP20820188A JPH0258100A JP H0258100 A JPH0258100 A JP H0258100A JP 63208201 A JP63208201 A JP 63208201A JP 20820188 A JP20820188 A JP 20820188A JP H0258100 A JPH0258100 A JP H0258100A
Authority
JP
Japan
Prior art keywords
pitch
section
sound source
frame
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63208201A
Other languages
English (en)
Other versions
JP2829978B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63208201A priority Critical patent/JP2829978B2/ja
Publication of JPH0258100A publication Critical patent/JPH0258100A/ja
Application granted granted Critical
Publication of JP2829978B2 publication Critical patent/JP2829978B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声符号化復号化方法及び音声符号化装置並
びに音声復号化装置に関し、特に、音声信号を低いビッ
トレート、特に4.8kb/s程度以下で、比較的少な
い演算量により高品質に符号化し、復号化できるように
するための音声符号化復号化方法及びその符号化、復号
化のための装置に関する。
〔従来の技術〕
音声信号を4.8kb/s程度の低いビットレートで符
号化する方式としては、例えば特願昭59−27243
5号や特願昭60−178911号明細書等に開示され
ているピッチ補間マルチパルス法が知られている。この
方法では、送信側では、フレーム毎の音声信号から音声
信号のスペクトル特性を表すスペクトルパラメータとピ
ッチパラメータを抽出し、有声区間では、1フレームの
音源信号を、1フレームをピッチ区間毎に分割した複数
個のピッチ区間のうちの一つのピッチ区間(代表区間)
についてマルチパルスで表し、代表区間におけるマルチ
パルスの振幅1位置とスペクトル、ピッチパラメータを
伝送する。また、無声区間では、■フレームの音源を少
数のマルチパルスと雑音信号で表し、マルチパルスの振
幅5位置と雑音信号のゲイン、インデクスを伝送する。
一方、受信側においては、有声区間では、代表区間のマ
ルチパルスと隣接フレームのマルチパルスとを用いてマ
ルチパルス同士を補間して代表区間以外のピッチ区間の
パルスを復元し、フレームの駆動音源信号を復元する。
また、無声区間では、マルチパルスと雑音信号のインデ
クス、ゲインを用いてフレームの音源信号を復元する。
さらに、復元した駆動音源信号を、スペクトルパラメー
タを用いた合成フィルタに入力して合成音声信号を出力
する。
〔発明が解決しようとする課題〕
しかしながら、上述した従来方式では、有声区間では代
表区間のマルチパルス同士の補間によりフレームの駆動
音源信号を復元しているので、母音連鎖の母音から母音
へ遷移する部分や有声の過渡部など、音声信号の特性が
変化しているフレームでは、補間により復元した駆動音
源信号は大きく劣化し、その結果、合成音声の音質が劣
化していた。このような音声の特性が大きく変化する部
分は、音韻知覚や自然性の知覚に非常に重要であること
が知られているが、従来方式ではこれらの部分の情報が
十分に復元できないので音質が劣化するという大きな問
題点があった。
本発明の目的は夷上述した問題点を解決し、比較的少な
い演算量により低いビットレートでも音質の良好な音声
符号化復号化方法及びその方法に適した音声符号化装置
、音声復号化装置を提供することにある。
〔課題を解決するための手段〕
本発明の音声41号化復号化方法は、 送信側において、離散的な音声信号を入力し、その音声
信号からフレーム毎にスペクトル包絡を表すスペクトル
パラメータとピッチを表すピッチパラメータとを抽出し
て前記フレーム区間をそのピッチ情報に応じたピッチ区
間に分割し、前記音声信号の音源信号を、前記ピッチ区
間のうち1つのピッチ区間のマルチパルスとそのマルチ
パルスに関する補正情報もしくは雑音とパルス列との組
合せで表し、 受信側では、前記1つのピッチ区間のマルチパルスと前
記マルチパルスに関する補正情報もしくは前記雑音とパ
ルス列との組合せと前記ピソチバラメータとを用いて前
記フレームの駆動音源信号を復元し、前記スペクトルパ
ラメータを用いて合成音声信号を求めることを特徴とし
ている。
また、本発明の音声符号化装置は、 入力した離散的な音声信号からフレーム毎にスペクトル
包絡を表すスペクトルパラメータとピッチを表すピッチ
パラメータを抽出し符号化するパラメータ計算手段と、 フレーム区間を前記ピッチパラメータに応じたピッチ区
間に分割し前記フレーム区間毎の音声信号の音源信号と
して前記ピッチ区間のうちの1つのピッチ区間のマルチ
パルスと他のピッチ区間において前記マルチパルスに関
して振幅あるいは位相の少なくとも一方を補正するため
の補正情報もしくは雑音とパルス列との組合せを求めて
符号化する音源信号計算手段と、 前記パラメータ計算手段の出力符号と前記音源信号計算
手段の出力符号とを組み合わせて出力するマルチプレク
サとを有することを特徴としている。
更に、本発明の音声復号化装置は、 スペクトルパラメータを表す符号とピッチパラメータを
表す符号と音源信号を表す符号とを分離して復号化する
手段と、 フレームを前記復号化したピッチパラメータに応じたピ
ッチ区間に分割し1つのピッチ区間についてマルチパル
スを発生し他のピッチ区間において前記マルチパルスに
関して振幅あるいは位相の少なくとも一方を補正する補
正情報を用いてパルスを発生させて前記フレームの駆動
音源信号を復元するかもしくは雑音とパルス列の組合せ
を用いて前記フレームの駆動音源信号を復元する駆動信
号復元手段と、 駆動音源と前記復号したスペクトルパラメータとを用い
て合成音声を求め出力する合成フィルタとを有すること
を特徴としている。
〔作用〕
本発明によれば、有声区間の音源信号を、フレームをピ
ッチ周期に分割して1つのピッチ区間(代表区間)のマ
ルチパルスと他のピッチ区間では補正情報を用いて表す
ことが可能となる。補正情報としては、より望ましくは
振幅補正係数、位相補正係数とすることができる。
かかる音源信号の処理は、従来のものにおける駆動音源
信号の劣化回避に有効であり、音声の特性が大きく変化
する部分であっても音質の良好な合成音声を得ることを
可能ならしめる。また、有声区間以外では、雑音とマル
チパルスの組合せにより音源信号を表すことができるの
で、種々の子音に対しても良好な合成音声を得られる。
〔実施例〕
次に、本発明の実施例について図面を参照して説明する
第1図は本発明による音声符号化復号化方法とそのため
の符号化装置及び復号化装置の一実施例を示すブロック
図である。また、第2図は有声フレームでの代表区間と
代表区間のマルチパルス及び振幅補正係数、位相補正係
数を説明するための図である。
第1図に示すように、音声信号の符号化、復号化処理の
ための伝送系は、送信側の符号化装置と受信側の復号化
装置とから構成される。
本実施例では、送信側は、バッファメモリ110を備え
ると共に、ピッチ分析回路130と、ピッチ符号化回路
150と、スペクトルパラメータを表すパラメータとし
てのにパラメータのためのにパラメータ計算回路140
と、Kパラメータ符号化回路160とを有する。
更に、インパルス応答計算回路170と、自己相関関数
計算回路180と、減算器190と、重み付は回路20
0と、相互相関関数計算回路210と、音源信号計算回
路220と、符号化回路230と、マルチプレクサ26
0とを備えると共に、振幅・位相補正係数計算回路27
0と、雑音メモリ225と、駆動信号復元回路283と
、合成フィルタ281と、補間回路282とを備えて構
成されている。
送信側では、符号100で示す入力端子に音声信号が供
給され、ピッチ符号化回路150 、Kパラメータ符号
化回路160及び符号化回路230の各出力が供給され
るマルチプレクサ260を介して符号化出力が受信側へ
送出される。
受信側は、第1図に示すように、デマルチプレクサ29
0と、音源復号回路300と、雑音メモリ310と、復
号回路315と、ピッチ復号回路320と、Kパラメー
タ復号回路330を備えると共に、駆動信号復元回路3
40の他、補間回路335、合成フィルタ回路350を
含んで構成されており、デマルチプレクサ290に送信
側からの符号化出力が供給され、出力端子360を通し
て合成音声が取り出される。
入力端子100に入力される音声信号の符号化。
復号化処理は、送信側では、離散的な音声信号を入力し
前記音声信号からフレーム毎にスペクトル包絡を表すス
ペクトルバラメークとピッチを表すピッチパラメータと
を抽出して前記フレーム区間を前記ピッチ情報に応じた
ピッチ区間に分割し、前記音声信号の音源信号を前記ピ
ッチ区間のうち1つのピッチ区間のマルチパルスと前記
マルチパルスに関する補正情報もしくは雑音とパルス列
との組合せで表し、受信側では、前記1つのピッチ区間
のマルチパルスと前記マルチパルスに関する補正情報も
しくは前記雑音とパルス列との組合せと前記ピッチパラ
メータとを用いて前記フレームの駆動音源信号を復元し
前記スペクトルパラメータを用いて合成音声信号を求め
ることによって行われる。
以下、まず、これについて第2図に示す例を参照してそ
の原理を説明する。
第1図に示した本発明に従う音声符号化復号化方法及び
装置は、有声区間では、フレーム区間をピッチ周期毎の
ピッチ区間に分割し、前記ピッチ区間のうちの1つのピ
ッチ区間(代表区間)についてマルチパルスを求め、同
一フレーム内の他のピッチ区間については前記マルチパ
ルスに対する振幅補正係数ck+位相補正係数d、を求
め、そして、フレーム毎に、音源情報として代表区間の
フレーム内のピッチ位置、代表区間のマルチハ/L/ス
の振幅2位置と同一フレームの他のピッチ区間の振幅補
正係数cli+位相補正係数d、を伝送し、さらに、補
助情報としてスペクトルパラメータ、ピッチパラメータ
、有声/無声判別情+Ilを伝送することを特徴とする
。代表区間は、最も良好な合成音声信号が求められる区
間を探索して求めてもよいし、フレーム内で固定として
もよい。音質は前者の方が良好であるが、演算量は多く
なる。
以下で振幅補正係数ck+位相補正係数dkの求め方、
代表区間の探索法を示す。今、フレームで求めた平均ピ
ッチ周期をTとする。1フレームの音声波形フレームを
T毎のサブフレーム区間に分割した様子を第2図(a)
、  (b)に示す。ここでは、代表区間を探索する場
合について示す。
代表区間の候補となるサブフレームを例えばサブフレー
ム■とする。サブフレーム■について予め定められた個
数りのマルチパルスの振幅1位置を求める。マルチパル
スの求め方については、相互相関関数Φxhと自己相関
関数Rhhを用いて求める方法が知られており、これは
例えば前記各特許出願明細書や、Araseki、 O
zawa、 Ono、 0chiai氏による” Mu
lti−pulse Excited 5peech 
Coder Ba5edon Maximum Cro
ss−correlation 5earch Alg
orithm。
(GLOBECOM 83. IEEE Global
 TelecommunicationsCon f 
erence、講演番号23.3.1983)  (文
献1)に記載されているので、ここではその詳細な説明
は省略する。
代表区間のマルチパルスの振幅2位置をそれぞれg= 
、mi (i可1〜L)とする。これを第2図(c)に
示す。代表区間以外の区間kにおける振幅補正係数01
1+ 位相補正係数d、は、これらと合成フィルタを用
いて区間kについて合成した合成音声x+、(n)と、
該当区間の音声Xk(n>との重み付は誤差電力Ekを
最小化するように求めることができる。重み付は誤差電
力E、は、次式(1)で与えられる。
Ek=Σ ((xt+ (n)−1k(n))*w (
n)1文k (n)=(kΣ g=・h  (n−mi
−T−dk)ここで、w (n)は聴感重み付はフィル
タのインパルス応答を示す。ただし、このフィルタはな
くてもよい。また、h (n)は音声を合成するための
合成フィルタのインパルス応答を示す。ck。
dkは+11式を最小化するように求めることができる
。このためには例えばまずdkを固定して、(1)式を
ckについて偏微分して0とおき、次式を得る。
ここで、Xwk (n) 、  交w++ (n)は、
それぞれXwk (n) −)(k(n) *w (n
)   ・・・(4a)xw、l (n)  −Σ g
= Hh  (n −mi−’r   dh)である。
従って、(3)式の値を種々のdkO値について求め、
(3)弐のC3を最小化するdkickの組合せを求め
ることにより(1)式のEkは最小化される。
このようにして、代表区間以外のピッチ区間に対してC
k、dkを求めフレーム全体に対して次式で定義される
誤差電力Eを次式(5)で求める。
E= Σ E、               ・ ・
 ・(5)ここで、Nはフレームに含まれるサブフレー
ムの個数である。ただし、代表ピッチ区間(第2図の例
ではサブフレーム区間■)の重み付は誤差電力E2は次
式で求める。
*w(n))”             ・ ・ ・
(6)代表ピッチ区間の探索は、全ての代表ピッチ区間
の候補について、(1)〜(6)式の値を求め、(5)
式の値を最も小さくする区間を代表ピッチ区間とするこ
とができる。第2図(c)に探索後の代表ピッチ区間が
サブフレーム■であった場合について、代表区間のマル
チパルスと、代表区間以外のに番目の区間(第2図(c
)ではに=1. 2. 4−、 5)の音源V、(n)
を次式に従い発生させた例を示す。
vt+(n)=chΣ gi・ δ (n −mi−’
r −dh)・ ・ ・ (7) 以上説明した方法により、有声区間では、フレーム毎に
代表区間を探索して代表区間のマルチパルスの振幅と位
置、他のピッチ区間の振幅1位相補正係数ck、dkを
音源情報として伝送し、さらに補助情報として合成フィ
ルタのスペクトルパラメータ、ピッチパラメータを伝送
することにより、従来方式の問題点を解決し4.8kb
/s程度でも良好な音質を提供できる。
一方、無声区間では音源をマルチパルスと雑音。
の組合せで表している。この具体的な構成については、
前記特願昭60−178911号明細書等を参照できる
更に、第1図の送信側及び受信側の各要素の動作を含め
つつその符号化処理、復号化処理の内容を具体的に説明
する。
第1図において、送信側では、入力端子100から音声
信号を入力し、1フレ一ム分の音声信号をパンツアメモ
リ110に格納する。ピッチ分析回路130は、フレー
ムの音声信号から平均ピッチ周期Tを計算する。この方
法としては、例えば自己相関法に基づく方法が知られて
おり、詳細は前記の各特許出願のピッチ抽出回路を参照
することができる。また、この方法以外にも他の周知な
方法(例えば、ケプストラム法、5IFT法、変相閣法
など)を用いることができる。ピッチ符号化回路150
は、平均ピッチ周期Tを予め定められたビット数で量子
化して得た符号をマルチプレクサ260へ出力するとと
もに、これを復号化して得た平均ピッチ周期T′を音源
信号計算回路220、補間回路282、駆動信号復元回
路283へ出力する。
Kパラメータ計算回路140は、フレームの音声信号の
スペクトル特性を表すパラメータとして、Kパラメータ
を前記フレームの音声信号から周知のLPG分析を行い
予め定められた次数Mだけ計算する。この具体的な方法
については、前記各特許出願のにパラメータ計算回路を
参照することができる。なお、KパラメータはPARC
OR係数同一のものである。Kパラメータ符号化回路1
60は、前記にパラメータを予め定められた量子化ビッ
ト数で量子化して得た符号1kをマルチプレクサ260
へ出力するとともに、これを復号化してさらに線形予測
係数ai′ (i=1〜M)に変換して重み付け回路2
00、補間回路282、インパルス応答計算回路170
へ出力する。Kパラメータの符号化、Kパラメータから
線形予測係数への変換の方法については前記各特許出願
明細書を参照することができる。
インパルス応答計算回路170は、前記線形予測係数を
用いて、聴感重み付けを行った合成フィルタのインパル
ス応答hw(n)を計算し、これを自己相関関数計算回
路180へ出力する。自己相関関数計算回路180は、
前記インパルス応答の自己相関関数Rhh(n)を予め
定められた遅れ時間まで計算して出力する。インパルス
応答計算回路170、自己相関関数計算回路180の動
作は前記各特許出願明細書を参照することができる。
減算器190は、フレームの音声信号x (n)から合
成フィルタ281の出力を1フレーム分減算し、減算結
果を重み付は回路200へ出力する。重み付は回路20
0は前記減算結果をインパルス応答がw (n)で表さ
れる聴感重み付はフィルタに通し、重み付は信号x、(
n)を得てこれを出力する。
重み付けの方法は前記各特許出願を参照できる。
相互相関関数計算回路210は、重み付は信号x、、(
n)とインパルス応答り。(n)を入力して相互相関関
数Φxhを予め定められた遅れ時間まで計算し出力する
。この計算法は前記各特許出願明細書を参照できる。
音源信号計算回路220は、ピッチゲインPgを予め定
められた゛しきい値T、と比較して有声、無声の判別を
行う。すなわち、P、>Tゎのときは有声、p、<’r
、のときは無声と判別する。次に有声区間では、前記原
理の項で説明したように、復号化した平均ピッチ周期T
′を用いてフレームを予めピッチ周期毎のサブフレーム
に分割し、音源信号として、代表的な1ピッチ区間(代
表区間)の候補となるピッチ区間に対してマルチパルス
の位置と振幅を求める。
次に振幅・位相補正係数計算回路270は、前記(3)
 、 (4a) 、 (4b)式に従い、他のピッチ区
間kにおける音源信号発生のためのマルチパルスの振幅
補正係数Ck、位相補正係数dkを計算する。さらに、
これらの値を音源信号計算回路220へ出力し、音源信
号計算回路220では前記(IL (5)、 (61式
に基づき、いくつかの候補区間についてフレーム全体の
誤差電力Eを計算し、Eを最も小さくするピッチ区間を
代表区間として選択し、代表区間のサブフレーム番号を
示す情報P4、代表区間のマルチパルスの振幅g正1位
置mu (i=1−1j 、及び他のピッチ区間の振幅
補正係数CI++位相補正係数dkを出力する。
一方、無声区間では、予め定められた個数のマルチパル
スと雑音信号で音源信号を表す。複数種類の雑音信号が
予め雑音メモリ225に格納されており、雑音の種類を
表すインデクスとゲインを求める。これらの計算はフレ
ームを予め定められた区間長に分割したサブフレーム毎
に行う。具体的な方法は、前記特願昭60−17891
1号明細書を参照することができる。この場合、音源信
号として伝送するのは、マルチパルスの振幅1位置と雑
音信号のインデクスとゲインである。
符号化回路230は、代表区間のマルチパルスの振幅g
i、位置m、を予め定められたビット数で符号化して出
力する。また、代表区間のサブフレームを示す情報Pl
、振幅補正係数ck、位相補正係数dkを予め定められ
たビット数で符号化してマルチプレクサ260へ出力す
る。さらに、これらを復号化して駆動信号復元回路28
3へ出力する。
駆動信号復元回路283は、を声区間では、平均ピッチ
周期T′を用いてフレームを前記音源信号計算回路22
0と同様な方法で分割し、代表区間のサブフレームを示
す情報P、、代表区間のマルチパルスの復号化された振
幅1位置を用いて、代表区間にはマルチパルスを発生し
、代表区間以外のピッチ区間では、前記代表区間のマル
チパルスと復号化された振幅補正係数、復号化された位
相補正係数を用いて、前記(7)式に従い音源信号■。
(n)を復元する。
一方、無声区間では、マルチパルスを発生させ、さらに
雑音信号のインデクスを用いて雑音メモリ225から雑
音信号をアクセスしてそれにゲインを乗じて音源信号を
復元する。無声区間での音源信号の復元法の詳細は前記
特願昭60−178911号明細書を参照することがで
きる。
補間回路282は、有声区間では、線形予測係数を一旦
にパラメータに変換してにパラメータ上でピッチ周期T
′のサブフレーム区間毎に補間し、線形予測係数に逆交
換し出力する。無声区間では補間は行わない。
合成フィルタ281は、前記復元された音源信号を入力
し、前記線形予測係数を入力して1フレ一ム分の合成音
声信号を求めるとともに、次のフレームへの影響信号を
1フレーム分計算しこれを減算器190へ出力する。な
お、影響信号の計算法は特願昭57−231605号明
細書等を参照できる。
マルチプレクサ260は、音源信号を表す符号、有声・
無声を表す符号、有声区間では代表区間のサブフレーム
を表す符号、平均ピッチ周期の符号、Kパラメータを表
す符号を組み合わせて出力する。
以上が本実施例の送信側の動作についての説明である。
このように、入力した離散的な音声信号からフレーム毎
にスペクトル包絡を表すスペクトルパラメータとピッチ
を表すピッチパラメータを抽出し符号化するパラメータ
のための計算回路と、前記フレーム区間を前記ピッチパ
ラメータに応じたピッチ区間に分割し前記フレーム毎の
音声信号の音源信号として前記ピッチ区間の内の1つの
ピッチ区間のマルチパルスと他のピッチ区間において前
記マルチパルスに関して振幅あるいは位相の少なくとも
一方を補正するための補正情報もしくは雑音とパルス列
との組合せを求めて符号化する音源信号のための計算回
路と、前記パラメータのための計算回路の出力符号と前
記音源信号のための計算回路の出力符号とを組み合わせ
て出力するマルチプレクサ回路とを有する構成の音声符
号化装置によって、本発明に係る送信側での音声符号化
処理を実現することができる。
一方、これに対する受信側での音声復号化処理は、スペ
クトルパラメータを表す符号とピッチパラメータを表す
符号と音源信号を表す符号とをデマルチプレクサで分離
して復号化するための回路と、フレームを前記復号した
ピッチパラメータに応じたピッチ区間に分割し1つのピ
ッチ区間についてマルチパルスを発生し他のピッチ区間
において前記マルチパルスに関して振幅あるいは位相の
少なくとも一方を補正する補正情報を用いてパルスを発
生させて前記フレームの駆動音源信号を復元するか、も
しくは雑音とパルス列の組合せを用いて前記フレームの
駆動音源信号を復元する駆動信号復元回路と、前記駆動
音源と前記復号したスペクトルパラメータとを用いて合
成音声を求め出力する合成フィルタとを有する構成の音
声復号化装置によって実現することができる。
すなわち第1図の場合は、受信側では、まず、デマルチ
プレクサ290は前記組み合わされた符号を入力し、音
源信号を表す符号、有声・無声を表す符号、有声区間で
は代表区間のサブフレームを表す符号、平均ピッチ周期
の符号、Kパラメータを表す符号を分離して出力する。
音源復号回路300は音源信号を表す符号を復号して駆
動信号復元回路340へ出力する。ピッチ復号回路32
0は平均ピッチ周期を復号して駆動信号復元回路340
と補間回路355へ出力する。復号回路315は、振幅
補正係数1位相補正係数を表す符号を入力しこれらを復
号して出力する。また代表区間のサブフレームを表す符
号を復号して出力する。
Kパラメータ復号回路330はにパラメータを表す符号
を復号して補間回路335へ出力する。
駆動信号復元回路340は、復号化した音源情報の他に
、有声・無声情報、有声の場合は復号化した平均ピッチ
周期、復号化した振幅補正係数、復号化した位相補正係
数、復号化した代表区間のサブフレーム位置を入力し、
送信側の駆動信号復元回路283と同一の動作を行い、
1フレームの駆動音源信号を復元して出力する。また、
雑音メモリ310は送信側の雑音メモリ225と同一の
構成となっている。
補間回路355は、送信側の補間回路282と同一の動
作を行い、有声区間ではにパラメータを復号した平均ピ
ッチ周期毎に直線補間し、さらにこれを線形予測係数に
変換して出力する。
合成フィルタ回路350は、復元したフレームの駆動音
源信号と線形予測係数を入力して1フレ一ム分の合成音
声x (n)を計算して端子360を通して出力する。
ここで合成フィルタの動作は、前記特願昭57−231
605号明細書に開示の合成フィルタを参照できる。
以上で本実施例の受信側の説明を終える。
上述した実施例はあくまで本発明の一構成に過ぎずその
変形例も種々考えられる。
例えば、前記実施例では、有声区間以外では音源信号を
少数のマルチパルスと雑音信号で表したが、これは周知
の確率符号化(Stochastic coding)
の方法により表すこともできる。この方法の詳細につい
ては、例えば5chroeder、へta1氏による“
Code−excitedlinear predic
tion (CELP): Ilighquality
 5peech at very low bit r
ates、   (IC^SSP、 937−940.
 1985)  (文献2)等を参照できる。さらに、
雑音メモリ225.310に格納されている雑音信号の
求め方としては、予め定められた確率密度特性(例えば
ガウス分布など)を有する白色雑音信号を格納しておい
てもよいし、予め多量の音声信号を予測して求めた予測
残差信号から学習により計算しておいてもよい。後者の
方法については、例えば、Makhou 1氏らによる
“VectorQuantization in  5
peech Coding、   (Proc、 IE
EE、 vol、73.11.1551−1588.1
985) (文献3)等を参照できる。
また、実施例では、フレームの音声信号を有声区間と無
声区間の2種に分類して異なる音源信号を用いたが、こ
の分類数を増やしてもよい。例えば、音声学的な知見を
利用して、母音、鼻音、摩擦音、破裂音等に分類してそ
れぞれ異なる音源信号を用いてもよい。
また、実施例では、スペクトルパラメータとしてにパラ
メータを符号化し、その分析法としてLPG分析を用い
たが、スペクトルパラメータとしては他の周知なパラメ
ータ、例えばLPS 、ケプストラム、改良ケプストラ
ム、−C化ケプストラム、メルケプストラムなどを用い
ることもできる。また、各パラメータに最適な分析法を
用いることができる。また、補間回路282. j3s
における補間すべきパラメータ及びその補間法について
は、他の周知な方法を用いることができる。具体的な補
間法は、例えばへta1氏らによる“5peech A
nalysis and 5ynthesis by 
Linear Prediction of 5pee
ch Waveと題した論文(J、Acoust、 S
oc、八m、、 pp、 637−6551971) 
 (文献4)等を参照できる。
さらに、有声区間では、代表区間以外のピッチ区間では
、振幅補正係数ckと位相補正係数dkを求めて伝送し
たが、復号化した平均ピッチ周期T′をピッチ区間毎に
補間することにより位相補正係数を伝送しない構成とす
ることもできる。また振幅補正係数は、ピッチ区間毎に
伝送するのではなくてピッチ区間毎に求めた振幅補正係
数の値を最小2乗曲線あるいは最小2乗直線で近似して
、前記曲線あるいは直線の係数を伝送するような構成に
してもよい。これらにより補正情報の伝送のための情報
量を低減することができる。
また、サブフレーム分割法としては、第2図(b)のよ
うにフレーム左端からピッチ周期T毎に分割したが、前
フレームから連続的に分割する方法や、前記特願昭59
−272435号、特願昭60−178911号に開示
のような分割法を用いることもできる。
また、演算量を大幅に低減するために、有声区間では、
代表区間をフレーム内の予め定められた区間に固定しく
例えば、フレームのほぼ中央のピッチ区間や、フレーム
内でパワーの最も大きいピッチ区間など)、代表区間の
探索をしない構成としてもよい。この場合は、各候補区
間に対する(5)。
(6)式の計算が不要となり、大幅な演算量低減が可能
となるが音質は低下する。
また、さらに演算量を低減するために、送信側では影響
信号の計算を省略することもできる。これによって、送
信側における駆動信号復元回路283、補間回路282
、合成フィルタ281、減算器190は不要となり演算
量低減が可能となるが、やはり音質は低下する。
また、受信側で合成フィルタ回路350の後段に、量子
化雑音を整形することにより聴覚的に聞き易くするため
に、ピッチとスペクトル包絡の少なくとも1つについて
動作する適応形ポストフィルタを付加してもよい。適応
形ポストフィルタの構成については、例えば、Kroo
n氏らによるA C1assof Analysis−
by−synthesis Predictive C
odersfor High Quality at 
Rates between 4.8 and 16k
b/s、   (IEEEJSAC,vol、6.2.
353−363.1988)(文献5)等を参照できる
なお、デジタル信号処理の分野でよく知られているよう
に、自己相関関数は周波数軸上でパワースペクトルに、
相互相関関数はクロスパワースペクトルに対応している
ので、これらから計算することもできる。これらの計算
法については、Oppenheim氏らによるDigi
tal Signal Processing(Pre
ntice−Hall、 1975)と題した単行本(
文献6)を参照できる。
〔発明の効果〕
以上説明したように、本発明によれば、有声区間の音源
信号を、フレームをピッチ周期に分割して1つのピッチ
区間(代表区間)のマルチパルスと他のピッチ区間では
補正情報、特に振幅補正係数、位相補正係数を用いて表
すことができるので、母音定常区間はもちろんのこと、
音韻知覚や自然性の知覚に重要な音声の特性が変化して
いる部分(有声の過渡部や母音間の変化部分)でも音質
の劣化のほとんどない合成音声を得ることができるとい
う大きな効゛果がある。さらに有声区間以外では、雑音
とマルチパルスの組合せにより音源信号を表すことがで
きるので、種々の子音に対して良好な合成音声を得るこ
とができるという大きな効果がある。
また、このような音質の良好な符号化復号化方法に適し
た音声符号装置、音声復号化装置を提供することができ
る。
【図面の簡単な説明】
第1図は本発明の音声符号化復号化方法及び音声符号化
装置並びに音声復号化装置の一実施例を示すブロック図
、 第2図は本発明の説明に供する有声フレームでの代表区
間と代表区間のマルチパルス及び振幅補正係数、位相補
正係数を示す説明図である。 110  ・・・・・バッファメモリ 130  ・・・・・ピッチ分析回路 140  ・・・・・Kパラメータ計算回路150  
・・・・・ピッチ符号化回路160  ・・・・・Kパ
ラメータ符号化回路170  ・・・・・インパルス応
答計算回路180  ・・・・・自己相関関数計算回路
190  ・・・・・減算器 200  ・・・・・重み付は回路 210  ・・・・・相互相関関数計算回路220  
・・・・・音源信号計算回路225、310・・ ・雑
音メモリ 230  ・・・・・符号化回路 260  ・・・・・マルチプレクサ 270  ・・・・・振幅・位相補正係数計算回路28
1、350・・・合成フィルタ 282、335・・・補間回路 283、340・・・駆動信号復元回路デマルチプレク
サ 音源復号回路 復号回路 ピッチ復号回路 にパラメータ復号回路

Claims (3)

    【特許請求の範囲】
  1. (1)送信側において、離散的な音声信号を入力し、そ
    の音声信号からフレーム毎にスペクトル包絡を表すスペ
    クトルパラメータとピッチを表すピッチパラメータとを
    抽出して前記フレーム区間をそのピッチ情報に応じたピ
    ッチ区間に分割し、前記音声信号の音源信号を、前記ピ
    ッチ区間のうち1つのピッチ区間のマルチパルスとその
    マルチパルスに関する補正情報もしくは雑音とパルス列
    との組合せで表し、 受信側では、前記1つのピッチ区間のマルチパルスと前
    記マルチパルスに関する補正情報もしくは前記雑音とパ
    ルス列との組合せと前記ピッチパラメータとを用いて前
    記フレームの駆動音源信号を復元し、前記スペクトルパ
    ラメータを用いて合成音声信号を求めることを特徴とす
    る音声符号化復号化方法。
  2. (2)入力した離散的な音声信号からフレーム毎にスペ
    クトル包絡を表すスペクトルパラメータとピッチを表す
    ピッチパラメータを抽出し符号化するパラメータ計算手
    段と、 フレーム区間を前記ピッチパラメータに応じたピッチ区
    間に分割し前記フレーム区間毎の音声信号の音源信号と
    して前記ピッチ区間のうちの1つのピッチ区間のマルチ
    パルスと他のピッチ区間において前記マルチパルスに関
    して振幅あるいは位相の少なくとも一方を補正するため
    の補正情報もしくは雑音とパルス列との組合せを求めて
    符号化する音源信号計算手段と、 前記パラメータ計算手段の出力符号と前記音源信号計算
    手段の出力符号とを組み合わせて出力するマルチプレク
    サとを有することを特徴とする音声符号化装置。
  3. (3)スペクトルパラメータを表す符号とピッチパラメ
    ータを表す符号と音源信号を表す符号とを分離して復号
    化する手段と、 フレームを前記復号化したピッチパラメータに応じたピ
    ッチ区間に分割し1つのピッチ区間についてマルチパル
    スを発生し他のピッチ区間において前記マルチパルスに
    関して振幅あるいは位相の少なくとも一方を補正する補
    正情報を用いてパルスを発生させて前記フレームの駆動
    音源信号を復元するか、もしくは雑音とパルス列の組合
    せを用いて前記フレームの駆動音源信号を復元する駆動
    信号復元手段と、 駆動音源と前記復号したスペクトルパラメータとを用い
    て合成音声を求め出力する合成フィルタとを有すること
    を特徴とする音声復号化装置。
JP63208201A 1988-08-24 1988-08-24 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 Expired - Lifetime JP2829978B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63208201A JP2829978B2 (ja) 1988-08-24 1988-08-24 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63208201A JP2829978B2 (ja) 1988-08-24 1988-08-24 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置

Publications (2)

Publication Number Publication Date
JPH0258100A true JPH0258100A (ja) 1990-02-27
JP2829978B2 JP2829978B2 (ja) 1998-12-02

Family

ID=16552338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63208201A Expired - Lifetime JP2829978B2 (ja) 1988-08-24 1988-08-24 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置

Country Status (1)

Country Link
JP (1) JP2829978B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5142584A (en) * 1989-07-20 1992-08-25 Nec Corporation Speech coding/decoding method having an excitation signal
JPH06230800A (ja) * 1992-12-30 1994-08-19 Internatl Business Mach Corp <Ibm> 音声データ圧縮及び再生の方法及び装置
US5864814A (en) * 1996-12-04 1999-01-26 Justsystem Corp. Voice-generating method and apparatus using discrete voice data for velocity and/or pitch
US5875427A (en) * 1996-12-04 1999-02-23 Justsystem Corp. Voice-generating/document making apparatus voice-generating/document making method and computer-readable medium for storing therein a program having a computer execute voice-generating/document making sequence
US6655730B2 (en) 1998-10-13 2003-12-02 Oji Paper Co., Ltd. Automobile interior headliner molding or forming member and an automobile interior headliner member using the same
CN112634914A (zh) * 2020-12-15 2021-04-09 中国科学技术大学 基于短时谱一致性的神经网络声码器训练方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61148500A (ja) * 1984-12-21 1986-07-07 日本電気株式会社 音声信号符号化方法とその装置
JPS6238500A (ja) * 1985-08-13 1987-02-19 日本電気株式会社 高能率音声符号化方式とその装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61148500A (ja) * 1984-12-21 1986-07-07 日本電気株式会社 音声信号符号化方法とその装置
JPS6238500A (ja) * 1985-08-13 1987-02-19 日本電気株式会社 高能率音声符号化方式とその装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5142584A (en) * 1989-07-20 1992-08-25 Nec Corporation Speech coding/decoding method having an excitation signal
JPH06230800A (ja) * 1992-12-30 1994-08-19 Internatl Business Mach Corp <Ibm> 音声データ圧縮及び再生の方法及び装置
US5864814A (en) * 1996-12-04 1999-01-26 Justsystem Corp. Voice-generating method and apparatus using discrete voice data for velocity and/or pitch
US5875427A (en) * 1996-12-04 1999-02-23 Justsystem Corp. Voice-generating/document making apparatus voice-generating/document making method and computer-readable medium for storing therein a program having a computer execute voice-generating/document making sequence
US6655730B2 (en) 1998-10-13 2003-12-02 Oji Paper Co., Ltd. Automobile interior headliner molding or forming member and an automobile interior headliner member using the same
CN112634914A (zh) * 2020-12-15 2021-04-09 中国科学技术大学 基于短时谱一致性的神经网络声码器训练方法
CN112634914B (zh) * 2020-12-15 2024-03-29 中国科学技术大学 基于短时谱一致性的神经网络声码器训练方法

Also Published As

Publication number Publication date
JP2829978B2 (ja) 1998-12-02

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
HK1040807B (zh) 可变速率语音编码
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP2956068B2 (ja) 音声符号化復号化方式
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3299099B2 (ja) 音声符号化装置
JP2992998B2 (ja) 音声符号化復号化装置
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3055901B2 (ja) 音声信号符号化復号化方法及び音声信号符号化装置
JP2508002B2 (ja) 音声符号化方法とその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3410931B2 (ja) 音声符号化方法及び装置
JPH02160300A (ja) 音声符号化方式
JP2658438B2 (ja) 音声符号化方法とその装置
JPH0511799A (ja) 音声符号化方式
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置
JP3144244B2 (ja) 音声符号化装置
JPH01233499A (ja) 音声信号符号化復号化方法及びその装置
JP2003015699A (ja) 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080925

Year of fee payment: 10

EXPY Cancellation because of completion of term