JPH0258100A

JPH0258100A - 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置

Info

Publication number: JPH0258100A
Application number: JP63208201A
Authority: JP
Inventors: Kazunori Ozawa; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1988-08-24
Filing date: 1988-08-24
Publication date: 1990-02-27
Anticipated expiration: 2013-12-02
Also published as: JP2829978B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、音声符号化復号化方法及び音声符号化装置並
びに音声復号化装置に関し、特に、音声信号を低いビッ
トレート、特に４．８ｋｂ／ｓ程度以下で、比較的少な
い演算量により高品質に符号化し、復号化できるように
するための音声符号化復号化方法及びその符号化、復号
化のための装置に関する。

〔従来の技術〕

音声信号を４．８ｋｂ／ｓ程度の低いビットレートで符
号化する方式としては、例えば特願昭５９−２７２４３
５号や特願昭６０−１７８９１１号明細書等に開示され
ているピッチ補間マルチパルス法が知られている。この
方法では、送信側では、フレーム毎の音声信号から音声
信号のスペクトル特性を表すスペクトルパラメータとピ
ッチパラメータを抽出し、有声区間では、１フレームの
音源信号を、１フレームをピッチ区間毎に分割した複数
個のピッチ区間のうちの一つのピッチ区間（代表区間）
についてマルチパルスで表し、代表区間におけるマルチ
パルスの振幅１位置とスペクトル、ピッチパラメータを
伝送する。また、無声区間では、■フレームの音源を少
数のマルチパルスと雑音信号で表し、マルチパルスの振
幅５位置と雑音信号のゲイン、インデクスを伝送する。

一方、受信側においては、有声区間では、代表区間のマ
ルチパルスと隣接フレームのマルチパルスとを用いてマ
ルチパルス同士を補間して代表区間以外のピッチ区間の
パルスを復元し、フレームの駆動音源信号を復元する。

また、無声区間では、マルチパルスと雑音信号のインデ
クス、ゲインを用いてフレームの音源信号を復元する。

さらに、復元した駆動音源信号を、スペクトルパラメー
タを用いた合成フィルタに入力して合成音声信号を出力
する。

〔発明が解決しようとする課題〕

しかしながら、上述した従来方式では、有声区間では代
表区間のマルチパルス同士の補間によりフレームの駆動
音源信号を復元しているので、母音連鎖の母音から母音
へ遷移する部分や有声の過渡部など、音声信号の特性が
変化しているフレームでは、補間により復元した駆動音
源信号は大きく劣化し、その結果、合成音声の音質が劣
化していた。このような音声の特性が大きく変化する部
分は、音韻知覚や自然性の知覚に非常に重要であること
が知られているが、従来方式ではこれらの部分の情報が
十分に復元できないので音質が劣化するという大きな問
題点があった。

本発明の目的は夷上述した問題点を解決し、比較的少な
い演算量により低いビットレートでも音質の良好な音声
符号化復号化方法及びその方法に適した音声符号化装置
、音声復号化装置を提供することにある。

〔課題を解決するための手段〕

本発明の音声４１号化復号化方法は、送信側において、離散的な音声信号を入力し、その音声
信号からフレーム毎にスペクトル包絡を表すスペクトル
パラメータとピッチを表すピッチパラメータとを抽出し
て前記フレーム区間をそのピッチ情報に応じたピッチ区
間に分割し、前記音声信号の音源信号を、前記ピッチ区
間のうち１つのピッチ区間のマルチパルスとそのマルチ
パルスに関する補正情報もしくは雑音とパルス列との組
合せで表し、受信側では、前記１つのピッチ区間のマルチパルスと前
記マルチパルスに関する補正情報もしくは前記雑音とパ
ルス列との組合せと前記ピソチバラメータとを用いて前
記フレームの駆動音源信号を復元し、前記スペクトルパ
ラメータを用いて合成音声信号を求めることを特徴とし
ている。

また、本発明の音声符号化装置は、入力した離散的な音声信号からフレーム毎にスペクトル
包絡を表すスペクトルパラメータとピッチを表すピッチ
パラメータを抽出し符号化するパラメータ計算手段と、フレーム区間を前記ピッチパラメータに応じたピッチ区
間に分割し前記フレーム区間毎の音声信号の音源信号と
して前記ピッチ区間のうちの１つのピッチ区間のマルチ
パルスと他のピッチ区間において前記マルチパルスに関
して振幅あるいは位相の少なくとも一方を補正するため
の補正情報もしくは雑音とパルス列との組合せを求めて
符号化する音源信号計算手段と、前記パラメータ計算手段の出力符号と前記音源信号計算
手段の出力符号とを組み合わせて出力するマルチプレク
サとを有することを特徴としている。

更に、本発明の音声復号化装置は、スペクトルパラメータを表す符号とピッチパラメータを
表す符号と音源信号を表す符号とを分離して復号化する
手段と、フレームを前記復号化したピッチパラメータに応じたピ
ッチ区間に分割し１つのピッチ区間についてマルチパル
スを発生し他のピッチ区間において前記マルチパルスに
関して振幅あるいは位相の少なくとも一方を補正する補
正情報を用いてパルスを発生させて前記フレームの駆動
音源信号を復元するかもしくは雑音とパルス列の組合せ
を用いて前記フレームの駆動音源信号を復元する駆動信
号復元手段と、駆動音源と前記復号したスペクトルパラメータとを用い
て合成音声を求め出力する合成フィルタとを有すること
を特徴としている。

〔作用〕

本発明によれば、有声区間の音源信号を、フレームをピ
ッチ周期に分割して１つのピッチ区間（代表区間）のマ
ルチパルスと他のピッチ区間では補正情報を用いて表す
ことが可能となる。補正情報としては、より望ましくは
振幅補正係数、位相補正係数とすることができる。

かかる音源信号の処理は、従来のものにおける駆動音源
信号の劣化回避に有効であり、音声の特性が大きく変化
する部分であっても音質の良好な合成音声を得ることを
可能ならしめる。また、有声区間以外では、雑音とマル
チパルスの組合せにより音源信号を表すことができるの
で、種々の子音に対しても良好な合成音声を得られる。

〔実施例〕

次に、本発明の実施例について図面を参照して説明する
。

第１図は本発明による音声符号化復号化方法とそのため
の符号化装置及び復号化装置の一実施例を示すブロック
図である。また、第２図は有声フレームでの代表区間と
代表区間のマルチパルス及び振幅補正係数、位相補正係
数を説明するための図である。

第１図に示すように、音声信号の符号化、復号化処理の
ための伝送系は、送信側の符号化装置と受信側の復号化
装置とから構成される。

本実施例では、送信側は、バッファメモリ１１０を備え
ると共に、ピッチ分析回路１３０と、ピッチ符号化回路
１５０と、スペクトルパラメータを表すパラメータとし
てのにパラメータのためのにパラメータ計算回路１４０
と、Ｋパラメータ符号化回路１６０とを有する。

更に、インパルス応答計算回路１７０と、自己相関関数
計算回路１８０と、減算器１９０と、重み付は回路２０
０と、相互相関関数計算回路２１０と、音源信号計算回
路２２０と、符号化回路２３０と、マルチプレクサ２６
０とを備えると共に、振幅・位相補正係数計算回路２７
０と、雑音メモリ２２５と、駆動信号復元回路２８３と
、合成フィルタ２８１と、補間回路２８２とを備えて構
成されている。

送信側では、符号１００で示す入力端子に音声信号が供
給され、ピッチ符号化回路１５０　、Ｋパラメータ符号
化回路１６０及び符号化回路２３０の各出力が供給され
るマルチプレクサ２６０を介して符号化出力が受信側へ
送出される。

受信側は、第１図に示すように、デマルチプレクサ２９
０と、音源復号回路３００と、雑音メモリ３１０と、復
号回路３１５と、ピッチ復号回路３２０と、Ｋパラメー
タ復号回路３３０を備えると共に、駆動信号復元回路３
４０の他、補間回路３３５、合成フィルタ回路３５０を
含んで構成されており、デマルチプレクサ２９０に送信
側からの符号化出力が供給され、出力端子３６０を通し
て合成音声が取り出される。

入力端子１００に入力される音声信号の符号化。

復号化処理は、送信側では、離散的な音声信号を入力し
前記音声信号からフレーム毎にスペクトル包絡を表すス
ペクトルバラメークとピッチを表すピッチパラメータと
を抽出して前記フレーム区間を前記ピッチ情報に応じた
ピッチ区間に分割し、前記音声信号の音源信号を前記ピ
ッチ区間のうち１つのピッチ区間のマルチパルスと前記
マルチパルスに関する補正情報もしくは雑音とパルス列
との組合せで表し、受信側では、前記１つのピッチ区間
のマルチパルスと前記マルチパルスに関する補正情報も
しくは前記雑音とパルス列との組合せと前記ピッチパラ
メータとを用いて前記フレームの駆動音源信号を復元し
前記スペクトルパラメータを用いて合成音声信号を求め
ることによって行われる。

以下、まず、これについて第２図に示す例を参照してそ
の原理を説明する。

第１図に示した本発明に従う音声符号化復号化方法及び
装置は、有声区間では、フレーム区間をピッチ周期毎の
ピッチ区間に分割し、前記ピッチ区間のうちの１つのピ
ッチ区間（代表区間）についてマルチパルスを求め、同
一フレーム内の他のピッチ区間については前記マルチパ
ルスに対する振幅補正係数ｃｋ＋位相補正係数ｄ、を求
め、そして、フレーム毎に、音源情報として代表区間の
フレーム内のピッチ位置、代表区間のマルチハ／Ｌ／ス
の振幅２位置と同一フレームの他のピッチ区間の振幅補
正係数ｃｌｉ＋位相補正係数ｄ、を伝送し、さらに、補
助情報としてスペクトルパラメータ、ピッチパラメータ
、有声／無声判別情＋Ｉｌを伝送することを特徴とする
。代表区間は、最も良好な合成音声信号が求められる区
間を探索して求めてもよいし、フレーム内で固定として
もよい。音質は前者の方が良好であるが、演算量は多く
なる。

以下で振幅補正係数ｃｋ＋位相補正係数ｄｋの求め方、
代表区間の探索法を示す。今、フレームで求めた平均ピ
ッチ周期をＴとする。１フレームの音声波形フレームを
Ｔ毎のサブフレーム区間に分割した様子を第２図（ａ）
、　　（ｂ）に示す。ここでは、代表区間を探索する場
合について示す。

代表区間の候補となるサブフレームを例えばサブフレー
ム■とする。サブフレーム■について予め定められた個
数りのマルチパルスの振幅１位置を求める。マルチパル
スの求め方については、相互相関関数Φｘｈと自己相関
関数Ｒｈｈを用いて求める方法が知られており、これは
例えば前記各特許出願明細書や、Ａｒａｓｅｋｉ、　Ｏ
ｚａｗａ、　Ｏｎｏ、　０ｃｈｉａｉ氏による”　Ｍｕ
ｌｔｉ−ｐｕｌｓｅ　Ｅｘｃｉｔｅｄ　５ｐｅｅｃｈ　
Ｃｏｄｅｒ　Ｂａ５ｅｄｏｎ　Ｍａｘｉｍｕｍ　Ｃｒｏ
ｓｓ−ｃｏｒｒｅｌａｔｉｏｎ　５ｅａｒｃｈ　Ａｌｇ
ｏｒｉｔｈｍ。

（ＧＬＯＢＥＣＯＭ　８３．　ＩＥＥＥ　Ｇｌｏｂａｌ
　ＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓＣｏｎ　ｆ　
ｅｒｅｎｃｅ、講演番号２３．３．１９８３）　　（文
献１）に記載されているので、ここではその詳細な説明
は省略する。

代表区間のマルチパルスの振幅２位置をそれぞれｇ＝　
、ｍｉ　（ｉ可１〜Ｌ）とする。これを第２図（ｃ）に
示す。代表区間以外の区間ｋにおける振幅補正係数０１
１＋　位相補正係数ｄ、は、これらと合成フィルタを用
いて区間ｋについて合成した合成音声ｘ＋、（ｎ）と、
該当区間の音声Ｘｋ（ｎ＞との重み付は誤差電力Ｅｋを
最小化するように求めることができる。重み付は誤差電
力Ｅ、は、次式（１）で与えられる。

Ｅｋ＝Σ　（（ｘｔ＋　（ｎ）−１ｋ（ｎ））＊ｗ　（
ｎ）１文ｋ　（ｎ）＝（ｋΣ　ｇ＝・ｈ　　（ｎ−ｍｉ
−Ｔ−ｄｋ）ここで、ｗ　（ｎ）は聴感重み付はフィル
タのインパルス応答を示す。ただし、このフィルタはな
くてもよい。また、ｈ　（ｎ）は音声を合成するための
合成フィルタのインパルス応答を示す。ｃｋ。

ｄｋは＋１１式を最小化するように求めることができる
。このためには例えばまずｄｋを固定して、（１）式を
ｃｋについて偏微分して０とおき、次式を得る。

ここで、Ｘｗｋ　（ｎ）　、　　交ｗ＋＋　（ｎ）は、
それぞれＸｗｋ　（ｎ）　−）（ｋ（ｎ）　＊ｗ　（ｎ
）　　　・・・（４ａ）ｘｗ、ｌ　（ｎ）　　−Σ　ｇ
＝　Ｈｈ　　（ｎ　−ｍｉ−’ｒ　　　ｄｈ）である。

従って、（３）式の値を種々のｄｋＯ値について求め、
（３）弐のＣ３を最小化するｄｋｉｃｋの組合せを求め
ることにより（１）式のＥｋは最小化される。

このようにして、代表区間以外のピッチ区間に対してＣ
ｋ、ｄｋを求めフレーム全体に対して次式で定義される
誤差電力Ｅを次式（５）で求める。

Ｅ＝　Σ　Ｅ、　　　　　　　　　　　　　　　・　・
　・（５）ここで、Ｎはフレームに含まれるサブフレー
ムの個数である。ただし、代表ピッチ区間（第２図の例
ではサブフレーム区間■）の重み付は誤差電力Ｅ２は次
式で求める。

＊ｗ（ｎ））”　　　　　　　　　　　　　・　・　・
（６）代表ピッチ区間の探索は、全ての代表ピッチ区間
の候補について、（１）〜（６）式の値を求め、（５）
式の値を最も小さくする区間を代表ピッチ区間とするこ
とができる。第２図（ｃ）に探索後の代表ピッチ区間が
サブフレーム■であった場合について、代表区間のマル
チパルスと、代表区間以外のに番目の区間（第２図（ｃ
）ではに＝１．　２．　４−、　５）の音源Ｖ、（ｎ）
を次式に従い発生させた例を示す。

ｖｔ＋（ｎ）＝ｃｈΣ　ｇｉ・　δ　（ｎ　−ｍｉ−’
ｒ　−ｄｈ）・　・　・　（７）以上説明した方法により、有声区間では、フレーム毎に
代表区間を探索して代表区間のマルチパルスの振幅と位
置、他のピッチ区間の振幅１位相補正係数ｃｋ、ｄｋを
音源情報として伝送し、さらに補助情報として合成フィ
ルタのスペクトルパラメータ、ピッチパラメータを伝送
することにより、従来方式の問題点を解決し４．８ｋｂ
／ｓ程度でも良好な音質を提供できる。

一方、無声区間では音源をマルチパルスと雑音。

の組合せで表している。この具体的な構成については、
前記特願昭６０−１７８９１１号明細書等を参照できる
。

更に、第１図の送信側及び受信側の各要素の動作を含め
つつその符号化処理、復号化処理の内容を具体的に説明
する。

第１図において、送信側では、入力端子１００から音声
信号を入力し、１フレ一ム分の音声信号をパンツアメモ
リ１１０に格納する。ピッチ分析回路１３０は、フレー
ムの音声信号から平均ピッチ周期Ｔを計算する。この方
法としては、例えば自己相関法に基づく方法が知られて
おり、詳細は前記の各特許出願のピッチ抽出回路を参照
することができる。また、この方法以外にも他の周知な
方法（例えば、ケプストラム法、５ＩＦＴ法、変相閣法
など）を用いることができる。ピッチ符号化回路１５０
は、平均ピッチ周期Ｔを予め定められたビット数で量子
化して得た符号をマルチプレクサ２６０へ出力するとと
もに、これを復号化して得た平均ピッチ周期Ｔ′を音源
信号計算回路２２０、補間回路２８２、駆動信号復元回
路２８３へ出力する。

Ｋパラメータ計算回路１４０は、フレームの音声信号の
スペクトル特性を表すパラメータとして、Ｋパラメータ
を前記フレームの音声信号から周知のＬＰＧ分析を行い
予め定められた次数Ｍだけ計算する。この具体的な方法
については、前記各特許出願のにパラメータ計算回路を
参照することができる。なお、ＫパラメータはＰＡＲＣ
ＯＲ係数同一のものである。Ｋパラメータ符号化回路１
６０は、前記にパラメータを予め定められた量子化ビッ
ト数で量子化して得た符号１ｋをマルチプレクサ２６０
へ出力するとともに、これを復号化してさらに線形予測
係数ａｉ′　（ｉ＝１〜Ｍ）に変換して重み付け回路２
００、補間回路２８２、インパルス応答計算回路１７０
へ出力する。Ｋパラメータの符号化、Ｋパラメータから
線形予測係数への変換の方法については前記各特許出願
明細書を参照することができる。

インパルス応答計算回路１７０は、前記線形予測係数を
用いて、聴感重み付けを行った合成フィルタのインパル
ス応答ｈｗ（ｎ）を計算し、これを自己相関関数計算回
路１８０へ出力する。自己相関関数計算回路１８０は、
前記インパルス応答の自己相関関数Ｒｈｈ（ｎ）を予め
定められた遅れ時間まで計算して出力する。インパルス
応答計算回路１７０、自己相関関数計算回路１８０の動
作は前記各特許出願明細書を参照することができる。

減算器１９０は、フレームの音声信号ｘ　（ｎ）から合
成フィルタ２８１の出力を１フレーム分減算し、減算結
果を重み付は回路２００へ出力する。重み付は回路２０
０は前記減算結果をインパルス応答がｗ　（ｎ）で表さ
れる聴感重み付はフィルタに通し、重み付は信号ｘ、（
ｎ）を得てこれを出力する。

重み付けの方法は前記各特許出願を参照できる。

相互相関関数計算回路２１０は、重み付は信号ｘ、、（
ｎ）とインパルス応答り。（ｎ）を入力して相互相関関
数Φｘｈを予め定められた遅れ時間まで計算し出力する
。この計算法は前記各特許出願明細書を参照できる。

音源信号計算回路２２０は、ピッチゲインＰｇを予め定
められた゛しきい値Ｔ、と比較して有声、無声の判別を
行う。すなわち、Ｐ、＞Ｔゎのときは有声、ｐ、＜’ｒ
、のときは無声と判別する。次に有声区間では、前記原
理の項で説明したように、復号化した平均ピッチ周期Ｔ
′を用いてフレームを予めピッチ周期毎のサブフレーム
に分割し、音源信号として、代表的な１ピッチ区間（代
表区間）の候補となるピッチ区間に対してマルチパルス
の位置と振幅を求める。

次に振幅・位相補正係数計算回路２７０は、前記（３）
　、　（４ａ）　、　（４ｂ）式に従い、他のピッチ区
間ｋにおける音源信号発生のためのマルチパルスの振幅
補正係数Ｃｋ、位相補正係数ｄｋを計算する。さらに、
これらの値を音源信号計算回路２２０へ出力し、音源信
号計算回路２２０では前記（ＩＬ　（５）、　（６１式
に基づき、いくつかの候補区間についてフレーム全体の
誤差電力Ｅを計算し、Ｅを最も小さくするピッチ区間を
代表区間として選択し、代表区間のサブフレーム番号を
示す情報Ｐ４、代表区間のマルチパルスの振幅ｇ正１位
置ｍｕ　（ｉ＝１−１ｊ　、及び他のピッチ区間の振幅
補正係数ＣＩ＋＋位相補正係数ｄｋを出力する。

一方、無声区間では、予め定められた個数のマルチパル
スと雑音信号で音源信号を表す。複数種類の雑音信号が
予め雑音メモリ２２５に格納されており、雑音の種類を
表すインデクスとゲインを求める。これらの計算はフレ
ームを予め定められた区間長に分割したサブフレーム毎
に行う。具体的な方法は、前記特願昭６０−１７８９１
１号明細書を参照することができる。この場合、音源信
号として伝送するのは、マルチパルスの振幅１位置と雑
音信号のインデクスとゲインである。

符号化回路２３０は、代表区間のマルチパルスの振幅ｇ
ｉ、位置ｍ、を予め定められたビット数で符号化して出
力する。また、代表区間のサブフレームを示す情報Ｐｌ
、振幅補正係数ｃｋ、位相補正係数ｄｋを予め定められ
たビット数で符号化してマルチプレクサ２６０へ出力す
る。さらに、これらを復号化して駆動信号復元回路２８
３へ出力する。

駆動信号復元回路２８３は、を声区間では、平均ピッチ
周期Ｔ′を用いてフレームを前記音源信号計算回路２２
０と同様な方法で分割し、代表区間のサブフレームを示
す情報Ｐ、、代表区間のマルチパルスの復号化された振
幅１位置を用いて、代表区間にはマルチパルスを発生し
、代表区間以外のピッチ区間では、前記代表区間のマル
チパルスと復号化された振幅補正係数、復号化された位
相補正係数を用いて、前記（７）式に従い音源信号■。

（ｎ）を復元する。

一方、無声区間では、マルチパルスを発生させ、さらに
雑音信号のインデクスを用いて雑音メモリ２２５から雑
音信号をアクセスしてそれにゲインを乗じて音源信号を
復元する。無声区間での音源信号の復元法の詳細は前記
特願昭６０−１７８９１１号明細書を参照することがで
きる。

補間回路２８２は、有声区間では、線形予測係数を一旦
にパラメータに変換してにパラメータ上でピッチ周期Ｔ
′のサブフレーム区間毎に補間し、線形予測係数に逆交
換し出力する。無声区間では補間は行わない。

合成フィルタ２８１は、前記復元された音源信号を入力
し、前記線形予測係数を入力して１フレ一ム分の合成音
声信号を求めるとともに、次のフレームへの影響信号を
１フレーム分計算しこれを減算器１９０へ出力する。な
お、影響信号の計算法は特願昭５７−２３１６０５号明
細書等を参照できる。

マルチプレクサ２６０は、音源信号を表す符号、有声・
無声を表す符号、有声区間では代表区間のサブフレーム
を表す符号、平均ピッチ周期の符号、Ｋパラメータを表
す符号を組み合わせて出力する。

以上が本実施例の送信側の動作についての説明である。

このように、入力した離散的な音声信号からフレーム毎
にスペクトル包絡を表すスペクトルパラメータとピッチ
を表すピッチパラメータを抽出し符号化するパラメータ
のための計算回路と、前記フレーム区間を前記ピッチパ
ラメータに応じたピッチ区間に分割し前記フレーム毎の
音声信号の音源信号として前記ピッチ区間の内の１つの
ピッチ区間のマルチパルスと他のピッチ区間において前
記マルチパルスに関して振幅あるいは位相の少なくとも
一方を補正するための補正情報もしくは雑音とパルス列
との組合せを求めて符号化する音源信号のための計算回
路と、前記パラメータのための計算回路の出力符号と前
記音源信号のための計算回路の出力符号とを組み合わせ
て出力するマルチプレクサ回路とを有する構成の音声符
号化装置によって、本発明に係る送信側での音声符号化
処理を実現することができる。

一方、これに対する受信側での音声復号化処理は、スペ
クトルパラメータを表す符号とピッチパラメータを表す
符号と音源信号を表す符号とをデマルチプレクサで分離
して復号化するための回路と、フレームを前記復号した
ピッチパラメータに応じたピッチ区間に分割し１つのピ
ッチ区間についてマルチパルスを発生し他のピッチ区間
において前記マルチパルスに関して振幅あるいは位相の
少なくとも一方を補正する補正情報を用いてパルスを発
生させて前記フレームの駆動音源信号を復元するか、も
しくは雑音とパルス列の組合せを用いて前記フレームの
駆動音源信号を復元する駆動信号復元回路と、前記駆動
音源と前記復号したスペクトルパラメータとを用いて合
成音声を求め出力する合成フィルタとを有する構成の音
声復号化装置によって実現することができる。

すなわち第１図の場合は、受信側では、まず、デマルチ
プレクサ２９０は前記組み合わされた符号を入力し、音
源信号を表す符号、有声・無声を表す符号、有声区間で
は代表区間のサブフレームを表す符号、平均ピッチ周期
の符号、Ｋパラメータを表す符号を分離して出力する。

音源復号回路３００は音源信号を表す符号を復号して駆
動信号復元回路３４０へ出力する。ピッチ復号回路３２
０は平均ピッチ周期を復号して駆動信号復元回路３４０
と補間回路３５５へ出力する。復号回路３１５は、振幅
補正係数１位相補正係数を表す符号を入力しこれらを復
号して出力する。また代表区間のサブフレームを表す符
号を復号して出力する。

Ｋパラメータ復号回路３３０はにパラメータを表す符号
を復号して補間回路３３５へ出力する。

駆動信号復元回路３４０は、復号化した音源情報の他に
、有声・無声情報、有声の場合は復号化した平均ピッチ
周期、復号化した振幅補正係数、復号化した位相補正係
数、復号化した代表区間のサブフレーム位置を入力し、
送信側の駆動信号復元回路２８３と同一の動作を行い、
１フレームの駆動音源信号を復元して出力する。また、
雑音メモリ３１０は送信側の雑音メモリ２２５と同一の
構成となっている。

補間回路３５５は、送信側の補間回路２８２と同一の動
作を行い、有声区間ではにパラメータを復号した平均ピ
ッチ周期毎に直線補間し、さらにこれを線形予測係数に
変換して出力する。

合成フィルタ回路３５０は、復元したフレームの駆動音
源信号と線形予測係数を入力して１フレ一ム分の合成音
声ｘ　（ｎ）を計算して端子３６０を通して出力する。

ここで合成フィルタの動作は、前記特願昭５７−２３１
６０５号明細書に開示の合成フィルタを参照できる。

以上で本実施例の受信側の説明を終える。

上述した実施例はあくまで本発明の一構成に過ぎずその
変形例も種々考えられる。

例えば、前記実施例では、有声区間以外では音源信号を
少数のマルチパルスと雑音信号で表したが、これは周知
の確率符号化（Ｓｔｏｃｈａｓｔｉｃ　ｃｏｄｉｎｇ）
の方法により表すこともできる。この方法の詳細につい
ては、例えば５ｃｈｒｏｅｄｅｒ、へｔａ１氏による“
Ｃｏｄｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒ　ｐｒｅｄｉｃ
ｔｉｏｎ　（ＣＥＬＰ）：　Ｉｌｉｇｈｑｕａｌｉｔｙ
　５ｐｅｅｃｈ　ａｔ　ｖｅｒｙ　ｌｏｗ　ｂｉｔ　ｒ
ａｔｅｓ、　　　（ＩＣ＾ＳＳＰ、　９３７−９４０．
　１９８５）　　（文献２）等を参照できる。さらに、
雑音メモリ２２５．３１０に格納されている雑音信号の
求め方としては、予め定められた確率密度特性（例えば
ガウス分布など）を有する白色雑音信号を格納しておい
てもよいし、予め多量の音声信号を予測して求めた予測
残差信号から学習により計算しておいてもよい。後者の
方法については、例えば、Ｍａｋｈｏｕ　１氏らによる
“ＶｅｃｔｏｒＱｕａｎｔｉｚａｔｉｏｎ　ｉｎ　　５
ｐｅｅｃｈ　Ｃｏｄｉｎｇ、　　　（Ｐｒｏｃ、　ＩＥ
ＥＥ、　ｖｏｌ、７３．１１．１５５１−１５８８．１
９８５）　（文献３）等を参照できる。

また、実施例では、フレームの音声信号を有声区間と無
声区間の２種に分類して異なる音源信号を用いたが、こ
の分類数を増やしてもよい。例えば、音声学的な知見を
利用して、母音、鼻音、摩擦音、破裂音等に分類してそ
れぞれ異なる音源信号を用いてもよい。

また、実施例では、スペクトルパラメータとしてにパラ
メータを符号化し、その分析法としてＬＰＧ分析を用い
たが、スペクトルパラメータとしては他の周知なパラメ
ータ、例えばＬＰＳ　、ケプストラム、改良ケプストラ
ム、−Ｃ化ケプストラム、メルケプストラムなどを用い
ることもできる。また、各パラメータに最適な分析法を
用いることができる。また、補間回路２８２．　ｊ３ｓ
における補間すべきパラメータ及びその補間法について
は、他の周知な方法を用いることができる。具体的な補
間法は、例えばへｔａ１氏らによる“５ｐｅｅｃｈ　Ａ
ｎａｌｙｓｉｓ　ａｎｄ　５ｙｎｔｈｅｓｉｓ　ｂｙ　
Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ　ｏｆ　５ｐｅｅ
ｃｈ　Ｗａｖｅと題した論文（Ｊ、Ａｃｏｕｓｔ、　Ｓ
ｏｃ、八ｍ、、　ｐｐ、　６３７−６５５１９７１）　
　（文献４）等を参照できる。

さらに、有声区間では、代表区間以外のピッチ区間では
、振幅補正係数ｃｋと位相補正係数ｄｋを求めて伝送し
たが、復号化した平均ピッチ周期Ｔ′をピッチ区間毎に
補間することにより位相補正係数を伝送しない構成とす
ることもできる。また振幅補正係数は、ピッチ区間毎に
伝送するのではなくてピッチ区間毎に求めた振幅補正係
数の値を最小２乗曲線あるいは最小２乗直線で近似して
、前記曲線あるいは直線の係数を伝送するような構成に
してもよい。これらにより補正情報の伝送のための情報
量を低減することができる。

また、サブフレーム分割法としては、第２図（ｂ）のよ
うにフレーム左端からピッチ周期Ｔ毎に分割したが、前
フレームから連続的に分割する方法や、前記特願昭５９
−２７２４３５号、特願昭６０−１７８９１１号に開示
のような分割法を用いることもできる。

また、演算量を大幅に低減するために、有声区間では、
代表区間をフレーム内の予め定められた区間に固定しく
例えば、フレームのほぼ中央のピッチ区間や、フレーム
内でパワーの最も大きいピッチ区間など）、代表区間の
探索をしない構成としてもよい。この場合は、各候補区
間に対する（５）。

（６）式の計算が不要となり、大幅な演算量低減が可能
となるが音質は低下する。

また、さらに演算量を低減するために、送信側では影響
信号の計算を省略することもできる。これによって、送
信側における駆動信号復元回路２８３、補間回路２８２
、合成フィルタ２８１、減算器１９０は不要となり演算
量低減が可能となるが、やはり音質は低下する。

また、受信側で合成フィルタ回路３５０の後段に、量子
化雑音を整形することにより聴覚的に聞き易くするため
に、ピッチとスペクトル包絡の少なくとも１つについて
動作する適応形ポストフィルタを付加してもよい。適応
形ポストフィルタの構成については、例えば、Ｋｒｏｏ
ｎ氏らによるＡ　Ｃ１ａｓｓｏｆ　Ａｎａｌｙｓｉｓ−
ｂｙ−ｓｙｎｔｈｅｓｉｓ　Ｐｒｅｄｉｃｔｉｖｅ　Ｃ
ｏｄｅｒｓｆｏｒ　Ｈｉｇｈ　Ｑｕａｌｉｔｙ　ａｔ　
Ｒａｔｅｓ　ｂｅｔｗｅｅｎ　４．８　ａｎｄ　１６ｋ
ｂ／ｓ、　　　（ＩＥＥＥＪＳＡＣ，ｖｏｌ、６．２．
３５３−３６３．１９８８）（文献５）等を参照できる
。

なお、デジタル信号処理の分野でよく知られているよう
に、自己相関関数は周波数軸上でパワースペクトルに、
相互相関関数はクロスパワースペクトルに対応している
ので、これらから計算することもできる。これらの計算
法については、Ｏｐｐｅｎｈｅｉｍ氏らによるＤｉｇｉ
ｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ（Ｐｒｅ
ｎｔｉｃｅ−Ｈａｌｌ、　１９７５）と題した単行本（
文献６）を参照できる。

〔発明の効果〕

以上説明したように、本発明によれば、有声区間の音源
信号を、フレームをピッチ周期に分割して１つのピッチ
区間（代表区間）のマルチパルスと他のピッチ区間では
補正情報、特に振幅補正係数、位相補正係数を用いて表
すことができるので、母音定常区間はもちろんのこと、
音韻知覚や自然性の知覚に重要な音声の特性が変化して
いる部分（有声の過渡部や母音間の変化部分）でも音質
の劣化のほとんどない合成音声を得ることができるとい
う大きな効゛果がある。さらに有声区間以外では、雑音
とマルチパルスの組合せにより音源信号を表すことがで
きるので、種々の子音に対して良好な合成音声を得るこ
とができるという大きな効果がある。

また、このような音質の良好な符号化復号化方法に適し
た音声符号装置、音声復号化装置を提供することができ
る。

【図面の簡単な説明】

第１図は本発明の音声符号化復号化方法及び音声符号化
装置並びに音声復号化装置の一実施例を示すブロック図
、第２図は本発明の説明に供する有声フレームでの代表区
間と代表区間のマルチパルス及び振幅補正係数、位相補
正係数を示す説明図である。１１０　　・・・・・バッファメモリ１３０　　・・・・・ピッチ分析回路１４０　　・・・・・Ｋパラメータ計算回路１５０　　
・・・・・ピッチ符号化回路１６０　　・・・・・Ｋパ
ラメータ符号化回路１７０　　・・・・・インパルス応
答計算回路１８０　　・・・・・自己相関関数計算回路
１９０　　・・・・・減算器２００　　・・・・・重み付は回路２１０　　・・・・・相互相関関数計算回路２２０　　
・・・・・音源信号計算回路２２５、３１０・・　・雑
音メモリ２３０　　・・・・・符号化回路２６０　　・・・・・マルチプレクサ２７０　　・・・・・振幅・位相補正係数計算回路２８
１、３５０・・・合成フィルタ２８２、３３５・・・補間回路２８３、３４０・・・駆動信号復元回路デマルチプレク
サ音源復号回路復号回路ピッチ復号回路にパラメータ復号回路

Claims

【特許請求の範囲】

（１）送信側において、離散的な音声信号を入力し、そ
の音声信号からフレーム毎にスペクトル包絡を表すスペ
クトルパラメータとピッチを表すピッチパラメータとを
抽出して前記フレーム区間をそのピッチ情報に応じたピ
ッチ区間に分割し、前記音声信号の音源信号を、前記ピ
ッチ区間のうち１つのピッチ区間のマルチパルスとその
マルチパルスに関する補正情報もしくは雑音とパルス列
との組合せで表し、受信側では、前記１つのピッチ区間のマルチパルスと前
記マルチパルスに関する補正情報もしくは前記雑音とパ
ルス列との組合せと前記ピッチパラメータとを用いて前
記フレームの駆動音源信号を復元し、前記スペクトルパ
ラメータを用いて合成音声信号を求めることを特徴とす
る音声符号化復号化方法。
（２）入力した離散的な音声信号からフレーム毎にスペ
クトル包絡を表すスペクトルパラメータとピッチを表す
ピッチパラメータを抽出し符号化するパラメータ計算手
段と、フレーム区間を前記ピッチパラメータに応じたピッチ区
間に分割し前記フレーム区間毎の音声信号の音源信号と
して前記ピッチ区間のうちの１つのピッチ区間のマルチ
パルスと他のピッチ区間において前記マルチパルスに関
して振幅あるいは位相の少なくとも一方を補正するため
の補正情報もしくは雑音とパルス列との組合せを求めて
符号化する音源信号計算手段と、前記パラメータ計算手段の出力符号と前記音源信号計算
手段の出力符号とを組み合わせて出力するマルチプレク
サとを有することを特徴とする音声符号化装置。
（３）スペクトルパラメータを表す符号とピッチパラメ
ータを表す符号と音源信号を表す符号とを分離して復号
化する手段と、フレームを前記復号化したピッチパラメータに応じたピ
ッチ区間に分割し１つのピッチ区間についてマルチパル
スを発生し他のピッチ区間において前記マルチパルスに
関して振幅あるいは位相の少なくとも一方を補正する補
正情報を用いてパルスを発生させて前記フレームの駆動
音源信号を復元するか、もしくは雑音とパルス列の組合
せを用いて前記フレームの駆動音源信号を復元する駆動
信号復元手段と、駆動音源と前記復号したスペクトルパラメータとを用い
て合成音声を求め出力する合成フィルタとを有すること
を特徴とする音声復号化装置。