JP2000305599A

JP2000305599A - 音声合成装置及び方法、電話装置並びにプログラム提供媒体

Info

Publication number: JP2000305599A
Application number: JP11115415A
Authority: JP
Inventors: Shiro Omori; 士郎大森; Masayuki Nishiguchi; 正之西口
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1999-04-22
Filing date: 1999-04-22
Publication date: 2000-11-02
Also published as: KR20000077057A; US6732075B1; EP1047045A3; TW469421B; CN1185620C; CN1274146A; EP1047045A2

Abstract

(57)【要約】【課題】狭帯域信号のサンプリング周波数８ｋＨｚ、
広帯域信号のサンプリング周波数が１６ｋＨｚであり、
狭帯域励振源が３００−３４００Ｈｚに制限されたもの
であるとすると、広帯域励振源は３００−３４００Ｈｚ
および４６００−７７００Ｈｚとなり、特に３４００−
４６００Ｈｚの中域にギャップが生じる。【解決手段】この音声合成装置では、雑音付加部６２
にて、３４００−４６００Ｈｚの周波数帯域を持つ雑音
信号を生成し、ゲイン調整を行い、ゼロ詰め部６１での
ゼロ詰め後の励振源ｅｘｃＷに加算する。これにより得
られる広帯域励振源ｅｘｃＷ’は、よりフラットに近づ
いている。ゲイン調整は、狭帯域励振源もしくはゼロ詰
め後の励振源のパワーを求めるなどを行い、これに応じ
た値とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、例えば通信、放送
によって伝えられる周波数帯域の狭い音声信号またはそ
れを構成するパラメータを受信側で使って広帯域信号を
合成する音声合成装置及び方法に関する。また、その音
声合成装置及び方法を適用した電話装置、さらに上記音
声合成方法をソフトウェアプログラムとして提供するプ
ログラム提供媒体に関する。

【０００２】

【従来の技術】従来から、有線電話や移動電話の音質に
は不満の声がある。この原因の一つとして、周波数帯域
幅が３００〜３４００Ｈｚと狭いことが挙げられる。

【０００３】しかし、伝送路の規格が定まっているた
め、この幅を広げることは難しく、したがって、受信側
で帯域外の信号成分を予測し、広帯域信号を生成する様
々な手段が提案されている。

【０００４】中でも、一般に音声信号処理によく用いら
れる線形予測（ＬＰＣ）分析および合成の方法に基づい
て、狭帯域音声信号から求められる線形予測係数αと、
線形予測残差もしくはこれを元に量子化等をって得られ
た励振源の両方を広帯域化し、広帯域化された線形予測
係数αと励振源により広帯域のＬＰＣ合成を行うという
方法がある。

【０００５】ただし、この方法では、これによって得ら
れた広帯域音声には歪みが含まれるため、このうち原音
声に含まれていた周波数成分においては、合成された広
帯域音声のうちこの成分をフィルタにより除去し、原音
声と加算する。

【０００６】ここで、励振源の帯域拡張方法として、励
振源は白色雑音に近いという性質から、各サンプル間に
ゼロ値を挿入することによって、エイリアシング成分を
発生させ、これを広帯域励振源とする方法がある。

【０００７】例えば各サンプル間に１つずつゼロ値を挿
入するということは、周波数領域で考えると、スペクト
ルがナイキスト周波数を境に線対称の形に表れる。した
がって、元々白色雑音に近い狭帯域励振源から広帯域励
振源を求める場合に、この方法はある程度有効である。

【０００８】

【発明が解決しようとする課題】ところで、例えば狭帯
域信号のサンプリング周波数８ｋＨｚ、広帯域信号のサ
ンプリング周波数が１６ｋＨｚであり、狭帯域励振源が
３００−３４００Ｈｚに制限されたものであるとする
と、上記方法で得られる広帯域励振源は３００−３４０
０Ｈｚおよび４６００−７７００Ｈｚとなり、特に３４
００−４６００Ｈｚの中域にギャップが生じる。このた
めに、広帯域ＬＰＣ合成を行ってもこのギャップの帯域
は生成されず、この帯域を持たない広帯域音声が生成さ
れ、不自然であった。

【０００９】このように、帯域拡張をはじめとするＬＰ
Ｃ合成を行う系において、励振源の品質が悪いために、
合成された信号の品質が悪くなってしまうということが
あった。

【００１０】本発明は、上記実情に鑑みてなされたもの
であり、励振源の品質を改善することで、より品質の良
い広帯域信号を合成できる音声合成装置及び方法の提供
を目的とする。

【００１１】また、本発明は、上記音声合成装置及び方
法を適用することで、品質の良い広帯域信号を受信手段
から出力できる電話装置の提供を目的とする。

【００１２】また、本発明は、上記音声合成方法をプロ
グラム化して提供することにより、品質の良い広帯域信
号を安価に提供できるプログラム提供媒体の提供を目的
とする。

【００１３】

【課題を解決するための手段】本発明に係る音声合成装
置は、上記課題を解決するために、狭帯域信号の線形予
測残差又は励振源を入力パラメータにしたフィルタ合成
により得られた出力信号の一部を用いて広帯域信号を合
成する音声合成装置において、上記線形予測残差又は励
振源に雑音信号を付加する雑音付加手段を備える。

【００１４】また、本発明に係る音声合成装置は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成装置において、上記線形予測残差又は励振源を用い
て広帯域励振源を生成する広帯域励振源生成手段と、上
記広帯域励振源に雑音信号を付加する雑音付加手段とを
備える。

【００１５】また、本発明に係る音声合成装置は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成装置において、上記線形予測残差又は励振源に雑音
信号を付加する雑音付加手段と、上記雑音付加手段で雑
音信号が付加された線形予測残差又は励振源から広帯域
励振源を生成する広帯域励振源生成手段とを備える。

【００１６】また、本発明に係る音声合成装置は、上記
課題を解決するために、狭帯域信号から生成した線形予
測残差を入力パラメータにしたフィルタ合成により得た
出力信号の一部を用いて広帯域信号を合成する音声合成
装置において、上記狭帯域信号を分析して線形予測残差
信号を求める分析手段と、上記分析手段で得られた線形
予測残差信号から広帯域残差信号を生成する広帯域残差
信号生成手段と、上記広帯域残差信号生成手段で生成さ
れた広帯域残差信号の持つ周波数帯域以外の帯域成分を
含む雑音信号を上記広帯域残差信号に付加する雑音付加
手段とを備える。

【００１７】また、本発明に係る音声合成装置は、上記
課題をかいけつするために、狭帯域信号から生成した線
形予測残差を入力パラメータにしたフィルタ合成により
得た出力信号の一部を用いて広帯域信号を合成する音声
合成装置において、上記狭帯域信号を分析して線形予測
残差信号を求める分析手段と、上記分析手段で得られた
線形予測残差信号の持つ周波数帯域以外の帯域成分を含
む雑音信号を上記残差信号に付加する雑音付加手段と、
上記雑音付加手段で雑音信号が付加された線形予測残差
信号から広帯域残差信号を生成する広帯域残差信号生成
手段とを備える。

【００１８】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成方法において、上記線形予測残差又は励振源に雑音
信号を付加する雑音付加工程を備える。

【００１９】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成方法において、上記線形予測残差又は励振源を用い
て広帯域励振源を生成する広帯域励振源生成工程と、上
記広帯域励振源に雑音信号を付加する雑音付加工程とを
備える。

【００２０】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成方法において、上記線形予測残差又は励振源に雑音
信号を付加する雑音付加工程と、上記雑音付加工程で雑
音信号が付加された線形予測残差又は励振源から広帯域
励振源を生成する広帯域励振源生成工程とを備える。

【００２１】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号から生成した線形予
測残差を入力パラメータにしたフィルタ合成により得た
出力信号の一部を用いて広帯域信号を合成する音声合成
方法において、上記狭帯域信号を分析して線形予測残差
信号を求める分析工程と、上記分析工程で得られた線形
予測残差信号から広帯域残差信号を生成する広帯域残差
信号生成工程と、上記広帯域残差信号生成工程で生成さ
れた広帯域残差信号の持つ周波数帯域以外の帯域成分を
含む雑音信号を上記広帯域残差信号に付加する雑音付加
工程とを備える。

【００２２】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号から生成した線形予
測残差を入力パラメータにしたフィルタ合成により得た
出力信号の一部を用いて広帯域信号を合成する音声合成
方法において、上記狭帯域信号を分析して線形予測残差
信号を求める分析工程と、上記分析工程で得られた線形
予測残差信号の持つ周波数帯域以外の帯域成分を含む雑
音信号を上記残差信号に付加する雑音付加工程と、上記
雑音付加工程で雑音信号が付加された線形予測残差信号
から広帯域残差信号を生成する広帯域残差信号生成工程
とを備える。

【００２３】また、本発明に係る電話装置は、上記課題
を解決するために、伝送信号として狭帯域信号のパラメ
ータをＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化し
て送信する送信手段と、上記パラメータの内の線形予測
残差又は励振源に雑音信号を付加してからフィルタ合成
により得た出力信号の一部を用いて広帯域信号を合成す
る受信手段とを備える。

【００２４】また、本発明に係る電話装置は、上記課題
を解決するために、伝送信号として狭帯域信号のパラメ
ータをＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化し
て送信する送信手段と、上記パラメータの内の線形予測
残差又は励振源を用いて広帯域励振源を生成し、この広
帯域励振源に雑音信号を付加してからフィルタ合成によ
り得た出力信号の一部を用いて広帯域信号を合成する受
信手段とを備える。

【００２５】また、本発明に係る電話装置は、上記課題
を解決するために、伝送信号として狭帯域信号のパラメ
ータをＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化し
て送信する送信手段と、上記パラメータの内の線形予測
残差又は励振源に雑音信号を付加し、この雑音信号が付
加された線形予測誤差又は励振源から広帯域励振源を生
成し、この広帯域励振源を用いたフィルタ合成により得
た出力信号の一部を用いて広帯域信号を合成する受信手
段とを備える。

【００２６】また、本発明に係るプログラム提供媒体
は、上記課題を解決するために、狭帯域信号の線形予測
残差又は励振源を入力パラメータにしたフィルタ合成に
より得られた出力信号の一部を用いて広帯域信号を合成
するためのプログラムを提供するプログラム提供媒体に
おいて、上記線形予測残差又は励振源を用いて広帯域励
振源を生成する広帯域励振源生成手順と、上記広帯域励
振源に雑音信号を付加する雑音付加手順とを備える音声
合成プログラムを提供する。

【００２７】また、本発明に係るプログラム提供媒体
は、上記課題を解決するために、狭帯域信号の線形予測
残差又は励振源を入力パラメータにしたフィルタ合成に
より得られた出力信号の一部を用いて広帯域信号を合成
するためのプログラムを提供するプログラム提供媒体に
おいて、上記線形予測残差又は励振源に雑音信号を付加
する雑音付加手順と、上記雑音付加手順で雑音信号が付
加された線形予測残差又は励振源から広帯域励振源を生
成する広帯域励振源生成手順とを備える音声合成プログ
ラムを提供する。

【００２８】また、本発明に係るプログラム提供媒体
は、上記課題を解決するために、狭帯域信号から生成し
た線形予測残差を入力パラメータにしたフィルタ合成に
より得た出力信号の一部を用いて広帯域信号を合成する
ためのプログラムを提供するプログラム提供媒体におい
て、上記狭帯域信号を分析して線形予測残差信号を求め
る分析手順と、上記分析手順で得られた線形予測残差信
号から広帯域残差信号を生成する広帯域残差信号生成手
順と、上記広帯域残差信号生成手順で生成された広帯域
残差信号の持つ周波数帯域以外の帯域成分を含む雑音信
号を上記広帯域残差信号に付加する雑音信号付加手順と
を備える音声合成プログラムを提供する。

【００２９】また、本発明に係るプログラム提供媒体
は、上記課題を解決するために、狭帯域信号から生成し
た線形予測残差を入力パラメータにしたフィルタ合成に
より得た出力信号の一部を用いて広帯域信号を合成する
ためのプログラムを提供するプログラム提供媒体におい
て、上記狭帯域信号を分析して線形予測残差信号を求め
る分析手順と、上記分析手順で得られた線形予測残差信
号の持つ周波数帯域以外の帯域成分を含む雑音信号を上
記残差信号に付加する雑音付加手順と、上記雑音付加手
順で雑音信号が付加された線形予測残差信号から広帯域
残差信号を生成する広帯域残差信号生成手順とを備える
音声合成プログラムを提供する。

【００３０】すなわち、本来励振源となる信号に、あえ
て別の雑音信号を加算し、合成された信号の品質を改善
する。

【００３１】特に、狭帯域励振源のパワー等によりゲイ
ンが調整された３４００−４６００Ｈｚの雑音成分を別
途生成しておき、ゼロ詰めによって得られた広帯域励振
源に加算し、これを広帯域励振源とする。あるいは、３
４００−４０００Ｈｚの雑音成分を別途生成しておき、
狭帯域励振源に加算し、その後でゼロ詰めを行い、広帯
域励振源とすれば、ギャップが解消される。

【００３２】上記音声合成装置及び方法によれば、線形
予測係数αおよび励振源もしくは予測残差excが与えら
れ、このうちのexcに別途用意した雑音信号が加算さ
れ、これをexc’と呼ぶとすると、その後にαをフィル
タ係数とする合成フィルタに、exc’が入力され、フィ
ルタ処理により出力信号が得られる。

【００３３】また、狭帯域信号の合成に用いられるフィ
ルタ係数αＮから、何らかの予測手段により広帯域化さ
れたフィルタ係数αＷが求められ、励振源もしくは予測
残差excＮは、ゼロ詰めによりエイリアシングが発生し
た信号にされ、さらに別途用意した雑音信号が加算さ
れ、これをexcＷと呼ぶとすると、その後にαＷをフィ
ルタ係数とする合成フィルタに、excＷが入力され、フ
ィルタ処理により出力信号が得られる。

【００３４】また、狭帯域信号の合成に用いられるフィ
ルタ係数αＮから、何らかの予測手段により広帯域化さ
れたフィルタ係数αＷが求められ、励振源もしくは予測
残差excＮは、別途用意した雑音信号が加算され、さら
にゼロ詰めによりエイリアシングが発生した信号にさ
れ、これをexcＷと呼ぶとすると、その後にαＷをフィ
ルタ係数とする合成フィルタに、excＷが入力され、フ
ィルタ処理により出力信号が得られる。

【００３５】また、狭帯域信号が入力されると、線形予
測分析等の分析が行われ、この結果狭帯域係数αＮが得
られ、逆フィルタにより予測残差信号excＮが得られ、
何らかの予測手段により広帯域化されたフィルタ係数α
Ｗが求められ、励振源もしくは予測残差excＮは、ゼロ
詰めによりエイリアシングが発生した信号にされ、さら
に別途用意した雑音信号が加算され、これをexcＷと呼
ぶとすると、その後にαＷをフィルタ係数とする合成フ
ィルタに、excＷが入力され、フィルタ処理により出力
信号が得られる。

【００３６】また、狭帯域信号が入力されると、線形予
測分析等の分析が行われ、この結果狭帯域係数αＮが得
られ、逆フィルタにより予測残差信号excＮが得られ、
何らかの予測手段により広帯域化されたフィルタ係数α
Ｗが求められ、励振源もしくは予測残差excＮは、別途
用意した雑音信号が加算され、さらにゼロ詰めによりエ
イリアシングが発生した信号にされ、これをexcＷと呼
ぶとすると、その後にαＷをフィルタ係数とする合成フ
ィルタに、excＷが入力され、フィルタ処理により出力
信号が得られる。

【００３７】

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照しながら説明する。狭帯域音声信号用のパ
ラメータを用いたフィルタ合成により得た広帯域音声信
号の一部を上記狭帯域音声信号に加算して広帯域信号を
合成できる音声合成方法を適用した音声合成装置を実施
の形態とする。以下には、いくつかの具体例を示す。

【００３８】先ず、音声合成装置の第１の具体例を図１
に示す。この音声合成装置には、周波数帯域が３００Ｈ
ｚ〜３４００Ｈｚで、サンプリング周波数が８ＫＨｚの
狭帯域音声信号sndＮと、その狭帯域音声の合成に用い
られる線形予測係数αＮと、励振源excＮとが、各入力
端子５７、５１、５３から供給される。

【００３９】線形予測係数αＮと励振源excＮが上記狭
帯域音声信号sndＮに関するパラメータである。但し、
これらパラメータと入力信号は全てが独立ではなく、線
形予測係数αＮ及び励振源excＮは、狭帯域音声信号snd
Ｎを線形予測分析して求めることができる。この場合ex
cＮは正確には線形予測残差である。あるいは逆に線形
予測係数αＮ及び励振源excＮから、フィルタ合成によ
り狭帯域音声信号sndＮを求めることもできる。また、
狭帯域音声信号sndＮに前処理を施してから線形予測分
析して線形予測係数αＮおよび励振源excＮを求めるこ
ともできるし、さらに量子化をされたものを線形予測係
数αＮおよび励振源excＮとする等ができる。同様に線
形予測係数αＮおよび励振源（線形予測残差）excＮか
ら、フィルタ合成した後に後処理を加えたものを狭帯域
音声信号sndＮとすること等ができる。

【００４０】この音声合成装置は、入力端子５１から供
給された線形予測係数αＮを広帯域化するα広帯域化部
５２と、入力端子５３から供給された励振源excＮを広
帯域化するゼロ詰め部６１と、このゼロ詰め部６１から
の広帯域化励振源excＷに雑音信号を付加する雑音付加
部６２と、雑音付加部６２で雑音信号が付加された広帯
域励振源excＷ’を入力としα広帯域化部５２からの広
帯域線形予測係数αＷをフィルタ係数として広帯域音声
信号をＬＰＣ合成する広帯域ＬＰＣ合成部５５と、広帯
域ＬＰＣ合成部５５からの合成出力音声信号から狭帯域
音声信号の持っている周波数帯域を抑圧する帯域抑圧部
５６と、入力端子５７から供給された狭帯域音声信号sn
dＮのサンプリング周波数を広帯域音声信号用の１６Ｋ
Ｈｚにするオーバーサンプル部５８と、オーバーサンプ
ル部５８からの狭帯域音声信号sndＮ’と帯域抑圧部５
６からの出力信号とを加算する加算器５９とを備え、出
力端子６０から広帯域音声信号sndＷを出力する。

【００４１】α広帯域化部５２は、狭帯域スペクトル包
絡を表すパラメータである線形予測係数αＮから、これ
よりも広い周波数帯域のスペクトル包絡を表すパラメー
タである広帯域化線形予測係数αＷを求める。具体的に
は、狭帯域線形予測係数αＮを自己相関ｒＮに変換し、
この自己相関ｒＮを狭帯域音声用のコードブックを用い
て量子化し、その量子化データを広帯域音声用のコード
ブックを用いて逆量子化して広帯域自己相関ｒＷを求
め、この広帯域自己相関ｒＷを広帯域線形予測係数αＷ
に変換する。

【００４２】ゼロ詰め部６１は、広帯域音声のサンプリ
ング周波数が狭帯域音声のサンプリング周波数のｎ倍で
ある場合、各サンプル間にｎ−１のゼロ値を挿入する。
これによって、サンプリング周波数を合わせるととも
に、エイリアシング成分が発生する。もともと励振源の
周波数特性はフラットに近いため、エイリアシングも当
然フラットに近く、広帯域の励振源excＷとして利用が
できる。

【００４３】しかしながら、狭帯域励振源excＮが０Ｈ
ｚからナイキスト周波数までフラットではない場合、エ
イリアシング成分も、これに対応する部分がフラットで
はない。例えば狭帯域励振源が３００−３４００Ｈｚに
制限されており、サンプリング周波数を２倍にするため
に１サンプルおきにゼロ値を挿入すると、広帯域励振源
excＷは３００−３４００Ｈｚおよび４６００−７７０
０Ｈｚとなり、特に３４００−４６００Ｈｚの中域成分
を持たず、品質が良くない。

【００４４】そこで、この図１に示す音声合成装置で
は、雑音付加部６２にて、３４００−４６００Ｈｚの周
波数帯域を持つ雑音信号を生成し、ゲイン調整を行い、
ゼロ詰め部６１でのゼロ詰め後の励振源excＷに加算す
る。これにより得られる広帯域励振源excＷ’は、より
フラットに近づいている。ゲイン調整は、狭帯域励振源
もしくはゼロ詰め後の励振源のパワーを求めるなどを行
い、これに応じた値とする。あるいは、コーデックに適
用する場合、雑音コードブックに乗じるべきゲイン値な
どがパラメータによってあらかじめ与えられていれば、
励振源のパワーを求めずに、これをそのまま用いる、も
しくはこれに応じた値を求める等を行っても良い。

【００４５】広帯域ＬＰＣ合成部５５は、上記α広帯域
化部５２で求められた広帯域化線形予測係数αＷをフィ
ルタ係数とし、上記雑音付加部６２からのexcＷ’を入
力とすることで、フィルタ合成を行い、広帯域の音声信
号を合成する。

【００４６】帯域抑圧部５６は、元々入力信号である狭
帯域音声信号の持っている周波数帯域を抑圧する。これ
は、上記広帯域ＬＰＣ合成部５５で得られる信号には歪
みが含まれるので、元々持っている帯域に関してはその
まま使うためである。

【００４７】オーバーサンプル部５８は、サンプリング
周波数を広帯域音声信号のものに合わせる。

【００４８】加算器５９は、帯域抑圧部５６で得られた
信号とオーバーサンプル部５８で得られた信号を加算す
る。両者の周波数帯域は異なっており、両者を加算する
ことで出力である広帯域音声信号sndＷが得られる。

【００４９】この第１の具体例の全体的な動作は以下の
通りとなる。入力端子５１から線形予測係数αＮ、入力
端子５３から狭帯域励振源excＮ、及び入力端子５７か
ら狭帯域音声信号sndＮが入力されると、先ず、狭帯域
線形予測係数αＮがα広帯域化部５２で広帯域化され広
帯域線形予測係数αＷが得られる。一方で狭帯域励振源
excＮが広帯域化されるが、まずゼロ詰め部６１でゼロ
詰めが行われ、雑音付加部６２で生成された雑音信号が
加算され、より品質の良い広帯域励振源excＷが生成さ
れる。これらを用いて広帯域ＬＰＣ合成部５５でＬＰＣ
合成が行われ、第一の広帯域の音声信号が得られる。

【００５０】次に、この第一の広帯域の音声信号のう
ち、狭帯域音声が持つ周波数帯域が帯域抑圧部５６で抑
圧され、第二の広帯域音声信号となる。一方で狭帯域音
声信号sndＮは広帯域音声信号のサンプリング周波数に
オーバーサンプル部５８でオーバーサンプルされ、上記
第二の広帯域音声信号と加算器５９で加算され、最終的
な広帯域音声信号sndＷが出力端子６０から出力され
る。

【００５１】したがって、この第１の具体例では、励振
源の品質を改善することでより品質のよい広帯域信号を
得られる。

【００５２】ここで、帯域抑圧部５６は、厳密に狭帯域
音声の持つ周波数帯域のみを抑圧するのではなく、例え
ば低域を全て抑圧してしまうハイパスフィルタ等でも良
い。また、第一の広帯域音声信号もしくは第二の広帯域
音声信号に、さらにゲインを乗じたり、フィルタ処理を
行って周波数特性を変化させる等を行っても良い。

【００５３】比較のため図２には、従来の音声合成装置
の構成を示す。上記図１に示した音声合成装置と異なる
のは、狭帯域励振源excＮに対する処理系である。図２
に示す音声合成装置では、励振源の広帯域化部（exc広
帯域化部）５４により狭帯域励振源excＮを広帯域化し
ている。

【００５４】このexc広帯域化部５４は、狭帯域音声信
号と広帯域音声信号のサンプリング周波数が異なる場
合、サンプリング周波数を広帯域音声信号に合わせる機
能を持ち、さらに狭帯域励振源excＮの持つ周波数帯域
よりも広い周波数帯域を持つ広帯域励振源excＷを求め
る。

【００５５】この図２に示した従来の音声合成装置の全
体的な動作は以下の通りとなる。入力端子５１から線形
予測係数αＮ、入力端子５３から狭帯域励振源excＮ、
及び入力端子５７から狭帯域音声信号sndＮが入力され
ると、先ず、狭帯域線形予測係数αＮがα広帯域化部５
２で広帯域化され広帯域線形予測係数αＷが得られる。
一方で狭帯域励振源excＮがexc広帯域化部５４で広帯域
化される。これらを用いて広帯域ＬＰＣ合成部５５でＬ
ＰＣ合成が行われ、第一の広帯域の音声信号が得られ
る。

【００５６】そして、この第一の広帯域の音声信号のう
ち、狭帯域音声が持つ周波数帯域が帯域抑圧部５６で抑
圧され、第二の広帯域音声信号となる。一方で狭帯域音
声信号sndＮは広帯域音声信号のサンプリング周波数に
オーバーサンプル部５８でオーバーサンプルされ、上記
第二の広帯域音声信号と加算器５９で加算され、最終的
な広帯域音声信号sndＷが出力端子６０から出力され
る。

【００５７】しかし、狭帯域信号のサンプリング周波数
８ｋＨｚ、広帯域信号のサンプリング周波数が１６ｋＨ
ｚであり、狭帯域励振源が３００−３４００Ｈｚに制限
されたものであるとすると、上記exc広帯域化部５４に
より得られる広帯域励振源excＷは３００−３４００Ｈ
ｚおよび４６００−７７００Ｈｚとなり、特に３４００
−４６００Ｈｚの中域にギャップが生じる。このため
に、広帯域ＬＰＣ合成部５５で広帯域ＬＰＣ合成を行っ
てもこのギャップの帯域は生成されず、この帯域を持た
ない広帯域音声が生成され、不自然であった。

【００５８】そこで、上記図１に示した音声合成装置
は、本来励振源となる信号に、あえて別の雑音信号を加
算し、合成された信号の品質を改善している。

【００５９】すなわち、狭帯域励振源excＮをゼロ詰め
して広帯域化した後、雑音信号を加算して広帯域音声信
号を合成している。特に、狭帯域励振源のパワー等によ
りゲインが調整された３４００−４６００Ｈｚの雑音成
分を別途生成しておき、ゼロ詰めによって得られた広帯
域励振源に加算しこれを広帯域励振源としている。

【００６０】次に、音声合成装置の第２の具体例を図３
に示す。この図３に示す音声合成装置にも、周波数帯域
が３００Ｈｚ〜３４００Ｈｚで、サンプリング周波数が
８ＫＨｚの狭帯域音声信号sndＮと、その狭帯域音声の
合成に用いられる線形予測係数αＮと、励振源excＮと
が、各入力端子５７、５１、５３から供給される。

【００６１】上記第１の具体例と異なるのは狭帯域励振
源excＮの処理系であり、他の構成は上記図１と同様で
あるので、同符号を付し説明を省略する。

【００６２】具体的には、３４００−４０００Ｈｚの雑
音成分を雑音付加部７１で別途生成しておき、狭帯域励
振源excＮに付加し、その後ゼロ詰め部７２でゼロ詰め
を行い、広帯域励振源excＷとしている。すなわち、雑
音信号を狭帯域励振源excＮに付加してから、広帯域励
振源excＷを求め、広帯域音声信号を合成している。

【００６３】狭帯域励振源として利用されるexcＮの周
波数特性はフラットに近い。しかしながら、これが０Ｈ
ｚからナイキスト周波数までフラットではない場合、ゼ
ロ詰め部７２によって広帯域化された励振源excＷもフ
ラットではなくなる。例えば狭帯域励振源が３００−３
４００Ｈｚに制限されており、サンプリング周波数を２
倍にするために１サンプルおきにゼロ値を挿入すると、
広帯域励振源は３００−３４００Ｈｚおよび４６００−
７７００Ｈｚとなり、３４００−４６００Ｈｚの中域成
分を持たず、品質が良くない。

【００６４】そこで雑音付加部７１は、３４００−４０
００Ｈｚの周波数帯域を持つ雑音信号を生成し、ゲイン
調整を行い、励振源excＮに付加している。これにより
得られる狭帯域励振源は、よりフラットに近づいてい
る。ゲイン調整は、狭帯域励振源パワーを求めるなどを
行い、これに応じた値とする。あるいは、コーデックに
適用する場合、雑音コードブックに乗じるべきゲイン値
などがパラメータによってあらかじめ与えられていれ
ば、励振源のパワーを求めずに、これをそのまま用い
る、もしくはこれに応じた値を求める等を行っても良
い。

【００６５】ゼロ詰め部７２は、広帯域音声のサンプリ
ング周波数が狭帯域音声のサンプリング周波数のｎ倍で
ある場合、各サンプル間にｎ−１のゼロ値を挿入する。
これによって、サンプリング周波数を合わせるととも
に、エイリアシング成分が発生する。雑音を付加された
狭帯域励振源の周波数特性は、当初よりいっそうフラッ
トに近い。従って、ゼロ詰めによって得られるエイリア
シングもフラットに近く、品質の良い広帯域励振源とし
て利用ができる。

【００６６】この第２の具体例の全体的な動作は以下の
通りとなる。入力端子５１から線形予測係数αＮ、入力
端子５３から狭帯域励振源excＮ、及び入力端子５７か
ら狭帯域音声信号sndＮが入力されると、先ず、狭帯域
線形予測係数αＮが広帯域化され広帯域線形予測係数α
Ｗが得られる。一方で狭帯域励振源excＮが広帯域化さ
れるが、まず雑音付加部７１で生成された雑音信号が加
算され、ゼロ詰め部７２でゼロ詰めが行われ、より品質
の良い広帯域励振源excＷとなる。これらを用いて広帯
域ＬＰＣ合成部５５で広帯域のＬＰＣ合成が行われ、第
一の広帯域の音声信号が得られる。そして、この第一の
広帯域の音声信号のうち、狭帯域音声信号が持つ周波数
帯域が抑圧され、第二の広帯域音声信号となる。一方で
狭帯域音声信号sndＮは広帯域音声信号のサンプリング
周波数にオーバーサンプル部５８でオーバーサンプルさ
れ、上記第二の広帯域音声信号と加算器５９で加算さ
れ、出力端子６０から最終的な広帯域音声信号sndＷが
出力される。

【００６７】この第２の具体例においても、励振源の品
質を改善することでより品質のよい広帯域信号を得られ
る。

【００６８】図４には音声合成装置の第３の具体例を示
す。この図４に示す音声合成装置には、周波数帯域が３
００Ｈｚ〜３４００Ｈｚで、サンプリング周波数が８Ｋ
Ｈｚの狭帯域音声信号sndＮのみが入力端子５７から供
給される。

【００６９】上記第１の具体例と異なるのは、αＮとex
cＮをＬＰＣ分析部８１により求めていることである。
他の構成は上記図１と全く同様であり、同符号を付し説
明を省略する。

【００７０】ＬＰＣ分析部８１は、狭帯域音声sndＮが
入力端子５７から入力されると、これを線形予測分析
し、線形予測係数αＮ及びこれを用いた逆フィルタの結
果である線形予測残差excＮを得る。

【００７１】このＬＰＣ分析部８１で得られた線形予測
係数αＮおよび線形予測残差excＮを、上記第１の具体
例で述べた図１中の線形予測係数αＮおよび励振源exc
Ｎとしてそのまま、もしくは何らかの後処理を用いて整
形をし、使用することで音声の広帯域化を行うのがこの
具体例である。

【００７２】この第３の具体例の全体的な動作は以下の
通りとなる。入力端子５７から狭帯域音声sndＮが入力
されると、ＬＰＣ分析部８１は線形予測分析を行い、狭
帯域線形予測係数αＮおよび狭帯域線形予測残差excＮ
が得られる。そして狭帯域線形予測係数αＮがα広帯域
化部５２で広帯域化され広帯域線形予測係数αＷが得ら
れる。一方で狭帯域励振源excＮが広帯域化されるが、
まずゼロ詰め部６１でゼロ詰めが行われ、雑音付加部６
２で生成された雑音信号が加算され、より品質の良い広
帯域励振源excＷ’となる。これらを用いて広帯域ＬＰ
Ｃ合成部５５で広帯域のＬＰＣ合成が行われ、第一の広
帯域の音声信号が得られる。次に、この第一の広帯域の
音声信号のうち、狭帯域音声信号が持つ周波数帯域が抑
圧され、第二の広帯域音声信号となる。一方で狭帯域音
声信号sndＮは広帯域音声信号のサンプリング周波数に
オーバーサンプル部５８でオーバーサンプルされ、上記
第二の広帯域音声信号と加算器５９で加算され、最終的
な広帯域音声信号sndＷが出力端子６０から出力され
る。

【００７３】この第３の具体例においても、励振源の品
質を改善することでより品質のよい広帯域信号を得られ
る。

【００７４】図５には音声合成装置の第４の具体例を示
す。この図５に示す音声合成装置にも、上記第３の具体
例と同様に、周波数帯域が３００Ｈｚ〜３４００Ｈｚ
で、サンプリング周波数が８ＫＨｚの狭帯域音声信号sn
dＮのみが入力端子５７から供給される。

【００７５】上記第３の具体例と異なるのは、ＬＰＣ分
析部８１で求めた線形予測残差excＮを処理する系であ
り、他の構成は上記図４と同様であるので、同符号を付
し説明を省略する。

【００７６】具体的には、３４００−４０００Ｈｚの雑
音成分を雑音付加部７１で別途生成しておき、線形予測
残差excＮに付加し、その後ゼロ詰め部７２でゼロ詰め
を行い、広帯域励振源excＷとしている。すなわち、雑
音信号を狭帯域線形予測残差excＮに付加してから、広
帯域励振源excＷを求め、広帯域音声信号を合成してい
る。

【００７７】この第４の具体例の全体的な動作は以下の
通りとなる。入力端子５７から狭帯域音声sndＮが入力
されると、ＬＰＣ分析部８１は線形予測分析を行い、狭
帯域線形予測係数αＮおよび狭帯域線形予測残差excＮ
が得られる。そして狭帯域線形予測係数αＮがα広帯域
化部５２で広帯域化され広帯域線形予測係数αＷが得ら
れる。一方で線形予測残差excＮが広帯域化されるが、
まず雑音付加部７１で生成された雑音信号が付加され、
ゼロ詰め部７２でゼロ詰めが行われ、より品質の良い広
帯域励振源excＷ’となる。これらを用いて広帯域ＬＰ
Ｃ合成部５５で広帯域のＬＰＣ合成が行われ、第一の広
帯域の音声信号が得られる。次に、この第一の広帯域の
音声信号のうち、狭帯域音声信号が持つ周波数帯域が抑
圧され、第二の広帯域音声信号となる。一方で狭帯域音
声信号sndＮは広帯域音声信号のサンプリング周波数に
オーバーサンプル部５８でオーバーサンプルされ、上記
第二の広帯域音声信号と加算器５９で加算され、最終的
な広帯域音声信号sndＷが出力端子６０から出力され
る。

【００７８】この第４の具体例においても、励振源の品
質を改善することでより品質のよい広帯域信号を得られ
る。

【００７９】図６には音声合成装置の第５の具体例を示
す。この図６に示す音声合成装置の入力端子１には、周
波数帯域が例えば３００Ｈｚ〜３４００Ｈｚで、サンプ
リング周波数が８ｋＨｚの狭帯域音声信号が供給され
る。

【００８０】この第５の具体例となる音声合成装置は、
広帯域有声音及び無声音から抽出した有声音用及び無声
音用パラメータを用いて予め作成した広帯域有声音用コ
ードブック１２と広帯域無声音用コードブック１４と、
上記広帯域音声を周波数帯域制限して得た周波数帯域が
例えば３００Ｈｚ〜３４００Ｈｚの狭帯域音声信号から
抽出した有声音用及び無声音用パラメータにより予め作
成した狭帯域有声音用コードブック７と狭帯域無声音用
コードブック１０とを備える。

【００８１】また、この音声合成装置は、入力端子１か
ら入力され、フレーム化回路２により、１６０サンプル
毎にフレーミング（サンプリング周波数は８ｋＨｚであ
るので１フレームは２０ｍｓｅｃ）された上記狭帯域信
号に基づいて励振源を求める励振源形成手段となるゼロ
詰め部１６と、このゼロ詰め部１６からの励振源に雑音
信号を付加する雑音付加部９１と、上記入力狭帯域信号
を２０ｍｓｅｃの１フレーム毎に有声音（Ｖ）と無声音
（ＵＶ）に判定する有声音（Ｖ）／無声音（ＵＶ）判定
部５と、この有声音（Ｖ）／無声音（ＵＶ）判定部５か
らの有声音（Ｖ）／無声音（ＵＶ）判定結果に基づいて
狭帯域有声音用及び無声音用の線形予測係数αを出力す
るＬＰＣ（線形予測符号化）分析回路３と、このＬＰＣ
分析回路３からの線形予測係数αをパラメータの一種で
ある自己相関ｒに変換する線形予測係数→自己相関（α
→ｒ）変換回路４と、このα→ｒ変換回路４からの狭帯
域有声音用自己相関を狭帯域有声音用コードブック８を
用いて量子化する狭帯域有声音用量子化器７と、上記α
→ｒ変換回路４からの狭帯域無声音用自己相関を狭帯域
無声音用コードブック１０を用いて量子化する狭帯域無
声音用量子化器９と、狭帯域有声音用量子化器７からの
狭帯域有声音用量子化データを広帯域有声音用コードブ
ック１２を用いて逆量子化する広帯域有声音用逆量子化
器１１と、狭帯域無声音用量子化器９からの狭帯域無声
音用量子化データを広帯域無声音用コードブック１４を
用いて逆量子化する広帯域無声音用逆量子化器１３と、
広帯域有声音用逆量子化器１１からの逆量子化データと
なる広帯域有声音用自己相関を広帯域有声音用の線形予
測係数に変換すると共に広帯域無声音用逆量子化器１３
からの逆量子化データとなる広帯域無声音用自己相関を
広帯域無声音用の線形予測係数に変換する自己相関→線
形予測係数（ｒ→α）変換回路１５と、このｒ→α変換
回路１５からの広帯域有声音用線形予測係数と広帯域無
声音用線形予測係数と雑音付加部９１で雑音信号が付加
された励振源とに基づいて広帯域音声を合成するＬＰＣ
合成回路１７とを備えてなる。

【００８２】また、この音声合成装置は、フレーム化回
路２でフレーミングされた狭帯域音声のサンプリング周
波数を８ｋＨｚから１６ｋＨｚにオーバーサンプリング
するオーバーサンプル回路１９と、ＬＰＣ合成回路１７
からの合成出力から入力狭帯域音声信号の周波数帯域３
００Ｈｚ〜３４００Ｈｚの信号成分を除去するバンドス
トップフィルタ（ＢＳＦ）１８と、このＢＳＦ１８から
のフィルタ出力にオーバーサンプル回路１９からのサン
プリング周波数１６ｋＨｚの周波数帯域３００Ｈｚ〜３
４００Ｈｚの基の狭帯域音声信号の成分とを加算する加
算器２０とを備えている。そして、出力端子２１から
は、周波数帯域が３００〜７０００Ｈｚで、サンプリン
グ周波数が１６ｋＨｚのディジタル音声信号が出力され
る。

【００８３】ここで、広帯域有声音用コードブック１２
と広帯域無声音用コードブック１４と、狭帯域有声音用
コードブック８と狭帯域無声音用コードブック１０の作
成について説明する。

【００８４】先ず、広帯域有声音用コードブック１２と
広帯域無声音用コードブック１４は、フレーム化回路２
でのフレーミングと同様に例えば２０ｍｓｅｃ毎にフレ
ーミングした、周波数帯域が例えば３００Ｈｚ〜７００
０Ｈｚの広帯域音声信号を、有声音（Ｖ）と無声音（Ｕ
Ｖ）に分け、この広帯域有声音及び無声音から抽出した
有声音用及び無声音用パラメータを用いて作成する。

【００８５】また、狭帯域有声音用コードブック７と狭
帯域無声音用コードブック１０は、上記広帯域音声を周
波数帯域制限して得た周波数帯域が例えば３００Ｈｚ〜
３４００Ｈｚの狭帯域音声信号から抽出した有声音用及
び無声音用パラメータにより作成する。

【００８６】図７は、上記４つのコードブックを作成す
るにあたっての学習データの作り方を説明するための図
である。図７に示すように、広帯域の学習用音声信号を
用意し、ステップＳ１で１フレーム２０ｍｓｅｃにフレ
ーミングする。また、上記広帯域の学習用音声信号をス
テップＳ２で帯域制限して狭帯域とした信号についても
上記ステップＳ１でのフレーミングと同じタイミングの
フレーム位相によりステップＳ３でフレーミングする。
そして、狭帯域音声の各フレームにおいて、例えばフレ
ームエネルギーやゼロクロスの値等を調べることによっ
てステップＳ４で有声音（Ｖ）か無声音（ＵＶ）かの判
別を行う。

【００８７】ここで、コードブックの品質を良いものと
するために、有声音（Ｖ）から無声音（ＵＶ）、ＵＶか
らＶへの遷移状態のものや、ＶともＵＶとも判別しがた
いものは除外してしまい、確実にＶであるものと、確実
にＵＶであるもののみを利用する。このようにして、学
習用狭帯域Ｖフレームの集まりと、同うＶフレームの集
まりを作成する。

【００８８】次に、広帯域フレームもＶとＵＶに分類す
るが、狭帯域フレームと同じタイミングでフレーミング
されているため、その判別結果を用いて、狭帯域でＶと
判別された狭帯域フレームと同じ時刻の広帯域フレーム
はＶとし、ＵＶと判別された狭帯域フレームと同じ時刻
の広帯域フレームはＵＶとする。以上により、学習用デ
ータが作成される。ここで、狭帯域でＶにもＵＶにも分
類されなかったものは、広帯域でも同様であることは言
うまでもない。

【００８９】また、図示しないが、これと対称な方法で
学習データを作ることも可能である。すなわち、広帯域
フレームを用いてＶ／ＵＶの判別を行い、その判別結果
を用いて狭帯域フレームのＶ／ＵＶを分類するというも
のである。

【００９０】続いて、ここで得られた学習データを用
い、図８に示すようにコードブックを作成する。図８に
示すように、まず広帯域Ｖ（またはＵＶ）フレームの集
まりを用いて広帯域Ｖ（ＵＶ）コードブックを学習し作
成する。

【００９１】先ず、ステップＳ６に示すように、各広帯
域フレームにおいて、例えばｄｎ次までの自己相関パラ
メータを抽出する。自己相関パラメータは以下の（１）
式に基づいて算出される。

【００９２】

【数１】

【００９３】ここで、ｘは入力信号、φ（ｘｉ）はｉ次
の自己相関、Ｎはフレーム長である。

【００９４】この各フレームのｄｗ次元の自己相関パラ
メータから、ＧＬＡ（ＧｅｎｅｒａｌｉｚｅｄＬｌｏ
ｙｄＡｌｇｏｒｉｔｈｍ）により次元ｄｗ、サイズｓ
ｗの広帯域Ｖ（ＵＶ）コードブックをステップＳ７で作
成する。

【００９５】ここで、各広帯域Ｖ（ＵＶ）フレームの自
己相関パラメータが、作成されたコードブックの、どの
コードベクタに量子化されるかをエンコード結果から調
べる。そしてコードベクタごとに、そのベクタに量子化
された各広帯域Ｖ（ＵＶ）フレームに対応する、すなわ
ち同じ時刻の各狭帯域Ｖ（ＵＶ）フレームから求められ
るｄｎ次元の自己相関パラメータ同士の例えば重心を算
出し、これをステップＳ８で狭帯域コードベクタとす
る。これをすべてのコードベクタに対して行うことによ
り、狭帯域コードブックが生成される。

【００９６】また、図９に示すように、これと対称な方
法も可能である。すなわち、先にステップＳ９からステ
ップＳ１０で狭帯域フレームのパラメータを用いて学習
することにより狭帯域コードブックを作成し、ステップ
Ｓ１１で対応する広帯域フレームのパラメータの重心を
求めるというものである。

【００９７】以上により狭帯域Ｖ／ＵＶ、広帯域Ｖ／Ｕ
Ｖの４つのコードブックが作成される。

【００９８】次に、これらのコードブックを使用して、
実際に狭帯域音声が入力されたときに、広帯域音声を出
力する、上記音声合成方法を適用した音声合成装置の動
作について図１０を参照しながら説明する。

【００９９】入力端子１から入力された上記狭帯域音声
信号は、先ずステップＳ２１でフレーム化回路２により
１６０サンプル（２０ｍｓｅｃ）毎にフレーミングされ
る。そして各フレームについて、ＬＰＣ分析回路３で、
ステップＳ２３のようにＬＰＣ分析が行われ、線形予測
係数αパラメータとＬＰＣ残差に分けられる。αパラメ
ータはステップＳ２４でα→ｒ変換回路４により自己相
関ｒに変換される。

【０１００】また、フレーミングされた信号は、ステッ
プＳ２２でＶ／ＵＶ判定回路５により、Ｖ／ＵＶの判別
が行われており、ここで、Ｖと判定されると、α→ｒ変
換回路４からの出力を切り替えるスイッチ６は、狭帯域
有声音量子化回路７に接続され、ＵＶと判定されると、
狭帯域無声音量子化回路９に接続される。

【０１０１】ただし、ここでのＶ／ＵＶの判別は、コー
ドブック作成時とは異なり、ＶにもＵＶにも属さないフ
レームは発生させず、必ずどちらかに振り分ける。実際
には、ＵＶの方が、高域エネルギーが大きいために、高
域を予測した場合、大きなエネルギーとなる傾向がある
が、Ｖ／ＵＶ判断が難しいもの等をＵＶと誤って判断し
た場合に異音を発生することにつながる。したがって、
コードブック作成時にはＶともＵＶとも判別できなかっ
たものは、Ｖとするよう設定している。

【０１０２】ＵＶ判定回路５がＶと判定したときには、
ステップＳ２５では、スイッチ６からの有声音用自己相
関ｒを狭帯域Ｖ量子化回路７に供給し、狭帯域Ｖコード
ブック８を用いて量子化する。一方、ＵＶ判定回路５が
Ｖであるときには、ステップＳ２５では、スイッチ６か
らの無声音用自己相関ｒを狭帯域ＵＶ量子化回路９に供
給し、狭帯域ＵＶコードブック１０を用いて量子化す
る。

【０１０３】そして、ステップＳ２６でそれぞれ対応す
る広帯域Ｖ逆量子化回路１１又は広帯域ＵＶ逆量子化回
路１３により広帯域Ｖコードブック１２又は広帯域ＵＶ
コードブック１４を用いて逆量子化され、これにより広
帯域自己相関が得られる。

【０１０４】そして、広帯域自己相関はステップＳ２７
でｒ→α変換回路１５により広帯域αに変換される。

【０１０５】一方で、ＬＰＣ分析回路３からのＬＰＣ残
差は、ステップＳ２８でゼロ詰め部１６によりサンプル
間にゼロが詰められることでアップサンプルされ、エイ
リアシングにより広帯域化される。そして、この広帯域
励振源にステップＳ２８−１で雑音付加部９１により雑
音信号が付加され、その後ＬＰＣ合成回路１７に供給さ
れる。

【０１０６】そして、ステップＳ２９で、ＬＰＣ合成回
路１７が広帯域αと雑音信号が付加された広帯域励振源
とを、ＬＰＣ合成し、広帯域の音声信号が得られる。

【０１０７】しかし、このままでは予測によって求めら
れた広帯域信号にすぎず、予測による誤差が含まれる。
特に入力狭帯域音声の周波数範囲に関しては、入力音声
をそのまま利用したほうが良い。

【０１０８】したがって、入力狭帯域音声の周波数範囲
をステップＳ３０でＢＳＦ１８を用いたフィルタリング
により除去してから、ステップ３１でオーバーサンプル
回路１９により狭帯域音声をオーバーサンプルしたもの
と、ステップＳ３２で加算する。これにより、帯域幅拡
張された広帯域音声信号が得られる。ここで、前記加算
時にゲインの調節、また高域の若干の抑圧等を行い、聴
感上の品質を向上させることも可能である。

【０１０９】この第５の具体例で特徴的なのは、雑音付
加部９１にて、３４００−４６００Ｈｚの周波数帯域を
持つ雑音信号を生成し、ゲイン調整を行い、ゼロ詰め部
１６でのゼロ詰め後の励振源excＷに付加している点で
ある。これにより得られる広帯域励振源excＷは、より
フラットに近づいている。ゲイン調整は、狭帯域励振源
もしくはゼロ詰め後の励振源のパワーを求めるなどを行
い、これに応じた値とする。あるいは、コーデックに適
用する場合、雑音コードブックに乗じるべきゲイン値な
どがパラメータによってあらかじめ与えられていれば、
励振源のパワーを求めずに、これをそのまま用いる、も
しくはこれに応じた値を求める等を行っても良い。

【０１１０】以上、図６に示した第５の具体例となる音
声合成装置でも、励振源の品質を改善することでより品
質のよい広帯域信号を得られる。

【０１１１】また、この音声合成装置では、都合４つの
コードブックで、自己相関パラメータを使用することを
前提としたが、これは自己相関に限るものではない。た
とえば、ＬＰＣケプストラムでも良好な効果が得られる
し、スペクトル包絡を予測するという観点から、スペク
トル包絡そのものをパラメータとしても良い。

【０１１２】また、上記音声合成装置では、狭帯域Ｖ
（ＵＶ）用のコードブック８及び１０を用いたが、これ
らを用いずに、コードブック用のＲＡＭ容量を削減する
ことも可能である。

【０１１３】この場合の音声合成装置の構成を図１１に
示す。この図１１に示す音声合成装置は、狭帯域Ｖ（Ｕ
Ｖ）用のコードブック８及び１０の代わりに、広帯域コ
ードブック内の各コードベクトルより演算によって狭帯
域Ｖ（ＵＶ）パラメータを求める演算回路２５及び２６
を用いている。他の構成は上記図６と同様である。

【０１１４】コードブックに使うパラメータを自己相関
とした場合、広帯域自己相関と狭帯域自己相関には以下
の（２）式のような関係が成り立つ。

【０１１５】

【数２】

【０１１６】このために、広帯域自己相関φ（ｘｗ）か
ら狭帯域自己相関φ（ｘｎ）を演算によって算出するこ
とが可能で、理論的に広帯域ベクタと狭帯域ベクタを両
方持つ必要がない。ここで、φは自己相関、ｘｎは狭帯
域信号、ｘｗは広帯域信号、ｈは帯域制限フィルタのイ
ンパルス応答である。

【０１１７】すなわち、狭帯域自己相関は、広帯域自己
相関と、帯域制限フィルタのインパルス応答の自己相関
との畳み込みで求められる。

【０１１８】したがって、この音声合成装置は、上記図
１０の代わりに、図１２のように行える。すなわち、入
力端子１から入力された上記狭帯域音声信号は、先ずス
テップＳ４１でフレーム化回路２により１６０サンプル
（２０ｍｓｅｃ）毎にフレーミングされる。そして各フ
レームについて、ＬＰＣ分析回路３で、ステップＳ４３
のようにＬＰＣ分析が行われ、線形予測係数αパラメー
タとＬＰＣ残差に分けられる。αパラメータはステップ
Ｓ４４でα→ｒ変換回路４により自己相関ｒに変換され
る。

【０１１９】また、フレーミングされた信号は、ステッ
プＳ４２でＶ／ＵＶ判定回路５により、Ｖ／ＵＶの判別
が行われており、ここで、Ｖと判定されると、α→ｒ変
換回路４からの出力を切り替えるスイッチ６は、狭帯域
有声音量子化回路７に接続され、ＵＶと判定されると、
狭帯域無声音量子化回路９に接続される。

【０１２０】このＶ／ＵＶの判別も、コードブック作成
時とは異なり、ＶにもＵＶにも属さないフレームは発生
させず、必ずどちらかに振り分ける。

【０１２１】ＵＶ判定回路５がＶと判定したときには、
ステップＳ４６では、スイッチ６からの有声音用自己相
関ｒを狭帯域Ｖ量子化回路７に供給して、量子化する。
しかし、この量子化は狭帯域用のコードブックを用いる
のではなく、上述したように演算回路２５によりステッ
プＳ４５で求めた狭帯域Ｖ用パラメータを用いる。

【０１２２】一方、ＵＶ判定回路５がＶであるときに
は、ステップＳ４６では、スイッチ６からの無声音用自
己相関ｒを狭帯域ＵＶ量子化回路９に供給して量子化す
るが、ここでも、狭帯域ＵＶコードブックを用いずに、
演算回路２６で演算により求めた狭帯域ＵＶ用パラメー
タを用いて量子化する。

【０１２３】そして、ステップＳ４７でそれぞれ対応す
る広帯域Ｖ逆量子化回路１１又は広帯域ＵＶ逆量子化回
路１３により広帯域Ｖコードブック１２又は広帯域ＵＶ
コードブック１４を用いて逆量子化し、これにより広帯
域自己相関が得られる。

【０１２４】そして、広帯域自己相関はステップＳ４８
でｒ→α変換回路１５により広帯域αに変換される。

【０１２５】一方で、ＬＰＣ分析回路３からのＬＰＣ残
差は、ステップＳ４９でゼロ詰め部１６によりサンプル
間にゼロが詰められることでアップサンプルされ、エイ
リアシングにより広帯域化される。そして、この広帯域
励振源にステップＳ４９−１で雑音付加部９１により雑
音信号が付加され、その後ＬＰＣ合成回路１７に供給さ
れる。

【０１２６】そして、ステップＳ５０で、ＬＰＣ合成回
路１７が広帯域αと雑音信号が付加された広帯域励振源
とを、ＬＰＣ合成し、広帯域の音声信号が得られる。

【０１２７】しかし、このままでは予測によって求めら
れた広帯域信号にすぎず、予測による誤差が含まれる。
特に入力狭帯域音声の周波数範囲に関しては、入力音声
をそのまま利用したほうが良い。

【０１２８】したがって、入力狭帯域音声の周波数範囲
をステップＳ５１でＢＳＦ１８を用いたフィルタリング
により除去してから、ステップ５２でオーバーサンプル
回路１９により狭帯域音声をオーバーサンプルしたもの
と、ステップＳ５３で加算する。

【０１２９】このように、図１１に示した音声合成装置
では、量子化時に狭帯域コードブックのコードベクタと
比較することによって量子化するのではなく、広帯域コ
ードブックから演算によって求められるコードベクタと
の比較で量子化する。これにより、広帯域コードブック
が分析、合成の両用となり、狭帯域コードブックを保持
するメモリが不要となる。もちろん、この音声合成装置
によっても、励振源の品質を改善することでより品質の
よい広帯域信号を得られる。

【０１３０】しかしながら、この図１１に示した音声合
成装置では、メモリ容量を節約する効果よりも、演算に
よる処理量が増えることが問題となる場合も考えられ
る。そこで、コードブックは広帯域のみとしつつ、演算
量も増やさない音声合成方法を適用した図１３に示す音
声合成装置を説明する。この図１３に示す音声合成装置
は、上記図１１に示した演算回路２５及び２６の代わり
に、上記広帯域コードブック内の各コードベクトルを部
分的に抽出して狭帯域パラメータを求める部分抽出回路
２８及び２９を用いている。他の構成は上記図６又は図
１１と同様である。

【０１３１】先に示した帯域制限フィルタのインパルス
応答の自己相関は、周波数領域では、次の（３）式で示
すように帯域制限フィルタのパワースペクトル特性とな
る。

【０１３２】

【数３】

【０１３３】ここで、この帯域制限フィルタのパワー特
性と等しい周波数特性を持つ、もう一つの帯域制限フィ
ルタを考え、この周波数特性をＨ’とすれば、上記
（３）式は次の（４）式になる。

【０１３４】

【数４】

【０１３５】この（４）式で示される新たなフィルタの
通過域、阻止域は当初の帯域制限フィルタと同等であ
り、減衰特性が２乗となる。したがって、この新たなフ
ィルタもまた、帯域制限フィルタと言える。

【０１３６】これを考慮すると、狭帯域自己相関は、広
帯域自己相関と帯域制限フィルタのインパルス応答との
畳み込み、すなわち広帯域自己相関を帯域制限した次の
（５）式のように単純化される。

【０１３７】

【数５】

【０１３８】ここで、コードブックに使用するパラメー
タを自己相関とする場合、そもそも現実にＶにおいて
は、自己相関パラメータは１次よりも２次が小さく、２
次よりも３次がさらに小さく、という具合に、なだらか
な単調減少の曲線を描く傾向がある。

【０１３９】一方で、狭帯域信号と広帯域信号との関係
は、広帯域信号をローパスしたものを狭帯域信号として
いるため、狭帯域自己相関は、広帯域自己相関をローパ
スすることによって理論的に求められる。

【０１４０】しかしながら、そもそも広帯域自己相関が
なだらかであるため、ローパスしてもほとんど変化がな
く、このローパス処理は省略しても影響がない。したが
って、広帯域自己相関を狭帯域自己相関そのものとして
利用することが可能である。ただし、広帯域信号のサン
プリング周波数は、狭帯域信号のサンプリング周波数の
２倍としているため、実際には、狭帯域自己相関は広帯
域自己相関の１次おきに取ったものとなる。

【０１４１】すなわち、広帯域自己相関コードベクタを
１次おきに取ったものは、狭帯域自己相関コードベクタ
と同等に扱うことができ、入力狭帯域音声の自己相関
は、広帯域コードブックによって量子化することがで
き、狭帯域コードブックが不要ということである。

【０１４２】また、ＵＶにおいては、先に述べたよう
に、高域エネルギーが大きく、予測を誤ると影響が大の
ため、Ｖ／ＵＶ判断をＶ側に偏らせてあり、ＵＶと判断
されるのは、ＵＶである確度が高い場合のみである。そ
のため、ＵＶ用コードブックサイズはＶ用よりも小さく
しており、互いにはっきりと異なるベクタのみが登録さ
れている。したがって、ＵＶの自己相関はＶほどなだら
かな曲線ではないにも関わらず、広帯域自己相関コード
ベクタを１次おきに取ったものと入力狭帯域信号の自己
相関とを比較することで、広帯域自己相関コードベクタ
をローパスしたものと同等の、すなわち狭帯域コードブ
ックが存在する場合と同等の量子化が可能である。すな
わち、ＶもＵＶも、狭帯域コードブックが不要となる。

【０１４３】以上のように、コードブックに使用するパ
ラメータを自己相関とした場合は、入力狭帯域音声の自
己相関を、広帯域コードベクタを１次おきに取ったもの
と比較することで量子化できる。この動作は、上記図１
２のステップＳ４５で部分抽出回路２８及び２９に広帯
域コードブックのコードベクトルを１次おきに取らせる
ことにより実現できる。

【０１４４】ここで、コードブックに使用するパラメー
タを、スペクトル包絡とした場合について考える。この
場合、明らかであるが、狭帯域スペクトルは、広帯域ス
ペクトルの一部であるから、狭帯域スペクトルのコード
ブックは不要である。狭帯域入力音声のスペクトル包絡
を、広帯域スペクトル包絡コードベクタの一部と比較を
することによって量子化が可能であることは言うまでも
ない。

【０１４５】次に、本発明に係る音声合成方法及び装置
の適用例について図面を参照しながら説明する。この適
用例は、入力された複数種類の符号化パラメータを用い
て音声を合成する音声合成装置を受信機側に備えた、図
１４に示すディジタル携帯電話装置である。

【０１４６】先ず、このディジタル携帯電話装置の構成
を説明しておく。ここでは、送信機側と受信機側を別々
に記しているが、実際には一つの携帯電話装置内にまと
めて内蔵されている。

【０１４７】送信機側では、マイクロホン３１から入力
された音声信号を、Ａ／Ｄ変換器３２によりディジタル
信号に変換し、音声符号化器３３により符号化してから
送信器３４で出力ビットに送信処理を施し、アンテナ３
５から送信する。

【０１４８】このとき、音声符号化器３３は、伝送路に
より制限される狭帯域化を考慮した符号化パラメータを
送信器３４に供給する。例えば、符号化パラメータとし
ては、励振源に関するパラメータや、線形予測係数αな
どがある。

【０１４９】また、受信機側では、アンテナ３６で捉え
た電波を、受信器３７で受信し、音声復号化器３８で上
記符号化パラメータを復号し、音声合成部３９で上記復
号化パラメータを用いて音声を合成し、Ｄ／Ａ変換器４
０でアナログ音声信号に戻して、スピーカ４１から出力
する。

【０１５０】このディジタル携帯電話装置における、上
記音声合成装置の第１の具体例を図１５に示す。この図
１５に示す音声合成装置は、上記ディジタル携帯電話装
置の送信側の音声符号化器３３から送られてきた符号化
パラメータを用いて音声を合成する装置であるため、音
声符号化器３３での符号化方法に従った復号化を音声復
号化器３８で行う。

【０１５１】音声符号器３３での符号化方法がＰＳＩ−
ＣＥＬＰ（ＰｉｔｃｈＳｙｎｃｈｒｏｎｕｓＩｎｎ
ｏｖａｔｉｏｎ−ＣＥＬＰ：ピッチ同期雑音励振源−Ｃ
ＥＬＰ）符号化方式によるものであるとすれば、音声復
号化器３８での復号化方法もＰＳＩ−ＣＥＬＰによる。

【０１５２】音声復号化器３８は、上記符号化パラメー
タの内の第１の符号化パラメータである励振源に関する
パラメータから狭帯域励振源を復号した後、ゼロ詰め部
１６に送る。また、上記符号化パラメータの内の第２の
符号化パラメータである線形予測係数に関するパラメー
タをαに変換しα→ｒ（線形予測係数→自己相関）変換
回路４に供給する。また、上記符号化パラメータの内の
第３の符号化パラメータである有声音／無声音判定フラ
グに関するものをＶ／ＵＶ判定回路５に供給する。

【０１５３】音声合成装置は、上記音声復号化器３８
と、ゼロ詰め部１６と、このゼロ詰め部１６からの広帯
域励振源に雑音信号を付加する雑音付加部９１と、α→
ｒ変換回路４と、Ｖ／ＵＶ判定回路５の他、広帯域有声
音及び無声音から抽出した有声音用及び無声音用パラメ
ータを用いて予め作成した広帯域有声音用コードブック
１２と広帯域無声音用コードブック１４とを備える。

【０１５４】さらに、この音声合成装置は、広帯域有声
音用コードブック１２と広帯域無声音用コードブック１
４内の各コードベクトルを部分抽出して狭帯域パラメー
タを求める部分抽出回路２８及び部分抽出回路２９と、
α→ｒ変換回路４からの狭帯域有声音用自己相関を部分
抽出回路２８からの狭帯域パラメータを用いて量子化す
る狭帯域有声音用量子化器７と、上記α→ｒ変換回路４
からの狭帯域無声音用自己相関を部分抽出回路２９から
の狭帯域パラメータを用いて量子化する狭帯域無声音用
量子化器９と、狭帯域有声音用量子化器７からの狭帯域
有声音用量子化データを広帯域有声音用コードブック１
２を用いて逆量子化する広帯域有声音用逆量子化器１１
と、狭帯域無声音用量子化器９からの狭帯域無声音用量
子化データを広帯域無声音用コードブック１４を用いて
逆量子化する広帯域無声音用逆量子化器１３と、広帯域
有声音用逆量子化器１１からの逆量子化データとなる広
帯域有声音用自己相関を広帯域有声音用の線形予測係数
に変換すると共に広帯域無声音用逆量子化器１３からの
逆量子化データとなる広帯域無声音用自己相関を広帯域
無声音用の線形予測係数に変換する自己相関→線形予測
係数（ｒ→α）変換回路１５と、このｒ→α変換回路１
５からの広帯域有声音用線形予測係数と広帯域無声音用
線形予測係数と雑音付加部９１からの雑音信号が付加さ
れた広帯域励振源とに基づいて広帯域音声を合成するＬ
ＰＣ合成回路１７とを備えてなる。

【０１５５】また、この音声合成装置は、音声復号化器
３８で復号化された狭帯域音声データのサンプリング周
波数を８ｋＨｚから１６ｋＨｚにオーバーサンプリング
するオーバーサンプル回路１９と、ＬＰＣ合成回路１７
からの合成出力から入力狭帯域音声データの周波数帯域
３００Ｈｚ〜３４００Ｈｚの信号成分を除去するバンド
ストップフィルタ（ＢＳＦ）１８と、このＢＳＦ１８か
らのフィルタ出力にオーバーサンプル回路１９からのサ
ンプリング周波数１６ｋＨｚの周波数帯域３００Ｈｚ〜
３４００Ｈｚの基の狭帯域音声データ成分を加算する加
算器２０とを備えている。

【０１５６】ここで、上記広帯域有声音及び無声音用コ
ードブック１２及び１４は、上記図７〜図９に示した手
順に基づいて作成できる。学習用データとしては、コー
ドブックの品質を良いものとするために、有声音（Ｖ）
から無声音（ＵＶ）、ＵＶからＶへの遷移状態のもの
や、ＶともＵＶとも判別しがたいものは除外してしま
い、確実にＶであるものと、確実にＵＶであるもののみ
を利用する。このようにして、学習用狭帯域Ｖフレーム
の集まりと、同ＵＶフレームの集まりを作成する。次
に、上記広帯域有声音及び無声音用コードブック１２及
び１４を用い、実際に送信側から伝送されてきた符号化
パラメータを用いて音声を合成する動作について図１６
を参照しながら説明する。

【０１５７】先ず、音声復号化器３８でデコードされた
線形予測係数αは、ステップＳ６１でα→ｒ変換回路４
により自己相関ｒに変換される。

【０１５８】また、音声復号化器３８でデコードされた
有声音／無声音判定フラグに関するパラメータはステッ
プＳ６２でＶ／ＵＶ判定回路５により解読され、Ｖ／Ｕ
Ｖの判別が行われる。

【０１５９】ここで、Ｖと判定されると、α→ｒ変換回
路４からの出力を切り替えるスイッチ６は、狭帯域有声
音量子化回路７に接続され、ＵＶと判定されると、狭帯
域無声音量子化回路９に接続される。

【０１６０】このＶ／ＵＶの判別も、コードブック作成
時とは異なり、ＶにもＵＶにも属さないフレームは発生
させず、必ずどちらかに振り分ける。

【０１６１】ＵＶ判定回路５がＶと判定したときには、
ステップＳ６４では、スイッチ６からの有声音用自己相
関ｒを狭帯域Ｖ量子化回路７に供給して、量子化する。
しかし、この量子化は狭帯域用のコードブックを用いる
のではなく、上述したように部分抽出回路２８によりス
テップＳ６３で求めた狭帯域Ｖ用パラメータを用いる。

【０１６２】一方、ＵＶ判定回路５がＵＶであるときに
は、ステップＳ６３では、スイッチ６からの無声音用自
己相関ｒを狭帯域ＵＶ量子化回路９に供給して量子化す
るが、ここでも、狭帯域ＵＶコードブックを用いずに、
部分抽出回路２９で演算により求めた狭帯域ＵＶ用パラ
メータを用いて量子化する。

【０１６３】そして、ステップＳ６５でそれぞれ対応す
る広帯域Ｖ逆量子化回路１１又は広帯域ＵＶ逆量子化回
路１３により広帯域Ｖコードブック１２又は広帯域ＵＶ
コードブック１４を用いて逆量子化し、これにより広帯
域自己相関が得られる。

【０１６４】そして、広帯域自己相関はステップＳ６６
でｒ→α変換回路１５により広帯域αに変換される。

【０１６５】一方で、音声復号化器３８からの励振源に
関するパラメータは、ステップＳ６７でゼロ詰め部１６
によりサンプル間にゼロが詰められることでアップサン
プルされ、エイリアシングにより広帯域化される。そし
て、この広帯域励振源にステップＳ６７−１で雑音付加
部９１から雑音信号が付加されてから、ＬＰＣ合成回路
１７に供給される。

【０１６６】そして、ステップＳ６８で、ＬＰＣ合成回
路１７が広帯域αと広帯域励振源とを、ＬＰＣ合成し、
広帯域の音声信号が得られる。

【０１６７】しかし、このままでは予測によって求めら
れた広帯域信号にすぎず、予測による誤差が含まれる。
特に入力狭帯域音声の周波数範囲に関しては、入力音声
をそのまま利用したほうが良い。

【０１６８】したがって、入力狭帯域音声の周波数範囲
をステップＳ６９でＢＳＦ１８を用いたフィルタリング
により除去してから、ステップ７０でオーバーサンプル
回路１９により符号化音声データをオーバーサンプルし
たものと、ステップＳ７１で加算する。

【０１６９】このように、図１５に示した音声合成装置
では、量子化時に狭帯域コードブックのコードベクタと
比較することによって量子化するのではなく、広帯域コ
ードブックから部分抽出して求められるコードベクタと
の比較で量子化する。

【０１７０】すなわち、デコード中にαパラメータが得
られるので、これを利用し、αから狭帯域自己相関に変
換、これを広帯域コードブックの各ベクタを１次おきに
とったものと比較をし、量子化する。そして同じベクタ
の今度は全部を用いて逆量子化することで広帯域自己相
関を得る。そして広帯域自己相関から広帯域αに変換す
る。このときに、ゲイン調整および高域の若干の抑圧も
先の説明同様に行い、聴感上の品質を向上させている。

【０１７１】これにより、広帯域コードブックが分析、
合成の両用となり、狭帯域コードブックを保持するメモ
リが不要となる。

【０１７２】もちろん、この音声合成装置でも、雑音付
加部９１で３４００−４６００Ｈｚの周波数帯域を持つ
雑音信号を生成し、ゲイン調整を行い、ゼロ詰め部１６
でのゼロ詰め後の励振源excＷに付加している。これに
より得られる広帯域励振源は、よりフラットに近づいて
おり、品質のよい広帯域信号を得られる。

【０１７３】なお、ＰＳＩ−ＣＥＬＰによる音声復号化
器３８からの符号化パラメータを用いて音声を合成する
音声合成装置としては、図１７に示す音声合成装置も考
えられる。この図１７に示す音声合成装置は、部分抽出
回路２８及び部分抽出回路２９の代わりに、広帯域コー
ドブック内の各コードベクトルより演算によって狭帯域
Ｖ（ＵＶ）パラメータを求める演算回路２５及び２６を
用いている。他の構成は上記図１５と同様である。

【０１７４】次に、上記ディジタル携帯電話装置におけ
る、上記音声合成装置の第２の具体例を図１８に示す。
この図１８に示す音声合成装置も、上記ディジタル携帯
電話装置の送信側の音声符号化器３３から送られてきた
符号化パラメータを用いて音声を合成する装置であるた
め、音声符号化器３３での符号化方法に従った復号化を
音声復号化器４６で行う。

【０１７５】音声符号器３３での符号化方法がＶＳＥＬ
Ｐ（ＶｅｃｔｏｒＳｕｍ excｉｔｅｄＬｉｎｅａ
ｒＰｒｅｄｉｃｔｉｏｎ：ベクトル和励起線形予測）
符号化方式によるものであるとすれば、この音声復号化
器４６での復号化方法もＶＳＥＬＰによる。

【０１７６】音声復号化器４６は、上記符号化パラメー
タの内の第１の符号化パラメータである励振源に関する
パラメータを励振源切り換え部４７に供給する。また、
上記符号化パラメータの内の第２の符号化パラメータで
ある線形予測係数αをα→ｒ（線形予測係数→自己相
関）変換回路４に供給する。また、上記符号化パラメー
タの内の第３の符号化パラメータである有声音／無声音
判定フラグに関するものをＶ／ＵＶ判定回路５に供給す
る。

【０１７７】上記図１５及び図１７に示したＰＳＩ−Ｃ
ＥＬＰを用いた音声合成装置と異なるのは、励振源切り
換え回路４７をゼロ詰め部１６の前段に設けている点で
ある。

【０１７８】ＰＳＩ−ＣＥＬＰは、コーデック自体、特
にＶを聴感上滑らかに聞こえるような処理を行っている
が、ＶＳＥＬＰにはこれがなく、このために帯域幅拡張
したときに若干雑音が混入したように聞こえる。そこ
で、広帯域励振源を作成する際に、励振源切り換え回路
４７により図１９のような処理を施す。

【０１７９】ＶＳＥＬＰの励振源は、コーデックに利用
されるパラメータｂｅｔａ（長期予測係数），ｂＬ
［ｉ］（長期フィルタ状態），ｇａｍｍａ１（利得），
ｃ１［ｉ］（励起コードベクタ）により、ｂｅｔａ＊ｂ
Ｌ［ｉ］＋ｇａｍｍａ１＊ｃ１［ｉ］として作成される
が、このうち前者がピッチ成分、後者がノイズ成分を表
すので、これをｂｅｔａ＊ｂＬ［ｉ］とｇａｍｍａ１＊
ｃ１［ｉ］に分け、ステップＳ８７で、一定の時間範囲
において、前者のエネルギーが大きい場合にはピッチが
強い有声音と考えられるため、ステップＳ８８でＹＥＳ
に進み、励振源をパルス列とし、ピッチ成分のない部分
ではＮＯに進み０に抑圧して、ステップＳ８９でゼロ詰
めする。ここでは雑音付加はしない。また、ステップＳ
８７でエネルギーが大きくない場合には１のサンプル値
と２のサンプル値で合成し、ステップＳ９４でゼロ詰め
を行ってからステップＳ９５で雑音付加を行い、その
後、ステップＳ９０でＬＰＣ合成する。これにより、Ｖ
ＳＥＬＰにおける有声音の聴感上の品質が向上した。

【０１８０】なお、ＶＳＥＬＰによる音声復号化器４６
からの符号化パラメータを用いて音声を合成する音声合
成装置としては、図２０に示す音声合成装置も考えられ
る。この図２０に示す音声合成装置は、部分抽出回路２
８及び部分抽出回路２９の代わりに、広帯域コードブッ
ク内の各コードベクトルより演算によって狭帯域Ｖ（Ｕ
Ｖ）パラメータを求める演算回路２５及び２６を用いて
いる。他の構成は上記図１８と同様である。

【０１８１】なお、このような音声合成装置において
も、図６に示したような広帯域有声音及び無声音から抽
出した有声音用及び無声音用パラメータを用いて予め作
成した広帯域有声音用コードブック１２と広帯域無声音
用コードブック１４と、上記広帯域音声を周波数帯域制
限して得た周波数帯域が例えば３００Ｈｚ〜３４００Ｈ
ｚの狭帯域音声信号から抽出した有声音用及び無声音用
パラメータにより予め作成した狭帯域有声音用コードブ
ック７と狭帯域無声音用コードブック１０とを用いての
音声合成処理も可能である。

【０１８２】また、低域から高域を予測するものだけに
限定するものではない。また、広帯域スペクトルを予測
する手段においては、信号を音声に限るものではない。

【０１８３】なお、本発明は、低域から高域を予測する
ものだけに限定するものではない。また、広帯域スペク
トルを予測する手段においては、信号を音声に限るもの
ではない。さらに、線形予測分析に限らず、ＰＡＲＣＯ
Ｒ分析などを用いても良い。

【０１８４】また、本発明に係る音声合成方法をソフト
ウェアプログラムとして例えばＲＯＭのような記録媒体
に記録しておけば、パーソナルコンピュータ上で音声合
成装置をソフト的に構成できる。

【０１８５】図２１にはパーソナルコンピュータの具体
的構成例を示す。ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏ
ｒｙ）１０１には、上記音声合成方法をソフトウェア化
した音声合成プログラムが記憶されている。ＣＰＵ（Ｃ
ｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０
２は、ＲＯＭ１０１に記憶された上記音声合成プログラ
ムを読み出し実行することで、上述してきた音声合成装
置として動作する。

【０１８６】ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭ
ｅｍｏｒｙ）１０３は、ＣＰＵ１０２の動作上必要なプ
ログラムやデータなどを記憶する。入力装置１０４は、
例えば、マイク、外部インターフェースなどで構成され
る。出力装置１０５は、例えば、ディスプレイや、スピ
ーカなどで構成され、必要な情報を出力する。

【０１８７】

【発明の効果】このように、本発明に係る音声合成装置
及び方法によれば、励振源の品質を改善することで、よ
り品質の良い広帯域信号を得られるようになる。

【０１８８】また、本発明に係る電話装置によれば、品
質の良い広帯域信号を受信手段から出力できる。

【０１８９】また、本発明に係るプログラム提供媒体に
よれば、上記音声合成方法をプログラム化して提供する
ことにより、品質の良い広帯域信号を安価に提供でき
る。

【図面の簡単な説明】

【図１】本発明の音声合成装置の実施の形態の第１の具
体例の構成を示すブロック図である。

【図２】上記第１の具体例に対する比較例としての従来
の音声合成装置のブロック図である。

【図３】上記実施の形態の第２の具体例の構成を示すブ
ロック図である。

【図４】上記実施の形態の第３の具体例の構成を示すブ
ロック図である。

【図５】上記実施の形態の第４の具体例の構成を示すブ
ロック図である。

【図６】上記実施の形態の第５の具体例の構成を示すブ
ロック図である。

【図７】上記図６に示した第５の具体例に用いているコ
ードブック用のデータを作成する方法を説明するための
フローチャートである。

【図８】上記図６に示した第５の具体例となる音声合成
装置に用いているコードブックを作成する方法を説明す
るためのフローチャートである。

【図９】上記図６に示した音声帯域合成装置に用いてい
るコードブックを作成する他の方法を説明するためのフ
ローチャートである。

【図１０】上記図６に示した音声合成置の動作を説明す
るためのフローチャートである。

【図１１】上記図６に示した音声合成装置からコードブ
ックの数を減らした変形例の構成を示すブロック図であ
る。

【図１２】上記図１１に示す変形例の動作を説明するた
めのフローチャートである。

【図１３】上記図６に示した音声合成装置からコードブ
ックの数を減らした他の変形例の構成を示すブロック図
である。

【図１４】本発明に係る音声合成方法及び装置を受信機
側に適用したディジタル携帯電話装置の構成を示すブロ
ック図である。

【図１５】音声復号化器にＰＳＩ−ＣＥＬＰ方式を採用
した音声合成装置の構成を示すブロック図である。

【図１６】上記図１５に示した音声合成装置の動作を説
明するためのフローチャートである。

【図１７】音声復号化器にＰＳＩ−ＣＥＬＰ方式を採用
した音声合成装置の他の構成を示すブロック図である。

【図１８】音声復号化器にＶＳＥＬＰ方式を採用した音
声合成装置の構成を示すブロック図である。

【図１９】上記図１８に示した音声合成装置の動作を説
明するためのフローチャートである。

【図２０】音声復号化器にＶＳＥＬＰ方式を採用した音
声合成装置の他の構成を示すブロック図である。

【図２１】本発明に係るプログラム提供媒体をＲＯＭか
ら読み出して実行するパーソナルコンピュータの構成を
示すブロック図である。

【符号の説明】

５２ α広帯域化部、５５広帯域ＬＰＣ合成部、５６
帯域抑圧部、６１ゼロ詰め部、６２雑音付加部

Claims

【特許請求の範囲】

【請求項１】狭帯域信号の線形予測残差又は励振源を
入力パラメータにしたフィルタ合成により得られた出力
信号の一部を用いて広帯域信号を合成する音声合成装置
において、上記線形予測残差又は励振源に雑音信号を付加する雑音
付加手段を備えることを特徴とする音声合成装置。
【請求項２】上記雑音信号は、上記線形予測残差又は
励振源の持つ周波数帯域以外の帯域成分を含むことを特
徴とする請求項１記載の音声合成装置。
【請求項３】狭帯域信号の線形予測残差又は励振源を
入力パラメータにしたフィルタ合成により得られた出力
信号の一部を用いて広帯域信号を合成する音声合成装置
において、上記線形予測残差又は励振源を用いて広帯域励振源を生
成する広帯域励振源生成手段と、上記広帯域励振源に雑音信号を付加する雑音付加手段と
を備えることを特徴とする音声合成装置。
【請求項４】上記雑音信号は、上記広帯域励振源の持
つ周波数帯域以外の帯域成分を含むことを特徴とする請
求項３記載の音声合成装置。
【請求項５】狭帯域信号の線形予測残差又は励振源を
入力パラメータにしたフィルタ合成により得られた出力
信号の一部を用いて広帯域信号を合成する音声合成装置
において、上記線形予測残差又は励振源に雑音信号を付加する雑音
付加手段と、上記雑音付加手段で雑音信号が付加された線形予測残差
又は励振源から広帯域励振源を生成する広帯域励振源生
成手段とを備えることを特徴とする音声合成装置。
【請求項６】上記雑音信号は狭帯域励振源の持つ周波
数帯域以外の帯域成分を含むことを特徴とする請求項５
記載の音声合成装置。
【請求項７】狭帯域信号から生成した線形予測残差を
入力パラメータにしたフィルタ合成により得た出力信号
の一部を用いて広帯域信号を合成する音声合成装置にお
いて、上記狭帯域信号を分析して線形予測残差信号を求める分
析手段と、上記分析手段で得られた線形予測残差信号から広帯域残
差信号を生成する広帯域残差信号生成手段と、上記広帯域残差信号生成手段で生成された広帯域残差信
号の持つ周波数帯域以外の帯域成分を含む雑音信号を上
記広帯域残差信号に付加する雑音付加手段とを備えるこ
とを特徴とする音声合成装置。
【請求項８】上記雑音信号は、広帯域励振源の持つ周
波数帯域以外の帯域成分を含むことを特徴とする請求項
７記載の音声合成装置。
【請求項９】狭帯域信号から生成した線形予測残差を
入力パラメータにしたフィルタ合成により得た出力信号
の一部を用いて広帯域信号を合成する音声合成装置にお
いて、上記狭帯域信号を分析して線形予測残差信号を求める分
析手段と、上記分析手段で得られた線形予測残差信号の持つ周波数
帯域以外の帯域成分を含む雑音信号を上記残差信号に付
加する雑音付加手段と、上記雑音付加手段で雑音信号が付加された線形予測残差
信号から広帯域残差信号を生成する広帯域残差信号生成
手段とを備えることを特徴とする音声合成装置。
【請求項１０】上記雑音信号は狭帯域励振源の持つ周
波数帯域以外の帯域成分を含むことを特徴とする請求項
９記載の音声合成装置。
【請求項１１】狭帯域信号の線形予測残差又は励振源
を入力パラメータにしたフィルタ合成により得られた出
力信号の一部を用いて広帯域信号を合成する音声合成方
法において、上記線形予測残差又は励振源に雑音信号を付加する雑音
付加工程を備えることを特徴とする音声合成方法。
【請求項１２】上記雑音信号は、上記線形予測残差又
は励振源の持つ周波数帯域以外の帯域成分を含むことを
特徴とする請求項１１記載の音声合成方法。
【請求項１３】狭帯域信号の線形予測残差又は励振源
を入力パラメータにしたフィルタ合成により得られた出
力信号の一部を用いて広帯域信号を合成する音声合成方
法において、上記線形予測残差又は励振源を用いて広帯域励振源を生
成する広帯域励振源生成工程と、上記広帯域励振源に雑音信号を付加する雑音付加工程と
を備えることを特徴とする音声合成方法。
【請求項１４】上記雑音信号は、上記広帯域励振源の
持つ周波数帯域以外の帯域成分を含むことを特徴とする
請求項１３記載の音声合成方法。
【請求項１５】狭帯域信号の線形予測残差又は励振源
を入力パラメータにしたフィルタ合成により得られた出
力信号の一部を用いて広帯域信号を合成する音声合成方
法において、上記線形予測残差又は励振源に雑音信号を付加する雑音
付加工程と、上記雑音付加工程で雑音信号が付加された線形予測残差
又は励振源から広帯域励振源を生成する広帯域励振源生
成工程とを備えることを特徴とする音声合成方法。
【請求項１６】上記雑音信号は狭帯域励振源の持つ周
波数帯域以外の帯域成分を含むことを特徴とする請求項
１５記載の音声合成方法。
【請求項１７】狭帯域信号から生成した線形予測残差
を入力パラメータにしたフィルタ合成により得た出力信
号の一部を用いて広帯域信号を合成する音声合成方法に
おいて、上記狭帯域信号を分析して線形予測残差信号を求める分
析工程と、上記分析工程で得られた線形予測残差信号から広帯域残
差信号を生成する広帯域残差信号生成工程と、上記広帯域残差信号生成工程で生成された広帯域残差信
号の持つ周波数帯域以外の帯域成分を含む雑音信号を上
記広帯域残差信号に付加する雑音付加工程とを備えるこ
とを特徴とする音声合成方法。
【請求項１８】上記雑音信号は、広帯域励振源の持つ
周波数帯域以外の帯域成分を含むことを特徴とする請求
項１７記載の音声合成方法。
【請求項１９】狭帯域信号から生成した線形予測残差
を入力パラメータにしたフィルタ合成により得た出力信
号の一部を用いて広帯域信号を合成する音声合成方法に
おいて、上記狭帯域信号を分析して線形予測残差信号を求める分
析工程と、上記分析工程で得られた線形予測残差信号の持つ周波数
帯域以外の帯域成分を含む雑音信号を上記残差信号に付
加する雑音付加工程と、上記雑音付加工程で雑音信号が付加された線形予測残差
信号から広帯域残差信号を生成する広帯域残差信号生成
工程とを備えることを特徴とする音声合成方法。
【請求項２０】上記雑音信号は狭帯域励振源の持つ周
波数帯域以外の帯域成分を含むことを特徴とする請求項
１９記載の音声合成方法。
【請求項２１】伝送信号として狭帯域信号のパラメー
タをＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化して
送信する送信手段と、上記パラメータの内の線形予測残差又は励振源に雑音信
号を付加してからフィルタ合成により得た出力信号の一
部を用いて広帯域信号を合成する受信手段とを備えるこ
とを特徴とする電話装置。
【請求項２２】伝送信号として狭帯域信号のパラメー
タをＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化して
送信する送信手段と、上記パラメータの内の線形予測残差又は励振源を用いて
広帯域励振源を生成し、この広帯域励振源に雑音信号を
付加してからフィルタ合成により得た出力信号の一部を
用いて広帯域信号を合成する受信手段とを備えることを
特徴とする電話装置。
【請求項２３】伝送信号として狭帯域信号のパラメー
タをＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化して
送信する送信手段と、上記パラメータの内の線形予測残差又は励振源に雑音信
号を付加し、この雑音信号が付加された線形予測誤差又
は励振源から広帯域励振源を生成し、この広帯域励振源
を用いたフィルタ合成により得た出力信号の一部を用い
て広帯域信号を合成する受信手段とを備えることを特徴
とする電話装置。
【請求項２４】狭帯域信号の線形予測残差又は励振源
を入力パラメータにしたフィルタ合成により得られた出
力信号の一部を用いて広帯域信号を合成するためのプロ
グラムを提供するプログラム提供媒体において、上記線形予測残差又は励振源を用いて広帯域励振源を生
成する広帯域励振源生成手順と、上記広帯域励振源に雑音信号を付加する雑音付加手順と
を備える音声合成プログラムを提供することを特徴とす
るプログラム提供媒体。
【請求項２５】狭帯域信号の線形予測残差又は励振源
を入力パラメータにしたフィルタ合成により得られた出
力信号の一部を用いて広帯域信号を合成するためのプロ
グラムを提供するプログラム提供媒体において、上記線形予測残差又は励振源に雑音信号を付加する雑音
付加手順と、上記雑音付加手順で雑音信号が付加された線形予測残差
又は励振源から広帯域励振源を生成する広帯域励振源生
成手順とを備える音声合成プログラムを提供することを
特徴とするプログラム提供媒体。
【請求項２６】狭帯域信号から生成した線形予測残差
を入力パラメータにしたフィルタ合成により得た出力信
号の一部を用いて広帯域信号を合成するためのプログラ
ムを提供するプログラム提供媒体において、上記狭帯域信号を分析して線形予測残差信号を求める分
析手順と、上記分析手順で得られた線形予測残差信号から広帯域残
差信号を生成する広帯域残差信号生成手順と、上記広帯域残差信号生成手順で生成された広帯域残差信
号の持つ周波数帯域以外の帯域成分を含む雑音信号を上
記広帯域残差信号に付加する雑音信号付加手順とを備え
る音声合成プログラムを提供することを特徴とするプロ
グラム提供媒体。
【請求項２７】狭帯域信号から生成した線形予測残差
を入力パラメータにしたフィルタ合成により得た出力信
号の一部を用いて広帯域信号を合成するためのプログラ
ムを提供するプログラム提供媒体において、上記狭帯域信号を分析して線形予測残差信号を求める分
析手順と、上記分析手順で得られた線形予測残差信号の持つ周波数
帯域以外の帯域成分を含む雑音信号を上記残差信号に付
加する雑音付加手順と、上記雑音付加手順で雑音信号が付加された線形予測残差
信号から広帯域残差信号を生成する広帯域残差信号生成
手順とを備える音声合成プログラムを提供することを特
徴とするプログラム提供媒体。