JPH0421900A

JPH0421900A - 音声合成装置

Info

Publication number: JPH0421900A
Application number: JP2127282A
Authority: JP
Inventors: Kenji Matsui; 謙二松井
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1990-05-16
Filing date: 1990-05-16
Publication date: 1992-01-24
Anticipated expiration: 2012-11-12
Also published as: JP2674280B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明（よ　テキストを音声に変換する音声合成装置に
関する。

従来の技術音声合成方式には現在色々な方式が考案されており、た
とえｔｉ　　Ｌｐｃ系のパラメータを用いたＬＳＰ、Ｐ
ＡＲＣＯＲ，ケプストラム力式や、ターミナルアナログ
系のホルマント合成方式等である。この中でホルマント
合成方式は人間の発声機構に対して物理的な対応が最も
良く、古くから用いられている方式である。

第６図は従来例のホルマント音声合成方式の構成を示す
ものである。ここでは簡単のため母音の合成のみを考え
る。同図に於て、　１１は音源波生成部、　１２は共振
器や反共振器からなるポルマント合成部である。ま咀　
音源波生成部１で所望の基本周波数の音源波を合成する
。現在用いられている音源波モデルζ友　第６図に示す
ようＥ　　連続したパルス処　あるいは自然音源波をま
ねた形状のものが用いられている。この音源信号がホル
マント合成部１２に人力され声道の共振特性を付与され
て合成音とし２で出力される。

この手法で１ヨー４二記のような音源信号で取り扱える
音源情報は非常に少なく、ある程度以上の自然性は望む
ことが出来ない。自然な音源信号（ぬ個人性　性ｇＬ　
　年齢　等の音声にとって非常に重要な情報を持ってい
ると吾われている。然るに上記のような従来の音源モデ
ルでは重要な情報が大幅に欠落し合成器からの出力が機
械的な音声になるのが実情である。

発明が解決しようとする課題本発明は上記のような従来例の欠点を鑑へ　自然性の高
い合成音を出力できる技術を提供するものである。

課題を解決するための手段人間の声帯で生起する音源信号を抽出したものの一部を
格納する音源信号格納部と、上記音源信号格納部の音源
信号を用いて任意の長さの音源信号を再生する音源信号
再生部と、上記音源信号再生部の出力である音源信号の
基本周波数を制御する基本周波数制御部と、上記基本周
波数制御部の出力である音源信号の振ＩＮ　　周波数、
位相情報に揺らぎを付与する揺らぎ制御部と、人間の声
道や口腔、　鼻腔を模擬する声道フィルタ部とを具備す
る構成とする。

作用上記手段を用いることにより、自然音源の持つきめ細か
な情報を失う事無く音声合成処理が行え高品質な音声が
得られる。

実施例第１図（よ　自然音源の持つきめ細かな情報を失う事な
く高品質な音声合成処理を目的とした本発明の一実施例
における音声合成装置の構成を示すものである。

同図に於て、　１は音源格納部　２は音源再生部３は基
本周波数制御部　４は揺らぎ制御部　５は声道フィルタ
部である。

上記のように構成された本実施例の音声合成装置につい
て以下その動作を説明する。ここでは簡単のため母音の
合成のみを考える。

音源格納部１には予め自然音声から声道の共振特性など
を取り除いた音源信号のうち例えば基本周波数の一周期
分あるいは複数周期分が格納されている。音声合成を行
う場合、まず、音源再生部２が音源格納部１から必要な
一周期分または複数周期分の音源信号を取り出しその波
形を繰り返して次の基本周波数制御部３に送出する。こ
のとき音源信号の前端と後端を滑らかに接続する。この
接続方法の一例を説明する。第２図（戴　この波形接続
の一例を示したものである。音源波形をディジタル化し
Ｓ［ｉ］（ｉ＝１．２．、、、、Ｎ）とし　次の距離尺
度Ｄ（ｋ）を定義する。

このＤ（ｋ）を最小にする値ｋを算出ｔ、、　　ｉ＝ｏ
とｉ＝にの点を接続する。また　この距離（より（ｋ） Σ　　Ｓ（ｋ＋ｊ、）−８（ｉ）Ｄ（ｋ）　　＝−Σ　（Ｓ（ｋ＋１）−８（ｉ））等も
考えられる。

次に基本周波数制御部３で音源再生部２から出力された
音源波を所望の基本周波数に変換する。

この変換方法は例えば音源信号をディジタル化し各サン
プル点間を線形補間する。第３図はこの線形補間の様子
を示したものである。

次に揺らぎ制御部４で基本周波数制御部３から出力され
た音源信号に例えばランダムな振幅変態位相変温　周波
数変調等を行い自然音声の持つ揺らぎを付加する。この
揺らぎ制御部４からの出力は声道フィルタ部５に入力さ
れる。ここでは声道フィルタ部５としてホルマント合成
方式を例にとって考える。第４図はホルマント合成によ
る声道フィルタ部５の信号処理の様子を示したものであ
る。ここでは所望の音韻の各ホルマント周波数に対応す
る共振器が音源信号のスペクトルを変化させ合成音とし
て出力させる。

以上、説明したように本実施例によれ（渋　自然音源を
効果的に利用し高品質な合成音を出力出来る。

次（へ　第５図を参照（、なから、任意の音質で高品質
な合成を行うことを目的とした本発明の第２の実施例に
於ける音声合成装置を説明する。この例においても簡単
のため母音の合成のみを考える。

同図に於て、６は入力音声信号の各音素を認識する音素
認識部　７は白色化フィルタ餓　８は声道パラメータ抽
出Ｒ，９は声道パラメータ格納部１０は音源情報抽出部
である。

先ず操作者が所望の音質を本合成装置に登録する場合、
操作者はその音質の自然音声を音素認識部６に入力する
。このとき、予め決められた母音系列を入力するように
しておくと便利である。音素認識部６は入力された音声
から各母音の認識および各音素間の境界位置等の情報を
抽出する。

方、音素認識部６に入力されたものと同じ信号を白色化
フィルタ部７に入力する。白色化フィルタ部７（友　声
道の共振特性を取り除く操作を行うと同時にホルマント
周波数等の声道パラメータの情報も算出する。第５図で
（戴　例として各ホルマント周波数に対応する反共振器
が各ホルマントの共振特性を打ち消す場合を示す。この
白色化フィルタ部７の出力と音素認識部６の出力から声
道パラメータ抽出部″８は各母音の定常部の位置を検出
し装置　その母音の持つ各ホルマントの周波数やバンド
幅等の声道に関するパラメータを抽出し　声道パラメー
タ格納部９に格納する。音源情報抽出部１０は白色化フ
ィルタ部７の出力である声道特性を取り除かれた信号の
うち母音定常部の部分を代表的な音源波形として抽出し
音源格納部１に格納する。

以上で所望の音質の音声を合成するための準備が完了し
た　この後の合成の処理に関しては第１図で説明した処
理と同等であり、音源格納部１及び声道パラメータ格納
部９に格納された特定の音質に対応する情報により高品
質でかつ所望の声質に近い合成音が得られる。

以上説明したように本実施例によれば　特定の人の声を
分析しその特徴を格納することにより自然音源を利用し
高品質でかつ希望の声質の合成が可能になる。

発明の効果以上のように本発明によれば　音源にパルスや単純なモ
デルでなく、自然音声から取り出した音源波を繰り返し
用いる事により極めて自然性の高い合成音が得られる。

さらに　音源波が音声の個人性に大きく寄与しているこ
とから、この合成装置に音源波の抽出手段、声道パラメ
ータの抽出手段等を付属させることにより任意の音質で
の高品質な合成が実現できその実用的効果は大きい。

【図面の簡単な説明】

第１図は本発明の第１実施例における音声合成装置のブ
ロック巨　第２図は本実施例に於ける音源信号の接続の
様子を示す医　第３図は本実施例における音源信号の基
本周波数制御の様子を示す医　第４図は声道フィルタ部
の動作例を示す阻のブロック図である。１・・・音源格納詠　２・・・音源再生部、３・・・基
本周波数制御訊　４・・・揺らぎ制御餓５・・・声道フ
ィルタ餓　６・・・音素認識訊７・・・白色化フィルタ
眼　８・・・声道パラメータ抽出能　９・・・声道パラ
メータ格納眠　１０・・・音源情報抽出能　１１・・・
音源波生成餓　１２・・・ホルマント合成訛

Claims

【特許請求の範囲】

（１）人間の声帯で生起する音源信号を抽出したものの
一部を格納する音源信号格納部と、上記音源信号格納部
の音源信号を用いて任意の長さの音源信号を再生する音
源信号再生部と、上記音源信号再生部の出力である音源
信号の基本周波数を制御する基本周波数制御部と、上記
基本周波数制御部の出力である音源信号の振幅、周波数
、位相情報に揺らぎを付与する揺らぎ制御部と、人間の
声道や口腔、鼻腔を模擬する声道フィルタ部を具備する
ことを特徴とする音声合成装置。
（２）格納されている音源信号が基本周波数の一周期分
あるいは複数周期分であり、その信号を繰り返すことに
より長時間の音源信号とする音声信号再生部を有するこ
とを特徴とする請求項１に記載の音声合成装置。
（３）音源信号をディジタル化し、基本周波数を変化さ
せる際には各サンプル点間を線形補間する基本周波数制
御部を有することを特徴とする請求項１に記載の音声合
成装置。
（４）入力音声信号を音素認識する音素認識部と、上記
入力音声信号から声道の共振特性を打ち消す作用をする
白色化フィルタ部と、上記白色化フィルタ部に接続され
且つ上記音素認識部に接続されて白色化フィルタ部から
得られる声道パラメータ系列のうち音素認識部で得られ
た認識結果を基にして母音定常部の声道パラメータを抽
出する声道パラメータ抽出部と、上記声道パラメータ抽
出部の出力である各母音などの声道パラメータ系列を格
納する声道パラメータ格納部と、上記白色化フィルタ部
に接続され音源波形や基本周波数等の音源情報を抽出す
る音源情報抽出部と、上記音源情報抽出部の出力である
音源情報を格納する音源情報格納部と、音声合成時に上
記音源情報格納部から出力される音源情報と上記声道パ
ラメータ格納部から出力される声道パラメータ情報とを
用いて音声合成処理を行う請求項１に記載の音声合成装
置。