JPH0421900A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPH0421900A JPH0421900A JP2127282A JP12728290A JPH0421900A JP H0421900 A JPH0421900 A JP H0421900A JP 2127282 A JP2127282 A JP 2127282A JP 12728290 A JP12728290 A JP 12728290A JP H0421900 A JPH0421900 A JP H0421900A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- source signal
- vocal tract
- sound
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明(よ テキストを音声に変換する音声合成装置に
関する。
関する。
従来の技術
音声合成方式には現在色々な方式が考案されており、た
とえti Lpc系のパラメータを用いたLSP、P
ARCOR,ケプストラム力式や、ターミナルアナログ
系のホルマント合成方式等である。この中でホルマント
合成方式は人間の発声機構に対して物理的な対応が最も
良く、古くから用いられている方式である。
とえti Lpc系のパラメータを用いたLSP、P
ARCOR,ケプストラム力式や、ターミナルアナログ
系のホルマント合成方式等である。この中でホルマント
合成方式は人間の発声機構に対して物理的な対応が最も
良く、古くから用いられている方式である。
第6図は従来例のホルマント音声合成方式の構成を示す
ものである。ここでは簡単のため母音の合成のみを考え
る。同図に於て、 11は音源波生成部、 12は共振
器や反共振器からなるポルマント合成部である。ま咀
音源波生成部1で所望の基本周波数の音源波を合成する
。現在用いられている音源波モデルζ友 第6図に示す
ようE 連続したパルス処 あるいは自然音源波をま
ねた形状のものが用いられている。この音源信号がホル
マント合成部12に人力され声道の共振特性を付与され
て合成音とし2で出力される。
ものである。ここでは簡単のため母音の合成のみを考え
る。同図に於て、 11は音源波生成部、 12は共振
器や反共振器からなるポルマント合成部である。ま咀
音源波生成部1で所望の基本周波数の音源波を合成する
。現在用いられている音源波モデルζ友 第6図に示す
ようE 連続したパルス処 あるいは自然音源波をま
ねた形状のものが用いられている。この音源信号がホル
マント合成部12に人力され声道の共振特性を付与され
て合成音とし2で出力される。
この手法で1ヨー4二記のような音源信号で取り扱える
音源情報は非常に少なく、ある程度以上の自然性は望む
ことが出来ない。自然な音源信号(ぬ個人性 性gL
年齢 等の音声にとって非常に重要な情報を持ってい
ると吾われている。然るに上記のような従来の音源モデ
ルでは重要な情報が大幅に欠落し合成器からの出力が機
械的な音声になるのが実情である。
音源情報は非常に少なく、ある程度以上の自然性は望む
ことが出来ない。自然な音源信号(ぬ個人性 性gL
年齢 等の音声にとって非常に重要な情報を持ってい
ると吾われている。然るに上記のような従来の音源モデ
ルでは重要な情報が大幅に欠落し合成器からの出力が機
械的な音声になるのが実情である。
発明が解決しようとする課題
本発明は上記のような従来例の欠点を鑑へ 自然性の高
い合成音を出力できる技術を提供するものである。
い合成音を出力できる技術を提供するものである。
課題を解決するための手段
人間の声帯で生起する音源信号を抽出したものの一部を
格納する音源信号格納部と、上記音源信号格納部の音源
信号を用いて任意の長さの音源信号を再生する音源信号
再生部と、上記音源信号再生部の出力である音源信号の
基本周波数を制御する基本周波数制御部と、上記基本周
波数制御部の出力である音源信号の振IN 周波数、
位相情報に揺らぎを付与する揺らぎ制御部と、人間の声
道や口腔、 鼻腔を模擬する声道フィルタ部とを具備す
る構成とする。
格納する音源信号格納部と、上記音源信号格納部の音源
信号を用いて任意の長さの音源信号を再生する音源信号
再生部と、上記音源信号再生部の出力である音源信号の
基本周波数を制御する基本周波数制御部と、上記基本周
波数制御部の出力である音源信号の振IN 周波数、
位相情報に揺らぎを付与する揺らぎ制御部と、人間の声
道や口腔、 鼻腔を模擬する声道フィルタ部とを具備す
る構成とする。
作用
上記手段を用いることにより、自然音源の持つきめ細か
な情報を失う事無く音声合成処理が行え高品質な音声が
得られる。
な情報を失う事無く音声合成処理が行え高品質な音声が
得られる。
実施例
第1図(よ 自然音源の持つきめ細かな情報を失う事な
く高品質な音声合成処理を目的とした本発明の一実施例
における音声合成装置の構成を示すものである。
く高品質な音声合成処理を目的とした本発明の一実施例
における音声合成装置の構成を示すものである。
同図に於て、 1は音源格納部 2は音源再生部3は基
本周波数制御部 4は揺らぎ制御部 5は声道フィルタ
部である。
本周波数制御部 4は揺らぎ制御部 5は声道フィルタ
部である。
上記のように構成された本実施例の音声合成装置につい
て以下その動作を説明する。ここでは簡単のため母音の
合成のみを考える。
て以下その動作を説明する。ここでは簡単のため母音の
合成のみを考える。
音源格納部1には予め自然音声から声道の共振特性など
を取り除いた音源信号のうち例えば基本周波数の一周期
分あるいは複数周期分が格納されている。音声合成を行
う場合、まず、音源再生部2が音源格納部1から必要な
一周期分または複数周期分の音源信号を取り出しその波
形を繰り返して次の基本周波数制御部3に送出する。こ
のとき音源信号の前端と後端を滑らかに接続する。この
接続方法の一例を説明する。第2図(戴 この波形接続
の一例を示したものである。音源波形をディジタル化し
S[i](i=1.2.、、、、N)とし 次の距離尺
度D(k)を定義する。
を取り除いた音源信号のうち例えば基本周波数の一周期
分あるいは複数周期分が格納されている。音声合成を行
う場合、まず、音源再生部2が音源格納部1から必要な
一周期分または複数周期分の音源信号を取り出しその波
形を繰り返して次の基本周波数制御部3に送出する。こ
のとき音源信号の前端と後端を滑らかに接続する。この
接続方法の一例を説明する。第2図(戴 この波形接続
の一例を示したものである。音源波形をディジタル化し
S[i](i=1.2.、、、、N)とし 次の距離尺
度D(k)を定義する。
このD(k)を最小にする値kを算出t、、 i=o
とi=にの点を接続する。また この距離(よ り(k) Σ S(k+j、)−8(i) D(k) =−Σ (S(k+1)−8(i))等も
考えられる。
とi=にの点を接続する。また この距離(よ り(k) Σ S(k+j、)−8(i) D(k) =−Σ (S(k+1)−8(i))等も
考えられる。
次に基本周波数制御部3で音源再生部2から出力された
音源波を所望の基本周波数に変換する。
音源波を所望の基本周波数に変換する。
この変換方法は例えば音源信号をディジタル化し各サン
プル点間を線形補間する。第3図はこの線形補間の様子
を示したものである。
プル点間を線形補間する。第3図はこの線形補間の様子
を示したものである。
次に揺らぎ制御部4で基本周波数制御部3から出力され
た音源信号に例えばランダムな振幅変態位相変温 周波
数変調等を行い自然音声の持つ揺らぎを付加する。この
揺らぎ制御部4からの出力は声道フィルタ部5に入力さ
れる。ここでは声道フィルタ部5としてホルマント合成
方式を例にとって考える。第4図はホルマント合成によ
る声道フィルタ部5の信号処理の様子を示したものであ
る。ここでは所望の音韻の各ホルマント周波数に対応す
る共振器が音源信号のスペクトルを変化させ合成音とし
て出力させる。
た音源信号に例えばランダムな振幅変態位相変温 周波
数変調等を行い自然音声の持つ揺らぎを付加する。この
揺らぎ制御部4からの出力は声道フィルタ部5に入力さ
れる。ここでは声道フィルタ部5としてホルマント合成
方式を例にとって考える。第4図はホルマント合成によ
る声道フィルタ部5の信号処理の様子を示したものであ
る。ここでは所望の音韻の各ホルマント周波数に対応す
る共振器が音源信号のスペクトルを変化させ合成音とし
て出力させる。
以上、説明したように本実施例によれ(渋 自然音源を
効果的に利用し高品質な合成音を出力出来る。
効果的に利用し高品質な合成音を出力出来る。
次(へ 第5図を参照(、なから、任意の音質で高品質
な合成を行うことを目的とした本発明の第2の実施例に
於ける音声合成装置を説明する。この例においても簡単
のため母音の合成のみを考える。
な合成を行うことを目的とした本発明の第2の実施例に
於ける音声合成装置を説明する。この例においても簡単
のため母音の合成のみを考える。
同図に於て、6は入力音声信号の各音素を認識する音素
認識部 7は白色化フィルタ餓 8は声道パラメータ抽
出R,9は声道パラメータ格納部10は音源情報抽出部
である。
認識部 7は白色化フィルタ餓 8は声道パラメータ抽
出R,9は声道パラメータ格納部10は音源情報抽出部
である。
先ず操作者が所望の音質を本合成装置に登録する場合、
操作者はその音質の自然音声を音素認識部6に入力する
。このとき、予め決められた母音系列を入力するように
しておくと便利である。音素認識部6は入力された音声
から各母音の認識および各音素間の境界位置等の情報を
抽出する。
操作者はその音質の自然音声を音素認識部6に入力する
。このとき、予め決められた母音系列を入力するように
しておくと便利である。音素認識部6は入力された音声
から各母音の認識および各音素間の境界位置等の情報を
抽出する。
方、音素認識部6に入力されたものと同じ信号を白色化
フィルタ部7に入力する。白色化フィルタ部7(友 声
道の共振特性を取り除く操作を行うと同時にホルマント
周波数等の声道パラメータの情報も算出する。第5図で
(戴 例として各ホルマント周波数に対応する反共振器
が各ホルマントの共振特性を打ち消す場合を示す。この
白色化フィルタ部7の出力と音素認識部6の出力から声
道パラメータ抽出部″8は各母音の定常部の位置を検出
し装置 その母音の持つ各ホルマントの周波数やバンド
幅等の声道に関するパラメータを抽出し 声道パラメー
タ格納部9に格納する。音源情報抽出部10は白色化フ
ィルタ部7の出力である声道特性を取り除かれた信号の
うち母音定常部の部分を代表的な音源波形として抽出し
音源格納部1に格納する。
フィルタ部7に入力する。白色化フィルタ部7(友 声
道の共振特性を取り除く操作を行うと同時にホルマント
周波数等の声道パラメータの情報も算出する。第5図で
(戴 例として各ホルマント周波数に対応する反共振器
が各ホルマントの共振特性を打ち消す場合を示す。この
白色化フィルタ部7の出力と音素認識部6の出力から声
道パラメータ抽出部″8は各母音の定常部の位置を検出
し装置 その母音の持つ各ホルマントの周波数やバンド
幅等の声道に関するパラメータを抽出し 声道パラメー
タ格納部9に格納する。音源情報抽出部10は白色化フ
ィルタ部7の出力である声道特性を取り除かれた信号の
うち母音定常部の部分を代表的な音源波形として抽出し
音源格納部1に格納する。
以上で所望の音質の音声を合成するための準備が完了し
た この後の合成の処理に関しては第1図で説明した処
理と同等であり、音源格納部1及び声道パラメータ格納
部9に格納された特定の音質に対応する情報により高品
質でかつ所望の声質に近い合成音が得られる。
た この後の合成の処理に関しては第1図で説明した処
理と同等であり、音源格納部1及び声道パラメータ格納
部9に格納された特定の音質に対応する情報により高品
質でかつ所望の声質に近い合成音が得られる。
以上説明したように本実施例によれば 特定の人の声を
分析しその特徴を格納することにより自然音源を利用し
高品質でかつ希望の声質の合成が可能になる。
分析しその特徴を格納することにより自然音源を利用し
高品質でかつ希望の声質の合成が可能になる。
発明の効果
以上のように本発明によれば 音源にパルスや単純なモ
デルでなく、自然音声から取り出した音源波を繰り返し
用いる事により極めて自然性の高い合成音が得られる。
デルでなく、自然音声から取り出した音源波を繰り返し
用いる事により極めて自然性の高い合成音が得られる。
さらに 音源波が音声の個人性に大きく寄与しているこ
とから、この合成装置に音源波の抽出手段、声道パラメ
ータの抽出手段等を付属させることにより任意の音質で
の高品質な合成が実現できその実用的効果は大きい。
とから、この合成装置に音源波の抽出手段、声道パラメ
ータの抽出手段等を付属させることにより任意の音質で
の高品質な合成が実現できその実用的効果は大きい。
第1図は本発明の第1実施例における音声合成装置のブ
ロック巨 第2図は本実施例に於ける音源信号の接続の
様子を示す医 第3図は本実施例における音源信号の基
本周波数制御の様子を示す医 第4図は声道フィルタ部
の動作例を示す阻のブロック図である。 1・・・音源格納詠 2・・・音源再生部、3・・・基
本周波数制御訊 4・・・揺らぎ制御餓5・・・声道フ
ィルタ餓 6・・・音素認識訊7・・・白色化フィルタ
眼 8・・・声道パラメータ抽出能 9・・・声道パラ
メータ格納眠 10・・・音源情報抽出能 11・・・
音源波生成餓 12・・・ホルマント合成訛
ロック巨 第2図は本実施例に於ける音源信号の接続の
様子を示す医 第3図は本実施例における音源信号の基
本周波数制御の様子を示す医 第4図は声道フィルタ部
の動作例を示す阻のブロック図である。 1・・・音源格納詠 2・・・音源再生部、3・・・基
本周波数制御訊 4・・・揺らぎ制御餓5・・・声道フ
ィルタ餓 6・・・音素認識訊7・・・白色化フィルタ
眼 8・・・声道パラメータ抽出能 9・・・声道パラ
メータ格納眠 10・・・音源情報抽出能 11・・・
音源波生成餓 12・・・ホルマント合成訛
Claims (4)
- (1)人間の声帯で生起する音源信号を抽出したものの
一部を格納する音源信号格納部と、上記音源信号格納部
の音源信号を用いて任意の長さの音源信号を再生する音
源信号再生部と、上記音源信号再生部の出力である音源
信号の基本周波数を制御する基本周波数制御部と、上記
基本周波数制御部の出力である音源信号の振幅、周波数
、位相情報に揺らぎを付与する揺らぎ制御部と、人間の
声道や口腔、鼻腔を模擬する声道フィルタ部を具備する
ことを特徴とする音声合成装置。 - (2)格納されている音源信号が基本周波数の一周期分
あるいは複数周期分であり、その信号を繰り返すことに
より長時間の音源信号とする音声信号再生部を有するこ
とを特徴とする請求項1に記載の音声合成装置。 - (3)音源信号をディジタル化し、基本周波数を変化さ
せる際には各サンプル点間を線形補間する基本周波数制
御部を有することを特徴とする請求項1に記載の音声合
成装置。 - (4)入力音声信号を音素認識する音素認識部と、上記
入力音声信号から声道の共振特性を打ち消す作用をする
白色化フィルタ部と、上記白色化フィルタ部に接続され
且つ上記音素認識部に接続されて白色化フィルタ部から
得られる声道パラメータ系列のうち音素認識部で得られ
た認識結果を基にして母音定常部の声道パラメータを抽
出する声道パラメータ抽出部と、上記声道パラメータ抽
出部の出力である各母音などの声道パラメータ系列を格
納する声道パラメータ格納部と、上記白色化フィルタ部
に接続され音源波形や基本周波数等の音源情報を抽出す
る音源情報抽出部と、上記音源情報抽出部の出力である
音源情報を格納する音源情報格納部と、音声合成時に上
記音源情報格納部から出力される音源情報と上記声道パ
ラメータ格納部から出力される声道パラメータ情報とを
用いて音声合成処理を行う請求項1に記載の音声合成装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2127282A JP2674280B2 (ja) | 1990-05-16 | 1990-05-16 | 音声合成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2127282A JP2674280B2 (ja) | 1990-05-16 | 1990-05-16 | 音声合成装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0421900A true JPH0421900A (ja) | 1992-01-24 |
| JP2674280B2 JP2674280B2 (ja) | 1997-11-12 |
Family
ID=14956118
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2127282A Expired - Fee Related JP2674280B2 (ja) | 1990-05-16 | 1990-05-16 | 音声合成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2674280B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2004049304A1 (ja) * | 2002-11-25 | 2004-06-10 | Matsushita Electric Industrial Co., Ltd. | 音声合成方法および音声合成装置 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58168097A (ja) * | 1982-03-29 | 1983-10-04 | 日本電気株式会社 | 音声合成装置 |
| JPH0266600A (ja) * | 1988-08-31 | 1990-03-06 | Nec Corp | 音声合成方式 |
| JPH03144498A (ja) * | 1989-10-30 | 1991-06-19 | Ricoh Co Ltd | 音源信号生成装置 |
-
1990
- 1990-05-16 JP JP2127282A patent/JP2674280B2/ja not_active Expired - Fee Related
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58168097A (ja) * | 1982-03-29 | 1983-10-04 | 日本電気株式会社 | 音声合成装置 |
| JPH0266600A (ja) * | 1988-08-31 | 1990-03-06 | Nec Corp | 音声合成方式 |
| JPH03144498A (ja) * | 1989-10-30 | 1991-06-19 | Ricoh Co Ltd | 音源信号生成装置 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2004049304A1 (ja) * | 2002-11-25 | 2004-06-10 | Matsushita Electric Industrial Co., Ltd. | 音声合成方法および音声合成装置 |
| US7562018B2 (en) | 2002-11-25 | 2009-07-14 | Panasonic Corporation | Speech synthesis method and speech synthesizer |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2674280B2 (ja) | 1997-11-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Bonada et al. | Synthesis of the singing voice by performance sampling and spectral models | |
| JP3408477B2 (ja) | フィルタパラメータとソース領域において独立にクロスフェードを行う半音節結合型のフォルマントベースのスピーチシンセサイザ | |
| US5400434A (en) | Voice source for synthetic speech system | |
| JP2002328695A (ja) | テキストからパーソナライズ化音声を生成する方法 | |
| JP2004522186A (ja) | 音声合成器の音声固有化 | |
| EP0391545B1 (en) | Speech synthesizer | |
| EP0561752B1 (en) | A method and an arrangement for speech synthesis | |
| JPH08254993A (ja) | 音声合成装置 | |
| US20230260493A1 (en) | Sound synthesizing method and program | |
| JPH0421900A (ja) | 音声合成装置 | |
| JP2005539261A (ja) | 音声合成における時間幅を制御する方法 | |
| JP3785892B2 (ja) | 音声合成装置及び記録媒体 | |
| US7130799B1 (en) | Speech synthesis method | |
| JP3727885B2 (ja) | 音声素片生成方法と装置及びプログラム、並びに音声合成方法と装置 | |
| JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
| JP3742206B2 (ja) | 音声合成方法及び装置 | |
| JPS5914752B2 (ja) | 音声合成方式 | |
| JP3130305B2 (ja) | 音声合成装置 | |
| JP3967571B2 (ja) | 音源波形生成装置、音声合成装置、音源波形生成方法およびプログラム | |
| JP2573586B2 (ja) | 規則型音声合成装置 | |
| JP2591289B2 (ja) | 音声合成装置 | |
| JPH0836397A (ja) | 音声合成装置 | |
| JP3284634B2 (ja) | 規則音声合成装置 | |
| JP2614436B2 (ja) | 音声合成装置 | |
| JPH07152396A (ja) | 音声合成装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |