JP3078073B2 - 基本周波数パタン生成方法 - Google Patents
基本周波数パタン生成方法Info
- Publication number
- JP3078073B2 JP3078073B2 JP03344627A JP34462791A JP3078073B2 JP 3078073 B2 JP3078073 B2 JP 3078073B2 JP 03344627 A JP03344627 A JP 03344627A JP 34462791 A JP34462791 A JP 34462791A JP 3078073 B2 JP3078073 B2 JP 3078073B2
- Authority
- JP
- Japan
- Prior art keywords
- accent
- fall
- command
- fundamental frequency
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 14
- 230000004044 response Effects 0.000 claims description 31
- 238000005316 response function Methods 0.000 claims description 19
- 238000013016 damping Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 description 29
- 239000011295 pitch Substances 0.000 description 14
- 235000016496 Panda oleosa Nutrition 0.000 description 6
- 240000000220 Panda oleosa Species 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 210000001260 vocal cord Anatomy 0.000 description 5
- 230000007423 decrease Effects 0.000 description 3
- 241001417093 Moridae Species 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000011306 natural pitch Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Description
本周波数パタン生成方法に関する。
て出力する音声合成装置は、出力語彙の制限がないこと
から録音・再生型の音声合成に取って代る技術として期
待されている。この種の合成装置に於いて、音声のアク
セント、イントネ−ションを表現する声帯振動の基本周
波数(ピッチ)パタンの生成は自然な合成音を得る上で
非常に重要な要素である。
セント型のみならず文章構造、意味等の影響を強く受け
るため、実際の音声から抽出した基本周波数パタンを種
々用意して、此等を組合せて文章全体のパタンとすると
いう方法では実現が困難であり、適切なモデル化が不可
欠となる。
は、幾つかの方法が提案されているが、対数軸上の基本
周波数パタンを文頭から文末に向かう緩やかな下降(イ
ントネ−ション)に対応するフレ−ズ成分と、局所的な
起伏(アクセント)に対応するアクセント成分の和で表
現されるとし、フレ−ズ成分はインパルス状のフレ−ズ
指令に対する臨界制動2次線形系の応答であるとの近似
の基に、また、アクセント成分はステップ状のアクセン
ト指令に対する臨界制動2次線形系の応答であるとの近
似の基に定式化したモデルが一般に広く用いられている
(広瀬啓吉、藤崎博也、河井恒、山口幹雄:“基本周波
数パタン生成過程モデルに基づく文章音声の合成”、電
子情報通信学会論文誌 ’89/01 Vol.J72
−A No.1 参照)。
を示すブロック図である。このモデルでは対数基本周波
数ln F0(t)は時刻tの関数として次式で与えられ
る。
のi番目のフレ−ズ指令の大きさ、Aajは文章中のj番
目のアクセント指令の大きさ、Iは一文章中のフレ−ズ
指令の数、Jは一文章中のアクセント指令の数、T0iは
i番目のフレ−ズ指令の開始時点、T1j,T2jは其々j
番目のアクセント指令の開始時点と終了時点である。
制御機構のインパルス応答関数、アクセント制御機構の
ステップ応答関数であり、t≧0の範囲で次式(2)、
(3)で与えられる(t<0では両者とも0)。
応答の速さ、アクセント制御機構の応答の速さを決める
定数であり、α=3.0、β=20.0程度の値を用い
る。また、θはアクセント成分の上限値で通常θ=0.
9等に選ばれる。
初めはピッチが高く、以後呼気圧の低下などにより自然
にピッチが下がる性質があり、このピッチの自然下降成
分をモデル化したものが前述のフレ−ズ制御機構であ
る。
合、単語のアクセントは第1モ−ラから第2モ−ラにか
けて必ず顕著なピッチの上昇または下降があり、かつ、
単語内でのピッチの顕著な下降は一ヶ所のみに限られ
る。従って、n個のモ−ラから成る単語には(n+1)
種のアクセント型が存在する。各アクセント型はピッチ
の下降する位置に着目して0型、1型、2型、3型(第
iモ−ラと第i+1モ−ラとの間でピッチが顕著に下降
するものがi型であり、0型は平板アクセントとも言
う)と呼ぶ。ピッチの上昇、下降は、前述の基本周波数
生成モデルのアクセント指令の始点、終点に対応する。
ント制御機構によるアクセント成分の形状を示したもの
である。図4は通常用いられる応答速度(β=20)を
用いた例であるが、アクセント指令の開始時点から顕著
な立ち上がりを見せた後、上限値に達し、以後その値を
保持する。そして指令の終了時点から立ち上がりと同一
の応答速度で再び0に下降する。
の観測によると、アクセント成分の上昇と下降の応答速
度は必ずしも同一にはならない。立ち上がりの応答速度
は従来用いられている一定値としても問題となることは
少ないが、下降の速度は単語のアクセント型、モ−ラ
数、アクセント核の次に来るモ−ラの音節の種類などに
よって大きな違いがある。此等の性質を考慮せずピッチ
の下降速度を上昇の速度と同一にしてパタンを生成する
と、アクセントの起伏が激しく、全体的に滑らかさを欠
いた不自然な合成音となる。
成では、これらの性質を明記した例は無く、また、ステ
ップ応答を仮定した従来のアクセント制御機構では下降
の応答速度のみを分離して制御することは困難である。
々の状況に適応して自然なピッチパタンの生成が可能な
基本周波数パタン生成方法提供することを目的とする。
解決するために、入力文章の解析により算出される韻律
を生成する為のアクセント指令とフレーズ指令を入力
し、対数軸上の基本周波数パタンを、イントネーション
に対応するフレーズ成分と、アクセントに対応するアク
セント成分との和で表す基本周波数パタン生成法におい
て、前記アクセント成分を、アクセントの立ち上げ応答
速度を表す定数を用いてアクセントの立ち上がりを記述
する対数周波数軸上の臨界制動2次線形系のインパルス
応答関数と、アクセントの立ち下げ応答速度を表す定数
を用いてアクセントの立ち下がりを記述する対数周波数
軸上の臨界制動2次線形系のインパルス応答関数の和と
して表すと共に、前記インパルス応答関数の立ち上げ応
答速度及び立ち下げ応答速度を各々独立に制御すること
を特徴とする。
立ち下がりを記述する前記インパルス応答関数の立ち下
げ応答速度を、単語のアクセント型、モーラ数、アクセ
ント核のあるモーラの次のモーラの音節の種類に応じて
適応的に制御するのが好適である。
タンにおけるアクセント成分をアクセントの立ち上がり
の成分と立ち下がりの成分とに分離して扱い、其々を臨
界制動2次線形系のインパルス応答関数で近似する。こ
の場合、対数基本周波数の生成式は次式(4)のように
表される。
のi番目のフレ−ズ指令の大きさ、Aajは文章中のj番
目のアクセント指令の大きさ、Iは一文章中のフレ−ズ
指令の数、Jは一文章中のアクセント指令の数、T0iは
i番目のフレ−ズ指令の開始時点、T1j,T2jは其々j
番目のアクセント指令の開始時点と終了時点である。ま
た、Ga1j (t) 、Ga2j (t) は其々j番目のアクセント
指令に対するアクセントの立ち上がりを記述するインパ
ルス応答関数及びアクセントの立ち下がりを記述するイ
ンパルス応答関数であり、t≧0の範囲で次式(5)、
(6)で与える(t<0では両者ともに0となる)。
に対するアクセント立ち上げ応答の速さ、アクセント立
ち下げ応答の速さを決める定数である。
型との関連については、日本語の単語アクセントパタン
にはピッチの下降の動作を単語の終端までの時間範囲で
完了させるという傾向がみられ、ピッチの立ち下がり時
間に余裕がある場合には余裕のない場合に比べピッチの
下降が緩やかになることが多い。つまり、同じモーラ数
の単語ではアクセント核が前方にある(アクセント型が
小さい)ほうが立ち下がりの応答速度(減衰速度)が遅
くなり、また同じアクセント型の単語では単語のモ−ラ
数が大きい程減衰速度が遅くなる。
と音韻の種類との関係では、特に、アクセント核のある
モ−ラの次のモ−ラ、即ちi型(i≠0)アクセントの
単語では語頭から数えてi+1番目のモ−ラの音節の種
類による影響が顕著である。
クセントの立ち下げを記述する前記式(6)で表される
インパルス応答関数の応答速度(即ちζj )を、アクセ
ントの立ち上げを記述する前記式(5)で表されるイン
パルス応答関数の応答速度(即ちεj )と独立に制御
し、且つ、単語のアクセント型とモ−ラ数とアクセント
核のあるモ−ラの次のモ−ラの音節の種類に応じて適応
的に変化させることにより、実際の音声に近い自然な基
本周波数パタンを生成することが出来るのである。図2
は本発明によるアクセント成分のパタンの一例を示した
ものであり、ζjの増大につれてアクセントの立ち下が
りの減衰速度が速くなるように作用する。
ブロック図であり、文字列入力部10、文字列解析部1
1、フレ−ズ制御機構12、アクセント立ち上げ制御機
構13、アクセント立ち下げ制御機構14、定数設定部
15、声帯振動機構16、基本周波数出力端子17から
構成されている。以下、本実施例における基本周波数の
生成方法につき説明する。
されるべき文章の韻律記号付き仮名文字列が入力され
る。韻律記号付き仮名文字列とは、例えば表1に示され
る文字列であり、音声に変換されるべき文章の読みに対
応する仮名文字列とフレ−ズ記号、アクセント記号、休
止記号(区切り記号)等の韻律制御記号から成る。
付き仮名文字列に基づき、フレ−ズ制御機構12の入力
であるフレ−ズ指令を決定すると共にアクセント立ち上
げ制御機構13及びアクセント立ち下げ制御機構14の
入力であるアクセント指令を決定する。また、文字列解
析部11では入力された韻律記号付き仮名文字列から文
章中の各単語におけるモ−ラ数、アクセント型、アクセ
ント核のあるモ−ラの次のモ−ラの音節の種類を判別
し、定数設定部15に出力する。
入されているフレ−ズ記号の種類に応じて表2の如く決
められる。
字列に於いて、仮名文字列中のフレ−ズ記号の挿入位置
に応じて決められる。例えば、表1に示される文字列で
は、第1フレ−ズのフレ−ズ記号P1に対して、当該フ
レ−ズの第1音節「キ」の始端を基準に、通常100〜
200msさかのぼった時点に設定される。
立ち下げ指令の一対のインパルス指令からなるが、立ち
上げ指令と立ち下げ指令の大きさは同じであるので、従
来のステップ状のアクセント指令と何等変るところはな
い。但し、アクセント立ち下げ指令に対しては定数設定
部15において単語のモ−ラ数、アクセント型、アクセ
ント核のあるモ−ラの次のモ−ラの音節の種類を基に設
定された立ち下げの応答速度を決める定数(式(6)の
ζj )が同時に与えられる。
休止記号、アクセント記号の位置、種類に応じて決定さ
れる。アクセント記号はアクセント核のある音節の直後
に挿入されて語のアクセント位置を示すと共にその種類
によってアクセントの強さを表している。アクセント記
号の種類に応じたアクセント指令の大きさを表3に示
す。アクセント記号の無い語については平板型(0型)
アクセントと見做され、同じく表3の指令の大きさが与
えられる。
型によっても異なるが、語の第1モ−ラもしくは第2モ
−ラの母音開始時点を基準に決められる。立ち下げ指令
時点はアクセント記号の位置によりアクセント核の次の
モ−ラの母音開始時点を基準に求められる。平板型の場
合は語の最終モ−ラが基準となる。
令、アクセント立ち上げ指令、アクセント立ち下げ指令
は其々フレ−ズ制御機構12、アクセント立ち上げ制御
機構13、アクセント立ち下げ制御機構14に送られ
る。
−ズ指令に対するインパルス応答関数である式(2)を
計算してフレ−ズ成分を生成する。
セント立ち上げ指令に対して立ち上げの応答関数である
式(5)を計算し、アクセント立ち下げ制御機構14は
アクセント立ち下げ指令に対して、定数設定部15から
与えられる時定数ζj をもとに立ち下げの応答関数であ
る式(6)を計算し、両者の応答の和としてアクセント
成分を生成する。
−ズ成分、アクセント成分は加算されて声帯振動機構1
6に出力され、声帯振動機構16では前記フレ−ズ成
分、アクセント成分に対数基本周波数の下限値ln F
min を加算して対数基本周波数とし、更に指数変換を行
って基本周波数F0(t)を得て基本周波数出力端子17
から出力する。
基本周波数パタン生成方法によれば、音声の対数基本周
波数パタン中のアクセント成分を、アクセントの立ち上
がりを記述する臨界制動2次線形系のインパルス応答関
数とアクセントの立ち下がりを記述する臨界制動2次線
形系のインパルス応答関数の応答の和で表し、前記アク
セントの立ち下がりを記述する関数の応答速度を単語の
アクセント型、モ−ラ数、アクセント核のあるモ−ラの
次のモ−ラの音節の種類に応じて適応的に設定するた
め、種々の状況の単語もしくは文節に対して自然音声に
近いアクセント成分が生成できる。従って、本発明によ
る基本周波数パタン生成方法を用いて音声合成を行うこ
とにより、より自然な抑揚をもった合成音が生成でき
る。
である。
示す図である。
ック図である。
分の形状を示す図である。
Claims (2)
- 【請求項1】 入力文章の解析により算出される韻律を
生成する為のアクセント指令とフレーズ指令を入力し、
対数軸上の基本周波数パタンを、イントネーションに対
応するフレーズ成分と、アクセントに対応するアクセン
ト成分との和で表す基本周波数パタン生成法において、 前記アクセント成分を、アクセントの立ち上げ応答速度
を表す定数を用いてアクセントの立ち上がりを記述する
対数周波数軸上の臨界制動2次線形系のインパルス応答
関数と、アクセントの立ち下げ応答速度を表す定数を用
いてアクセントの立ち下がりを記述する対数周波数軸上
の臨界制動2次線形系のインパルス応答関数の和として
表すと共に、前記インパルス応答関数の立ち上げ応答速
度及び立ち下げ応答速度を各々独立に制御することを特
徴とする基本周波数パタン生成方法。 - 【請求項2】 請求項1記載の基本周波数パタン生成方
法において、アクセントの立ち下がりを記述する前記イ
ンパルス応答関数の立ち下げ応答速度を、単語のアクセ
ント型、モーラ数、アクセント核のあるモーラの次のモ
ーラの音節の種類に応じて適応的に制御することを特徴
とする基本周波数パタン生成方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP03344627A JP3078073B2 (ja) | 1991-12-26 | 1991-12-26 | 基本周波数パタン生成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP03344627A JP3078073B2 (ja) | 1991-12-26 | 1991-12-26 | 基本周波数パタン生成方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH05173590A JPH05173590A (ja) | 1993-07-13 |
| JP3078073B2 true JP3078073B2 (ja) | 2000-08-21 |
Family
ID=18370727
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP03344627A Expired - Fee Related JP3078073B2 (ja) | 1991-12-26 | 1991-12-26 | 基本周波数パタン生成方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3078073B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3576840B2 (ja) | 1997-11-28 | 2004-10-13 | 松下電器産業株式会社 | 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 |
| JP4787769B2 (ja) * | 2007-02-07 | 2011-10-05 | 日本電信電話株式会社 | F0値時系列生成装置、その方法、そのプログラム、及びその記録媒体 |
-
1991
- 1991-12-26 JP JP03344627A patent/JP3078073B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
| Title |
|---|
| 藤崎、須藤「日本語単語アクセントの基本周波数パタンとその生成機構のモデル」音響学会誌27巻9号、pp.445−453(1971) |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH05173590A (ja) | 1993-07-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6625575B2 (en) | Intonation control method for text-to-speech conversion | |
| US6499014B1 (en) | Speech synthesis apparatus | |
| US6470316B1 (en) | Speech synthesis apparatus having prosody generator with user-set speech-rate- or adjusted phoneme-duration-dependent selective vowel devoicing | |
| US6751592B1 (en) | Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically | |
| US20040030555A1 (en) | System and method for concatenating acoustic contours for speech synthesis | |
| JPH08512150A (ja) | ニューラル・ネットワークを利用してテキストを可聴信号に変換する方法および装置 | |
| US20130262120A1 (en) | Speech synthesis device and speech synthesis method | |
| Bellegarda et al. | Statistical prosodic modeling: from corpus design to parameter estimation | |
| JPH0632020B2 (ja) | 音声合成方法および装置 | |
| JP3078073B2 (ja) | 基本周波数パタン生成方法 | |
| JPH0580791A (ja) | 音声規則合成装置および方法 | |
| JP3078074B2 (ja) | 基本周波数パタン生成方法 | |
| JP3314116B2 (ja) | 音声規則合成装置 | |
| JP3397406B2 (ja) | 音声合成装置及び音声合成方法 | |
| JP2848604B2 (ja) | 音声合成装置 | |
| JP2001100777A (ja) | 音声合成方法及び装置 | |
| JPH06214585A (ja) | 音声合成装置 | |
| JP2977236B2 (ja) | 音声合成装置 | |
| JP3368948B2 (ja) | 音声規則合成装置 | |
| JPH09292897A (ja) | 音声合成装置 | |
| JP3186263B2 (ja) | 音声合成装置のアクセント処理方式 | |
| JPH04130400A (ja) | 音声規則合成装置 | |
| Chowdhury | Concatenative text-to-speech synthesis: A study on standard colloquial Bengali | |
| JPH0968993A (ja) | 音声合成における韻律制御方法 | |
| JPH0519780A (ja) | 音声規則合成装置および方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000530 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080616 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090616 Year of fee payment: 9 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090616 Year of fee payment: 9 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |