JP3078205B2

JP3078205B2 - 波形の連結及び部分的重複化による音声合成方法

Info

Publication number: JP3078205B2
Application number: JP07175553A
Authority: JP
Inventors: エンツオ・フオテイ; ルチアノ・ネツビア; ステフアノ・サンドリ
Original assignee: Telecom Italia Lab SpA
Current assignee: TIM SpA
Priority date: 1994-09-29
Filing date: 1995-06-20
Publication date: 2000-08-21
Anticipated expiration: 2015-08-21
Also published as: EP0706170A2; DE69521955T2; EP0706170B1; DE69521955D1; EP0706170A3; DK0706170T3; CA2150614A1; ES2113329T1; US5774855A; DE706170T1; IT1266943B1; CA2150614C; JPH08110789A; ITTO940756A1; ITTO940756A0; ES2113329T3

Description

【発明の詳細な説明】

【０００１】本明細書中で述べられる発明は、音声合成
に関し、そして更に特別には要素の音声単位に関連した
波形の連結を基にした合成方法に関する。好ましくは、
本発明の方法はテキストから音声への合成に適用される
が、必ずしもそうでなくても良い。これらの適用におい
ては、音声信号に変換されるべきテキストをまず、一列
の対応する音素及びそれらに関係した韻律素の特性（継
続時間、強度、及び基本期間）を示す音声の−韻律素の
表現に転換する。次にこの表現を、最も一般的なケース
においては二重音（一つの音素の静止部分から引き続く
音素の静止部分まで広がる声の要素で、音素の間の遷移
部分も含む）から成る、前記要素の単位の語彙から出発
するデジタルの合成音声信号に転換する。イタリア語に
関しては、約千の二重音の語彙が音声の適用範囲を保証
し、イタリア語のためのすべての認められる音を合成す
ることを可能にする。テキストから音声への合成のため
のシステムにおいては、種々の要素の単位を表す波形
の、時間領域における、連結を基にした方法を、音声信
号の生成のために使用することができる。これらの方法
は、非常に柔軟でありそして良好な合成音声品質を保証
する。

【０００２】一つの例が、Ｅ．Ｍｏｕｌｉｎｅｓ及び
Ｆ．Ｃｈａｒｐｅｎｔｉｅｒによって論文“二重音を使
用するテキストから音声への合成のためのピッチ同期波
形処理技術”、ＳｐｅｅｃｈＣｏｍｍｕｎｉｃａｔｉ
ｏｎ、９巻、Ｎｏ．５／６、１９９０年１２月、４５３
〜４６７頁中で述べられている。この方法は、合成規則
によって課された韻律素を適用しそして要素の単位の波
形を連結する、ＰＳＯＬＡ（ピッチ同期重複及び加算）
として知られている技術を基にしている。元の信号の少
なくとも声に出される分節音に関しては、ＰＳＯＬＡ技
術は、ピッチ同期ウインドウイング（ｗｉｎｄｏｗｉｎ
ｇ）を適用して、特にその継続時間が基本期間（ピッチ
期間）のほぼ２倍であるＨａｎｎｉｎｇウインドウを使
用して、それによって一列の部分的に重複する短期信号
を発生させることによって分解を実施する。合成相にお
いては、ウインドウイングから生じる信号を、合成のた
めの韻律素の規則によって課された基本期間と時間同期
してシフトさせる。最後に、シフトされた信号を重複さ
せそして加算することによって、合成信号を発生させ
る。コンピュータにまつわる複雑さを減らすために、第
二のステップは、時間領域において直接に実施すること
ができる。元の信号の個々の区間の完全なウインドウイ
ングは、比較的重いコンピュータへの負荷を要求し、そ
して更にまたそれは区間全体にわたって広がる元の信号
の変更を設定し、その結果合成信号はそれだけ自然では
ない音がする。

【０００３】本発明によれば、元の信号の各々の区間の
基本情報を含む部分を変えずに残し、そして区間の残り
の部分だけを変える合成方法が提供される。このように
して、区間の主な部分は元の信号の正確な再生であるの
で、処理時間が減らされるばかりでなく、また合成信号
の自然な音出しも改善される。

【０００４】それ故、本発明は、声に出される音に関係
する少なくとも波形を、信号の基本振動数と同期して声
帯を刺激する一連の衝撃に対する声管の応答に対応する
複数の区間に分割し；各々の区間中の波形に重みを付
け；重み付けから生じる信号を、韻律素の情報に依存す
る量だけ時間がシフトされた、それらの複製によって置
き換え；そしてシフトされた信号を重複させそして加算
することによって合成を実施する、要素の音声信号単位
を代表する波形の時間連結による音声信号合成方法であ
って、 − 合成において再生されるべき元の信号の現在の区間
を、開始区間と、所定の条件を満たす元の音声信号のゼ
ロ交点によって表される左の分解端との間に横たわる不
変部分、及び左の分解端と、現在の区間の端と本質的に
一致する右の分解端との間に横たわる可変部分に細分し
［ここで、左及び右の分解端は、合成された信号中で、
それぞれ左の及び右の合成端と関連し、左の合成端は、
区間開始マーカに関して、左の分解端と一致し、そして
右の合成端は合成された信号中の区間の終わりと本質的
に一致する］、 − 左と右の合成端の間に横たわる合成された波形の分
節音の継続時間に等しい継続時間並びに次第に減少しそ
して左の分解端と対応して最大である振幅を有する第一
接続関数を、元の信号の現在の区間の左の分解端の右の
波形の部分に適用し、 − 左と右の合成端の間に横たわる合成された波形の分
節音の継続時間と等しい継続時間並びに次第に増加しそ
して前記の引き続く区間の始めと対応して最大である振
幅を有する第二接続関数を、合成的に再生されるべき元
の信号の引き続く区間の左の波形の部分に適用し、そし
て − 各々の区間の合成された信号を、元の区間の不変部
分中の波形を変えずに再生することによって、そして第
一及び第二接続関数の適用から生じる２つの波形を時間
において整列させそして加算することによって得られる
波形をそれに合わせることによって作る方法を提供す
る。

【０００５】一層の明確化のために、非限定的な例とし
て与えられる本発明の実施態様を図示する同封の図面を
参照して説明する。本発明を詳細に説明する前に、テキ
ストから音声への合成システムの構成を手短に説明す
る。

【０００６】図１中に見ることができるように、第一相
として、書かれたテキストを言語学的処理段階ＴＬに供
給するが、この段階は書かれたテキストを発音可能な形
に変換しそして言語学的な印し、例えば略語、数などの
書き換え、強勢及び文法上の分類規則の適用、特別な語
彙中に含まれる辞書情報ＶＬへのアクセスを加える。引
き続く段階、ＴＦは、綴字法の順序から対応する列の音
声のシンボルへの転写を実施する。一組の韻律素の規則
ＲＰを基にして、韻律素の処理段階ＴＰは、ＴＦを去る
各々の音素のために継続時間及び基本期間（そしてかく
してまた基本振動数）を与える。次に、この情報を予備
合成段階ＰＳに与えるが、この段階は、各々の音素に関
して、音素を形成する音響信号の順序（二重音（ｄｉｐ
ｈｏｎｅ）データベースＶＤへのアクセス）並びに、各
々の分節音に関して、基本期間と等しい継続時間を有す
る、幾つのそしてどの区間を使用すべきか（声に出され
る音の場合に）及び合成において帰属されるべき基本期
間の対応する値を決定する。これらの値は、音素の境界
と相応して割り当てられた値を内挿することによって得
られる。それらの中に周期性特性が存在しない声に出さ
れない又は“無音声の”音の場合には、区間は固定され
た継続時間を有する。この情報は、合成信号を発生させ
るために必要とされる変換を実施する真の合成装置ＳＩ
ＮＴによって最後に使用される。

【０００７】図２は、モジュールＰＳ及びＳＩＮＴの操
作をより詳細に説明する。入力は、現在の音素識別子Ｆ
_iによって、音素継続時間Ｄ_iによって、そして音素の
開始時の基本期間Ｐ_i-1及び音素の終了時のＰ_iの値に
よって、そして前の音素Ｆ_i-1の及び引き続く音素Ｆ
_i+1の識別子によって構成される。実施されるべき第一
の操作は、二重音ＤＦ_i-1及びＤＦ_iを復号すること、
並びに二重音開始及び終了の並びに音素境界のマーカを
検出することである。この情報は、二重音を記憶するデ
ータベース又は語彙から波形及び関連する境界、声に出
される／声に出されないの決定及びピッチのマークを付
ける記述語として直接引き出される。引き続くモジュー
ルは、音素を参照しながら上で述べた記述語を変換す
る。この情報を基にして、リズムのモジュールは、規則
によって課された継続時間Ｄ_iと音素の本来の継続時間
（語彙中に記憶されそして２つの二重音ＤＦ_i-1及びＤ
Ｆ_iに属する音素の２つの部分の和によって与えられ
る）との間の比を計算する。次に、継続時間の変更を考
慮に入れながら、それは、合成において使用されるべき
区間の数を計算し、そして値Ｐ_i-1とＰ_iとの間の内挿
の法則によって、それらの各々に関する基本期間の値を
決定する。次に、基本期間の値は声に出される音のため
にだけ実際には使用され、一方声に出されない音のため
には、上で述べたように、区間は固定された継続時間の
ものであると考えられる。

【０００８】実際の合成のためには、操作は、音が声に
出されるか又は声に出されないかに依存して異なる。声
に出されない音の場合には、合成は、韻律素の規則によ
って課された継続時間と本来の継続時間との間の比を基
にした上で述べた区間の単純な時間シフト（長期化又は
短期化）を要求する。声に出される音の場合には、その
代わりに、本発明の方法を適用する。本発明による合成
方法は、声に出される音は、各々が基本期間の値ｐ_aに
よって規定される一列の疑似期間の区間として考えるこ
とができるという考慮から出発する。これは、二重音
“外１”の波形、個々の区間を分離する関連したマーカ
及び、各々の区間に関して、Ｈｚで表される対応する期
間の値ｐ_aを示す図３中に明らかに見られる。図３の２
つのマーカ“ｖ”の間の部分は、音素の右の部分“外
２”に対応し、そして２番目のマーカ“ｖ”と二重音の
終了マーカ“ｆ”との間の部分は、音素の左の部分
“ｍ”に対応する。上で述べた区間は、何ミリセカンド
の間は不動でそして声管に対応する濾波器の衝撃応答と
して考えることができ、そしてこの声管は、ソースの基
本振動数（声帯の振動する振動数）と同期した一列の衝
撃によって刺激される。各々の区間に関して、合成モジ
ュールは、基本期間ｐ_a（分解期間）を有する元の信号
を受け取りそして韻律素の規則によって必要とされる期
間ｐ_s（合成期間）によって変更された信号を供給する
とされる。

【０００９】

【外１】

【外２】

【００１０】各々の音声区間を特性決定する必須の情報
は刺激衝撃のすぐ後に続く信号部分（応答の主な部分）
中に含まれていて、一方応答それ自体は、衝撃位置から
の距離が増加するにつれてそれだけ小さくなりそしてそ
れだけ重要でなくなる。これを考慮に入れると、本発明
による合成方法においては、この主な部分をできる限り
変えずに維持し、そして韻律素の規則によって必要とさ
れる期間の長期化又は短期化は、残りの部分に作用する
ことによって得る。この目的のために、不変及び可変部
分を次に各々の区間において識別し、そして後者だけを
接続、重複及び加算操作中に含める。元の信号の不変部
分は一定ではなく、むしろそれは、各々の区間に関し
て、ｐ_sとｐ_aの間の比に依存する。この不変部分は、
区間開始マーカと所謂左の分解端ｂ_saとの間に横たわ
る。端ｂ_saは、元の音声信号のゼロ交点の一つであり、
後で更に説明するそして合成期間が分解期間よりも長い
か、短いか又は等しいかに依存して異なり得る基準によ
って識別される。可変部分は、左の分解端ｂ_saによっ
て、そして区間の終了と、特に引き続く区間の区間開始
マーカに先行するサンプルと本質的に一致する所謂右の
分解端ｂ_daによって限界を定められる。

【００１１】合成された信号においては、左の及び右の
合成端ｂ_ss、ｂ_dsは、左の及び右の分解端ｂ_sa、ｂ_daに
対応するであろう。与えられた区間に関しては、信号の
先行する部分が合成において変えられずに再生されるの
で、左の合成端は、区間開始マーカに関して、左の分解
端と明らかに一致する。右の合成端は、以下の関係ｂ_ds＝ｂ_ss＋Δｐ（１）［式中、Δｐ＝ｐ_s−ｐ_aは、合成において、基本期間
の長期化又は短期化が存在するか否かに依存して正又は
負の値を有するであろう］によって規定される。区間の
可変部分は、その継続時間がΔｓ＝ｂ_ds−ｂ_ssである一
対の接続（ｃｏｎｎｅｃｔｉｎｇ）関数を適用すること
によって変えられる。第一の関数は、左の分解端に対応
する最大値（殊に１）及び点ｂ_sa＋Δｓに対応する最小
値（殊に０）を有する。第二の関数は、右の分解端ｂ_da
に対応する最大値（殊に１）及び点ｂ_da−Δｓに対応す
る最小値（殊に０）を有する。これらの接続関数は、こ
れらの目的のために一般に使用される種類のもので良い
（例えばＨａｎｎｉｎｇウインドウズ又は類似の関
数）。

【００１２】本発明を更に明確にするために、図４〜６
は、架空の信号への本発明の方法の適用を図示する幾つ
かのグラフを示す。これらの図においては、部分Ａは、
指数ｉ−１、ｉ、ｉ＋１を有する、元の信号の３つの連
続的な区間を示し、そしてまたそれらの基本期間ｐ
_ah（ｈ＝ｉ−１、ｉ、ｉ＋１）並びにピッチ（又は区間
の開始）マーカＭ_a並びに左の及び右の分解端ｂ_sa、ｂ
_daを指示する。部分Ｂ及びＣは、各々の区間に関して、
それぞれ第一及び第二接続関数（簡単のために本明細書
中では以後“関数Ｂ”及び“関数Ｃ”と呼ぶものとす
る）並びに元の信号との時間関係を示す。部分Ｄは、本
発明による方法から生じる合成された信号波形を、それ
ぞれの基本期間ｐ_sk（ｋ＝ｊ−１、ｊ、ｊ＋１）の、ピ
ッチマーカＭ_sの、そして左の及び右の合成端ｂ_ss、ｂ
_dsの表示と共に示す。部分Ｅは、時間シフトの後で、元
の信号の可変部分への２つの接続関数の適用によって得
られる波形を重複及び加算プロセスにかける場合の波形
部分の表現である。分解及び合成における区間の通し番
号は、区間の抑制又は重複が前に起きた可能性があるの
で、異なる可能性があることに注意せよ。

【００１３】特に、図４は、区間抑制又は重複が起きな
かった信号部分における、元の信号に関する合成におけ
る基本期間の増加（そしてそれ故振動数の減少）のケー
スを図示する。それぞれの対の接続関数によって各々の
区間において重み付けを実施する。期間増加の結果とし
て、関数の継続時間Δｓは元の信号の可変部分の長さよ
りも長く、その結果関数Ｂもまた引き続く区間に関する
波形の始めに関係し、一方関数Ｃは左の分解端の左の波
形の部分に関係する。図５は、元の信号に関する合成に
おける基本期間の減少（そしてそれ故振動数の増加）の
ケースにおける類似の表現を示す。この例においてもま
た、区間抑制又は重複は起きなかった。このケースにお
いては、関数Ｂ、Ｃは、ｂ_saとｂ_daの間に横たわる部分
よりも短い継続時間を有する波形部分に関係する。

【００１４】最後に、図６は、元の信号（例においては
指数ｉを有するもの）の区間の抑制のケースにおける合
成における基本期間の増加の例を示す。指数ｊ−１及び
ｊによって指示した２つの区間が合成において得られる
が、これらの区間は、それぞれ元の信号中の指数ｉ−１
及びｉ＋１を有する区間の一つを不変部分として維持す
る。元の信号中の指数ｉ＋１を有する区間は、図４中の
元の信号の各々の区間と同じやり方で処理する。その代
わりに、合成された信号中の指数ｊ−１を有する区間の
変更された部分は、元の信号中の指数ｉ−１を有する区
間の可変部分を関数Ｂによってだけ重み付けすることに
よって、そして元の信号中の指数ｉを有する区間の最後
の部分を関数Ｃによってだけ重み付けすることによって
得られる２つの波形を重複させそして加算することによ
って得られる。言い換えると、関数Ｂは、合成において
再生されるべき現在の区間中のｂ_saの右に適用され、そ
して関数Ｃは、再生されるべき引き続く区間の左に適用
される。接続関数の適用のこれらの手順は、極めて一般
的であり、そしてまた区間重複及び二重音変化のケース
においても適用される。

【００１５】純粋に例として、図４〜６中の図表のため
には、以下の関数を利用した： 0.5 − 0.5・cos｛π[(Δｓ−１＋ｂ_ss−ｘ_i)／(Δｓ−１)]ⁿ｝（関数Ｂ） 0.5 − 0.5・cos｛π[(ｘ_i−ｂ_ss)／(Δｓ−１)]ⁿ｝（関数Ｃ）これらの関数においては、ｂ_ss、Δｓは、前に見られた
意味を有し、そして多数のサンプルとして表される。ｘ
_iは、元の波形の可変部分の一般的サンプルである（関
数Ｂに関してはｂ_sa≦ｘ_i＜ｂ_sa＋Δｓそして関数Ｃに
関してはｂ_da−Δｓ≦ｘ_i＜ｂ_daでもって）。ｎは、比
Δｓ／ｐ_aに依存して変わる（例えば１〜３）ことがで
きる数であり、特に、図表においては、ｎは１であると
考えられた。明らかに、これらの式においては、その最
大値が１の代わりにＡである関数が使用される場合に
は、値０．５は、一般的値Ａ／２によって、又はそれら
の和が１（又はＡ）である一対の値によって置き換える
ことができる。

【００１６】図７Ａ、７Ｂ〜１０Ａ、１０Ｂは、合成規
則が基本期間のそれぞれ減少及び増加（そしてそれ故基
本振動数の増加及びそれぞれ減少）を要求する文章中の
２つの異なる位置で利用される、図３の二重音“外３”
の２つの部分のための、本発明の方法の適用の幾つかの
実際の例を表す。すべての区間に関して、ピッチマー
カ、左の分解及び合成端、並びに分解及び合成の両方に
おける基本振動数を示す。文字Ａを有する図は元の波形
を示し、そして文字Ｂを有する図は合成された信号を示
す。図７Ａ、７Ｂ、８Ａ、８Ｂは、基本振動数の増加
（図７Ａ、７Ｂ）のそしてそれぞれ減少（図８Ａ、８
Ｂ）のケースにおける検査されている二重音の最初の２
つの区間（音素“外４”）を示す。図９Ａ、９Ｂ、１０
Ａ、１０Ｂは、代わりに、図７、８中で示されたのと同
じ条件で音素“ｍ”の最初の２つの区間を示す。振動数
減少の結果として、図８Ｂ及び１０Ｂにおいては最初の
区間だけを完全に見ることができる。

【００１７】

【外３】

【外４】

【００１８】合成において再生されるべき各々の区間の
ための左の分解及び合成端を識別するために採用される
本発明の方法の好ましい実施態様をここで説明する。述
べる例においては、合成における基本期間が分解におけ
る期間よりも短いか若しくは等しいか、又はそれがより
長いかに依存して、異なる方法を使用する。

【００１９】図１１は、ｐ_s≦ｐ_aである場合に実施さ
れる操作の総括的なフローチャートである。第一の操作
は、ゼロ交点の数を示す関数ＺＣＲ（ゼロ交点率）の計
算である（ステップ１１）。この計算においては、限ら
れた数よりも少ない信号サンプル（例えば１０）によっ
て前のものから隔てられているゼロ交点は、信号の有意
ではない振動を排除するために無視する。図１３中に見
ることができるように、考慮されているゼロ交点を、１
から全ゼロ交点数ＬＺＶの記述子まで変わる指数に割り
当てる（ステップ１１０）。更にまた、以下の変数を割
り当てる（ステップ１１１）： − ｂ_da（右の分解端）を分解期間の値ｐ_aに、 − ｂ_ds（右の合成端）を合成期間の値ｂ_da＋Δｐに、 − Ｄｉｆｆａｓを分解と合成の期間の間の差の絶
対値｜Δｐ｜に。これらの関係においては、後で検査される関係における
ように、期間の値及びある区間の長さは、サンプルの数
の項で表される。

【００２０】図１１に戻ると、関数ＺＣＲを計算した後
で、ステップ１１中で見い出されたゼロ交点の数がゼロ
交点の最小しきい値ＩｎｄＺＭｉｎ（例えば５つの交
点）よりも小さくないというチェックを行う（ステップ
１２）。実際に、本発明によれば、合成された信号にお
いて、刺激衝撃にすぐ続く振動［これらの振動は、上で
述べたように、最も重要な振動である］を変えずに再生
することが望ましい。チェックが正の結果をもたらす場
合には、見い出されたゼロ交点の中から可能な候補を探
索し（ステップ１３）、そして引き続いて左の合成及び
分解端ｂ_ss、ｂ_saを求める探索の第一相を実施する（ス
テップ１４）。ステップ１４の終了時に適切なゼロ交点
が見い出されなかった場合には、探索継続相を開始し
（ステップ１５）そして、この相の後で左の合成及び分
解端がなお識別されなかった場合には、探索の継続及び
終結（ｃｏｎｃｌｕｓｉｏｎ）の相を開始する（ステッ
プ１７）。ステップ１２における比較がゼロ交点の数が
しきい値よりも小さいことを示す場合には、指数Ｊ＝Ｉ
ｎｄＺＭｉｎを有するゼロ交点を勝手に候補として考
え（ステップ１８）そしてステップ１４において実施さ
れたものと同一の、ｂ_sa及びｂ_ssを求める探索（ステッ
プ１９）を実施する。この探索が不成功である場合に
は、ステップ１５を説明した後では明らかになるであろ
う理由のために、ステップ１５を通って行くことなく、
ステップ１７、即ち探索継続及び終結を直接開始する。

【００２１】ステップ１７と類似のステップがまた、後
で見られるように、合成における基本期間の長期化のケ
ースにおいてもくろまれる。簡単のために、両方のケー
スのために同じフローチャートを使用したが、これらの
ケースはステップそれ自体中への入力の幾つかの条件に
よって区別される。特に、ｐ_s≦ｐ_aのケースのために
は、条件ｒＰ≦１（ここでｒＰは比ｐ_s／ｐ_aであ
る）、開始＝０、終了＝ＬＺＶ、ステップ＝＋１（図１
１中のステップ１６）をセットする。第一の条件は明ら
かである。他の３つは、相１７中でもくろまれるゼロ交
点の検査のサイクルは、増加する指数の順序で実施され
るであろうことを示す。ステップ１３〜１５及び１７中
で実施される操作を、図１４〜１７を参照して以下に詳
細に説明する。

【００２２】図１２は、合成期間ｐ_sが分解期間ｐ_aよ
りも長い場合に実施される操作の一般的フローチャート
である。第一の操作（ステップ２１）は、再び、関数Ｚ
ＣＲを計算することにありそして図１１中のステップ１
１と同一である。引き続いて（ステップ２２）、図１８
を参照して説明されるであろう手順によって左の合成及
び分解端を求める探索を実施し、そして、この相が正の
結果を持たない場合には、図１１中のステップ１７に対
応する探索継続及び終結相を開始する（ステップ２
４）。条件ｒＰ＞ｌ、開始＝ＬＺＶ−１、終了＝−
１、ステップ＝−１を、ステップ２４においてもくろま
れる操作のためにセットする。第一の条件は明らかであ
る。他の３つは、ステップ２４中でもくろまれるゼロ交
点の検査のサイクルは、このケースにおいては、減少す
る指数の順序で実施されるであろうことを示す。

【００２３】図１４は、左の分解及び合成端として作用
する候補であるゼロ交点を求める探索（図１１中のステ
ップ１３）のフローチャートを示す。Ｊは候補の指数を
表す。特に、その指数がＪ＝（ＬＺＶ＋１）／２である
中央のゼロ交点（ステップ１３０）を、最初に候補とし
て調べ、そしてその横座標ＺＣＲ（Ｊ）を右の合成端ｂ
_dsと比較する（ステップ１３１）。この最初の候補が既
に右の合成端の左にある場合には、左の分解及び合成端
を求める探索の相（ステップ１４、図１１）を直接開始
する。反対のケースにおいては、中央のものの左のゼロ
交点を後ろ向きサイクルで検査し、その横座標がｂ_dsの
左にある候補を求めて探索する（ステップ１３２〜１３
４）。この条件を満たすゼロ交点が見い出される時に
は、それを候補として考え（ステップ１３５）、そして
候補の指数が（ＬＺＶ＋１）／２ではないことを立証し
た（ステップ１３６）後で探索相（図１中のステップ１
４）を開始する。実際に、後ろ向き探索サイクルは、指
数（ＬＺＶ＋１）／２を有する最初の候補がｂ_dsの右に
あり、そしてそれ故その指数を有する候補を得ることが
例外的な条件を意味するので実施された。これが起きる
場合には、Ｊ＝０をセットした後で探索相を開始する。
候補が見い出される前にサイクルが終了する場合には、
同じ操作を実施する。

【００２４】図１５は、ｂ_ss、ｂ_saを求める探索の第一
相（図１１中のステップ１４）のために実施される操作
を示す。この探索のためには、後ろ向きの検査を、ＬＺ
Ｖに先行するゼロ交点から出発してゼロ交点に関して行
い、そして右の分解端ｂ_daと現在のゼロ交点ＺＣＲ
（ｉ）との間の距離Ｄｉｆｆｚａを計算する（ステ
ップ１４０、１４１）。この距離にｒＰ（合成期間ｐ
_sと分解期間ｐ_aの間の比）を掛けてＤｉｆｆａｓ
と比較して（ステップ１４２）、接続関数を適用するの
に十分な時間区間が存在することをチェックする。ｒ
Ｐによる重み付けは、その関数の継続時間を期間の短期
化パーセントに結び付け、そしてそれは引き続く区間の
間の良好な接続を保証することを目的とする。Ｄｉｆｆ
ａｓ＞Ｄｉｆｆｚａ＊ｒＰである場合には、
Ｄｉｆｆａｓ≦（Ｄｉｆｆｚａ＊ｒＰ）である
ようなゼロ交点が見い出されるまで、又はすべてのゼロ
交点が考慮されてしまうまで、探索サイクルが続く（ス
テップ１４３）。後者のケースにおいては、ステップ１
４を残し、そして探索継続のステップ１５（図１１）を
開始する。条件Ｄｉｆｆａｓ≦Ｄｉｆｆｚａ＊
ｒＰが満たされる時には、現在の指数ｉを候補の指数
Ｊと比較する（ステップ１４４）。ｉ＜Ｊである場合に
は、サイクルを継続する。これらの２つの指数が等しい
場合には、現在のゼロ交点を左の分解端ｂ_saとしてそし
て左の合成端ｂ_ssとして考える（ステップ１４７）。そ
の代わりにｉ＞Ｊである場合には、右の分解端ｂ_daと現
在のゼロ交点ＺＣＲ（ｉ）との間の距離Δ ａ、右の合
成端ｂ_dsと現在のゼロ交点ＺＣＲ（ｉ）との間の距離Δ
ｓ、及びΔ ｓとΔ ａとの間の比Δを計算し（ステ
ップ１４５）、そして比Δを値（ｒＰ）／２と比較す
る（ステップ１４６）。Δ≦（ｒＰ）／２である場合
には、左の分解端ｂ_saと左の合成端ｂ_ssの仕事を現在の
ゼロ交点に割り当て（ステップ１４７）、そうでなけれ
ば、探索継続の相１５（図１１）を開始する。最後の比
較は、左と右の合成端の間の十分な距離が必要とされる
ことばかりでなく、また接続関数は合成における短期化
を考慮することも示す。これはまた、隣り合う区間の間
の良好な接続を得るのを助ける。

【００２５】図１５中の最後のステップ１４７における
変数“ＴＲＵＥ”は、ｂ_sa及びｂ_ssが既に見い出されそ
して引き続く探索相を無力にすることを示す。同じ変数
がまた、左の分解及び合成端を求める探索に関する他の
フローチャートにおいて同じ意味で利用されるであろ
う。ステップ１４は、右の合成端の左に横たわりそして
それにできる限り近い候補を、もしあれば、見い出し、
一方接続関数を適用するのに十分な時間区間を保証する
ことを可能にする。このステップは、ｂ_sa及びｂ_ssを求
める探索の基準の核である。探索継続ステップ１５を図
１６中で詳細に説明する。このステップは、それが実施
される場合には（相１４のそしてそれ故ステップ１５０
中のＴＲＵＥ条件に関するチェックの負の結果）、今や
ＬＺＶ＞ＩｎｄＺｍｉｎであるかどうかを証明するこ
とだけを目的にした、ＬＺＶとＩｎｄＺｍｉｎとの間
の新しい比較（ステップ１５１）から出発する。条件が
満たされなければ、探索継続及び終結のステップ１７を
開始する。ＬＺＶ＞ＩｎｄＺｍｉｎである場合には、
指数ＩｎｄＺＭｉｎを有するゼロ交点が右の合成端ｂ
_dsの左に位置付けられているかどうかに関するチェック
を行う（ステップ１５２）。肯定的である場合には、こ
の交点を左の分解端ｂ_sa及び左の合成端ｂ_ssであると考
える（ステップ１５３）。その代わりに指数ＩｎｄＺ
Ｍｉｎを有するゼロ交点がまだ右の合成端の右にある場
合には、探索継続及び終結のステップ１７（図１１）を
開始する。

【００２６】探索継続及び終結ステップ１７を図１７中
に詳細に表す。それを実施する必要性をチェックした後
で（ステップ１７０）、増加する指数順序でゼロ交点を
再び概観する。検査サイクル（図１７中のステップ１７
１〜１７４）においては、現在のゼロ交点（ＺＴｅｍ
によって示される）が右の合成端ｂ_dsの左にあるかそし
てこのような端からのその距離が所定の最小値δ、例え
ば１０個の信号サンプルよりも小さくないかどうかを各
々のステップにおいてチェックする（ステップ１７
３）。これらの２つの条件が満たされない場合には、引
き続くゼロ交点を検査し（ステップ１７４）、さもなけ
ればこのゼロ交点を仮に左の合成及び分解端として考え
（ステップ１７５）、そしてサイクルを継続する。条件
１７３を満たす最後のゼロ交点は、左の合成及び分解端
として考えられるであろう（ステップ１７９）。ステッ
プ１７６におけるｒＰに関するチェックは、ケースｐ
_s≦ｐ_aとケースｐ_s＞ｐ_aを区別する付加的な手段で
あり、そしてそれは、検査されているケースにおいてフ
ローチャートのステップ１７７及び１７８を省略せしめ
る。

【００２７】図１８は、合成期間が分解期間に関して長
期化される時のｂ_sa及びｂ_ssを求める探索を図示する。
この探索は、合成の長期化Ｄｉｆｆａｓと分解期間
ｐ_aの継続時間の半分との間の比較で始まる（ステップ
２２０）。Ｄｉｆｆａｓ＞ｐ_a／２である場合に
は、ステップ２４（図１７中に詳細に図示した）を直接
に開始する。Ｄｉｆｆａｓ≦ｐ_a／２である場合に
は、ＬＺＶより先行するゼロ交点から出発して後ろ向き
探索サイクルを実施する。右の分解端ｂ_daと現在のゼロ
交点ＺＣＲ（ｉ）との間の距離Ｄｉｆｆｚａを計算
し（ステップ２２１、２２２）、そしてＤｉｆｆａ
ｓと比較する（ステップ２２３）。それがより小さい場
合には、探索サイクルを継続し（ステップ２２４）、そ
うでない場合には、現在のゼロ交点を左の分解及び合成
端として考える（ステップ２２５）。サイクルの終了時
に、ｂ_sa及びｂ_ssがまだ決定されなかった場合には、探
索継続及び終結の相を開始する（相２４、図１２）。合
成において必要とされる長期化が分解期間の半分よりも
短い又はそれと等しい場合には、上で述べた操作は、右
の分解端からの距離が必要とされる長期化を越える又は
それと等しい最初のものである候補を、もしあれば、見
い出すことを可能にする。

【００２８】探索継続及び終結相においては、上で述べ
たように、図１７中のステップ１７１〜１７５中で示し
た手順によって、ＬＺＶよりも先行するゼロ交点から出
発して、後ろ向き探索サイクルを実施する。更にまた、
区間の長期化が考慮される（ステップ１７６）ので、右
の分解端ｂ_daと現在のゼロ交点ＺＴｍｐとの間の距離
Δ ａ、右の合成端ｂ_dsと現在のゼロ交点ＺＴｍｐと
の間の距離Δ ｓ、及びこれらの距離の間の比Δを、ス
テップ１７３の条件を満たすゼロ交点に関して計算する
（ステップ１７７）。比Δを上述の期間の間の比の２倍
（ｒＰ＊２）と、図１５中の比較１４６に関して見ら
れたのと同じ理由のために比較し、そして条件Δ≦（ｒ
Ｐ＊２）を満たすゼロ交点を左の分解端ｂ_sa及び左の
合成端ｂ_ssとして採用するであろう。この相において課
される条件は、左の分解端の仕事を、右の合成端の左に
横たわり、できる限りそれに近く、そしてまた適用され
る接続関数のために十分な時間区間を保証するゼロ交点
に割り当てることを可能にする。特に、ある分解期間を
与えるならば、元の期間中の更に後ろに位置付けられた
左の分解端は、合成において必要とされるより大きな長
期化に対応するであろう。

【００２９】本明細書中で述べた方法は、慣用のパソコ
ン、ワークステーション、又は類似の装置によって実施
することができる。上で述べられていることは非限定的
な例のために与えられていること、並びに本発明の範囲
から逸脱することなく変形及び変更が可能であることは
明らかである。

【図面の簡単な説明】

【図１】要素の音波の単位の連結によるテキストから音
声への合成システムの操作の一般的なアウトラインであ
る。

【図２】本発明による、二重音の連結及び時間領域にお
ける韻律素のパラメータの変更による合成方法の図表で
ある。

【図３】音素のそして二重音境界のためのマーカ並びに
ピッチマーカを有する、本当の二重音の波形を表す。

【図４】自然の音声信号の韻律素のパラメータが幾つか
の特別なケースにおいて本発明に従ってどのようにして
変更されるかを表すグラフである。

【図５】自然の音声信号の韻律素のパラメータが幾つか
の特別なケースにおいて本発明に従ってどのようにして
変更されるかを表すグラフである。

【図６】自然の音声信号の韻律素のパラメータが幾つか
の特別なケースにおいて本発明に従ってどのようにして
変更されるかを表すグラフである。

【図７Ａ】図３中の二重音の分節音に関する基本期間の
変更のための本発明による方法の適用の幾つかの本当の
例である。

【図７Ｂ】図３中の二重音の分節音に関する基本期間の
変更のための本発明による方法の適用の幾つかの本当の
例である。

【図８Ａ】図３中の二重音の分節音に関する基本期間の
変更のための本発明による方法の適用の幾つかの本当の
例である。

【図８Ｂ】図３中の二重音の分節音に関する基本期間の
変更のための本発明による方法の適用の幾つかの本当の
例である。

【図９Ａ】図３中の二重音の分節音に関する基本期間の
変更のための本発明による方法の適用の幾つかの本当の
例である。

【図９Ｂ】図３中の二重音の分節音に関する基本期間の
変更のための本発明による方法の適用の幾つかの本当の
例である。

【図１０Ａ】図３中の二重音の分節音に関する基本期間
の変更のための本発明による方法の適用の幾つかの本当
の例である。

【図１０Ｂ】図３中の二重音の分節音に関する基本期間
の変更のための本発明による方法の適用の幾つかの本当
の例である。

【図１１】左の分解及び合成端を決定するための操作の
フローチャートである。

【図１２】左の分解及び合成端を決定するための操作の
フローチャートである。

【図１３】左の分解及び合成端を決定するための操作の
フローチャートである。

【図１４】左の分解及び合成端を決定するための操作の
フローチャートである。

【図１５】左の分解及び合成端を決定するための操作の
フローチャートである。

【図１６】左の分解及び合成端を決定するための操作の
フローチャートである。

【図１７】左の分解及び合成端を決定するための操作の
フローチャートである。

【図１８】左の分解及び合成端を決定するための操作の
フローチャートである。

フロントページの続き (72)発明者ルチアノ・ネツビアイタリー国トリノ、ヴイア・モンテ・オルチガラ 41 (72)発明者ステフアノ・サンドリイタリー国トリノ、ピー・ツエーツア・マツサウア７ (56)参考文献特開昭60−184300（ＪＰ，Ａ) 特開平６−19496（ＪＰ，Ａ) 特開平３−97000（ＪＰ，Ａ) 特開平５−241598（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 11/00 - 21/06 ＩＮＳＰＥＣ（ＤＩＡＬＯＧ)

Claims

(57)【特許請求の範囲】

【請求項１】基本的な音声信号単位を表す波形を時間
連結することによる音声信号合成方法であって、少なく
とも有声音に関する波形を、声帯刺激の一連の衝撃に対
する声管の応答に対応し且つ信号の基本周波数に同期し
た複数の区間に細分し；合成において再生されるべき元
の信号の現在の区間を、不変部分と可変部分に細分し；
各区間の可変部分の波形を重み付けし；重み付けにより
得られた信号を、韻律素情報に依存した量だけ時間シフ
トされたそれらの複製と置き換え；そして、シフトされ
た信号を重複させて加算することにより合成を行う該音
声信号合成方法において、（ア）不変部分が、所定条件を満たす元の音声信号のゼ
ロ交点により表される左の分解端と区間の開始との間に
存在し、且つ、可変部分が、現在の区間の終わりと本質
的に一致する右の分解端と左の分解端との間に存在する
ように、不変部分と可変部分の間の境界を決め、ここ
で、左の分解端と右の分解端は、合成された信号におい
てそれぞれ左の合成端と右の合成端に関連し、このうち
左の合成端は区間開始マーカに関して左の分解端と一致
し、また、右の合成端は合成された信号において区間の
終わりと本質的に一致し、（イ）第一接続関数を、元の信号の現在の区間の左の分
解端の右にある波形部分に適用し、ここで、この関数
は、左と右の合成端の間に存在する合成された波形の分
節音の継続時間に等しい継続時間、及び次第に減少し且
つ左の分解端に対応して最大である振幅を有し、（ウ）第二接続関数を、合成において再生されるべき元
の信号の後続の区間の左にある波形部分に適用し、ここ
で、この関数は、左と右の合成端の間に存在する合成さ
れた波形の分節音の継続時間と等しい継続時間、及び次
第に増加し且つ前記の後続区間の開始に対応して最大で
ある振幅を有し、そして（エ）元の区間の不変部分中の波形を変えずに再生し、
且つ、２つの接続関数を適用して得られる２つの波形を
時間に関して整列させて加算することによって得られた
波形を不変部分の再生波形に結合させることにより、合
成された信号の各々の区間を作る、ことを特徴とする音声信号合成方法。
【請求項２】一つの区間の継続時間が元の信号の対応
する区間の継続時間に対して合成のために減らされるか
又は変えられずに維持される場合には、左の分解端及び
左の合成端を、以下の操作： − 元の信号波形のゼロ交点の数を計算し、そして各々
のゼロ交点に区間の始めから終わりに向かって増加する
指数を割り当てること、 − ゼロ交点の数が第一しきい値よりも小さくないこと
をチェックすること、 − チェックの正の結果のケースにおいては、左の分解
及び合成端として機能するゼロ交点候補を求めて探索す
ること、 − 前記区間中のすべてのゼロ交点の中で、最後のもの
を除いて、右の合成端の左に横たわり、できる限りそれ
に近く、そして適用されるべき接続関数のために十分な
時間区間を保証する候補を求めて後ろ向きに探索し、そ
して左の分解及び合成端の仕事をこの候補に割り当てる
ことによって決定することを特徴とする、請求項１記載
の方法。
【請求項３】前記のゼロ交点の計算において、前のゼ
ロ交点からのその距離が所定の距離よりも短いゼロ交点
を考慮しないことを特徴とする、請求項２記載の方法。
【請求項４】後ろ向き探索が負の結果をもたらした場
合にはそしてゼロ交点の数が第一しきい値よりも大きい
場合には、左の分解端及び左の合成端の仕事を、その指
数が前記しきい値に対応するゼロ交点に、このようなゼ
ロ交点が右の合成端の左に横たわる場合には、割り当て
ることを特徴とする、請求項２又は３記載の方法。
【請求項５】後ろ向き探索が負の結果をもたらした場
合にはそしてゼロ交点の数が第一しきい値よりも大きく
ない場合には、右の合成端の左に横たわりそして第二し
きい値よりも小さくない右の合成端からの距離を有する
ゼロ交点を識別するために更なる探索相を実施し、そし
て左の分解端及び右の分解端の仕事を、これらの条件を
満たす最大指数のゼロ交点に割り当てることを特徴とす
る、請求項２又は３記載の方法。
【請求項６】第一しきい値との比較がゼロ交点の数が
第一しきい値よりも小さいことを示す場合には、前記後
ろ向き探索を直接に実施しそして、それが負の結果をも
たらす場合には、前記の更なる探索相を直接に実施する
ことを特徴とする、請求項２記載の方法。
【請求項７】区間の継続時間が元の信号の対応する区
間の継続時間と比較して合成のために増加される場合に
は、左の分解端及び右の合成端を以下の操作： − 元の信号波形のゼロ交点の数を計算すること、 − 合成区間の継続時間長期化と元の区間の継続時間と
を比較して、この長期化が元の区間継続時間の半分を越
えないことをチェックすること、 − このチェックが正の結果をもたらす場合には、最後
のものを除くすべてのゼロ交点の中で、右の合成端の左
に横たわりそして右の合成端からの距離が区間継続時間
の長期化よりも短くない最初のものである候補ゼロ交点
を求めて後ろ向きに探索し、そして左の分解端及び左の
合成端の仕事を、もしあれば、前記条件を満たすゼロ交
点に割り当てることによって決定することを特徴とす
る、請求項１記載の方法。
【請求項８】前記のゼロ交点の計算において、前の交
点からのその距離が所定の距離よりも短い交点を考慮し
ないことを特徴とする、請求項７記載の方法。
【請求項９】区間継続時間長期化が元の区間継続時間
の半分を越える場合には、又は後ろ向き探索が不成功で
ある場合には、右の合成端の左に横たわりそして第三し
きい値よりも短くない右の合成端からの距離を有するゼ
ロ交点を識別するために更なる後ろ向き探索相を実施
し、右の合成端からのそして右の分解端からの距離及び
これらの距離の間の比をこのようなゼロ交点に関して計
算し、この比を、合成区間の継続時間と元の区間の継続
時間との間の比の値と比較し、そして左の分解端及び左
の合成端の仕事を、その指数が、これらの端からの前記
距離の間の比が所定の係数だけ継続時間の間の比を越え
ないものの中で最低であるゼロ交点に割り当てることを
特徴とする、請求項７又は８記載の方法。