JPS63285597A - 音素接続形パラメ−タ規則合成方式 - Google Patents
音素接続形パラメ−タ規則合成方式Info
- Publication number
- JPS63285597A JPS63285597A JP62119121A JP11912187A JPS63285597A JP S63285597 A JPS63285597 A JP S63285597A JP 62119121 A JP62119121 A JP 62119121A JP 11912187 A JP11912187 A JP 11912187A JP S63285597 A JPS63285597 A JP S63285597A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- formant
- change pattern
- speech
- previous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、規則による音声合成方式に関し、特にかな文
字列とそれに付加されたアクセント、イントネーション
等の韻律記号列を人力することにより高品質の音声を合
成する規則による音素接続形パラメータ規則合成方式に
関する。
字列とそれに付加されたアクセント、イントネーション
等の韻律記号列を人力することにより高品質の音声を合
成する規則による音素接続形パラメータ規則合成方式に
関する。
(従来の技術)
従来、規則により音声を合成する際、各音素を特徴づけ
る複数個のホルマント周波数及びホルマント帯域幅等の
特徴ベクトルと隣接音素間の音素変化を表わす特徴ベク
トル係数の時系列を蓄積し、隣接音素間の過渡部は、線
形補間法を用いて各音素の特徴ベクトルおよび特徴ベク
トル係数の線形結合により作成する方法等がある。これ
らの方法では前後の音素、発話速度等により定まる各音
素の持続時間に応じて定常部分を表示している特徴ベク
トルの部分を伸縮する方法が用いられる。しかし、この
ような方法は発話速度が異なっても過渡部分は変化しな
いという粗い近似であり、これにより得られる合成音は
発話速度によっては不自然な感じになるのは免れない。
る複数個のホルマント周波数及びホルマント帯域幅等の
特徴ベクトルと隣接音素間の音素変化を表わす特徴ベク
トル係数の時系列を蓄積し、隣接音素間の過渡部は、線
形補間法を用いて各音素の特徴ベクトルおよび特徴ベク
トル係数の線形結合により作成する方法等がある。これ
らの方法では前後の音素、発話速度等により定まる各音
素の持続時間に応じて定常部分を表示している特徴ベク
トルの部分を伸縮する方法が用いられる。しかし、この
ような方法は発話速度が異なっても過渡部分は変化しな
いという粗い近似であり、これにより得られる合成音は
発話速度によっては不自然な感じになるのは免れない。
(発明が解決しようとする問題点)
本発明の目的は、このような従来の欠点を改善するため
、人間の実音声の分析により抽出されるホルマント周波
数等の音声合成パラメータの時間的変化パターンと極め
てよく一致する時間的変化パターンを人工的に発生させ
、任意の文章を種々の発話速度で高品質な音声に変換す
る音声規則合成方式を提供することである。
、人間の実音声の分析により抽出されるホルマント周波
数等の音声合成パラメータの時間的変化パターンと極め
てよく一致する時間的変化パターンを人工的に発生させ
、任意の文章を種々の発話速度で高品質な音声に変換す
る音声規則合成方式を提供することである。
(問題点を解決するための手段)
本発明による規則による音声合成方式は、かな文字列若
しくはローマ字表記されたかな文字列とそれに付加され
たアクセント、イントネーション等の韻律記号列を入力
することにより、音素持続時間、ピッチ周波数の時間的
変化パターン、ホルマント周波数及びホルマント帯域幅
の時間的変化パターン及び音源強度の時間的変化パター
ンを予め定めた規則を用いて決定し、音声波形を合成す
る規則による音声合成方式において、各音素のホルマン
ト周波数、ホルマント帯域幅及び音源強度の時間的変化
パターンを、ホルマント周波数等の時間的変化パターン
における2つの位置(以下、ターゲット位置という)で
の値(以下、ターゲツト値という)と、それらの間の接
続方法を規定し、それらの値を用いて逐次算出するとに
より求めることに特徴を有する。
しくはローマ字表記されたかな文字列とそれに付加され
たアクセント、イントネーション等の韻律記号列を入力
することにより、音素持続時間、ピッチ周波数の時間的
変化パターン、ホルマント周波数及びホルマント帯域幅
の時間的変化パターン及び音源強度の時間的変化パター
ンを予め定めた規則を用いて決定し、音声波形を合成す
る規則による音声合成方式において、各音素のホルマン
ト周波数、ホルマント帯域幅及び音源強度の時間的変化
パターンを、ホルマント周波数等の時間的変化パターン
における2つの位置(以下、ターゲット位置という)で
の値(以下、ターゲツト値という)と、それらの間の接
続方法を規定し、それらの値を用いて逐次算出するとに
より求めることに特徴を有する。
(実施例)
本発明においては、各音素の調音特徴を特徴づけるパラ
メータとして、ホルマント周波数、ホルマント帯域幅及
び音源強度の変化を用いており、これらの時間的変化パ
ターンを2つのターゲット位置での値(ターゲツト値)
と各々のターゲット位置の間の接続方法を規定する方法
により、合成音声の品質を向上させている。
メータとして、ホルマント周波数、ホルマント帯域幅及
び音源強度の変化を用いており、これらの時間的変化パ
ターンを2つのターゲット位置での値(ターゲツト値)
と各々のターゲット位置の間の接続方法を規定する方法
により、合成音声の品質を向上させている。
第1図は、本発明の実施態様の一例を示す構成を示す。
図中、1は韻律記号が付加されたかな文字列が入力され
る入力端子、2はかな文字列の各音素を前後の音素や韻
律記号を参照して音韻記号に変化させる音韻記号変換回
路、3は各音韻の特徴ベクトルを4の音韻特徴ベクトル
テーブルから取り出すための音韻特徴ベクトル選定回路
、4は各音韻毎にホルマント周波数、ホルマント帯域幅
、音源強度のターゲット位置、ターゲツト値及びターゲ
ツト値の間の接続方法、持続時間長及びピッチパターン
情報等の情報を記憶している音韻特徴ベクトルテーブル
、5は音韻特徴ベクトルを用いて予め定めた時間間隔毎
のホルマント周波数等の音声合成パラメータを算出する
音声合成パラメータ演算回路、6はホルマント形音声合
成器、7は合成された音声波形を出力する出力端子であ
る。
る入力端子、2はかな文字列の各音素を前後の音素や韻
律記号を参照して音韻記号に変化させる音韻記号変換回
路、3は各音韻の特徴ベクトルを4の音韻特徴ベクトル
テーブルから取り出すための音韻特徴ベクトル選定回路
、4は各音韻毎にホルマント周波数、ホルマント帯域幅
、音源強度のターゲット位置、ターゲツト値及びターゲ
ツト値の間の接続方法、持続時間長及びピッチパターン
情報等の情報を記憶している音韻特徴ベクトルテーブル
、5は音韻特徴ベクトルを用いて予め定めた時間間隔毎
のホルマント周波数等の音声合成パラメータを算出する
音声合成パラメータ演算回路、6はホルマント形音声合
成器、7は合成された音声波形を出力する出力端子であ
る。
以下、図に沿ってその動作を説明する。入力端子1より
入力された韻律記号が付加されたかな文字列は、音韻記
号変換回路2により各音素とそれぞれの音素に韻律記号
の付された音韻記号の列に変換される。音韻記号は3の
音韻特徴ベクトル選定回路へ人力される。音韻特徴ベク
トル選定回路は1種のインデックスファイルであり、入
力された各音韻毎の特徴ベクトルが記憶されている音韻
特徴ベクトルテーブル4内のアドレスを、各音韻毎に記
憶している。音韻特徴ベクトルテーブル4に記憶されて
いる特徴ベクトルとしては、ホルマント周波数、ホルマ
ント帯域幅、音源強度のターゲット位置、ターゲツト値
及びターゲツト値の間の接続方法、持続時間長及びピッ
チパターン情報がある。ピッチパターン情報としては、
例えばアクセント核の位置と戸車て成分の位置を使用す
る方法は公知である(例えば、藤崎、須藤: “日本語
単語アクセントの基本周波数パターンとその生成機構モ
デル”、日本音晋学会誌、27.445−453(19
71))。これらの特徴ベクトルは音声合成パラメータ
演算回路5に入力される、音声合成パラメータ演算回路
5はこれらの特徴ベクトルを用いて、予め定めた時間間
隔例えば5 m5ec毎の音声合成パラメータを算出す
る。音声合成パラメータ演算回路5へ人力される特徴ベ
クトルの内、ピッチパターン情報の処理は上述の文献等
で公知であるため、ホルマント周波数等に関する音声合
成パララメータの算出方法についてのみ、以下説明する
。なお、音声合成パラメータ演算回路6の出力は、予め
定めた時間間隔毎のホルマント周波数、ホルマント帯域
幅、音源強度、ピッチ周波数であり、これらの信号はホ
ルマント形音声合成器6に人力される。ホルマント形音
声合成器6は公知(イ列えば、D、H,に1att:“
Software for a cascade/pa
rallel formant 5ynthesi
zer ″ 、J、 Acoust。
入力された韻律記号が付加されたかな文字列は、音韻記
号変換回路2により各音素とそれぞれの音素に韻律記号
の付された音韻記号の列に変換される。音韻記号は3の
音韻特徴ベクトル選定回路へ人力される。音韻特徴ベク
トル選定回路は1種のインデックスファイルであり、入
力された各音韻毎の特徴ベクトルが記憶されている音韻
特徴ベクトルテーブル4内のアドレスを、各音韻毎に記
憶している。音韻特徴ベクトルテーブル4に記憶されて
いる特徴ベクトルとしては、ホルマント周波数、ホルマ
ント帯域幅、音源強度のターゲット位置、ターゲツト値
及びターゲツト値の間の接続方法、持続時間長及びピッ
チパターン情報がある。ピッチパターン情報としては、
例えばアクセント核の位置と戸車て成分の位置を使用す
る方法は公知である(例えば、藤崎、須藤: “日本語
単語アクセントの基本周波数パターンとその生成機構モ
デル”、日本音晋学会誌、27.445−453(19
71))。これらの特徴ベクトルは音声合成パラメータ
演算回路5に入力される、音声合成パラメータ演算回路
5はこれらの特徴ベクトルを用いて、予め定めた時間間
隔例えば5 m5ec毎の音声合成パラメータを算出す
る。音声合成パラメータ演算回路5へ人力される特徴ベ
クトルの内、ピッチパターン情報の処理は上述の文献等
で公知であるため、ホルマント周波数等に関する音声合
成パララメータの算出方法についてのみ、以下説明する
。なお、音声合成パラメータ演算回路6の出力は、予め
定めた時間間隔毎のホルマント周波数、ホルマント帯域
幅、音源強度、ピッチ周波数であり、これらの信号はホ
ルマント形音声合成器6に人力される。ホルマント形音
声合成器6は公知(イ列えば、D、H,に1att:“
Software for a cascade/pa
rallel formant 5ynthesi
zer ″ 、J、 Acoust。
Am、 、 67−3 (1980) )であり、上記
信号を用いて音声波形を合成し、出力端子7へ出力する
。
信号を用いて音声波形を合成し、出力端子7へ出力する
。
第2図に音声合成パラメータ演算回路5での処理方法を
説明する。横軸は時刻を示し、縦軸はホルマント周波数
を表わしている。“で示される点は音韻特徴ベクトルテ
ーブル4内に記憶されているターゲット位置でのホルマ
ント周波数を示す。
説明する。横軸は時刻を示し、縦軸はホルマント周波数
を表わしている。“で示される点は音韻特徴ベクトルテ
ーブル4内に記憶されているターゲット位置でのホルマ
ント周波数を示す。
更に、これらの相対位置間の接続方法を線形であるとす
る。予め定めた時間間隔毎の値は、そのサンプル時刻の
両側のターゲット位置でのホルマント周波数とその間の
接続方法により一意的に決定される。例えば、図中音素
101の第2番目のサンプル時刻02におけるホルマン
ト周波数は、位置O1と位置02とを結ぶ直線にサンプ
ル時刻02からたてた垂線が交わる点のホルマント周波
数に設定される。2つのターゲット位置の接続方法は線
形接続だけではなく、正弦・余弦関数を初め、その関数
が一意の関数として規定できるものであれば全て可能で
あることは当然である。以上述べたように、音声合成パ
ラメータ演算回路5は、2つのターゲット位置の値を直
線若しくは任意の曲線で接続する際の予め定めた間隔毎
の値を算出するものであるため、演算機能を有するマイ
クロコンピュータで構成可能である。なお、上記任意の
曲線を表わす関数は、1つの入力値に対ルてその値が一
意的に定まる条件を有する曲線であることは当然である
。
る。予め定めた時間間隔毎の値は、そのサンプル時刻の
両側のターゲット位置でのホルマント周波数とその間の
接続方法により一意的に決定される。例えば、図中音素
101の第2番目のサンプル時刻02におけるホルマン
ト周波数は、位置O1と位置02とを結ぶ直線にサンプ
ル時刻02からたてた垂線が交わる点のホルマント周波
数に設定される。2つのターゲット位置の接続方法は線
形接続だけではなく、正弦・余弦関数を初め、その関数
が一意の関数として規定できるものであれば全て可能で
あることは当然である。以上述べたように、音声合成パ
ラメータ演算回路5は、2つのターゲット位置の値を直
線若しくは任意の曲線で接続する際の予め定めた間隔毎
の値を算出するものであるため、演算機能を有するマイ
クロコンピュータで構成可能である。なお、上記任意の
曲線を表わす関数は、1つの入力値に対ルてその値が一
意的に定まる条件を有する曲線であることは当然である
。
(発明の効果)
以上説明したように、本発明によれば、任意の文章を極
めて自然性の高い音声に変換することが可能であり、か
つ色々な発話速度を実現することができる。しかも、相
対位置におけるホルマント周波数等の値を結ぶ関数をテ
ーブルとして有しておれば、テーブルを検索するという
簡単な方法により実現することができる。なお、本発明
は、従来の音素接続形パラメータ規則合成方式と異なり
、特定の個人の発話パラメータを蓄積しているのではな
いから、音韻特徴ベクトルテーブルに蓄積されている特
徴ベクトルを全て変更することなく声質を変更できるた
め、特徴ベクトルテーブルを余り増大させずに声質の変
更が可能である。
めて自然性の高い音声に変換することが可能であり、か
つ色々な発話速度を実現することができる。しかも、相
対位置におけるホルマント周波数等の値を結ぶ関数をテ
ーブルとして有しておれば、テーブルを検索するという
簡単な方法により実現することができる。なお、本発明
は、従来の音素接続形パラメータ規則合成方式と異なり
、特定の個人の発話パラメータを蓄積しているのではな
いから、音韻特徴ベクトルテーブルに蓄積されている特
徴ベクトルを全て変更することなく声質を変更できるた
め、特徴ベクトルテーブルを余り増大させずに声質の変
更が可能である。
第1図は本発明の実施例の構成を示す図であり、第2図
は第1図の音声合成パラメータ演算回路での処理方法を
示す図である。 1:入力端子、2:音韻記号変換回路、3:音韻特徴ベ
クトル選定回路、 4:音韻特徴ベクトルテーブル、 5:音声合成パラメータ演算回路、 6:音声合成器、7:出力端子。 第1 図
は第1図の音声合成パラメータ演算回路での処理方法を
示す図である。 1:入力端子、2:音韻記号変換回路、3:音韻特徴ベ
クトル選定回路、 4:音韻特徴ベクトルテーブル、 5:音声合成パラメータ演算回路、 6:音声合成器、7:出力端子。 第1 図
Claims (1)
- 【特許請求の範囲】 文字列とそれに付加されたアクセント、イントネーショ
ンをふくむ韻律記号列を入力することにより、音素持続
時間、ピッチ周波数の時間的変化パターン、ホルマント
周波数及びホルマント帯域幅の時間的変化パターン及び
音源強度の時間的変化パターンを予め定めた規則を用い
て決定し、音声波形を合成する規則による音声合成方式
において、 各音素のホルマント周波数及びホルマント帯域幅の時間
的変化パターン及び音源強度の時間的変化パターンとし
て、当該音素の持続時間内の2ケ所の相対位置と、その
位置での値、その相対位置間の遷移方法及び前後の音素
に応じて定める前後の音素内の相対位置との間の遷移方
法を登録するテーブルを検索し、それらの値と音素持続
時間を用いて予め定めた時間間隔毎の値を求めることを
特徴とする音素接続形パラメータ規則合成方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62119121A JPS63285597A (ja) | 1987-05-18 | 1987-05-18 | 音素接続形パラメ−タ規則合成方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62119121A JPS63285597A (ja) | 1987-05-18 | 1987-05-18 | 音素接続形パラメ−タ規則合成方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS63285597A true JPS63285597A (ja) | 1988-11-22 |
Family
ID=14753455
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62119121A Pending JPS63285597A (ja) | 1987-05-18 | 1987-05-18 | 音素接続形パラメ−タ規則合成方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS63285597A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH031200A (ja) * | 1989-05-29 | 1991-01-07 | Nec Corp | 規則型音声合成装置 |
| JPH04191898A (ja) * | 1990-11-27 | 1992-07-10 | Sharp Corp | テキスト音声合成装置 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60205801A (ja) * | 1984-03-30 | 1985-10-17 | Nec Corp | 任意音声合成器 |
-
1987
- 1987-05-18 JP JP62119121A patent/JPS63285597A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60205801A (ja) * | 1984-03-30 | 1985-10-17 | Nec Corp | 任意音声合成器 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH031200A (ja) * | 1989-05-29 | 1991-01-07 | Nec Corp | 規則型音声合成装置 |
| JPH04191898A (ja) * | 1990-11-27 | 1992-07-10 | Sharp Corp | テキスト音声合成装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS63285598A (ja) | 音素接続形パラメ−タ規則合成方式 | |
| JPH031200A (ja) | 規則型音声合成装置 | |
| JPS62160495A (ja) | 音声合成装置 | |
| WO2019138871A1 (ja) | 音声合成方法、音声合成装置およびプログラム | |
| Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
| JP3732793B2 (ja) | 音声合成方法、音声合成装置及び記録媒体 | |
| JP3281266B2 (ja) | 音声合成方法及び装置 | |
| US6829577B1 (en) | Generating non-stationary additive noise for addition to synthesized speech | |
| JP2001242882A (ja) | 音声合成方法及び音声合成装置 | |
| JPH08335096A (ja) | テキスト音声合成装置 | |
| AU6081399A (en) | Device and method for digital voice processing | |
| JPS63285597A (ja) | 音素接続形パラメ−タ規則合成方式 | |
| JPH09179576A (ja) | 音声合成方法 | |
| US7130799B1 (en) | Speech synthesis method | |
| JP2740510B2 (ja) | テキスト音声合成方式 | |
| JPH06318094A (ja) | 音声規則合成装置 | |
| JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
| JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
| JPS63285596A (ja) | 音声合成における発話速度変更方式 | |
| JP2995774B2 (ja) | 音声合成方式 | |
| JP2586040B2 (ja) | 音声編集合成装置 | |
| Hinterleitner | Speech synthesis | |
| JP2573587B2 (ja) | ピッチパタン生成装置 | |
| JPH0553595A (ja) | 音声合成装置 | |
| CN120183420A (zh) | 基于韵律的语音转换方法、装置、设备及介质 |