JPH0310300A - 音声合成装置のデータ処理方式 - Google Patents
音声合成装置のデータ処理方式Info
- Publication number
- JPH0310300A JPH0310300A JP1145605A JP14560589A JPH0310300A JP H0310300 A JPH0310300 A JP H0310300A JP 1145605 A JP1145605 A JP 1145605A JP 14560589 A JP14560589 A JP 14560589A JP H0310300 A JPH0310300 A JP H0310300A
- Authority
- JP
- Japan
- Prior art keywords
- data
- speech
- energy
- parameter
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002194 synthesizing effect Effects 0.000 title description 2
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 abstract description 3
- 230000011218 segmentation Effects 0.000 abstract 2
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
A 産業上の利用分野
本発明は、規則合成方式による音声合成装置に係り、特
にCVデータとVCデータの処理方式に関する。
にCVデータとVCデータの処理方式に関する。
B 発明の概要
本発明は、入力文字列に対応するCVデータとVCデー
タの接続によって音声合成を行う音声合成装置において
、 CVデータとVCデータの接続点のエネルギーを一致さ
せたデータ作成と保存を行うことにより、CVデータと
VCデータの接続に自然性を高めたものである。
タの接続によって音声合成を行う音声合成装置において
、 CVデータとVCデータの接続点のエネルギーを一致さ
せたデータ作成と保存を行うことにより、CVデータと
VCデータの接続に自然性を高めたものである。
C従来の技術
規則合成方式による音声合成装置は、人力文字列を構文
解析によって単語9文節に区切り、夫々にはイントネー
ション、アクセン1−を決定し、単語や文節を音節さら
には音素にまで分解し、音節又は音素単位の音源波及び
調音フィルタのパラメータを求め、音源波に対する調音
フィルタの応答出力として合成音声を得るようにしてい
る。
解析によって単語9文節に区切り、夫々にはイントネー
ション、アクセン1−を決定し、単語や文節を音節さら
には音素にまで分解し、音節又は音素単位の音源波及び
調音フィルタのパラメータを求め、音源波に対する調音
フィルタの応答出力として合成音声を得るようにしてい
る。
このような音声合成装置において、音節単位の規則合成
には、音節パラメータメモリに子音+母音(CVデータ
)又は母音十子音(VCデータ)単位で音声を特徴づけ
るパラメータを保存しておき、入力文字列°に応じて音
韻毎のつながり継続時間、音の強さ(エネルキー、ピッ
チ周波数)等の規則を外部から勺えて音声特徴パラメー
タを変化させ、これを調音フィルタに入力して合成音声
を得るようにしている。
には、音節パラメータメモリに子音+母音(CVデータ
)又は母音十子音(VCデータ)単位で音声を特徴づけ
るパラメータを保存しておき、入力文字列°に応じて音
韻毎のつながり継続時間、音の強さ(エネルキー、ピッ
チ周波数)等の規則を外部から勺えて音声特徴パラメー
タを変化させ、これを調音フィルタに入力して合成音声
を得るようにしている。
ここで、CVデータ又はVCデータを作成するのに、各
音節を独立して発声したときの音声槽−」−からパラメ
ータを求めている。
音節を独立して発声したときの音声槽−」−からパラメ
ータを求めている。
D9発明が解決しようとする課題
従来の音声合成装置において、CVデータ又はVCデー
タは音声信号からの作成時に音の強ざにバラツキが生じ
、入力文字列に従ってcv、vcデータを接続する際に
接続点で異音が生し易いという問題があった。
タは音声信号からの作成時に音の強ざにバラツキが生じ
、入力文字列に従ってcv、vcデータを接続する際に
接続点で異音が生し易いという問題があった。
例えば、第4図に示すように、CvデータとVCデータ
を接続するのに、CVデータの終了点のエネルギーEc
vとVCデータの開始点のエネルギEvcとにずれがあ
ると、接続点で異音が発生し、自然性の高い合成音声を
得るのを難しくする。
を接続するのに、CVデータの終了点のエネルギーEc
vとVCデータの開始点のエネルギEvcとにずれがあ
ると、接続点で異音が発生し、自然性の高い合成音声を
得るのを難しくする。
本発明の目的は、CVデータのVCデータの接続に自然
性を高めた処理方式を提供することにある。
性を高めた処理方式を提供することにある。
IC1課題を解決するだめの手段と作用本発明は、」二
足目的を達成するため、入力文字列に対応したCVデー
タとVCデータを接続した音声特徴パラメータから合成
音声を得る音声合成装置において、音節毎の音声波形の
レベルを正規化及び音声パラメータ分析によって前記c
■データ及びVCデータを得、このCVデータの終了の
エネルギーにVCデータの開始のエネルギーを一致させ
るよう該CVデータとVCデータを調節して前記音声特
徴パラメータとするようにし、CVデータの終了からV
Cデータの開始にか(プてのイったりにエネルギーの急
激な変化を無くした接続を得る。
足目的を達成するため、入力文字列に対応したCVデー
タとVCデータを接続した音声特徴パラメータから合成
音声を得る音声合成装置において、音節毎の音声波形の
レベルを正規化及び音声パラメータ分析によって前記c
■データ及びVCデータを得、このCVデータの終了の
エネルギーにVCデータの開始のエネルギーを一致させ
るよう該CVデータとVCデータを調節して前記音声特
徴パラメータとするようにし、CVデータの終了からV
Cデータの開始にか(プてのイったりにエネルギーの急
激な変化を無くした接続を得る。
F 実施例
第1図は本発明の一実施例を示す処理フローチャロート
である。アナウンサー等により発声された音節毎の音声
波形を取込み(ステップSl)、この音声波形のレベル
を正規化しくステップ82)、音声パラメータの分析に
よってパラメータ抽出を行う(ステップ83)。このパ
ラメータは時系列データとしてエネルギーやピッチ周波
数として取出され、このパラメータに対してCVデータ
及びVCデータの決定には時系列データのうちのc■デ
ータの終了とVCデータの開始のエネルギーレベルを合
わせたデータ切出しを行う(ステップS4)。データ切
出しを行われたCVデータ及びVCデータは夫々のパラ
メータとして音節パラメータメモリに保存される(ステ
ップS5)。
である。アナウンサー等により発声された音節毎の音声
波形を取込み(ステップSl)、この音声波形のレベル
を正規化しくステップ82)、音声パラメータの分析に
よってパラメータ抽出を行う(ステップ83)。このパ
ラメータは時系列データとしてエネルギーやピッチ周波
数として取出され、このパラメータに対してCVデータ
及びVCデータの決定には時系列データのうちのc■デ
ータの終了とVCデータの開始のエネルギーレベルを合
わせたデータ切出しを行う(ステップS4)。データ切
出しを行われたCVデータ及びVCデータは夫々のパラ
メータとして音節パラメータメモリに保存される(ステ
ップS5)。
上述のようなcv、vcデータの作成処理において、ス
テップS4におけるデータ切出しには、第2図に示すよ
うにCVデータの終了エネルギーEsに一致する■Cデ
ータの切出し範囲の調節によって実現され、CVデータ
とVCデータの接続点のエネルギー変化を連続的にする
。逆に、c■データの切出し範囲の調節さらには両デー
タの切出し範囲調節にする。
テップS4におけるデータ切出しには、第2図に示すよ
うにCVデータの終了エネルギーEsに一致する■Cデ
ータの切出し範囲の調節によって実現され、CVデータ
とVCデータの接続点のエネルギー変化を連続的にする
。逆に、c■データの切出し範囲の調節さらには両デー
タの切出し範囲調節にする。
また、第3図に示すように、VCデータの切出し範囲は
CVデータと同じにし、VCデータの全体のレベルを調
節することで同じエネルギーE5による接続を得ること
ができる。
CVデータと同じにし、VCデータの全体のレベルを調
節することで同じエネルギーE5による接続を得ること
ができる。
従って、CVデータとVCデータの接続による音声合成
時にはCVデータとVCデータの接続点でのエネルギー
レベルの急変を少なくし、自然性の高いエネルギー変化
にして合成音声の自然性を高めることがてきる。
時にはCVデータとVCデータの接続点でのエネルギー
レベルの急変を少なくし、自然性の高いエネルギー変化
にして合成音声の自然性を高めることがてきる。
G3発明の効果
以上のとおり、本発明によれば、CVデータとVCデー
タの接続点のエネルギーを一致させたCVデータ及びV
Cデータとするため、音声合成時のCVデータとVCデ
ータの接続に滑らかなエネルギー変化を得て自然性を高
めた合成音声を得ることができる。
タの接続点のエネルギーを一致させたCVデータ及びV
Cデータとするため、音声合成時のCVデータとVCデ
ータの接続に滑らかなエネルギー変化を得て自然性を高
めた合成音声を得ることができる。
第1図は本発明の一実施例を示すフローヂャート、第2
図及び第3図は実施例におけるCVデータとVCデータ
の結合状態図、第4図は従来の結外2名
図及び第3図は実施例におけるCVデータとVCデータ
の結合状態図、第4図は従来の結外2名
Claims (1)
- (1)入力文字列に対応したCVデータとVCデータを
接続した音声特徴パラメータから合成音声を得る音声合
成装置において、音節毎の音声波形のレベルを正規化及
び音声パラメータ分析によって前記CVデータ及びVC
データを得、このCVデータの終了のエネルギーにVC
データの開始のエネルギーを一致させるよう該CVデー
タとVCデータを調節して前記音声特徴パラメータとす
ることを特徴とする音声合成装置のデータ処理方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1145605A JP2956069B2 (ja) | 1989-06-08 | 1989-06-08 | 音声合成装置のデータ処理方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1145605A JP2956069B2 (ja) | 1989-06-08 | 1989-06-08 | 音声合成装置のデータ処理方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0310300A true JPH0310300A (ja) | 1991-01-17 |
| JP2956069B2 JP2956069B2 (ja) | 1999-10-04 |
Family
ID=15388910
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1145605A Expired - Lifetime JP2956069B2 (ja) | 1989-06-08 | 1989-06-08 | 音声合成装置のデータ処理方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2956069B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0756591A (ja) * | 1993-08-19 | 1995-03-03 | Sony Corp | 音声合成装置、音声合成方法及び記録媒体 |
| US5528726A (en) * | 1992-01-27 | 1996-06-18 | The Board Of Trustees Of The Leland Stanford Junior University | Digital waveguide speech synthesis system and method |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5868099A (ja) * | 1981-10-19 | 1983-04-22 | 富士通株式会社 | 音声合成装置 |
| JPS63307500A (ja) * | 1987-06-09 | 1988-12-15 | 日本電気株式会社 | 録音編集合成装置 |
-
1989
- 1989-06-08 JP JP1145605A patent/JP2956069B2/ja not_active Expired - Lifetime
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5868099A (ja) * | 1981-10-19 | 1983-04-22 | 富士通株式会社 | 音声合成装置 |
| JPS63307500A (ja) * | 1987-06-09 | 1988-12-15 | 日本電気株式会社 | 録音編集合成装置 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5528726A (en) * | 1992-01-27 | 1996-06-18 | The Board Of Trustees Of The Leland Stanford Junior University | Digital waveguide speech synthesis system and method |
| JPH0756591A (ja) * | 1993-08-19 | 1995-03-03 | Sony Corp | 音声合成装置、音声合成方法及び記録媒体 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2956069B2 (ja) | 1999-10-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Halle et al. | Speech recognition: A model and a program for research | |
| CN111429877B (zh) | 歌曲处理方法及装置 | |
| JPH031200A (ja) | 規則型音声合成装置 | |
| Sanchez et al. | Hierarchical modeling of F0 contours for voice conversion. | |
| CN113436606A (zh) | 一种原声语音翻译方法 | |
| CN109616131A (zh) | 一种数字实时语音变音方法 | |
| Jalin et al. | Text to speech synthesis system for tamil using HMM | |
| Li et al. | Prosody usage optimization for children speech recognition with zero resource children speech. | |
| JP2904279B2 (ja) | 音声合成方法および装置 | |
| Saitou et al. | Analysis of acoustic features affecting" singing-ness" and its application to singing-voice synthesis from speaking-voice. | |
| JPH0310300A (ja) | 音声合成装置のデータ処理方式 | |
| JPH0580791A (ja) | 音声規則合成装置および方法 | |
| JP2995774B2 (ja) | 音声合成方式 | |
| JP2900454B2 (ja) | 音声合成装置の音節データ作成方式 | |
| JPH0756590A (ja) | 音声合成装置、音声合成方法及び記録媒体 | |
| JPH03216699A (ja) | 音声合成装置の音源データ生成方法 | |
| Konan et al. | The phonemes recognition through formant analysis in vowelconsonant transition case in “Baoule” language of Côte d’Ivoire | |
| Saiyod et al. | Thai Speech Synthesis for Text-to-Speech based on Formant Synthesis Technique | |
| Minematsu et al. | Prosodic manipulation system of speech material for perceptual experiments | |
| JP3368948B2 (ja) | 音声規則合成装置 | |
| Abid et al. | Efficient English Text-to-Speech Voice Cloning Using Limited Speaker Data | |
| JP2755478B2 (ja) | テキスト音声合成装置 | |
| Van Ngo et al. | Evaluation of the Lombard effect model on synthesizing Lombard speech in varying noise level environments with limited data | |
| Haque et al. | Generating Vowel Nasality for a Rule-Based Bangla Speech Synthesizer | |
| Saitou et al. | Speech-to-Singing Synthesis System: Vocal conversion from speaking voices to singing voices by controlling acoustic features unique to singing voices |