JPH0310300A - 音声合成装置のデータ処理方式 - Google Patents

音声合成装置のデータ処理方式

Info

Publication number
JPH0310300A
JPH0310300A JP1145605A JP14560589A JPH0310300A JP H0310300 A JPH0310300 A JP H0310300A JP 1145605 A JP1145605 A JP 1145605A JP 14560589 A JP14560589 A JP 14560589A JP H0310300 A JPH0310300 A JP H0310300A
Authority
JP
Japan
Prior art keywords
data
speech
energy
parameter
syllable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1145605A
Other languages
English (en)
Other versions
JP2956069B2 (ja
Inventor
Yoshimasa Sawada
沢田 喜正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP1145605A priority Critical patent/JP2956069B2/ja
Publication of JPH0310300A publication Critical patent/JPH0310300A/ja
Application granted granted Critical
Publication of JP2956069B2 publication Critical patent/JP2956069B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A 産業上の利用分野 本発明は、規則合成方式による音声合成装置に係り、特
にCVデータとVCデータの処理方式に関する。
B 発明の概要 本発明は、入力文字列に対応するCVデータとVCデー
タの接続によって音声合成を行う音声合成装置において
、 CVデータとVCデータの接続点のエネルギーを一致さ
せたデータ作成と保存を行うことにより、CVデータと
VCデータの接続に自然性を高めたものである。
C従来の技術 規則合成方式による音声合成装置は、人力文字列を構文
解析によって単語9文節に区切り、夫々にはイントネー
ション、アクセン1−を決定し、単語や文節を音節さら
には音素にまで分解し、音節又は音素単位の音源波及び
調音フィルタのパラメータを求め、音源波に対する調音
フィルタの応答出力として合成音声を得るようにしてい
る。
このような音声合成装置において、音節単位の規則合成
には、音節パラメータメモリに子音+母音(CVデータ
)又は母音十子音(VCデータ)単位で音声を特徴づけ
るパラメータを保存しておき、入力文字列°に応じて音
韻毎のつながり継続時間、音の強さ(エネルキー、ピッ
チ周波数)等の規則を外部から勺えて音声特徴パラメー
タを変化させ、これを調音フィルタに入力して合成音声
を得るようにしている。
ここで、CVデータ又はVCデータを作成するのに、各
音節を独立して発声したときの音声槽−」−からパラメ
ータを求めている。
D9発明が解決しようとする課題 従来の音声合成装置において、CVデータ又はVCデー
タは音声信号からの作成時に音の強ざにバラツキが生じ
、入力文字列に従ってcv、vcデータを接続する際に
接続点で異音が生し易いという問題があった。
例えば、第4図に示すように、CvデータとVCデータ
を接続するのに、CVデータの終了点のエネルギーEc
vとVCデータの開始点のエネルギEvcとにずれがあ
ると、接続点で異音が発生し、自然性の高い合成音声を
得るのを難しくする。
本発明の目的は、CVデータのVCデータの接続に自然
性を高めた処理方式を提供することにある。
IC1課題を解決するだめの手段と作用本発明は、」二
足目的を達成するため、入力文字列に対応したCVデー
タとVCデータを接続した音声特徴パラメータから合成
音声を得る音声合成装置において、音節毎の音声波形の
レベルを正規化及び音声パラメータ分析によって前記c
■データ及びVCデータを得、このCVデータの終了の
エネルギーにVCデータの開始のエネルギーを一致させ
るよう該CVデータとVCデータを調節して前記音声特
徴パラメータとするようにし、CVデータの終了からV
Cデータの開始にか(プてのイったりにエネルギーの急
激な変化を無くした接続を得る。
F 実施例 第1図は本発明の一実施例を示す処理フローチャロート
である。アナウンサー等により発声された音節毎の音声
波形を取込み(ステップSl)、この音声波形のレベル
を正規化しくステップ82)、音声パラメータの分析に
よってパラメータ抽出を行う(ステップ83)。このパ
ラメータは時系列データとしてエネルギーやピッチ周波
数として取出され、このパラメータに対してCVデータ
及びVCデータの決定には時系列データのうちのc■デ
ータの終了とVCデータの開始のエネルギーレベルを合
わせたデータ切出しを行う(ステップS4)。データ切
出しを行われたCVデータ及びVCデータは夫々のパラ
メータとして音節パラメータメモリに保存される(ステ
ップS5)。
上述のようなcv、vcデータの作成処理において、ス
テップS4におけるデータ切出しには、第2図に示すよ
うにCVデータの終了エネルギーEsに一致する■Cデ
ータの切出し範囲の調節によって実現され、CVデータ
とVCデータの接続点のエネルギー変化を連続的にする
。逆に、c■データの切出し範囲の調節さらには両デー
タの切出し範囲調節にする。
また、第3図に示すように、VCデータの切出し範囲は
CVデータと同じにし、VCデータの全体のレベルを調
節することで同じエネルギーE5による接続を得ること
ができる。
従って、CVデータとVCデータの接続による音声合成
時にはCVデータとVCデータの接続点でのエネルギー
レベルの急変を少なくし、自然性の高いエネルギー変化
にして合成音声の自然性を高めることがてきる。
G3発明の効果 以上のとおり、本発明によれば、CVデータとVCデー
タの接続点のエネルギーを一致させたCVデータ及びV
Cデータとするため、音声合成時のCVデータとVCデ
ータの接続に滑らかなエネルギー変化を得て自然性を高
めた合成音声を得ることができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すフローヂャート、第2
図及び第3図は実施例におけるCVデータとVCデータ
の結合状態図、第4図は従来の結外2名

Claims (1)

    【特許請求の範囲】
  1. (1)入力文字列に対応したCVデータとVCデータを
    接続した音声特徴パラメータから合成音声を得る音声合
    成装置において、音節毎の音声波形のレベルを正規化及
    び音声パラメータ分析によって前記CVデータ及びVC
    データを得、このCVデータの終了のエネルギーにVC
    データの開始のエネルギーを一致させるよう該CVデー
    タとVCデータを調節して前記音声特徴パラメータとす
    ることを特徴とする音声合成装置のデータ処理方式。
JP1145605A 1989-06-08 1989-06-08 音声合成装置のデータ処理方式 Expired - Lifetime JP2956069B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1145605A JP2956069B2 (ja) 1989-06-08 1989-06-08 音声合成装置のデータ処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1145605A JP2956069B2 (ja) 1989-06-08 1989-06-08 音声合成装置のデータ処理方式

Publications (2)

Publication Number Publication Date
JPH0310300A true JPH0310300A (ja) 1991-01-17
JP2956069B2 JP2956069B2 (ja) 1999-10-04

Family

ID=15388910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1145605A Expired - Lifetime JP2956069B2 (ja) 1989-06-08 1989-06-08 音声合成装置のデータ処理方式

Country Status (1)

Country Link
JP (1) JP2956069B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0756591A (ja) * 1993-08-19 1995-03-03 Sony Corp 音声合成装置、音声合成方法及び記録媒体
US5528726A (en) * 1992-01-27 1996-06-18 The Board Of Trustees Of The Leland Stanford Junior University Digital waveguide speech synthesis system and method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5868099A (ja) * 1981-10-19 1983-04-22 富士通株式会社 音声合成装置
JPS63307500A (ja) * 1987-06-09 1988-12-15 日本電気株式会社 録音編集合成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5868099A (ja) * 1981-10-19 1983-04-22 富士通株式会社 音声合成装置
JPS63307500A (ja) * 1987-06-09 1988-12-15 日本電気株式会社 録音編集合成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5528726A (en) * 1992-01-27 1996-06-18 The Board Of Trustees Of The Leland Stanford Junior University Digital waveguide speech synthesis system and method
JPH0756591A (ja) * 1993-08-19 1995-03-03 Sony Corp 音声合成装置、音声合成方法及び記録媒体

Also Published As

Publication number Publication date
JP2956069B2 (ja) 1999-10-04

Similar Documents

Publication Publication Date Title
Halle et al. Speech recognition: A model and a program for research
CN111429877B (zh) 歌曲处理方法及装置
JPH031200A (ja) 規則型音声合成装置
Sanchez et al. Hierarchical modeling of F0 contours for voice conversion.
CN113436606A (zh) 一种原声语音翻译方法
CN109616131A (zh) 一种数字实时语音变音方法
Jalin et al. Text to speech synthesis system for tamil using HMM
Li et al. Prosody usage optimization for children speech recognition with zero resource children speech.
JP2904279B2 (ja) 音声合成方法および装置
Saitou et al. Analysis of acoustic features affecting" singing-ness" and its application to singing-voice synthesis from speaking-voice.
JPH0310300A (ja) 音声合成装置のデータ処理方式
JPH0580791A (ja) 音声規則合成装置および方法
JP2995774B2 (ja) 音声合成方式
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JPH0756590A (ja) 音声合成装置、音声合成方法及び記録媒体
JPH03216699A (ja) 音声合成装置の音源データ生成方法
Konan et al. The phonemes recognition through formant analysis in vowelconsonant transition case in “Baoule” language of Côte d’Ivoire
Saiyod et al. Thai Speech Synthesis for Text-to-Speech based on Formant Synthesis Technique
Minematsu et al. Prosodic manipulation system of speech material for perceptual experiments
JP3368948B2 (ja) 音声規則合成装置
Abid et al. Efficient English Text-to-Speech Voice Cloning Using Limited Speaker Data
JP2755478B2 (ja) テキスト音声合成装置
Van Ngo et al. Evaluation of the Lombard effect model on synthesizing Lombard speech in varying noise level environments with limited data
Haque et al. Generating Vowel Nasality for a Rule-Based Bangla Speech Synthesizer
Saitou et al. Speech-to-Singing Synthesis System: Vocal conversion from speaking voices to singing voices by controlling acoustic features unique to singing voices