JPS60203998A - 音声合成用制御パラメ−タの推定方法 - Google Patents
音声合成用制御パラメ−タの推定方法Info
- Publication number
- JPS60203998A JPS60203998A JP59061484A JP6148484A JPS60203998A JP S60203998 A JPS60203998 A JP S60203998A JP 59061484 A JP59061484 A JP 59061484A JP 6148484 A JP6148484 A JP 6148484A JP S60203998 A JPS60203998 A JP S60203998A
- Authority
- JP
- Japan
- Prior art keywords
- ago
- control parameters
- sectional area
- speech synthesis
- estimating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Selective Calling Equipment (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、声帯を2質量モデル化した声帯等価回路と、
複数のフィルタ回路を縦続して々る声道等価回路とで構
成される音声合成装置を制御するパラメータを自然音声
から推定する音声合成用制御パラメータの推定方法に関
するものである。
複数のフィルタ回路を縦続して々る声道等価回路とで構
成される音声合成装置を制御するパラメータを自然音声
から推定する音声合成用制御パラメータの推定方法に関
するものである。
従来例の構成とその問題点
第1図はこの種の音声合成装置の概略を示している。第
1図において、1は声帯を2質量モデル化した声帯等価
回路、2は複数のフィルタ回路を縦続接続してなる声道
等価回路、3は出力端子である。上記声帯等価回路1の
制御パラメータは、呼気圧Ps、声帯緊張度Q、声門開
口断面積Agoであり、上記声道等価回路2の制御パラ
メータは10個縦続接続された各フィルタ係数を決める
声道断面積である。
1図において、1は声帯を2質量モデル化した声帯等価
回路、2は複数のフィルタ回路を縦続接続してなる声道
等価回路、3は出力端子である。上記声帯等価回路1の
制御パラメータは、呼気圧Ps、声帯緊張度Q、声門開
口断面積Agoであり、上記声道等価回路2の制御パラ
メータは10個縦続接続された各フィルタ係数を決める
声道断面積である。
有声音の合成に必要な声帯等価回路1および声道等価回
路2の制御パラメータは、自然音声(単音節)のスペク
トルと合成音声のスペクトルとの差が最小となるように
パターン探索法でめる。
路2の制御パラメータは、自然音声(単音節)のスペク
トルと合成音声のスペクトルとの差が最小となるように
パターン探索法でめる。
Agoは固定(Ago=(l O5cTL2’)とし、
Psおよび声無音声については、制御パラメータの推定
を行っていないので、既に合成されている有声音のAg
oを子音部で開放状態(Ago−0,6Crn2)とし
て合成する。
Psおよび声無音声については、制御パラメータの推定
を行っていないので、既に合成されている有声音のAg
oを子音部で開放状態(Ago−0,6Crn2)とし
て合成する。
しかし、声門開口断面積Agoは、音韻環境や音韻自体
によってそれぞれ異なり、−律に有声子音−c tri
振動状態(Ago−005cn12)、無声子音では
開放状態(Ago = 0.6 ctrt2)とするに
は無理がある。
によってそれぞれ異なり、−律に有声子音−c tri
振動状態(Ago−005cn12)、無声子音では
開放状態(Ago = 0.6 ctrt2)とするに
は無理がある。
例えば、従来知られている方法(J、 L、 Flan
agan。
agan。
K+1shizaka : 「Signal mode
ls for low bit−rate cod−i
ng of 5peech J JASA、 63(3
)、 5ept、 1980 )声道断面積/1/を用
い、Agoを001C1n2から20酊2までの範囲で
制御(後続母音は10/を用いた)すると、第2図に示
すように、Agoが004〜03cTL2の範囲で/d
o/と聞え(正聴率50%以上)、0.4〜095C1
n2の範囲でハO/と聞える(正聴率50%以上)。こ
のように子音部のAgoの制御範囲は広く、/dO/で
はAgo = 0.2 cm2の場合が、/lo/では
Ag。
ls for low bit−rate cod−i
ng of 5peech J JASA、 63(3
)、 5ept、 1980 )声道断面積/1/を用
い、Agoを001C1n2から20酊2までの範囲で
制御(後続母音は10/を用いた)すると、第2図に示
すように、Agoが004〜03cTL2の範囲で/d
o/と聞え(正聴率50%以上)、0.4〜095C1
n2の範囲でハO/と聞える(正聴率50%以上)。こ
のように子音部のAgoの制御範囲は広く、/dO/で
はAgo = 0.2 cm2の場合が、/lo/では
Ag。
= 0.75 cm2の場合が正聴率が最も高くなって
おり、子音部でAgoを一律に与えた場合に正聴率が最
高となるとは限らないという欠点があった。
おり、子音部でAgoを一律に与えた場合に正聴率が最
高となるとは限らないという欠点があった。
発明の目的
本発明は、上記従来例の欠点を除去するものであり、明
瞭な音節を合成することを目的としている。
瞭な音節を合成することを目的としている。
発明の構成
本発明は、上記目的を達成するために、制御パラメータ
の推定に際し、声道断面積と声門開口断面積を同時推定
することにより、合成音の品質を向上させるものである
。
の推定に際し、声道断面積と声門開口断面積を同時推定
することにより、合成音の品質を向上させるものである
。
実施例の説明
以下に本発明の一実施例について説明する。本実施例の
推定方法は、従来の制御パラメータの推定に子音部の声
門開口断面積Agoの推定を含めたものである。Ago
の推定区間は、ケプストラムのピークレベルを用いて決
める。ピンチ周期が存在すると考えられる区間で、ケプ
ストラムのピークを探し、あらかじめ設定されている閾
値よりも大きい場合には、有声区間(母音定常部)とし
てAgoは振動状態(Ago = 0.05(m2 )
を保持スル。ピークレベルが賎値化下ならば、無声区間
が含捷れるとしてAgoの探索を行う。閾値は、充分に
有声区間を含んだ値として設定する。
推定方法は、従来の制御パラメータの推定に子音部の声
門開口断面積Agoの推定を含めたものである。Ago
の推定区間は、ケプストラムのピークレベルを用いて決
める。ピンチ周期が存在すると考えられる区間で、ケプ
ストラムのピークを探し、あらかじめ設定されている閾
値よりも大きい場合には、有声区間(母音定常部)とし
てAgoは振動状態(Ago = 0.05(m2 )
を保持スル。ピークレベルが賎値化下ならば、無声区間
が含捷れるとしてAgoの探索を行う。閾値は、充分に
有声区間を含んだ値として設定する。
第3図(a)に自然音声/lo/の波形を示し、第3図
(b)にケプストラムピークレベルの推移を示す。
(b)にケプストラムピークレベルの推移を示す。
3フレームから4フレームへの移行時にケプストラムの
ピークレベルが急激に増加している(分析窓長25.’
6 ms )。この場合には1〜4フレームの範囲でA
goの推定を行い、ピークレベルの閾値は4フレーム目
の値を用いた。
ピークレベルが急激に増加している(分析窓長25.’
6 ms )。この場合には1〜4フレームの範囲でA
goの推定を行い、ピークレベルの閾値は4フレーム目
の値を用いた。
破裂音/、to/について声道断面積とAgoの同時推
定を行った。第4図(a)はハ0/を推定した時のスペ
クトル誤差の時間変化を示し、第4図(b)はその場合
のAgoの値を示している(分析窓長6.4ms。
定を行った。第4図(a)はハ0/を推定した時のスペ
クトル誤差の時間変化を示し、第4図(b)はその場合
のAgoの値を示している(分析窓長6.4ms。
シフト3.2m5)。Agoは子音部(33フレームま
で)で開口(07c1rL2程度)推定されており、誤
差も平均で3.5 dBであった。
で)で開口(07c1rL2程度)推定されており、誤
差も平均で3.5 dBであった。
第5図は/do/の結果である。第5図(a)の点線は
Agoの推定を行った場合(本実施例)、実線は子音部
でA go = 0.05 cIIL2に固定した場合
(従来例)のスペクトル誤差である。Agoを固定した
場合、スペクトル誤差が平均で38dBであったものが
、推定を行った場合には3.4dBと減少している。第
5図(b)は推定されたAgoを表わしており、子音部
でAgo−0,2Crn2程度と推定されている。
Agoの推定を行った場合(本実施例)、実線は子音部
でA go = 0.05 cIIL2に固定した場合
(従来例)のスペクトル誤差である。Agoを固定した
場合、スペクトル誤差が平均で38dBであったものが
、推定を行った場合には3.4dBと減少している。第
5図(b)は推定されたAgoを表わしており、子音部
でAgo−0,2Crn2程度と推定されている。
本実施例のようにAgoの推定を行った/io/。
/do/の正聴率は、/lo/−87,5%、 /do
/=68.8%であシ、Agoを一律に与えた場合(/
lo/=80%、 /do/−57,1%)に比べ向上
している。
/=68.8%であシ、Agoを一律に与えた場合(/
lo/=80%、 /do/−57,1%)に比べ向上
している。
このように、Agoの推定することにより、無声音の制
御パラメータが推定できるとともに、有声音についても
スペクトル誤差の減少2合成音の品質が改善されるとい
う利点がある。
御パラメータが推定できるとともに、有声音についても
スペクトル誤差の減少2合成音の品質が改善されるとい
う利点がある。
発明の効果
本発明は上記のような推定方法であり、以下に示す効果
かあ、る。
かあ、る。
(1)制御パラメータ推定時に、子音部の声門開口断面
積のAgoの推定を行っているため、無声子音を含む音
節の制御パラメータが推定できる。
積のAgoの推定を行っているため、無声子音を含む音
節の制御パラメータが推定できる。
(2) Agoの推定によシ、従来−律にAgoを与え
ていた場合に比べ、明瞭な音節が合成できる。
ていた場合に比べ、明瞭な音節が合成できる。
第1図は、音声合成装置のブロック図、第2図は従来例
の声道断面積/1/を用いAgoを0.01〜20cI
rL2の範囲で変化させた場合の正聴率を表す図、第3
図は本発明の一実施例における自然音声波形/io/と
ケプストラムピークの遷移を表す図、第4図は同実施例
のハ0/の制御パラメータを推定した時のスペクトル誤
差とAg、の推定値を表す図、第5図は同実施例の/d
o/の制御パラメータを推定した時のスペクトル誤差と
Agnの推定値を表す図である。 ■・・声帯等価回路、2・・声道等価回路、3・出力端
子。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 ハgo (ctnり 第3図 フレーム#号 第4図 心 ! フレーム番号 第5図 フレーム一番号
の声道断面積/1/を用いAgoを0.01〜20cI
rL2の範囲で変化させた場合の正聴率を表す図、第3
図は本発明の一実施例における自然音声波形/io/と
ケプストラムピークの遷移を表す図、第4図は同実施例
のハ0/の制御パラメータを推定した時のスペクトル誤
差とAg、の推定値を表す図、第5図は同実施例の/d
o/の制御パラメータを推定した時のスペクトル誤差と
Agnの推定値を表す図である。 ■・・声帯等価回路、2・・声道等価回路、3・出力端
子。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 ハgo (ctnり 第3図 フレーム#号 第4図 心 ! フレーム番号 第5図 フレーム一番号
Claims (2)
- (1)単音節の声道断面積と声門開口断面積を制御する
パラメータを、自然音声とのスペクトルマツチングによ
り同時に推定することを特徴とする音声合成用制御パラ
メータの推定方法。 - (2)声門開口断面積を制御する制御パラメータを、ケ
プヌトラムビークレベルが所定の開鎖になるまでの区間
で推定することを特徴とする特許請求の範囲第1項記載
の音声合成用制御パラメータの推定方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59061484A JPS60203998A (ja) | 1984-03-28 | 1984-03-28 | 音声合成用制御パラメ−タの推定方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59061484A JPS60203998A (ja) | 1984-03-28 | 1984-03-28 | 音声合成用制御パラメ−タの推定方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS60203998A true JPS60203998A (ja) | 1985-10-15 |
Family
ID=13172398
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59061484A Pending JPS60203998A (ja) | 1984-03-28 | 1984-03-28 | 音声合成用制御パラメ−タの推定方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60203998A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02108097A (ja) * | 1988-10-18 | 1990-04-19 | Matsushita Electric Ind Co Ltd | 楽音合成装置 |
-
1984
- 1984-03-28 JP JP59061484A patent/JPS60203998A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02108097A (ja) * | 1988-10-18 | 1990-04-19 | Matsushita Electric Ind Co Ltd | 楽音合成装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH031200A (ja) | 規則型音声合成装置 | |
| Doi et al. | Esophageal speech enhancement based on statistical voice conversion with Gaussian mixture models | |
| US6424937B1 (en) | Fundamental frequency pattern generator, method and program | |
| JPH0632020B2 (ja) | 音声合成方法および装置 | |
| Schwartz et al. | Diphone synthesis for phonetic vocoding | |
| JP2904279B2 (ja) | 音声合成方法および装置 | |
| JPS60203998A (ja) | 音声合成用制御パラメ−タの推定方法 | |
| JP3437064B2 (ja) | 音声合成装置 | |
| JPH08248993A (ja) | 音韻時間長制御方法 | |
| JPS5972494A (ja) | 規則合成方式 | |
| JPH0580791A (ja) | 音声規則合成装置および方法 | |
| JP2001034284A (ja) | 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体 | |
| JPS5888798A (ja) | 音声合成方式 | |
| JPH04115299A (ja) | 音声有音無音判定方法および装置 | |
| JP2900454B2 (ja) | 音声合成装置の音節データ作成方式 | |
| JPS62135897A (ja) | 促音合成方法 | |
| JPS5880699A (ja) | 音声合成方式 | |
| JPS58166400A (ja) | 音声合成方式 | |
| KR930011736B1 (ko) | 음성신호의 피치반분법에 의한 파형코딩과 혼성코딩의 피치 조절방법 | |
| JP2573587B2 (ja) | ピッチパタン生成装置 | |
| JPS6325700A (ja) | 長音結合方法 | |
| JPH01118200A (ja) | 音声合成方式 | |
| JPS6132096A (ja) | 音声合成装置の音声合成方式 | |
| KR940008839B1 (ko) | 켑스트럼 분석에 의한 음성 파형코딩의 피치 변경 방법 | |
| JPS60123900A (ja) | 法則音声合成装置 |