JPH01283600A - 残差駆動型音声合成装置 - Google Patents
残差駆動型音声合成装置Info
- Publication number
- JPH01283600A JPH01283600A JP88113982A JP11398288A JPH01283600A JP H01283600 A JPH01283600 A JP H01283600A JP 88113982 A JP88113982 A JP 88113982A JP 11398288 A JP11398288 A JP 11398288A JP H01283600 A JPH01283600 A JP H01283600A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- waveform
- residual
- frequency spectrum
- interpolation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 21
- 238000003786 synthesis reaction Methods 0.000 title claims description 21
- 238000001228 spectrum Methods 0.000 claims abstract description 20
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 4
- 230000002123 temporal effect Effects 0.000 claims 2
- 230000006866 deterioration Effects 0.000 abstract description 6
- 239000000284 extract Substances 0.000 abstract description 3
- 230000033764 rhythmic process Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、線形予測等のパラメータ分析を行った際の予
測残差を音源として用いる残差駆動型音声合成装置に関
する。
測残差を音源として用いる残差駆動型音声合成装置に関
する。
(従来の技術)
線形予測分析等を行って得られたパラメータを用いた音
声合成における合成音声の品質を向上するための方法と
して、音源にパラメータ分析を行った際の予測誤差であ
る残差を用いる方法がある0例えば、子音区間に対して
は残差をそのまま用い、母音区間では代表的な1ビヅチ
分の残差を用いる方法や、あるいは残差を零位相化した
波形を用いる方法等が知られている。このような従来技
術については、日本音響学会音声研究会資料883−6
5(1984−01) r素片編集型規則合成システム
における素片の選択と補間法」等で詳述されている。
声合成における合成音声の品質を向上するための方法と
して、音源にパラメータ分析を行った際の予測誤差であ
る残差を用いる方法がある0例えば、子音区間に対して
は残差をそのまま用い、母音区間では代表的な1ビヅチ
分の残差を用いる方法や、あるいは残差を零位相化した
波形を用いる方法等が知られている。このような従来技
術については、日本音響学会音声研究会資料883−6
5(1984−01) r素片編集型規則合成システム
における素片の選択と補間法」等で詳述されている。
(発明が解決しようとする課題)
先に述べた従来の方法では、音素あるいは合成の基本単
位となる素片の境界において補間区間を設け、その中で
直線補間等の補間方法により合成に用いる線形予測係数
等のパラメータを補間し、前後の音素あるいは素片が滑
らかに接続されるようにしていた。一方、音源に関して
は補間は行わず、前後それぞれの音素あるいは素片から
抽出された残差を補間区間の途中で切り換えて用いてい
た。
位となる素片の境界において補間区間を設け、その中で
直線補間等の補間方法により合成に用いる線形予測係数
等のパラメータを補間し、前後の音素あるいは素片が滑
らかに接続されるようにしていた。一方、音源に関して
は補間は行わず、前後それぞれの音素あるいは素片から
抽出された残差を補間区間の途中で切り換えて用いてい
た。
しかしながら、実際にはパラメータの変化とともに残差
のスペクトルも徐々に変化しており、このような変化を
考慮せず音素あるいは素片の境界で音源を急変させるこ
とは、合成される音声の品質劣化の原因となる。
のスペクトルも徐々に変化しており、このような変化を
考慮せず音素あるいは素片の境界で音源を急変させるこ
とは、合成される音声の品質劣化の原因となる。
これに対して本発明は、音素あるいは素片の境界部分に
おいて、劣化の少ない滑らかな合成音声を生成すること
が可能な残差駆動型音声合成装置を提供することを目的
としている。
おいて、劣化の少ない滑らかな合成音声を生成すること
が可能な残差駆動型音声合成装置を提供することを目的
としている。
(課題を解決するための手段)
本発明は、線形予測等のパラメータ分析を行った際に得
られる予測残差波形を音源として用いる音声合成装置で
あって、音素ごとに残差波形を記憶しておく手段と、該
記憶手段から読み出した前記残差波形にフーリエ変換等
を施して前記残差波形の周波数スペクトルを求める手段
と、音素境界において前記残差波形の周波数スペクトル
を各周波数成分ごとに補間する手段と、該補間手段にお
いて前記補間を施して得た残差波形の周波数スペクトル
を逆フーリエ変換等によって時間波形に変換する手段と
、前記時間波形を音源として音声を1合成する手段とを
有することを特徴とする。
られる予測残差波形を音源として用いる音声合成装置で
あって、音素ごとに残差波形を記憶しておく手段と、該
記憶手段から読み出した前記残差波形にフーリエ変換等
を施して前記残差波形の周波数スペクトルを求める手段
と、音素境界において前記残差波形の周波数スペクトル
を各周波数成分ごとに補間する手段と、該補間手段にお
いて前記補間を施して得た残差波形の周波数スペクトル
を逆フーリエ変換等によって時間波形に変換する手段と
、前記時間波形を音源として音声を1合成する手段とを
有することを特徴とする。
(作用)
本発明においては、まず、音素あるいは素片の境界前後
の残差の周波数スペクトルをフーリエ変換等によってそ
れぞれ求める。音素あるいは素片の境界において前後の
周波数スペクトルが連続的に変化するよう、フーリエ変
換後の各周波数成分ごとに直線補間等の補間方法によっ
て補間部分に用いる音源の周波数スペクトルを生成する
0次に、補間によって得られた周波数スペクトルを逆フ
ーリエ変換等によって時間領域に変換し、得られた時間
波形を駆動音源として用いる。
の残差の周波数スペクトルをフーリエ変換等によってそ
れぞれ求める。音素あるいは素片の境界において前後の
周波数スペクトルが連続的に変化するよう、フーリエ変
換後の各周波数成分ごとに直線補間等の補間方法によっ
て補間部分に用いる音源の周波数スペクトルを生成する
0次に、補間によって得られた周波数スペクトルを逆フ
ーリエ変換等によって時間領域に変換し、得られた時間
波形を駆動音源として用いる。
このようにして、音素の境界においてパラメータだけで
なく音源となる残差も補間によってその周波数スペクト
ルを連続的に変化させることによって、音素あるいは素
片の接続区間においても劣化の少ない合成音声を得るこ
とが可能となる。
なく音源となる残差も補間によってその周波数スペクト
ルを連続的に変化させることによって、音素あるいは素
片の接続区間においても劣化の少ない合成音声を得るこ
とが可能となる。
(実施例)
第1図は本発明を実現した残差駆動型音声合成装置の一
実施例を示すブロック図である。
実施例を示すブロック図である。
まず、音素情報入力端子101から、合成されるべき音
声の音素情報が入力され、残差記憶部104及びパラメ
ータ記憶部108に送られる。音素あるいは素片境界に
おける補間区間の長さなどは、補間情報入力端子102
を通して残差補間部106及びパラメータ補間部109
に入力される。また、韻律情報入力端子103からは、
音素の継続時間長、音源振幅、ピッチバタン等の韻律制
御情報が入力され、合成フィルタ部110に送られる。
声の音素情報が入力され、残差記憶部104及びパラメ
ータ記憶部108に送られる。音素あるいは素片境界に
おける補間区間の長さなどは、補間情報入力端子102
を通して残差補間部106及びパラメータ補間部109
に入力される。また、韻律情報入力端子103からは、
音素の継続時間長、音源振幅、ピッチバタン等の韻律制
御情報が入力され、合成フィルタ部110に送られる。
残差記憶部104は、前記入力された音素情報に応じて
各音素で音源として用いる残差波形を取り出し、フーリ
エ変換部105及び合成フィルタ部110に送る。フー
リエ変換部105は、前記残差波形をフーリエ変換によ
って周波数スペクトルに変換し、残差補間部106に送
る。
各音素で音源として用いる残差波形を取り出し、フーリ
エ変換部105及び合成フィルタ部110に送る。フー
リエ変換部105は、前記残差波形をフーリエ変換によ
って周波数スペクトルに変換し、残差補間部106に送
る。
残差補間部106は、前記残差の周波数スペクトルを用
い、音素あるいは素片の接続部において用いる音源の周
波数スペクトルを、補間情報人力l;1子102から入
力された補間情報に応じて生成し、逆フーリエ変換部1
07に送る。逆フーリエ変換部107は、補間によって
生成された前記周波数スペクトルを逆フーリエ変換によ
って時間領域の波形に変換し、合成フィルタ部110に
送る。
い、音素あるいは素片の接続部において用いる音源の周
波数スペクトルを、補間情報人力l;1子102から入
力された補間情報に応じて生成し、逆フーリエ変換部1
07に送る。逆フーリエ変換部107は、補間によって
生成された前記周波数スペクトルを逆フーリエ変換によ
って時間領域の波形に変換し、合成フィルタ部110に
送る。
一方、パラメータ記憶部108は、前記入力された音素
情報に応じて各音素の合成パラメータを取り出し、パラ
メータ補間部109及び音声合成フィルタ部110に送
る。パラメータ補間部109は、パラメータ記憶部10
8から送られてくるパラメータを用い、音素あるいは素
片の接続部において用いるパラメータを、補間情報入力
端子102から入力された補間情報に応じて生成し、合
成フィルタ部110に送る。
情報に応じて各音素の合成パラメータを取り出し、パラ
メータ補間部109及び音声合成フィルタ部110に送
る。パラメータ補間部109は、パラメータ記憶部10
8から送られてくるパラメータを用い、音素あるいは素
片の接続部において用いるパラメータを、補間情報入力
端子102から入力された補間情報に応じて生成し、合
成フィルタ部110に送る。
合成フィルタ部110は、前記韻律Vt報、パラメータ
、及び残差を用いて音声波形を合成し、音声出力端子1
11から出力する。
、及び残差を用いて音声波形を合成し、音声出力端子1
11から出力する。
(発明の効果)
以上に述べてきたように、本発明によれば、音素の境界
部分においても劣化の少ない合成音声を生成することが
可能であり、品質の高い音声を合成できる残差駆動型音
声合成装置を実現するのに有効である。
部分においても劣化の少ない合成音声を生成することが
可能であり、品質の高い音声を合成できる残差駆動型音
声合成装置を実現するのに有効である。
第1図は本発明による残差駆動型音声合成装置の一実施
例を示すブロック図である。 図において、101は音素情報入力端子、102は補間
情報入力端子、103は韻律情報入力端子、104は残
差記憶部、105はフーリエ変換部、106は残差補間
部、107は逆フーリエ変換部、108はパラメータ記
憶部、109はパラメータ補間部、110は合成フィル
タ部、111は音声出力端子である。
例を示すブロック図である。 図において、101は音素情報入力端子、102は補間
情報入力端子、103は韻律情報入力端子、104は残
差記憶部、105はフーリエ変換部、106は残差補間
部、107は逆フーリエ変換部、108はパラメータ記
憶部、109はパラメータ補間部、110は合成フィル
タ部、111は音声出力端子である。
Claims (1)
- 線形予測等のパラメータ分析を行った際に得られる予測
残差波形を音源として用いる音声合成装置において、音
素ごとに残差波形を記憶しておく手段と、該記憶手段か
ら読み出した前記残差波形にフーリエ変換等を施して前
記残差波形の周波数スペクトルを求める手段と、音素境
界において前記残差波形の周波数スペクトルを各周波数
成分ごとに補間する手段と、該補間手段において補間を
施して得た残差波形の周波数スペクトルを逆フーリエ変
換等によって時間波形に変換する手段と、前記時間波形
を音源として音声を合成する手段とを有することを特徴
とする残差駆動型音声合成装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP88113982A JPH01283600A (ja) | 1988-05-10 | 1988-05-10 | 残差駆動型音声合成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP88113982A JPH01283600A (ja) | 1988-05-10 | 1988-05-10 | 残差駆動型音声合成装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01283600A true JPH01283600A (ja) | 1989-11-15 |
Family
ID=14626092
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP88113982A Pending JPH01283600A (ja) | 1988-05-10 | 1988-05-10 | 残差駆動型音声合成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01283600A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100429978B1 (ko) * | 1996-12-26 | 2004-07-27 | 엘지전자 주식회사 | 음성합성시스템의음질저하방지장치 |
-
1988
- 1988-05-10 JP JP88113982A patent/JPH01283600A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100429978B1 (ko) * | 1996-12-26 | 2004-07-27 | 엘지전자 주식회사 | 음성합성시스템의음질저하방지장치 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2782147B2 (ja) | 波形編集型音声合成装置 | |
| Slaney et al. | Automatic audio morphing | |
| JP3328080B2 (ja) | コード励振線形予測復号器 | |
| US20020049594A1 (en) | Speech synthesis | |
| JPH086592A (ja) | 音声合成方法及び装置 | |
| US6950798B1 (en) | Employing speech models in concatenative speech synthesis | |
| Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
| JPH08254993A (ja) | 音声合成装置 | |
| JP3278863B2 (ja) | 音声合成装置 | |
| JPH01283600A (ja) | 残差駆動型音声合成装置 | |
| JPH07261798A (ja) | 音声分析合成装置 | |
| JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
| JPH01224800A (ja) | 残差駆動型音声合成装置 | |
| JP2709198B2 (ja) | 音声合成方法 | |
| JPH0462600B2 (ja) | ||
| JP2956936B2 (ja) | 音声合成装置の発声速度制御回路 | |
| JPS5925239B2 (ja) | パラメ−タ補間方式 | |
| JP3284634B2 (ja) | 規則音声合成装置 | |
| JPS5880699A (ja) | 音声合成方式 | |
| JPH08160991A (ja) | 音声素片作成方法および音声合成方法、装置 | |
| JPS58168097A (ja) | 音声合成装置 | |
| JP2614436B2 (ja) | 音声合成装置 | |
| JP2580123B2 (ja) | 音声合成装置 | |
| JPH09258796A (ja) | 音声合成方法 | |
| JPH05257494A (ja) | 音声規則合成方式 |