JPH01197799A - 音声合成装置の調音・音源パラメータ生成方法 - Google Patents
音声合成装置の調音・音源パラメータ生成方法Info
- Publication number
- JPH01197799A JPH01197799A JP63022487A JP2248788A JPH01197799A JP H01197799 A JPH01197799 A JP H01197799A JP 63022487 A JP63022487 A JP 63022487A JP 2248788 A JP2248788 A JP 2248788A JP H01197799 A JPH01197799 A JP H01197799A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- parameter
- waveform
- section
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 11
- 230000001755 vocal effect Effects 0.000 claims description 30
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 238000001308 synthesis method Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 abstract description 19
- 230000004044 response Effects 0.000 abstract description 8
- 238000005070 sampling Methods 0.000 abstract description 6
- 238000004458 analytical method Methods 0.000 description 14
- 230000003595 spectral effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 230000005855 radiation Effects 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
A、産業上の利用分野
本発明は、規則合成方式による音声合成装置に係り、特
に調音パラメータと音源パラメータの生成方法に関する
。
に調音パラメータと音源パラメータの生成方法に関する
。
B1発明の概要
本発明は、音節又は音素に対応づけた調音パラメータ及
び音源パラメータを生成するにおいて、任意設定した調
音パラメータを持つディジタルフィルタの出力側から実
音声データを与えたときの該フィルタの入力側応答デー
タから音源パラメータを求め、このときの調音パラメー
タとの組合せで当該音節又は音素の合成でのパラメータ
とすることにより、 ディジタルフィルタの簡単化及び音源パラメータ生成の
簡単化を図りながら音声品質を向上できるようにしたも
のである。
び音源パラメータを生成するにおいて、任意設定した調
音パラメータを持つディジタルフィルタの出力側から実
音声データを与えたときの該フィルタの入力側応答デー
タから音源パラメータを求め、このときの調音パラメー
タとの組合せで当該音節又は音素の合成でのパラメータ
とすることにより、 ディジタルフィルタの簡単化及び音源パラメータ生成の
簡単化を図りながら音声品質を向上できるようにしたも
のである。
C0従来の技術
規則合成方式による音声合成装置は、例えば第3図に示
す構成にされる。文章解析部lは日本語入力テキストの
文字列に対して辞書1aと文章解析装置、tbによる文
章解析を行う。辞書1aには単語の読みがな変換のため
の辞書のほかに単語の文節区切1句区切等のための日本
語文法辞書を有し、さらには単語のアクセントや基本イ
ントネーションの規則辞書を有する。文章解析装置!b
は辞書1aを参照して入力テキストを音素あるいは音節
の音韻記号列に変換すると共に、単語アクセントや基本
イントネーション等の韻律情報を発生する。
す構成にされる。文章解析部lは日本語入力テキストの
文字列に対して辞書1aと文章解析装置、tbによる文
章解析を行う。辞書1aには単語の読みがな変換のため
の辞書のほかに単語の文節区切1句区切等のための日本
語文法辞書を有し、さらには単語のアクセントや基本イ
ントネーションの規則辞書を有する。文章解析装置!b
は辞書1aを参照して入力テキストを音素あるいは音節
の音韻記号列に変換すると共に、単語アクセントや基本
イントネーション等の韻律情報を発生する。
音声合成規則部2は、ファイル2aとパラメータ生成装
置2bによって構成される。ファイル2aは音韻単位の
特徴パラメータとそれらの接続規則及び韻律情報の制御
規則を蓄積しておく。パラメータ生成装置2bは音韻情
報に対する特徴パラメータをその持続時間等の情報と共
に連結した制御パラメータ列を生成すると共に、韻律情
報による音源のピッチ、エネルギー、イントネーション
処理を施した音源パターン列を生成する。
置2bによって構成される。ファイル2aは音韻単位の
特徴パラメータとそれらの接続規則及び韻律情報の制御
規則を蓄積しておく。パラメータ生成装置2bは音韻情
報に対する特徴パラメータをその持続時間等の情報と共
に連結した制御パラメータ列を生成すると共に、韻律情
報による音源のピッチ、エネルギー、イントネーション
処理を施した音源パターン列を生成する。
音声生成部3は、音源生成装置3aと音声合成ディジタ
ルフィルタ3bと音声変換器3cとによって構成される
。音源生成装置3aは、音源パターン列に従ったピッチ
、エネルギー等の音源信号を発生する。ディジタルフィ
ルタ3bは制御パラメータ列に従ってパーコール係数や
伝達関数又はフォルマント周波数のパラメータが変えら
れ、このパラメータでの音源信号に対する応答出力に合
成音声データ列を得る。音声変換器3cはフィルタ3b
の出力をアナログ信号に変換して音声波形を得、スピー
カ等の電気−音変換手段による合成音声を出力する。
ルフィルタ3bと音声変換器3cとによって構成される
。音源生成装置3aは、音源パターン列に従ったピッチ
、エネルギー等の音源信号を発生する。ディジタルフィ
ルタ3bは制御パラメータ列に従ってパーコール係数や
伝達関数又はフォルマント周波数のパラメータが変えら
れ、このパラメータでの音源信号に対する応答出力に合
成音声データ列を得る。音声変換器3cはフィルタ3b
の出力をアナログ信号に変換して音声波形を得、スピー
カ等の電気−音変換手段による合成音声を出力する。
上述のような音声合成装置において、音声波形の生成に
は音源の生成と声道形による調音に分離し、音源及び調
音が電気的等価回路にモデル化される。例えば、音源に
は2質量モデルによる声帯振動モデルを求め、調音には
声道断面積モデルや調音器官の構造とその運動上の特性
を直接的に求める調音モデルが求められる。こうしたモ
デル化による音声の特徴パラメータが求められるが、音
声の特徴パラメータを求めるのに音声波形を直接扱う代
わりに音声スペクトルによる分析から求められる。例え
ば、音声の短時間スペクトルは周波数と共にゆるやかに
変化するスペクトル包絡と、細かく周期的(有声音)又
は非周期的(無声音)に変化するスペクトル微細構造に
分解される。スペクトル包絡は発声器官の共振・反共振
特性等の大局的なものに相当し、スペクトル微細構造は
音源の周期性に相当する。そして、スペクトル包絡の抽
出には、自己相関関数分析やケプストラム分析によるノ
ンパラメトリック分析法か、又はABSや線形予測分析
(パーコール分析、LSP分析等)によるパラメトリッ
ク分析法が使用される。
は音源の生成と声道形による調音に分離し、音源及び調
音が電気的等価回路にモデル化される。例えば、音源に
は2質量モデルによる声帯振動モデルを求め、調音には
声道断面積モデルや調音器官の構造とその運動上の特性
を直接的に求める調音モデルが求められる。こうしたモ
デル化による音声の特徴パラメータが求められるが、音
声の特徴パラメータを求めるのに音声波形を直接扱う代
わりに音声スペクトルによる分析から求められる。例え
ば、音声の短時間スペクトルは周波数と共にゆるやかに
変化するスペクトル包絡と、細かく周期的(有声音)又
は非周期的(無声音)に変化するスペクトル微細構造に
分解される。スペクトル包絡は発声器官の共振・反共振
特性等の大局的なものに相当し、スペクトル微細構造は
音源の周期性に相当する。そして、スペクトル包絡の抽
出には、自己相関関数分析やケプストラム分析によるノ
ンパラメトリック分析法か、又はABSや線形予測分析
(パーコール分析、LSP分析等)によるパラメトリッ
ク分析法が使用される。
また、スペクトル微細構造のうち、音源の基本周波数(
ピッチ)の抽出には相関処理やスペクトル処理方法が使
用される。
ピッチ)の抽出には相関処理やスペクトル処理方法が使
用される。
また、調音の特徴パラメータを求めるのに、声道をその
断面積変化を多数の一次元音響管の縦続接続と見なして
各音響管での前向き進行波と後向き進行波の線形結合で
表して面積比と反射係数で記述するモデル化や共振周波
数(フォルマント周波数)と振幅スペクトル特性で記述
するモデル化が行われる。さらには調音器官の構造とそ
の運動上の特性を直接的に表したモデル化が行われる。
断面積変化を多数の一次元音響管の縦続接続と見なして
各音響管での前向き進行波と後向き進行波の線形結合で
表して面積比と反射係数で記述するモデル化や共振周波
数(フォルマント周波数)と振幅スペクトル特性で記述
するモデル化が行われる。さらには調音器官の構造とそ
の運動上の特性を直接的に表したモデル化が行われる。
D1発明が解決しようとする課題
従来、音声の特徴パラメータを求める種々の方法は、線
形予測分析法に代表されるように、音声波形やスペクト
ルの性質を少数のパラメータで能率的かつ正確に求めよ
うとするしのであるが、実際に出力される合成音には実
音声に較べて明瞭性。
形予測分析法に代表されるように、音声波形やスペクト
ルの性質を少数のパラメータで能率的かつ正確に求めよ
うとするしのであるが、実際に出力される合成音には実
音声に較べて明瞭性。
自然性に著しく劣るものになる。これは、例えばABS
法や線形予測分析法では信号の生成モデルにより生成さ
れた値と観測値との誤差(予測残差)が最小となるよう
なパラメータをフィードバック制御により求めるもので
あるが、仮定する生成モデルと複雑に変化する声帯振動
や声道形との差が大きく、完全な分析1合成になし得な
いことに因る。
法や線形予測分析法では信号の生成モデルにより生成さ
れた値と観測値との誤差(予測残差)が最小となるよう
なパラメータをフィードバック制御により求めるもので
あるが、仮定する生成モデルと複雑に変化する声帯振動
や声道形との差が大きく、完全な分析1合成になし得な
いことに因る。
また、従来ではパラメータを求めるのに何回ものフィー
ドバック制御を必要とし、情報処理量が非常に多くなる
問題があった。この問題において、モデル化を細密にす
るほど著しく情報処理量を多くするし、必要な記憶容量
を増大させる。
ドバック制御を必要とし、情報処理量が非常に多くなる
問題があった。この問題において、モデル化を細密にす
るほど著しく情報処理量を多くするし、必要な記憶容量
を増大させる。
本発明の目的は、情報処理量を少なくしながら実音声に
近づけた調音パラメータ及び音源パラメータを得ること
ができる調音・音源パラメータ生成方法を提供するにあ
る。
近づけた調音パラメータ及び音源パラメータを得ること
ができる調音・音源パラメータ生成方法を提供するにあ
る。
60課題を解決するための手段
本発明は上記目的を達成するため、音声波形の生成に音
源の生成と声道断面積による調音に分離し、音源パラメ
ータにより音源波形を生成し、調音パラメータによる声
道断面積のディジタルフィルタに音源波形を与えて該フ
ィルタの出力に音声信号を得る規則合成方式の音声合成
装置において、音節又は音素に対応づけて任意に設定し
た調音パラメータにより前記ディジタルフィルタの声道
断面積係数を固定させ、該フィルタの出力側に実音節又
は実音素波形を与えたときの該フィルタの入力側に表れ
る信号波形から音源パラメータを求め、該音源パラメー
タ及び前記調音パラメータを対応する音節又は音素のパ
ラメータとすることを特徴とする。
源の生成と声道断面積による調音に分離し、音源パラメ
ータにより音源波形を生成し、調音パラメータによる声
道断面積のディジタルフィルタに音源波形を与えて該フ
ィルタの出力に音声信号を得る規則合成方式の音声合成
装置において、音節又は音素に対応づけて任意に設定し
た調音パラメータにより前記ディジタルフィルタの声道
断面積係数を固定させ、該フィルタの出力側に実音節又
は実音素波形を与えたときの該フィルタの入力側に表れ
る信号波形から音源パラメータを求め、該音源パラメー
タ及び前記調音パラメータを対応する音節又は音素のパ
ラメータとすることを特徴とする。
F1作用
ディジタルフィルタとして声道断面積関数を採用すると
きにはその入力に対する応答出力を求めるのとは逆に、
出力側の波形から人力波形を求めることができる。これ
を以下に詳細に説明する。
きにはその入力に対する応答出力を求めるのとは逆に、
出力側の波形から人力波形を求めることができる。これ
を以下に詳細に説明する。
声道による調音は、音源波形に対して断面積の異なる複
数個の音響管を縦続接続した一次元音響管での進行波と
反射波による振動現象として見なすことができる。そし
て、音響管は声道の長さ、太さと音波長との関係から分
布定数系として取り扱うのが適切となり、また音源の伝
搬損失は無視できる。
数個の音響管を縦続接続した一次元音響管での進行波と
反射波による振動現象として見なすことができる。そし
て、音響管は声道の長さ、太さと音波長との関係から分
布定数系として取り扱うのが適切となり、また音源の伝
搬損失は無視できる。
上述のことから、声道を断面積A、〜Anを持つn個の
一次元音響管を縦続接続した第2図(ア)の等価モデル
で表し、各音響管S、−SnをLC成分のみの無損失分
布定数線路T、〜Tnと見なすと同図(イ)の電気回路
に変換され、この電気回路に音源に代えたインパルス性
の電圧又は電流信号を印加したときの出力波形が音声波
形に相当する応答出力と見なすことができる。そして、
声道の調音状態を変えるには各線路T、〜T、、の定数
り。
一次元音響管を縦続接続した第2図(ア)の等価モデル
で表し、各音響管S、−SnをLC成分のみの無損失分
布定数線路T、〜Tnと見なすと同図(イ)の電気回路
に変換され、この電気回路に音源に代えたインパルス性
の電圧又は電流信号を印加したときの出力波形が音声波
形に相当する応答出力と見なすことができる。そして、
声道の調音状態を変えるには各線路T、〜T、、の定数
り。
C全変えることによるサージインピーダンスの変更にな
る。
る。
同図(イ)の等価回路において、音源に代えたインパル
ス性の電流を印加したとき、各線路T。
ス性の電流を印加したとき、各線路T。
〜Trlは夫々サージインピーダンスZ1〜Z、を内部
抵抗とする電流源を持ち、各線路T I””’ T−の
接続点で反射と透過を伴う等価回路に変換される。
抵抗とする電流源を持ち、各線路T I””’ T−の
接続点で反射と透過を伴う等価回路に変換される。
この等価回路は同図(つ)に示すようになる。同図にお
いて、Eは音源に相当する電圧源電圧、Z。
いて、Eは音源に相当する電圧源電圧、Z。
はその出力インピーダンス、ZLは口唇からの放射イン
ピーダンス、i OA−i (1%−11A は線路
T。
ピーダンス、i OA−i (1%−11A は線路
T。
〜Tnの各接続点の前進波電流、foe〜Ln−++a
は各接続点の後進波電流、Z I〜Znは夫々断面積A
t〜Anと空気密度ρと音速CからρC/Al〜ρC/
Anになるサージインピーダンス、IOA〜1111−
+1A 及びI IB−1nBは線路T、−Tnの接
続点に現れる電流源電流&。6〜a (n−+lA及び
ale〜ansは電流源の分流電流である。
は各接続点の後進波電流、Z I〜Znは夫々断面積A
t〜Anと空気密度ρと音速CからρC/Al〜ρC/
Anになるサージインピーダンス、IOA〜1111−
+1A 及びI IB−1nBは線路T、−Tnの接
続点に現れる電流源電流&。6〜a (n−+lA及び
ale〜ansは電流源の分流電流である。
これら各電流には第2図(1)に示す関係にある。同式
中、S +a= A +/ (A ++ A t)、S
1A=At/(A++At)〜S +n−+1B=A
(n−117(A+n−t++A11)、S +1l
−119= A n/ A (n−11+A nを示す
。
中、S +a= A +/ (A ++ A t)、S
1A=At/(A++At)〜S +n−+1B=A
(n−117(A+n−t++A11)、S +1l
−119= A n/ A (n−11+A nを示す
。
また、メモリ項目は現在値のlステップ前の演算結果を
格納する項目を示す。こうした関係式の演算はメモリ項
目に初期値0を与え、電圧Eを与えたときの各メモリ項
目について、線路T、〜T7まで基本周期で順次演算し
、最終段の電流1neを基本周期で求め、この電流la
gに調音音声出力デー□りを得ることができる。
格納する項目を示す。こうした関係式の演算はメモリ項
目に初期値0を与え、電圧Eを与えたときの各メモリ項
目について、線路T、〜T7まで基本周期で順次演算し
、最終段の電流1neを基本周期で求め、この電流la
gに調音音声出力デー□りを得ることができる。
ここで、第2図(つ)の等価回路は線形回路になって重
ねの理が成立し、電圧Eを零として放射インピーダンス
ZLに直列に電圧E+、を印加したときの各部電流を求
めること、即ち、インピーダンスE。の電流を求めるこ
とができる。そこで、本発明はディジタルフィルタの声
道断面積係数を音節又は音素に対応づけて任意に設定し
ておき、ディジタルフィルタの出力側に実音節又は実音
素を与えたときの入力側に表れる信号波形を求め、この
信号波形の分析によって当該音節又は音素の音源パラメ
ータを求め、併せて声道断面積係数を調音パラメータと
して求める。
ねの理が成立し、電圧Eを零として放射インピーダンス
ZLに直列に電圧E+、を印加したときの各部電流を求
めること、即ち、インピーダンスE。の電流を求めるこ
とができる。そこで、本発明はディジタルフィルタの声
道断面積係数を音節又は音素に対応づけて任意に設定し
ておき、ディジタルフィルタの出力側に実音節又は実音
素を与えたときの入力側に表れる信号波形を求め、この
信号波形の分析によって当該音節又は音素の音源パラメ
ータを求め、併せて声道断面積係数を調音パラメータと
して求める。
このようにして求めた音源パラメータ及び調音パラメー
タは、ディジタルフィルタと人の発声器官との誤差及び
音源波形と声帯振動との誤差をそのままにして出力音声
波形を実音声に近づけることができる。そして、音源パ
ラメータ及び調音パラメータを求めるのに、従来のフィ
ードバック方式と異なり一回の実音声に対する応答を求
めるのみで済み、情報処理型を少なくする。また、調音
パラメータは声道のモデル化を細密にすることを不要に
し、音節又は音素パラメータとして必要な情報量を低減
、即ち情報圧縮とディジタルフィルタの演算速度向上も
しくは演算量低減を可能にする。
タは、ディジタルフィルタと人の発声器官との誤差及び
音源波形と声帯振動との誤差をそのままにして出力音声
波形を実音声に近づけることができる。そして、音源パ
ラメータ及び調音パラメータを求めるのに、従来のフィ
ードバック方式と異なり一回の実音声に対する応答を求
めるのみで済み、情報処理型を少なくする。また、調音
パラメータは声道のモデル化を細密にすることを不要に
し、音節又は音素パラメータとして必要な情報量を低減
、即ち情報圧縮とディジタルフィルタの演算速度向上も
しくは演算量低減を可能にする。
G、実施例
第1図は本発明の一実施例を示すブロック図である。音
声登録部11にはアナウンサー等が発声した音節又は音
素単位の実音声波形をサンプリングデータとして登録し
ておく。音声続出部12は音声登録部11から指定され
る音節又は音素のサンプリングデータを読出し、このデ
ータに比例する電圧波形を増幅出力する。ディジタルフ
ィルタ演算部13は、音声続出部12からの電圧波形を
出力側の入力とし、該電圧波形に対応する音節又は音素
の声道断面積係数が設定され、この声道断面積係数での
入力側の応答出力(音源データ)を演算で求める。パラ
メータ演算部14はディジタルフィルタ演算部13から
の音源データを分析して音源パラメータを求め、この音
源パラメータをパラメータ登録部15に登録する。この
登録において、ディジタルフィルタ演算部13に設定し
た声道断面積係数も併せて登録する。コントロール部1
6はキーボード等の入力装置17からの指令によって各
部を制御し、制御状態を表示装置18に表示する。
声登録部11にはアナウンサー等が発声した音節又は音
素単位の実音声波形をサンプリングデータとして登録し
ておく。音声続出部12は音声登録部11から指定され
る音節又は音素のサンプリングデータを読出し、このデ
ータに比例する電圧波形を増幅出力する。ディジタルフ
ィルタ演算部13は、音声続出部12からの電圧波形を
出力側の入力とし、該電圧波形に対応する音節又は音素
の声道断面積係数が設定され、この声道断面積係数での
入力側の応答出力(音源データ)を演算で求める。パラ
メータ演算部14はディジタルフィルタ演算部13から
の音源データを分析して音源パラメータを求め、この音
源パラメータをパラメータ登録部15に登録する。この
登録において、ディジタルフィルタ演算部13に設定し
た声道断面積係数も併せて登録する。コントロール部1
6はキーボード等の入力装置17からの指令によって各
部を制御し、制御状態を表示装置18に表示する。
上述の構成における調音・音源パラメータの生成処理を
以下に詳細に説明する。
以下に詳細に説明する。
登録すべき音源(音節又は音素)が指令されると、コン
トロール部16は音声読出部12に該音源を指定すると
共に、ディジタルフィルタ演算部13に当該音源に対応
する断面積係数データを設定及びパラメータ登録部15
への登録を行う。音源指定された音声続出部12は該音
源のサンプリングデータを音声登録部11から読出し、
このデータをディジタルフィルタ演算部13の出力側に
順次与える。ディジタルフィルタ演算部13は、第2図
(つ)に示す等価回路と設定断面積係数から定める演算
式(同図工の関係式)による演算を行い、放射インピー
ダンスZLに直列の電圧源として音声続出部12からの
サンプリングデータを与え、出力インピーダンスZ。の
電圧値のデータ列を応答出力として求める。このとき求
められるデータ列は設定される断面積係数において入力
音声波形に対する音源波形のサンプリングデータになる
。このデータに対して、パラメータ演算部14ではスペ
クトル包絡やスペクトル微細構造等への分析によって音
源パラメータを求め、この音源パラメータをパラメータ
登録部15に登録する。
トロール部16は音声読出部12に該音源を指定すると
共に、ディジタルフィルタ演算部13に当該音源に対応
する断面積係数データを設定及びパラメータ登録部15
への登録を行う。音源指定された音声続出部12は該音
源のサンプリングデータを音声登録部11から読出し、
このデータをディジタルフィルタ演算部13の出力側に
順次与える。ディジタルフィルタ演算部13は、第2図
(つ)に示す等価回路と設定断面積係数から定める演算
式(同図工の関係式)による演算を行い、放射インピー
ダンスZLに直列の電圧源として音声続出部12からの
サンプリングデータを与え、出力インピーダンスZ。の
電圧値のデータ列を応答出力として求める。このとき求
められるデータ列は設定される断面積係数において入力
音声波形に対する音源波形のサンプリングデータになる
。このデータに対して、パラメータ演算部14ではスペ
クトル包絡やスペクトル微細構造等への分析によって音
源パラメータを求め、この音源パラメータをパラメータ
登録部15に登録する。
H,発明の効果
本発明の調音・音源パラメータ生成方法によれば、求め
ようとする音節又は音素の音源パラメータについて、声
道断面積関数の設定による1回の演算によって音源波形
を求めることができ、従来のフィードバック方式による
繰り返し演算に較べて情報処理量及び処理時間を短縮す
る。また、声道断面積関数及び声道等価回路と実際の人
の声道構造との間に誤差が存在するも、該誤差分は求め
る音源波形にも含まれており、実際の音声合成時に音源
波形に含まれる該誤差分はディジタルフィルタの声道断
面積関数等の誤差分と相殺され、音声合成時には求めた
音源波形と音源パラメータの間の誤差分のみになる。こ
のことは、合成音声を実音声に近づける効果のほか、声
道断面積係数の単純化(例えば縦続接続音響管の個数低
減)や各音響管で複雑に変化する断面積変化の単純化に
よる演算処理の簡単化、処理速度の向上効果を得ること
ができる。
ようとする音節又は音素の音源パラメータについて、声
道断面積関数の設定による1回の演算によって音源波形
を求めることができ、従来のフィードバック方式による
繰り返し演算に較べて情報処理量及び処理時間を短縮す
る。また、声道断面積関数及び声道等価回路と実際の人
の声道構造との間に誤差が存在するも、該誤差分は求め
る音源波形にも含まれており、実際の音声合成時に音源
波形に含まれる該誤差分はディジタルフィルタの声道断
面積関数等の誤差分と相殺され、音声合成時には求めた
音源波形と音源パラメータの間の誤差分のみになる。こ
のことは、合成音声を実音声に近づける効果のほか、声
道断面積係数の単純化(例えば縦続接続音響管の個数低
減)や各音響管で複雑に変化する断面積変化の単純化に
よる演算処理の簡単化、処理速度の向上効果を得ること
ができる。
第1図は本発明の一実施例を示すブロック図、第2図は
本発明を原理的に説明するための音響管の等価モデルと
演算態様図、第3図は規則合成方式の音声合成装置のブ
ロック図である。 11・・・音声登録部、12・・・音声読出部、13・
・・ディジタルフィルタ演算部、14・・・パラメータ
演算部、!5・・・パラメータ登録部、16・・・コン
トロール部、17・・・入力装置、18・・・表示装置
。 11間+1−197799 (7)
本発明を原理的に説明するための音響管の等価モデルと
演算態様図、第3図は規則合成方式の音声合成装置のブ
ロック図である。 11・・・音声登録部、12・・・音声読出部、13・
・・ディジタルフィルタ演算部、14・・・パラメータ
演算部、!5・・・パラメータ登録部、16・・・コン
トロール部、17・・・入力装置、18・・・表示装置
。 11間+1−197799 (7)
Claims (1)
- (1)音声波形の生成に音源の生成と声道断面積による
調音に分離し、音源パラメータにより音源波形を生成し
、調音パラメータによる声道断面積のディジタルフィル
タに音源波形を与えて該フィルタの出力に音声信号を得
る規則合成方式の音声合成装置において、音節又は音素
に対応づけて任意に設定した調音パラメータにより前記
ディジタルフィルタの声道断面積係数を固定させ、該フ
ィルタの出力側に実音節又は実音素波形を与えたときの
該フィルタの入力側に表れる信号波形から音源パラメー
タを求め、該音源パラメータ及び前記調音パラメータを
対応する音節又は音素のパラメータとすることを特徴と
する音声合成装置の調音・音源パラメータ生成方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63022487A JPH01197799A (ja) | 1988-02-02 | 1988-02-02 | 音声合成装置の調音・音源パラメータ生成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63022487A JPH01197799A (ja) | 1988-02-02 | 1988-02-02 | 音声合成装置の調音・音源パラメータ生成方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01197799A true JPH01197799A (ja) | 1989-08-09 |
Family
ID=12084086
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63022487A Pending JPH01197799A (ja) | 1988-02-02 | 1988-02-02 | 音声合成装置の調音・音源パラメータ生成方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01197799A (ja) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58162999A (ja) * | 1982-03-23 | 1983-09-27 | 松下電器産業株式会社 | 音声合成用駆動波抽出方法 |
| JPS62150398A (ja) * | 1985-12-25 | 1987-07-04 | 日本電気株式会社 | 音声規則合成装置 |
-
1988
- 1988-02-02 JP JP63022487A patent/JPH01197799A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58162999A (ja) * | 1982-03-23 | 1983-09-27 | 松下電器産業株式会社 | 音声合成用駆動波抽出方法 |
| JPS62150398A (ja) * | 1985-12-25 | 1987-07-04 | 日本電気株式会社 | 音声規則合成装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5729694A (en) | Speech coding, reconstruction and recognition using acoustics and electromagnetic waves | |
| JPH031200A (ja) | 規則型音声合成装置 | |
| JPH0677200B2 (ja) | デジタル化テキストの音声合成用デジタルプロセッサ | |
| JPH0632020B2 (ja) | 音声合成方法および装置 | |
| JPH0772900A (ja) | 音声合成の感情付与方法 | |
| JPH0641557A (ja) | 音声合成のための方法および装置 | |
| JP2904279B2 (ja) | 音声合成方法および装置 | |
| US6829577B1 (en) | Generating non-stationary additive noise for addition to synthesized speech | |
| Peterson et al. | Objectives and techniques of speech synthesis | |
| Sondhi | Articulatory modeling: a possible role in concatenative text-to-speech synthesis | |
| JPH01197799A (ja) | 音声合成装置の調音・音源パラメータ生成方法 | |
| JPH02106799A (ja) | 合成音声情緒付与回路 | |
| Kim | Singing voice analysis, synthesis, and modeling | |
| JP2990693B2 (ja) | 音声合成装置 | |
| JPH02293900A (ja) | 音声合成装置 | |
| JP2990691B2 (ja) | 音声合成装置 | |
| JP2992995B2 (ja) | 音声合成装置 | |
| Singh et al. | Removal of spectral discontinuity in concatenated speech waveform | |
| JPH0464080B2 (ja) | ||
| JPH0833749B2 (ja) | 音合成方法 | |
| JPH01219899A (ja) | 音声合成装置 | |
| Wakita | the Study of Speech Acoustics | |
| JPH0833752B2 (ja) | 音声合成装置 | |
| JPH01262598A (ja) | 音声合成装置の発声速度制御回路 | |
| Gray Jr et al. | Generalization for damping in the acoustic tube model of speech production |