JPH01197799A

JPH01197799A - 音声合成装置の調音・音源パラメータ生成方法

Info

Publication number: JPH01197799A
Application number: JP63022487A
Authority: JP
Inventors: Norio Suda; 典雄須田
Original assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Current assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Priority date: 1988-02-02
Filing date: 1988-02-02
Publication date: 1989-08-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】Ａ、産業上の利用分野本発明は、規則合成方式による音声合成装置に係り、特
に調音パラメータと音源パラメータの生成方法に関する
。

Ｂ１発明の概要本発明は、音節又は音素に対応づけた調音パラメータ及
び音源パラメータを生成するにおいて、任意設定した調
音パラメータを持つディジタルフィルタの出力側から実
音声データを与えたときの該フィルタの入力側応答デー
タから音源パラメータを求め、このときの調音パラメー
タとの組合せで当該音節又は音素の合成でのパラメータ
とすることにより、ディジタルフィルタの簡単化及び音源パラメータ生成の
簡単化を図りながら音声品質を向上できるようにしたも
のである。

Ｃ０従来の技術規則合成方式による音声合成装置は、例えば第３図に示
す構成にされる。文章解析部ｌは日本語入力テキストの
文字列に対して辞書１ａと文章解析装置、ｔｂによる文
章解析を行う。辞書１ａには単語の読みがな変換のため
の辞書のほかに単語の文節区切１句区切等のための日本
語文法辞書を有し、さらには単語のアクセントや基本イ
ントネーションの規則辞書を有する。文章解析装置！ｂ
は辞書１ａを参照して入力テキストを音素あるいは音節
の音韻記号列に変換すると共に、単語アクセントや基本
イントネーション等の韻律情報を発生する。

音声合成規則部２は、ファイル２ａとパラメータ生成装
置２ｂによって構成される。ファイル２ａは音韻単位の
特徴パラメータとそれらの接続規則及び韻律情報の制御
規則を蓄積しておく。パラメータ生成装置２ｂは音韻情
報に対する特徴パラメータをその持続時間等の情報と共
に連結した制御パラメータ列を生成すると共に、韻律情
報による音源のピッチ、エネルギー、イントネーション
処理を施した音源パターン列を生成する。

音声生成部３は、音源生成装置３ａと音声合成ディジタ
ルフィルタ３ｂと音声変換器３ｃとによって構成される
。音源生成装置３ａは、音源パターン列に従ったピッチ
、エネルギー等の音源信号を発生する。ディジタルフィ
ルタ３ｂは制御パラメータ列に従ってパーコール係数や
伝達関数又はフォルマント周波数のパラメータが変えら
れ、このパラメータでの音源信号に対する応答出力に合
成音声データ列を得る。音声変換器３ｃはフィルタ３ｂ
の出力をアナログ信号に変換して音声波形を得、スピー
カ等の電気−音変換手段による合成音声を出力する。

上述のような音声合成装置において、音声波形の生成に
は音源の生成と声道形による調音に分離し、音源及び調
音が電気的等価回路にモデル化される。例えば、音源に
は２質量モデルによる声帯振動モデルを求め、調音には
声道断面積モデルや調音器官の構造とその運動上の特性
を直接的に求める調音モデルが求められる。こうしたモ
デル化による音声の特徴パラメータが求められるが、音
声の特徴パラメータを求めるのに音声波形を直接扱う代
わりに音声スペクトルによる分析から求められる。例え
ば、音声の短時間スペクトルは周波数と共にゆるやかに
変化するスペクトル包絡と、細かく周期的（有声音）又
は非周期的（無声音）に変化するスペクトル微細構造に
分解される。スペクトル包絡は発声器官の共振・反共振
特性等の大局的なものに相当し、スペクトル微細構造は
音源の周期性に相当する。そして、スペクトル包絡の抽
出には、自己相関関数分析やケプストラム分析によるノ
ンパラメトリック分析法か、又はＡＢＳや線形予測分析
（パーコール分析、ＬＳＰ分析等）によるパラメトリッ
ク分析法が使用される。

また、スペクトル微細構造のうち、音源の基本周波数（
ピッチ）の抽出には相関処理やスペクトル処理方法が使
用される。

また、調音の特徴パラメータを求めるのに、声道をその
断面積変化を多数の一次元音響管の縦続接続と見なして
各音響管での前向き進行波と後向き進行波の線形結合で
表して面積比と反射係数で記述するモデル化や共振周波
数（フォルマント周波数）と振幅スペクトル特性で記述
するモデル化が行われる。さらには調音器官の構造とそ
の運動上の特性を直接的に表したモデル化が行われる。

Ｄ１発明が解決しようとする課題従来、音声の特徴パラメータを求める種々の方法は、線
形予測分析法に代表されるように、音声波形やスペクト
ルの性質を少数のパラメータで能率的かつ正確に求めよ
うとするしのであるが、実際に出力される合成音には実
音声に較べて明瞭性。

自然性に著しく劣るものになる。これは、例えばＡＢＳ
法や線形予測分析法では信号の生成モデルにより生成さ
れた値と観測値との誤差（予測残差）が最小となるよう
なパラメータをフィードバック制御により求めるもので
あるが、仮定する生成モデルと複雑に変化する声帯振動
や声道形との差が大きく、完全な分析１合成になし得な
いことに因る。

また、従来ではパラメータを求めるのに何回ものフィー
ドバック制御を必要とし、情報処理量が非常に多くなる
問題があった。この問題において、モデル化を細密にす
るほど著しく情報処理量を多くするし、必要な記憶容量
を増大させる。

本発明の目的は、情報処理量を少なくしながら実音声に
近づけた調音パラメータ及び音源パラメータを得ること
ができる調音・音源パラメータ生成方法を提供するにあ
る。

６０課題を解決するための手段本発明は上記目的を達成するため、音声波形の生成に音
源の生成と声道断面積による調音に分離し、音源パラメ
ータにより音源波形を生成し、調音パラメータによる声
道断面積のディジタルフィルタに音源波形を与えて該フ
ィルタの出力に音声信号を得る規則合成方式の音声合成
装置において、音節又は音素に対応づけて任意に設定し
た調音パラメータにより前記ディジタルフィルタの声道
断面積係数を固定させ、該フィルタの出力側に実音節又
は実音素波形を与えたときの該フィルタの入力側に表れ
る信号波形から音源パラメータを求め、該音源パラメー
タ及び前記調音パラメータを対応する音節又は音素のパ
ラメータとすることを特徴とする。

Ｆ１作用ディジタルフィルタとして声道断面積関数を採用すると
きにはその入力に対する応答出力を求めるのとは逆に、
出力側の波形から人力波形を求めることができる。これ
を以下に詳細に説明する。

声道による調音は、音源波形に対して断面積の異なる複
数個の音響管を縦続接続した一次元音響管での進行波と
反射波による振動現象として見なすことができる。そし
て、音響管は声道の長さ、太さと音波長との関係から分
布定数系として取り扱うのが適切となり、また音源の伝
搬損失は無視できる。

上述のことから、声道を断面積Ａ、〜Ａｎを持つｎ個の
一次元音響管を縦続接続した第２図（ア）の等価モデル
で表し、各音響管Ｓ、−ＳｎをＬＣ成分のみの無損失分
布定数線路Ｔ、〜Ｔｎと見なすと同図（イ）の電気回路
に変換され、この電気回路に音源に代えたインパルス性
の電圧又は電流信号を印加したときの出力波形が音声波
形に相当する応答出力と見なすことができる。そして、
声道の調音状態を変えるには各線路Ｔ、〜Ｔ、、の定数
り。

Ｃ全変えることによるサージインピーダンスの変更にな
る。

同図（イ）の等価回路において、音源に代えたインパル
ス性の電流を印加したとき、各線路Ｔ。

〜Ｔｒｌは夫々サージインピーダンスＺ１〜Ｚ、を内部
抵抗とする電流源を持ち、各線路Ｔ　Ｉ””’　Ｔ−の
接続点で反射と透過を伴う等価回路に変換される。

この等価回路は同図（つ）に示すようになる。同図にお
いて、Ｅは音源に相当する電圧源電圧、Ｚ。

はその出力インピーダンス、ＺＬは口唇からの放射イン
ピーダンス、ｉ　ＯＡ−ｉ　（１％−１１Ａ　　は線路
Ｔ。

〜Ｔｎの各接続点の前進波電流、ｆｏｅ〜Ｌｎ−＋＋ａ
は各接続点の後進波電流、Ｚ　Ｉ〜Ｚｎは夫々断面積Ａ
ｔ〜Ａｎと空気密度ρと音速ＣからρＣ／Ａｌ〜ρＣ／
Ａｎになるサージインピーダンス、ＩＯＡ〜１１１１−
＋１Ａ　　及びＩ　ＩＢ−１ｎＢは線路Ｔ、−Ｔｎの接
続点に現れる電流源電流＆。６〜ａ　（ｎ−＋ｌＡ及び
ａｌｅ〜ａｎｓは電流源の分流電流である。

これら各電流には第２図（１）に示す関係にある。同式
中、Ｓ　＋ａ＝　Ａ　＋／　（Ａ　＋＋　Ａ　ｔ）、Ｓ
　１Ａ＝Ａｔ／（Ａ＋＋Ａｔ）〜Ｓ　＋ｎ−＋１Ｂ＝Ａ
　（ｎ−１１７（Ａ＋ｎ−ｔ＋＋Ａ１１）、Ｓ　＋１ｌ
−１１９＝　Ａ　ｎ／　Ａ　（ｎ−１１＋Ａ　ｎを示す
。

また、メモリ項目は現在値のｌステップ前の演算結果を
格納する項目を示す。こうした関係式の演算はメモリ項
目に初期値０を与え、電圧Ｅを与えたときの各メモリ項
目について、線路Ｔ、〜Ｔ７まで基本周期で順次演算し
、最終段の電流１ｎｅを基本周期で求め、この電流ｌａ
ｇに調音音声出力デー□りを得ることができる。

ここで、第２図（つ）の等価回路は線形回路になって重
ねの理が成立し、電圧Ｅを零として放射インピーダンス
ＺＬに直列に電圧Ｅ＋、を印加したときの各部電流を求
めること、即ち、インピーダンスＥ。の電流を求めるこ
とができる。そこで、本発明はディジタルフィルタの声
道断面積係数を音節又は音素に対応づけて任意に設定し
ておき、ディジタルフィルタの出力側に実音節又は実音
素を与えたときの入力側に表れる信号波形を求め、この
信号波形の分析によって当該音節又は音素の音源パラメ
ータを求め、併せて声道断面積係数を調音パラメータと
して求める。

このようにして求めた音源パラメータ及び調音パラメー
タは、ディジタルフィルタと人の発声器官との誤差及び
音源波形と声帯振動との誤差をそのままにして出力音声
波形を実音声に近づけることができる。そして、音源パ
ラメータ及び調音パラメータを求めるのに、従来のフィ
ードバック方式と異なり一回の実音声に対する応答を求
めるのみで済み、情報処理型を少なくする。また、調音
パラメータは声道のモデル化を細密にすることを不要に
し、音節又は音素パラメータとして必要な情報量を低減
、即ち情報圧縮とディジタルフィルタの演算速度向上も
しくは演算量低減を可能にする。

Ｇ、実施例第１図は本発明の一実施例を示すブロック図である。音
声登録部１１にはアナウンサー等が発声した音節又は音
素単位の実音声波形をサンプリングデータとして登録し
ておく。音声続出部１２は音声登録部１１から指定され
る音節又は音素のサンプリングデータを読出し、このデ
ータに比例する電圧波形を増幅出力する。ディジタルフ
ィルタ演算部１３は、音声続出部１２からの電圧波形を
出力側の入力とし、該電圧波形に対応する音節又は音素
の声道断面積係数が設定され、この声道断面積係数での
入力側の応答出力（音源データ）を演算で求める。パラ
メータ演算部１４はディジタルフィルタ演算部１３から
の音源データを分析して音源パラメータを求め、この音
源パラメータをパラメータ登録部１５に登録する。この
登録において、ディジタルフィルタ演算部１３に設定し
た声道断面積係数も併せて登録する。コントロール部１
６はキーボード等の入力装置１７からの指令によって各
部を制御し、制御状態を表示装置１８に表示する。

上述の構成における調音・音源パラメータの生成処理を
以下に詳細に説明する。

登録すべき音源（音節又は音素）が指令されると、コン
トロール部１６は音声読出部１２に該音源を指定すると
共に、ディジタルフィルタ演算部１３に当該音源に対応
する断面積係数データを設定及びパラメータ登録部１５
への登録を行う。音源指定された音声続出部１２は該音
源のサンプリングデータを音声登録部１１から読出し、
このデータをディジタルフィルタ演算部１３の出力側に
順次与える。ディジタルフィルタ演算部１３は、第２図
（つ）に示す等価回路と設定断面積係数から定める演算
式（同図工の関係式）による演算を行い、放射インピー
ダンスＺＬに直列の電圧源として音声続出部１２からの
サンプリングデータを与え、出力インピーダンスＺ。の
電圧値のデータ列を応答出力として求める。このとき求
められるデータ列は設定される断面積係数において入力
音声波形に対する音源波形のサンプリングデータになる
。このデータに対して、パラメータ演算部１４ではスペ
クトル包絡やスペクトル微細構造等への分析によって音
源パラメータを求め、この音源パラメータをパラメータ
登録部１５に登録する。

Ｈ，発明の効果本発明の調音・音源パラメータ生成方法によれば、求め
ようとする音節又は音素の音源パラメータについて、声
道断面積関数の設定による１回の演算によって音源波形
を求めることができ、従来のフィードバック方式による
繰り返し演算に較べて情報処理量及び処理時間を短縮す
る。また、声道断面積関数及び声道等価回路と実際の人
の声道構造との間に誤差が存在するも、該誤差分は求め
る音源波形にも含まれており、実際の音声合成時に音源
波形に含まれる該誤差分はディジタルフィルタの声道断
面積関数等の誤差分と相殺され、音声合成時には求めた
音源波形と音源パラメータの間の誤差分のみになる。こ
のことは、合成音声を実音声に近づける効果のほか、声
道断面積係数の単純化（例えば縦続接続音響管の個数低
減）や各音響管で複雑に変化する断面積変化の単純化に
よる演算処理の簡単化、処理速度の向上効果を得ること
ができる。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロック図、第２図は
本発明を原理的に説明するための音響管の等価モデルと
演算態様図、第３図は規則合成方式の音声合成装置のブ
ロック図である。１１・・・音声登録部、１２・・・音声読出部、１３・
・・ディジタルフィルタ演算部、１４・・・パラメータ
演算部、！５・・・パラメータ登録部、１６・・・コン
トロール部、１７・・・入力装置、１８・・・表示装置
。１１間＋１−１９７７９９　（７）

Claims

【特許請求の範囲】

（１）音声波形の生成に音源の生成と声道断面積による
調音に分離し、音源パラメータにより音源波形を生成し
、調音パラメータによる声道断面積のディジタルフィル
タに音源波形を与えて該フィルタの出力に音声信号を得
る規則合成方式の音声合成装置において、音節又は音素
に対応づけて任意に設定した調音パラメータにより前記
ディジタルフィルタの声道断面積係数を固定させ、該フ
ィルタの出力側に実音節又は実音素波形を与えたときの
該フィルタの入力側に表れる信号波形から音源パラメー
タを求め、該音源パラメータ及び前記調音パラメータを
対応する音節又は音素のパラメータとすることを特徴と
する音声合成装置の調音・音源パラメータ生成方法。