JPH0160840B2

JPH0160840B2 -

Info

Publication number: JPH0160840B2
Application number: JP55070237A
Authority: JP
Inventors: Ei Buranton Keisu; Aaru Dodeinton Jooji
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1979-05-29
Filing date: 1980-05-28
Publication date: 1989-12-26
Also published as: DE3019823A1; US4304965A; JPS55161300A; GB2050125A; FR2458121A1; DE3019823C2; GB2050125B; FR2458121B1

Description

【発明の詳細な説明】本発明はデータ変換装置に関するものであり、
更に詳細には音声（スピーチ）合成回路に用いら
れるデータ変換装置に関するものである。

音声合成装置は従来知られている。音声合成装
置では、デジタルフイルタの特性制御を反射係数
で行なうことによる、デジタルフイルタを用いた
人間音声域の合成が普通の方法である。例として
は米国特許第3975578号及び第4058676号がある。
反射係数をフイルタ制御に用いる方法は、かなり
正確な音声合成を可能にはするが、必要とされる
ビツト速度は典型的には、１秒当り2400ないし
5000ビツトにもなる。最近、米国テキサス州ダラ
ス市のテキサスインスツルメンツインコーポレイ
テツドによつて製造された集積回路装置が、1200
ビツト／秒の速度において、反射係数型データを
用いた音声合成を可能にした。上記装置は1978年
４月28日付で米国特許出願第901393号として出願
され、本発明と同一譲受人に譲渡されている。

反射係数型データは、人間音声の特定のホルマ
ント周波数と帯域幅をくわしく数学的に解析する
ことによつて得られる。しかし、これに必要な解
析は時間を浪費し、高度な計算機システムなしに
は実時間計算として実用的でない。従つて、ホル
マント周波数データは反射係数データよりもより
固有な音声情報を含んでいるものの、実時間でホ
ルマント周波数データを反射係数データへ変換す
ることができないことが、ホルマント周波数デー
タを用いた低ビツト速の音声合成システムを実現
させる上で障害になつてきた。

従つて、本発明の１つの目的は、ホルマント周
波数データを用いた低ビツト速の音声合成システ
ムを提供することである。

本発明の別の１つの目的は、ホルマント周波数
データを反射係数データへ実時間変換するための
改良装置を提供することである。

上記の目的はここに述べられるようにして達成
される。符号化されたピツチ、エネルギー、ホル
マント中心周波数を含む約300ビツト／秒のビツ
トの流れが復号化される。ホルマント中心周波数
データは実時間で反射係数へ、テーラー級数型近
似を具体化した回路手段によつて変換される。そ
して反射係数は量子化されて、音声合成のために
量子化された反射係数を用いる音声合成装置へ入
力される。

本発明の特徴と考えられる新規な性質は特許請
求の範囲に述べた。しかし本発明の好ましい使用
例と更に他の目的、特長も含めて、本発明それ自
体の理解のためには、以下の図面を参照した詳細
な説明が最も有効であろう。

本発明の譲受入へ譲渡された1978年４月28日付
の米国特許出願第901393号の音声合成集積回路装
置は、革新的に新規なデジタルフイルタを用いた
独特の線形予測符号化音声合成装置である。上述
のデジタルフイルタの実施は、単１ステージで10
ステージ、２乗算器格子フイルタを実現すること
ができる。そのような実施例においては、音声合
成は、音声域の音響的特徴をまねるためのフイル
タの特性を選択的に制御するための10の反射係数
によつて行なわれる。これらの反射係数は人間音
声の詳しい解析から得られ、1200ビツト／秒の平
均ビツト速は、このシステムで人間音声を合成す
るために必要とされる典型的な値である。より固
有な音声情報を含むホルマント周波数データを、
本発明のデータ変換装置を用いて上述の反射係数
へ変換することができ、例えば300ビツト／秒の
ような低データ速で、高品質合成音声が得られ
る。従つて出願番号第901393号の米国特許出願を
ここに参考のために引用した。

既に述べたように、ホルマント中心周波数と帯
域幅を反射係数へ変換するための従来の手順は複
雑、時間浪費型のものであり、モノリシツク半導
体装置あるいは中規模の電子計算機を用いてさえ
も実時間合成には通常適していない。予測、方程
式、係数を反射係数へ変換するためのアルゴリズ
ムは、例えば10次のシステムに対して、140の整
数加算、65の実数加算、65の実数乗算、55の実数
除算を含んでいる。従つて、もし実時間合成を行
なうためにはより簡便な変換方式がとられるべき
である。

本発明の実施例に従つた４ホルマントシステム
を用いた場合、もしホルマント帯域幅と第４ホル
マントの中心周波数を固定すれば、高品質の合成
音声が得られることが明らかになつた。

本実施例において、帯域幅に対する値は、仮に
B₁＝75Hz，B₂＝50Hz，B₃＝100Hz，B₄＝100Hzに
選ばれる。もし１つの値が上記の値より本質的に
小さくなると（30％以上小さなくなると）、合成
音声にブザー状の音があらわれてくる。おそら
く、これは人間音声に対して不自然に長いインパ
ルス応答のためであろう。もう１つの値が上記の
値より本質的に大きいと、ホルマントが明瞭に定
義されないため、合成音声は押し殺された音をも
つようになる。上記の値は、フオーローマンジヤ
コブソン、モートンアンドコーポレイシヨンにグ
ンナールフアンドが1956年に「ホルマント周波数
からのホルマントレベルとスペクトルエンベロー
プの予測性について」の中で得た平均値B₁＝80
Hz，B₂＝80Hz，B₃＝100Hzに妥当な範囲で一致し
ている。複数個のテスト用句と語からのスペクト
ルを調べることによつて、第４のホルマント中心
周波数には3300Hzという値が与えられた。第１、
第２、第３ホルマントがフイルタの周波数応答強
度を第３ホルマントより大きい周波数に対してオ
クターブ当り36db落させるので、第４ホルマン
トの7738強度は合成音声中で非常に弱い。このよ
うに、もしF₄に与えられた値が大きすぎると、
第４ホルマントは完全に消失してしまうだろう
し、もしF₄に与えられた値がF₃の可能な値の範
囲にあると不自然な共鳴が発生するであろう。上
記の固定された値を用いて、各反射係数K_iは最初
の３のホルマント中心周波数F₁，F₂，F₃の関数
になる。テーラー級数展開を用いると、式(1)は式
(2)にほヾ等しいものとして表わすことができる。
ここでK_iはF₁＝F₁₀，F₂＝F₂₀，F₃＝F₃₀として知
られている。

(1) K_i＝f_i（F₁，F₂，F₃） (2) K_if_i（F₁₀，F₂₀，F₃₀）＋∂f_i／∂F₁（F₁₀，F₂₀，F₃₀）・（F₁―F₁₀）＋∂／∂F₂f_i（F₁₀，F₂₀，F₃₀）・（F₂―F₂₀）＋∂／∂F₃f_i（F₁₀，F₂₀，F₃₀）・（F₃―F₃₀）従つて、もしK_iが適当な数のF₁，F₂，F₃の値
に対して知られていれば、知れていないF₁，F₂，
F₃の値に対するK_iは線形内挿によつて近似でき
る。不安定なフイルタ係数をさけるために、この
方法を用いて得られたK_iの絶対値は１以内に制限
される。更に、合成の間の実際の計算を最少にす
るために偏微分∂f／∂はあらかじめ計算して表として格納しておく。

さて第１ａ図と第１ｂ図を参照すると、データ
変換装置の実施例の主要な部分を示す論理ブロツ
ク図が示されている。本実施例においては、
ROM１２からの300ビツト／秒の符号化データ
流が入力レジスタ１００、検索表１０１、LPC4
レジスタ１０２へ与えられる。各データ流の前に
は特定のスペースパラメータあるいはＮ数値が先
行する。これらのスペースパラメータはその流れ
の中にいくつかのフレームが含まれているか、ま
たその流れの中で各特定のパラメータがどれだけ
のフレーム速度で更新されるかを示す符号化デジ
タル数値である。好ましくは、本実施例では、そ
の流れの与えられた音声領域内で本実質的に変更
のあつたパラメータのみを送信するのがより効率
的である。実験によれば、代表的にはスペースパ
ラメータが８フレームのデータに等しい時、また
通常５ないし10フレームの範囲の時に、合成音声
は高品質のものとなる。更に別の符号化因子がそ
の流れが有声か無声かを指定する。簡単なビツト
流れが第２図に示されている。

無声音の間は、米国特許出願第901393号の合成
装置はK₁ないしK₄の反射係数を用いる。無声音
はホルマント周波数データを含まず、「ホワイト
ノイズ」の広いスペクトルを有するので、これら
４つの反射係数で無声音合成に十分である。本発
明のデータ変換装置が無声音フレームを検出する
と、LPC4レジスタ１０２は反射係数K₁―K₄を受
信し、直接、変換することなしにこれら反射係数
をFIFOバツフア１１６へ入力する。次にこれら
係数は米国特許出願第901393号の合成装置に受け
入れられるような形に、符号化器１１７によつて
符号化され、ピツチ及びエネルギーパラメータと
共に合成装置へ入力される。

有声音フレームの間は、検索表１０１がスペー
スパラメータＮを解読し、そのスペースパラメー
タを比較セル１０４へ入力する。比較セル１０４
はフレームム計数器１０５からクロツク信号を受
けており、各フレームが発生する毎に、そのフレ
ームがその中でパラメータ更新すべきかどうかを
決定し、どのパラメータを更新するかを決定する
ようになつている。更新ラインは計数器１０５を
制御し、それは入力レジスタ１００が与えられた
変更パラメータの符号化値にラツチされるのを許
容する。検索表１０３はレジスタ１００の出力を
解読し、ピツチ、エネルギー、ホルマントデータ
の実際の値を内挿レジスタ１０６へ供給する。こ
れらのピツチ、エネルギー、ホルマント周波数の
最初値は目標値として格納されれ、全手順がくり
かえされる。各々のパラメータについてひきつづ
く２つの値が内挿レジスタ１０６中につくられる
と、内挿器１０７は標準的な内挿計算を実行して
所定の速さで言語パラメータの一定の流れを発生
する。内挿器１０７はまた入力として比較セル１
０４からのスペースパラメータＮを有している。
これは、本発明では、特定のパラメータが他のパ
ラメータよりもより頻繁に更新されることが好ま
しいからである。従つて、スペースパラメータ
は、すべての音声パラメータの一定の定常的流れ
を発生するために任意の与えられたパラメータの
２つのひきつづく値の間で何回の内挿が必要であ
るかを決定するために必要な入力である。ピツチ
とエネルギーの因子は内挿器１０７からとり出さ
れてFIFOバツフア１１６中へラツチされ、内挿
されたホルマント周波数データが反射係数へ処理
される間待機する。

読出し専用記憶装置（ROM）１０８は特定の
あらかじめ定められたホルマント中心周波数の選
ばれた値を記憶する。比較器１０９は最初のホル
マント中心周波数にラツチされ、そのホルマント
に対して記憶されている値のうちで最も良く一致
するものを決定するために、ROM１０８との間
ですべての値についてくりかえして比較を行な
う。選ばれた値がとり出されてレジスタ及び符号
化器１１１へラツチされ、エラー信号あるいは第
１ホルマントの実際の値と記憶されている最良一
致との間の差異が乗算器１１４へ出力される。こ
の操作が第２、第３のホルマントに対してもくり
かえされる。実験によれば、本発明では、第１と
第２のホルマント中心周波数に対して３つのとり
うる値また第３のホルマント中心周波数に対して
２つの値だけで、ROM１０８に記憶されていれ
ば、許容できる品質の合成音声を作成することが
できる。レジスタ符号化器１１１は３つのホルマ
ント周波数すべてにラツチされた後に、その特定
の組合せを表わす符号化信号を解読器及びROM
１１３へ供給し、RMO１１３内であらかじめ計
算された値_i，∂_i／∂F₁，∂_i／∂F₂，∂_i／∂
F₃の位置を示す部分的番地として働く。これらの値は最良一致の
ホルマントとそれの偏微分の各々に対するほん訳
された反射係数である。Ｋ計数器１１２は所定の
反射係数値K₁―K₈を通すくりかえしによつて、
ROM１１３内の番地の残りの部分を提供する。
米国特許出願第901393号に詳細に述べられた音声
合成装置の実施例は10の反射係数K₁―K₁₀を用い
ているが、本発明者によつて、K₉とK₁₀を固定す
ることによつて、本発明を併用した米国特許出願
第901393号の合成装置で得られる音声の品質はそ
れ程低下しないことが確められている。このよう
にして、８の反射係数がホルマント周波数の18の
可能な組合せ（３×３×２）の各々に対して用い
られ、各反応係数に対して４つの値が記憶されて
いるから（_i，∂_i／∂F₁，∂_i／∂F₂，∂_i／∂
F₃）、ROM１１３に必要とされる記憶容量は576バイト（18×８
×４）だけである。その時のホルマント周波数の
組合せに対して各反射係数あるいはＫ値がROM
１１３中で番地指定されると、_i，∂_i／∂F₁，∂
_i／∂F₂， ∂_i／∂F₃に対する値が乗算器１１４へとり出される
。

乗算器１１４は偏微分の各々と比較器１０９から
出力された適正なエラー信号とを乗算し、直列式
加算器１１５がそれら積を加算する。従つて直列
式加算器１１５の出力が式(2)の解になる。このよ
うにして、乗算器１１４と直列式加算器１１５の
働きによつて、既知の反射係数とエラー信号が入
力ホルマント周波数に対応した適切な反射係数へ
変換される。ｉ＝１〜８に対するK_iの各値が計算
されてFIFOバツフア１１６へラツチされる。全
データフレームがFIFOバツフア１１６へラツチ
されると、それは符号化器１１７によつて、米国
特許出願第901393号の合成装置に必要とされるホ
ルマントへ符号化されれ、合成装置へ入力され
る。

本発明のデータ変換装置は、米国特許出願第
901393号の音声合成装置と共に用いる形で説明し
てきたが、当業者にとつては、ホルマント中心周
波数データを音声合成装置制御情報へ変換するた
めの実時間変換回路が、そのようなフイルタ制御
係数を用いる任意の音声合成装置に用いられるこ
とは明らかであろう。符号化器１１７の符号化回
路を単に変更することでも、本発明は、ここに述
べた量子化反射係数システムの他自動相関係数あ
るいは部分的自動相関係数を用いたシステムに対
しても有用である。従つて、特許請求の範囲は、
本発明の真の範囲に含まれるこれら及び他の変更
あるいは実施例を包含すると理解されるべきであ
る。

以上の説明に関連して更に以下の項を開示す
る。

(1) デジタルフイルタ制御データによつて制御さ
れるデジタルフイルタを有する音声合成装置に
用いるためのデータ変換装置であつて、 (a) 人間の音声の分析によつて得られるホルマ
ント周波数データを受信するための入力装
置、 (b) 上記入力装置に結合され、上記ホルマント
周波数データをデジタルフイルタの制御デー
タに変換するためのデジタル変換器回路装
置、 (c) 上記デジタル変換器回路装置に結合され、
上記デジタルフイルタ制御データを上記デジ
タルフイルタへ出力するための出力装置、を含むデータ変換装置。

(2) 第１項のデータ変換装置であつて、上記デー
タ変換装置が、１個のモノリシツクな半導体回
路装置として集積化できるような、データ変換
装置。

(3) 第１項のデータ変換装置であつて、上記ホル
マント周波数データが、人間の音声の最初の３
つのホルマントの中心周波数であるデータ変換
装置。

(4) 第１項のデータ変換装置であつて、上記デジ
タルフイルタ制御データが量子化された反射係
数の形をとつているデータ変換装置。

(5) 人間音声の分析で得られたホルマント周波数
の組をデジタルフイルタ制御データへ変換する
ためのデータ変換装置であつて、 (a) ホルマント周波数の複数の入力組を受信す
るための入力装置、 (b) ホルマント周波数のあらかじめ定められた
モデル組を格納するための記憶装置、 (c) 上記入力装置と上記記憶装置とに結合され
て、上記ホルマント周波数のモデル組のうち
のどの１組が、上記入力装置により受信され
るホルマント周波数の上記入力組の各々に対
し、最も類似しているかを決定するための比
較装置、 (d) 上記入力装置と上記比較装置に結合され、
上記ホルマント周波数のモデル組の上記選択
された１組とホルマント周波数の上記入力組
との間の差異を表示するエラー信号を発生す
るためのエラー信号発生装置、 (e) 上記比較装置に結合され、ホルマント周波
数の上記モデル組のうちの上記選択された１
組をデジタルフイルタ制御データのモデル組
へ変形するための変形装置、 (f) 上記変換装置と上記エラー信号発生装置と
に結合され、上記エラー信号に応答してデジ
タルフイルタ制御データの上記モデル組を、
ホルマント周波数の上記入力組を伴なう１組
のデジタルフイルタ制御データへ修正するた
めの修正装置、を含むようなデータ変換装置。

(6) 第５項のデータ変換装置であつて、上記デー
タ変換装置がモノリシツクな半導体回路装置と
して集積化できるデータ変換装置。

(7) 第５項のデータ変換装置であつて、ホルマン
ト周波数の上記組が人間音声の最初の３つのホ
ルマントの中心周波数であるデータ変換装置。

(8) 第５項のデータ変換装置であつて、上記デジ
タルフイルタ制御データが量子化された反射係
数であるデータ変換装置。

(9) 第７項のデータ変換装置であつて、ホルマン
ト周波数の上記モデル組が人間言語の最初の３
つのホルマントの各々に対して、少なくとも２
つの異なる中心周波数を含んでいるデータ変換
装置。

(10) 第５項のデータ変換装置であつて、上記記憶
装置が読み出し専用記憶（ROM）装置である
データ変換装置。

(11) 第５項のデータ変換装置であつて、上記エラ
ー信号発生装置が、ホルマント周波数の上記入
力組からホルマント周波数の上記モデル組の上
記選択された１組を差引くための引算装置を含
むデータ変換装置。

(12) 第５項のデータ変換装置であつて、上記変形
装置が、ホルマント周波数の上記モデル組の上
記選択された１組を表わす数値によつて選択的
に番地指定される読出し専用記憶装置であるデ
ータ変換装置。

(13) 第５項のデータ変換装置であつて、上記修
正装置が、上記エラー信号に応答してデジタル
フイルタ制御データの上記モデル組を修正する
ための乗算器と直列式加算器を含むデータ変換
装置。

(14) 音声合成システムであつて、 (a) 人間音声の分析によつて得られた選択され
たホルマント周波数データを格納するための
記憶装置、 (b) 上記記憶装置に結合され、上記ホルマント
周波数データをデジタルフイルタの制御デー
タへ変換するためのデータ変換装置、 (c) 合成装置であつて、上記データ変換装置に
結合されたデジタルフイルタを含み、上記デ
ジタルフイルタ制御データに応答して、上記
デジタルフイルタの出力へ、人間音声を再生
するアナログ信号を生成するための合成装
置、 (d) 発音装置であつて、トランスジユサを含
み、人間音声を表わす上記アナログ信号を可
聴信号へ変換するための発音装置、を含む音声合成システム。

(15) 第14項の音声合成システムであつて、上記
記憶装置が１個のモノリシツク半導体回路装置
として集積化できる音声合成システム。

(16) 第14項の音声合成システムであつて、上記
データ変換装置が、１個のモノリシツク半導体
回路装置として集積化できる音声合成システ
ム。

(17) 第14項の音声合成システムであつて、上記
合成装置が、１個のモノリシツク半導体回路装
置として集積化できる音声合成システム。

(18) 第14項の音声合成システムであつて、上記
ホルマント周波数データが人間音声の最初の３
つのホルマントの各々の中心周波数である音声
合成システム。

(19) 第14項の音声合成システムであつて、上記
デジタルフイルタ制御データが量子化された反
射係数である音声合成システム。

【図面の簡単な説明】

第１ａ図及び第１ｂ図は、データ変換装置の主
たる部品を示すブロツク図である。第２図はデー
タ変換装置と共に用いれるビツト流の例を示す。参照番号、１２……読出し専用記憶装置
（ROM）、１００……入力レジスタ、１０１……
検索表、１０２……LPC４レジスタ、１０３…
…検索表、１０４……比較セル、１０５……フレ
ーム計数器、１０６……内挿レジスタ、１０７…
…内挿器、１０８……ROM、１０９……比較
器、１１０……計数器、１１１……レジスタ符号
化器、１１２……Ｋ計数器、１１３……ROM、
１１４……乗算器、１１５……直列式加算器、１
１６……FIFOバツフア、１１７……符号化器、
１１８……音声合成装置。

Claims

【特許請求の範囲】１デジタルフイルタの制御データによつて制御
されるデジタルフイルタを有する音声合成装置に
用いるためのデータ変換装置であつて、 (a) 人間の音声の分析によつて得られるホルマン
ト周波数の複数の入力組を受信するための入力
装置、 (b) ホルマント周波数の予め定められたモデル組
を格納するための記憶装置、 (c) 上記入力装置と上記記憶装置に結合され、上
記モデル組のうちのどの１組が上記入力装置に
より受信されるホルマント周波数の上記入力組
の各々に対し、最も近似しているかを決定する
ための比較装置、 (d) 上記入力装置と上記比較装置とに結合され、
上記ホルマント周波数のモデル組の上記選ばれ
た１組とホルマント周波数の上記入力組との間
の差異を表示するエラー信号発生装置、 (e) 上記比較装置に結合され、ホルマント周波数
の上記モデル組のうちの上記選ばれた１組をデ
ジタルフイルタ制御データのモデル組へ変形す
る変形装置、 (f) 上記変形装置と上記エラー信号発生装置とに
結合され、上記エラー信号に応答してデジタル
フイルタ制御データの上記モデル組を、ホルマ
ント周波数の上記入力組に対応したデジタルフ
イルタ制御データへ変換するための変換装置、 (g) 上記変換装置に結合され、上記デジタルフイ
ルタ制御データを上記デジタルフイルタへ出力
するための出力装置、を含むデータ変換装置。２音声合成システムであつて、 (a) 人間の音声の分析によつて得られるホルマン
ト周波数の複数の入力組を受信するための入力
装置、 (b) 人間の音声の分析によつて得られた選択され
たホルマント周波数のモデル組を格納するため
の記憶装置、 (c) 上記入力装置と上記記憶装置に結合され、上
記モデル組のうちのどの１組が、上記入力装置
により受信されるホルマント周波数の上記入力
組の各々に対し、最も近似しているかを決定す
るための比較装置、 (d) 上記入力装置と上記比較装置とに結合され、
上記ホルマント周波数のモデル組の上記選ばれ
た１組とホルマント周波数の上記入力組との間
の差異を表示するエラー信号発生装置、 (e) 上記比較装置に結合され、ホルマント周波数
の上記モデル組のうちの上記選ばれた１組をデ
ジタルフイルタ制御データのモデル組へ変形す
る変形装置、 (f) 上記変形装置と上記エラー信号発生装置とに
結合され、上記エラー信号に応答してデジタル
フイルタ制御データの上記モデル組を、ホルマ
ント周波数の上記入力組に対応したデジタルフ
イルタ制御データへ変換するための変換装置、 (g) 合成装置であつて、上記データ変換装置に結
合されたデジタルフイルタを含み、上記デジタ
ルフイルタ制御データに応答して、上記デジタ
ルフイルタの出力に、人間音声を再生するアナ
ログ信号を生成するための合成装置、 (h) 発生装置であつて、トランスジユサを含み、
人間音声を表わす上記アナログ信号を可聴信号
に変換するための発音装置、を含む音声合成システム。