JPH0160840B2 - - Google Patents
Info
- Publication number
- JPH0160840B2 JPH0160840B2 JP55070237A JP7023780A JPH0160840B2 JP H0160840 B2 JPH0160840 B2 JP H0160840B2 JP 55070237 A JP55070237 A JP 55070237A JP 7023780 A JP7023780 A JP 7023780A JP H0160840 B2 JPH0160840 B2 JP H0160840B2
- Authority
- JP
- Japan
- Prior art keywords
- digital filter
- input
- formant
- control data
- formant frequencies
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Electrophonic Musical Instruments (AREA)
Description
【発明の詳細な説明】
本発明はデータ変換装置に関するものであり、
更に詳細には音声(スピーチ)合成回路に用いら
れるデータ変換装置に関するものである。
更に詳細には音声(スピーチ)合成回路に用いら
れるデータ変換装置に関するものである。
音声合成装置は従来知られている。音声合成装
置では、デジタルフイルタの特性制御を反射係数
で行なうことによる、デジタルフイルタを用いた
人間音声域の合成が普通の方法である。例として
は米国特許第3975578号及び第4058676号がある。
反射係数をフイルタ制御に用いる方法は、かなり
正確な音声合成を可能にはするが、必要とされる
ビツト速度は典型的には、1秒当り2400ないし
5000ビツトにもなる。最近、米国テキサス州ダラ
ス市のテキサスインスツルメンツインコーポレイ
テツドによつて製造された集積回路装置が、1200
ビツト/秒の速度において、反射係数型データを
用いた音声合成を可能にした。上記装置は1978年
4月28日付で米国特許出願第901393号として出願
され、本発明と同一譲受人に譲渡されている。
置では、デジタルフイルタの特性制御を反射係数
で行なうことによる、デジタルフイルタを用いた
人間音声域の合成が普通の方法である。例として
は米国特許第3975578号及び第4058676号がある。
反射係数をフイルタ制御に用いる方法は、かなり
正確な音声合成を可能にはするが、必要とされる
ビツト速度は典型的には、1秒当り2400ないし
5000ビツトにもなる。最近、米国テキサス州ダラ
ス市のテキサスインスツルメンツインコーポレイ
テツドによつて製造された集積回路装置が、1200
ビツト/秒の速度において、反射係数型データを
用いた音声合成を可能にした。上記装置は1978年
4月28日付で米国特許出願第901393号として出願
され、本発明と同一譲受人に譲渡されている。
反射係数型データは、人間音声の特定のホルマ
ント周波数と帯域幅をくわしく数学的に解析する
ことによつて得られる。しかし、これに必要な解
析は時間を浪費し、高度な計算機システムなしに
は実時間計算として実用的でない。従つて、ホル
マント周波数データは反射係数データよりもより
固有な音声情報を含んでいるものの、実時間でホ
ルマント周波数データを反射係数データへ変換す
ることができないことが、ホルマント周波数デー
タを用いた低ビツト速の音声合成システムを実現
させる上で障害になつてきた。
ント周波数と帯域幅をくわしく数学的に解析する
ことによつて得られる。しかし、これに必要な解
析は時間を浪費し、高度な計算機システムなしに
は実時間計算として実用的でない。従つて、ホル
マント周波数データは反射係数データよりもより
固有な音声情報を含んでいるものの、実時間でホ
ルマント周波数データを反射係数データへ変換す
ることができないことが、ホルマント周波数デー
タを用いた低ビツト速の音声合成システムを実現
させる上で障害になつてきた。
従つて、本発明の1つの目的は、ホルマント周
波数データを用いた低ビツト速の音声合成システ
ムを提供することである。
波数データを用いた低ビツト速の音声合成システ
ムを提供することである。
本発明の別の1つの目的は、ホルマント周波数
データを反射係数データへ実時間変換するための
改良装置を提供することである。
データを反射係数データへ実時間変換するための
改良装置を提供することである。
上記の目的はここに述べられるようにして達成
される。符号化されたピツチ、エネルギー、ホル
マント中心周波数を含む約300ビツト/秒のビツ
トの流れが復号化される。ホルマント中心周波数
データは実時間で反射係数へ、テーラー級数型近
似を具体化した回路手段によつて変換される。そ
して反射係数は量子化されて、音声合成のために
量子化された反射係数を用いる音声合成装置へ入
力される。
される。符号化されたピツチ、エネルギー、ホル
マント中心周波数を含む約300ビツト/秒のビツ
トの流れが復号化される。ホルマント中心周波数
データは実時間で反射係数へ、テーラー級数型近
似を具体化した回路手段によつて変換される。そ
して反射係数は量子化されて、音声合成のために
量子化された反射係数を用いる音声合成装置へ入
力される。
本発明の特徴と考えられる新規な性質は特許請
求の範囲に述べた。しかし本発明の好ましい使用
例と更に他の目的、特長も含めて、本発明それ自
体の理解のためには、以下の図面を参照した詳細
な説明が最も有効であろう。
求の範囲に述べた。しかし本発明の好ましい使用
例と更に他の目的、特長も含めて、本発明それ自
体の理解のためには、以下の図面を参照した詳細
な説明が最も有効であろう。
本発明の譲受入へ譲渡された1978年4月28日付
の米国特許出願第901393号の音声合成集積回路装
置は、革新的に新規なデジタルフイルタを用いた
独特の線形予測符号化音声合成装置である。上述
のデジタルフイルタの実施は、単1ステージで10
ステージ、2乗算器格子フイルタを実現すること
ができる。そのような実施例においては、音声合
成は、音声域の音響的特徴をまねるためのフイル
タの特性を選択的に制御するための10の反射係数
によつて行なわれる。これらの反射係数は人間音
声の詳しい解析から得られ、1200ビツト/秒の平
均ビツト速は、このシステムで人間音声を合成す
るために必要とされる典型的な値である。より固
有な音声情報を含むホルマント周波数データを、
本発明のデータ変換装置を用いて上述の反射係数
へ変換することができ、例えば300ビツト/秒の
ような低データ速で、高品質合成音声が得られ
る。従つて出願番号第901393号の米国特許出願を
ここに参考のために引用した。
の米国特許出願第901393号の音声合成集積回路装
置は、革新的に新規なデジタルフイルタを用いた
独特の線形予測符号化音声合成装置である。上述
のデジタルフイルタの実施は、単1ステージで10
ステージ、2乗算器格子フイルタを実現すること
ができる。そのような実施例においては、音声合
成は、音声域の音響的特徴をまねるためのフイル
タの特性を選択的に制御するための10の反射係数
によつて行なわれる。これらの反射係数は人間音
声の詳しい解析から得られ、1200ビツト/秒の平
均ビツト速は、このシステムで人間音声を合成す
るために必要とされる典型的な値である。より固
有な音声情報を含むホルマント周波数データを、
本発明のデータ変換装置を用いて上述の反射係数
へ変換することができ、例えば300ビツト/秒の
ような低データ速で、高品質合成音声が得られ
る。従つて出願番号第901393号の米国特許出願を
ここに参考のために引用した。
既に述べたように、ホルマント中心周波数と帯
域幅を反射係数へ変換するための従来の手順は複
雑、時間浪費型のものであり、モノリシツク半導
体装置あるいは中規模の電子計算機を用いてさえ
も実時間合成には通常適していない。予測、方程
式、係数を反射係数へ変換するためのアルゴリズ
ムは、例えば10次のシステムに対して、140の整
数加算、65の実数加算、65の実数乗算、55の実数
除算を含んでいる。従つて、もし実時間合成を行
なうためにはより簡便な変換方式がとられるべき
である。
域幅を反射係数へ変換するための従来の手順は複
雑、時間浪費型のものであり、モノリシツク半導
体装置あるいは中規模の電子計算機を用いてさえ
も実時間合成には通常適していない。予測、方程
式、係数を反射係数へ変換するためのアルゴリズ
ムは、例えば10次のシステムに対して、140の整
数加算、65の実数加算、65の実数乗算、55の実数
除算を含んでいる。従つて、もし実時間合成を行
なうためにはより簡便な変換方式がとられるべき
である。
本発明の実施例に従つた4ホルマントシステム
を用いた場合、もしホルマント帯域幅と第4ホル
マントの中心周波数を固定すれば、高品質の合成
音声が得られることが明らかになつた。
を用いた場合、もしホルマント帯域幅と第4ホル
マントの中心周波数を固定すれば、高品質の合成
音声が得られることが明らかになつた。
本実施例において、帯域幅に対する値は、仮に
B1=75Hz,B2=50Hz,B3=100Hz,B4=100Hzに
選ばれる。もし1つの値が上記の値より本質的に
小さくなると(30%以上小さなくなると)、合成
音声にブザー状の音があらわれてくる。おそら
く、これは人間音声に対して不自然に長いインパ
ルス応答のためであろう。もう1つの値が上記の
値より本質的に大きいと、ホルマントが明瞭に定
義されないため、合成音声は押し殺された音をも
つようになる。上記の値は、フオーローマンジヤ
コブソン、モートンアンドコーポレイシヨンにグ
ンナールフアンドが1956年に「ホルマント周波数
からのホルマントレベルとスペクトルエンベロー
プの予測性について」の中で得た平均値B1=80
Hz,B2=80Hz,B3=100Hzに妥当な範囲で一致し
ている。複数個のテスト用句と語からのスペクト
ルを調べることによつて、第4のホルマント中心
周波数には3300Hzという値が与えられた。第1、
第2、第3ホルマントがフイルタの周波数応答強
度を第3ホルマントより大きい周波数に対してオ
クターブ当り36db落させるので、第4ホルマン
トの7738強度は合成音声中で非常に弱い。このよ
うに、もしF4に与えられた値が大きすぎると、
第4ホルマントは完全に消失してしまうだろう
し、もしF4に与えられた値がF3の可能な値の範
囲にあると不自然な共鳴が発生するであろう。上
記の固定された値を用いて、各反射係数Kiは最初
の3のホルマント中心周波数F1,F2,F3の関数
になる。テーラー級数展開を用いると、式(1)は式
(2)にほヾ等しいものとして表わすことができる。
ここでKiはF1=F10,F2=F20,F3=F30として知
られている。
B1=75Hz,B2=50Hz,B3=100Hz,B4=100Hzに
選ばれる。もし1つの値が上記の値より本質的に
小さくなると(30%以上小さなくなると)、合成
音声にブザー状の音があらわれてくる。おそら
く、これは人間音声に対して不自然に長いインパ
ルス応答のためであろう。もう1つの値が上記の
値より本質的に大きいと、ホルマントが明瞭に定
義されないため、合成音声は押し殺された音をも
つようになる。上記の値は、フオーローマンジヤ
コブソン、モートンアンドコーポレイシヨンにグ
ンナールフアンドが1956年に「ホルマント周波数
からのホルマントレベルとスペクトルエンベロー
プの予測性について」の中で得た平均値B1=80
Hz,B2=80Hz,B3=100Hzに妥当な範囲で一致し
ている。複数個のテスト用句と語からのスペクト
ルを調べることによつて、第4のホルマント中心
周波数には3300Hzという値が与えられた。第1、
第2、第3ホルマントがフイルタの周波数応答強
度を第3ホルマントより大きい周波数に対してオ
クターブ当り36db落させるので、第4ホルマン
トの7738強度は合成音声中で非常に弱い。このよ
うに、もしF4に与えられた値が大きすぎると、
第4ホルマントは完全に消失してしまうだろう
し、もしF4に与えられた値がF3の可能な値の範
囲にあると不自然な共鳴が発生するであろう。上
記の固定された値を用いて、各反射係数Kiは最初
の3のホルマント中心周波数F1,F2,F3の関数
になる。テーラー級数展開を用いると、式(1)は式
(2)にほヾ等しいものとして表わすことができる。
ここでKiはF1=F10,F2=F20,F3=F30として知
られている。
(1) Ki=fi(F1,F2,F3)
(2) Kifi(F10,F20,F30)
+∂fi/∂F1(F10,F20,F30)・(F1―F10)
+∂/∂F2fi(F10,F20,F30)・(F2―F20)
+∂/∂F3fi(F10,F20,F30)・(F3―F30)
従つて、もしKiが適当な数のF1,F2,F3の値
に対して知られていれば、知れていないF1,F2,
F3の値に対するKiは線形内挿によつて近似でき
る。不安定なフイルタ係数をさけるために、この
方法を用いて得られたKiの絶対値は1以内に制限
される。更に、合成の間の実際の計算を最少にす
るために偏微分∂f/∂はあらかじめ計算して表とし て格納しておく。
に対して知られていれば、知れていないF1,F2,
F3の値に対するKiは線形内挿によつて近似でき
る。不安定なフイルタ係数をさけるために、この
方法を用いて得られたKiの絶対値は1以内に制限
される。更に、合成の間の実際の計算を最少にす
るために偏微分∂f/∂はあらかじめ計算して表とし て格納しておく。
さて第1a図と第1b図を参照すると、データ
変換装置の実施例の主要な部分を示す論理ブロツ
ク図が示されている。本実施例においては、
ROM12からの300ビツト/秒の符号化データ
流が入力レジスタ100、検索表101、LPC4
レジスタ102へ与えられる。各データ流の前に
は特定のスペースパラメータあるいはN数値が先
行する。これらのスペースパラメータはその流れ
の中にいくつかのフレームが含まれているか、ま
たその流れの中で各特定のパラメータがどれだけ
のフレーム速度で更新されるかを示す符号化デジ
タル数値である。好ましくは、本実施例では、そ
の流れの与えられた音声領域内で本実質的に変更
のあつたパラメータのみを送信するのがより効率
的である。実験によれば、代表的にはスペースパ
ラメータが8フレームのデータに等しい時、また
通常5ないし10フレームの範囲の時に、合成音声
は高品質のものとなる。更に別の符号化因子がそ
の流れが有声か無声かを指定する。簡単なビツト
流れが第2図に示されている。
変換装置の実施例の主要な部分を示す論理ブロツ
ク図が示されている。本実施例においては、
ROM12からの300ビツト/秒の符号化データ
流が入力レジスタ100、検索表101、LPC4
レジスタ102へ与えられる。各データ流の前に
は特定のスペースパラメータあるいはN数値が先
行する。これらのスペースパラメータはその流れ
の中にいくつかのフレームが含まれているか、ま
たその流れの中で各特定のパラメータがどれだけ
のフレーム速度で更新されるかを示す符号化デジ
タル数値である。好ましくは、本実施例では、そ
の流れの与えられた音声領域内で本実質的に変更
のあつたパラメータのみを送信するのがより効率
的である。実験によれば、代表的にはスペースパ
ラメータが8フレームのデータに等しい時、また
通常5ないし10フレームの範囲の時に、合成音声
は高品質のものとなる。更に別の符号化因子がそ
の流れが有声か無声かを指定する。簡単なビツト
流れが第2図に示されている。
無声音の間は、米国特許出願第901393号の合成
装置はK1ないしK4の反射係数を用いる。無声音
はホルマント周波数データを含まず、「ホワイト
ノイズ」の広いスペクトルを有するので、これら
4つの反射係数で無声音合成に十分である。本発
明のデータ変換装置が無声音フレームを検出する
と、LPC4レジスタ102は反射係数K1―K4を受
信し、直接、変換することなしにこれら反射係数
をFIFOバツフア116へ入力する。次にこれら
係数は米国特許出願第901393号の合成装置に受け
入れられるような形に、符号化器117によつて
符号化され、ピツチ及びエネルギーパラメータと
共に合成装置へ入力される。
装置はK1ないしK4の反射係数を用いる。無声音
はホルマント周波数データを含まず、「ホワイト
ノイズ」の広いスペクトルを有するので、これら
4つの反射係数で無声音合成に十分である。本発
明のデータ変換装置が無声音フレームを検出する
と、LPC4レジスタ102は反射係数K1―K4を受
信し、直接、変換することなしにこれら反射係数
をFIFOバツフア116へ入力する。次にこれら
係数は米国特許出願第901393号の合成装置に受け
入れられるような形に、符号化器117によつて
符号化され、ピツチ及びエネルギーパラメータと
共に合成装置へ入力される。
有声音フレームの間は、検索表101がスペー
スパラメータNを解読し、そのスペースパラメー
タを比較セル104へ入力する。比較セル104
はフレームム計数器105からクロツク信号を受
けており、各フレームが発生する毎に、そのフレ
ームがその中でパラメータ更新すべきかどうかを
決定し、どのパラメータを更新するかを決定する
ようになつている。更新ラインは計数器105を
制御し、それは入力レジスタ100が与えられた
変更パラメータの符号化値にラツチされるのを許
容する。検索表103はレジスタ100の出力を
解読し、ピツチ、エネルギー、ホルマントデータ
の実際の値を内挿レジスタ106へ供給する。こ
れらのピツチ、エネルギー、ホルマント周波数の
最初値は目標値として格納されれ、全手順がくり
かえされる。各々のパラメータについてひきつづ
く2つの値が内挿レジスタ106中につくられる
と、内挿器107は標準的な内挿計算を実行して
所定の速さで言語パラメータの一定の流れを発生
する。内挿器107はまた入力として比較セル1
04からのスペースパラメータNを有している。
これは、本発明では、特定のパラメータが他のパ
ラメータよりもより頻繁に更新されることが好ま
しいからである。従つて、スペースパラメータ
は、すべての音声パラメータの一定の定常的流れ
を発生するために任意の与えられたパラメータの
2つのひきつづく値の間で何回の内挿が必要であ
るかを決定するために必要な入力である。ピツチ
とエネルギーの因子は内挿器107からとり出さ
れてFIFOバツフア116中へラツチされ、内挿
されたホルマント周波数データが反射係数へ処理
される間待機する。
スパラメータNを解読し、そのスペースパラメー
タを比較セル104へ入力する。比較セル104
はフレームム計数器105からクロツク信号を受
けており、各フレームが発生する毎に、そのフレ
ームがその中でパラメータ更新すべきかどうかを
決定し、どのパラメータを更新するかを決定する
ようになつている。更新ラインは計数器105を
制御し、それは入力レジスタ100が与えられた
変更パラメータの符号化値にラツチされるのを許
容する。検索表103はレジスタ100の出力を
解読し、ピツチ、エネルギー、ホルマントデータ
の実際の値を内挿レジスタ106へ供給する。こ
れらのピツチ、エネルギー、ホルマント周波数の
最初値は目標値として格納されれ、全手順がくり
かえされる。各々のパラメータについてひきつづ
く2つの値が内挿レジスタ106中につくられる
と、内挿器107は標準的な内挿計算を実行して
所定の速さで言語パラメータの一定の流れを発生
する。内挿器107はまた入力として比較セル1
04からのスペースパラメータNを有している。
これは、本発明では、特定のパラメータが他のパ
ラメータよりもより頻繁に更新されることが好ま
しいからである。従つて、スペースパラメータ
は、すべての音声パラメータの一定の定常的流れ
を発生するために任意の与えられたパラメータの
2つのひきつづく値の間で何回の内挿が必要であ
るかを決定するために必要な入力である。ピツチ
とエネルギーの因子は内挿器107からとり出さ
れてFIFOバツフア116中へラツチされ、内挿
されたホルマント周波数データが反射係数へ処理
される間待機する。
読出し専用記憶装置(ROM)108は特定の
あらかじめ定められたホルマント中心周波数の選
ばれた値を記憶する。比較器109は最初のホル
マント中心周波数にラツチされ、そのホルマント
に対して記憶されている値のうちで最も良く一致
するものを決定するために、ROM108との間
ですべての値についてくりかえして比較を行な
う。選ばれた値がとり出されてレジスタ及び符号
化器111へラツチされ、エラー信号あるいは第
1ホルマントの実際の値と記憶されている最良一
致との間の差異が乗算器114へ出力される。こ
の操作が第2、第3のホルマントに対してもくり
かえされる。実験によれば、本発明では、第1と
第2のホルマント中心周波数に対して3つのとり
うる値また第3のホルマント中心周波数に対して
2つの値だけで、ROM108に記憶されていれ
ば、許容できる品質の合成音声を作成することが
できる。レジスタ符号化器111は3つのホルマ
ント周波数すべてにラツチされた後に、その特定
の組合せを表わす符号化信号を解読器及びROM
113へ供給し、RMO113内であらかじめ計
算された値i,∂i/∂F1,∂i/∂F2,∂i/∂
F3の位置を示す 部分的番地として働く。これらの値は最良一致の
ホルマントとそれの偏微分の各々に対するほん訳
された反射係数である。K計数器112は所定の
反射係数値K1―K8を通すくりかえしによつて、
ROM113内の番地の残りの部分を提供する。
米国特許出願第901393号に詳細に述べられた音声
合成装置の実施例は10の反射係数K1―K10を用い
ているが、本発明者によつて、K9とK10を固定す
ることによつて、本発明を併用した米国特許出願
第901393号の合成装置で得られる音声の品質はそ
れ程低下しないことが確められている。このよう
にして、8の反射係数がホルマント周波数の18の
可能な組合せ(3×3×2)の各々に対して用い
られ、各反応係数に対して4つの値が記憶されて
いるから(i,∂i/∂F1,∂i/∂F2,∂i/∂
F3)、ROM11 3に必要とされる記憶容量は576バイト(18×8
×4)だけである。その時のホルマント周波数の
組合せに対して各反射係数あるいはK値がROM
113中で番地指定されると、i,∂i/∂F1,∂
i/∂F2, ∂i/∂F3に対する値が乗算器114へとり出される
。
あらかじめ定められたホルマント中心周波数の選
ばれた値を記憶する。比較器109は最初のホル
マント中心周波数にラツチされ、そのホルマント
に対して記憶されている値のうちで最も良く一致
するものを決定するために、ROM108との間
ですべての値についてくりかえして比較を行な
う。選ばれた値がとり出されてレジスタ及び符号
化器111へラツチされ、エラー信号あるいは第
1ホルマントの実際の値と記憶されている最良一
致との間の差異が乗算器114へ出力される。こ
の操作が第2、第3のホルマントに対してもくり
かえされる。実験によれば、本発明では、第1と
第2のホルマント中心周波数に対して3つのとり
うる値また第3のホルマント中心周波数に対して
2つの値だけで、ROM108に記憶されていれ
ば、許容できる品質の合成音声を作成することが
できる。レジスタ符号化器111は3つのホルマ
ント周波数すべてにラツチされた後に、その特定
の組合せを表わす符号化信号を解読器及びROM
113へ供給し、RMO113内であらかじめ計
算された値i,∂i/∂F1,∂i/∂F2,∂i/∂
F3の位置を示す 部分的番地として働く。これらの値は最良一致の
ホルマントとそれの偏微分の各々に対するほん訳
された反射係数である。K計数器112は所定の
反射係数値K1―K8を通すくりかえしによつて、
ROM113内の番地の残りの部分を提供する。
米国特許出願第901393号に詳細に述べられた音声
合成装置の実施例は10の反射係数K1―K10を用い
ているが、本発明者によつて、K9とK10を固定す
ることによつて、本発明を併用した米国特許出願
第901393号の合成装置で得られる音声の品質はそ
れ程低下しないことが確められている。このよう
にして、8の反射係数がホルマント周波数の18の
可能な組合せ(3×3×2)の各々に対して用い
られ、各反応係数に対して4つの値が記憶されて
いるから(i,∂i/∂F1,∂i/∂F2,∂i/∂
F3)、ROM11 3に必要とされる記憶容量は576バイト(18×8
×4)だけである。その時のホルマント周波数の
組合せに対して各反射係数あるいはK値がROM
113中で番地指定されると、i,∂i/∂F1,∂
i/∂F2, ∂i/∂F3に対する値が乗算器114へとり出される
。
乗算器114は偏微分の各々と比較器109から
出力された適正なエラー信号とを乗算し、直列式
加算器115がそれら積を加算する。従つて直列
式加算器115の出力が式(2)の解になる。このよ
うにして、乗算器114と直列式加算器115の
働きによつて、既知の反射係数とエラー信号が入
力ホルマント周波数に対応した適切な反射係数へ
変換される。i=1〜8に対するKiの各値が計算
されてFIFOバツフア116へラツチされる。全
データフレームがFIFOバツフア116へラツチ
されると、それは符号化器117によつて、米国
特許出願第901393号の合成装置に必要とされるホ
ルマントへ符号化されれ、合成装置へ入力され
る。
出力された適正なエラー信号とを乗算し、直列式
加算器115がそれら積を加算する。従つて直列
式加算器115の出力が式(2)の解になる。このよ
うにして、乗算器114と直列式加算器115の
働きによつて、既知の反射係数とエラー信号が入
力ホルマント周波数に対応した適切な反射係数へ
変換される。i=1〜8に対するKiの各値が計算
されてFIFOバツフア116へラツチされる。全
データフレームがFIFOバツフア116へラツチ
されると、それは符号化器117によつて、米国
特許出願第901393号の合成装置に必要とされるホ
ルマントへ符号化されれ、合成装置へ入力され
る。
本発明のデータ変換装置は、米国特許出願第
901393号の音声合成装置と共に用いる形で説明し
てきたが、当業者にとつては、ホルマント中心周
波数データを音声合成装置制御情報へ変換するた
めの実時間変換回路が、そのようなフイルタ制御
係数を用いる任意の音声合成装置に用いられるこ
とは明らかであろう。符号化器117の符号化回
路を単に変更することでも、本発明は、ここに述
べた量子化反射係数システムの他自動相関係数あ
るいは部分的自動相関係数を用いたシステムに対
しても有用である。従つて、特許請求の範囲は、
本発明の真の範囲に含まれるこれら及び他の変更
あるいは実施例を包含すると理解されるべきであ
る。
901393号の音声合成装置と共に用いる形で説明し
てきたが、当業者にとつては、ホルマント中心周
波数データを音声合成装置制御情報へ変換するた
めの実時間変換回路が、そのようなフイルタ制御
係数を用いる任意の音声合成装置に用いられるこ
とは明らかであろう。符号化器117の符号化回
路を単に変更することでも、本発明は、ここに述
べた量子化反射係数システムの他自動相関係数あ
るいは部分的自動相関係数を用いたシステムに対
しても有用である。従つて、特許請求の範囲は、
本発明の真の範囲に含まれるこれら及び他の変更
あるいは実施例を包含すると理解されるべきであ
る。
以上の説明に関連して更に以下の項を開示す
る。
る。
(1) デジタルフイルタ制御データによつて制御さ
れるデジタルフイルタを有する音声合成装置に
用いるためのデータ変換装置であつて、 (a) 人間の音声の分析によつて得られるホルマ
ント周波数データを受信するための入力装
置、 (b) 上記入力装置に結合され、上記ホルマント
周波数データをデジタルフイルタの制御デー
タに変換するためのデジタル変換器回路装
置、 (c) 上記デジタル変換器回路装置に結合され、
上記デジタルフイルタ制御データを上記デジ
タルフイルタへ出力するための出力装置、 を含むデータ変換装置。
れるデジタルフイルタを有する音声合成装置に
用いるためのデータ変換装置であつて、 (a) 人間の音声の分析によつて得られるホルマ
ント周波数データを受信するための入力装
置、 (b) 上記入力装置に結合され、上記ホルマント
周波数データをデジタルフイルタの制御デー
タに変換するためのデジタル変換器回路装
置、 (c) 上記デジタル変換器回路装置に結合され、
上記デジタルフイルタ制御データを上記デジ
タルフイルタへ出力するための出力装置、 を含むデータ変換装置。
(2) 第1項のデータ変換装置であつて、上記デー
タ変換装置が、1個のモノリシツクな半導体回
路装置として集積化できるような、データ変換
装置。
タ変換装置が、1個のモノリシツクな半導体回
路装置として集積化できるような、データ変換
装置。
(3) 第1項のデータ変換装置であつて、上記ホル
マント周波数データが、人間の音声の最初の3
つのホルマントの中心周波数であるデータ変換
装置。
マント周波数データが、人間の音声の最初の3
つのホルマントの中心周波数であるデータ変換
装置。
(4) 第1項のデータ変換装置であつて、上記デジ
タルフイルタ制御データが量子化された反射係
数の形をとつているデータ変換装置。
タルフイルタ制御データが量子化された反射係
数の形をとつているデータ変換装置。
(5) 人間音声の分析で得られたホルマント周波数
の組をデジタルフイルタ制御データへ変換する
ためのデータ変換装置であつて、 (a) ホルマント周波数の複数の入力組を受信す
るための入力装置、 (b) ホルマント周波数のあらかじめ定められた
モデル組を格納するための記憶装置、 (c) 上記入力装置と上記記憶装置とに結合され
て、上記ホルマント周波数のモデル組のうち
のどの1組が、上記入力装置により受信され
るホルマント周波数の上記入力組の各々に対
し、最も類似しているかを決定するための比
較装置、 (d) 上記入力装置と上記比較装置に結合され、
上記ホルマント周波数のモデル組の上記選択
された1組とホルマント周波数の上記入力組
との間の差異を表示するエラー信号を発生す
るためのエラー信号発生装置、 (e) 上記比較装置に結合され、ホルマント周波
数の上記モデル組のうちの上記選択された1
組をデジタルフイルタ制御データのモデル組
へ変形するための変形装置、 (f) 上記変換装置と上記エラー信号発生装置と
に結合され、上記エラー信号に応答してデジ
タルフイルタ制御データの上記モデル組を、
ホルマント周波数の上記入力組を伴なう1組
のデジタルフイルタ制御データへ修正するた
めの修正装置、 を含むようなデータ変換装置。
の組をデジタルフイルタ制御データへ変換する
ためのデータ変換装置であつて、 (a) ホルマント周波数の複数の入力組を受信す
るための入力装置、 (b) ホルマント周波数のあらかじめ定められた
モデル組を格納するための記憶装置、 (c) 上記入力装置と上記記憶装置とに結合され
て、上記ホルマント周波数のモデル組のうち
のどの1組が、上記入力装置により受信され
るホルマント周波数の上記入力組の各々に対
し、最も類似しているかを決定するための比
較装置、 (d) 上記入力装置と上記比較装置に結合され、
上記ホルマント周波数のモデル組の上記選択
された1組とホルマント周波数の上記入力組
との間の差異を表示するエラー信号を発生す
るためのエラー信号発生装置、 (e) 上記比較装置に結合され、ホルマント周波
数の上記モデル組のうちの上記選択された1
組をデジタルフイルタ制御データのモデル組
へ変形するための変形装置、 (f) 上記変換装置と上記エラー信号発生装置と
に結合され、上記エラー信号に応答してデジ
タルフイルタ制御データの上記モデル組を、
ホルマント周波数の上記入力組を伴なう1組
のデジタルフイルタ制御データへ修正するた
めの修正装置、 を含むようなデータ変換装置。
(6) 第5項のデータ変換装置であつて、上記デー
タ変換装置がモノリシツクな半導体回路装置と
して集積化できるデータ変換装置。
タ変換装置がモノリシツクな半導体回路装置と
して集積化できるデータ変換装置。
(7) 第5項のデータ変換装置であつて、ホルマン
ト周波数の上記組が人間音声の最初の3つのホ
ルマントの中心周波数であるデータ変換装置。
ト周波数の上記組が人間音声の最初の3つのホ
ルマントの中心周波数であるデータ変換装置。
(8) 第5項のデータ変換装置であつて、上記デジ
タルフイルタ制御データが量子化された反射係
数であるデータ変換装置。
タルフイルタ制御データが量子化された反射係
数であるデータ変換装置。
(9) 第7項のデータ変換装置であつて、ホルマン
ト周波数の上記モデル組が人間言語の最初の3
つのホルマントの各々に対して、少なくとも2
つの異なる中心周波数を含んでいるデータ変換
装置。
ト周波数の上記モデル組が人間言語の最初の3
つのホルマントの各々に対して、少なくとも2
つの異なる中心周波数を含んでいるデータ変換
装置。
(10) 第5項のデータ変換装置であつて、上記記憶
装置が読み出し専用記憶(ROM)装置である
データ変換装置。
装置が読み出し専用記憶(ROM)装置である
データ変換装置。
(11) 第5項のデータ変換装置であつて、上記エラ
ー信号発生装置が、ホルマント周波数の上記入
力組からホルマント周波数の上記モデル組の上
記選択された1組を差引くための引算装置を含
むデータ変換装置。
ー信号発生装置が、ホルマント周波数の上記入
力組からホルマント周波数の上記モデル組の上
記選択された1組を差引くための引算装置を含
むデータ変換装置。
(12) 第5項のデータ変換装置であつて、上記変形
装置が、ホルマント周波数の上記モデル組の上
記選択された1組を表わす数値によつて選択的
に番地指定される読出し専用記憶装置であるデ
ータ変換装置。
装置が、ホルマント周波数の上記モデル組の上
記選択された1組を表わす数値によつて選択的
に番地指定される読出し専用記憶装置であるデ
ータ変換装置。
(13) 第5項のデータ変換装置であつて、上記修
正装置が、上記エラー信号に応答してデジタル
フイルタ制御データの上記モデル組を修正する
ための乗算器と直列式加算器を含むデータ変換
装置。
正装置が、上記エラー信号に応答してデジタル
フイルタ制御データの上記モデル組を修正する
ための乗算器と直列式加算器を含むデータ変換
装置。
(14) 音声合成システムであつて、
(a) 人間音声の分析によつて得られた選択され
たホルマント周波数データを格納するための
記憶装置、 (b) 上記記憶装置に結合され、上記ホルマント
周波数データをデジタルフイルタの制御デー
タへ変換するためのデータ変換装置、 (c) 合成装置であつて、上記データ変換装置に
結合されたデジタルフイルタを含み、上記デ
ジタルフイルタ制御データに応答して、上記
デジタルフイルタの出力へ、人間音声を再生
するアナログ信号を生成するための合成装
置、 (d) 発音装置であつて、トランスジユサを含
み、人間音声を表わす上記アナログ信号を可
聴信号へ変換するための発音装置、 を含む音声合成システム。
たホルマント周波数データを格納するための
記憶装置、 (b) 上記記憶装置に結合され、上記ホルマント
周波数データをデジタルフイルタの制御デー
タへ変換するためのデータ変換装置、 (c) 合成装置であつて、上記データ変換装置に
結合されたデジタルフイルタを含み、上記デ
ジタルフイルタ制御データに応答して、上記
デジタルフイルタの出力へ、人間音声を再生
するアナログ信号を生成するための合成装
置、 (d) 発音装置であつて、トランスジユサを含
み、人間音声を表わす上記アナログ信号を可
聴信号へ変換するための発音装置、 を含む音声合成システム。
(15) 第14項の音声合成システムであつて、上記
記憶装置が1個のモノリシツク半導体回路装置
として集積化できる音声合成システム。
記憶装置が1個のモノリシツク半導体回路装置
として集積化できる音声合成システム。
(16) 第14項の音声合成システムであつて、上記
データ変換装置が、1個のモノリシツク半導体
回路装置として集積化できる音声合成システ
ム。
データ変換装置が、1個のモノリシツク半導体
回路装置として集積化できる音声合成システ
ム。
(17) 第14項の音声合成システムであつて、上記
合成装置が、1個のモノリシツク半導体回路装
置として集積化できる音声合成システム。
合成装置が、1個のモノリシツク半導体回路装
置として集積化できる音声合成システム。
(18) 第14項の音声合成システムであつて、上記
ホルマント周波数データが人間音声の最初の3
つのホルマントの各々の中心周波数である音声
合成システム。
ホルマント周波数データが人間音声の最初の3
つのホルマントの各々の中心周波数である音声
合成システム。
(19) 第14項の音声合成システムであつて、上記
デジタルフイルタ制御データが量子化された反
射係数である音声合成システム。
デジタルフイルタ制御データが量子化された反
射係数である音声合成システム。
第1a図及び第1b図は、データ変換装置の主
たる部品を示すブロツク図である。第2図はデー
タ変換装置と共に用いれるビツト流の例を示す。 参照番号、12……読出し専用記憶装置
(ROM)、100……入力レジスタ、101……
検索表、102……LPC4レジスタ、103…
…検索表、104……比較セル、105……フレ
ーム計数器、106……内挿レジスタ、107…
…内挿器、108……ROM、109……比較
器、110……計数器、111……レジスタ符号
化器、112……K計数器、113……ROM、
114……乗算器、115……直列式加算器、1
16……FIFOバツフア、117……符号化器、
118……音声合成装置。
たる部品を示すブロツク図である。第2図はデー
タ変換装置と共に用いれるビツト流の例を示す。 参照番号、12……読出し専用記憶装置
(ROM)、100……入力レジスタ、101……
検索表、102……LPC4レジスタ、103…
…検索表、104……比較セル、105……フレ
ーム計数器、106……内挿レジスタ、107…
…内挿器、108……ROM、109……比較
器、110……計数器、111……レジスタ符号
化器、112……K計数器、113……ROM、
114……乗算器、115……直列式加算器、1
16……FIFOバツフア、117……符号化器、
118……音声合成装置。
Claims (1)
- 【特許請求の範囲】 1 デジタルフイルタの制御データによつて制御
されるデジタルフイルタを有する音声合成装置に
用いるためのデータ変換装置であつて、 (a) 人間の音声の分析によつて得られるホルマン
ト周波数の複数の入力組を受信するための入力
装置、 (b) ホルマント周波数の予め定められたモデル組
を格納するための記憶装置、 (c) 上記入力装置と上記記憶装置に結合され、上
記モデル組のうちのどの1組が上記入力装置に
より受信されるホルマント周波数の上記入力組
の各々に対し、最も近似しているかを決定する
ための比較装置、 (d) 上記入力装置と上記比較装置とに結合され、
上記ホルマント周波数のモデル組の上記選ばれ
た1組とホルマント周波数の上記入力組との間
の差異を表示するエラー信号発生装置、 (e) 上記比較装置に結合され、ホルマント周波数
の上記モデル組のうちの上記選ばれた1組をデ
ジタルフイルタ制御データのモデル組へ変形す
る変形装置、 (f) 上記変形装置と上記エラー信号発生装置とに
結合され、上記エラー信号に応答してデジタル
フイルタ制御データの上記モデル組を、ホルマ
ント周波数の上記入力組に対応したデジタルフ
イルタ制御データへ変換するための変換装置、 (g) 上記変換装置に結合され、上記デジタルフイ
ルタ制御データを上記デジタルフイルタへ出力
するための出力装置、 を含むデータ変換装置。 2 音声合成システムであつて、 (a) 人間の音声の分析によつて得られるホルマン
ト周波数の複数の入力組を受信するための入力
装置、 (b) 人間の音声の分析によつて得られた選択され
たホルマント周波数のモデル組を格納するため
の記憶装置、 (c) 上記入力装置と上記記憶装置に結合され、上
記モデル組のうちのどの1組が、上記入力装置
により受信されるホルマント周波数の上記入力
組の各々に対し、最も近似しているかを決定す
るための比較装置、 (d) 上記入力装置と上記比較装置とに結合され、
上記ホルマント周波数のモデル組の上記選ばれ
た1組とホルマント周波数の上記入力組との間
の差異を表示するエラー信号発生装置、 (e) 上記比較装置に結合され、ホルマント周波数
の上記モデル組のうちの上記選ばれた1組をデ
ジタルフイルタ制御データのモデル組へ変形す
る変形装置、 (f) 上記変形装置と上記エラー信号発生装置とに
結合され、上記エラー信号に応答してデジタル
フイルタ制御データの上記モデル組を、ホルマ
ント周波数の上記入力組に対応したデジタルフ
イルタ制御データへ変換するための変換装置、 (g) 合成装置であつて、上記データ変換装置に結
合されたデジタルフイルタを含み、上記デジタ
ルフイルタ制御データに応答して、上記デジタ
ルフイルタの出力に、人間音声を再生するアナ
ログ信号を生成するための合成装置、 (h) 発生装置であつて、トランスジユサを含み、
人間音声を表わす上記アナログ信号を可聴信号
に変換するための発音装置、 を含む音声合成システム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US06/042,737 US4304965A (en) | 1979-05-29 | 1979-05-29 | Data converter for a speech synthesizer |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS55161300A JPS55161300A (en) | 1980-12-15 |
| JPH0160840B2 true JPH0160840B2 (ja) | 1989-12-26 |
Family
ID=21923489
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7023780A Granted JPS55161300A (en) | 1979-05-29 | 1980-05-28 | Data converter |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US4304965A (ja) |
| JP (1) | JPS55161300A (ja) |
| DE (1) | DE3019823A1 (ja) |
| FR (1) | FR2458121B1 (ja) |
| GB (1) | GB2050125B (ja) |
Families Citing this family (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4661915A (en) * | 1981-08-03 | 1987-04-28 | Texas Instruments Incorporated | Allophone vocoder |
| EP0107659A4 (en) * | 1982-04-29 | 1985-02-18 | Massachusetts Inst Technology | VOICE ENCODER AND SYNTHESIZER. |
| US4624012A (en) | 1982-05-06 | 1986-11-18 | Texas Instruments Incorporated | Method and apparatus for converting voice characteristics of synthesized speech |
| JPS58196598A (ja) * | 1982-05-13 | 1983-11-16 | 日本電気株式会社 | 法則型音声合成装置 |
| US4675840A (en) * | 1983-02-24 | 1987-06-23 | Jostens Learning Systems, Inc. | Speech processor system with auxiliary memory access |
| US4639877A (en) * | 1983-02-24 | 1987-01-27 | Jostens Learning Systems, Inc. | Phrase-programmable digital speech system |
| US4703505A (en) * | 1983-08-24 | 1987-10-27 | Harris Corporation | Speech data encoding scheme |
| US4797930A (en) * | 1983-11-03 | 1989-01-10 | Texas Instruments Incorporated | constructed syllable pitch patterns from phonological linguistic unit string data |
| EP0170087B1 (en) * | 1984-07-04 | 1992-09-23 | Kabushiki Kaisha Toshiba | Method and apparatus for analyzing and synthesizing human speech |
| KR950007859B1 (ko) * | 1986-01-03 | 1995-07-20 | 모토로라 인코포레이티드 | 음성화 혹은 핏치정보 없이 음성을 합성하는 방법 및 장치 |
| US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
| US4905177A (en) * | 1988-01-19 | 1990-02-27 | Qualcomm, Inc. | High resolution phase to sine amplitude conversion |
| JPH03136100A (ja) * | 1989-10-20 | 1991-06-10 | Canon Inc | 音声処理方法及び装置 |
| US6032028A (en) * | 1996-04-12 | 2000-02-29 | Continentral Electronics Corporation | Radio transmitter apparatus and method |
| JP3444131B2 (ja) * | 1997-02-27 | 2003-09-08 | ヤマハ株式会社 | 音声符号化及び復号装置 |
| US11471088B1 (en) * | 2015-05-19 | 2022-10-18 | The Board Of Trustees Of The Leland Stanford Junior University | Handheld or wearable device for recording or sonifying brain signals |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3828132A (en) * | 1970-10-30 | 1974-08-06 | Bell Telephone Labor Inc | Speech synthesis by concatenation of formant encoded words |
| US3808370A (en) * | 1972-08-09 | 1974-04-30 | Rockland Systems Corp | System using adaptive filter for determining characteristics of an input |
| FR2238412A5 (ja) * | 1973-07-20 | 1975-02-14 | Trt Telecom Radio Electr | |
| JPS5515720B2 (ja) * | 1973-07-31 | 1980-04-25 | ||
| DE2435654C2 (de) * | 1974-07-24 | 1983-11-17 | Gretag AG, 8105 Regensdorf, Zürich | Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache |
| US3975587A (en) * | 1974-09-13 | 1976-08-17 | International Telephone And Telegraph Corporation | Digital vocoder |
| US4058676A (en) * | 1975-07-07 | 1977-11-15 | International Communication Sciences | Speech analysis and synthesis system |
| JPS5228211A (en) * | 1975-08-28 | 1977-03-03 | Nippon Telegr & Teleph Corp <Ntt> | Tone analysis and composite system |
| GB2020077B (en) * | 1978-04-28 | 1983-01-12 | Texas Instruments Inc | Learning aid or game having miniature electronic speech synthesizer chip |
-
1979
- 1979-05-29 US US06/042,737 patent/US4304965A/en not_active Expired - Lifetime
-
1980
- 1980-05-01 GB GB8014537A patent/GB2050125B/en not_active Expired
- 1980-05-23 DE DE19803019823 patent/DE3019823A1/de active Granted
- 1980-05-28 JP JP7023780A patent/JPS55161300A/ja active Granted
- 1980-05-29 FR FR8011919A patent/FR2458121B1/fr not_active Expired
Also Published As
| Publication number | Publication date |
|---|---|
| DE3019823A1 (de) | 1980-12-11 |
| US4304965A (en) | 1981-12-08 |
| JPS55161300A (en) | 1980-12-15 |
| GB2050125A (en) | 1980-12-31 |
| FR2458121A1 (fr) | 1980-12-26 |
| DE3019823C2 (ja) | 1989-06-15 |
| GB2050125B (en) | 1984-03-07 |
| FR2458121B1 (fr) | 1985-12-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4435832A (en) | Speech synthesizer having speech time stretch and compression functions | |
| JPH0160840B2 (ja) | ||
| EP1308928B1 (en) | System and method for speech synthesis using a smoothing filter | |
| US3982070A (en) | Phase vocoder speech synthesis system | |
| JP3294604B2 (ja) | 波形の加算重畳による音声合成のための処理装置 | |
| JP3563772B2 (ja) | 音声合成方法及び装置並びに音声合成制御方法及び装置 | |
| US3995116A (en) | Emphasis controlled speech synthesizer | |
| EP0030390A1 (en) | Sound synthesizer | |
| EP1160771A1 (en) | Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals | |
| JPS5930280B2 (ja) | 音声合成装置 | |
| JPH10319996A (ja) | 雑音の効率的分解と波形補間における周期信号波形 | |
| US4716591A (en) | Speech synthesis method and device | |
| EP0391545B1 (en) | Speech synthesizer | |
| US4700393A (en) | Speech synthesizer with variable speed of speech | |
| EP0063602A1 (en) | Filter system for modelling a sound channel and speech synthesizer using the same | |
| US4541111A (en) | LSP Voice synthesizer | |
| JPH03136100A (ja) | 音声処理方法及び装置 | |
| US4601052A (en) | Voice analysis composing method | |
| EP1543497B1 (en) | Method of synthesis for a steady sound signal | |
| JPH10222197A (ja) | 音声合成方法およびコード励振線形予測合成装置 | |
| US4633500A (en) | Speech synthesizer | |
| JP2003066983A (ja) | 音声合成装置および音声合成方法、並びに、プログラム記録媒体 | |
| JP2956936B2 (ja) | 音声合成装置の発声速度制御回路 | |
| JPS6136800A (ja) | 可変長フレ−ム音声分析合成方式 | |
| EP1326236B1 (en) | Efficient implementation of joint optimization of excitation and model parameters in multipulse speech coders |