JPH051957B2 - - Google Patents
Info
- Publication number
- JPH051957B2 JPH051957B2 JP59143045A JP14304584A JPH051957B2 JP H051957 B2 JPH051957 B2 JP H051957B2 JP 59143045 A JP59143045 A JP 59143045A JP 14304584 A JP14304584 A JP 14304584A JP H051957 B2 JPH051957 B2 JP H051957B2
- Authority
- JP
- Japan
- Prior art keywords
- csm
- phase
- phase reset
- speech
- window function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Piezo-Electric Transducers For Audible Bands (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
Description
【発明の詳細な説明】
(技術分野)
本発明はCSM型音声合成器、すなわち高々4
〜6波の周波数で表現されるCSM(Composite
Sinusoidal Modeling:複合正弦波モデル)を用
いて音声を合成する音声合成器に関する。
〜6波の周波数で表現されるCSM(Composite
Sinusoidal Modeling:複合正弦波モデル)を用
いて音声を合成する音声合成器に関する。
(従来技術)
音声合成器として従来LPC型音声合成器が広
く用いられているが、LPC型音声合成器は一般
に構造が複雑である。また音声合成に用いる
LPCフイルタの特性が、パラメータ伝送時のエ
ラー等によりその安定性が損なわれるという欠点
がある。
く用いられているが、LPC型音声合成器は一般
に構造が複雑である。また音声合成に用いる
LPCフイルタの特性が、パラメータ伝送時のエ
ラー等によりその安定性が損なわれるという欠点
がある。
これに対してCSMを用いて音声合成を行なう
CSM型音声合成器は、後に詳述するように、フ
イルタを有しておらずその構造が非常に簡単であ
り、本質的に合成時における安定性の問題を生ず
ることはない。
CSM型音声合成器は、後に詳述するように、フ
イルタを有しておらずその構造が非常に簡単であ
り、本質的に合成時における安定性の問題を生ず
ることはない。
しかしながら、高々4〜6波の周波数で表現さ
れるCSMを用いて音声を合成するためには、単
にこれらを線形結合するだけでは全く不充分で、
これ以外にいくつかの特別の処理をすることが必
要である。これらの処理については現在一般に必
ずしも明確に知られておらず、とくにCSMを用
いて音声合成を行なう場合におけるスペクトルの
拡散性、無音声の発生法、パラメータの補間法等
が確立しておらず、従つてCSM型音声合成器は
まだ実用化されているとはいい難い。
れるCSMを用いて音声を合成するためには、単
にこれらを線形結合するだけでは全く不充分で、
これ以外にいくつかの特別の処理をすることが必
要である。これらの処理については現在一般に必
ずしも明確に知られておらず、とくにCSMを用
いて音声合成を行なう場合におけるスペクトルの
拡散性、無音声の発生法、パラメータの補間法等
が確立しておらず、従つてCSM型音声合成器は
まだ実用化されているとはいい難い。
(発明の目的)
本発明の目的は、CSMを用いて音声合成を行
なう場合における上述の種々の問題を解決して、
実用的なCSM型音声合成器を提供することにあ
る。
なう場合における上述の種々の問題を解決して、
実用的なCSM型音声合成器を提供することにあ
る。
(発明の構成)
本発明の合成器は、CSMの指定する各周波数
に設定される複数の位相リセツト機能付可変周波
数発振器と、これに対応して前記各発振器の出力
をCSMの指定する各強度に設定する複数の可変
利得増幅器と、可変長窓関数発生器と、乱数発生
器とを備え有声音合成時にはピツチ周期に対応し
て前記各発振器の位相リセツトを行ないまた無声
音合成時には前記乱数発生器の出力を乱数より算
出される分布幅と下限値とを設定された周期に対
応して前記各発振器の位相リセツトを行ない前記
可変長窓関数発生器で発生される始点が1かつ終
点が0であり連続性を有する可変長の窓関数の開
始時点および終止時点が上記位相リセツトの時点
とほぼ一致するようにしている。
に設定される複数の位相リセツト機能付可変周波
数発振器と、これに対応して前記各発振器の出力
をCSMの指定する各強度に設定する複数の可変
利得増幅器と、可変長窓関数発生器と、乱数発生
器とを備え有声音合成時にはピツチ周期に対応し
て前記各発振器の位相リセツトを行ないまた無声
音合成時には前記乱数発生器の出力を乱数より算
出される分布幅と下限値とを設定された周期に対
応して前記各発振器の位相リセツトを行ない前記
可変長窓関数発生器で発生される始点が1かつ終
点が0であり連続性を有する可変長の窓関数の開
始時点および終止時点が上記位相リセツトの時点
とほぼ一致するようにしている。
(原理)
最初にCSM型音声合成器の原理について説明
する。
する。
CSMとは、音声信号を、振幅と周波数とを自
由に選べるパラメータとしてもつ特定の個数の正
弦波の和として、表現するものである。この正弦
波の個数としては高々4〜6個の予め定めた数が
用いられる。
由に選べるパラメータとしてもつ特定の個数の正
弦波の和として、表現するものである。この正弦
波の個数としては高々4〜6個の予め定めた数が
用いられる。
従つてCSM音声合成を行なう場合には、まず、
音声信号はCSM音声分析により、予め定められ
た個数の正弦波の和として表現する必要がある。
CSM音声分析については後に詳述することとし、
ここではその要点のみを説明する。
音声信号はCSM音声分析により、予め定められ
た個数の正弦波の和として表現する必要がある。
CSM音声分析については後に詳述することとし、
ここではその要点のみを説明する。
CSM分析においてもLPC分析の場合と同様に、
位相情報の無視、音源の影響の平均化、雑音成分
による不安定性の回避等を目的に、中間パラメー
タとして自己相関係数を使用する。
位相情報の無視、音源の影響の平均化、雑音成分
による不安定性の回避等を目的に、中間パラメー
タとして自己相関係数を使用する。
すなわち、CSM分析は、各分析フレーム毎に
表現されるべき音声波形から直接算出される標本
自己相関係数の低次のタツプのN個を、合成波の
自己相関係数の低次のタツプのN個と一致するよ
うに、合成すべき各正弦波の周波数およびその強
度(電力振幅)を決定することである。
表現されるべき音声波形から直接算出される標本
自己相関係数の低次のタツプのN個を、合成波の
自己相関係数の低次のタツプのN個と一致するよ
うに、合成すべき各正弦波の周波数およびその強
度(電力振幅)を決定することである。
今、合成すべき正弦波の個数をnとし、各正弦
波の角周波数をωi(i=1,2、……n)、各正弦
波の強度をmiとすると、CSMの合成波ytは、 yt=o 〓i=1 √isin(ωit+φi) となるが、このタツプlの自己相関係数γlは
ωi,miを用いて容易に表され、 γl=o 〓i=1 micoslωi である。
波の角周波数をωi(i=1,2、……n)、各正弦
波の強度をmiとすると、CSMの合成波ytは、 yt=o 〓i=1 √isin(ωit+φi) となるが、このタツプlの自己相関係数γlは
ωi,miを用いて容易に表され、 γl=o 〓i=1 micoslωi である。
一方、表現されるべき音声波形のサンプルを
Xtとすると、あるフレームにおけるタツプlの
標本自己相関係数vlは vl=1/MM-1 〓t=l XtXt−l として与えられる。但し、Mは1分析フレーム
におけるサンプル数である。
Xtとすると、あるフレームにおけるタツプlの
標本自己相関係数vlは vl=1/MM-1 〓t=l XtXt−l として与えられる。但し、Mは1分析フレーム
におけるサンプル数である。
さて、CSM分析においては、上述のγlが、与
えられたvlと低次のN個について等しくなるよう
に各mi,ωiの値を決定することである。
えられたvlと低次のN個について等しくなるよう
に各mi,ωiの値を決定することである。
すなわち、
γl=vl:但し、l=0,1,2、……N
が成立するようにmI,ωiの値を決定すること
である。
である。
この具体的な方法については後に詳述すること
にして、ここでは、上述のn個の正弦波のmiお
よびωiが、与えられた音声信号に応答して各分析
フレームごとに次次に得られるものとする。
にして、ここでは、上述のn個の正弦波のmiお
よびωiが、与えられた音声信号に応答して各分析
フレームごとに次次に得られるものとする。
こうして得られたCSMパラメータmi,ωiによ
る音声特徴ベクトルパターンの一例を第1図に示
す。
る音声特徴ベクトルパターンの一例を第1図に示
す。
また、分析フレームの窓長を30mSECとして分
析した9次(N=9)のCSM(正弦波の個数n=
5)ラインスペクトルと、同一の音声サンプルよ
り求めた9次のLPCスペクトル包絡(LPC合成
フイルタの周波数伝送特性)との対応例を第2図
に示す。
析した9次(N=9)のCSM(正弦波の個数n=
5)ラインスペクトルと、同一の音声サンプルよ
り求めた9次のLPCスペクトル包絡(LPC合成
フイルタの周波数伝送特性)との対応例を第2図
に示す。
なお、上述の次数Nと、正弦波の個数nとの間
には、後述するように N=2n−1 の関数がある。
には、後述するように N=2n−1 の関数がある。
これらの図より、CSMは表現すべき原音声の
特徴を抽出した情報を含んでいることが窺える。
特徴を抽出した情報を含んでいることが窺える。
しかしながら、こうしてCSM分析の結果得ら
れたn組のmi,ωiの値を用いて、このmi,ωiで指
定される強度(実際の振幅は前述のように√i)
および角周波数をもつn個の正弦波を作り、これ
を単純に加算合成しただけでは、人間の耳には、
単に正弦波が合成された音として聞えるだけで、
もとの音声を再現するという目的は達成できな
い。
れたn組のmi,ωiの値を用いて、このmi,ωiで指
定される強度(実際の振幅は前述のように√i)
および角周波数をもつn個の正弦波を作り、これ
を単純に加算合成しただけでは、人間の耳には、
単に正弦波が合成された音として聞えるだけで、
もとの音声を再現するという目的は達成できな
い。
これは、正弦波を単純加算しても、発生された
信号のスペクトルは、離散化されたn個の線スペ
クトルに過ぎず、一方、音声信号のスペクトルは
連続的なスペクトル包絡を有し、さらにまた、有
声音ではピツチ構造で表現され、また無声音では
確率過程で表現される微細なスペクトル構造を合
せもつていて、単純加算したCSMと音声信号と
はスペクトル構造が全く異なつていることに起因
すると考えられる。
信号のスペクトルは、離散化されたn個の線スペ
クトルに過ぎず、一方、音声信号のスペクトルは
連続的なスペクトル包絡を有し、さらにまた、有
声音ではピツチ構造で表現され、また無声音では
確率過程で表現される微細なスペクトル構造を合
せもつていて、単純加算したCSMと音声信号と
はスペクトル構造が全く異なつていることに起因
すると考えられる。
そこで、CSMを用いて音声を合成するには、
何らかの方法を用いて線スペクトルを連続的なス
ペクトルへ拡散することが必要となる。つまり
CSM音声合成とは、第1図、第2図で示される
ような線スペクトルで表現された音声特徴ベクト
ルパターンから音声スペクトルパターンを発生さ
せることと考えることができる。
何らかの方法を用いて線スペクトルを連続的なス
ペクトルへ拡散することが必要となる。つまり
CSM音声合成とは、第1図、第2図で示される
ような線スペクトルで表現された音声特徴ベクト
ルパターンから音声スペクトルパターンを発生さ
せることと考えることができる。
本発明においては、CSM音声合成において上
述のスペクトル拡散を行なうために、以下のよう
な手法を用いる。
述のスペクトル拡散を行なうために、以下のよう
な手法を用いる。
すなわち、有声音は明確なピツチ構造を有する
ため、前述のようにして指定されるn個の各正弦
波を、このピツチ周期ごとに位相のリセツトを行
う。これにより、簡単にスペクトル包絡の発生と
ピツチの微細スペクトル構造の発生とが可能にな
る。
ため、前述のようにして指定されるn個の各正弦
波を、このピツチ周期ごとに位相のリセツトを行
う。これにより、簡単にスペクトル包絡の発生と
ピツチの微細スペクトル構造の発生とが可能にな
る。
さらにまた、実施例の説明において詳述するよ
うな特殊の時間窓処理を上述の位相リセツト波形
に施すことにより位相リセツト時における合成波
形の不連続性を除き、音声波形のもつ連続性を確
保している。
うな特殊の時間窓処理を上述の位相リセツト波形
に施すことにより位相リセツト時における合成波
形の不連続性を除き、音声波形のもつ連続性を確
保している。
以上の実施により第2図に示したCSMのライ
ンスペクトルは、第3図Aに示されるように拡散
され、スペクトル包絡とピツチの微細構造とを有
するスペクトルに変化し、聴覚的にも充分実用に
耐える音質が得られることが実験結果明らかとな
つている。
ンスペクトルは、第3図Aに示されるように拡散
され、スペクトル包絡とピツチの微細構造とを有
するスペクトルに変化し、聴覚的にも充分実用に
耐える音質が得られることが実験結果明らかとな
つている。
なお参考のため、上述の処理を行なわず、単純
加算をしただけのCSMのスペクトルを第3図B
に示す。前述のように、このようなスペクトルを
もつ波形では聴覚的には単に正弦波が合成された
音として聞こえるだけで、音声を再現するという
目的は達成されない。
加算をしただけのCSMのスペクトルを第3図B
に示す。前述のように、このようなスペクトルを
もつ波形では聴覚的には単に正弦波が合成された
音として聞こえるだけで、音声を再現するという
目的は達成されない。
以上は有声音の場合であるが、無声音の場合に
は以下のように行なう。すなわち、上述の有声音
の場合に、ピツチ周期毎に行なつた位相のリセツ
トと特殊の時間窓処理とを、無声音の場合にはピ
ツチ周期のかわりに、確率過程としてランダムに
発生するその周期が分布幅と下限値とを設定され
たパルスを用い、このパルスの発生時点ごとに上
述の処理を実施するようにする。
は以下のように行なう。すなわち、上述の有声音
の場合に、ピツチ周期毎に行なつた位相のリセツ
トと特殊の時間窓処理とを、無声音の場合にはピ
ツチ周期のかわりに、確率過程としてランダムに
発生するその周期が分布幅と下限値とを設定され
たパルスを用い、このパルスの発生時点ごとに上
述の処理を実施するようにする。
以上の手法を用いることにより聴覚的に充分実
用に耐えるCSM合成を行なうことができる。な
お、以上のCSM合成はフイルタを用いない合成
法であるため、合成側の安定性に対する考慮を必
要としない。このため、mi,ωiの情報を合成側に
伝送し、合成側で音声を再現するような通信手段
に用いる場合に、回線品質が比較的に劣悪で伝送
途中にエラーを発生するようなときにはボコーダ
よりも良好な音質が得られるという特徴が考えら
れる。
用に耐えるCSM合成を行なうことができる。な
お、以上のCSM合成はフイルタを用いない合成
法であるため、合成側の安定性に対する考慮を必
要としない。このため、mi,ωiの情報を合成側に
伝送し、合成側で音声を再現するような通信手段
に用いる場合に、回線品質が比較的に劣悪で伝送
途中にエラーを発生するようなときにはボコーダ
よりも良好な音質が得られるという特徴が考えら
れる。
(実施例)
次に本発明を実施例を用いて詳細に説明する。
第4図は本発明の一実施例を示すブロツク図で
ある。
ある。
本実施例は送信側1と、受信側2よりなる。
送信側1は、さらに、A/D変換器101、ハ
ミング窓処理器102、自己相関係数計測器10
3、CSM分析器104、CSM量子化器10後、
電力量子化器106、ピツチ抽出器107、有声
音/無声音判定器108およびマルチプレクサ1
09を含む。
ミング窓処理器102、自己相関係数計測器10
3、CSM分析器104、CSM量子化器10後、
電力量子化器106、ピツチ抽出器107、有声
音/無声音判定器108およびマルチプレクサ1
09を含む。
また、受信側2は、さらに、デマルチプレクサ
および復号化器201、補間器202、有声音/
無声音切替器203、周期算出器204、乱数発
生器205、n個の位相リセツト機能付可変周波
数発振器206−1,206−2,206−n,
n個の可変利得増幅器207−1,207−2、
……207−n、加算合成器208、可変長窓関
数発生器209、乗算器210および乗算器21
1を含んでいる。
および復号化器201、補間器202、有声音/
無声音切替器203、周期算出器204、乱数発
生器205、n個の位相リセツト機能付可変周波
数発振器206−1,206−2,206−n,
n個の可変利得増幅器207−1,207−2、
……207−n、加算合成器208、可変長窓関
数発生器209、乗算器210および乗算器21
1を含んでいる。
さて、本実施例の動作は下記の通りである。伝
送されるべき音声波形は、入力ライン1000を介し
て、A/D変換器101に供給され、ここで振幅
および時間軸が量子化されたデイジタルデータに
変換され、この出力はそれぞれ、ハミング窓処理
器102、ピツチ抽出器107、有声音/無声音
判定器108の入力側に供給される。
送されるべき音声波形は、入力ライン1000を介し
て、A/D変換器101に供給され、ここで振幅
および時間軸が量子化されたデイジタルデータに
変換され、この出力はそれぞれ、ハミング窓処理
器102、ピツチ抽出器107、有声音/無声音
判定器108の入力側に供給される。
ハミング窓処理器102に供給されたデイジタ
ルデータは、予め定められている1フレームごと
に、公知のハミング窓関数による加重乗算がなさ
れ、各フレームのデータごとに自己相関係数計測
器103に供給される。
ルデータは、予め定められている1フレームごと
に、公知のハミング窓関数による加重乗算がなさ
れ、各フレームのデータごとに自己相関係数計測
器103に供給される。
自己相関係数計測器103は、こうして入力さ
れた各フレームのデータごとに前述した下記の演
算により低位のN個の自己相関係数vl(但しl=
1,2、……N)を求める。
れた各フレームのデータごとに前述した下記の演
算により低位のN個の自己相関係数vl(但しl=
1,2、……N)を求める。
すなわち、1フレーム文のデータをXt(但し、
t=0,1、……、M−1)とすると、 vl=1/MM-1 〓t=l XtXt−l の演算処理を行なうことにより、N個の各vlを求
める。
t=0,1、……、M−1)とすると、 vl=1/MM-1 〓t=l XtXt−l の演算処理を行なうことにより、N個の各vlを求
める。
こうして求められた各フレームごとのvlの組を
次のCSM分析器に供給するとともに、この中の
vp(つまり、vp=1/MM-1 〓t=0 X2 t)をこのフレームにお ける電力情報として、電力量子化器106に供給
する。
次のCSM分析器に供給するとともに、この中の
vp(つまり、vp=1/MM-1 〓t=0 X2 t)をこのフレームにお ける電力情報として、電力量子化器106に供給
する。
さて、上述の各フレームごとの自己相関係数vl
の組の供給を受けたCSM分析器104は後に後
述する演算を行なうことによつて、対応するフレ
ームのCSMのn個の各正弦波の強度および角周
波数を指定するmi,ωi(但しi=1,2……n)
の組を決定し、これをCSM量子化器105に供
給する。
の組の供給を受けたCSM分析器104は後に後
述する演算を行なうことによつて、対応するフレ
ームのCSMのn個の各正弦波の強度および角周
波数を指定するmi,ωi(但しi=1,2……n)
の組を決定し、これをCSM量子化器105に供
給する。
CSM量子化器105はこれらmi,ωiの値の組
を、再生音質に対する要求と回線の伝送容量とを
勘案して定まる適当な粗さで量子化した後、マル
チプレクサ109に供給する。
を、再生音質に対する要求と回線の伝送容量とを
勘案して定まる適当な粗さで量子化した後、マル
チプレクサ109に供給する。
また前述のvpの供給を受けた電力量子化器10
6も、vpを上述の観点から定まる適当な粗さで量
子化した後、同様にマルチプレクサ109に供給
する。
6も、vpを上述の観点から定まる適当な粗さで量
子化した後、同様にマルチプレクサ109に供給
する。
マタ、A/D変換器101から原音声信号のデ
イジタルデータの供給を受けたピツチ抽出器10
7は、このデイジタルデータよりピツチ周期を抽
出してこれを適当に量子化したデータとしてマル
チプレクサ109に供給し、同様に有声音/無声
音判定器108も供給されたデイジタルデータよ
り有声音/無声音の判定を行ないこれを2値信号
としてマルチプレクサ109に供給する。
イジタルデータの供給を受けたピツチ抽出器10
7は、このデイジタルデータよりピツチ周期を抽
出してこれを適当に量子化したデータとしてマル
チプレクサ109に供給し、同様に有声音/無声
音判定器108も供給されたデイジタルデータよ
り有声音/無声音の判定を行ないこれを2値信号
としてマルチプレクサ109に供給する。
以上の信号の供給を受けたマルチプレクサ10
9は、これらの信号を、受信側における分離が容
易に行なえ、また与えられた伝送路を伝送するの
に適した形に合成し、伝送路1200を介して受
信側2に伝送する。
9は、これらの信号を、受信側における分離が容
易に行なえ、また与えられた伝送路を伝送するの
に適した形に合成し、伝送路1200を介して受
信側2に伝送する。
さて受信側2においては、こうして伝送された
信号をデマルチプレクサおよび復号化器201に
おいて、復号化および分離を行なうことによつ
て、送信側1のマルチプレクサ109の入力側に
おける各信号を復元する。
信号をデマルチプレクサおよび復号化器201に
おいて、復号化および分離を行なうことによつ
て、送信側1のマルチプレクサ109の入力側に
おける各信号を復元する。
こうして復元された各信号は、メモリ機能を有
する補間器202に供給され、必要な補間がほど
こされた後、それぞれ次のように用いられる。
する補間器202に供給され、必要な補間がほど
こされた後、それぞれ次のように用いられる。
まず、CSMのn個の各波の角周波数を指定す
るωi(ω1〜ωoは、前記n個の位相リセツト機能付
可変周波数発振器206−1〜206−nの周波
数制御入力に加えられ、これらの発振器の出力角
周波数を指定された角周波数ω12〜ωoに設定す
る。
るωi(ω1〜ωoは、前記n個の位相リセツト機能付
可変周波数発振器206−1〜206−nの周波
数制御入力に加えられ、これらの発振器の出力角
周波数を指定された角周波数ω12〜ωoに設定す
る。
また、CSMのn個の各波の強度(電力振幅)
を指定するm1〜moは前記n個の可変利得増幅器
207−1〜207−nの利得制御端子に供給さ
れ、これによつて各周波数の発振電力が指定され
た値になるように制御する。
を指定するm1〜moは前記n個の可変利得増幅器
207−1〜207−nの利得制御端子に供給さ
れ、これによつて各周波数の発振電力が指定され
た値になるように制御する。
こうして得られたn個の出力は、加算合成器2
08において加算合成が行なわれた後、次の乗算
器210に供給される。
08において加算合成が行なわれた後、次の乗算
器210に供給される。
さて、デマルチプレクサおよび復号化器201
から出力されるピツチ周期情報は、メモリを含む
補間器202において、必要に応じて補間が施さ
れ、ピツチ周期を表わすデイジタルデータとして
有声音/無声音切替器203に供給される。
から出力されるピツチ周期情報は、メモリを含む
補間器202において、必要に応じて補間が施さ
れ、ピツチ周期を表わすデイジタルデータとして
有声音/無声音切替器203に供給される。
一方、乱数発生器205で発生された乱数が、
周期算出器204に供給され、ここで乱数の分布
幅およびその下限値が特定の値になるように変換
され、無声音時の位相リセツト時間間隔を決定す
るデータ列として有声音/無声音切替器203の
他方の入力に供給される。
周期算出器204に供給され、ここで乱数の分布
幅およびその下限値が特定の値になるように変換
され、無声音時の位相リセツト時間間隔を決定す
るデータ列として有声音/無声音切替器203の
他方の入力に供給される。
またデマルチプレクサおよび復号化器201か
ら出力される有声音無声音を区別する2値信号
(V/U)は前述の切替器203の切替制御信号
として供給され、有声音の場合には、切替器20
3が、補間器202から出力する前述のピツチ周
期を表わすデイジタルデータ側を選択して、これ
を窓関数発生器209に供給する。
ら出力される有声音無声音を区別する2値信号
(V/U)は前述の切替器203の切替制御信号
として供給され、有声音の場合には、切替器20
3が、補間器202から出力する前述のピツチ周
期を表わすデイジタルデータ側を選択して、これ
を窓関数発生器209に供給する。
またもし前記2値信号(V/U)が、無声音を
指定する場合には切替器203は、前述の周期算
出器204の出力の確率過程で発生するランダム
な時間間隔を表わすデータ列側を選択し、これを
上述のピツチ周期を表わすデイジタルデータ列の
かわりに、窓関数発生器209に供給する。
指定する場合には切替器203は、前述の周期算
出器204の出力の確率過程で発生するランダム
な時間間隔を表わすデータ列側を選択し、これを
上述のピツチ周期を表わすデイジタルデータ列の
かわりに、窓関数発生器209に供給する。
さて、窓関数発生器209は、位相リセツトに
よつて出力波形に生ずる不連続を除き音声波形の
もつ連続性を確保する窓関数を発生するためのも
ので、またされにこの窓関数と密接な時間関係を
有する位相リセツト用パルスをも発生する。
よつて出力波形に生ずる不連続を除き音声波形の
もつ連続性を確保する窓関数を発生するためのも
ので、またされにこの窓関数と密接な時間関係を
有する位相リセツト用パルスをも発生する。
前述のように窓関数発生器209には切替器2
03を介して、次次の位相リセツト用パルス間の
間隔を指定するデータ列が入力されるが、窓関数
発生器209は、このデータで指定される時間間
隔を有するインパルスを次次に発生し、これをラ
イン2090を介して位相リセツト機能付可変周
波数発振器206−1〜206−nの位相リセツ
ト端子に供給し、これによつてこれら発振器の位
相リセツトを行なう。またこれをライン2090
を介して補間器202に供給し、角周波数データ
ωiおよび強度データmiを補間するためのタイミン
グ信号として使用する。
03を介して、次次の位相リセツト用パルス間の
間隔を指定するデータ列が入力されるが、窓関数
発生器209は、このデータで指定される時間間
隔を有するインパルスを次次に発生し、これをラ
イン2090を介して位相リセツト機能付可変周
波数発振器206−1〜206−nの位相リセツ
ト端子に供給し、これによつてこれら発振器の位
相リセツトを行なう。またこれをライン2090
を介して補間器202に供給し、角周波数データ
ωiおよび強度データmiを補間するためのタイミン
グ信号として使用する。
すなわち、入力されたデータにより指定された
その時点における位相リセツト用パルス間間隔の
値をTとし、前の位相リセツト用パルスが発生し
てからの経過時間をxとすると W(x)=0.5+0.5cos(xx/T) 但し 0<xT で表わされるような窓関数を発生する。この窓関
数W(x)を第5図Aに示す。上述のTの値は、有声
音の場合にはピツチ周期を表わし、無声音の場合
には確率過程で発生する変数を表わすので時間と
ともに変化する。従つて、この窓関数W(x)は可変
長であり、上述の位相リセツト用パルスの発生と
第5図Bに示すような相対時間関係で同期してい
る(窓関数の開始時点および終止時点が位相リセ
ツト用パルスの発生時点とほぼ一致している)。
その時点における位相リセツト用パルス間間隔の
値をTとし、前の位相リセツト用パルスが発生し
てからの経過時間をxとすると W(x)=0.5+0.5cos(xx/T) 但し 0<xT で表わされるような窓関数を発生する。この窓関
数W(x)を第5図Aに示す。上述のTの値は、有声
音の場合にはピツチ周期を表わし、無声音の場合
には確率過程で発生する変数を表わすので時間と
ともに変化する。従つて、この窓関数W(x)は可変
長であり、上述の位相リセツト用パルスの発生と
第5図Bに示すような相対時間関係で同期してい
る(窓関数の開始時点および終止時点が位相リセ
ツト用パルスの発生時点とほぼ一致している)。
こうして発生された窓関数はライン2091を
介して乗算器210に供給される。この結果、乗
算器210において、加算合成器208で合成さ
れた各位相リセツト用パルスごとに位相リセツト
されるn個の正弦波形と、各位相リセツト用パル
スに同期して発生される上述の窓関数W(x)との積
が得られる。こうして得られる波形は、各正弦波
が位相リセツトされる直前で窓関数W(x)の乗算に
より連続的に0に収束されており、また位相リセ
ツト時点では各正弦波は0から立ち上るので波形
の連続性が確保され、かくして窓関数W(x)の乗算
により位相リセツト波形に生ずる不連続性を除く
ことができる。
介して乗算器210に供給される。この結果、乗
算器210において、加算合成器208で合成さ
れた各位相リセツト用パルスごとに位相リセツト
されるn個の正弦波形と、各位相リセツト用パル
スに同期して発生される上述の窓関数W(x)との積
が得られる。こうして得られる波形は、各正弦波
が位相リセツトされる直前で窓関数W(x)の乗算に
より連続的に0に収束されており、また位相リセ
ツト時点では各正弦波は0から立ち上るので波形
の連続性が確保され、かくして窓関数W(x)の乗算
により位相リセツト波形に生ずる不連続性を除く
ことができる。
不連続性を除かれた乗算器210の出力は、次
の乗算器211に供給され、ここで送信側1から
送られた各フレームの電力情報によつて加重さ
れ、合成音声としてライン2000から出力され
る。
の乗算器211に供給され、ここで送信側1から
送られた各フレームの電力情報によつて加重さ
れ、合成音声としてライン2000から出力され
る。
以上に説明したように、本実施例の受信側2に
おいては、前述した音声合成に必要なCSM合成
が実行され、この結果、送信側1に入力した原音
声の再現が、伝送路1200における情報量の圧
縮や伝送エラーにもかかわらず比較的良好な音質
をもつて行なわれることになる。
おいては、前述した音声合成に必要なCSM合成
が実行され、この結果、送信側1に入力した原音
声の再現が、伝送路1200における情報量の圧
縮や伝送エラーにもかかわらず比較的良好な音質
をもつて行なわれることになる。
以上で説明した補間器202における各伝送デ
ータに対する補間は、送信側1で各伝送データを
量子化する際の粗さに応じて種種の組合せ(例え
ばωiだけ、あるいはωi,miだけ、等)で行なうこ
とが可能で、また補間の方法も、直線補間あるい
はさらに高級な関数による補間を用いることも可
能である。なお、ωi,miに対する補間に関して
は、上述の位相リセツトパルスの発生時点ごとに
補間データが得られるように補間点を選定するこ
とが有利であり、つまりωi,miの時間的歪を減少
でき、再現性を向上できるので、ωi,miの値の更
新をこのタイミングで行なうために前述のように
位相リセツト用パルスをライン2090を介して
補間器202に供給している。
ータに対する補間は、送信側1で各伝送データを
量子化する際の粗さに応じて種種の組合せ(例え
ばωiだけ、あるいはωi,miだけ、等)で行なうこ
とが可能で、また補間の方法も、直線補間あるい
はさらに高級な関数による補間を用いることも可
能である。なお、ωi,miに対する補間に関して
は、上述の位相リセツトパルスの発生時点ごとに
補間データが得られるように補間点を選定するこ
とが有利であり、つまりωi,miの時間的歪を減少
でき、再現性を向上できるので、ωi,miの値の更
新をこのタイミングで行なうために前述のように
位相リセツト用パルスをライン2090を介して
補間器202に供給している。
このような補間を行なうためには、必要な後の
データが到着するかまたは発生するかした後に、
補間データが求められるため、発振器206に対
する位相のリセツトおよび周波数ωiの設定、また
増幅器207に対する強度miの設定等の実際の
処理は、実時間より必要な一定時間だけ遅れて実
行されることになる。このため補間器202には
必要な情報を必要時点まで記憶しておくためのメ
モリが含まれている。
データが到着するかまたは発生するかした後に、
補間データが求められるため、発振器206に対
する位相のリセツトおよび周波数ωiの設定、また
増幅器207に対する強度miの設定等の実際の
処理は、実時間より必要な一定時間だけ遅れて実
行されることになる。このため補間器202には
必要な情報を必要時点まで記憶しておくためのメ
モリが含まれている。
次に、位相リセツト機能付可変周波数発振器2
06の回路例を第6図に示す。周波数制御端子2
061に加わる電圧によつて、定電流電源206
2および2063に流れる。容量2064に対す
る充放電電流値を制御し、これによつて発振周波
数を可変とする。v点の発振電圧波形は基準電圧
の+Vrと−Vrとの間を直線的に上下する三角波
形となる。位相リセツト端子2065にインパル
スを加えると、v点は瞬間的に接地されて、強制
的に0電位に引き戻され、そこから発振を再スタ
ートして位相リセツトが行なわれる。この。v点
の三角波発振出力を正弦波変換器2066に入力
し正弦波に変換して端子2067より出力し、こ
れを発振器206の出力として用いる。正弦波変
換器2066は例えばROMに格納したサイン関
数値を入力波形で読出す等の方法により容易に実
現できる。
06の回路例を第6図に示す。周波数制御端子2
061に加わる電圧によつて、定電流電源206
2および2063に流れる。容量2064に対す
る充放電電流値を制御し、これによつて発振周波
数を可変とする。v点の発振電圧波形は基準電圧
の+Vrと−Vrとの間を直線的に上下する三角波
形となる。位相リセツト端子2065にインパル
スを加えると、v点は瞬間的に接地されて、強制
的に0電位に引き戻され、そこから発振を再スタ
ートして位相リセツトが行なわれる。この。v点
の三角波発振出力を正弦波変換器2066に入力
し正弦波に変換して端子2067より出力し、こ
れを発振器206の出力として用いる。正弦波変
換器2066は例えばROMに格納したサイン関
数値を入力波形で読出す等の方法により容易に実
現できる。
またこのような位相リセツト機能付可変周波数
発振器は計算機のプログラムを用いて実現するこ
とも容易である。
発振器は計算機のプログラムを用いて実現するこ
とも容易である。
次に可変利得増幅器207の回路例を第7図に
示す。増幅すべき信号を端子2071に加え、制
御信号を端子2072に加えることによつて負帰
還量を制御し出力端子2073に制御された振幅
を有する出力を得る。
示す。増幅すべき信号を端子2071に加え、制
御信号を端子2072に加えることによつて負帰
還量を制御し出力端子2073に制御された振幅
を有する出力を得る。
またこのほかに、アナログ乗算器を用いて実現
することもできるし、またD/A変換器の基準電
圧のアナログ波形入力を用い、デイジタル入力
に、デイジタル量で表現された制御情報を用いる
等の方法によつても容易に実現することができ
る。
することもできるし、またD/A変換器の基準電
圧のアナログ波形入力を用い、デイジタル入力
に、デイジタル量で表現された制御情報を用いる
等の方法によつても容易に実現することができ
る。
次に乱数発生器205の一回路例を第8図に示
す。15段のシフトレジスタ2051と1個の中加
算器2052とにより215−1の同期を有する15
次のM系列の疑似乱数を発生する。必要な時点で
クロツク端子2053にシフトパルスを加えるこ
とにより、次の乱数値が得られる。
す。15段のシフトレジスタ2051と1個の中加
算器2052とにより215−1の同期を有する15
次のM系列の疑似乱数を発生する。必要な時点で
クロツク端子2053にシフトパルスを加えるこ
とにより、次の乱数値が得られる。
次に周期算出器204のブロツク図を第9図A
に示す。これは上述の乱数発生器205から出力
される0から215−1の範囲に一様に分布してい
る乱数を、無声音時の位相リセツト用パルスの時
間間隔を指定する乱数として用いるのに適した分
布に変換するもので、定数乗算器2041と定数
加算器2042よりなる。これによつて、第9図
Bに示すように、乱数の分布幅Dと下限値Lとを
適当な値に設定することができる。
に示す。これは上述の乱数発生器205から出力
される0から215−1の範囲に一様に分布してい
る乱数を、無声音時の位相リセツト用パルスの時
間間隔を指定する乱数として用いるのに適した分
布に変換するもので、定数乗算器2041と定数
加算器2042よりなる。これによつて、第9図
Bに示すように、乱数の分布幅Dと下限値Lとを
適当な値に設定することができる。
次に窓関数発生器209の一実施例を第10図
に示す。これは、レジスタ2091、プリセツト
可能なダウンカウンタ2092、カウンタ209
3、読出し専用メモリ(ROM)2094を含ん
でいる。
に示す。これは、レジスタ2091、プリセツト
可能なダウンカウンタ2092、カウンタ209
3、読出し専用メモリ(ROM)2094を含ん
でいる。
切替器203から供給された位相リセツト用パ
ルス間隔を指定するデータTは、レジスタ209
1に格納される。ダウンカウンタ2092は一定
周期の高速クロツクCLKをカウントするカウン
タで、まず、レジスタ2091の内容Tをプリセ
ツトし、これをクロツクCLKを用いてダウンカ
ウントする。カウンタ2092の内容が0になる
と出力端子よりパルスを発生し、これにより再び
レジスタ2091の内容をプリセツトしてこの値
のダウンカウントを開始する。かくしてダウンカ
ウンタ2092の出力2092−1にはTに比例
した周期(例えばT/k)をもつパルス列が発生
する。このパルス列はカウンタ2093のクロツ
クとして加えられる。このクロツクで歩進される
カウンタ2093のカウント出力2093−1は
ROM2094にアドレス指定信号として加えら
れ、そこに書き込まれている窓関数w(x)のデータ
を順番に読出してライン2091に出力する。カ
ウンタ2093の内容がkになると、ROM20
94の窓関数w(x)の最後のデータが読出され、こ
れとともにカウンタ2093はリセツトされてラ
イン2090にリセツトパルスを出力する。この
リセツトパルスは、発振器206−1〜206−
nの位相リセツト用端子および補間器202に供
給される前述の位相リセツト用パルスとして用い
られると共に、レジスタ2091に次の入力デー
タをセツトするために用いられる。またROM2
094の中にk個のサンプルとして予め格納され
ている窓関数w(x)のデータはライン2095に読
出されて乗算器210に供給される。かくして、
パルス間間隔がつぎつぎに指定された値をもつ位
相リセツト用パルスと、これと第5図Bに示すよ
うに同期された可変長の窓関数w(x)とが生成され
る。
ルス間隔を指定するデータTは、レジスタ209
1に格納される。ダウンカウンタ2092は一定
周期の高速クロツクCLKをカウントするカウン
タで、まず、レジスタ2091の内容Tをプリセ
ツトし、これをクロツクCLKを用いてダウンカ
ウントする。カウンタ2092の内容が0になる
と出力端子よりパルスを発生し、これにより再び
レジスタ2091の内容をプリセツトしてこの値
のダウンカウントを開始する。かくしてダウンカ
ウンタ2092の出力2092−1にはTに比例
した周期(例えばT/k)をもつパルス列が発生
する。このパルス列はカウンタ2093のクロツ
クとして加えられる。このクロツクで歩進される
カウンタ2093のカウント出力2093−1は
ROM2094にアドレス指定信号として加えら
れ、そこに書き込まれている窓関数w(x)のデータ
を順番に読出してライン2091に出力する。カ
ウンタ2093の内容がkになると、ROM20
94の窓関数w(x)の最後のデータが読出され、こ
れとともにカウンタ2093はリセツトされてラ
イン2090にリセツトパルスを出力する。この
リセツトパルスは、発振器206−1〜206−
nの位相リセツト用端子および補間器202に供
給される前述の位相リセツト用パルスとして用い
られると共に、レジスタ2091に次の入力デー
タをセツトするために用いられる。またROM2
094の中にk個のサンプルとして予め格納され
ている窓関数w(x)のデータはライン2095に読
出されて乗算器210に供給される。かくして、
パルス間間隔がつぎつぎに指定された値をもつ位
相リセツト用パルスと、これと第5図Bに示すよ
うに同期された可変長の窓関数w(x)とが生成され
る。
最後にCSM分析析について説明する。
前述のように、CSM分析は、各分析フレーム
毎に、表現されるべき音声波形から直接算出され
る標本自己相関係数のN個の低次のタツプ値と、
合成波(n個の正弦波の和)のN個の低次のタツ
プ値とが一致するように、合成すべき各正弦波の
周波数ωiとその強度(電力振幅)miとを決定する
ことである。
毎に、表現されるべき音声波形から直接算出され
る標本自己相関係数のN個の低次のタツプ値と、
合成波(n個の正弦波の和)のN個の低次のタツ
プ値とが一致するように、合成すべき各正弦波の
周波数ωiとその強度(電力振幅)miとを決定する
ことである。
今、合成波のタツプlの自己相関係数をγlとす
ると、前述のように、 γl=o 〓i=1 micoslωi となる。
ると、前述のように、 γl=o 〓i=1 micoslωi となる。
一方、表現されるへき音声波形のサンプルXt
から、あるフレームの、タツプlの標本自己相関
係数vlは vl=1/MM-1 〓t=l XtXt−l ……(1) である。
から、あるフレームの、タツプlの標本自己相関
係数vlは vl=1/MM-1 〓t=l XtXt−l ……(1) である。
これより、
γl=vl ……(2)
l=0,1,2、……N、但しN=2n−1
とすると下記のマトリツクス表現が得られる。
しかし上式は、ωiおよびmiが未知のため単純な
行列演算では解けない。そこで、 ωi=cos-1Xi ……(4) とおき、 coslωi=coslcos-1Xi≡Tl(xi) ……(5) の置換を行なう。このTl(x)はTchebycheff(チエ
ビシエフ)の多項式である。この置換を行なうと
(3)式は次のように変換される。
行列演算では解けない。そこで、 ωi=cos-1Xi ……(4) とおき、 coslωi=coslcos-1Xi≡Tl(xi) ……(5) の置換を行なう。このTl(x)はTchebycheff(チエ
ビシエフ)の多項式である。この置換を行なうと
(3)式は次のように変換される。
ところが、一般にxlはT0(x),T1(x)……Tl(x)の
線形結合として表わすことができる。
線形結合として表わすことができる。
すなわち、
xl=l
〓j=0
S(1) jTj(x) ……(7)
但しS(l)jは逆Tchebycheff(チエビシエフ)関数
である。
である。
このS(l)jを用いて、前述の標本自己相関係数vj
の線形結合Alを下式のように定義する。
の線形結合Alを下式のように定義する。
Al=l
〓j=0
S(1) jvj ……(8)
但しl=0,1,2、……、2n−1
こうすると、(6)式の左辺および右辺にそれぞれ
(7)式および(8)式の関係を用いることにより、下記
の関係式が成立する。
(7)式および(8)式の関係を用いることにより、下記
の関係式が成立する。
さて、ここで、x1,x2、……、xoに零点をも
つ、n次の多項式 Po(x)≡o 〓k=0 p(n) kXk=o Πi=1 (x−xi) を定義し、このPo(x)を用いて、(9)式の左辺と似
た式の o 〓i=1 miPo(xi)xl i を作り、これを検討してみる。上式が0であるこ
とは明らかであるが、さらにこれは次のように書
き変えることができる。
つ、n次の多項式 Po(x)≡o 〓k=0 p(n) kXk=o Πi=1 (x−xi) を定義し、このPo(x)を用いて、(9)式の左辺と似
た式の o 〓i=1 miPo(xi)xl i を作り、これを検討してみる。上式が0であるこ
とは明らかであるが、さらにこれは次のように書
き変えることができる。
0=o
〓i=1
miPo(xi)xl i=o
〓i=1
mio
〓k=0
p(n) kXk+l i=o
〓k=0
p(n) ko
〓i=1
mixi k+l=o
〓k=0
p(n) kAk+l
以上により、l=0,1,2、……nとして下
式が得られる。
式が得られる。
しかるにp(n) o=1である。
が成立する。左辺のAiでできるマトリクスは一般
にHankel(ヘンケル)行列と呼ばれているもので
ある。前述のように各Aiは、表現すへき音声波形
の標本自己関係数vjから(8)式により与えられるも
ので既知である。
にHankel(ヘンケル)行列と呼ばれているもので
ある。前述のように各Aiは、表現すへき音声波形
の標本自己関係数vjから(8)式により与えられるも
ので既知である。
従つて(10)式を解くことにより、p(n) 0,p(n) 1、……
p(n) o-1の値を求めることができる。
p(n) o-1の値を求めることができる。
この各p(n) iが求めると、n次方程式
Po(x)=xn+p(n) o-1xn-1+……p(n) 0=0
の解として、{x1,x2……、xo}が求められる。
これより各CSM周波数ωiは(4)式の
ωi=cos-1xi
より求められ、またCSM強度miは(9)式より導か
れる下式を用いて求められる。
れる下式を用いて求められる。
なお、上式の左辺の行列は一般にVan der
Monde(フアンデルモンデ)行列と呼ばれている
ものである。
Monde(フアンデルモンデ)行列と呼ばれている
ものである。
以上をまとめると、CSM分析の分析アルゴリ
ズムは以下のようになる。
ズムは以下のようになる。
(1) 標本自己相関係数を計算する
vl=1/MM-1
〓t=l
XtXt−l
(2) 逆チエビシエフ係数を用いてAlを定義する。
Al=l
〓j=0
S(1) jvj
(3) AlによるHankel(ヘンケル)行列方程式を解
いてp(n) iを求める (4) p(n) iを係数としてもつn次代数方程式を解い
てn個のxiを求める。
いてp(n) iを求める (4) p(n) iを係数としてもつn次代数方程式を解い
てn個のxiを求める。
Po(x)≡xn+p(n) o-1xn-1+p(n) o-2xn-2+……+p(n) 1
x+
p0=0 (5) cos逆変換を行なつてCSM角周波数{ωi}を
求める。
x+
p0=0 (5) cos逆変換を行なつてCSM角周波数{ωi}を
求める。
ωi=cos-1xi
(6) Van der Monde(フアンデルモンデ)行列
方程式を解いてCSM強度{mi}を求める。
方程式を解いてCSM強度{mi}を求める。
以上の各ステツプを実行することによりCSM
の各周波数{ω1,ω2……ωo}および各波の強度
{m1,m2、……mo}を求めることができる。
の各周波数{ω1,ω2……ωo}および各波の強度
{m1,m2、……mo}を求めることができる。
なお、上述のHankel(ヘンケル)行列方程式の
能率的解法として、初期条件を与えて逐次的に解
を求める方法が知られている。
能率的解法として、初期条件を与えて逐次的に解
を求める方法が知られている。
また、上記n次の代数方程式は実根のみを有す
ることが証明されているため、ニユートン・ラプ
ソンの方法等を用いて根を求めることができる。
ることが証明されているため、ニユートン・ラプ
ソンの方法等を用いて根を求めることができる。
さらに、上記Van der Monde(フアンデルモ
ンデ)行列方程式の能率的解法として三角行列化
を行なつて順次に解を求める方法を用いることが
できる。なお、上述の分析法は嵯峨山氏らの論文
゛複合正弦波モデルによる音声スペクトル分析″
電子通信学会論部誌′81/2Vol.J64−ANo.2P.105〜
112に詳しく述べられている。
ンデ)行列方程式の能率的解法として三角行列化
を行なつて順次に解を求める方法を用いることが
できる。なお、上述の分析法は嵯峨山氏らの論文
゛複合正弦波モデルによる音声スペクトル分析″
電子通信学会論部誌′81/2Vol.J64−ANo.2P.105〜
112に詳しく述べられている。
以上は本発明の一実施例を示したもので、本発
明は以上の実施例に限定されるものではない。
明は以上の実施例に限定されるものではない。
例えば、送信側のCSM分析において、本実施
例では、標本自己相関係数とCSMの自己相関係
数とを等しいとする方程式を解く方法を用いた
が、このかわりに、LPC係数の無損失化による
線スペクトル周波数の算出および留数計算による
方法を用いることもできる。いずれにせよ、
CSM分析によつて得られた適正なCSMパラメー
タと他の必要なパラメータとを上述の実施例の受
信側に供給することにより良好な音質をもつ
CSM音声合成が可能となる。こうしてCSM型音
声分析合成装置を構成することもできる。
例では、標本自己相関係数とCSMの自己相関係
数とを等しいとする方程式を解く方法を用いた
が、このかわりに、LPC係数の無損失化による
線スペクトル周波数の算出および留数計算による
方法を用いることもできる。いずれにせよ、
CSM分析によつて得られた適正なCSMパラメー
タと他の必要なパラメータとを上述の実施例の受
信側に供給することにより良好な音質をもつ
CSM音声合成が可能となる。こうしてCSM型音
声分析合成装置を構成することもできる。
また本実施例においては、補間器により、位相
リセツト時点で、パラメータ補間を行なうように
したが、これは省略することもできる。
リセツト時点で、パラメータ補間を行なうように
したが、これは省略することもできる。
さらに、本実施例においては、特定の関数形を
もつ可変長窓関数を用いたが、この関数形は一例
を示したもので、他の関数形が用いられることも
明らかである。
もつ可変長窓関数を用いたが、この関数形は一例
を示したもので、他の関数形が用いられることも
明らかである。
さらに乱数発生器、周期算出器等も一例を示し
たもので、これに限定される必要はない。
たもので、これに限定される必要はない。
(発明の効果)
以上述べたように本発明を用いると、CSMパ
ラメータを用いて音声信号を良好な音質をもつて
合成するCSM型音声合成器を提供できる。
ラメータを用いて音声信号を良好な音質をもつて
合成するCSM型音声合成器を提供できる。
この合成器は構造が簡単でフイルタを含まず、
このため合成側における安定性の問題が生じない
等の利点を有し、これを用いて音声伝送装置、音
声分析合成装置等の性能向上を達成できる。
このため合成側における安定性の問題が生じない
等の利点を有し、これを用いて音声伝送装置、音
声分析合成装置等の性能向上を達成できる。
第1図はCSMパラメータによる音声特徴ベク
トルパターンの一例を示す図、第2図はCSMラ
インスペクトルと、同一音声サンプルより求めた
LPCスペクトル包絡との対応例を示す図、第3
図Aは拡散されたCSMのスペクトル包絡とピツ
チの微細構造とを示す図、第3図Bは単純加算し
ただけのCSMスペクトルを示す図、第4図は本
発明の一実施例を示すブロツク図、第5図Aは可
変長窓関数の関数形を示す図、第5図Bは前記可
変長窓関数と位相リセツト用パルスとの相対時間
関係を示す図、第6図は位相リセツト機能付可変
周波数発振器の一回路例を示す図、第7図は可変
利得増幅器の一回路例を示す図、第8図は乱数発
生器の一回路例を示す図、第9図Aは周期算出器
のブロツク図、第9図Bは前記周期算出器の出力
の乱数の分布を示す図および第10図は可変長窓
発生器の一例を示すブロツク図である。 図において、1……送信側、2……受信側、1
01……A/D変換器、102……ハミング窓処
理器、103……自己相関係数計測器、104…
…CSM分析器、105……CSM量子化器、10
6……電力量子化器、107……ピツチ抽出器、
108……有声音/無声音判定器、109……マ
ルチプレクサ、201……デマルチプレクサおよ
び復号化器、202……補間器、203……有声
音/無声音切替器、204……周期算出器、20
5……乱数発生器、206−1〜206−n……
位相リセツト機能付可変周波数発振器、207−
1〜207−n……可変利得増幅器、208……
加算合成器、209……可変長窓関数発生器、2
10,211……乗算器。
トルパターンの一例を示す図、第2図はCSMラ
インスペクトルと、同一音声サンプルより求めた
LPCスペクトル包絡との対応例を示す図、第3
図Aは拡散されたCSMのスペクトル包絡とピツ
チの微細構造とを示す図、第3図Bは単純加算し
ただけのCSMスペクトルを示す図、第4図は本
発明の一実施例を示すブロツク図、第5図Aは可
変長窓関数の関数形を示す図、第5図Bは前記可
変長窓関数と位相リセツト用パルスとの相対時間
関係を示す図、第6図は位相リセツト機能付可変
周波数発振器の一回路例を示す図、第7図は可変
利得増幅器の一回路例を示す図、第8図は乱数発
生器の一回路例を示す図、第9図Aは周期算出器
のブロツク図、第9図Bは前記周期算出器の出力
の乱数の分布を示す図および第10図は可変長窓
発生器の一例を示すブロツク図である。 図において、1……送信側、2……受信側、1
01……A/D変換器、102……ハミング窓処
理器、103……自己相関係数計測器、104…
…CSM分析器、105……CSM量子化器、10
6……電力量子化器、107……ピツチ抽出器、
108……有声音/無声音判定器、109……マ
ルチプレクサ、201……デマルチプレクサおよ
び復号化器、202……補間器、203……有声
音/無声音切替器、204……周期算出器、20
5……乱数発生器、206−1〜206−n……
位相リセツト機能付可変周波数発振器、207−
1〜207−n……可変利得増幅器、208……
加算合成器、209……可変長窓関数発生器、2
10,211……乗算器。
Claims (1)
- 【特許請求の範囲】 1 CSMの指定する各周波数に設定される複数
の位相リセツト機能付可変周波数発振器と、 これに対応して前記各発振器の出力をCSMの
指定する各強度に設定する複数の可変利得増幅器
と、 可変長窓関数発生器と、 乱数発生器とを備え、 有声音合成時にはピツチ周期に対応して前記各
発振器の位相リセツトを行ないまた無声音合成時
には前記乱数発生器の出力を乱数より算出される
分布幅と下限値とを設定された周期に対応して前
記各発振器の位相リセツトを行ない前記可変長窓
関数発生器で発生される始点が1かつ終点が0で
あり連続性を有する可変長の窓関数の開始時点お
よび終止時点が上記位相リセツトの時点とほぼ一
致するようにしたことを特徴とするCSM型音声
合成器。 2 前記位相リセツトの時点でCSMパラメータ
の補間を実施するようにしたことを特徴とする特
許請求の範囲第1項記載のCSM型音声合成器。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59143045A JPS6121000A (ja) | 1984-07-10 | 1984-07-10 | Csm型音声合成器 |
| US06/753,138 US4815135A (en) | 1984-07-10 | 1985-07-09 | Speech signal processor |
| CA000486504A CA1242279A (en) | 1984-07-10 | 1985-07-09 | Speech signal processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59143045A JPS6121000A (ja) | 1984-07-10 | 1984-07-10 | Csm型音声合成器 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6121000A JPS6121000A (ja) | 1986-01-29 |
| JPH051957B2 true JPH051957B2 (ja) | 1993-01-11 |
Family
ID=15329621
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59143045A Granted JPS6121000A (ja) | 1984-07-10 | 1984-07-10 | Csm型音声合成器 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6121000A (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6139100A (ja) * | 1984-07-31 | 1986-02-25 | 日本電気株式会社 | 秘話装置 |
| US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
| US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
| JP4866125B2 (ja) * | 2006-03-30 | 2012-02-01 | 大阪瓦斯株式会社 | 低温液化ガス貯留設備とアンカーストラップの設置方法 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5853351A (ja) * | 1981-09-24 | 1983-03-29 | Toyota Motor Corp | 水平割鋳型造型機における鋳型取出装置 |
| JPS58147798A (ja) * | 1982-02-27 | 1983-09-02 | 松下電工株式会社 | 音声合成装置 |
-
1984
- 1984-07-10 JP JP59143045A patent/JPS6121000A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6121000A (ja) | 1986-01-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US3982070A (en) | Phase vocoder speech synthesis system | |
| US4393272A (en) | Sound synthesizer | |
| US6298322B1 (en) | Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal | |
| CA1065490A (en) | Emphasis controlled speech synthesizer | |
| De Poli | A tutorial on digital sound synthesis techniques | |
| US4108036A (en) | Method of and apparatus for electronically generating musical tones and the like | |
| US4680479A (en) | Method of and apparatus for providing pulse trains whose frequency is variable in small increments and whose period, at each frequency, is substantially constant from pulse to pulse | |
| US5024133A (en) | Electronic musical instrument with improved generation of wind instruments | |
| JPH051957B2 (ja) | ||
| GB2103005A (en) | Modulation effect device | |
| JPS5919352B2 (ja) | 電子楽器 | |
| US4231277A (en) | Process for forming musical tones | |
| JPS6140119B2 (ja) | ||
| JPH0363079B2 (ja) | ||
| JPH0439678B2 (ja) | ||
| JPH0441838B2 (ja) | ||
| GB2059726A (en) | Sound synthesizer | |
| JPH0582958B2 (ja) | ||
| JPH051958B2 (ja) | ||
| JPS5816297A (ja) | 音声合成方式 | |
| Pekonen | Filter-based oscillator algorithms for virtual analog synthesis | |
| JPH0754436B2 (ja) | Csm型音声合成器 | |
| JPH02137889A (ja) | 信号記録方法及び装置 | |
| JPH051959B2 (ja) | ||
| JPH0131638B2 (ja) |