JPH0754436B2 - Csm型音声合成器 - Google Patents

Csm型音声合成器

Info

Publication number
JPH0754436B2
JPH0754436B2 JP62019114A JP1911487A JPH0754436B2 JP H0754436 B2 JPH0754436 B2 JP H0754436B2 JP 62019114 A JP62019114 A JP 62019114A JP 1911487 A JP1911487 A JP 1911487A JP H0754436 B2 JPH0754436 B2 JP H0754436B2
Authority
JP
Japan
Prior art keywords
random number
csm
generating means
signal
sine wave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62019114A
Other languages
English (en)
Other versions
JPS63186300A (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62019114A priority Critical patent/JPH0754436B2/ja
Publication of JPS63186300A publication Critical patent/JPS63186300A/ja
Publication of JPH0754436B2 publication Critical patent/JPH0754436B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はCSM型音声合成器に関し、特に合成音質の改善
を図ったCSM型音声合成器に関する。
〔従来の技術〕
たかだか4〜6波程度の正弦波周波数の組合せで音声信
号を表現するCSM型音声合成器は近時よく知られつつあ
る。
音声合成器としては従来LPC(Linear Prediction Codin
g,線形予測分析)型音声合成器)が広く利用されている
が、このLPC型音声合成器は一般に構成が複雑であり、
また、音声合成に用いられるLPC合成フィルタの特性が
音声パラメータ伝送時のエラー等によってその安定性が
損なわれる機会が多いという問題がある。
これに対してCSM型音声合成器は、後述する如く、LPC合
成フィルタの如き音声合成フィルタを利用する必要がな
いためその構成が極めて単純化され本質的に合成時にお
ける安定性の問題を生ずることがない。
〔発明が解決しようとする問題点〕
しかしながら、従来のこの種のCSM型音声合成器におい
て、たかだか4〜6波程度の正弦波周波数で表現される
CSMを利用して音声を合成するには単にこれらを線形結
合するだけでは全く不充分で、これらの処理のほかにい
くつかの特別の処理をすることが必要となる。
これら特別な処理は、単純なCSMの集合、すなわちたか
だか4〜6波程度の線スペクトルを、声道伝送特性に対
応するスペクトル包絡と、声帯振動特性あるいは声道の
狭め等によってつくられる無声音声の音源の特性に対応
するスペクトルの微細構造との畳み込みの形式のスペク
トルに変換するためのもので、後に詳述する如く目的と
するところはたかだか数個のCSMの必要なスペクトル拡
散にあり、ピッチ情報を利用した特別な窓処理を介して
実施される。第11図は従来のCSMにおける窓処理説明図
である。第11図は有声音を生成する場合を対象とした窓
処理を示す。あらかじめ設定する窓関数による時間窓を
利用し、この時間窓をすべてのCSM正弦波信号の位相を
ピッチ周期に応答して位相リセットしつつ出力する状況
を示す。ただし、このような窓処理を前提として行なわ
れる音源付与によれば、スペクトルの微細構造としての
音源が完壁にピッチ構造を持過ぎてしまうこととなる。
何故ならば、現実の音声はピッチ構造を有してはいるも
ののそのくずれもまた大きいからである。従って、従来
の有声音発生法は、人工的過ぎる合成音を発生し聴覚的
に不自然すなわち機械的音声にならざるを得ないという
問題がある。
上述した問題は有声音を対象としたものであるが、一方
無声音について言えば次のような問題がある。
すなわち、無声音の処理については現在、一般的に必ら
ずしも明確に知られていない。特にCSMを用いて無声音
の合成を行なう場合に必要なスペクトル拡散法も確立し
ておらず、従ってCSM型音声合成器はまだ実用化されて
いるとは言い難いという問題がある。
本発明の目的は上述した欠点を除去し、実用に耐えるCS
M型音声合成器を提供することにある。
〔問題点を解決するための手段〕
本発明のCSM型音声合成器は、ピッチ構造に拘束されな
いスペクトル拡散手段を含む有声音発生手段を有して構
成される。
また、本発明のCSM型音声合成器は、乱数発生手段を有
しかつこの乱数発生手段によって発生した乱数信号にも
とづいて設定される周期の連続波形を利用したスペクト
ル拡散手段を含む無声音発生手段を有するCSM型音声合
成器において、前記スペクトル拡散手段が周波数変調と
して構成される。
さらに、本発明のCSM型音声合成器は、乱数発生手段を
有しかつこの乱数発生手段によって発生した乱数信号に
もとづいて設定された周期信号を利用するスペクトル拡
散手段を含む無声音発生手段を有するCSM型音声合成器
において、前記スペクトル拡散手段が前記同期信号によ
って指定される周期とは異る周期の窓関数発生手段を含
んで構成される。
〔実施例〕
最初にCSM型音声合成器の原理について説明する。
CSMは、音声信号を振幅と周波数を自由に選択しうるパ
ラメータとしてもつ特定個数の正弦波の和として表現し
たものである。特定個数としてはたかだか4〜6個のあ
らかじめ設定するが利用される。従って、CSM音声合成
を行なうには、先ず被分析音声信号をCSM音声分析によ
って、あらかじめ設定された個数の正弦波の和として表
現することが必要となる。
CSM音声分析については後で詳述するものとし、ここで
は要点のみを説説する。
CSM音声分析もLPC分析の場合と同様に位相情報の無視、
音源の影響の平均化、雑育成分による不安定性の回避等
を目的とし中間パラメータとして自己相関係数を利用す
る。
すなわち、CSM分析は各分析フレームごとに表現される
べき音声波形から直接算出される標本自己相関係数の低
次のタップのN個を、合成波の自己相関係数の低次のタ
ップのN個と一致するように、合成すべき各正弦波の周
波数およびその強度(電力振幅)を決定することであ
る。
いま、合成すべき正弦波の個数をnとし、各正弦波の角
周波数をωi(i=1,2,…n)、各正弦波の強度をmi
すると、CSMによる合成波ytは次の(1)式で表わされ
る。
(1)式のタップlの自己相関係数γlはωi,miを利用
して容易に(2)式の如く表わすことができる。
一方、表現されるべき音声波形のサンプルをXtとする
と、あるフレームにおけるタップlの標本自己相関係数
lは次の(3)式で示すことができる。
(3)式において、Mは1分析フレームあたりのサンプ
ル数である。
さて、CSM分析においては上述したγlが、与えられたV
lと低次のN個について等しくなるようにmi,ωiが決
定される。すなわちγl=Vl(l=0,1,2,…N)が成立
するようにmi,ωiが決定される。ここで、n個の正弦
波のmiおよびωiが、与えられた音声信号に対応して各
分析フレームごとに次次に得られるものとする。第12図
はCSMパラメータmi,ωiによる音声特徴ベクトルパタ
ーンの一例を示す音声特徴ベクトルパターン図である。
第13図はCSM線スペクトルとLPCスペクトル包絡とを対比
して示すCSM/LPCスペクトル対比図である。第13図の場
合は分析フレーム長が30mSEC、分析次数9次(N=9)
のCSM(n=5)のCSM線スペクトルと、同一の音声サン
プルから求めた9次のLPCスペクトル包絡とを対比して
示している。
上述した次数Nと、正弦波の個数nとの間にはN=2n−
1の関係があることもよく知られている。
ところで、このようなCSM分析の結果得られるn個の
i,ωiの値を用いて、このmi,ωiで指定される強度
(振幅は および角周波数をもつn個の正弦波をつくりこれを単純
に加算しただけでは人間の耳には単に正弦波が合成され
た音として聞えるだけでもとの音声を再現するという目
的は果たせない。
このことは、正弦波を単純加算しても、発生した信号の
スペクトルは離散化されたn個の線スペクトルに過ぎ
ず、一方、音声信号のスペクトルは連続的スペクトル包
絡を有し、さらに、有声音はピッチ構造で表現され、ま
た無声音は確率過程で表現される微細スペクトル構造を
有し、従って単純加算したCSMと音声信号とは互いにス
ペクトル構造が全く異ることに起因する。そこで、CSM
を用いて音声を合成するには、何等かの手法を用いて線
スペクトルを連続的スペクトルに拡散せしめることが必
要となる。つまり、CSM音声合成とは第12図、第13図に
示すような線スペクトルで表現された音声特徴スペクト
ルパターンから音声スペクトルパターンを発生させるこ
とに帰着する。
本発明においては、上述したスペクトル拡散を行なうた
めに次に述べるような手法を用いている。
すなわち、有声音は明確なピッチ構造を有することを利
用し、n個の各正弦波をこのピッチ周期ごとに位相のリ
セットを行なう。これにより、容易にスペクトルの発生
とピッチ微細構造の発生が可能となる。さらに、後述す
る如く、特殊な窓処理を上述した位相リセット波形に施
すことによって位相リセット時における合成波形の不連
続性を除去している。第14図は本発明におけるCSMのス
ペクトル拡散前のスペクトル包絡およびピッチ微細構造
特性図、第15図は従来のCSMのスペクトル拡散後のスペ
クトル特性図である。第14図の内容がスペクトル包絡と
ピッチ微細構造とを有するスペクトルに変化し、聴覚的
にも充分実用に耐える音質となることが実験結果でも明
らかになっている。これに対し、第14図の場合は、単に
正弦波が合成された波形として聞えるだけで音声合成の
目的は達せられない。
以上は有声音の場合であるが、無声音の場合は次のよう
にして行なう。すなわち、上述した有声音の場合には、
ピッチ周期ごとに行なった位相のリセットと特殊の窓処
理とを、無声音の場合にはピッチ周期の代りに確率過程
としてランダムに発生するその周期が分布幅と下限値と
を設定されたパルスを用い、このパルスの発生時点ごと
に上述した処理を実施する。
しかしながら、本来無声音は有声音と異り、声帯のよう
な明確な音源を有せず、声道全体が乱流を発生して音源
となっている。従って、無声音には位相初期化により発
生する各周波数成分の明確な位相関係は不要である。そ
こで、本発明では、不要な位相関係を有せずに周波数拡
散を行なう1つの無声音の合成としてCSMの各周波数に
雑音でFM変調をかける方法を用いている。この場合の雑
音は、白色雑音や上述した周期が分布幅と下限値とを設
定したものでよい。これにより、無声音において不必要
な位相初期化は排除できる。
また本発明においては、無声音の他の合成法として次の
ような手法も利用している。
すなわち、乱数発生手段によって発生した乱数信号にも
とずいて設定した同期信号を利用するスペクトル拡散手
段を含む無声音発生手段を有するCSM型音声合成器を対
象とし、前記同期信号とは異る周期の窓関数発生手段を
含むスペクトル拡散手段によって無声音を合成するもの
である。このような窓関数発生手段を利用することによ
って位相リセット時点近傍における連続性を著しく改善
することができる。
さらに本発明においては、有声音においてもピッチ構造
が従来の手法にあっては明確化され過ぎ、極めて不自然
な聴感を与えることに対し、ピッチ構造に拘束されない
スペクトル拡散手段を利用し有声音合成も実施してい
る。このことは無声音の場合に同期信号とは異る周期の
窓関数発生手段を利用する前述の例と同じく、窓区間境
界部分における合成音声の連続性を高める効果を狙った
ものである。
さて、次に本発明の具体的実施例を図面を参照して詳細
に説明する。第1図は本発明の第1の実施例を示すブロ
ック図である。
この第1の実施例は、乱数発生によって発生した乱数信
号にもとづいて設定した周期の連続波形を利用するスペ
クトル拡散手段を含む無声音発生手段を備えたCSM型音
声合成器であって、しかも周波数変調をスペクトル拡散
とする場合の具体例を示すものである。
第1の実施例は分析側(送信側)と合成側(受信側)と
から成る。分析側は図示しないが、A/Dコンバータ、ハ
ミング窓処理器、自己相関係数計測器、CSM分析器、CSM
量子化器、電子量子化器、ピッチ抽出器、有声音/無声
音判定器、およびマルチプレクサを備えて構成される。
また合成側は、第1図に示す如く、デマルチプレクサ・
復号化器101、補間器102、同期算出器103、乱数発生器1
04、n個の位相リセット機能付可変周波数発振器105
(1),105(2),…105(n),n個の可変利得増幅器1
06(1),106(n),加算合成器107,可変長窓関数発生
器108,乗算器109,110,n個のFM変調器111(1),111
(2),…111(n)、鋸歯状波発生器112,および有声
/無声切替器113(a)〜113(c)等を備えて構成され
る。
分析側では、音声波形をA/Dコンバータで振幅と時間軸
とが量子化されたディジタルデータに変換し、ハミング
窓処理器、ピッチ抽出器、有声音/無声音判定器等に供
給する。
ハミング窓処理器に供給されたディジタルデータは、あ
らかじめ定める1分析フレームごとに公知のハミング窓
関数による荷重乗算を受け各分析フレームのデータごと
に自己相関係数計測器に供給される。
自己相関係数計測器は、こうして入力された各分析フレ
ームのデータごとに前述した(3)式の演算により低位
のN個の自己相関係数Vlを求める。こうして得られる
各分析フレームごとのVlの組を次のCSM分析器に供給す
るとともにこの中のV0、つまり遅れ時間零における自
己相関係数を当該分析フレームにおける電力情報として
電力量子化器に供給する。
各分析フレームごとの自己相関係数Vlの組の供給を受
けたCSM分析器は、後述する演算を行なうことによって
対応する分析フレームのCSMのn個の各正弦波の強度お
よび角周波数を指定するmi,ωiを決定しこれをCSM量
子化器に供給する。
CSM量子化器は、これらmi,ωiの組を再生音質に対す
る要求と伝送路の伝送容量とを勘案して設定される適当
な粗さで量子化したのちマルチプレクサに供給する。ま
た、電力量子化器もV0を上述の観点から設定される粗
さで量子化したのちマルチプレクサに供給する。また、
A/Dコンバータからのディジタルデータを受けたピッチ
抽出器は、ピッチ周期を抽出しこれを量子化したのちマ
ルチプレクサに供給し、さらに、有声音/無声音判定器
も供給されたディジタルデータによって有声音/無声音
の判定を行ないこれを2値信号としてマルチプレクサに
供給する。
以上の信号の供給を受けたマルチプレクサは、これらの
信号を合成側における分離の容易さ、ならびに伝送に適
した形式で多重化し合成側に伝送する。
合成側では、こうして伝送された信号をデマルチプレク
サ・復号化器101で受け、復号化および分離化を行なっ
て分析側のマルチプレクサ入力の信号状態に復元する。
説明を簡単にするためにn個のFM変調器111(1)〜111
(n)は存在しないものとして説明を進める。
こうして復元された角信号はメモリ機能を有する補間器
102に供給され、必要な補間を施されたのちω1〜ωi
n個の位相リセット機能付可変周波数発振器105(1)
〜105(n)の周波数制御入力として供給され、これら
各発振器の出力角周波数をそれぞれω1〜ωnに設定す
る。
また、CSMのn個の各正弦波の強度(電力振幅)を指定
するmi〜mnはn個の可変利得増幅器106(1)〜106
(n)の利得制御入力として供給され、これにより各周
波数の発振電力がそれぞれ指定された値になるように制
御する。
こうして得られるn個の可変利得増幅器106(1)〜106
(n)の出力は加算合成器107で加算合成したのち乗算
器109に供給される。
デマルチプレクサ・復号化器101から出力されるピッチ
周期情報は、補間器102で必要な補間が行なわれたのち
可変長窓関数発生器108に供給される。
可変長窓関数発生器108は、位相リセットによって出力
波形に生ずる不連続を除き、音声波形のもつ連続性を確
保するための窓関数を発生するものであり、同時に、こ
の窓関数と密接な時間関係を有する位相リセット用パル
スも発生する。前述した如く、可変長窓関数発生器108
には次次に位相リセット用パルスの間隔を指定するピッ
チ周期データ列が入力されるが、可変長窓関数発生器10
8は、このデータは、このデータで指定される時間間隔
を有するインパルスを次次に発生し、これを有声/無声
切替器113(a)を介して位相リセット機能付可変周波
数発振器105(1)〜105(n)の位相リセット用入力と
して供給しこれによって各発振器の位相リセットを行な
う。また、これを補間器102にも供給し、ωiおよびmi
を補間するためのタイミング信号として使用する。
さて、可変長窓関数発生器108は、上述した位相リセッ
ト用パルス発生と同期して下記のような可変長の窓関数
W(x)を発生する。すなわち、供給されたデータによ
って指定されたその時点における位相リセット用パルス
間隔をTとし、前の位相リセットパルスが発生してから
の経過時間をtとするとW(t)は次の(4)式で示さ
れる。
第16図は第1図の実施例の可変長窓関数特性図である。
この場合のTの値は、有声音の場合にはピッチ周期を表
わし時間とともに変化する。従って、W(t)は可変長
である。第17図は第1図の可変長窓関数と位相リセット
用パルスとの相対時間関係特性図である。第17図からも
明らかな如く、窓関数の開始時点および終止時点が位相
リセット用パルスとほぼ一致している。
可変長窓関数発生器108の出力は、有声/無声切替器113
(b)を介して乗算器109に供給される。この結果、乗
算器109には、加算合成器107で合成されたn個の正弦波
形と、各位相リセット用パルスに同期して発生される窓
関数W(t)との積が得られる。こうして得られる波形
は、各正弦波が位相リセットされる直前で窓関数W
(t)の乗算を受けて連続的に零に収束されており、ま
た位相リセット時点では各正弦波は零から立上るので波
形の連続性が確保され、かくして窓関数W(t)の乗算
により位相リセット波形に生ずる不連続性を除去するこ
とができる。
乗算器109の出力は乗算器110に供給され、補間器102を
介して出力される電力V0によって加重され合成音声と
して出力する。
以上が第1の実施例における音声合成時の動作である
が、ただし有声音を対象としたものであり、従って有声
/無声切替器113(a),(b),(c)はいずれも第
1図に示す(V)側、すなわち有声音側に接続されてい
る。
さて、上記は有声音の場合であるが、無声音の場合には
有声/無声切替器113(a),(b),(c)は(UV)
側に切替えられ次のようにして処理される。
乱数発生器104は乱数信号を発生しこれを周期算出器103
に出力する。周期算出器103は提供された乱数信号にも
とづいて算出した周期データを鋸歯状波発生器112に出
力する。
鋸歯状波発生器112は、供給された周期データで周期が
制御される鋸歯状波を発生する。第18図は第1図の実施
例における鋸歯状波出力波形図である。
鋸歯状波発生器112は、第18図に示す周期T1,T2,T3,T4
…等の鋸歯状波を出力し、有声/無声切替器113(c)
に供給する。
FM変調器111(1)〜111(n)は、位相リセット機能付
可変周波数発振器105(1)〜105(n)から提供される
正弦波をFM変調するものであり、その変調信号は無声時
の場合は鋸歯状波発生器112の出力が有声/無声切替器1
13(c)を介して供給され、有声時の場合には“0"電圧
が有声/無声切替器113(c)を介して供給される。つ
まり、位相リセット機能付可変周波数発振器105(1)
〜105(n)の出力波形は無声音では鋸歯状波でFM変調
され、有声音では変調されない。FM変調により正弦波が
周波数拡散されることは公知であり説明は省略する。な
お、変調指数は聴覚的な観点から経験的に設定される。
有声/無声切替器113(a)〜113(c)はデマルチプレ
クサ・復号化器101から出力されるV(有声)/UV(無
声)信号によって一斉に切替えられる。こうして有声音
時には位相リセット用パルスを利用して音成が合成さ
れ、無声音時にはFM変調によって音声が合成される。
なお、無声音合成の場合には位相リセット機能付可変周
波数発振器105(1)〜105(n)は位相リセットを行な
わず、また乗算器110には一定のDC信号が印加され波形
の整形は行なわれない。また、補間器102は有声時のみ
位相リセット機能付可変周波数発振器105(1)〜105
(n)に供給される位相リセット用パルスに同期して補
間処理を実施し、無声音時には、たとえば5mSEC等一定
の周期で補間処理を実施する。
このようにして音声合成に必要なCSM合成が実行され、
伝送路における情報量の圧縮や伝送エラーにかかわらず
比較的良好な音質が得られる。
上述した説明中、補間器102における各データに対する
補間は、分析側で各データを量子化する際の粗さに応じ
て種種の組合せで行なうことが可能で、たとえばωi
け、あるいはωi,miだけ等種種考えられ、また補間の方
法も直線補間や高級な関数による補間も可能である。な
お、ωi,miに対する補間に関しては、前述した位相リセ
ットパルス発生時点ごとに補間データが得られるように
補間点を選択することが有利であり、ωi,miの更新をこ
のタイミングで行なうため前述の如く位相リセット用パ
ルス補間器102にも供給している。このような補間を行
なうためには、必要な後データが到着するかもしくは発
生するかした後で補間データを求めることとなるため補
間器102には必要情報を補間演算に必要な時点まで記憶
しておくメモリが備えられている。
第2図は第1図の位相リセット機能付可変周波数発振器
の部分を詳細に示す回路図である。
定電流源1051,1052を流れる電流値は周波数制御端子に
印加される電圧によって制御される。これら定電流の制
御は、スイッチ1050によって切替えられるキャパシタ10
53の充放電電流を制御することとなる。V点の出力は基
準電圧+Vγと−Vγとの間を直線的に上下する三角波
形となる。定電流i1とi2はそれぞれこの三角波形の立
上りと立下りの特性を決定し従ってその周期も決定す
る。たとえばこの電流値が小であれば周期は大となる。
スイッチ1050はRS型フリップフロップ回路1059のQ出力
によって制御されるが、RS型フリップフロップ回路1059
は、コンパレータ1056の出力をリセット端子Rで受け、
またコンパレータ1057の出力ならびに位相リセット端子
の入力を2入力とするOR回路1058の出力をセット端子S
を受けて前記三角波形を形成せしめるためのスイッチ切
替えを行なわせる。すなわち、位相リセット端子にイン
パルスを印加するとV点はスイッチ1054によって強制的
に零電位に戻され、この零電位から発振を再スタートし
スイッチ1050は充電側に接続され位相リセットされる。
このようにして得られるV点の三角波発振出力は正弦波
変換器1055に供給され正弦波に変換される。この正弦波
変換器は、たとえばROMに格納したサイン関数値を入力
波形で読出すといった形式で容易に実施しうる。
また、かかる位相リセット機能付可変周波数発振器は計
算器のプログラムを用いても容易に実施することができ
る。
第3図は第1図の可変利得増幅器の部分を詳細に示す回
路図である。第3図に示す可変利得増幅器は増幅器207
1、抵抗2073による演算増幅器の利得を電界効果トラン
ジスタ2072に印加される電圧に対応して可変とするもの
で、増幅すべき信号を入力端子に加え、制御端子に制御
信号を加え、出力端子から制御された振幅を有する出力
を得る。
また、このほかに、アナログ乗算器を用いて実現するこ
とも可能であり、さらに、D/Aコンバータの基準電圧に
アナログ波形入力を利用し、ディジタル入力としてディ
ジタル量で表現された制御情報を利用する等の方法によ
っても容易に実現することができる。
第4図は第1図の乱数発生器の部分を詳細に示す回路図
である。D1〜D15で示す15段のシフトレジスタ1041と
半加算器1042の組合せを利用し、2個の入力端子A,Bに
印加される信号の排他的論理和を出力S端からシフトレ
ジスタ1041の入力に帰還する形式で215−1の周期を有
する15次のM系列の乱数信号を発生する。CLK(クロッ
ク)端子に必要なタイミングでシフトパルスを加えるこ
とによって次の乱数値を得るように歩進せしめる。
第5図は第1図の周期算出器103の部分を詳細に示すブ
ロック図である。乱数発生器104から出力される0から
15−1の範囲に一様に分布している乱数を無声時に位
相リセット用パルスの時間間隔を指定する乱数として利
用するのに適した分布に変換するもので定数乗算器1031
と定数加算器1032から成り、これら定数乗算、加算を介
して乱数上上,下限と分布幅とを適当な値に設定するこ
とができる。
第6図は第1図の可変長窓関数発生器の部分を詳細に示
すブロック図であり、レジスタ1081,プリセット可能な
ダウンカウンタ1082,カウンタ1803,ROM1084等を備えて
構成される。
補間器102から供給された位相リセット用パルス間隔を
指定するピッチ周期データはレジスタ1081に格納され
る。
ダウンカウンタ1082は、一定周期の高速クロックCLKを
カウントするカウンタで、レジスタ1081の内容Tをプリ
セットしこれをCLKを用いてダウンカウントする。ダウ
ンカウンタ1082の内容が零になると出力端子からパルス
を発生しこれによって再びレジスタ1081の内容をプリセ
ットしてこのダウンカウントを開始する。このようにし
てダウンカウンタ1082の出力にはTに比例した周期、た
とえばT/Kのパルス列が発生する。このパルス列はカウ
ンタ1038のクロックとして提供され、このクロックで歩
進させられるカウンタ1083のカウント出力はROM1084に
アドレス指定信号として加えられ、このアドレスに書き
込まれている窓関数W(t)のデータを順番に読出して
出力する。カウンタ1083の内容がKとなるとROM1084の
窓関数W(t)の最後のデータが読出され、これととも
にカウント1083はリセットされてROM1084からは位相リ
セット用パルスが出力される。また、ROM1084の中にK
個のサンプルとしてあらかじめ格納されている窓関数の
データは有声/無声切替器113(b)を介して乗算器109
に供給される。かくして、パルス間間隔が次次に指定さ
れた値をもつ位相リセット用パルスと、これと同期した
可変長窓関数W(t)とが生成される。
CSM分析およびその具体的構成については、“複合正弦
波モデルによる音声スペクトル分析”嵯峨山その他、電
子通信学会論文誌81/2、Vol.J64−A No.2 P.105-112や
同人による特願昭59-143045に詳述されている。
なお、上述した第1の実施例における分析側のCSM分析
は、標本自己相関係数とCSMの自己相関係数とを等しい
とする方程式を解く方法を用いているが、この代りにLP
C係数の無損失化による線スペクトル周波数の算出およ
び留数計算による方法を用いることもできる。また、本
実施においては補間器で位相リセット時点でパラメータ
補間を行なっているが、この補間は運用条件等によって
は省略することも可能である。
また、本実施例で利用している可変長の窓関数は一例を
示すもので他の関数形を利用しても差支えない。
さらに乱数発生器周期算出器等もその一例を示したもの
でこれに限定される必要はない。
次に本発明の第2の実施例について説明する。第7図は
本発明の第2の実施例を示すブロック図である。この第
2の実施例は、ピッチ構造に拘束されないスペクトル拡
散手段を含む有声音発声手段を有するCSM型音声合成器
におけるスペクトル拡散手段を周波数変調としたもので
ある。つまり、第1の実施例では無声音の合成において
FM変調を用いているが有声音の場合もFM変調を用いるこ
とができ、これを利用したものである。
第7図において、同一記号に関する構成要素は第1図の
場合と全く同一であるのでこれらに関する詳細な説明に
省略する。
有声/無声切替器114はデマルチプレクサ・復号化器101
から供給されるV/UV情報を受けつつこれが有声(V)を
指定するときは補間器102からのピッチ周期情報を可変
長窓関数発生器108に供給し、第1図の場合と同様にし
て発生する位相リセット用パルスは位相リセット機能付
加変周波数発振器105(1)〜105(n)ならびに補間器
102に供給する。また可変長窓関数も乗算器109に提供さ
れかくして有声音の場合にもスペクトル拡散手段として
の周波数変調が実施される。一方、無声の場合は可変長
窓関数発生器に対するピッチ周期データの提供は停止さ
れ、第1図の場合と同様に無声音が発生される。こうし
て、有声音の合成においてもFM変調を行ない、より肉声
に近い音声の合成が可能となる。このことは、次のよう
な効果を意味する。すなわち、単純なCSM位相初期化に
よって合成した音声のスペクトルがあまりにも明確過ぎ
るピッチ調波構造を付与しているのに対し、実際の音声
は声帯のゆらぎ等によってある程度不明確なピッチ構造
と有しており、従って、有声音合成時にFM変調を併用す
ることにより肉声に接近せしめることができるというこ
とである。
次に本発明の第3の実施例について説明する。第8図は
本発明の第3の実施例を示すブロック図であり、デマル
チプレクサ・復号化器101、補間器102、周期算出器10
3、乱数発生器104等前述した内容のほか、有声/無声切
替器114、カウンタ115、固定窓長CSM合成器116(1),1
16(2),…116(n)、加算合成器117等を備えて構成
される。
この第3の実施例は、ピッチ構造に拘束されないスペク
トル拡散手段を含む有声音発生手段を有するCSM型音声
合成器であって、スペクトル拡散手段がピッチ周期長と
は異る周期の窓関数発生手段を含んでいる場合、ならび
に乱数発生手段で発生した乱数信号にもとづいて設定さ
れる周期信号を利用したスペクトル拡散手段を含む無声
音発生手段を備えたCSM型音声合成器であって、そのス
ペクトル拡散手段が上述した周期信号によって指定され
る周期とは異る周期の窓関数発生手段を含んでいる場合
の2つの場合を併せ実施して有声音と無声音を発生する
場合の一実施例を示すものである。
有声/無声切替器114は、デマルチプレクサ・復号化器1
01から受けるV/UV情報によって切替えられカウンタ115
に有声のときはピッチ周期、無声のとき周期算出器103
から出力される乱数周期に関するデータをカウンタ115
に供給する。
カウンタ115は、こうして入力するピッチ周期データも
しくは乱数周期データ入力ごとに歩進せしめられつつ固
定窓長CSM合成器116(1)〜116(n)に対し次次に位
相リセット用パルスを出力しn個の固定窓長CSM合成器1
16(1)〜116(n)に供給する。
n個の固定窓長CSM合成器116(1)〜116(n)はそれ
ぞれ、補間器102から補間ずみのデータm1〜mn,ω1
ωnならびに電力情報V0を提供され、互いに異る固定窓
長のCSMを合成し加算合成器117に出力する。
第9図は第8図の固定窓長CSM合成器116の部分を詳細に
示すブロック図であり、n個の位相リセット機能付可変
周波数発振器1161(1)〜1161(n)、固定長窓関数発
生器、n個の可変利得増幅器1163(1)〜1163(n)、
加算合成器1164、乗算器1165、および乗算器1166等を備
えて構成される。
n個の位相リセット機能付周波数発振器1161(1)〜11
61(n)はそれぞれ補間器からω1〜ωnを受け位相リセ
ット用パルスで位相リセットしながら正弦波周波数を発
振し可変利得増幅器1163(1)〜1163(n)に出力す
る。これら可変利得増幅器はそれぞれm1〜mnに対応し
た可変利得制御をうけたのち加算合成器で加算される。
有声音の場合は、こうして出力される波形の位相リセッ
トはピッチ周期に対応して行なわれ、また無声音の場合
は乱数周期に対応して行なわれる。
乗算器1165は加算合成器1164の出力と固定長窓関数発生
器1162から受ける固定長窓関数との乗算を行ないその出
力を乗算器1166に供給する。固定長窓関数はn個の固定
窓長CSM合成器ごとに互いに異り、従ってこれら固定長
窓が互いに重複し合い、もしくは離隔し合うような処理
も選択しうる。このような固定長窓関数を利用する目的
は位相リセット時点近傍での合成音質の連続性をさらに
改善させようとする目的に他ならない。
第10図は第9図の固定長窓関数発生器1162の部分を詳細
に示すブロック図であり、RS型フリップフロップ回路11
62−1,AND回路1162−2、カウンタ1162−3,ROM1162−4,
ゲート回路1162−5等を備えて構成される。
RS型フリップフロップ回路1162−1は、カウンタ115か
ら位相リセット用パルスをS端子に受けるごとにQ出力
端子は“0"レベルとなり、またカウンタ1162−3もリセ
ットされ、AND回路1162−2からは高速クロックがカウ
ンタ1162−3に出力される。カウンタ1162−3は各固定
窓長CSM合成器ごとに形成すべき固定長窓関数の時間長
に対応した値のデータを格納し、入力する高速クロック
で読出されたときこれをROM1162−4のアドレスデータ
として出力し、ROM1162−4の当該アドレスに格納され
ている固定長窓関数に関するデータを乗算器1165に出力
する。また、カウンタ1162−3はこのようにして出力す
るアドレスデータをゲート回路1162−5に出力し、その
論理ゲートを利用して所定の形式のリセットパルスを出
力せしめる。
ゲート回路1162−5から出力されるリセットパルスはRS
型フリップフロップ回路1162−1のR端子に印加され
出力端子の極性を反転しカウンタ1162−3のカウント動
作を停止する。
こうしてROM1162−4からは位相リセット用パルス入力
ごとに所定の窓関数が出力され乗算器1165に提供され
る。
乗算器1165は、こうして入力する固定長窓関数と加算合
成器1164の出力とを乗算し乗算器1166に供給する。
乗算器1166は乗算器1165の出力に対し電力情報V0を乗
算しこれを加算合成器117に出力する。
加算合成器117は、こうして各固定窓長CSM合成器から出
力されるCSM合成音を加算合成し合成音として出力す
る。
こうしてピッチ構造に拘束されず、しかもピッチ周期長
とは異る周期の窓関数を利用する有声音の発生、ならび
に乱数信号で指定される周期とは異る周期の窓関数を利
用する無声音による音声合成が容易に行なわれる。
〔発明の効果〕
以上説明したように本発明によれば、CSM型音声合成器
において、ピッチ構造に拘束されないスペクトル拡散手
段を含む有声音発生手段、もしくは乱数信号にもとづい
て設定される周期の連続波形を利用するスペクトル拡散
手段が周波数変調である無声音発生手段、あるいは乱数
信号にもとづいて設定された周期信号によって指定され
る周期とは異る周期の窓関数発生手段を有するスペクト
ル拡散手段を含む無声音発生手段を備えることにより、
聴覚的に著しく肉声に近い音声の合成法を実施すること
が可能となるCSM型音声合成器が実現できるという効果
がある。
【図面の簡単な説明】
第1図は本発明の第1の実施例のブロック図、第2図は
第1図の実施例における位相リセット機能付可変周波数
発振器105の部分を詳細に示すブロック図、第3図は第
1図の実施例における可変利得増幅器106の部分を詳細
に示す回路図、第4図は第1図の実施例における乱数発
生器104の部分を詳細に示すブロック図、第5図は第1
図の実施例における周期算出器103の部分を詳細に示す
ブロック図、第6図は第1図の実施例における可変長窓
関数発生器108の部分を詳細に示すブロック図、第7図
は本発明の第2の実施例のブロック図、第8図は本発明
の第3の実施例のブロック図、第9図は第8図の実施例
における固定窓長CSM合成器116の部分を詳細に示すブロ
ック図、第10図は第9図の固定長窓関数発生器1162の部
分を詳細に示すブロック図、第11図は従来のCSMにおけ
る窓処理説明図、第12図はCSMパラメータmi,ωiによ
る音声特徴ベクトルパターン図、第13図はCSM線スペク
トルとLPCスペクトル包絡とを対比して示すCSM/LPCスペ
クトル対比図、第14図は本発明におけるCSMのスペクト
ル拡散後のスペクトル包絡およびピッチ微細構造特性
図、第15図は従来のCSMのスペクトル拡散後のスペクト
ル特性図、第16図は第1図の実施例における可変長窓関
数特性図、第17図は第1図の実施例における窓関数と位
相リセット用パルスとの相対時関関係特性図、第18図は
第1図の実施例における鋸歯状波出力波形図である。 101……デマルチプレクサ・復号化器、102……補間器、
103……周期算出器、14……乱数発生器、105(1)〜10
5(n)……位相リセット機能付可変周波数発振器、106
(1)〜106(n)……可変利得増幅器、107……加算合
成器、108……可変長窓関数発生器、109,110……乗算
器、111(1)〜111(n)……FM変調器、112……鋸歯
状波発生器、113(a),(b),(c),114……有声
/無声切替器、115……カウンタ、116(1)〜116
(n)……固定窓長CSM合成器、117……加算合成器。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】乱数発生手段を有しかつこの乱数発生手段
    によって発生した乱数信号にもとづいて設定された周期
    の連続波形を利用したスペクトル拡散手段を含む無声音
    発生手段を有するCSM型音声合成器において、前記スペ
    クトル拡散手段が周波数変調であることを特徴とするCS
    M型音声合成器。
  2. 【請求項2】乱数発生手段を有しかつこの乱数発生手段
    によって発生した乱数信号にもとづいて設定される周期
    信号を利用するスペクトル拡散手段を含む無声音発生手
    段を有するCSM型音声合成器において、前記スペクトル
    拡散手段が前記周期信号によって指定される周期と独立
    に設定された互いに周期が異なる複数の固定の時間長を
    有する窓関数発生手段を含んで構成されることを特徴と
    するCSM型音声合成器。
  3. 【請求項3】ピッチ構造に拘束されないスペクトル拡散
    手段を含む有声音発生手段を有し、前記スペクトル拡散
    手段として周波数変調手段を含むことを特徴とするCSM
    型音声合成器。
  4. 【請求項4】ピッチ構造に拘束されないスペクトル拡散
    手段を含む有声音発生手段を有し、前記スペクトル拡散
    手段として、ピッチ周期長とは独立に設定された互いに
    周期の異なる複数の固定の時間長を有する窓関数発生手
    段を含むことを特徴とするCSM型音声合成器。
  5. 【請求項5】乱数発生手段によって発生する乱数信号に
    もとづいて設定した周期の連続波形が鋸歯状波であるこ
    とを特徴とする特許請求の範囲第(1)項記載のCSM型
    音声合成器。
  6. 【請求項6】あらかじめ設定した有限の下限値と上限値
    によって設定される分布範囲を有する乱数信号を発生す
    る乱数発生手段を有することを特徴とする特許請求の範
    囲第(1)項記載のCSM型音声合成器。
  7. 【請求項7】音声信号を代表する別途抽出された複数個
    の正弦波信号の強度および周波数パラメータを入力もし
    くは蓄積する手段を有するとともに前記パラメータを利
    用して複数個の正弦波信号を出力する正弦波発生手段
    と、この正弦波発生手段によって出力する複数の正弦波
    信号を重畳する重畳手段と、あらかじめ設定した有限の
    下限値と上限値によって設定される分布範囲を有する乱
    数信号を発生する乱数発生手段と、前記音声信号が有声
    時には前記正弦波信号を前記音声信号のピッチ周期に対
    応して位相リセットするとともに無声時には前記乱数信
    号にもとづいて設定した周期の連続波形で前記正弦波信
    号を変調する変調手段とを備えて成ることを特徴とする
    特許請求の範囲第(1)項記載のCSM型音声合成器。
  8. 【請求項8】音声信号を代表する複数個の正弦波信号の
    強度および周波数パラメータを抽出する手段と、抽出さ
    れた強度および周波数パラメータをもつ複数個の正弦波
    信号を出力する正弦波発生手段と、この正弦波発生手段
    によって出力する複数個の正弦波信号を重畳する重畳手
    段と、あらかじめ設定した有限の下限値と上限値によっ
    て設定される分布範囲を有する乱数信号を発生する乱数
    発生手段と、前記音声信号が有声時には前記正弦波信号
    を前記音声信号のピッチ周期に対応して位相リセットす
    るとともに無声時には前記乱数信号にもとづいて設定し
    た周期の連続波形で前記正弦波信号を変調する変調手段
    とを備えて成ることを特徴とする特許請求の範囲第
    (1)項記載のCSM型音声合成器。
  9. 【請求項9】あらかじめ設定した有限の下限値と上限値
    によって設定される分布範囲を有する乱数発生手段を有
    することを特徴とする特許請求の範囲第(2)項記載の
    CSM型音声合成器。
JP62019114A 1987-01-28 1987-01-28 Csm型音声合成器 Expired - Lifetime JPH0754436B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62019114A JPH0754436B2 (ja) 1987-01-28 1987-01-28 Csm型音声合成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62019114A JPH0754436B2 (ja) 1987-01-28 1987-01-28 Csm型音声合成器

Publications (2)

Publication Number Publication Date
JPS63186300A JPS63186300A (ja) 1988-08-01
JPH0754436B2 true JPH0754436B2 (ja) 1995-06-07

Family

ID=11990449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62019114A Expired - Lifetime JPH0754436B2 (ja) 1987-01-28 1987-01-28 Csm型音声合成器

Country Status (1)

Country Link
JP (1) JPH0754436B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6151619B2 (ja) 2013-10-07 2017-06-21 クラリオン株式会社 音場測定装置、音場測定方法および音場測定プログラム

Also Published As

Publication number Publication date
JPS63186300A (ja) 1988-08-01

Similar Documents

Publication Publication Date Title
US5007095A (en) System for synthesizing speech having fluctuation
CA1046642A (en) Phase vocoder speech synthesis system
RU96111955A (ru) Способ и устройство воспроизведения речевых сигналов и способ их передачи
JPS5853352B2 (ja) 音声合成器
US3909533A (en) Method and apparatus for the analysis and synthesis of speech signals
US5321794A (en) Voice synthesizing apparatus and method and apparatus and method used as part of a voice synthesizing apparatus and method
JPH0754436B2 (ja) Csm型音声合成器
JPS6265100A (ja) Csm型音声合成器
JPH051957B2 (ja)
EP1291846A2 (en) Voice synthesizing apparatus capable of adding vibrato effect to synthesized voice
US4633500A (en) Speech synthesizer
US5797120A (en) System and method for generating re-configurable band limited noise using modulation
JPS6022191A (ja) 音源装置
JPH07261798A (ja) 音声分析合成装置
JPS6338719B2 (ja)
JPH0441838B2 (ja)
JP2004205624A (ja) 音声処理システム
JP3130305B2 (ja) 音声合成装置
JPH0439678B2 (ja)
JP2002006853A (ja) 共鳴装置
JP3017042B2 (ja) 音声合成装置
JPH0632000B2 (ja) 音声楽音合成装置
KR0149295B1 (ko) 디지탈 사운드 신시사이저 및 그 제어방법
JP2797141B2 (ja) 楽音波形発生装置
JPH10187180A (ja) 楽音発生装置