JPH0441838B2 - - Google Patents

Info

Publication number
JPH0441838B2
JPH0441838B2 JP59179694A JP17969484A JPH0441838B2 JP H0441838 B2 JPH0441838 B2 JP H0441838B2 JP 59179694 A JP59179694 A JP 59179694A JP 17969484 A JP17969484 A JP 17969484A JP H0441838 B2 JPH0441838 B2 JP H0441838B2
Authority
JP
Japan
Prior art keywords
csm
lpc
synthesis
output
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP59179694A
Other languages
English (en)
Other versions
JPS6157999A (ja
Inventor
Satoru Taguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59179694A priority Critical patent/JPS6157999A/ja
Publication of JPS6157999A publication Critical patent/JPS6157999A/ja
Publication of JPH0441838B2 publication Critical patent/JPH0441838B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 (技術分野) 本発明は擬フオルマント型ボコーダ、とくに合
成側に2種類の異なる合成手段を設けて動作環境
に適応させる機能を有する擬フオルマント型ボコ
ーダに関する。
音声分析側でCSM(Composite Sinusoidal
Modeling:複合正弦波モデル)音声分析により
音声信号の擬フオルマント情報を抽出し、これを
合成側に伝送して、この擬フオルマント情報
(CSMパラメータ)から独特のCSM音声合成手
段を用いて音声を再現させる擬フオルマント型ボ
コーダは、嵯峨山氏らの論文“複合正弦波モデル
による音声スペクトルの分析”電子通信学会誌
Vol.J64−ANo.2により明らかにされている。
この擬フオルマント型ボコーダは、後述するよ
うに、合成側に伝送されるパラメータによつて帯
域特性が指定されるような帯域フイルタを含ま
ず、このために伝送情報に誤りが生じても不安定
に陥ることがないために、とくに伝送路の誤り率
の劣化に対して強い耐性を有している。しかしな
がら、誤り率が問題にならないような動作環境の
場合には、同じ程度の情報量を用いて再成された
LPC音声合成方式による再生音声に対して音質
がやや劣るという欠点を有している。
(発明の目的) 本発明の目的は、伝送路の誤り率が良好な場合
に、より高度の音声品質が得られるLPC音声合
成方式と、誤り率の劣化に対してより高い耐性を
もつCSM音声合成方式の両者の特徴を併せもつ
擬フオルマント型ボコーダを提供するにある。
(発明の構成) 本発明のボコーダは、入力音声信号のCSM分
析によつて抽出されるCSMパラメータ情報を伝
送する送信側と、前記伝送路を介して伝送された
前記CSMパラメータ情報の指定する各周波数に
設定される複数の位相リセツト機能付可変周波数
発振器とこれに対応して前記発振器の出力を伝送
された前記CSMパラメータ情報の指定する各強
度に設定する複数の可変利得増幅器と前記複数の
増幅器の合成出力に演算する可変長窓関数発生器
と乱数発生器とを備え有声音合成時にはピツチ周
期に対応して前記各発振器の位相リセツトを行な
いまた無声音合成時には前記乱数発生器の出力よ
り算出される周期に対応して前記各発振器の位相
リセツトを行ないまた前記窓関数発生器の動作を
前記位相リセツトの動作と同期せしめるようにし
てCSM音声合成を行なうCSM合成手段と、伝送
された前記CSMパラメータ情報をLPCパラメー
タ情報に変換しこれを用いてLPC音声合成を行
なうLPC合成手段と、前記CSM合成手段の出力
と前記LPC合成手段の出力とを前記伝送路の伝
送品質に対する評価に従つて可変荷重合成するよ
うにした可変荷重合成手段とを含む受信側とを有
する。
(原 理) 次に、本ボコーダの成立に重要な関係を有する
CSM音声分析合成の原理について説明する。
CSMとは、音声信号を振幅と周波数とを自由
に選べるパラメータとしてもつ特定の個数の正弦
波の和として、表現するものである。この正弦波
の個数としては高々4〜6個の予め定めた数が用
いられる。
従つてCSM音声合成を行なう場合には、まず
音声信号をCSM音声分析により、予め定められ
た個数の正弦波の和として表現する必要がある。
CSM音声分析については後に詳述することとし、
ここではその要点のみを説明する。
CSM分析においてもLPC分析の場合と同様に、
位相情報の無視、音源の影響の平均化、雑音成分
による不安定性の回避等を目的に、中間パラメー
タとして自己相関係数を使用する。
すなわち、CSM分析は、各分析フレーム毎に
表現されるべき音声波形から直接算出される標本
自己相関係数の低次のタツプのN個を、合成波の
自己相関係数の低次のタツプのN個と一致するよ
うに、合成すべき各正弦波の周波数およびその強
度(電力振幅)を決定することである。
今、合成すべき正弦波の個数をnとし、各正弦
波の角周波数をωi(i=1,2,…n)、各正弦波
の強度をmiとすると、CSMの合成波ytは、 ytoi=1isin(ωit+φi) となるが、このタツプlの自己相関係数γlはωi
miを用いて容易に表わされ、 γloi=1 micosl ωi である。
一方、表現されるべき音声波形のサンプルを
Xtとすると、あるフレームにおけるタツプlの
標本自己相関係数υlは υl=1/MM-1t=l XtXt-l として与えられる。
但し、Mは1分析フレームにおけるサンプル数
である。
さて、CSM分析においては、上述のγlが、与
えられたυlと低次のN個について等しくなるよう
に各mi,ωiの値を決定することである。
すなわち、 γl=υl:但し、l=0,1,2,…N が成立するようにmi,ωiの値を決定することであ
る。
この具体的な方法については後に詳述すること
にして、ここでは、上述のn個の正弦波のmi
よびωiが、与えられた音声信号に応答して各分析
フレームごとに次次に得られるものとする。
こうして得られたCSMパラメータmi,ωiによ
る音声特徴ペクトルパターンの一例を第1図に示
す。
また、分析フレームの窓長を30mSECとして分
析した9次(N=9)のCSM(正弦波の個数n=
5)ラインスペクトルと同一の音声サンプルより
求めた9次LPCスペクトル包絡(LPC合成フイ
ルタの周波数伝送特性)との対応例を第2図に示
す。
なお、上述の次数Nと、正弦波の個数nとの間
には後述するように N=2n−1 の関係がある。
これらの図より、CSMは表現すべき原音声の
特徴を抽出した情報を含んでいることが窺える。
しかしながら、こうしてCSM分析の結果得ら
れたn個のmi,ωiの値を用いて、このmi,ωiで指
定される強度(実際の振幅は前述のように√i
および角周波数をもつn個の正弦波を作り、これ
を単純に加算合成しただけでは、人間の耳には、
単に正弦波が合成された音として聞える程度で、
もとの音声を再現するという目的は殆んど達成で
きない。
これは、正弦波を単純加算しても、発生された
信号のスペクトルは、離散化されたn個の線スペ
クトルに過ぎず、一方、音声信号のスペクトルは
連続的なスペクトル包絡を有し、さらにまた、有
声音ではピツチ構造で表現され、また無声音では
確率過程で表現される微細なスペクトル構造を合
せもつていて、単純加算したCSMと音声信号と
はスペクトル構造が全く異なつていることに起因
すると考えられる。
そこで、CSMを用いて音声を合成するには、
何らかの方法を用いて線スペクトルを連続的なス
ペクトルへ拡散することが必要となる。つまり
CSM音声合成とは、第1図、第2図で示される
ような線スペクトルで表現された音声特徴スベク
トルパターンから音声スペクトルパターンを発生
させることと考えることができる。
本発明においては、CSM音声合成において上
述のスペクトル拡散を行なうために、以下のよう
な手法を用いる。
すなわち、有声音は明確なピツチ構造を有する
ため、前述のようにして指定されるn個の各正弦
波を、このピツチ周期ごとに位相のリセツトを行
なう。これにより、簡単にスペクトル包絡の発生
とピツチの微細スペクトル構造の発生とが可能に
なる。
さらにまた、実施例の説明において詳述するよ
うな特殊の時間窓処理を上述の位相リセツト波形
に施すことにより位相リセツト時における合成波
形の不連続性を除き、音声波形のもつ連続性を確
保している。
以上の実施により第2図に示したCSMのライ
ンスペクトルは、第3図Aに示されるように拡散
され、スペクトル包絡とピツチの微細構造とを有
するスペクトルに変化し、聴覚的にも充分実用に
耐える音質が得られることが実験結果明らかとな
つている。
なお参考のため、上述の処理を行なわず単純加
算をしただけのCSMのスペクトルを第3図Bに
示す。前述のように、このようなスペクトルをも
つ波形では聴覚的には単に正弦波が合成された音
として聞える程度で、音声を再現するという目的
は殆んど達成されない。
以上は有声音の場合であるが、無声音の場合に
は以下のように行なう。すなわち、上述の有声音
の場合に、ピツチ周期毎に行なつた位相のリセツ
トと特殊の時間窓処理とを、無声音の場合にはピ
ツチ周期のかわりに、確率過程としてランダムに
発生するパルスを用い、このパルスの発生時点ご
とに上述の処理を実施するようにする。
以上の手法を用いることにより聴覚的に充分実
用に耐えるCSM音声合成を行なうことができる。
なお、以上のCSM音声合成はフイルタを用いな
い合成法であるため、合成側の安定性に対する考
慮を必要としない。このため、mi,ωiの情報を合
成側に伝送し、合成側で上述のCSM音声合成に
より音声を再現するような通信手段に用いる場合
に、伝送路の品質が比較的劣悪で伝送途中でエラ
ーを発生するような場合にもエラーに対する耐性
が強く、比較的良好な音質を保持するという特徴
がある。
しかしながら一方、エラーの少ない場合には、
同程度の情報量を用いたLPCパラメータによる
音声合成に対して音質がやや劣るという欠点があ
る。
そこで本ボコーダにおいては、合成側におい
て、LPCパラメータによる音声合成を行なう
LPC音声合成手段と、上に述べたCSM音声合成
手段と、上に述べたCSM音声合成手段との両手
段を別に設けておき、両者の出力を伝送路の品質
評価に従つて可変荷重合成を行なう。これにより
伝送路品質が非常に良好な場合には、LPC音声
合成手段の出力が用いられ、また伝送路の品質が
非常に悪い場合にはCSM音声合成手段の出力が
用いられるようにし、この中間の遷移領域におい
ては両者の間で連続的な移行が行なわれるように
し、これによつてかなり異質の音質を有する
LPC合成音からCSM合成音への突然の切替に伴
なう不自然さを除くようにしている。
また回線品質に対する評価としては、後述する
ようにCSM音声合成手段の出力とLPC音声合成
手段の出力との比を用いているが、これは伝送路
の品質が劣化してエラーが増しても前者は殆んど
影響を受けないのに、後者はLPC合成フイルタ
が不安定となりこのため出力電力が異常に増加す
る確率が高くなるという特性を利用したものであ
る。
(実施例) 次に本発明を実施例を用いて詳細に説明する。
第4図は本発明の一実施例を示すブロツク図で
ある。
本実施例は、第4図に示すように、CSM分析
部2およびコーダ部3を含む送信側1と、デコー
ダ部5、CSM合成部6、CSM/LPCパラメータ
変換部7、LPC合成部8および可変可重合成部
9を含む受信側4とから構成されている。
入力音声信号はライン1000を介して送信側
1に入力され、送信側1から伝送路3000を介
して受信側4に伝送され、受信側4からライン9
000を介して出力音声信号として出力される。
前記CSM分析部2は第5図に示すように、さ
らにA/D変換器201、ハミング窓処理器20
2、自己相関係数計測器203、CSM分析器2
04およびピツチ・V/UV分析器205を含
む。
また前記CSM合成部6は、第6図に示すよう
に、n個の位相リセツト機能付可変周波数発振器
601−1〜601−n、n個の可変利得増幅器
602−1〜602−n、加算合成器603、乗
算器604、乗算器605、V/UV切換器60
6、可変長窓関数発生器607、周期算出器60
8および乱数発生器609を含む。
さらにまた、前記CSM/LPCパラメータ変換
部7は、第7図に示すように、CSMパラメー
タ/自己相関係数変換部701および自己相関係
数/LPCパラメータ変換器702を含み、また
前記LPC合成部8は、第8図に示すようにLPC
合成フイルタ801、パルス発振器802、V/
UV切替器803、電力制御器804および雑音
発生器805を含んでいる。
最後に前記可変荷重合成部9は第9図に示すよ
うに、一時メモリ901,904、電力算出器9
02,905、乗算器903,906、ウエイト
算出器907および加算合成器908を含んでい
る。
さて、本実施例の動作は下記の通りである。伝
送されるべき音声波形は、入力ライン1000を
介して、A/D変換器201に供給され(第5
図)、ここで振幅および時間軸が量子化されたデ
イジタルデータに変換され、この出力はそれぞ
れ、ハミング窓処理器202およびピツチ・V/
UV分析器205に供給される。ハミング窓処理
器202に供給されたデイジタルデータは、予め
定められている1フレームごとに公知のハミング
窓関数による荷重乗算がなされ、各フレームのデ
ータごとに自己相関係数計測器203に供給され
る。
自己相関係数計測器203は、こうして入力さ
れた各フレームのデータごとに、前述した下記の
演算から低位のN個の自己相関係数υl(但しl=
1,2,…,N)を求める。
すなわち、1フレーム分のデータをXt(但しt
=0,1,…M−1)とすると、 υl=1/MM-1t=l XtXt-l の演算処理を行なうことにより、N個の各υlを求
める。
こうして求められた各フレームごとのυlの組を
次のCSM分析器204に供給するとともに、こ
の中のυp(つまりυp=1/MM-1t=0 X2 t)をこのフレーム における電力情報としてコーダ部3に供給する。
さて、上述の各フレームごとの自己相関係数υl
の組の供給を受けたCSM分析器204は、後に
詳述する演算を行なうことによつて対応するフレ
ームのCSMのn個の各正弦波の強度および角周
波数を指定するmi,ωi(但しi=1,2,…n)
の組を決定し、これをコーダ部3に供給する。
また、A/D変換器201から原音声信号のデ
イジタルデータの供給を受けたピツチ・V/UV
分析器205は、ピツチ周期と、有声音(t)/無声
音(UV)に関する情報を抽出してコーダ部3に
供給する。
さて、以上の各信号の供給を受けたコーダ部3
は、これらの信号を、受信側における分離が容易
に行なえ、また要求された音質と伝送路の伝送容
量とに見合つた粗さで符号化合成し、伝送路30
00を介して受信側4に伝送する。
さて、受信側4においては、こうして伝送され
た信号を、第4図に示すようにデコーダ部5にお
いて受信し、送信側1のコーダ部3の入力側に供
給された各種の信号を分離し、これらの信号をそ
れぞれCSM合成部6およびCSM/LPCパラメー
タ変換部7に供給する。
CSM合成部6(第6図)においては、デコー
ダ部5から供給されるCSMのn個の各波の角周
波数を指定するωi(ω1〜ωo)は、n個の位相リセ
ツト機能付可変周波数発振器601−1〜601
−nの周波数制御入力端子に加えられ、これら発
振器の出力角周波数を指定された角周波数ω1
ωoに設定する。またCSMのn個の各波の強度
(電力振幅)を指定するパラメータm1〜moは前
記n個の可変利得増幅器602−1〜602−n
の利得制御端子に供給され、これによつて各周波
数の発振電力が指定された値になるように制御す
る。
こうして得られたn個の出力は、加算合成器6
03において加算合成が行なわれた後、次の乗算
器604に供給される。
さて、デコーダ部5で分離されたピツチ周期デ
ータと、V/UV情報(有声音/無声音情報)と
は、それぞれ、V/UV切換器606に供給され
る。
一方、乱数発生器609で発生された乱数が、
周期算出器608に供給され、ここで乱数の分布
幅およびその下限値が特定の値になるように変換
され、無声音時の位相リセツト時間間隔を決定す
るデータ列としてV/UV切換器206に供給さ
れる。
かくして、前述のV/UV情報が有声音(t)を指
定する場合には、切替器606は、前述のピツチ
周期データ側を選択し、これを可変長窓関数発生
器607に供給する。またもし前述のV/UV情
報が無声音(UV)を指定する場合には、切替器
606は、前述の周期算出器608の出力の確率
過程で発生するランダムな時間間隔を表わすデー
タ側を選択し、これを上述のピツチ周期を表わす
デイジタルデータ列のかわりに、窓関数発生器6
07に供給する。
さて、窓関数発生器607は、前述の位相リセ
ツトによつて出力波形に生ずる不連続を除き、音
声波形のもつ連続性を確保する窓関数を発生する
ためのもので、またさらにこの窓関数と密接な時
間関係を有する位相リセツト用パルスをも発生す
る。
前述のように、窓関数発生器607には、切替
器606を介して、次次の位相リセツト用パルス
間の間隔を指定するデータ列が入力されるが、窓
関数発生器607は、このデータで指定される時
間間隔を有するインパルスを次次に発生し、これ
をライン6071を介して位相リセツト機能付可
変周波数発振器601−1〜601−nの位相リ
セツト端子に供給し、これによつてこれら発振器
の位相リセツトを行なう。
さて、窓関数発生器607は上述の位相リセツ
トパルスの発生と同期して下記のような可変長の
窓関数w(x)を発生する。
すなわち、入力されたデータにより指定された
その時点における位相リセツト用パルス間間隔の
値をTとし、前の位相リセツト用パルスが発生し
てからの経過時間をxとすると w(x)=0.5+0.5cos(πx/T) 但し 0<xT で表わされるような窓関数を発生する。この窓関
数w(x)を第10図Aに示す。上述のTの値は、有
声音の場合にはピツチ周期を表わし、無声音の場
合には確率過程で発生する変数を表わすので、い
ずれの場合にも時間とともに変化する。従つてこ
の窓関数w(x)は可変長であり、上述の位相リセツ
ト用パルスの発生と第10図Bに示すような相対
時間関係で同期している(窓関数の開始時点およ
び終止時点が位相リセツト用パルスの発生時点と
ほぼ一致している)。
こうして発生された窓関数は、ライン6072
を介して、乗算器604に供給される。この結
果、乗算器604において、加算合成器603で
合成された各位相リセツト用パルスごとに位相リ
セツトされるn個の正弦波と、各位相リセツト用
パルスに同期して発生される上述の窓関数w(x)と
の積が得られる。こうして得られる波形は、各正
弦波が、位相リセツトされる直前で窓関数(x)の乗
算により連続的に0に収束されており、また位相
リセツト時点では各正弦波は0から立ち上るよう
にしているので波形の連続性が確保され、かくし
て窓関数w(x)の乗算により位相リセツト波形に生
ずる不連続性を除くことができる。
不連続性を除かれた乗算器604の出力は、次
の乗算器605に供給され、ここで、デコーダ部
5によつて分離された各フレームの電力情報υp
よつて荷重され、CSM合成部6からの合成音声
としてライン6000を介して可変荷重合成部9
へ供給される。
さて、一方CSM/LPCパラメータ変換部7
(第7図)においては、デコーダ部5から供給さ
れるCSMのn個の各角周波数を指定するωi(i=
1〜n)およびn個の各波の強度(電力振幅)を
指定するパラメータmi(i=1〜n)はCSMパラ
メータ/自己相関係数変換器701に供給され、
ここで自己相関係数に変換される。
すなわち、上述のように指定されたCSMのn
個の正弦波の合成波形のタツプlの自己相関係数
をγlとすると、γlは供給されたパラメータωimi
用いて γloi=1 micos l ωi 但しl=1,2,…,N の演算により、容易に求めることができる。
こうして求められた自己相関係数の組は、次の
自己相関係数/LPCパラメータ変換器702に
供給され、ここでよく知られた手法によりLPC
パラメータに変換されてLPC合成部8に供給さ
れる。
LPCパラメータαi(i=1,…N)は例えば、
Durbin(ダービン)の方法用いて下式を解くこと
により容易に求めることができる。
LPC合成部8(第8図)においては、供給さ
れたLPCパラメータαi(i=1,2,…N)は
LPC合成フイルタ801の定数して設定される。
一方デコーダ部5で分離されたピツチ周期デー
タはパルス発振器802に供給され、この出力パ
ルスの周期を指定されたピツチ周期になるように
制御する。
また、V/UV情報(有声音/無声音情報)は
V/UV切替器803に切替制御信号として供給
され、有声音(t)の場合には切替器803がパルス
発振器802の出力側を選択し、無声音(UV)
の場合には切替器803が雑音発生器805の出
力側を選択するように制御する。
かくして選択された切替器803の出力は電力
制御器804に供給され、ここでデコーダ部5に
よつて分離された電力情報υpによつて電力制御を
受けた後にLPC合成フイルタ801に対する駆
動信号として供給される。
以上によりLPC合成フイルタ801は音声信
号を合成し、合成された信号は、LPC合成部8
からの合成音声信号としてライン8000を介し
て可変荷重合成部9へ供給される。
さて、CSM合成部6およびLPC合成部8から
ライン6000およびライン8000を介して、
それぞれの合成音声信号の供給を受けた可変荷重
合成部9(第9図)は、両者からの入力音声信号
を以下に示すようにして合成する。
まず、それぞれの入力音声信号は、電力算出器
902および905に供給される。これによつ
て、それぞれの信号の刻々の電力(適用な窓関数
を乗じて得られる電力)が計測された電力はウエ
イト算出器907に供給される。ウエイト算出器
907において両者の電力の比によつて定まる荷
重信号すなわちウエイトWCSMおよびウエイト
WLPCが生成され、それぞれ乗算器903および
乗算器906に供給される。
一方、それぞれの前記入力音声信号は、一時メ
モリ901および一時メモリ904を介してそれ
ぞれ前述の乗算器903および乗算器906のも
う一方の入力として供給される。一時メモリ90
1および一時メモリ904は、それぞれの信号の
遅延時間を調整し、両者の遅延時間の差をなくし
て合成時の不自然さを除くためのものである。
さて、遅延補正がなされたそれぞれの信号は、
乗算器903および乗算器906において、前述
のウエイトWCSMおよびWLPCによつてそれぞれ荷
重乗算(重みづけ)が施こされた後、加算器90
8において加算合成が行なわれ、出力ライン90
00から最終合成音声信号として出力される。
以上のような合成法をとることにより、それぞ
れの入力音声信号の電力比に応じて、それぞれの
入力信号に対する荷重(ウエイト)が制御されて
合成されるが、この荷重制御特性の一例を第11
図に示す。
すなわち、CSM側電力とLPC側電力との比r
が殆んど1に等しい正常な状態の場合には、
LPC側に対するウエイトWLPCは殆んど1となり、
これに対してCSM側に対するウエイトWCSMは殆
んど0となる。
伝送路の誤り率が劣化して、前述のように
LPC側の電力が増加し両者の比が小さくなると、
WLPCは、1から除々に減小し、WCSMは0から
除々に増大する。かくして、LPC側の電力が
CSM側の電力に対して4倍程度に増大した状態
(r≒0.25)では、ウエイトWLPCおよびWCSMは殆
んど相等しく0.5として合成される。
さらに、誤り率が劣化して、LPC側の電力が
大きくなると、WCSMは殆んど1となりWLPCは殆
んど0となる。
以上のようにして、伝送路の状態が良好でエラ
ーが無い場合には、より音質の良いLPC音声合
成による出力が用いられ、伝送路の状態が劣化て
多くのエラーが発生する場合にはエラーに対する
耐性の強いCSM音声合成による出力が用いられ
る。そして中間の遷移領域においては両者の合成
に対するウエイトが連続的に変化して一方から他
方に移行するようにし、これによつて異質の音質
を有する両合成方式の出力の急な切替に伴なう不
自然さをなくすようにしている。
以上述べたように、本実施例によると、送信側
においてCSM音声分析により、CSMパラメータ
(擬フオルマント情報)を抽出し、これを他の音
源情報とともに符号化て伝送路に送出し、受信側
においては、伝送されたCSMパラメータを用い
て直接CSM音声合成を行なう挟持のCSM音声合
成部と、伝送されたCSMパラメータをいつたん
LPCパラメータに変換してからLPC音声合成を
行なうLPC音声合成部とを設け、両者の出力を
上述のように可変荷重合成することによりそれぞ
れの音声合成方式の優れた特徴を発揮する擬フオ
ルマント型ボコーダを提供できる。
以下、CSM合成部6に用いられている各種回
路について説明する。
まず、位相リセツト機能付可変周波数発振器6
01の回路例を第12図に示す。周波数制御端子
6011に加わる電圧によつて、定電流源601
2および6013に流れる、容量6014に対す
る充放電電流値を制御し、これによつて発振周波
数を可変とする。υ点の発振電圧波形は基準電圧
の+Vrと−Vrとの間を直線的に上下する三角波
形となる。
位相リセツト端子6015にインパルスを加え
ると、υ点は瞬間的に接地されて、強制的に0電
位に引き戻され、そこから発振を再スタートして
位相リセツトが行なわれる。このυ点の三角波発
振出力を正弦波変換器6016に入力し正弦波に
変換して端子6017より出力し、これを発振器
601の出力として用いる。正弦波変換器601
6は例えばROMに格納したサイン関数値を入力
波形で読出す等の方法により容易に実現できる。
またこのような位相リセツト機能付可変周波数
発振器は計算器のプログラムを用いて実現するこ
とも容易である。
次に可変利得増幅器602の回路側を第13図
に示す。増幅すべき信号を端子6021に加え、
制御信号を端子6022に加えることによつて負
帰還量を制御し出力端子6023に制御された振
幅を有する出力を得る。
またこのほかに、アナログ乗算器を用いて実現
することもできるし、またD/A変換器の基準電
圧にアナログ波形入力を用い、デイジタル入力に
デイジタル量で表現された制御情報を用いる等の
方法によつても容易に実現することができる。
次に乱数発生器609の一回路例を第14図に
示す。15段のシフトレジスタ6091と1個の半
加算器6092とにより215−1の周期を有する
15次のM系列の擬似乱数を発生する。必要な時点
でクロツク端子6093にシフトパルスを加える
ことにより次の乱数値が得られる。
次に周期算出器608のブロツク図を第15図
Aに示す。これは上述の乱数発生器609から出
力される0から215−1の範囲に一様に分布して
いる乱数を、無声音時の位相リセツト用パルスの
時間間隔を指定する乱数として用いるのに適した
分布に変換するもので、定数乗算器6081と定
数加算器6082よりなる。これによつて、第1
5図Bに示すように、乱数の分布幅Dと下限値L
とを適当な値に設定することができる。
次に窓関数発生器607の一実施例を第16図
に示す。これは、レジスタ6073、プリセツト
可能なダウンカウンタ6074、カウンタ607
5、読読出し専用メモリ(ROM)6076を含
んでいる。切替器606から供給された位相リセ
ツト用パルス間隔を指定するデータTは、レジス
タ6073に格納される。ダウンカウンタ607
4は一定周期の高速クロツクCLKをカウントす
るカウンタで、まず、レジスタ6073の内容T
をプリセツトし、これをクロツクCLKを用いて
ダウンカウントする。カウンタ6074の内容が
0になると出力端子よりパルスを発生し、これに
より再びレジスタ6073の内容をプリセツトし
てこの値のダウンカウントを開始する。かくして
ダウンカウンタ6074の出力6074−1には
Tに比例した周期(例えばT/k)をもつパルス
列が発生する。このパルス列はカウンタ6075
のクロツクとして加えられる。このクロツクで歩
進されるカウンタ6075のカウント出力607
5−1はROM6076にアドレス指定信号とし
て加えられ、そこに書き込まれている窓関数w(x)
のデータを順番に読出してライン6072に出力
する。カウンタ6075の内容がkになると、
ROM6076の最後のデータが読出されてライ
ン6071にリセツトパルスを出力する。このリ
セツトパルスは、発振器601−1〜601−n
の位相リセツト用端子に供給される前述の位相リ
セツト用パルスとして用いられるとともに、レジ
スタ6073に次の入力データをセツトするため
に用いられる。かくして、パルス間間隔がつぎつ
ぎに指定された値をもつ位相リセツト用パルス
と、これと第10図Bに示すように同期された可
変長の窓関数w(x)とが生成される。
最後にCSM分析について説明する。
前述のように、CSM分析は、各分析フレーム
毎に、表現されるべき音声波形から直接算出され
る標本自己相関係数のN個の低次のタツプ値と、
合成波(n個の正弦波の和)のN個の低次のタツ
プ値とが一致するように、合成すべき各正弦波の
角周波数wiとその強度(電力振幅)miとを決定
することである。
今、合成波のタツプlの自己相関係数をγlとす
ると、前述のように、 γloi=1 micos l ωi となる。
一方、表現されるべき音声波形のサンプルXt
から、あるフレームのタツプlの標本自己相関係
数υlは、 υl=1/MM-1t=l XtXt-l …(1) である。
これより、 γl=υl …(2) l=0,1,2,…N 但しN=2n−1 とすると下記のマトリツクス表現が得られる。
しかし上式は、ωiおよびmiが未知のため単純な
行列演算では解けない。そこで、 ωi=cos-1xi …(4) とおき、 coslωi=coslcos-1xi≡Tl(xi) …(5) の置換を行なう。このTl(x)はTchebycheff(チエ
ビシエフ)の多項式である。この置換を行なうと
(3)式は次のように変換される。
ところが、一般にxlはTp(x),Tl(x)…T1(x)の線
決結合として表わすことができる。
すなわち xllj=o S(l) jTj(x) …(7) 但しS(l) jは逆Tchebycheff(チエビシエフ)係数
である。
このS(l) jを用いて、前述の標本自己相関係数υj
の線形結合Alを下式のように定義する。
Allj=o S(l) jυj …(8) 但し l=0,1,2,…,2n−1 こうすると、(6)式の左辺および右辺にそれぞれ
(7)式および(8)式の関係を用いることにより、下記
の関係式が成立する。
さて、ここで、x1,x2,…,xoに零点をもつn
次の多項式 Pn(x)≡ok=o P(n) kxko Πi=1 (x−xi) を定義し、このPn(x)を用いて、(9)式の左辺と似
た式の oi=1 miPn(xil i を作り、これを検討してみる。上式が0であるこ
とは明らかであるが、さらにこれは次のように書
き変えることができる。
0=oi=1 miPn(xixl ioi=1 miok=o P(n) jok=o P(n) koi=1 mixk+l jok=o P(n) kAk+l 以上より、l=0,1,2,…nとして下式が
得られる。
しかるにP(n) o=1であるから が成立する。左辺のAiでできるマトリクスは一般
にHankcl(ハンケル)行列と呼ばれているもので
ある。前述のように各Aiは、表現すべき音声波形
の標本自己相関係数υjから(8)式により与えられる
もので既知である。
従つて(10)式を解くことによ、P(n) p,P(n) 1,…P(n)
o-1
の値を求めることができる。
この各P(n) iが求まると、n次方程式 Pn(x)=xn+P(n) o-1xn-1+…P(n) 0=0 の解として、{x1,x2…,xo}が求められる。
これより各CSM周波数ωiは(4)式の ωi=cos-1xi より求められ、またCSM強度miは(9)式より導か
れる下式を用いて求められる。
なお、上式の左辺の行列は一般にVander
Monde(フアレデルモンデ)行列と呼ばれている
ものである。
以上をまとめると、CSM分析の分析アルゴリ
ズムは以下のようになる。
(1) 標本自己相関係数を計算する。
υl=1/MM-1t=l XtXt-l (2) 逆チエビシエフ係数を用いてAlを定義する。
Allj=o S(l) jυj (3) AlによるHankel(ハンケル)行列方程式を解
いてP(n) iを求める。
(4) P(n) iを係数としてもつn次代数方程式を解い
てn個のxiを求める。
Pn(x)≡xn+P(n) o-1xn-1+…+P(n) 1x+P0=0 (5) cos逆変換を行なつてCSM角周波数{ωi}を
求めると ωi=cos-1xi (6) Van der Monde(フアンデルモンデ)行列
方程式を解いてCSM強度{mi}を求める。
以上の各ステツプを実行することによりCSM
の各角周波数{ω1,ω2…ωo}および各波の強度
{m1,m2,…mo}を求めることができる。
なお、上述のHankel(ハンケル)行列方程式の
能率的解法として、初期条件を与えて逐次的に解
を求める方法が知られている。
また、上記n次の代数方程式は実根のみを有す
ることが証明されているため、ニユートン・ラプ
ソン方法等を用いて根を求めることができる。
さらに、上記Vander Monde(フアンデルモン
デ)行列方程式の能率的解法として三角行列化を
行なつて順次に解を求める方法を用いることがで
きる。
以上に述べたCSM分析において、本実施例で
は、標本自己相関係数とCSMの自己相関係数と
を等しいとする方程式を解く方法を用いたが、こ
のかわりに、LPC係数の無損失化による線スペ
クトル周波数の算出および留数計算による方法を
用いることもできる。
また本実施例においては、特定の関数形をもつ
可変長窓関数を用いたが、この関数形は一例を示
したもので、他の関数形が用いられることも明ら
かである。
さらに乱随発生器、周期算出器等も一例を示し
たものでこれを限定される必要はない。
なお、以上の実施例においてはCSMの各正弦
波の強度(電力振幅)を指定する量としてmi
用いて説明したが、実際の可変利得増幅器を制御
する信号としては振幅に比例する√iを用いて
行なつてもよいことは明らかである。
また本実施例においては伝送路の誤り率を評価
する方法として、エラーが大きくなるとLPC合
成フイルタが不安定領域に近ずく確率が大きくな
る結果LSP合成側の出力が、CSM合成側の出力
に対して大きくなることを利用し、両者の比を用
いて、CSM側出力に荷重すべきウエイトWCSM
LPC側出力に荷重すべきウエイトWLPCとを算出
しているが、別の適当な方法により伝送路のエラ
ーを評価しこれを用いて荷重すべきウエイト
WCSMおよびWLPCを決定するようにすることもで
きる。
なお第11図に示した可変荷重合成特性は一例
を示したものでこれに限定される必要がないこと
は明らかである。
(発明の効果) 以上述べたように本発明を用いると、伝送路の
誤り率が良好な場合にはより優れた音声品質が得
られるLPC音声合成方式と、誤り率の劣化に対
してより高い耐性をもつCSM音声合成方式との
両者の優れた特徴を併せもつような擬フオルマン
ト型ボコーダを提供できる。
これによりボコーダの性能向上を達成できる。
【図面の簡単な説明】
第1図はCSMパラメータによる音声特徴ベク
トルパターンの一例を示す図、第2図はCSMラ
インスペクトルと、同一音声サンプルより求めた
LPCスペクトル包絡との対応例を示す図、第3
図Aは拡散されたCSMのスペクトル包絡とピツ
チの微細構造とを示す図、第3図Bは単純加算し
ただけのCSMスペクトルを示す図、第4図は本
発明の一実施例を示すブロツク図、第5図は前記
実施例のCSM分析部の詳細を示すブロツク図、
第6図は前記実施例のCSM合成部、第7図は
CSM/LPCパラメータ変換部、第8図はLPC合
成部、第9図は可変荷重合成部のそれぞれの詳細
を示すブロツク図、第10図Aは可変長窓関数の
関数形を示す図、第10図Bは前記可変長窓関数
と位相リセツト用パルスとの相対時間関係を示す
図、第11図は可変荷重合成特性の一例を示す
図、第12図は位相リセツト機能付可変周波数発
振器の一回路例を示す図、第13図は可変利得増
幅器の一回路例を示す図、第14図は乱数発生器
の一回路例を示す図、第15図Aは周期算出器の
ブロツク図、第15図Bは前記周期算出器の出力
の乱数の分布を示す図および第16図は可変長窓
関数発生器の一例を示すブロツク図である。 図において、1…送信側、2…CSM分析、3
…コーダ部、4…受信側、5…デコーダ部、6…
CSM分成部、7…CSM/LPCパラメータ変換
部、8…LPC合成部、9…可変荷重合成部、2
01…A/D変換器、202…ハミング窓処理
器、203…自己相関係数計測器、204…
CSM分析器、205…ピツチ・V/UV分析器、
601−1〜601−n…位相リセツト機能付可
変周波数発振器、602−1〜602−n…可変
利得増幅器、603…加算合成器、604…乗算
器、605…乗算器、606…V/UV替器、6
07…可変長窓関数発生器、608…周期算出
器、609…乱数発生器、701…CSMパラメ
ータ/自己相関係数変換器、702…自己相関係
数/LPCパラメータ変換器、801…LPC合成
フイルタ、802…パルス発振器、803…V/
UV切替器、804…電力制御器、805…雑音
発生器、901,904…一時メモリ、902,
905…電力算出器、903,906…乗算器、
907…ウエイト算出器、908…加算合成器。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声信号のCSM分析によつて抽出され
    るCSMパラメータ情報を伝送路に送出する送信
    側と、 前記伝送路を介して伝送された前記CSMパラ
    メータ情報の指定する各周波数に設定される複数
    の位相リセツト機能付可変周波数発振器とこれに
    対応して前記発振器の出力を伝送された前記
    CSMパラメータ情報の指定する各強度に設定す
    る各強度に設定する複数の可変利得増幅器と前記
    複数の増幅器の合成出力演算する可変長窓関数発
    生器と乱数発生器とを備え有声音合成時にはピツ
    チ周期に対応して前記各発振器の位相リセツトを
    行ないまた無声音合成時には前記乱数発生器の出
    力より算出される周期に対応して前記各発振器の
    位相リセツトを行ないまた前記窓関数発生器の動
    作を位相リセツトの動作と同期せしめるようにし
    てCSM音声合成を行なうCSM合成手段と、伝送
    された前記CSMパラメータ情報をLPCパラメー
    タ情報に変換しこれを用いてLPC音声合成を行
    なうLPC合成手段と、前記CSM合成手段の出力
    と前記LPC合成手段の出力とを前記伝送路の伝
    送品質に対する評価に従つて可変荷重合成するよ
    うにした可変荷重合成手段とを含む受信側と、 を有することを特徴とする擬フオルマント型ボコ
    ーダ。 2 前記伝送路の伝送品質に対する評価として前
    記CSM合成手段の出力と前記LSP合成手段の出
    力との比を用いるようにしたことを特徴とする特
    許請求の範囲第1項記載の擬フオルマント型ボコ
    ーダ。
JP59179694A 1984-08-29 1984-08-29 擬フオルマント型ボコ−ダ Granted JPS6157999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59179694A JPS6157999A (ja) 1984-08-29 1984-08-29 擬フオルマント型ボコ−ダ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59179694A JPS6157999A (ja) 1984-08-29 1984-08-29 擬フオルマント型ボコ−ダ

Publications (2)

Publication Number Publication Date
JPS6157999A JPS6157999A (ja) 1986-03-25
JPH0441838B2 true JPH0441838B2 (ja) 1992-07-09

Family

ID=16070238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59179694A Granted JPS6157999A (ja) 1984-08-29 1984-08-29 擬フオルマント型ボコ−ダ

Country Status (1)

Country Link
JP (1) JPS6157999A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement

Also Published As

Publication number Publication date
JPS6157999A (ja) 1986-03-25

Similar Documents

Publication Publication Date Title
CA1157564A (en) Sound synthesizer
CA1242279A (en) Speech signal processor
De Poli A tutorial on digital sound synthesis techniques
JPS62289900A (ja) 音声分析合成装置
US5308918A (en) Signal delay circuit, FIR filter and musical tone synthesizer employing the same
US4231277A (en) Process for forming musical tones
JPH0441838B2 (ja)
US5245127A (en) Signal delay circuit, FIR filter and musical tone synthesizer employing the same
US5524173A (en) Process and device for musical and vocal dynamic sound synthesis by non-linear distortion and amplitude modulation
JPH0363079B2 (ja)
JPH051957B2 (ja)
US4084472A (en) Electronic musical instrument with tone generation by recursive calculation
JPS6227397B2 (ja)
JP2699629B2 (ja) 楽音信号生成装置
JPH0439678B2 (ja)
JPH051958B2 (ja)
JPH0131638B2 (ja)
JPH051959B2 (ja)
JPH0582958B2 (ja)
JP2606006B2 (ja) ノイズ音発生装置
JP2715692B2 (ja) 電子楽器
JPH0754436B2 (ja) Csm型音声合成器
JPS638955Y2 (ja)
JP3235315B2 (ja) フォルマント方式音源
JPS6338719B2 (ja)