JPS6139099A - Csmパラメ−タの量子化方法とその装置 - Google Patents
Csmパラメ−タの量子化方法とその装置Info
- Publication number
- JPS6139099A JPS6139099A JP16049184A JP16049184A JPS6139099A JP S6139099 A JPS6139099 A JP S6139099A JP 16049184 A JP16049184 A JP 16049184A JP 16049184 A JP16049184 A JP 16049184A JP S6139099 A JPS6139099 A JP S6139099A
- Authority
- JP
- Japan
- Prior art keywords
- csm
- speech
- supplied
- quantizer
- intensity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013139 quantization Methods 0.000 title claims description 19
- 238000000034 method Methods 0.000 title description 18
- 238000010606 normalization Methods 0.000 claims description 14
- 230000003595 spectral effect Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 description 33
- 238000004458 analytical method Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 17
- 230000015572 biosynthetic process Effects 0.000 description 16
- 238000001228 spectrum Methods 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 10
- 239000002131 composite material Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 230000010355 oscillation Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000005309 stochastic process Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- NMQPIBPZSLMCFI-UHFFFAOYSA-N 2-(4-methylphenyl)acetamide Chemical compound CC1=CC=C(CC(N)=O)C=C1 NMQPIBPZSLMCFI-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241000981595 Zoysia japonica Species 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000010356 wave oscillation Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(技術分野)
本発明はCSMパラメータ、すなわち高々4〜6波の周
波数で表現されるC S M (Compoait6S
i−nusoidal Modeling :複合正弦
波モデル)パラメータ量子化に関する。
波数で表現されるC S M (Compoait6S
i−nusoidal Modeling :複合正弦
波モデル)パラメータ量子化に関する。
(従来技術)
音声合成器として従来LPC型音声合成器が広く用いら
れているが、LPC型音声合成器は一般に構造が複雑で
ある。また音声合成に用いるLPCフィルタの特性が、
パラメータ伝送時のエラー等によりその安定性が損なわ
れるという欠点がある。
れているが、LPC型音声合成器は一般に構造が複雑で
ある。また音声合成に用いるLPCフィルタの特性が、
パラメータ伝送時のエラー等によりその安定性が損なわ
れるという欠点がある。
これに対してCSMを用いて音成合成を行なうCSM型
音声合成器は、後に詳述するように、フィルタを有して
おらずその構造が非常に簡単であシ、本質的に合成時に
おける安定性の問題を生ずることはない。しかしながら
CSMパラメータの量子化に関しては従来、パラメータ
の各振幅を態別に量子化されており、パラメータ相互の
関係を考慮していなかった。そのためCSMパラメータ
の特性を充分に利用した量子化が行なわれず量子化の効
率が低いという欠点を有していた。
音声合成器は、後に詳述するように、フィルタを有して
おらずその構造が非常に簡単であシ、本質的に合成時に
おける安定性の問題を生ずることはない。しかしながら
CSMパラメータの量子化に関しては従来、パラメータ
の各振幅を態別に量子化されており、パラメータ相互の
関係を考慮していなかった。そのためCSMパラメータ
の特性を充分に利用した量子化が行なわれず量子化の効
率が低いという欠点を有していた。
(発明の目的)
本発明の目的はCSMパラメータを量子化する場合にお
ける上述の問題を解決し、効率のよい量子化方法を提供
することにある。
ける上述の問題を解決し、効率のよい量子化方法を提供
することにある。
(発明の構成)
本発明の量子化方法は、音声のスペクトル包絡を所定の
数ルの周波数と振幅とが自由な正弦波の集合で表現する
CSMパラ、−夕の量子化に於いて、振幅の集合(扉、
、m、、・・・−一)をα=専ax(m 、m、、・
・・−一)で表現される正規化係数αにより正規化する
手段を有して構成される。
数ルの周波数と振幅とが自由な正弦波の集合で表現する
CSMパラ、−夕の量子化に於いて、振幅の集合(扉、
、m、、・・・−一)をα=専ax(m 、m、、・
・・−一)で表現される正規化係数αにより正規化する
手段を有して構成される。
(原 理)
最初にCSM型音声合成器の原理について説明する。
CAMとは、音声信号を、振幅と周波数とを自由に選べ
るパラメータとしてもつ特定の個数の正弦波の和として
、表現するものである。この正弦波の個数としては高々
4〜6個の予め定めた数が用いられる。
るパラメータとしてもつ特定の個数の正弦波の和として
、表現するものである。この正弦波の個数としては高々
4〜6個の予め定めた数が用いられる。
従ってCAM音声合成を行なう場合には、まず、音声信
号をCSM音声分析により、予め定められた個数の正弦
波の和として表現する必要がある。
号をCSM音声分析により、予め定められた個数の正弦
波の和として表現する必要がある。
CSM音声分析については後に詳述することとし、ここ
ではその要点のみを説明する。
ではその要点のみを説明する。
CSM分析においてもLPC分析の場合と同様に、位相
情報の無視、音源の影響の平均化、雑音゛成分による不
安定性の回避等を目的に中間パラメータとして自己相関
係数を使用する。
情報の無視、音源の影響の平均化、雑音゛成分による不
安定性の回避等を目的に中間パラメータとして自己相関
係数を使用する。
すなわち、CSM分析は、各分析フレーム毎に表現され
るべき音声波形から直接算出される標本自己相関係数の
低次のタップのN個を、合成波の自己相関係数の低次の
タップのN個と一致するように、合成すべき各正弦波の
周波数およびその強度(電力振幅)を決定することであ
る。
るべき音声波形から直接算出される標本自己相関係数の
低次のタップのN個を、合成波の自己相関係数の低次の
タップのN個と一致するように、合成すべき各正弦波の
周波数およびその強度(電力振幅)を決定することであ
る。
今、合成すべき正弦波の個数をルとし、各正弦波の角周
波数をω6 (i−x、z、・・・、す、各正弦波の強
度をm、とすると、CSMの合成波ytはyt= zF
i内(ωit+φ、) 1霧! となるが、このタップLの自己相関係数46はωi 、
nLiを用いて容易に表わされrt=、Σm@cmtc
d6 [=1 である。
波数をω6 (i−x、z、・・・、す、各正弦波の強
度をm、とすると、CSMの合成波ytはyt= zF
i内(ωit+φ、) 1霧! となるが、このタップLの自己相関係数46はωi 、
nLiを用いて容易に表わされrt=、Σm@cmtc
d6 [=1 である。
一方、表現されるべき音声波形のサンプルをXtとする
と、ある7レームにおけるタップtの標本自己相関係数
Utは と己て与えられる。但し、Mは1分析フレームにおける
サンプル数である。
と、ある7レームにおけるタップtの標本自己相関係数
Utは と己て与えられる。但し、Mは1分析フレームにおける
サンプル数である。
さて、CSM分析においては、上述のrtが、与えられ
たtjtと低次のN個について等しく女るように谷溝t
、ω、の値を決定することである。
たtjtと低次のN個について等しく女るように谷溝t
、ω、の値を決定することである。
すなわち、
’t”’t’但し、t=0.1,2.・ 、Nが成立す
るように扉i、ωiの値を決定することである。
るように扉i、ωiの値を決定することである。
この具体的な方法については後に詳述することにして、
ここでは、上述のル個の正弦波の11Liおよびωiが
与えられた音声信号に応答して各分析フレームごとに次
次に得られるものとする。
ここでは、上述のル個の正弦波の11Liおよびωiが
与えられた音声信号に応答して各分析フレームごとに次
次に得られるものとする。
こうして得られたCSMパラメータ町1ωiKよる音声
特徴ベクトルパターンの一例を第1図に示す。
特徴ベクトルパターンの一例を第1図に示す。
また、分析フレームの窓長を3QcmSECとして分析
した9次(N=9)のCSM(正弦波の個数rb=5
)−)インスペクトルと、同一の音声サンプルよシ求め
た9次のLPCスペクトル包絡(LPG合成フィルタの
周波数伝送特性)との対応例を第2図に示す。
した9次(N=9)のCSM(正弦波の個数rb=5
)−)インスペクトルと、同一の音声サンプルよシ求め
た9次のLPCスペクトル包絡(LPG合成フィルタの
周波数伝送特性)との対応例を第2図に示す。
なお、上述の次数Nと、正弦波の個数路との間には、後
述するように N==2ルー1 の関係がある。
述するように N==2ルー1 の関係がある。
これらの図よj5、CSMは表現すべき原音声の特徴を
抽出した情報を含んでいることが窺える。
抽出した情報を含んでいることが窺える。
しかしながら、こうしてCSM分析の結果得られたル組
のmi、miの値を用いて、このmi、miで指定され
る強度(実際の振幅は前述のようK ・tlLi)およ
び角周波数をもつル個の正弦波を作り、これを単純と加
算合成したたけでは、人間の耳には、単に正弦波が合成
された音として聞えるだけで、もとの音声を再現すると
いう目的は達成できない。
のmi、miの値を用いて、このmi、miで指定され
る強度(実際の振幅は前述のようK ・tlLi)およ
び角周波数をもつル個の正弦波を作り、これを単純と加
算合成したたけでは、人間の耳には、単に正弦波が合成
された音として聞えるだけで、もとの音声を再現すると
いう目的は達成できない。
これは、正弦波を単純加算しても、発生された信号のス
ペクトルは、離散化されたル個の線スペクトルに過ぎず
、一方音声信号のスペクトルは連続的なスペクトル包絡
を有し、さらKまえ、有声音ではピッチ構造で表現され
、また無声音では確率過程で表現される微細なスペクト
ル構造を合せもっていて、単純加算し九〇SMと音声信
号とはスペクトル構造が全く異なっていることに起因す
′ると考えられる。
ペクトルは、離散化されたル個の線スペクトルに過ぎず
、一方音声信号のスペクトルは連続的なスペクトル包絡
を有し、さらKまえ、有声音ではピッチ構造で表現され
、また無声音では確率過程で表現される微細なスペクト
ル構造を合せもっていて、単純加算し九〇SMと音声信
号とはスペクトル構造が全く異なっていることに起因す
′ると考えられる。
そこで、CSMを用いて音声を合成するには、何らかの
方法を用いて線スペクトルを連続的なスペクトルへ拡散
することが必要となる。つまりCSM音声合成とは、第
1図、第2図で示されるよ・うな線スペクトルで表現さ
れた音声特徴ベクトルパターンから音声スペクトルパタ
ーンを発生させることと考えることができる。
方法を用いて線スペクトルを連続的なスペクトルへ拡散
することが必要となる。つまりCSM音声合成とは、第
1図、第2図で示されるよ・うな線スペクトルで表現さ
れた音声特徴ベクトルパターンから音声スペクトルパタ
ーンを発生させることと考えることができる。
本発明においては、CSM音声合成において上述のスペ
クトル拡散を行なうために1以下のような手法を用いる
。
クトル拡散を行なうために1以下のような手法を用いる
。
すなわち、有声音は明確なピッチ構造を有するため、前
述のようにして指定されるル個の各正弦波を、このピッ
チ周期ごとに位相のリセットを行なう。これにより、簡
単にスペクトル包絡の発生とビ、ツチの微細スペクトル
構造の発生とが可能になる。
述のようにして指定されるル個の各正弦波を、このピッ
チ周期ごとに位相のリセットを行なう。これにより、簡
単にスペクトル包絡の発生とビ、ツチの微細スペクトル
構造の発生とが可能になる。
さらにまた、実施例の説明において詳述するような特殊
の時間窓処理を上述の位相リセット波形、に施すことに
より位相リセット時における合成波形の不連続性を除き
、音声波形のもつ連続性な確保している。
の時間窓処理を上述の位相リセット波形、に施すことに
より位相リセット時における合成波形の不連続性を除き
、音声波形のもつ連続性な確保している。
以上の実施により第2図に示したCSMのラインスペク
トルは、第3図(A)に示されるように拡散され、スペ
クトル包絡とピッチの微細構造とを有するスペクトルに
変化し、聴覚的にも充分実用に耐える音質が得られるこ
とが実験結果明らかとなっている。
トルは、第3図(A)に示されるように拡散され、スペ
クトル包絡とピッチの微細構造とを有するスペクトルに
変化し、聴覚的にも充分実用に耐える音質が得られるこ
とが実験結果明らかとなっている。
なお、参考のため、上述の処理を行なわず、単純加算を
しただけのCSMのスペクトルを第3図(ロ)に示す。
しただけのCSMのスペクトルを第3図(ロ)に示す。
前述のように、このようなスペクトルをもつ波形では聴
覚的には単に正弦波が合成された音とレズ聞えるだけで
、音声を再現するという目的は達成されない。
覚的には単に正弦波が合成された音とレズ聞えるだけで
、音声を再現するという目的は達成されない。
以上は有声音の場合であるが、無声音の場合には以下の
ように行なう。すなわち、上述の有声音の場合に、ピッ
チ同期毎に行なった位相のリセットと特殊の時間窓処理
とを、無声音の場合にはピッチ同期のかわりに、確率過
程としてランダムに発生するその同期が分布幅と下限値
とを設定されたパルスを用い、このパルスの発生時点ご
とに上述の処理を実施するようにする。
ように行なう。すなわち、上述の有声音の場合に、ピッ
チ同期毎に行なった位相のリセットと特殊の時間窓処理
とを、無声音の場合にはピッチ同期のかわりに、確率過
程としてランダムに発生するその同期が分布幅と下限値
とを設定されたパルスを用い、このパルスの発生時点ご
とに上述の処理を実施するようにする。
以上の手法を用いることにより聰覚的に充分実用に耐え
るCSM合成を行なうことができる。なお1以上のCS
M合成はフィルタを用いない合成法であるため、合成側
の安定性に対する考慮を必要としない。このため、mi
、miの情報を合成側に伝送し、合成側で音声を再現す
るような通信手段に用いる場合に、回線品質が比較的に
劣悪で伝送途中にエラーを発生するようなときKtiボ
コーダよりも良好な音質が得られるという特徴が考えら
れる。
るCSM合成を行なうことができる。なお1以上のCS
M合成はフィルタを用いない合成法であるため、合成側
の安定性に対する考慮を必要としない。このため、mi
、miの情報を合成側に伝送し、合成側で音声を再現す
るような通信手段に用いる場合に、回線品質が比較的に
劣悪で伝送途中にエラーを発生するようなときKtiボ
コーダよりも良好な音質が得られるという特徴が考えら
れる。
(実施例)
次に本発明を実施例を用いて詳細に説明する。
説明の都合上、本発明を含む分析合成系を用いて本発明
を説明する。
を説明する。
第4図は本発明の一実施例を示すブロック図である。
本実施例は送信側1と、受信側2よりなる。
送信側1は、さらに、A/D変換器1o1、ハミング窓
処理器102、自己相関係数計測器103CSM分析器
104、CSM量子化器105、電力補正量子化器10
6、ピッチ抽出器107、有声音/無声音判定器108
およびマルチプレクサ109を含む。
処理器102、自己相関係数計測器103CSM分析器
104、CSM量子化器105、電力補正量子化器10
6、ピッチ抽出器107、有声音/無声音判定器108
およびマルチプレクサ109を含む。
また、受信側2は、さらに、デマルチプレクサおよび復
号化器201、補間器202、有声音/無声音切替器2
03、周期算出器204、乱数発生器205.3個の、
位相リセット機能付可変周波数発蛋器206−1,20
6−2.・・・・・・、206−fL、 ル個の可変利
得増幅器207−1,207−2.・・・・・・207
−ル、加算合成器208、可変長窓関数発生器209、
乗算器210および乗算器211を含んでいる。
号化器201、補間器202、有声音/無声音切替器2
03、周期算出器204、乱数発生器205.3個の、
位相リセット機能付可変周波数発蛋器206−1,20
6−2.・・・・・・、206−fL、 ル個の可変利
得増幅器207−1,207−2.・・・・・・207
−ル、加算合成器208、可変長窓関数発生器209、
乗算器210および乗算器211を含んでいる。
さて、本実施例の動作は下記の通りである。伝送される
べき音声波形は、入力ライン1000を介して、A/D
変換器101に供給され、ここで、振幅および時間軸が
量子化されたディジタルデータに変換され、この出力は
それぞれ、ハミング窓処理器102、ピッチ抽出器10
7、有声音/無声音判定砦108の入力側に供給される
。
べき音声波形は、入力ライン1000を介して、A/D
変換器101に供給され、ここで、振幅および時間軸が
量子化されたディジタルデータに変換され、この出力は
それぞれ、ハミング窓処理器102、ピッチ抽出器10
7、有声音/無声音判定砦108の入力側に供給される
。
ハミング窓処理器102に供給されたディジタルデータ
は、予め定められている1フレームごとに、公知のハミ
ング窓関数による荷重乗算がなされ、各フレームのデー
タごとに自己相関係数計測器103に供給される。
は、予め定められている1フレームごとに、公知のハミ
ング窓関数による荷重乗算がなされ、各フレームのデー
タごとに自己相関係数計測器103に供給される。
自己相関係数計測器103は、こうして入力された各フ
レームのデータごとに前述した下記の演算により低位の
N個の自己相関係数νt (但しt=1.2.・・・・
・・N)を求める。
レームのデータごとに前述した下記の演算により低位の
N個の自己相関係数νt (但しt=1.2.・・・・
・・N)を求める。
すなわち、1フレ一ム分のデータをXt (但しt=
o、1.・・・・・・、 M−1)とすると、の演算処
理を行なうことにより、N個の各t’tを求める。
o、1.・・・・・・、 M−1)とすると、の演算処
理を行なうことにより、N個の各t’tを求める。
こうして求められた各フレームごとのvtcvmを次の
CSM分析器に供給するとともにこの中のにおける電力
情報と・して、電力補正量子化器106に供給する。
CSM分析器に供給するとともにこの中のにおける電力
情報と・して、電力補正量子化器106に供給する。
さて、上述の各フレームごとの自己相関係数シロの組の
供給を受けたCSM分析器104は後に詳述する演算を
行なうことによって、対応するフレームのCSMのル個
の各正弦波の強度および角周波数を指定するm2.ωL
(但しi=1.2.・・・・・・ル)の組を決定し、
これをCSM量子化器105に供、給する。
供給を受けたCSM分析器104は後に詳述する演算を
行なうことによって、対応するフレームのCSMのル個
の各正弦波の強度および角周波数を指定するm2.ωL
(但しi=1.2.・・・・・・ル)の組を決定し、
これをCSM量子化器105に供、給する。
CSM量子化器105は本発明を構成する直接的な部分
であり別途詳細に説明するが、その概要は以下の代りで
ある。
であり別途詳細に説明するが、その概要は以下の代りで
ある。
CSM量子化器105はこれら1ni、ωtの値の組を
振幅の集合(m、、m2.・・・・・・−5)から求め
られるα=max(ryt、 、m2.・・・・・・、
m%)で表わされる正規化係数αを検索し、前記αを補
正データとして電力量子化器106へ出力するとともに
、前記aを用いて前記集用(扉□9m2.・・・・・1
1)を正規化する手段を会んで量子化するものであシ、
量子化ビット数は、再生音質に対する要求と回線の伝送
容量と全勘案して定まる適当なビット数が選択される。
振幅の集合(m、、m2.・・・・・・−5)から求め
られるα=max(ryt、 、m2.・・・・・・、
m%)で表わされる正規化係数αを検索し、前記αを補
正データとして電力量子化器106へ出力するとともに
、前記aを用いて前記集用(扉□9m2.・・・・・1
1)を正規化する手段を会んで量子化するものであシ、
量子化ビット数は、再生音質に対する要求と回線の伝送
容量と全勘案して定まる適当なビット数が選択される。
CSM量子化器105は前記−2ω、の値の組を量子化
した後、マルチプレクサ109に供給する。
した後、マルチプレクサ109に供給する。
また前述のV。と正規化係数αの供給を受けた電力量子
化器106も、ν。を上述の観点から定まる適当な粗゛
さで量子化した後、同様にマルチプレクサ109に供給
する。
化器106も、ν。を上述の観点から定まる適当な粗゛
さで量子化した後、同様にマルチプレクサ109に供給
する。
また、A/D変換器101から原音声信号のディジタル
を適当に量子化したデータとしてマルチプレクサ109
に供給し、同様に有声音/無声音判定器108も供給さ
れたディジタルデータより有声音/無声音の判定を行な
いこれを2値信号としてマルチプレクサ109に供給す
る。 ゛以上の信号の供給を受けたマルチプレク
サ109は、これらの信号を、受信側における分−が容
易に行なえ、また与えられた伝送路を伝送するのに適し
た形に合成し、伝送路1200を介して受信側 ・2に
伝送する。
を適当に量子化したデータとしてマルチプレクサ109
に供給し、同様に有声音/無声音判定器108も供給さ
れたディジタルデータより有声音/無声音の判定を行な
いこれを2値信号としてマルチプレクサ109に供給す
る。 ゛以上の信号の供給を受けたマルチプレク
サ109は、これらの信号を、受信側における分−が容
易に行なえ、また与えられた伝送路を伝送するのに適し
た形に合成し、伝送路1200を介して受信側 ・2に
伝送する。
さて受信1ll112においては、こ゛うして伝送され
た信号をデマルチプレクサおよび復号化器201におい
て復号化および分離を行なうことによって、送信側1の
マルチプレクサ109の入力側における各信号を復元す
る。
た信号をデマルチプレクサおよび復号化器201におい
て復号化および分離を行なうことによって、送信側1の
マルチプレクサ109の入力側における各信号を復元す
る。
こうして復元された各信号は、メモリ機能を有する補間
器202に供給され、必要な補間がほどこされた後、そ
れぞれ次のように用いられる。
器202に供給され、必要な補間がほどこされた後、そ
れぞれ次のように用いられる。
まず、CSMのル個の容認の角周波数を指定する町(鮨
〜ω7)は、前記ル個の位相リセット機能付可変周波数
発振器206−1〜206−ルの周波数制御入力に加え
られ、これらの発振器の出力角周波数を指定された角周
波数ω、〜ω、に設定する。
〜ω7)は、前記ル個の位相リセット機能付可変周波数
発振器206−1〜206−ルの周波数制御入力に加え
られ、これらの発振器の出力角周波数を指定された角周
波数ω、〜ω、に設定する。
また、CSMのル個の容認の強度(電力振幅)と指定す
るm1〜mnは前記ル個の可変利得増幅器207〜1〜
207−ルの利得制御端子に供給され、これによって各
周波数の発振電力が指定された値になるように制御する
。
るm1〜mnは前記ル個の可変利得増幅器207〜1〜
207−ルの利得制御端子に供給され、これによって各
周波数の発振電力が指定された値になるように制御する
。
こうして得られたル個の出刃は、可算合成器208にお
いて可算合成が行なわれた後、次の乗算器210に供給
される。
いて可算合成が行なわれた後、次の乗算器210に供給
される。
さて、デマルチプレクサおよび復号化器201から出力
されるピッチ周期情報は、メモリを含む補間器202に
おいて、必要に応じて補間が施され、ピッチ周期を表わ
すディジタルデータとして有声音/無声音切替器203
に供給される。
されるピッチ周期情報は、メモリを含む補間器202に
おいて、必要に応じて補間が施され、ピッチ周期を表わ
すディジタルデータとして有声音/無声音切替器203
に供給される。
一方、乱数発生器205で発生された乱数が、パルス間
隔演算器204に供給され、ここで乱数の分布幅および
その下限値が特定の値になるように変換され、無声音時
の位相リセット時間間隔を決定するデータ列として有声
音/無声音切替器203の他方の入力に供給される。
隔演算器204に供給され、ここで乱数の分布幅および
その下限値が特定の値になるように変換され、無声音時
の位相リセット時間間隔を決定するデータ列として有声
音/無声音切替器203の他方の入力に供給される。
またデマルチプレクサおよび復号化器201から出力さ
れる有声音無声音を区別する2直信号(V/U)は前述
の切替器203の切替制御信号として供給され、有声音
の場合には、切替器203が補間器202から出力する
前述のピッチ周期を表わすディジタルデータ側を選択し
て、これを窓関数発生器209に供給する。
れる有声音無声音を区別する2直信号(V/U)は前述
の切替器203の切替制御信号として供給され、有声音
の場合には、切替器203が補間器202から出力する
前述のピッチ周期を表わすディジタルデータ側を選択し
て、これを窓関数発生器209に供給する。
またもし前記2値信号(V/U)が無声音を指定する場
合には、切替4203は、前述の周期演算器204の出
力の確率過程で発生するランダムな時間間隔を表わすデ
ータ列側を選択し、これを上述のピッチ周期を表わすデ
ィジタルデータ例のかわりに、窓関数発生−a209に
供給する。
合には、切替4203は、前述の周期演算器204の出
力の確率過程で発生するランダムな時間間隔を表わすデ
ータ列側を選択し、これを上述のピッチ周期を表わすデ
ィジタルデータ例のかわりに、窓関数発生−a209に
供給する。
さて、窓関数発生器209は、位相リセットによって出
力波形に生ずる不連続を除き音声波形のもつ連続性を確
保する窓関数を発生するための庵ので、またさらにこの
窓関数と密接な時間関係を有する位相リセット用パルス
をも発生する。
力波形に生ずる不連続を除き音声波形のもつ連続性を確
保する窓関数を発生するための庵ので、またさらにこの
窓関数と密接な時間関係を有する位相リセット用パルス
をも発生する。
前述のように窓関数発生器209には切替器203を介
して、次次の位相リセット用パルス間の間隔を指定する
データ列が入力されるが、窓関数発生器209は、この
データで指定される時間間隔を有するインパルスを次次
に発生し、これをライン2090を介して位相リセット
機能付可変周波数発振器206−1〜206−ルの位相
リセット端゛子に供給しζこれによってこれら発振器の
位相リセットを行なう。またこれをライン2090を介
して補間器202に供給し、角周波数データωtおよび
強度データmiを補間するためのタイミング信号として
使用する。
して、次次の位相リセット用パルス間の間隔を指定する
データ列が入力されるが、窓関数発生器209は、この
データで指定される時間間隔を有するインパルスを次次
に発生し、これをライン2090を介して位相リセット
機能付可変周波数発振器206−1〜206−ルの位相
リセット端゛子に供給しζこれによってこれら発振器の
位相リセットを行なう。またこれをライン2090を介
して補間器202に供給し、角周波数データωtおよび
強度データmiを補間するためのタイミング信号として
使用する。
さて、窓関数発生器209は上述の位相リセット用パル
スの発生と同期して下記のよりな可変長の窓関数W(よ
)を発生する。
スの発生と同期して下記のよりな可変長の窓関数W(よ
)を発生する。
すなわち、入力されたデータにより指定されたその時点
における位相リセット用ノくルス間間隔の値をTとし、
前の位相リセット用パルスが発生してからの経過時間を
Xとすると W=0.5+0.5cos(π−) (g) T 但し o<a−<’r で表わされるような窓関数を発生する。この窓関数W(
3:)を第5図(6)に示す。上述のTの値は、有声音
の場合にはピッチ周期を表わし、無声音の場合には確率
過程で発生する変数を表わすので時間とともに変化する
。従って、この窓関数w(l+)は可変長であり、上述
の位相リセット用パルスの発生と第5回申)に示すよう
な相対時間関係で同期している(窓関数の開始時点およ
び終止時点が位相リセット用パルスの発生時点とほぼ一
致している)。
における位相リセット用ノくルス間間隔の値をTとし、
前の位相リセット用パルスが発生してからの経過時間を
Xとすると W=0.5+0.5cos(π−) (g) T 但し o<a−<’r で表わされるような窓関数を発生する。この窓関数W(
3:)を第5図(6)に示す。上述のTの値は、有声音
の場合にはピッチ周期を表わし、無声音の場合には確率
過程で発生する変数を表わすので時間とともに変化する
。従って、この窓関数w(l+)は可変長であり、上述
の位相リセット用パルスの発生と第5回申)に示すよう
な相対時間関係で同期している(窓関数の開始時点およ
び終止時点が位相リセット用パルスの発生時点とほぼ一
致している)。
こうして発生された窓関数はライン2091を介して乗
算器210に供給される。この結果、乗算器210にお
いて、加算合成器208で合成された各位相リセット用
パルスごとに位相リセットされるが個の正弦波形と、各
位相リセット用パルスに同期して発生される上述の窓関
数W(、)との積が得られる。こうして得られる波形は
、各正弦波が位相リセットされる直前で窓関数W(、)
の乗算により連続的に0に収束されており、また位相リ
セット時点では各正弦波は0から立ち上るので波形の連
続性が確保され、かくして窓関数W(ヨ)の乗算により
位相リセット波形に生ずる不連続性を除くことができる
。
算器210に供給される。この結果、乗算器210にお
いて、加算合成器208で合成された各位相リセット用
パルスごとに位相リセットされるが個の正弦波形と、各
位相リセット用パルスに同期して発生される上述の窓関
数W(、)との積が得られる。こうして得られる波形は
、各正弦波が位相リセットされる直前で窓関数W(、)
の乗算により連続的に0に収束されており、また位相リ
セット時点では各正弦波は0から立ち上るので波形の連
続性が確保され、かくして窓関数W(ヨ)の乗算により
位相リセット波形に生ずる不連続性を除くことができる
。
不連続性を除かれた乗算器210の出力は、次の乗算器
211に供給され、ここで送信側1から送られた各フレ
ームの電力情報によって加重され、合成音声としてライ
ン2000から出力される。
211に供給され、ここで送信側1から送られた各フレ
ームの電力情報によって加重され、合成音声としてライ
ン2000から出力される。
以上に説明したように、本実施例の受信側2においては
、前述した音声合成に必要なCSM合成が実行され、こ
の結果、送信側1に入力した原音声の再現が、伝送路1
20Gにおける情報量の圧縮や伝送エラーにもかかわら
ず比較的良好な音質をもって行なわれることになる。
、前述した音声合成に必要なCSM合成が実行され、こ
の結果、送信側1に入力した原音声の再現が、伝送路1
20Gにおける情報量の圧縮や伝送エラーにもかかわら
ず比較的良好な音質をもって行なわれることになる。
以上で説明した補間器202における各伝送データに対
する補間は、送信側1で各伝送データを量子化する際の
粗さに応じて種種の組合せ(例えば町だけ、あるいはω
、−一だけ等)で行なうことが可能で、また補間の方法
も、直線補間あるいはさらに高級な関数による補間を用
いるととも可能である。なお、ωi*miに対する補間
に関しては、上述の位相リセット用パルスの発生時点ご
とに補間データが得られるように補間点を選定すること
が有利であり、ωi、miの値の更新をこのタイミング
で行なうために前述のように位相リセット用パルスをラ
イン2090を介して補間器202に供給している。
する補間は、送信側1で各伝送データを量子化する際の
粗さに応じて種種の組合せ(例えば町だけ、あるいはω
、−一だけ等)で行なうことが可能で、また補間の方法
も、直線補間あるいはさらに高級な関数による補間を用
いるととも可能である。なお、ωi*miに対する補間
に関しては、上述の位相リセット用パルスの発生時点ご
とに補間データが得られるように補間点を選定すること
が有利であり、ωi、miの値の更新をこのタイミング
で行なうために前述のように位相リセット用パルスをラ
イン2090を介して補間器202に供給している。
このような補間を行なうためには、必要な後のデータが
到着するかまたは発生するかした後に補間データが求め
られるため、発振器206に対する位相のリセットおよ
び周波数ω、の設定、また増幅器207に対する強度r
niの設定等の実際の処理は、実時間より必要な一定時
間だけ遅れて実行されることになる。このため補間器2
02には必要な情報を必要時点まで記憶しておくための
メモリが含まれている。
到着するかまたは発生するかした後に補間データが求め
られるため、発振器206に対する位相のリセットおよ
び周波数ω、の設定、また増幅器207に対する強度r
niの設定等の実際の処理は、実時間より必要な一定時
間だけ遅れて実行されることになる。このため補間器2
02には必要な情報を必要時点まで記憶しておくための
メモリが含まれている。
次に、位相リセット機能付可変周波数発振器206の回
路例を第6図に示す。周波数制御端子2061に加わる
電圧によって、定電流電源2062および2063に流
れる。容量2064に対する充放電電流値を制御し、こ
れによって発振周波数を可変とする。1点の発振電圧波
形は基準電圧の+Vrと−Vr との間を直線的に上
下する三角波形となる。位相リセット端子2065にイ
ンパルスを加えるとυ点は瞬間的に接地されて、強制的
に0電位に引き戻され、そこから発振を再スタートして
位相リセットが行なわれる。この1点の三角波発振出力
を正弦波変換器2066に入力し正弦波に変換して端子
2067より出力し、これを発振器206の出力として
用いる。正弦波変換器2066は例えばROMに格納し
たサイン関数値を入力波形で読出す等の方法により容易
に実現できる。
路例を第6図に示す。周波数制御端子2061に加わる
電圧によって、定電流電源2062および2063に流
れる。容量2064に対する充放電電流値を制御し、こ
れによって発振周波数を可変とする。1点の発振電圧波
形は基準電圧の+Vrと−Vr との間を直線的に上
下する三角波形となる。位相リセット端子2065にイ
ンパルスを加えるとυ点は瞬間的に接地されて、強制的
に0電位に引き戻され、そこから発振を再スタートして
位相リセットが行なわれる。この1点の三角波発振出力
を正弦波変換器2066に入力し正弦波に変換して端子
2067より出力し、これを発振器206の出力として
用いる。正弦波変換器2066は例えばROMに格納し
たサイン関数値を入力波形で読出す等の方法により容易
に実現できる。
またこのような位相リセット機能付可変周波数発振器は
計算機のプログラムを用いて実現することも容易である
。
計算機のプログラムを用いて実現することも容易である
。
次に可変利得増幅器207の回路例を第7図に示す。増
幅すべき信号を端子2071に加え、制御信号を端子2
072に加えることによって負帰還量を制御し出力端子
2073に制御された振幅を有する出力を得る。
幅すべき信号を端子2071に加え、制御信号を端子2
072に加えることによって負帰還量を制御し出力端子
2073に制御された振幅を有する出力を得る。
またこのほかに、アナログ乗算器を用いて実現すること
もできるし、またD/A変換器の基準電圧にアナログ波
形入力を用い、ディジタル入力に、ディジタル量で表現
された制御情報を用いる等の方法によりても容易に実現
することができる。
もできるし、またD/A変換器の基準電圧にアナログ波
形入力を用い、ディジタル入力に、ディジタル量で表現
された制御情報を用いる等の方法によりても容易に実現
することができる。
次に乱数発生器205の一回路例を第8図に示す。15
段のレフトレジスタ2051と1個の中加算器2052
とKよ#)2 −1の周期を有する15次のM系列の疑
似乱数を発生する。必要な時点でクロック端子2053
にシフトパルスを加えることにより、次の乱数値が得ら
れる。
段のレフトレジスタ2051と1個の中加算器2052
とKよ#)2 −1の周期を有する15次のM系列の疑
似乱数を発生する。必要な時点でクロック端子2053
にシフトパルスを加えることにより、次の乱数値が得ら
れる。
次に周期算出器204のプ四ツク図を第9図(6)に示
す。これは上述の乱数発生器205から出力・される0
から2−1の範囲に一様に分布している乱数を無声音時
の位相リセット用パルスの時間間隔を指定する乱数とし
て用いるのに適した分布に変換するもので、定数乗算器
2041と定数加算器2042よりなる。これによって
、第9図(B)に示すように、乱数の分布幅りと下限値
りとを適当な値に設定することができる。
す。これは上述の乱数発生器205から出力・される0
から2−1の範囲に一様に分布している乱数を無声音時
の位相リセット用パルスの時間間隔を指定する乱数とし
て用いるのに適した分布に変換するもので、定数乗算器
2041と定数加算器2042よりなる。これによって
、第9図(B)に示すように、乱数の分布幅りと下限値
りとを適当な値に設定することができる。
次に窓関数発生器209の一実施例を第10図に示す。
これはレジスタ2091、プリセット可能なダウンカウ
ンタ2092、カウンタ2093、読出し専用メモリ(
ROM)2094を含んでいる。
ンタ2092、カウンタ2093、読出し専用メモリ(
ROM)2094を含んでいる。
切替器203から供給された位相リセット用パルス間隔
を指定するデータTは、レジスタ2091に格能される
。ダウンカウンタ2092は一定周期の高速クロックC
LKをカウントするカウンタで、まず、レジスタ209
1の内容Tをプリセットし、これをクロックCLKを用
いてダウンカウントする。カウンタ2092の内容が0
になると出力端子よりパルスを発生し、これにより再び
レジスタ2091の内容をプリセットしてこの値のダウ
ンカウントを開始する。かくしてダウンカウンタ209
2の出力2092−1 にはTに比例した周期(例えば
T/&)をもつパルス列が発生する。このパルス列はカ
ラ/り2093のクロックとして加えられる。
を指定するデータTは、レジスタ2091に格能される
。ダウンカウンタ2092は一定周期の高速クロックC
LKをカウントするカウンタで、まず、レジスタ209
1の内容Tをプリセットし、これをクロックCLKを用
いてダウンカウントする。カウンタ2092の内容が0
になると出力端子よりパルスを発生し、これにより再び
レジスタ2091の内容をプリセットしてこの値のダウ
ンカウントを開始する。かくしてダウンカウンタ209
2の出力2092−1 にはTに比例した周期(例えば
T/&)をもつパルス列が発生する。このパルス列はカ
ラ/り2093のクロックとして加えられる。
このクロックで歩進されるカウンタ2093のカウント
出力2093−1はROM2094にアドレス指定信号
として加えられ、そこに書き込まれている窓関数W(、
)、のデータを順番に読出してライン2091に出力す
る。カウンタ2093の内容がkになると、ROM20
94の窓関数W(ヨ)の最後のデータが読出され、これ
とともにカウンタ2093はリセットされてライン20
90にリセットパルスを出力する。このリセットパルス
は、発振器206−1〜206−f&の位相リセット用
端子および補間器202に供給される前述の位相リセッ
ト用パルスとして用いられると共に、レジスタ2091
に次の入力データをセットするために用いられる。また
ROM2094の中にに個のサンプルとして予め格納さ
れている窓関数w(6)のデータはライン2091に流
出されて乗算器210に供給される。かくして、パルス
間間隔がつぎつぎに指定された値をもつ位相リセット用
パルスと、これと第5図(B)に示すように同期された
可変長の窓関数W(、)とが生成される。
出力2093−1はROM2094にアドレス指定信号
として加えられ、そこに書き込まれている窓関数W(、
)、のデータを順番に読出してライン2091に出力す
る。カウンタ2093の内容がkになると、ROM20
94の窓関数W(ヨ)の最後のデータが読出され、これ
とともにカウンタ2093はリセットされてライン20
90にリセットパルスを出力する。このリセットパルス
は、発振器206−1〜206−f&の位相リセット用
端子および補間器202に供給される前述の位相リセッ
ト用パルスとして用いられると共に、レジスタ2091
に次の入力データをセットするために用いられる。また
ROM2094の中にに個のサンプルとして予め格納さ
れている窓関数w(6)のデータはライン2091に流
出されて乗算器210に供給される。かくして、パルス
間間隔がつぎつぎに指定された値をもつ位相リセット用
パルスと、これと第5図(B)に示すように同期された
可変長の窓関数W(、)とが生成される。
次にCSM分析について説明する。
前述のように、C3lvl1分析は、各分析フレーム毎
に、表現されるべき音声波形から直接算出される標本自
己相関係数のN個の低次のタッグ値と、合成波(rL個
の正弦波の和)のN個の低次のタップ値とが一致するよ
うに、合成すべき各正弦波の周波数へとその強K(電力
振幅) ?1Lc とを決定することである。
に、表現されるべき音声波形から直接算出される標本自
己相関係数のN個の低次のタッグ値と、合成波(rL個
の正弦波の和)のN個の低次のタップ値とが一致するよ
うに、合成すべき各正弦波の周波数へとその強K(電力
振幅) ?1Lc とを決定することである。
今、合成波のタップtの自己相関係数をrt とすると
、前述のように rt=、J、 771i CXm l−町となる。
、前述のように rt=、J、 771i CXm l−町となる。
一方、表現されるべき音声波形のサンプルXtから、あ
るフレームの、タップLの標本自己相関係数utは である。
るフレームの、タップLの標本自己相関係数utは である。
これより
rt=vt ・・・(2)t
= 0 、1 、2、−−・・・・N 但しN=2n
−1とすると下記のマトリックス表現が得られる。
= 0 、1 、2、−−・・・・N 但しN=2n
−1とすると下記のマトリックス表現が得られる。
しかし上式は、ω、および7niが未知のだめ単純な行
列演算では解けない。そこで、 ω、−勇 X□ ・べ4)とお
き、 cm L GJ 6 = cos t cos−1へ三
Tt (”=) ・・−(5)の置換を行なう。
列演算では解けない。そこで、 ω、−勇 X□ ・べ4)とお
き、 cm L GJ 6 = cos t cos−1へ三
Tt (”=) ・・−(5)の置換を行なう。
このTz(x)はTcbebychef f(チェビシ
ェフ)の多項式である。この置換を行なうと(3)式は
次のように変換される。
ェフ)の多項式である。この置換を行なうと(3)式は
次のように変換される。
ところが、一般に、1はTo (:I:) 、 Ts
(,2?) −−−−−・T z(x)の線形結合と1
−で表わすことができる。
(,2?) −−−−−・T z(x)の線形結合と1
−で表わすことができる。
すなわち、
但し5(4)は逆Tchebycheff (チェビシ
ェフ)コ 係数である。
ェフ)コ 係数である。
の線形結合At を下式のように定規する。
但しt=0.1,2.・・・・・・12n−1こうする
と、(6)式の左辺および右辺にそれぞれ(7ン式訃よ
び(8)式の関係を用いることにより、下記の関係式が
成立する。
と、(6)式の左辺および右辺にそれぞれ(7ン式訃よ
び(8)式の関係を用いることにより、下記の関係式が
成立する。
さて、ここで、xl、x2.・・−・・・、x7 に零
点をもつ1次の多項式 を定義し、このPa(3:) を用いて、(9)式の
左辺と似た式の を作り、これを検討してみる。上式が0であることは明
らかであるが、さらにこれは次のように書き換えること
ができる。
点をもつ1次の多項式 を定義し、このPa(3:) を用いて、(9)式の
左辺と似た式の を作り、これを検討してみる。上式が0であることは明
らかであるが、さらにこれは次のように書き換えること
ができる。
以上より、t=0,1,2.・・・・・・nとして下式
が得られる。
が得られる。
しかるに吃゛←)、= 1 であるから 、が成立する
。左辺のAi ででまるマトリクスは一般にHankc
l (ハングル)行列と呼ばれているものである。前述
のように各人、は、表現すべき音声波形の標本自己相関
係数νjから(8)式により与えられるもので既知であ
る。
。左辺のAi ででまるマトリクスは一般にHankc
l (ハングル)行列と呼ばれているものである。前述
のように各人、は、表現すべき音声波形の標本自己相関
係数νjから(8)式により与えられるもので既知であ
る。
この各p、が求まると路次方程式
P、 (”) = x”+y?:、−8x”−”+・・
・−・p0= 0の解として、(xl、x2.・・・、
X、)が求められる。
・−・p0= 0の解として、(xl、x2.・・・、
X、)が求められる。
これより各CSM周波数ωiは(4)式のωi″邸 X
i より求められ、またCSM強度miは(9)式より導か
れる下式を用いて求められる。
i より求められ、またCSM強度miは(9)式より導か
れる下式を用いて求められる。
なお、上式の左辺の行列は一般にVander Mon
de(7アレデルモンデ)行列と呼ばれているものであ
る。
de(7アレデルモンデ)行列と呼ばれているものであ
る。
以上をまとめると、CSM分析の分析アルゴリズムは以
下のようになる。
下のようになる。
(1)標本自己相関係数を計算する
(2)逆チェビシェフ係数を用いてAtを定義する。
てル個の2t を求める。
p、<x)三−’十F(:jl ” ”−”+ PC:
、22 ”−”+ −+ P(1’= +p 6=0 (5)房逆変換を行なって08M角周波数(ωt)を求
める。
、22 ”−”+ −+ P(1’= +p 6=0 (5)房逆変換を行なって08M角周波数(ωt)を求
める。
ωも=房 Xl
(6) Van del Monde (777デル
モンデ)行列方程式を解いてCSM強度(−i)を求め
る。
モンデ)行列方程式を解いてCSM強度(−i)を求め
る。
の各角周波数(ω1.ω2・・・ω、)および容認の強
度(ml、m2.・・・mn}を求めることができる。
度(ml、m2.・・・mn}を求めることができる。
なお、上述のHankel (バンケル)行列方程式の
能率的解法として、初期条件を与えて遂次的に解を求め
る方法が知られている。
能率的解法として、初期条件を与えて遂次的に解を求め
る方法が知られている。
また、上記路次の代数方程式は実根のみを有することか
証明されているため、二ニートン・ラプソンの方法等を
用いて根を求めることができる。
証明されているため、二ニートン・ラプソンの方法等を
用いて根を求めることができる。
さらに、上記Vander Monde (77yデ
ルモンデ)行列方程式の能率的解法として三角行列化を
行なって順次に解を求める方法′を用いることができる
。なお上述の分析方法は嵯峨山氏らの論文1複合正弦波
モデルによる音声スペクトル分析”゛電子通信学会論文
誌’ 81/2 Mol 、J64−A tJn 2p
、ios〜112 に詳しく述べられている。
ルモンデ)行列方程式の能率的解法として三角行列化を
行なって順次に解を求める方法′を用いることができる
。なお上述の分析方法は嵯峨山氏らの論文1複合正弦波
モデルによる音声スペクトル分析”゛電子通信学会論文
誌’ 81/2 Mol 、J64−A tJn 2p
、ios〜112 に詳しく述べられている。
最後に本発明を構成する直接的な部分であるCSM量子
化器105、電力補正量子化器106を図面を用いて詳
細に説明する。第11図はCSM量子化器105、電力
補正量子化器106を詳細に説明するためのブロック図
である。
化器105、電力補正量子化器106を図面を用いて詳
細に説明する。第11図はCSM量子化器105、電力
補正量子化器106を詳細に説明するためのブロック図
である。
CSM分析器104よficsMのn個の各正弦波の強
度および角周波数を指定するmi、ωi (但しi=1
.2.・・・・・・ル)の組が一時メモリ(1)、10
51へ供給される。一時メモリ(1)、1051は前記
miを正規化係数検索器1052とCSM強度正規化器
1053とへ出力する。正規化係数検索器1o52は以
下の手順に従って正規化係数αと最大周波数の番号工と
を検索する。
度および角周波数を指定するmi、ωi (但しi=1
.2.・・・・・・ル)の組が一時メモリ(1)、10
51へ供給される。一時メモリ(1)、1051は前記
miを正規化係数検索器1052とCSM強度正規化器
1053とへ出力する。正規化係数検索器1o52は以
下の手順に従って正規化係数αと最大周波数の番号工と
を検索する。
(1)初期状a cL=m L I I = lを設
定する。
定する。
(2) αとm2との大小関係を調査する。
もしa>mzであれば (4)を次に実施する。
もしa<z2であれば (3)を次に実施する。
(3) α=m3.I=2を設定する。
(4) αとrlL3 との大小関係を調査し、上記
(2)と同様の処理を行なう。
(2)と同様の処理を行なう。
(5)以下m4・・・・・・肩Nまで(4)と同様の処
理を行なう。
理を行なう。
正規化係数検索器1052は検索した前記αを1上方補
正器1061とCSM強度正規化器1053とへ、又、
前記I′ir:CSM強度量子化器1054へ出力する
。CSM強度正規化器1053は一時メモり(1)。
正器1061とCSM強度正規化器1053とへ、又、
前記I′ir:CSM強度量子化器1054へ出力する
。CSM強度正規化器1053は一時メモり(1)。
1051より供給された前記miを前記正規化係数αを
用いて1ni=71!i/α(但し、i = 1 、2
、−=・・・rL)を算出する。更にCSM強度正規化
器1053は算出し九扉・の平方根V;]−(’ =1
* 2 *・・・・・・ル)霧 を求めCBM強度量子化器1054へ出力する。
用いて1ni=71!i/α(但し、i = 1 、2
、−=・・・rL)を算出する。更にCSM強度正規化
器1053は算出し九扉・の平方根V;]−(’ =1
* 2 *・・・・・・ル)霧 を求めCBM強度量子化器1054へ出力する。
CSM強度量子化器1054は正規化係数検索器105
2より供給される最大周波数の番号工と前記r (L
ml 、 2.・・・・・・ル)とを用いて例えば第1
2図に示す形式のビット配分で線形量子化を実施し、量
子化データを一時メモリ(2)、1056へ出力する。
2より供給される最大周波数の番号工と前記r (L
ml 、 2.・・・・・・ル)とを用いて例えば第1
2図に示す形式のビット配分で線形量子化を実施し、量
子化データを一時メモリ(2)、1056へ出力する。
次に量子化の形式を第12図を参照して説明する。
第12図(a)は9次CSM分析(ル÷5に相当する)
の結果得られるCSM強度強度、77L、・・・・・・
扉、を16bitsで量子化するためのピット配分を示
したものである。前記番号工に対応して最強CSM強度
の指定が行なわれる。ここで最強CSMが番号Iが1の
場合には第12図0)〜αに示す様に図上で左端に示さ
れるビットに10#が与えられ、Iが2.3,4.5
の場合には第12図(1))−b−eに示す様に図上
で左端に示さnるビットに61”が与えられる。
の結果得られるCSM強度強度、77L、・・・・・・
扉、を16bitsで量子化するためのピット配分を示
したものである。前記番号工に対応して最強CSM強度
の指定が行なわれる。ここで最強CSMが番号Iが1の
場合には第12図0)〜αに示す様に図上で左端に示さ
れるビットに10#が与えられ、Iが2.3,4.5
の場合には第12図(1))−b−eに示す様に図上
で左端に示さnるビットに61”が与えられる。
所で、CSM強度の分布を調査すると、最強のCSM強
度を持つのはmユとなる場合がきわめて多い。第13図
は9次CAM分析(ル=5)の結果得られるCSM強度
yx1,2+1. 、・・・・・−1を正規化係数αを
算出して正規化した場合の分布図であり図中@7レーム
数”と書かれたものは該強度が最強となったフレーム数
である。なお、全分析フレーム数は6963である。即
ち慝、が最強のCSM強度を持つ割合は5895/69
63冨0.847であつ、第12図(ロ)に示すように
mlが最強(I=13の場合にIの指屍が最も少ないビ
ット数で行なえるように構成されて−る。
度を持つのはmユとなる場合がきわめて多い。第13図
は9次CAM分析(ル=5)の結果得られるCSM強度
yx1,2+1. 、・・・・・−1を正規化係数αを
算出して正規化した場合の分布図であり図中@7レーム
数”と書かれたものは該強度が最強となったフレーム数
である。なお、全分析フレーム数は6963である。即
ち慝、が最強のCSM強度を持つ割合は5895/69
63冨0.847であつ、第12図(ロ)に示すように
mlが最強(I=13の場合にIの指屍が最も少ないビ
ット数で行なえるように構成されて−る。
尚、最強のCSM強度そのものは自分自身で正規化され
ているため、必らず1.oとなり情報の伝送を必要とし
ない。
ているため、必らず1.oとなり情報の伝送を必要とし
ない。
再び第11図に戻り、こうして量子化されたCSM強度
パラメータ社一時メモリ(2)、1056へ出力される
。CSM周波数量子化器1o55はCSMの路側の正弦
波の角周波数を指定するω1 (但し’ ” 1 *
2 +”−−−・n) +7)!11t−一時メモリ(
1)、1051より供給を受は予じめ調査されている各
ω、の分布範囲を考慮した線形量子化を実施し、量子化
データを一時メモリ(2)、1056へ出力する。一時
メモIJ(2)、1056はi量子化すしたCSM強1
iとCEiM角周波数データとをiルナプレクサ109
へ出力する。電力補正器1061は自己相関係数計測器
103より供給を受は九成カデータに正規化係数検索器
よシ供給された係数αを掛は結果を電力量子化器106
2へ出力する。電力量子化器1062は前記結果を17
2乗し振幅情報に変換した後、例えdμ2ssPCM
で用いられている非線形量子化を行ないマルチプレクサ
109へ出力する。
パラメータ社一時メモリ(2)、1056へ出力される
。CSM周波数量子化器1o55はCSMの路側の正弦
波の角周波数を指定するω1 (但し’ ” 1 *
2 +”−−−・n) +7)!11t−一時メモリ(
1)、1051より供給を受は予じめ調査されている各
ω、の分布範囲を考慮した線形量子化を実施し、量子化
データを一時メモリ(2)、1056へ出力する。一時
メモIJ(2)、1056はi量子化すしたCSM強1
iとCEiM角周波数データとをiルナプレクサ109
へ出力する。電力補正器1061は自己相関係数計測器
103より供給を受は九成カデータに正規化係数検索器
よシ供給された係数αを掛は結果を電力量子化器106
2へ出力する。電力量子化器1062は前記結果を17
2乗し振幅情報に変換した後、例えdμ2ssPCM
で用いられている非線形量子化を行ないマルチプレクサ
109へ出力する。
なお合成側での逆正規化は乗算器211で自動的に行な
われる。
われる。
(発明の効果)
以上述べた様に本発明を用いるとCSM強度パラメータ
相互の関係を考慮してCSM強度パラメータを量子化す
ることにより、量子化の効率を高められるという効果が
ある。
相互の関係を考慮してCSM強度パラメータを量子化す
ることにより、量子化の効率を高められるという効果が
ある。
第1図はCSMパラメータによる音声特徴ベクトルバタ
ーノの一例を示す図、第2図はCSMラインスペクトル
と、同一音声サンプルより求めたLPGスペクトル包絡
との対応例を示す図、第3図(A)は拡散されたCAM
のスペクトル包絡とピッチの微細構造とを示す図、第3
図(B) u単純加算しただけのCSMスペクトルを示
す図、第4図は本発明を含む分析合成系の一実施例を示
すブロック図、第5図(A)は可変長窓関数の関数形を
示す図、第5図(B)は前記可変長窓関数と位相リセッ
ト用パルスとの相対時間関係を示す図、第6図は位相リ
セット機能付可変周波数発振器の一回路例を示す図、第
7図は可変利得増幅器の一回路例を示す図、第8図は乱
数発生器の一回路例を示す図、第9図(A)は周期算出
器のブロック図、第9図(B)は前記周期算出器の出力
の乱数の分布を示す図および第10図は可変長窓発生器
の一例を示すブロック図、第11図は本発明を構成する
直接的な部分を詳細に説明するためのブロック図、第1
2図は量子化の形式の一例を示す図、第13図はCAM
強度の分布例を示す図である。 図において、1・・・・・・送信側、2・・・・・・受
信側、101・・・・・・A/D変換器、102・・・
・・・ハミング窓処理器、103・・・・・・自己相関
係数計測器、104・・・・・・CSM分析器、105
・・・・・・CSM量子化器、106・・・・・・電力
量子化器、107・・・・・・ピッチ抽出器、108有
声音/無声音判定器、109・・・・・・マルチプレク
サ、201・・・・・・デマルチプレクサおよび復号化
器、202・・・・・・補間器、203・・・・・・有
声音/無声音切替器、204・・・・・・周期算出器、
205・・・・・・乱数発生器、206−1〜206−
3・・・・・・位相リセット機能付可変周波数発振器、
207−1〜207−3・・・・・・可変利得増幅器、
208・・・・・・加算合成器、209・・・・・・可
変長窓関数発生器、210,211・・・・・・乗算器
、1051・・・・・・一時メモl)、1052・・・
・・・正規化係数検索器、1053・・・・・・CSM
強度正規化器、1054・・・・・・CSM強度量子化
器、1055・・・・・・CSM周波数量子化器、10
56・・・・・・一時メモ!j(2)、1061・・・
電力補正器、1062・・・・・・電力量子化器。 筆撥 [;」 率2図 PTA数 0 時用□ 早S図 第6図 第7 ズ 第8回 第 q 図 (ハ) 奉120(α) っ l 0(ryn+ rns
rn4 m l=2 の 4イ
)N: 7 fil rnz m4
rn 1=3n4今J、tto ynr
171. rn rn I=4
v>40>e /// ynr 1712
mJm4x=sty>騰合第12図(b) 第13 額 手続補正書(方式) %式% 1、事件の表示 昭和59年 特 許願第1604
91号2、発明の名称 08Mパラメータの量子化
方法とその装置3、補正をする者 事件との関係 出 願 人東京都港区芝五
丁1」33番1号 (423) 日本電気株式会社 代表者 関本忠弘 4、代理人 6、補正の対象 図面 L 補正の内容 第13図を別添第13図と差し替える。 7v泌l屍 /ηtt、r雇 y
υ曜イ曜−賽東一 −琴賛一 −燦郵一 χを巌紹必 XMI弓i砂 一顆一 −簗受−−
ーノの一例を示す図、第2図はCSMラインスペクトル
と、同一音声サンプルより求めたLPGスペクトル包絡
との対応例を示す図、第3図(A)は拡散されたCAM
のスペクトル包絡とピッチの微細構造とを示す図、第3
図(B) u単純加算しただけのCSMスペクトルを示
す図、第4図は本発明を含む分析合成系の一実施例を示
すブロック図、第5図(A)は可変長窓関数の関数形を
示す図、第5図(B)は前記可変長窓関数と位相リセッ
ト用パルスとの相対時間関係を示す図、第6図は位相リ
セット機能付可変周波数発振器の一回路例を示す図、第
7図は可変利得増幅器の一回路例を示す図、第8図は乱
数発生器の一回路例を示す図、第9図(A)は周期算出
器のブロック図、第9図(B)は前記周期算出器の出力
の乱数の分布を示す図および第10図は可変長窓発生器
の一例を示すブロック図、第11図は本発明を構成する
直接的な部分を詳細に説明するためのブロック図、第1
2図は量子化の形式の一例を示す図、第13図はCAM
強度の分布例を示す図である。 図において、1・・・・・・送信側、2・・・・・・受
信側、101・・・・・・A/D変換器、102・・・
・・・ハミング窓処理器、103・・・・・・自己相関
係数計測器、104・・・・・・CSM分析器、105
・・・・・・CSM量子化器、106・・・・・・電力
量子化器、107・・・・・・ピッチ抽出器、108有
声音/無声音判定器、109・・・・・・マルチプレク
サ、201・・・・・・デマルチプレクサおよび復号化
器、202・・・・・・補間器、203・・・・・・有
声音/無声音切替器、204・・・・・・周期算出器、
205・・・・・・乱数発生器、206−1〜206−
3・・・・・・位相リセット機能付可変周波数発振器、
207−1〜207−3・・・・・・可変利得増幅器、
208・・・・・・加算合成器、209・・・・・・可
変長窓関数発生器、210,211・・・・・・乗算器
、1051・・・・・・一時メモl)、1052・・・
・・・正規化係数検索器、1053・・・・・・CSM
強度正規化器、1054・・・・・・CSM強度量子化
器、1055・・・・・・CSM周波数量子化器、10
56・・・・・・一時メモ!j(2)、1061・・・
電力補正器、1062・・・・・・電力量子化器。 筆撥 [;」 率2図 PTA数 0 時用□ 早S図 第6図 第7 ズ 第8回 第 q 図 (ハ) 奉120(α) っ l 0(ryn+ rns
rn4 m l=2 の 4イ
)N: 7 fil rnz m4
rn 1=3n4今J、tto ynr
171. rn rn I=4
v>40>e /// ynr 1712
mJm4x=sty>騰合第12図(b) 第13 額 手続補正書(方式) %式% 1、事件の表示 昭和59年 特 許願第1604
91号2、発明の名称 08Mパラメータの量子化
方法とその装置3、補正をする者 事件との関係 出 願 人東京都港区芝五
丁1」33番1号 (423) 日本電気株式会社 代表者 関本忠弘 4、代理人 6、補正の対象 図面 L 補正の内容 第13図を別添第13図と差し替える。 7v泌l屍 /ηtt、r雇 y
υ曜イ曜−賽東一 −琴賛一 −燦郵一 χを巌紹必 XMI弓i砂 一顆一 −簗受−−
Claims (2)
- (1)音声のスペクトル包絡を所定の数nの周波数と振
幅とが自由な正弦波の集合で表現するCSMパラメータ
量子化に於いて、振幅の集合{m_1、m_2、…、m
_n}をa=max{m_1、m_2、…、m_n}で
表現される正規化係数αにより正規化する手段を用いる
ことを特徴とするCSMパラメータ量子化方法。 - (2)音声のスペクトル包絡を所定の数nの周波数と振
幅とが自由な正弦波の集合で表現するCSMパラメータ
を少数のビットで表現するためのCSMパラメータ量子
化装置に於いて、前記正弦波の振幅の集合{m_1、m
_2、…、m_n}から前記集合の最大値a=max{
m_1、m_2、…、m_n)を検索する手段と、前記
手段により検索された最大値aにより前記振幅の集合を
正規化する手段とを有することを特徴とするCSMパラ
メータ量子化装置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16049184A JPS6139099A (ja) | 1984-07-31 | 1984-07-31 | Csmパラメ−タの量子化方法とその装置 |
| US06/753,138 US4815135A (en) | 1984-07-10 | 1985-07-09 | Speech signal processor |
| CA000486504A CA1242279A (en) | 1984-07-10 | 1985-07-09 | Speech signal processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16049184A JPS6139099A (ja) | 1984-07-31 | 1984-07-31 | Csmパラメ−タの量子化方法とその装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6139099A true JPS6139099A (ja) | 1986-02-25 |
| JPH0439678B2 JPH0439678B2 (ja) | 1992-06-30 |
Family
ID=15716087
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP16049184A Granted JPS6139099A (ja) | 1984-07-10 | 1984-07-31 | Csmパラメ−タの量子化方法とその装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6139099A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02203398A (ja) * | 1988-04-08 | 1990-08-13 | American Teleph & Telegr Co <Att> | スピーチ処理、合成と解析方法及びその装置 |
| JPH02204800A (ja) * | 1988-04-08 | 1990-08-14 | American Teleph & Telegr Co <Att> | スピーチ処理と合成方法及びその装置 |
-
1984
- 1984-07-31 JP JP16049184A patent/JPS6139099A/ja active Granted
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02203398A (ja) * | 1988-04-08 | 1990-08-13 | American Teleph & Telegr Co <Att> | スピーチ処理、合成と解析方法及びその装置 |
| JPH02204800A (ja) * | 1988-04-08 | 1990-08-14 | American Teleph & Telegr Co <Att> | スピーチ処理と合成方法及びその装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0439678B2 (ja) | 1992-06-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA1157564A (en) | Sound synthesizer | |
| JP5275612B2 (ja) | 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法 | |
| Dolson | The phase vocoder: A tutorial | |
| US4175464A (en) | Musical tone generator with time variant overtones | |
| CA1065490A (en) | Emphasis controlled speech synthesizer | |
| US4815135A (en) | Speech signal processor | |
| EP0657873B1 (en) | Speech signal bandwidth compression and expansion apparatus, and bandwidth compressing speech signal transmission method, and reproducing method | |
| JPH0618351B2 (ja) | 音楽信号の通信装置 | |
| US4382160A (en) | Methods and apparatus for encoding and constructing signals | |
| US4114498A (en) | Electronic musical instrument having an electronic filter with time variant slope | |
| JPH0754440B2 (ja) | 音声分析合成装置 | |
| US3069507A (en) | Autocorrelation vocoder | |
| JPS6243199B2 (ja) | ||
| JPS6139099A (ja) | Csmパラメ−タの量子化方法とその装置 | |
| US4231277A (en) | Process for forming musical tones | |
| GB2103005A (en) | Modulation effect device | |
| JPS6332196B2 (ja) | ||
| JPH0310120B2 (ja) | ||
| JPH0363079B2 (ja) | ||
| JPS6121000A (ja) | Csm型音声合成器 | |
| JPH0441838B2 (ja) | ||
| EP0149724A1 (en) | Method and apparatus for coding digital signals | |
| US3994195A (en) | Electronic musical instrument | |
| JPS5816297A (ja) | 音声合成方式 | |
| JPS6265100A (ja) | Csm型音声合成器 |