JPH0141999B2 - - Google Patents
Info
- Publication number
- JPH0141999B2 JPH0141999B2 JP56069950A JP6995081A JPH0141999B2 JP H0141999 B2 JPH0141999 B2 JP H0141999B2 JP 56069950 A JP56069950 A JP 56069950A JP 6995081 A JP6995081 A JP 6995081A JP H0141999 B2 JPH0141999 B2 JP H0141999B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- circuit
- scale
- melody
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000005070 sampling Methods 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 12
- 230000005236 sound signal Effects 0.000 claims description 11
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 14
- 230000006835 compression Effects 0.000 description 12
- 238000007906 compression Methods 0.000 description 12
- 101100087530 Caenorhabditis elegans rom-1 gene Proteins 0.000 description 6
- 101100305983 Mus musculus Rom1 gene Proteins 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 101001106432 Homo sapiens Rod outer segment membrane protein 1 Proteins 0.000 description 3
- 102100021424 Rod outer segment membrane protein 1 Human genes 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 101150065817 ROM2 gene Proteins 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Description
本発明は音声合成装置に関するものである。一
般に音声の特徴を表わす特徴パラメータには、音
の大小を表わす振巾パラメータ(以下Aパラメー
タと略称する)と、音の高低すなわち基本周期を
表わすピツチパラメータ(以下Pパラメータと略
称する)と、音の音色すなわちスペクトル分布を
表わすスペクトルパラメータ(以下Sパラメータ
と略称する)とがある。したがつて音声を合成す
るには音声信号を音声周波数よりも十分高い周波
数を有するサンプリングパルスでサンプリング
し、各特徴パラメータを抽出して予めデータメモ
リに記憶させ、データメモリから読み出された特
徴パラメータに基いて音源を駆動して音声を合成
すれば良いことになる。この種の音声合成装置で
は音声信号のサンプリング数を多くすればするほ
ど忠実な音声を合成できることになるが、反面サ
ンプリング数が多くなると音声合成データのビツ
ト数が増大して大きな容量のデータメモリが必要
になるとともにデータ処理の回路構成が複雑にな
り、コストが高くなるという問題がある。従つて
従来の音声合成装置にあつてはサンプリングパル
ス周波数(以下サンプリング周波数と略称する)
は人間の声を忠実に再生するために最低必要な周
波数に設定されており、通常、サンプリング周波
数は8または10KHz(サンプリング周期125μSま
たは100μS)に設定する。ところで、サンプリン
グパルスにて音声信号をサンプリングしてA、
P、Sパラメータよりなる特徴パラメータを抽出
してメモリに記憶させ、メモリに記憶させた特徴
パラメータをサンプリングパルスに等しい周期の
同期パルスにて読み出して音声を合成する場合、
Pパラメータに基いて再生される音声の基本周期
はサンプリング周波数によつて決められる離散値
しかとり得ない。すなわち、サンプリング周期を
100μS、PパラメータをPi(整数値)とすれば再
生される基本周期tは t=100Pi×10-6(sec) (但しPi=1、2、3…) となつて再生し得る音声周波数は(表1)のよう
な離散値となる。
般に音声の特徴を表わす特徴パラメータには、音
の大小を表わす振巾パラメータ(以下Aパラメー
タと略称する)と、音の高低すなわち基本周期を
表わすピツチパラメータ(以下Pパラメータと略
称する)と、音の音色すなわちスペクトル分布を
表わすスペクトルパラメータ(以下Sパラメータ
と略称する)とがある。したがつて音声を合成す
るには音声信号を音声周波数よりも十分高い周波
数を有するサンプリングパルスでサンプリング
し、各特徴パラメータを抽出して予めデータメモ
リに記憶させ、データメモリから読み出された特
徴パラメータに基いて音源を駆動して音声を合成
すれば良いことになる。この種の音声合成装置で
は音声信号のサンプリング数を多くすればするほ
ど忠実な音声を合成できることになるが、反面サ
ンプリング数が多くなると音声合成データのビツ
ト数が増大して大きな容量のデータメモリが必要
になるとともにデータ処理の回路構成が複雑にな
り、コストが高くなるという問題がある。従つて
従来の音声合成装置にあつてはサンプリングパル
ス周波数(以下サンプリング周波数と略称する)
は人間の声を忠実に再生するために最低必要な周
波数に設定されており、通常、サンプリング周波
数は8または10KHz(サンプリング周期125μSま
たは100μS)に設定する。ところで、サンプリン
グパルスにて音声信号をサンプリングしてA、
P、Sパラメータよりなる特徴パラメータを抽出
してメモリに記憶させ、メモリに記憶させた特徴
パラメータをサンプリングパルスに等しい周期の
同期パルスにて読み出して音声を合成する場合、
Pパラメータに基いて再生される音声の基本周期
はサンプリング周波数によつて決められる離散値
しかとり得ない。すなわち、サンプリング周期を
100μS、PパラメータをPi(整数値)とすれば再
生される基本周期tは t=100Pi×10-6(sec) (但しPi=1、2、3…) となつて再生し得る音声周波数は(表1)のよう
な離散値となる。
【表】
【表】
このような離散的な音声周波数しか発生できな
くとも人間の声などは比較的忠実に再生できる。
しかしながら音階周波数で構成されたメロデイ音
を再生する場合、各音階(ド、レ、ミ…)の音階
周波数は表1に示すように上記離散値に含まれて
いないものが多く、メロデイ音をこのような離散
的な音声周波数を用いて再生すれば著しく音程の
ずれたメロデイ音が再生されるという問題があつ
た。本発明は上記問題点を解決することを目的と
するものである。 以下PARCOR型音声合成装置の一実施例につ
いて図を用いて説明する。PARCOR型音声合成
方式は第1図に示すように音声信号VSをサンプ
リングパルスにより適当周期toでサンプリング
し、サンプリングされたサンプリング値Xtと
Xt-pの間にある(P−1)個のサンプリング値に
よる相関関係を除外し、XtとXt-pとの相関関係
のみを抽出したPARCOR係数(部分自己相関係
数:以下Kパラメータと略称する)をSパラメー
タとして音声を合成するものであり、Kパラメー
タは音声がほぼ定常状態とみなせる1フレーム
(5〜20msec)において、適当周期to(約
100μsec)毎に音声信号VSのサンプリングを行な
い、隣り合うサンプル値間の相関係数をK1とし、
複数間隔離されたサンプル値間では、その間に挾
まれたサンプル値による影響を最小2乗誤差によ
る線形予測によつて求め、それらを差引いてでき
る相関係数をK2〜Koとしたものである。このK
パラメータはK1、K2、K3のようにXtに近い点と
の部分自己相関関係を表わす係数にはスペクトル
分布に関する情報が豊富に含まれているが、K8、
K9、K10のようなXtから遠い点との部分自己相関
係数にはスペクトル分布に関する情報があまり含
まれていないので、低次のKパラメータに多数の
量子化ビツトを割り当て、高次のKパラメータに
は少数の量子化ビツトを割り当てることによりビ
ツト数を節減して冗長度を小さくするほうが効果
的である。したがつてPARCOR方式はSパラメ
ータとして自己相関係数を用いて各係数に同一ビ
ツト数を割り当てるようにした自己相関係数方式
に比べて帯域圧縮率がすぐれているものである。
通常各A、P、Kパラメータは圧縮されて記憶あ
るいは伝送され、Aパラメータに対して5ビツ
ト、Pパラメータに対して6ビツト、Kパラメー
タの各係数K1、K2…K10に対して7、6、5、
4、4、4、3、3、3、3ビツト等のように割
り当てる。 第2図は時報装置、警報装置、目覚装置などに
用いるPARCOR型音声合成装置の一実施例のブ
ロツク回路図であり、音声、メロデイを圧縮され
た特徴パラメータとして記憶するデータメモリM
を具備した制御用IC(A)と、音声合成用IC(点線部
A、Bを除いた部分)とで構成され、両IC間で
ビツトシリアルにデータの受渡しを行なうように
したものである。ところで、音声の特徴パラメー
タはすべて再生用ROM1内に10ビツトのデータ
として記憶されており、各特徴パラメータに割り
当てられるデータの個数は、その特徴パラメータ
が音質に寄与する度合に応じて最適に配分されて
いる。例えばAパラメータの場合10ビツトで表現
されるデータが32個記憶されている。したがつて
Aパラメータの任意のデータをアクセスするとき
に必要とされる相対アドレスのビツト数は5ビツ
トである。この相対アドレスは特徴パラメータを
必要最小限に圧縮して表現したものであるので圧
縮パラメータと呼ばれる。これに対して再生用
ROM1内に記憶されている実際の特徴パラメー
タは再生パラメータと呼ばれる。上述した所から
明らかなように再生パラメータのビツト数はA、
P、K1〜K10の各特徴パラメータについてすべて
共通に10ビツトであるが、圧縮パラメータのビツ
ト数はA、P、K1〜K10の各パラメータについて
異なるものであり、たとえばそれぞれ5、6、
3、3、3、3、4、4、4、5、6、7ビツト
(合計53ビツト)である。そのほか予備エリアと
して3ビツト分すなわちデータ8個分が再生用
ROM1に確保されている。かかる圧縮パラメー
タは音声信号がほぼ定常状態とみなし得る5〜20
msec(1フレーム)ごとに1組(=53ビツト)抽
出されたものであるから、高々2650ビツト/秒で
データを処理することにより音声信号を再生する
ことができ、無音区間やリピート区間をも考慮に
入れると実際には1600ビツト/秒程度で音声信号
を再生することができるものである。ところで、
実施例にあつては話し言葉のように均一に連続的
に音の高低が変化する音声を合成する場合とメロ
デイ音や歌唱のように離散的に続く音声を合成す
る場合とにおける基本周期発生方式を変更するよ
うになつており、メロデイ音を再生する場合、制
御用IC(A)からデータ入力端子8に入力される圧
縮パラメータのうち圧縮Aパラメータの先頭にメ
ロデイ制御コードを付加し、メロデイ制御コード
検出回路34からメロデイ制御コード検出信号
VMが得られたとき音声−メロデイ切換回路33
をメロデイ側(b側)に切換えて各音階音の基本
周期に等しい基本周期で音源を駆動してメロデイ
音を合成するように構成されている。 以下、実施例の基本構成および動作(人間の声
などを合成する通常の音声合成動作)について説
明する。 いま、圧縮パラメータ(すなわち再生用ROM
1の相対アドレス)は1フレームごとにデータ入
力端子8から切換回路10を介してリングレジス
タ3にビツトシリアルに記憶されるが、このよう
な相対アドレスだけでは再生用ROM1には各パ
ラメータの再生データが連続して記憶してあるの
で、特定のデータを取り出すことができない。そ
こでインデツクスROM2の中に記憶されている
再生ROM中の各パラメータの先頭アドレスをア
ドレスカウンタ11の制御の下に順次取り出し
て、上記相対アドレスと加算回路4によつて加算
することにより再生用ROM1の絶対アドレス
(9ビツト)を計算し、この絶対アドレスによつ
て再生用ROM1をアクセスするようにしてい
る。インデツクスROM2には圧縮パラメータの
ビツト配分数を3ビツトの2進数で記憶させてお
り、この圧縮パラメータのビツト配分数に関する
データは再生制御回路12に送られ、再生制御回
路12は、ビツト配分数だけシフトクロツクをリ
ングレジスタ3に送出する。したがつてリングレ
ジスタ3からは、上記ビツト配分数に応じて例え
ばAパラメータの場合には5ビツト、Pパラメー
タの場合には6ビツト、K10パラメータの場合に
は3ビツト、…K1パラメータの場合には7ビツ
トという具合に圧縮パラメータ(相対アドレス)
をそれぞれ加算回路にシリアルに送出するもので
ある。またインデツクスROM2内に記憶されて
いる各特徴パラメータの再生用ROM1内におけ
る先頭アドレスは、パラレルシリアル変換回路1
3を介して1ビツトづつ順次加算回路4に送出さ
れるので、順次1ビツトづつ加算されて絶対アド
レスが計算されるものである。こうして計算され
たシリアルな絶対アドレスはシリアルパラレル変
換回路14を介してパラレルデータに変換され、
再生用ROM1をアクセスするアドレスに変換さ
れる。 この再生用ROM1から出力される特徴パラメ
ータは1フレームごとに更新されるものである
が、データを更新する際に各フレーム間の接続点
において特徴パラメータが不連続的に変化すると
音声信号に歪みを生じて明瞭度が低下するおそれ
があるので、データ更新の際に特徴パラメータが
スムーズに変化し得るように補間計算回路5を設
けて1フレーム内の8点において近似的な直線的
補間を行なうようにしている。このため、タイミ
ング制御回路28では第2図に示すように1フレ
ーム(20msec)中に8個の補間用Dクロツク
(2.5msec)を発生し、1個のDクロツク中に25
個のパラメータ読込用Pクロツク(100μsec)、さ
らに1個のPクロツク中に22個のビツト読込用T
クロツク(4.5μsec周期)を作成する。なおPク
ロツクはサンプリングパルスに相当する同期パル
スである。8個のDクロツクのうち、最初のD1
においてデータ入力端子8からリングレジスタ3
にデータが読み込まれる。各圧縮パラメータA、
P、K10…、K1は奇数番目のPクロツクで順次読
み込まれるものであり、例えばAパラメータは
P1区間のT6〜T10の5個のTクロツクで読み込ま
れる。偶数番目のPクロツクあるいは上記以外の
Tクロツクは補間計算回路5、音源ROM6、デ
ジタルフイルタ7などのタイミングとして使用さ
れるものである。この補間計算回路5はメロデイ
制御コードが検出されたときにはその動作を停止
する。 上記補間計算回路5によつて2.5msecごとに新
しい値に更新された各特徴パラメータは、それぞ
れPラツチ16、AKラツチ23に一時的に蓄え
られる。ただし、補間計算に差し当り必要のない
パラメータはすべてAKパラメータスタツク24
に転送してデジタルフイルタ7の音声合成用デー
タとして蓄積している。 ところでPラツチ16に蓄えられたPパラメー
タは有声音源19を駆動してPパラメータに対応
する基本周期を有するインパルス信号を発生する
ためのデータであり、メロデイ制御コード検出回
路34から出力が得られておらず、音声−メロデ
イ切換回路33が人間の話し言葉のような音声を
合成する側(a側)に切換えられている場合、サ
ンプリングパルスに等しいPクロツクをカウント
している音源ROM6のアドレスカウンタ18の
リセツト信号はアドレスカウンタ18出力とPラ
ツチ16に蓄えられたPパラメータの一致を検出
する一致回路17の出力となり、アドレスカウン
タ18はPクロツク周期の整数倍(Pパラメー
タ)の周期でリセツトされるようになつている。
したがつて音源ROM6からPパラメータに基い
た有声音源制御データが出力され、有声音源19
にてPパラメータに対応する基本周期(表1に示
すような離散的な音声周波数)を有するインパル
ス信号を発生させる。なお、音声に基本周期がな
い場合には、音源制御回路20にて切換回路22
を駆動し、無声音源21に切換えるようになつて
おり、無声音源21は基本周期を持たないホワイ
トノイズ(白色雑音)を発生させるものである。
次にAパラメータおよびKパラメータはデジタル
フイルタ7に供給され、有声、無声音源より供給
されて、信号に振巾の大小およびスペクトル分布
に関する情報を付け加えることにより音声を再声
するものである。図中25は再生された音声信号
を増巾する低周波アンプ、26はスピーカ、27
は水晶発振回路である。 以下第4図〜第6図に示す音階信号発生回路3
1、リセツトパルス発生回路32の構成およびメ
ロデイ音を合成する音声合成動作について説明す
る。音階信号発生回路31はPパラメータに対応
するデータすなわち制御用IC(A)から出力される
圧縮Pパラメータをリクエスト信号VREによりと
りこむようにしたシフトレジスタ31aと、圧縮
Pパラメータをアドレスデータとして圧縮Pパラ
メータに対応する音階データを読み出すようにし
た音階ROM31bと、音階ROM31bから読
み出された音階データをプリセツト入力としPク
ロツクよりも周波数の高いクロツクパルス例えば
Tクロツクをカウントするプリセツトカウンタ3
1cと、プリセツトカウンタ31cの0検出信号
を反転するインバータ31dとで構成され、クロ
ツクパルスの周期の整数倍(音階データ)の周期
を有する0検出信号を音階信号PMとして出力す
る。この場合、音階信号発生回路31から出力さ
れる音階信号PMの周波数は離散的な値をとるが
離散間隔はクロツクパルスの周波数に応じて小さ
くなる。したがつて音階ROM31bに適当な音
階データを記憶させておくことにより音階信号発
生回路31にて各音階信号の周波数に一致するよ
うな音階信号PMが形成できることになる。例え
ばクロツクパルスをTクロツク(周期4.5μsec)
とし、Pパラメータ「12」に対応する圧縮Pパラ
メータにて音階ROM31bから音階データ
「284」が読み出されるようにすれば、プリセツト
カウンタ31cから4.5×284μsecの周期で0検出
信号が得られ、この音階信号PMはPパラメータ
の「12.8」に相当する基本周期となり、Pパラメ
ータに対応する離散的な基本周期を補間できるこ
とになる。リセツトパルス発生回路32はインバ
ータ35a,35b、コンデンサ36、ナンドゲ
ート37、Dフリツプフロツプ38およびナンド
ゲート39にて形成されており、第7図aのタイ
ムチヤートに示すようにプリセツトカウンタ31
cから出力される音階信号PMが得られた直後の
Pクロツクをアドレスカウンタ18のリセツトパ
ルスVRとして出力するようになつている。なお
図中イはPパラメータが「12」のときの一致回路
17出力、ロは音階信号PM、ハはリセツトパル
スVRを示すものである。 いま制御用IC(A)からメロデイ制御コードが出
力され、メロデイ制御コード検出回路34からメ
ロデイ制御コード検出信号VMが得られている場
合、音声−メロデイ切換回路33はメロデイ側
(b側)に切換えられ、アドレスカウンタ18は
リセツトパルス発生回路から出力されるリセツト
パルスVRにてリセツトされ、アドレスカウンタ
18はPクロツクを13個カウントしてリセツトさ
れる場合と、Pクロツク12個カウントしてリセツ
トされる場合とが、4:1の割合で起きることに
なる。したがつて等価的にPパラメータ「12.8」
に相当する基本周期で音源ROM6がアドレスさ
れ、有声音源19が制御されることになり、音階
音「ソ」が正確に再生されることになる。同様に
して各音階音が正確に再生され、メロデイが正し
い音程で再生される。 第7図bに示すタイムチヤートは音階信号PM
とリセツトパルスVRの関係をさらに分かり易く
説明するもので、例として3.75KHz(267μsec)
の音階信号PMに対応するリセツトパルスVRを示
したものである。図から明きらかなようにリセツ
トパルスVRとしてのPパルスの3、6、8、11、
14、16…番目のパルスが出力される。このリセツ
トパルスVRでリセツトされるアドレスカウンタ
18による音源ROM6がアドレスされるので、
音源ROM6から等価的に3.75KHz(800/3μsec) とみなせる周期で有声音源データが読み出される
ことになり、有声音源19が正しい音階周波数で
駆動されてメロデイ音や歌唱などの音声が正確な
音程で再生されることになる。なお実施例にあつ
ては圧縮パラメータを音階ROM31bのアドレ
スデータとしているが、Pラツチ16に蓄えられ
たPパラメータを音階ROM31bのアドレスと
して用いても良い。 本発明は上述のように音声信号を音声周波数よ
りも高い周波数のサンプリングパルスにてサンプ
リングし、振巾パラメータ、ピツチパラメータお
よびスペクトルパラメータよりなる特徴パラメー
タを抽出してデータメモリに記憶させ、データメ
モリから読み出された特徴パラメータに基いて音
源を制御して音声を合成するようにした音声合成
装置において、話し言葉のように均一に連続的に
音の高低が変化するような音声を合成する場合
と、メロデイ音や歌唱のように離散的に続く音声
を合成する場合とでピツチパラメータに基いて設
定される音源駆動周期を変更するようになつてお
り、メロデイ音を再生する場合には、音階信号発
生回路にてピツチパラメータに対応する音階信号
(音階音の基本周期に略一致した)を発生させ、
この音階信号に基いて音源を駆動する基本周期を
設定するようになつているので、再生されたメロ
デイ音の音程のずれを使用上、差支えのない程度
に小さくすることができ、しかもアドレスカウン
タ、音源ROM、音源などの音声合成回路の回路
構成およびビツト構成を変更する必要がないとい
う利点をもつている。
くとも人間の声などは比較的忠実に再生できる。
しかしながら音階周波数で構成されたメロデイ音
を再生する場合、各音階(ド、レ、ミ…)の音階
周波数は表1に示すように上記離散値に含まれて
いないものが多く、メロデイ音をこのような離散
的な音声周波数を用いて再生すれば著しく音程の
ずれたメロデイ音が再生されるという問題があつ
た。本発明は上記問題点を解決することを目的と
するものである。 以下PARCOR型音声合成装置の一実施例につ
いて図を用いて説明する。PARCOR型音声合成
方式は第1図に示すように音声信号VSをサンプ
リングパルスにより適当周期toでサンプリング
し、サンプリングされたサンプリング値Xtと
Xt-pの間にある(P−1)個のサンプリング値に
よる相関関係を除外し、XtとXt-pとの相関関係
のみを抽出したPARCOR係数(部分自己相関係
数:以下Kパラメータと略称する)をSパラメー
タとして音声を合成するものであり、Kパラメー
タは音声がほぼ定常状態とみなせる1フレーム
(5〜20msec)において、適当周期to(約
100μsec)毎に音声信号VSのサンプリングを行な
い、隣り合うサンプル値間の相関係数をK1とし、
複数間隔離されたサンプル値間では、その間に挾
まれたサンプル値による影響を最小2乗誤差によ
る線形予測によつて求め、それらを差引いてでき
る相関係数をK2〜Koとしたものである。このK
パラメータはK1、K2、K3のようにXtに近い点と
の部分自己相関関係を表わす係数にはスペクトル
分布に関する情報が豊富に含まれているが、K8、
K9、K10のようなXtから遠い点との部分自己相関
係数にはスペクトル分布に関する情報があまり含
まれていないので、低次のKパラメータに多数の
量子化ビツトを割り当て、高次のKパラメータに
は少数の量子化ビツトを割り当てることによりビ
ツト数を節減して冗長度を小さくするほうが効果
的である。したがつてPARCOR方式はSパラメ
ータとして自己相関係数を用いて各係数に同一ビ
ツト数を割り当てるようにした自己相関係数方式
に比べて帯域圧縮率がすぐれているものである。
通常各A、P、Kパラメータは圧縮されて記憶あ
るいは伝送され、Aパラメータに対して5ビツ
ト、Pパラメータに対して6ビツト、Kパラメー
タの各係数K1、K2…K10に対して7、6、5、
4、4、4、3、3、3、3ビツト等のように割
り当てる。 第2図は時報装置、警報装置、目覚装置などに
用いるPARCOR型音声合成装置の一実施例のブ
ロツク回路図であり、音声、メロデイを圧縮され
た特徴パラメータとして記憶するデータメモリM
を具備した制御用IC(A)と、音声合成用IC(点線部
A、Bを除いた部分)とで構成され、両IC間で
ビツトシリアルにデータの受渡しを行なうように
したものである。ところで、音声の特徴パラメー
タはすべて再生用ROM1内に10ビツトのデータ
として記憶されており、各特徴パラメータに割り
当てられるデータの個数は、その特徴パラメータ
が音質に寄与する度合に応じて最適に配分されて
いる。例えばAパラメータの場合10ビツトで表現
されるデータが32個記憶されている。したがつて
Aパラメータの任意のデータをアクセスするとき
に必要とされる相対アドレスのビツト数は5ビツ
トである。この相対アドレスは特徴パラメータを
必要最小限に圧縮して表現したものであるので圧
縮パラメータと呼ばれる。これに対して再生用
ROM1内に記憶されている実際の特徴パラメー
タは再生パラメータと呼ばれる。上述した所から
明らかなように再生パラメータのビツト数はA、
P、K1〜K10の各特徴パラメータについてすべて
共通に10ビツトであるが、圧縮パラメータのビツ
ト数はA、P、K1〜K10の各パラメータについて
異なるものであり、たとえばそれぞれ5、6、
3、3、3、3、4、4、4、5、6、7ビツト
(合計53ビツト)である。そのほか予備エリアと
して3ビツト分すなわちデータ8個分が再生用
ROM1に確保されている。かかる圧縮パラメー
タは音声信号がほぼ定常状態とみなし得る5〜20
msec(1フレーム)ごとに1組(=53ビツト)抽
出されたものであるから、高々2650ビツト/秒で
データを処理することにより音声信号を再生する
ことができ、無音区間やリピート区間をも考慮に
入れると実際には1600ビツト/秒程度で音声信号
を再生することができるものである。ところで、
実施例にあつては話し言葉のように均一に連続的
に音の高低が変化する音声を合成する場合とメロ
デイ音や歌唱のように離散的に続く音声を合成す
る場合とにおける基本周期発生方式を変更するよ
うになつており、メロデイ音を再生する場合、制
御用IC(A)からデータ入力端子8に入力される圧
縮パラメータのうち圧縮Aパラメータの先頭にメ
ロデイ制御コードを付加し、メロデイ制御コード
検出回路34からメロデイ制御コード検出信号
VMが得られたとき音声−メロデイ切換回路33
をメロデイ側(b側)に切換えて各音階音の基本
周期に等しい基本周期で音源を駆動してメロデイ
音を合成するように構成されている。 以下、実施例の基本構成および動作(人間の声
などを合成する通常の音声合成動作)について説
明する。 いま、圧縮パラメータ(すなわち再生用ROM
1の相対アドレス)は1フレームごとにデータ入
力端子8から切換回路10を介してリングレジス
タ3にビツトシリアルに記憶されるが、このよう
な相対アドレスだけでは再生用ROM1には各パ
ラメータの再生データが連続して記憶してあるの
で、特定のデータを取り出すことができない。そ
こでインデツクスROM2の中に記憶されている
再生ROM中の各パラメータの先頭アドレスをア
ドレスカウンタ11の制御の下に順次取り出し
て、上記相対アドレスと加算回路4によつて加算
することにより再生用ROM1の絶対アドレス
(9ビツト)を計算し、この絶対アドレスによつ
て再生用ROM1をアクセスするようにしてい
る。インデツクスROM2には圧縮パラメータの
ビツト配分数を3ビツトの2進数で記憶させてお
り、この圧縮パラメータのビツト配分数に関する
データは再生制御回路12に送られ、再生制御回
路12は、ビツト配分数だけシフトクロツクをリ
ングレジスタ3に送出する。したがつてリングレ
ジスタ3からは、上記ビツト配分数に応じて例え
ばAパラメータの場合には5ビツト、Pパラメー
タの場合には6ビツト、K10パラメータの場合に
は3ビツト、…K1パラメータの場合には7ビツ
トという具合に圧縮パラメータ(相対アドレス)
をそれぞれ加算回路にシリアルに送出するもので
ある。またインデツクスROM2内に記憶されて
いる各特徴パラメータの再生用ROM1内におけ
る先頭アドレスは、パラレルシリアル変換回路1
3を介して1ビツトづつ順次加算回路4に送出さ
れるので、順次1ビツトづつ加算されて絶対アド
レスが計算されるものである。こうして計算され
たシリアルな絶対アドレスはシリアルパラレル変
換回路14を介してパラレルデータに変換され、
再生用ROM1をアクセスするアドレスに変換さ
れる。 この再生用ROM1から出力される特徴パラメ
ータは1フレームごとに更新されるものである
が、データを更新する際に各フレーム間の接続点
において特徴パラメータが不連続的に変化すると
音声信号に歪みを生じて明瞭度が低下するおそれ
があるので、データ更新の際に特徴パラメータが
スムーズに変化し得るように補間計算回路5を設
けて1フレーム内の8点において近似的な直線的
補間を行なうようにしている。このため、タイミ
ング制御回路28では第2図に示すように1フレ
ーム(20msec)中に8個の補間用Dクロツク
(2.5msec)を発生し、1個のDクロツク中に25
個のパラメータ読込用Pクロツク(100μsec)、さ
らに1個のPクロツク中に22個のビツト読込用T
クロツク(4.5μsec周期)を作成する。なおPク
ロツクはサンプリングパルスに相当する同期パル
スである。8個のDクロツクのうち、最初のD1
においてデータ入力端子8からリングレジスタ3
にデータが読み込まれる。各圧縮パラメータA、
P、K10…、K1は奇数番目のPクロツクで順次読
み込まれるものであり、例えばAパラメータは
P1区間のT6〜T10の5個のTクロツクで読み込ま
れる。偶数番目のPクロツクあるいは上記以外の
Tクロツクは補間計算回路5、音源ROM6、デ
ジタルフイルタ7などのタイミングとして使用さ
れるものである。この補間計算回路5はメロデイ
制御コードが検出されたときにはその動作を停止
する。 上記補間計算回路5によつて2.5msecごとに新
しい値に更新された各特徴パラメータは、それぞ
れPラツチ16、AKラツチ23に一時的に蓄え
られる。ただし、補間計算に差し当り必要のない
パラメータはすべてAKパラメータスタツク24
に転送してデジタルフイルタ7の音声合成用デー
タとして蓄積している。 ところでPラツチ16に蓄えられたPパラメー
タは有声音源19を駆動してPパラメータに対応
する基本周期を有するインパルス信号を発生する
ためのデータであり、メロデイ制御コード検出回
路34から出力が得られておらず、音声−メロデ
イ切換回路33が人間の話し言葉のような音声を
合成する側(a側)に切換えられている場合、サ
ンプリングパルスに等しいPクロツクをカウント
している音源ROM6のアドレスカウンタ18の
リセツト信号はアドレスカウンタ18出力とPラ
ツチ16に蓄えられたPパラメータの一致を検出
する一致回路17の出力となり、アドレスカウン
タ18はPクロツク周期の整数倍(Pパラメー
タ)の周期でリセツトされるようになつている。
したがつて音源ROM6からPパラメータに基い
た有声音源制御データが出力され、有声音源19
にてPパラメータに対応する基本周期(表1に示
すような離散的な音声周波数)を有するインパル
ス信号を発生させる。なお、音声に基本周期がな
い場合には、音源制御回路20にて切換回路22
を駆動し、無声音源21に切換えるようになつて
おり、無声音源21は基本周期を持たないホワイ
トノイズ(白色雑音)を発生させるものである。
次にAパラメータおよびKパラメータはデジタル
フイルタ7に供給され、有声、無声音源より供給
されて、信号に振巾の大小およびスペクトル分布
に関する情報を付け加えることにより音声を再声
するものである。図中25は再生された音声信号
を増巾する低周波アンプ、26はスピーカ、27
は水晶発振回路である。 以下第4図〜第6図に示す音階信号発生回路3
1、リセツトパルス発生回路32の構成およびメ
ロデイ音を合成する音声合成動作について説明す
る。音階信号発生回路31はPパラメータに対応
するデータすなわち制御用IC(A)から出力される
圧縮Pパラメータをリクエスト信号VREによりと
りこむようにしたシフトレジスタ31aと、圧縮
Pパラメータをアドレスデータとして圧縮Pパラ
メータに対応する音階データを読み出すようにし
た音階ROM31bと、音階ROM31bから読
み出された音階データをプリセツト入力としPク
ロツクよりも周波数の高いクロツクパルス例えば
Tクロツクをカウントするプリセツトカウンタ3
1cと、プリセツトカウンタ31cの0検出信号
を反転するインバータ31dとで構成され、クロ
ツクパルスの周期の整数倍(音階データ)の周期
を有する0検出信号を音階信号PMとして出力す
る。この場合、音階信号発生回路31から出力さ
れる音階信号PMの周波数は離散的な値をとるが
離散間隔はクロツクパルスの周波数に応じて小さ
くなる。したがつて音階ROM31bに適当な音
階データを記憶させておくことにより音階信号発
生回路31にて各音階信号の周波数に一致するよ
うな音階信号PMが形成できることになる。例え
ばクロツクパルスをTクロツク(周期4.5μsec)
とし、Pパラメータ「12」に対応する圧縮Pパラ
メータにて音階ROM31bから音階データ
「284」が読み出されるようにすれば、プリセツト
カウンタ31cから4.5×284μsecの周期で0検出
信号が得られ、この音階信号PMはPパラメータ
の「12.8」に相当する基本周期となり、Pパラメ
ータに対応する離散的な基本周期を補間できるこ
とになる。リセツトパルス発生回路32はインバ
ータ35a,35b、コンデンサ36、ナンドゲ
ート37、Dフリツプフロツプ38およびナンド
ゲート39にて形成されており、第7図aのタイ
ムチヤートに示すようにプリセツトカウンタ31
cから出力される音階信号PMが得られた直後の
Pクロツクをアドレスカウンタ18のリセツトパ
ルスVRとして出力するようになつている。なお
図中イはPパラメータが「12」のときの一致回路
17出力、ロは音階信号PM、ハはリセツトパル
スVRを示すものである。 いま制御用IC(A)からメロデイ制御コードが出
力され、メロデイ制御コード検出回路34からメ
ロデイ制御コード検出信号VMが得られている場
合、音声−メロデイ切換回路33はメロデイ側
(b側)に切換えられ、アドレスカウンタ18は
リセツトパルス発生回路から出力されるリセツト
パルスVRにてリセツトされ、アドレスカウンタ
18はPクロツクを13個カウントしてリセツトさ
れる場合と、Pクロツク12個カウントしてリセツ
トされる場合とが、4:1の割合で起きることに
なる。したがつて等価的にPパラメータ「12.8」
に相当する基本周期で音源ROM6がアドレスさ
れ、有声音源19が制御されることになり、音階
音「ソ」が正確に再生されることになる。同様に
して各音階音が正確に再生され、メロデイが正し
い音程で再生される。 第7図bに示すタイムチヤートは音階信号PM
とリセツトパルスVRの関係をさらに分かり易く
説明するもので、例として3.75KHz(267μsec)
の音階信号PMに対応するリセツトパルスVRを示
したものである。図から明きらかなようにリセツ
トパルスVRとしてのPパルスの3、6、8、11、
14、16…番目のパルスが出力される。このリセツ
トパルスVRでリセツトされるアドレスカウンタ
18による音源ROM6がアドレスされるので、
音源ROM6から等価的に3.75KHz(800/3μsec) とみなせる周期で有声音源データが読み出される
ことになり、有声音源19が正しい音階周波数で
駆動されてメロデイ音や歌唱などの音声が正確な
音程で再生されることになる。なお実施例にあつ
ては圧縮パラメータを音階ROM31bのアドレ
スデータとしているが、Pラツチ16に蓄えられ
たPパラメータを音階ROM31bのアドレスと
して用いても良い。 本発明は上述のように音声信号を音声周波数よ
りも高い周波数のサンプリングパルスにてサンプ
リングし、振巾パラメータ、ピツチパラメータお
よびスペクトルパラメータよりなる特徴パラメー
タを抽出してデータメモリに記憶させ、データメ
モリから読み出された特徴パラメータに基いて音
源を制御して音声を合成するようにした音声合成
装置において、話し言葉のように均一に連続的に
音の高低が変化するような音声を合成する場合
と、メロデイ音や歌唱のように離散的に続く音声
を合成する場合とでピツチパラメータに基いて設
定される音源駆動周期を変更するようになつてお
り、メロデイ音を再生する場合には、音階信号発
生回路にてピツチパラメータに対応する音階信号
(音階音の基本周期に略一致した)を発生させ、
この音階信号に基いて音源を駆動する基本周期を
設定するようになつているので、再生されたメロ
デイ音の音程のずれを使用上、差支えのない程度
に小さくすることができ、しかもアドレスカウン
タ、音源ROM、音源などの音声合成回路の回路
構成およびビツト構成を変更する必要がないとい
う利点をもつている。
第1図は本発明一実施例の音声合成方式の原理
説明図、第2図は同上のブロツク回路図、第3図
は同上の動作説明図、第4図〜第6図は同上の要
部回路図、第7図a,bは同上の動作説明図であ
る。 Mはデータメモリ、6は音源ROM、17は一
致回路、18はアドレスカウンタ、19は音源、
31は音階信号発生回路、31bは音源ROM、
31cはプリセツトカウンタ、32はリセツトパ
ルス発生回路、33は音声−メロデイ切換回路、
34はメロデイ制御コード検出回路である。
説明図、第2図は同上のブロツク回路図、第3図
は同上の動作説明図、第4図〜第6図は同上の要
部回路図、第7図a,bは同上の動作説明図であ
る。 Mはデータメモリ、6は音源ROM、17は一
致回路、18はアドレスカウンタ、19は音源、
31は音階信号発生回路、31bは音源ROM、
31cはプリセツトカウンタ、32はリセツトパ
ルス発生回路、33は音声−メロデイ切換回路、
34はメロデイ制御コード検出回路である。
Claims (1)
- 【特許請求の範囲】 1 音声信号を音声周波数よりも高い周波数のサ
ンプリングパルスにてサンプリングし、振巾パラ
メータ、ピツチパラメータおよびスペクトルパラ
メータよりなる特徴パラメータを抽出してデータ
メモリに記憶させ、データメモリから読み出され
た特徴パラメータに基いて音源を制御して音声を
合成するようにした音声合成装置において、サン
プリングパルスと等しい周期の同期パルスをカウ
ントして音源ROMから音源データを読み出すア
ドレスカウンタの値がピツチパラメータに一致し
たとき一致信号を出力する一致回路と、ピツチパ
ラメータに対応したアドレスデータにより記憶さ
れている音階データを読み出すようにした音階
ROMおよび音階データをプリセツト入力とし同
期パルスよりも周波数の高いクロツクパルスを減
数カウントするプリセツトカウンタよりなる音階
発生回路と、プリセツトカウンタの0検出信号よ
りなる音階信号が得られた直後の同期パルスを出
力するリセツトパルス発生回路と、アドレスカウ
ンタのリセツト信号をリセツトパルス発生回路出
力あるいは一致回路出力に切換える音声−メロデ
イ切換回路とを設け、話し言葉のように均一に連
続的に音の高低が変化する様な音声を合成する場
合にはアドレスカウンタを一致回路出力にてリセ
ツトし、メロデイ音や歌唱のように離散的に続く
音声を合成する場合にはアドレスカウンタをリセ
ツトパルス発生回路出力にてリセツトして音源デ
ータを繰り返して使用するようにしたことを特徴
とする音声合成装置。 2 振巾パラメータに付加されたメロデイ制御コ
ードを検出するメロデイ制御コード検出回路を設
け、メロデイ制御コード検出回路出力にて音声−
メロデイ切換回路を制御するようにしたことを特
徴とする特許請求の範囲第1項記載の音声合成装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56069950A JPS57185099A (en) | 1981-05-09 | 1981-05-09 | Voice synthesizer |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56069950A JPS57185099A (en) | 1981-05-09 | 1981-05-09 | Voice synthesizer |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS57185099A JPS57185099A (en) | 1982-11-15 |
| JPH0141999B2 true JPH0141999B2 (ja) | 1989-09-08 |
Family
ID=13417437
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56069950A Granted JPS57185099A (en) | 1981-05-09 | 1981-05-09 | Voice synthesizer |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS57185099A (ja) |
-
1981
- 1981-05-09 JP JP56069950A patent/JPS57185099A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS57185099A (en) | 1982-11-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5321794A (en) | Voice synthesizing apparatus and method and apparatus and method used as part of a voice synthesizing apparatus and method | |
| JPH0141999B2 (ja) | ||
| JPS60100199A (ja) | 電子楽器 | |
| JPH0142000B2 (ja) | ||
| JPH0325799B2 (ja) | ||
| JPS6036600B2 (ja) | 音声合成装置 | |
| JP2797644B2 (ja) | 発声機能付きカラオケ装置 | |
| JPS6040636B2 (ja) | 音声合成装置 | |
| JPS6040633B2 (ja) | 無声破裂音源付きの音声合成装置 | |
| JPS62102294A (ja) | 音声符号化方式 | |
| JPS608520B2 (ja) | メロデイ音合成兼用の音声合成装置 | |
| EP0396141A2 (en) | System for and method of synthesizing singing in real time | |
| JPH035600B2 (ja) | ||
| JPS6040639B2 (ja) | 多重音声合成システム | |
| JPS59176782A (ja) | デジタル音響装置 | |
| JPS6040640B2 (ja) | 多重音声合成システム | |
| JPS6040635B2 (ja) | 音声合成装置 | |
| JPS6036597B2 (ja) | 音声合成装置 | |
| JPH02192259A (ja) | デジタル音楽情報の出力装置 | |
| RU2669U1 (ru) | Устройство формирования звукового сигнала | |
| JPS5949599B2 (ja) | メロデイ音合成兼用の音声合成装置 | |
| JPS6040637B2 (ja) | 音声合成装置 | |
| JPH043558B2 (ja) | ||
| JPH0664477B2 (ja) | 音声合成装置 | |
| JPS61100796A (ja) | 楽音信号発生装置 |