JPS587200A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPS587200A JPS587200A JP56105379A JP10537981A JPS587200A JP S587200 A JPS587200 A JP S587200A JP 56105379 A JP56105379 A JP 56105379A JP 10537981 A JP10537981 A JP 10537981A JP S587200 A JPS587200 A JP S587200A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- speech synthesis
- storage means
- bits
- storage device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、音声合成装置に係り、更に詳しくは音声合成
に使用される音声情報の圧縮を実現するための音声合成
装置に関するものである。
に使用される音声情報の圧縮を実現するための音声合成
装置に関するものである。
従来、効率的な音声情報圧縮を実現する音声合成方式と
しては、音声が一定時間内でほぼ定常的であることに着
目し、このフレームと呼ばれる一定時間を音声情報を持
つ一組の特徴パラメータで表現する方法が知られている
。
しては、音声が一定時間内でほぼ定常的であることに着
目し、このフレームと呼ばれる一定時間を音声情報を持
つ一組の特徴パラメータで表現する方法が知られている
。
第1図はその代表的な方式であるP/…COR方式の一
例を示すもので、フレーム長を20ミリセカンドとし1
フレームをアンプ、ピッチl K1’、 K21・・・
に、の計10個の特徴パラメータで表現していて、その
ビット配分はそれぞれ6.6.7.5.5.5.4.4
.3.6で1フレーム当り48ビツトを要し、1秒間の
音声としては240Oビツトである。
例を示すもので、フレーム長を20ミリセカンドとし1
フレームをアンプ、ピッチl K1’、 K21・・・
に、の計10個の特徴パラメータで表現していて、その
ビット配分はそれぞれ6.6.7.5.5.5.4.4
.3.6で1フレーム当り48ビツトを要し、1秒間の
音声としては240Oビツトである。
これらの特徴パラメータはPARCOFt分析で得られ
た値を符号化して得られるが、その符号化は第1には上
記のビット数では十分な精度が得られないこと、第2に
はパラメータの分布が第2図で示す様に均一でないこと
によりテーブルを用いて非線形に行われる。
た値を符号化して得られるが、その符号化は第1には上
記のビット数では十分な精度が得られないこと、第2に
はパラメータの分布が第2図で示す様に均一でないこと
によりテーブルを用いて非線形に行われる。
第5図(aL(b)はそれぞれピッチとに1のパラメー
タの変換テーブルを示す。
タの変換テーブルを示す。
ここで4フレームの間を定常状態とみなす根拠は、音声
発生の金管である声帯、舌、あご、くちびる等がその物
理的な制約からそれほど大きな速度では動き得ないとい
う事実に起因するが、同じ理由で隣接するフレーム間で
同一パラメータの変化を考えた1易合、その変化は小さ
く変化を表現するにはそのパラメータに配分されたビッ
ト数を全部必要としない場合が多い。
発生の金管である声帯、舌、あご、くちびる等がその物
理的な制約からそれほど大きな速度では動き得ないとい
う事実に起因するが、同じ理由で隣接するフレーム間で
同一パラメータの変化を考えた1易合、その変化は小さ
く変化を表現するにはそのパラメータに配分されたビッ
ト数を全部必要としない場合が多い。
本発明は、上記の点を鑑みなされたもので、音声合成の
ための音声情報の効果的な圧縮ができ、しかも安価な音
声合成装置を提供することを目的とする。
ための音声情報の効果的な圧縮ができ、しかも安価な音
声合成装置を提供することを目的とする。
以下、本発明の一実施例を図面に従って説明する。第4
図は、本発明の一実施例である音声合成装置の構成を示
すブロック図で、1は音声出力要求及びアドレス情報を
入力するための入力端子で、この入力端子1から入力さ
れたアドレス情報に従って中央演算装置2は、音声情報
を特徴パラメータで格納している記憶装置6から特徴パ
ラメータを呼出し、この呼出した特徴パラメータを一時
記憶する補助記憶装置4に格納した後、音声合成器であ
るPARC9R合成器5に送って起動をかける。
図は、本発明の一実施例である音声合成装置の構成を示
すブロック図で、1は音声出力要求及びアドレス情報を
入力するための入力端子で、この入力端子1から入力さ
れたアドレス情報に従って中央演算装置2は、音声情報
を特徴パラメータで格納している記憶装置6から特徴パ
ラメータを呼出し、この呼出した特徴パラメータを一時
記憶する補助記憶装置4に格納した後、音声合成器であ
るPARC9R合成器5に送って起動をかける。
次に、PARCOR合成器5からの要求で、中央演算装
置2は記憶装置6から符号化されて格納されている次の
特徴パラメータの変化値を呼出し、補助記憶装置4に記
憶されている前回の呼出された特徴パラメータと加算し
た結果を補助記憶装置4に格納すると共にPAF(CO
R合成器5に送る。PARCOR合成器5では、中央演
算装置2がら送出されてきた加算結果である特徴バラメ
ークを複合化して音声合成を行い、デジタル−アナログ
変換器乙に送出してデジタル信号であるその結果をアナ
ログ信号に変換する。そのアナログ信号は増幅器7で増
幅され、スピーカー8から音声として出力される。
置2は記憶装置6から符号化されて格納されている次の
特徴パラメータの変化値を呼出し、補助記憶装置4に記
憶されている前回の呼出された特徴パラメータと加算し
た結果を補助記憶装置4に格納すると共にPAF(CO
R合成器5に送る。PARCOR合成器5では、中央演
算装置2がら送出されてきた加算結果である特徴バラメ
ークを複合化して音声合成を行い、デジタル−アナログ
変換器乙に送出してデジタル信号であるその結果をアナ
ログ信号に変換する。そのアナログ信号は増幅器7で増
幅され、スピーカー8から音声として出力される。
上記に示した記憶装置13上には第5図で示すような音
声情報が上記特徴パラメータの変化値として符号化され
格納されているが、その中でアドレス000に格納され
ている音声1ゼロ”を例に取りこの符号化の過程を次に
説明する。
声情報が上記特徴パラメータの変化値として符号化され
格納されているが、その中でアドレス000に格納され
ている音声1ゼロ”を例に取りこの符号化の過程を次に
説明する。
第6図(a)は本発明で使用している日本人女声1ゼμ
”のピッチとKlパラメータに関する実データである。
”のピッチとKlパラメータに関する実データである。
これらを第5図(a)(b)の変換テーブルにより符号
化し、更に直前フレームからの符号の変化として求めた
ものが第6図(b)である。
化し、更に直前フレームからの符号の変化として求めた
ものが第6図(b)である。
第6図(b)より知られるように、ここで取り上げた2
つのパラメータの変化の範囲はピッチが−6〜0〜+6
でに1が−28〜0〜+27であり、この変化分を表現
するのに要するビット数はそれぞれ4ビツト及び6ビツ
トで第1図に示した従来技術より計6ビツトの情報圧縮
が可能である。
つのパラメータの変化の範囲はピッチが−6〜0〜+6
でに1が−28〜0〜+27であり、この変化分を表現
するのに要するビット数はそれぞれ4ビツト及び6ビツ
トで第1図に示した従来技術より計6ビツトの情報圧縮
が可能である。
上記の圧縮はビット配分の比較的大きなアンプ。
K、、 K、、 K、についても適用可能で、最終的な
圧縮されたビット配分はアンプ、ピッチr KI HK
、l 、e・・に自についてそれぞれ5.4.6.4.
4.4.4.4.3.3の計41ビットである。
圧縮されたビット配分はアンプ、ピッチr KI HK
、l 、e・・に自についてそれぞれ5.4.6.4.
4.4.4.4.3.3の計41ビットである。
以上の結果に基づいて音声9ゼロ”のビット配列を示さ
ば第7図のごとくである。
ば第7図のごとくである。
即ち、第1フレームは初期値として第1図で示すビット
配分をそのまま使用するが、第27レーム以降は上記圧
縮されたビット配分を使用、最後のエンドマークとして
用いているアンプの最大値も圧縮されたビット数を使用
している。
配分をそのまま使用するが、第27レーム以降は上記圧
縮されたビット配分を使用、最後のエンドマークとして
用いているアンプの最大値も圧縮されたビット数を使用
している。
このビット圧縮の結果型する全ビット数は48X1 +
41 X16+5−709計709ビツトとなり従来技
術が 48X17+、!S−822 計822ビットであるから 709÷822−0.862・・・ 約14%のメモリ効率上Mが得られる。
41 X16+5−709計709ビツトとなり従来技
術が 48X17+、!S−822 計822ビットであるから 709÷822−0.862・・・ 約14%のメモリ効率上Mが得られる。
最後に第7図のビット配列による音声1ゼロ”の合成手
順についてXi)明する。
順についてXi)明する。
1)入力端子1からの音声6ゼロ”出力要求により中央
演算装置2は記憶装置i 5のアドレスOo。
演算装置2は記憶装置i 5のアドレスOo。
カラフレーム1の10個のパラメータを取り出し、補助
記憶装置4に格納した後pkRcoR合成器5に送り起
動をかける。
記憶装置4に格納した後pkRcoR合成器5に送り起
動をかける。
+I) PARCOR合成器5からの要求により中央
演算装置2は記憶装置i¥6から次のフレーム用の10
個のパラメータを取り出し、上記補助記憶装置4に格納
された10個の値にそれぞれ加算して結果を補助記憶装
置¥14に格納した後PARCOR合成器5に送る。
演算装置2は記憶装置i¥6から次のフレーム用の10
個のパラメータを取り出し、上記補助記憶装置4に格納
された10個の値にそれぞれ加算して結果を補助記憶装
置¥14に格納した後PARCOR合成器5に送る。
l11) エンドマークを取り出すまで11)をくり
かえす。
かえす。
肋 エンドマークをPABCOR合成器5に送り終了す
る。
る。
なお、本実施例ではPAECOR型音声合成式に関して
説明したが、本発明はそれになんら限定されることなく
音声を表現する特徴lくラメータを使用する合成方式で
あればその全てに適用が可能である。
説明したが、本発明はそれになんら限定されることなく
音声を表現する特徴lくラメータを使用する合成方式で
あればその全てに適用が可能である。
以上で説明したように本発明によれば、符号化された特
徴パラメータを隣接する特徴ノ(ラメータの差を取って
符号化することによって、効率的な音声情報圧縮を実現
することができる音声合成装置を提供することができる
。
徴パラメータを隣接する特徴ノ(ラメータの差を取って
符号化することによって、効率的な音声情報圧縮を実現
することができる音声合成装置を提供することができる
。
第1図は、PARCOR合成器の各パラメータとそのビ
ット配分を示す図、第2図は、第1図に示したKlパラ
メータの分布図、第3図は、PAF(COR合成器用の
変換テーブルを示す図、第4図は、本発明による音声合
成装置の構成を示すブロック図、第5.4よ、8.憶装
置□内い格に!’a tl”Cい、音声デ。 を示す図、第6図は、音声゛ゼロ”のピッチとに1の特
徴パラメータに関する実データ及び符号の変化を示す図
、第7図は、音声”ゼロ”のビット配列を示す図であり
、1は入力端子、2は中央演算装置、5は記憶、け装置
WLs4は補助記憶装置、5はPARCOR合戊器、6
はD/A変換器、7は増幅器、8はスピーカーである。 出願人 キャノン株式会社
ット配分を示す図、第2図は、第1図に示したKlパラ
メータの分布図、第3図は、PAF(COR合成器用の
変換テーブルを示す図、第4図は、本発明による音声合
成装置の構成を示すブロック図、第5.4よ、8.憶装
置□内い格に!’a tl”Cい、音声デ。 を示す図、第6図は、音声゛ゼロ”のピッチとに1の特
徴パラメータに関する実データ及び符号の変化を示す図
、第7図は、音声”ゼロ”のビット配列を示す図であり
、1は入力端子、2は中央演算装置、5は記憶、け装置
WLs4は補助記憶装置、5はPARCOR合戊器、6
はD/A変換器、7は増幅器、8はスピーカーである。 出願人 キャノン株式会社
Claims (1)
- 【特許請求の範囲】 音声を表現する音声情報として特徴パラメータを用いて
音声合成を行う音声合成装置において、 音声合成に使用される前記特徴パラメータを記憶する第
1記憶手段と、前記第1記憶手段に記憶された特徴パラ
メータからの変化値を記憶する第2記憶手段を設け、 前記第1記憶手段に記憶された前記特徴パラメータと前
記第2記憶手段に記憶された前記変化値とを演算処理と
して得た特徴パラメータを次なる音声合成の情報とした
ことを特徴とする音声合成装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56105379A JPS587200A (ja) | 1981-07-06 | 1981-07-06 | 音声合成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56105379A JPS587200A (ja) | 1981-07-06 | 1981-07-06 | 音声合成装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS587200A true JPS587200A (ja) | 1983-01-14 |
Family
ID=14406041
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56105379A Pending JPS587200A (ja) | 1981-07-06 | 1981-07-06 | 音声合成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS587200A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010147739A (ja) * | 2008-12-18 | 2010-07-01 | Kiichi Kosugi | 補聴用集音器 |
-
1981
- 1981-07-06 JP JP56105379A patent/JPS587200A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010147739A (ja) * | 2008-12-18 | 2010-07-01 | Kiichi Kosugi | 補聴用集音器 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US3803358A (en) | Voice synthesizer with digitally stored data which has a non-linear relationship to the original input data | |
| US6480550B1 (en) | Method of compressing an analogue signal | |
| JPH05344003A (ja) | データ圧縮回路 | |
| JPS587200A (ja) | 音声合成装置 | |
| US4890326A (en) | Method for compressing data | |
| US4601052A (en) | Voice analysis composing method | |
| JPH02127899A (ja) | 複数チャンネルの信号圧縮方法 | |
| US5739778A (en) | Digital data formatting/deformatting circuits | |
| JPS5876896A (ja) | 音声合成装置 | |
| US20060069565A1 (en) | Compressed data processing apparatus and method and compressed data processing program | |
| JPS58197918A (ja) | 適応差分復号器 | |
| JPS5968793A (ja) | 音声合成装置 | |
| JPS62183627A (ja) | デジタルデ−タの処理方式 | |
| JP2900078B2 (ja) | 波形記録・再生法及び波形再生装置 | |
| US6285303B1 (en) | Gate table data compression and recovery process | |
| JP2900076B2 (ja) | 波形生成装置 | |
| JPH0482419A (ja) | オーディオ信号符号化装置 | |
| JPS5977498A (ja) | 音声特徴パラメータの圧縮装置 | |
| JPS6117200A (ja) | 音声分析合成方法および装置 | |
| JPS6117197A (ja) | 音声分析合成方法および装置 | |
| JPS62159198A (ja) | 音声合成方式 | |
| JPH1152996A (ja) | データ圧縮装置およびデータ伸長装置 | |
| JPS59125798A (ja) | 音声合成装置 | |
| JPH0426895A (ja) | 楽音信号発生装置 | |
| JPS59226397A (ja) | 音声応答装置 |