JPS587200A

JPS587200A - 音声合成装置

Info

Publication number: JPS587200A
Application number: JP56105379A
Authority: JP
Inventors: 桜井　穆
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1981-07-06
Filing date: 1981-07-06
Publication date: 1983-01-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は、音声合成装置に係り、更に詳しくは音声合成
に使用される音声情報の圧縮を実現するための音声合成
装置に関するものである。

従来、効率的な音声情報圧縮を実現する音声合成方式と
しては、音声が一定時間内でほぼ定常的であることに着
目し、このフレームと呼ばれる一定時間を音声情報を持
つ一組の特徴パラメータで表現する方法が知られている
。

第１図はその代表的な方式であるＰ／…ＣＯＲ方式の一
例を示すもので、フレーム長を２０ミリセカンドとし１
フレームをアンプ、ピッチｌ　Ｋ１’、　Ｋ２１・・・
に、の計１０個の特徴パラメータで表現していて、その
ビット配分はそれぞれ６．６．７．５．５．５．４．４
．３．６で１フレーム当り４８ビツトを要し、１秒間の
音声としては２４０Ｏビツトである。

これらの特徴パラメータはＰＡＲＣＯＦｔ分析で得られ
た値を符号化して得られるが、その符号化は第１には上
記のビット数では十分な精度が得られないこと、第２に
はパラメータの分布が第２図で示す様に均一でないこと
によりテーブルを用いて非線形に行われる。

第５図（ａＬ（ｂ）はそれぞれピッチとに１のパラメー
タの変換テーブルを示す。

ここで４フレームの間を定常状態とみなす根拠は、音声
発生の金管である声帯、舌、あご、くちびる等がその物
理的な制約からそれほど大きな速度では動き得ないとい
う事実に起因するが、同じ理由で隣接するフレーム間で
同一パラメータの変化を考えた１易合、その変化は小さ
く変化を表現するにはそのパラメータに配分されたビッ
ト数を全部必要としない場合が多い。

本発明は、上記の点を鑑みなされたもので、音声合成の
ための音声情報の効果的な圧縮ができ、しかも安価な音
声合成装置を提供することを目的とする。

以下、本発明の一実施例を図面に従って説明する。第４
図は、本発明の一実施例である音声合成装置の構成を示
すブロック図で、１は音声出力要求及びアドレス情報を
入力するための入力端子で、この入力端子１から入力さ
れたアドレス情報に従って中央演算装置２は、音声情報
を特徴パラメータで格納している記憶装置６から特徴パ
ラメータを呼出し、この呼出した特徴パラメータを一時
記憶する補助記憶装置４に格納した後、音声合成器であ
るＰＡＲＣ９Ｒ合成器５に送って起動をかける。

次に、ＰＡＲＣＯＲ合成器５からの要求で、中央演算装
置２は記憶装置６から符号化されて格納されている次の
特徴パラメータの変化値を呼出し、補助記憶装置４に記
憶されている前回の呼出された特徴パラメータと加算し
た結果を補助記憶装置４に格納すると共にＰＡＦ（ＣＯ
Ｒ合成器５に送る。ＰＡＲＣＯＲ合成器５では、中央演
算装置２がら送出されてきた加算結果である特徴バラメ
ークを複合化して音声合成を行い、デジタル−アナログ
変換器乙に送出してデジタル信号であるその結果をアナ
ログ信号に変換する。そのアナログ信号は増幅器７で増
幅され、スピーカー８から音声として出力される。

上記に示した記憶装置１３上には第５図で示すような音
声情報が上記特徴パラメータの変化値として符号化され
格納されているが、その中でアドレス０００に格納され
ている音声１ゼロ”を例に取りこの符号化の過程を次に
説明する。

第６図（ａ）は本発明で使用している日本人女声１ゼμ
”のピッチとＫｌパラメータに関する実データである。

これらを第５図（ａ）（ｂ）の変換テーブルにより符号
化し、更に直前フレームからの符号の変化として求めた
ものが第６図（ｂ）である。

第６図（ｂ）より知られるように、ここで取り上げた２
つのパラメータの変化の範囲はピッチが−６〜０〜＋６
でに１が−２８〜０〜＋２７であり、この変化分を表現
するのに要するビット数はそれぞれ４ビツト及び６ビツ
トで第１図に示した従来技術より計６ビツトの情報圧縮
が可能である。

上記の圧縮はビット配分の比較的大きなアンプ。

Ｋ、、　Ｋ、、　Ｋ、についても適用可能で、最終的な
圧縮されたビット配分はアンプ、ピッチｒ　ＫＩ　ＨＫ
、ｌ　、ｅ・・に自についてそれぞれ５．４．６．４．
４．４．４．４．３．３の計４１ビットである。

以上の結果に基づいて音声９ゼロ”のビット配列を示さ
ば第７図のごとくである。

即ち、第１フレームは初期値として第１図で示すビット
配分をそのまま使用するが、第２７レーム以降は上記圧
縮されたビット配分を使用、最後のエンドマークとして
用いているアンプの最大値も圧縮されたビット数を使用
している。

このビット圧縮の結果型する全ビット数は４８Ｘ１　＋
４１　Ｘ１６＋５−７０９計７０９ビツトとなり従来技
術が４８Ｘ１７＋、！Ｓ−８２２計８２２ビットであるから７０９÷８２２−０．８６２・・・約１４％のメモリ効率上Ｍが得られる。

最後に第７図のビット配列による音声１ゼロ”の合成手
順についてＸｉ）明する。

１）入力端子１からの音声６ゼロ”出力要求により中央
演算装置２は記憶装置ｉ　５のアドレスＯｏ。

カラフレーム１の１０個のパラメータを取り出し、補助
記憶装置４に格納した後ｐｋＲｃｏＲ合成器５に送り起
動をかける。

＋Ｉ）　　ＰＡＲＣＯＲ合成器５からの要求により中央
演算装置２は記憶装置ｉ￥６から次のフレーム用の１０
個のパラメータを取り出し、上記補助記憶装置４に格納
された１０個の値にそれぞれ加算して結果を補助記憶装
置￥１４に格納した後ＰＡＲＣＯＲ合成器５に送る。

ｌ１１）　　エンドマークを取り出すまで１１）をくり
かえす。

肋　エンドマークをＰＡＢＣＯＲ合成器５に送り終了す
る。

なお、本実施例ではＰＡＥＣＯＲ型音声合成式に関して
説明したが、本発明はそれになんら限定されることなく
音声を表現する特徴ｌくラメータを使用する合成方式で
あればその全てに適用が可能である。

以上で説明したように本発明によれば、符号化された特
徴パラメータを隣接する特徴ノ（ラメータの差を取って
符号化することによって、効率的な音声情報圧縮を実現
することができる音声合成装置を提供することができる
。

【図面の簡単な説明】

第１図は、ＰＡＲＣＯＲ合成器の各パラメータとそのビ
ット配分を示す図、第２図は、第１図に示したＫｌパラ
メータの分布図、第３図は、ＰＡＦ（ＣＯＲ合成器用の
変換テーブルを示す図、第４図は、本発明による音声合
成装置の構成を示すブロック図、第５．４よ、８．憶装
置□内い格に！’ａ　ｔｌ”Ｃい、音声デ。を示す図、第６図は、音声゛ゼロ”のピッチとに１の特
徴パラメータに関する実データ及び符号の変化を示す図
、第７図は、音声”ゼロ”のビット配列を示す図であり
、１は入力端子、２は中央演算装置、５は記憶、け装置
ＷＬｓ４は補助記憶装置、５はＰＡＲＣＯＲ合戊器、６
はＤ／Ａ変換器、７は増幅器、８はスピーカーである。出願人　キャノン株式会社

Claims

【特許請求の範囲】音声を表現する音声情報として特徴パラメータを用いて
音声合成を行う音声合成装置において、音声合成に使用される前記特徴パラメータを記憶する第
１記憶手段と、前記第１記憶手段に記憶された特徴パラ
メータからの変化値を記憶する第２記憶手段を設け、前記第１記憶手段に記憶された前記特徴パラメータと前
記第２記憶手段に記憶された前記変化値とを演算処理と
して得た特徴パラメータを次なる音声合成の情報とした
ことを特徴とする音声合成装置。