JPH0115880B2

JPH0115880B2 -

Info

Publication number: JPH0115880B2
Application number: JP56064633A
Authority: JP
Inventors: Sumio Fujita
Original assignee: Seiko Instruments Inc
Current assignee: Seiko Instruments Inc
Priority date: 1981-04-28
Filing date: 1981-04-28
Publication date: 1989-03-20
Also published as: JPS57179899A; GB2097636B; CH648945A5; GB2097636A; US4520502A

Description

【発明の詳細な説明】本発明は、PARCOR方式で代表される線形予
測符号方式の音声分析合成手法に基づく音声合成
に関する。

音声合成装置で合成に必要な１フレームの合成
パラメータは、振幅・ピツチ・リピート回数・有
音声／無音声識別・PARCOR係数等であつて、
フレーム間の合成パラメータのつながりを滑らか
にする為、補間処理を行ない、良好な合成音質を
得ていることは特願昭56−011871の通りである。

上記合成パラメータを用いて合成音声を発生さ
せる演算部がデイジタルフイルタ部である。この
デイジタルフイルタ部が演算を開始するにあた
り、前フレームの演算データがデイジタルフイル
タ部内に残つていると今後の演算に悪い影響を出
てしまう。具体的に言うと、このデイジタルフイ
ルタの出力をＤ−Ａ変換器を介して音声として聞
くならば、期待している音声にはならず、雑音の
多い聞きずらい音になつてしまう。上記の理由に
よつて、フレームの最初では必ずデイジタルフイ
ルタは初期化されていなければならない。

この初期化により前フレームに影響されない新
たなフレーム演算が開始されることになる。

補間とは有声音のフレームと有声音のフレーム
が続く場合に、前フレームの合成パラメータを時
間的変化に伴なつて後フレームの合成パラメータ
に近づけることである。この補間によつて、音声
の滑らかなつながりが得られるはずである。しか
し本音声合成装置にみられるような１ピツチを基
本としてフレームを構成しているピツチ同期式分
析合成装置においては、フレームの最初に遅延回
路を零にするフレームの初期化（フレームイニシ
ヤライズ）だけでは相隣るフレームのつながりに
不自然さが現われることがある。このような現象
をもつ「ことば」もしくは「文章」を聞いた場
合、不自然で聞きずらいものとなつてしまう。こ
の不自然なつながりをもつフレームをなくすた
め、ピツチ同期式方析合成装置では、ピツチ周期
毎に初期化（ピツチイニシヤライズ）を行ない、
相隣るフレームのつながりをよくしている。この
ことによりフレームイニシヤライズしたものより
も聴覚上「ことば」の自然さが増し、原音声によ
り近くなる効果がある。

以下にフレームイニシヤライズとピツチイニシ
ヤライズの音声波形をもつて本発明の実施例を説
明する。

第１図は本音声分析合成装置の要部である合成
回路のブロツク図である。

第１図はシフト回路１４で構成されるフレーム
間隔を求める回路部、カウンタ２３、ピツチ位相
検出回路３０で構成されるピツチ周期発生回路、
AMP補間回路２０、切換スイツチ２１、メモリ
２２、及びPARCOR係数補間回路１７、補間値
メモリ１８、切換スイツチ１９，２７等で構成さ
れる補間する回路部、カウンタ２３、及びシフト
回路１４，１５、カウンタ１６で構成される補間
タイミング信号発生回路部、さらにデイジタルフ
イルタ部５等で構成される合成部とで構成されて
いる。ピツチ周期発生回路は、メモリ１０ｂ中の
PITCHデータが格納されているプリセツタブル
ダウンカウンタ２３と、前記カウンタの出力信号
でPITCH時間経過する毎に出力されているカウ
ントアツプ信号C₂を検出し、デイジタルフイル
タ部５の動作に同期させてイニシヤライズ信号を
発生させているピツチ位相検出回路３０とから構
成されている。

他の構成の詳しい機能および動作は、特願昭56
−011871号に記載する通りである。

第２図は第１図のデイジタルフイルタ部５の一
実施例であり、１段あたり２個の乗算器５１と２
個の加算器５２と１個の遅延回路５３で構成され
た10段のデイジタルフイルタになつている。イニ
シヤライズ信号として入力されるものは、フレー
ムイニシヤライズの場合はREPEAT用カウンタ
３からの信号Ｃ３であり、ピツチイニシヤライズ
の場合はPITCH用カウンタ２３とピツチ位相検
出回路３０とからなるピツチ周期発生回路からの
信号Ｃ４である。この信号により遅延回路５３は
リセツトされ、デイジタルフイルタ内の初期状態
が決まることになる。

第３図、第４図は「私は」の音声波形で「−Ｓ
−ｉ−」の部分を抜き出した図である。第３図は
フレームイニシヤライズ、第４図はピツチイニシ
ヤライズしたものである。第５図は第３図、第４
図の波形を合成させる為の合成パラメータであ
る。「Ｓ」の無声音のフレームは図から省略され
ている。１ピツチとは波形１０１，１０３に相当
する１周期の波形である。１フレームとは波形１
０２，１０４に相当し、１ピツチの波形がリピー
ト回数だけ集まつたものである。次に合成パラメ
ータと対応させてみる。波形１０１はフレーム１
０２の最初の１ピツチであるので、回路的には第
２図で示すイニシヤライズ信号が入力され遅延回
路５３は初期状態になつていて、前フレームの演
算データに影響されない為に第３図、第４図とも
に同じ波形になつている。同じことが次フレーム
１０４の１ピツチの波形１０３についても言え
る。また、フレーム１０２の各ピツチの波形が次
第に大きくなつていくのは、振幅、PARCOR係
数が次フレーム１０４の振幅、PARCOR係数が
次フレーム１０４の振幅、PARCOR係数に向か
つて直線的に補間されているために現われる現象
である。さて、第３図はフレームイニシヤライズ
であるため、最初の１ピツチの波形１０１以後、
７ピツチ分の間はデイジタルフイルタ部５の遅延
回路５３にイニシヤライズ信号は入らない。波形
１０１のあとに続く７ピツチ分の音声波形は常に
前ピツチ波形の演算データを使つて合成を実行し
ていることになる。すなわち、遅延回路５３に蓄
積された上記演算データがリセツトされないで演
算されるために誤差となつて徐々に重なつてい
き、補間していつた最後のピツチの波形と次フレ
ーム１０４の最初の１ピツチ波形１０３とがつな
がりの悪い波形になつてしまう。第４図はピツチ
イニシヤライズであるので、遅延回路５３にはピ
ツチ周期毎にイニシヤライズ信号が入る。従つて
波形１０１に続く７ピツチ分の音声波形は遅延回
路５３に蓄積された上記演算データが使われてい
ないことになる。これにより誤差の積み重なりが
なくなり、次フレーム１０４の最初の１ピツチ波
形１０３に滑らかにつながつていく。

さらに顕著な実施例が第６図と第７図である。
第６図はフレームイニシヤライズ、第７図はピツ
チイニシヤライズしたものである。これは「セイ
コー」の「−ｉ−」であつて、合成パラメータは
第８図に揚げてある。フレームイニシヤライズの
第６図に注目すると、ピツチ2.6ミリ秒の音声波
形１０５（順次補間されている。）が４回きたあ
と、次フレーム１０８とのつながりがよくない。
これは第３図と同様の現象である。さらに、合成
パラメータの第８図で、次フレーム１０８と次々
フレーム１１０の振幅に注目されたい。振幅82か
ら振幅52と小さくなつている。フレーム１０８の
補間を行なうと波形が徐々に小さくなることは感
覚的にもわかる。すなわちピツチイニシヤライズ
を行なつている第７図弐の音声波形になる。とこ
ろがフレームイニシヤライズの第６図では全く逆
の現象になつてしまう。従つてフレームイニシヤ
ライズの音声「セイコー」は自然さが欠けた、聞
きづらいものになる。

以上のことからピツチ同期式分析合成器におい
ては、ピツチイニシヤライズすることによつて、
より原音声に近い合成音声を発生させる効果があ
る。なお、本文で用いている「PARCOR係数」
とは、正確には、反射係数と呼ばれるもので、
PARCOR係数とは絶対値が等しく符号が反対で
ある。

【図面の簡単な説明】

第１図は本発明に係る音声分析合成装置のブロ
ツク図である。第２図はデイジタルフイルタの一
実施例である。第３図はフレームイニシヤライズ
による合成音声波形を示す。第４図はピツチイニ
シヤライズによる合成音声波形を示す。第３図と
第４図の横軸方向すなわち時間軸は合致してお
り、同じ合成パラメータを使用している。第５図
は、第３図・第４図の合成音声波形合成パラメー
タを示す。第６図はフレームイニシヤライズによ
る合成音声波形を示す。第７図はピツチイニシヤ
ライズによる合成音声波形を示す。第６図と第７
図の横軸方向すなわち時間軸は合致しており、同
じ合成パラメータを使用している。第８図は、第
６図・第７図の合成音声波形の合成パラメータを
示す。１……スピーカ、４……バスライン、１７……
PARCOR係数補間回路、１８……補間値メモリ、
２３……プリセツタブルダウンカウンタ、３０…
…ピツチ位相検出回路、Tf……フレーム間隔、
△ｔ……補間周期、Ｃ４……イニシヤライズ信
号、５１……乗算器、５２……加算器、５３……
遅延回路。

Claims

【特許請求の範囲】１線形予測符号化方式の音声合成手法に基づく
音声合成装置であつて、原音声の１ビツチを基本
時間とし、かつほぼ同一波形の繰返しをリピート
回数として与え（１ピツチ）×（リピート回数）を
１フレーム長とする可変長フレーム方式とし、与
えられる音声データ中のピツチデータとリピート
回数からフレーム間隔を求める回路部と、合成パ
ラメータを補間する回路部と、補間タイミング信
号を発生する回路部と、前記合成パラメータに基
づいて音声合成（演算）を実行するデイジタルフ
イルタ部とを有する音声合成装置において、ピツ
チ周期毎にデイジタルフイルタ部を初期化するこ
とを特徴とする音声合成装置。２前記初期化は、ピツチ周期発生回路から生じ
るイニシヤライズ信号を、前記デイジタルフイル
タ部の遅延回路に与え、前記遅延回路をリセツト
することによつて行なうことを特徴とする特許請
求の範囲第１項記載の音声合成装置。