JPH02230300A

JPH02230300A - 音声合成器

Info

Publication number: JPH02230300A
Application number: JP1049958A
Authority: JP
Inventors: Takayuki Ishikawa; 孝行石川
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1989-03-03
Filing date: 1989-03-03
Publication date: 1990-09-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は音声分析器で分析されたスペクトラル包絡情報
と音源情報とを合成する音声合成器に関する。

〔従来の技術〕

従来、この種の音声合成器は、入力音声信号の巨視的構
造を示すスペクトラル包絡情報と微細構造を示す音源情
報とを入力し、これら分析情報に基づいて人力音声信号
を再生するものである。すなわち、このような音声合成
器においては、分析情報として伝送されるスペクトラル
包絡情報を音源情報で駆動する全極型のディジタルフィ
ルタが音声合成フィルタとして備えられている。

スペクトラル包絡情報は、通常は入力音声信号をＬＰＧ
分析（線形予測分析；　ＬｉｎｅａｒＰｒｅｄｉｃｔｉ
ｖｅ　Ｃｏｅｆｆｉｃｉｅｎｔ）　Ｌて求められるαパ
ラメータやＫパラメータのごとき線形予測係数をフィル
タ係数としたものである。

一方、音源情報はピッチ周期に基づいたインバルス列（
ピッチパルス列）、有声無声無音情報、その他音声電力
等であり、音源情報の持つ波形情報は切り揄でて、音源
のピッチ周期と有声無声無音情報および音声電力等をモ
デル化したもので、音声合成フィルタを駆動するように
している。すなわち、有声音源はそのピッチ周期のイン
パルス列で、また無声無音は白色雑音によるモデル化表
現で、音声合成フィルタを駆動するようにしている。

〔発明が解決しようとする課題〕

しかしながら、従来のこのような波掛非伝送の分析情報
を用いて音声合成フィルタを駆動する音声合成器にあっ
ては、波形伝送型の音声合成器、例えばマルチパルスボ
コーダと比較すると、本質的に位相情報に欠け、またピ
ッチ周期情報にも曖昧性が入り込み易い。特に、音声合
成フィルタは分析側から合成側に伝送されるピッチ周期
情報に対応して発生するピッチパルス位置をパルス励起
点として駆動されるので、そのパルス励起点にエネルギ
の過度の集中が起こる。ピッチ周期を利用しての励振は
、定周期的にエネルギの集中を発生することになり、自
然性に乏しい機械音的な合成音質となるという欠点があ
った。

〔課題を解決するための手段〕

本発明は、音声合成フィルタをピッチ周期に基づいたイ
ンパルス列もしくは白色雑音でモデル化音源で駆動する
ことによって入力音声信号を合成するにあたって、ピッ
チ周期に基づいたピッチパルス列（インパルス列）の発
生周期を可変するピッチパルス可変器を設けたことを特
徴とする。

〔作用〕

ピッチパルス可変器により、パルス励起点であるピッチ
パルス位置が、ピッチパルス可変器で定まる周期によっ
て変化するので、エネルギの集中が避けられ、自然性に
近い合成音を得ることができる。

〔実施例〕

以下、図面に示す一実施例を参照して、本発明を詳細に
説明する。

第１図は本発明の音声合成器の一実施例を示すブロック
図である。デマルチプレクサ１１は伝送路１２を介して
、合成すべき音声信号の分析情報を人力する。この分析
情報は音声分析器によるスペクトラル包絡情報と音源情
報との多重化信号であり、スペクトラル包絡情報として
のＬＰＧ係数データａ１音源情報としての有声無声無音
情報ｂとピッチ周期情報Ｃおよび短時間音声電力データ
ｄが含まれる。

ここで、音声信号を分析する音声分析器は、ＬＰＧ分析
器、ピッチ抽出器、有声無声無音判別器、電力計測器等
からなり、分析した分析情報をメモリ回路に記憶すると
共に、マルチプレクサ等で適宜組み合わせて多重化し、
これを伝送符号化して伝送路１２に送出し、第１図に示
す音声合成器に供給する。

音声合成器では、入力された分析情報に基づき、デマル
チプレクサ１１によって多重化データの多重化分離と復
号化とを行う。

復号化したＬＰＧ係数データａは、音声合成フィルタ１
３に、ピッチ周期情報Ｃはピッチ，｛Ｊレス発生器１４
に、有声無声無音情報ｂは切替器１５に、また短時間音
声電力データｄは可変増幅器１６にそれぞれ供給される
。音声合成フィルタ１３は、予め定めた次数の全極型デ
ィジタルフィルタとして構成され、ＬＰＧ係数データａ
はこのフィルタの係数として利用される。

有声無声無音情報ｂは切替器１５に供給され、このデー
タが有声を指定するときはピッチパルス発生器１４の出
力を可変増幅器１６に、また無声無音のときは雑音発生
器１７の出力を可変増幅器ｌ６に供給するように切替器
１５を切り替えさせる。

雑音発生器１７は白色雑音を発生し、有声無声無音情報
ｂが無声か無音かを指定するときは、この白色雑音が可
変増幅器１６に供給される。

ピッチ周期情報Ｃを供給されたピッチパルス発生器ｌ４
は、このピッチ周期に対応する周波数のピッチパルス列
を発生し、更に前述のパルス列を本発明の特徴であるピ
ッチパルス可変器１８の指示に基づいた位置に修正した
のち、切替器１５に供給する。

可変増幅器１６はこうして入力するピッチパルスもしく
は白色雑音に対し、別に入力する短時間音声電力データ
ｄの大きさに対応した重み付け増幅を実施したのち、こ
れを音声合成フィルタ１３に供給し、このフィルタの駆
動音源とする。

音声合成フィルタ１３は、こうして入力するＬＰＧ係数
データａをフィルタ係数とし、駆動音源によって駆動さ
れ、分析フレームごとに量子化合成波形を再生し、Ｄ／
Ａコンバータｌ９に供給する。

Ｄ／Ａコンバータ１９は、こうして入力した量子化合成
波形をアナログ波形に変換し、ＬＰＦ（Ｌｏｗ　Ｐａｓ
ｓ　Ｆｉｌｔｅｒ）　２Ｑに送出する。ＬＰＦ２０は、
所定の高城周波数遮断フィルタリングを行い、合成音声
として出力ライン２１に送出する。

ところで、従来の音声合成器は、前述した通り、音声合
成フィルタ１３を駆動するパルス励起点にピッチ周期、
すなわち定周期的な過度のエネルギの集中が生起し、自
然性に乏しい合成音声となっていたが、本発明によるこ
の実施例では、パルス励起点をピッチパルス可変器１８
により意図的に動かす。これによって、定周期（ピッチ
周期）ごとに発生する過度のエネルギの集中をピッチ周
期を基本としながら分散させる。つまり、ピッチ周期、
もしくはその周期よりも少し前もしくは少し後というよ
うにパルスの励起点を意図的に動かすことにより、従来
は定周期的に発生した過度のエネルギの発生を時間的に
分散させることができ、聴覚的違和感をなくし、合成音
声の自然性を著しく改善している。

ここで、ピッチパルス可変器１８は、擬似乱数として代
表的なＭ系列を利用しており、Ｍ系列の下位２ビットが
（０．０）（１．１）のときは、ピッチ周期通りのパル
ス励起とし、（１．０）のときはピッチ周期よりも１サ
ンプル（１２５μＳｅｃ）早く励起し、（１．０）のと
きは１サンプル遅く励起する構成となっている。そして
、ピッチパルス可変器１８の内容は１サンプルごとに更
新する構成となっている。

〔発明の効果〕

以上説明したように本発明によれば、音声合成器にピッ
チ可変器を設け、ピッチパルス周期およびその近傍でパ
ルス励起点を定めるので、過度のエネルギの集中を防止
することができ、自然性のない機械音的な合成音となる
ことを防ぐことができる。このように、エネルギの励振
点を可変するピッチパルス可変器により、エネルギを時
間的に分散せしめ、聴覚的違和感のない自然性のよい合
成音声が生成できる。

【図面の簡単な説明】第１図は本発明の音声合成器の一実施例を示すブロック
図である。１１・・・・・・デマルチブレクサ、１２・・・・・・
伝送路、１３・・・・・・音声合成フィルタ、１４・・・・・・ピッチパルス発生器、１５・旧・・切
替器、１６・・・・・・可変増幅器、１７・・・・・・
雑音発生器、１８・・・・・・ピッチパルス可変器、１
９・・・・・・Ｄ／Ａコンバータ、２０・・・・・・Ｌ
ＰＦ．躬１図

Claims

【特許請求の範囲】

音声分析器で分析された音声信号の巨視的構造を示すス
ペクトラル包絡情報と前記音声信号の微細構造を示す音
源情報とを入力し、前記スペクトラル包絡情報を前記音
源情報で駆動し、音声合成フィルタで音声を合成する音
声合成器において、前記音源情報のうちのピッチ周期情
報に基づいて所定の周波数のピッチパルス列を発生する
ピッチパルス発生器と、このピッチパルス発生器で発生
するピッチパルス列の発生位置を変化させるためのピッ
チパルス可変器と、白色雑音を発生するための雑音発生
器と、前記音源情報のうちの有声無声無音情報が有声情
報であるときは前記ピッチパルス発生器の出力を選択し
、無声無音情報であるときは前記雑音発生器の出力を選
択する切替器と、この切替器の出力に基づいて前記音声
合成フィルタを駆動することを特徴とする音声合成器。