JPS593497A

JPS593497A - 規則合成方式における補間制御方式

Info

Publication number: JPS593497A
Application number: JP57112881A
Authority: JP
Inventors: 金盛　亨
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-06-30
Filing date: 1982-06-30
Publication date: 1984-01-10
Also published as: JPH0358519B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は規則合成方式の蒔声合成装＋ｔｉｃ関し、簡単
な制御により十分な性能が得られるようにしたものであ
る。

〔発明の従来技術Ｊ音声出力装置に杜大別して２通シの出力方式がある。１
つは出力すべき単語ないし文章をすべて側窓しておき、
それらを所望の組合わせで順次出力するものであるが、
出力すべき文章の種類が多数の場合には膨大な記憶容量
を必要とする欠点がある７辷れに対して本願の対象とする出力方式は、自然音声の
音韻単位を必要な種類だけバラメータ化して用意してお
き、任意の単語ないし文章をそれら音韻単位から合成す
る規則合成方式である　この場合、各音韻単位を並べる
だけでなく、それらのピッチや振幅を制御して、より自
然な音声とすることができる。１〔従来技術の問題点〕従来方式に訃いて、人間の発声に近い滑らかな基本周波
数の時間変化パターンを得るためには、１０ｍ５ｅｃ程
度の短い時間間隔にて、関数近位等の１を雑な手段を用
いて基本周波数を設定する必要があった。

乙また、これら基本周波数の計算処理は、一般周波数の対
数値を用いて行なわれる。とれは人間の聴感上は周波数
の対数に応じて操作する方が優れた近似が得られること
による。しかし、この基本周波数情報に応じて音声信号
を作成する、いわゆる音声合成ｒ、５ｘＦｉすべて基本
周期（周波数の逆数）を入力するようになっておシ従っ
て周波数の対数を周期に変換する必要があシ、その六め
の複雑な回路及び変換処理時間を要するという問題があ
る。

さらに、２つの音韻単位を接続する場合、第１の音韻単
位の最終振幅と第２の音韻単位の初期捩輻とが異なる場
合、その間を清らかになるよう補間する必要がある。こ
の振幅情報社一般に対数表示をさらに情報圧縮した形式
のパラメータで与えられるが、これを補間するには一但
整数表現にしてから補間し、再度元のパラメータ形式に
戻して音声合成ＬＳＩに入力しておシ、そのための回路
及び処理時間も大きくなるという問題がある、（発明の目的〕御所の羽的号一本発明はこれらの問題を解決し、簡単な回路で高速処理
ができ、かつ十分な性能を得られる音声合成制御方式を
提供することにある。

〔発明の構成〕

本発明は上記欠点を解決するため、先ず、基本周波数を
制御する情報は大まかな近似で与え、その情報（デジタ
ル情報）をデジタルフィルタによシ平滑化することで、
細かい近似で与えた場合に近い滑らかさを得るようにし
ている。

また、この基本周波数情報をピッチ周期に基づくパラメ
ータに変換するのにテープｌｖ索引方式を採用し、ハー
ドウェアの単純化、特性変更の容易化を達成する。

また、振幅情報の補間処理においては、−但整数値に変
換することをせず、捩幅パヲメータをそのまま純２進数
と見なして補間することによシ、高速かつ高性能の補間
処理を行なうようにしている。

〔発明の実施例〕

第１図は、規則合成方式の説明図であり、「ヤマガタ」
という単語を合成する場合を例にしている。音韻単位の
分は形にはいくつかの方式があるが、ここではいわゆる
ＶＣＶ　（母音・子音・母音）の組合わせを用いている
。

［ＹＡＭＡＧＡＴＡＪは５つの音韻単位「ＹＡＪ。

１’−ＡＭＡＪ　、　［ＡＧＡＪ　、　［ＡＴＡＪ　、
　［ＡＪを接続して得られる。（同図（ａ））各単位間は同一母音で接続すればよいので、自然な接続
が比較的容易に得られる。

同図（ｂ）は、基本周波数情報（対数表現）を示してお
シ、「マ」にアクセントがあることを示している。

同図（ｃ）は、基本周波数のピッチ（周期）表現を示し
ておシ、対数表現では直線のものが周期では曲線になっ
ている。

第２図は、本発明の一実施例ブロック図であり、１は合
成すべき単語／文章を文字コードで入力する手段・２は
文字列を音韻単位（ＶＣＶ）の系列情報へ変換する手段
、３は音韻単位の系列をＶ、Ｃの系列情報へ分解整列す
る手段、４はアクセント、イントネーションのパターン
を指定する手段、５は韻律テーブルでイントネーション
等に応じたパラメータを与えるもの、６は基本周波数や
各音韻間の接続時間の時系列的なパターンを作成する手
段、７はデジタルフィルタ、８は変換テーブル、９は各
音韻単位（ＶＣＶ　）が、例えば１０ｍ５ｅｃのサンプ
リング周期でバフメータ化されて格納されたファイル、
１０はｖＣ■パラメータを結合する手段、１１がパラメ
ータに応じて音声信号を合成する手段、１２はスピーカ
である。

イントネーション情報等によって音韻テープ／Ｌ１５を
索引して基本周波数情報（ｌｏｇ　ｆ）を求める場合、
従来では充分滑らかなｌｏｇｆ曲線を得るには、この音
韻テーブル５の情報を上記サンプリング周期と同程度の
周期で詳細に用意するか、又はテープ／％１５の情報は
粗っぽくしてその代シ比較的複雑な所定の関数を用いて
その間を補間するかしていた。

これに対して本発明ではテープ／Ｌ１５の情報は例えば
１００１１１１６１ｊ　　毎程度に粗つホ＜シ、かつ補
間は直線補間等の単純な関数で行なう。その代り、その
情報はデジタルフィルり７にて平滑化を施される。

第３図は、デジタルフィルタ７の一実施例であり、入力
Ｘは減算器３１にて出力Ｙの遅延（Ｚ”’）したものＹ
Ｘ’□Ｉのと差をとられ、それをアンプ３２でａ倍（１
＞ａ＞Ｏ）Ｌ、それにＹＸ］を加算器３３で加算して出
力される。出力Ｙは１サンプリング周期（例えば１０ｍ
ｍｅｅ）遅延素子３４で遅延されて減算＠？；３Ｘ＋加
算器３３にフィードバックされる。この回路の伝達特性
は、Ｙ　　　　　　　　　　ａであり、Ｚ　＝　１−　ａのときに極であり、Ｓ平面に
写像すると、Ｚ＝ｅ”πｆＴ　　となる。ここでｆは極
周波数、Ｔはサンプリング周期である。

今、ａ−１／４　、　Ｔ　＝＝　０．０１秒とすると、
ハｆ−Ｊ　ｎ　（１ａ　）中４．６Ｈｚ　。

２πＴ即ち、カットオフ周波数４．６Ｈｚ、−６ｄｂ１０ｃｔ
のローパス・フィルタトナル。

このようなフィルタを用いれば第１図（ｂ）の実線のよ
うな直線近似でも同図点線のような滑らかなｌｏｇ　ｆ
　　情報となる。

さらに、このようにして得た基本周波数の対数表現情報
を周期情報に変換するには変換テーブル８を用いる。第
４図はテーブルの一実施例ヲ示シ、ＲＯＭ　（リードオ
ンリーメモリ）を用い、入力には例えば８ビツト２進数
で（０〜２５５）＋ｏが与えられ、これに対して出力に
は７ビツト２進数で（１１１〜２１）１０が出力される
。

このようなテーブル変換方式によればＲＯＭを変換又は
切換えるのみで、任意の特性の装置に変換することがで
きる。例えば男声から女声への変更等が容易に行なえる
。。

また、各音韻単位間の振幅補間は以下のとおシに行なう
。

尚、ＶＣＶファイル９には各音韻単位が１０ｍａｌｅｅ
毎の各種パラメータの時系列集合として記憶されている
。振幅情報もそのパラメータの１つである。第１図（ａ
）の［ＹＡＪの最後と［ＡＭＡＪの最初のように同一母
音ｒＡＪでもその振幅は一般に異なっており、それらを
接続するときには滑らかにつながるように補間を施す必
要がある。パラメータ中の振幅Ｗ報は一般に次表のよう
に表わされる。

即ち、ｌＯ進整数は浮動小数点の２進表示にされ、その
小数点以下第１桁は常に”１”であるので（正規化しで
ある故）それを省いてビット数を圧縮している。

例えば、ある音韻の最終振幅パフメータが”１０００１
”で、次の音韻の最初の振幅パラメータが１０１０１”
の場合、従来は各パラメータを整数値”１０”と”２０
″とに一但変換し、その間の直線補間をとって再びパラ
メータ形式に戻し７ている。

これに対して本発明ではパラメータ形式をそのまま純２
進数と見なして直接に直線補間を行なう。即ち、」１記
の例では１０００１　”と”１０１旧”の差は００１０
０”であシ、仮りに４点間に直線補間するとすれば、各
点に”００００１”の差をつければよい。

従って前夫のとおりパラメータ形式は、”１０００１″
から１０１０１″　捷で”００００１″きざみで補間さ
れる。これを１０進表示に直してみると、６１０″、”
１２’、’１４″、″１６”、′２０”となり、指数関
数的な補間になっているのが判この方法は無駄な変換が
不要なだけでなく、ｂむしち聴感特性上も優れているという効果がある。とい
うのは人間の聴感上は周波数、振幅等が対数的に変化し
ても、それが直線的な変化にしか感じないという特性が
あり、補間を施すにも対数関数的な補間の方が優れてい
るのである。

第５図に補間用回路の例を示すが、この回路はＶＣＶ結
合部１０の中にあると考えてよい。

前回の音韻単位の最終振幅パラメータはレジスタ４１に
、また次音韻単位の先頭振幅パフメータはＶジメタ４２
にセットされ、夫々を純２進数として減算器４３にて差
をとる。

一方、音韻単位間の接続時間を決定する手段６からの接
続時間（サンプル点数）でその差を除算器４４で割り、
その商を加算器４５にて前回最終振幅値に加算して行け
ばよい。

〔発明の効果〕

以上の如く本発明によれば、単純な回路で単純な処理を
行なうことで従来と同等、或いはより優れた特性を得る
ことができ、音声出力装置のコストダウン化に有効であ
る。

【図面の簡単な説明】

第１図は規則合成方式の説明図、第２図は本発明の一寮
施例概略ブロック図、第３図はテ゛ジタルフィルりの一
実施例ブロック図、第４図は変換テーブルの一夾施例グ
ロック図、第５図は第１　図躬　２　回

Claims

【特許請求の範囲】

複数の音韻単位を所定周期でサンプリングし、少なくと
も周波数情報又は振幅情報を正規化された２進浮動小数
点表現に変換し、さらにその小数点以下第１桁を削除し
た形式で蓄積し、所望の音韻単位を接続して音声合成す
る規則合成方式において、上記形式の情報の補間処理に
当たって上記形式の指数部及び第１桁を削除された小数
点部を純２進数の上位桁とみなして直線補間することを
特徴とする規則合成方式における補間制御方式。