JPH05127697A

JPH05127697A - ホルマントの線形転移区間の分割による音声の合成方法

Info

Publication number: JPH05127697A
Application number: JP3142257A
Authority: JP
Inventors: Yun-Kun Lee; ヨーンケウンリー
Original assignee: Gold Star Co Ltd
Current assignee: LG Electronics Inc
Priority date: 1990-03-31
Filing date: 1991-04-01
Publication date: 1993-05-25
Also published as: US5649058A; KR920008259B1; EP0450533A2; EP0450533A3; KR910017357A

Abstract

(57)【要約】【目的】ホルマントの変異区間を線形特性をもつ部分
に分割し各部分のホルマントの情報を貯蔵した後音声デ
ータを抽出することにより適切な音声合成を行う。【構成】個人用計算機１、個人用計算機インタフェイ
ス２、音声合成器３、デジタルアナログ変換器８、ＲＯ
Ｍ４、およびＲＡＭ５を有する音声システムを用い、入
力文字にしたがうホルマント周波数データを分解領域の
段階で、ＲＯＭから読取り、次いでピッチとエネルギを
調整し、次いでホルマント周波数および帯域幅を計算
し、ホルマント形状を生成させ、濾波器により濾波され
たホルマントの形状のエネルギを調整し、現在のサンプ
ル個数を増加させる過程を経て音声合成を行う。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はホルマントの線形転移区
間の分割による音声の合成方法に関する。本発明による
方法は、特に、音声のコーディングによる方法とホルマ
ント（ｆｏｒｍａｎｔ）分析による規則合成方法を用い
て音声を形成させホルマントの線形転移区間の分割によ
る音声の合成を行う場合に用いることができる。

【０００２】

【従来の技術】一般的に音声の合成方法は大きく２つに
分けられるがその中の１つが音声のコーディンクによる
方法でこれは音声のすべての音素（音節又は発音節単位
も含み）については実際の音声信号をＬＰＣ（ｌｉｎｅ
ａｒｐｒｅｄｉｃｔｉｖｅ）又はＬＳＰ（ｌｉｎｅ
ｓｐｅｃｔｒｕｍｐａｉｒ）方法により分析した後こ
れをデータベースに貯蔵、任意の合成が必要な際、貯蔵
中の求める係数をデータベースより抽出して当該音声信
号を合成する方法でありもう一つの方法は音声のすべて
の音声について基本フォーマント周波数及び帯域幅を抽
出して音素の接合時に発生するホルマントの変化を規則
化して任意の発音の合成が必要な際、その規則をプラグ
ラムにより具現させることによって当該音声信号を合成
する方法である。

【０００３】

【発明が解決しようとする課題】しかし、上記の電子の
音声コーディングによる方法を利用すれば比較的良質の
音声が得られる反面、音声信号を短期間単位のフレイム
で分割して各各のフレイムを分析しなければならないの
でデータの量がかさむ上、さらに音声信号の特性が変化
しない区間についても不必要なデータを生じメモリ量を
増加させなければならない問題があり後者のホルマント
分折による規則合成方法はホルマントの変異を一定の規
則により処理しなければならないのでその規則を求める
のに多くの困難が伴なった。本発明はこのような問題点
を解決すべくホルマントの変異区間を線形特性をもつ部
分に分割し、各部分のホルマントの情報を貯蔵した後こ
れより音声データを抽出する方法を創案したものであ
る。

【０００４】

【課題を解決するための手段】本発明においては、個人
用計算機、個人用計算機インタフェイス、音声合成装
置、デジタルアナログ変換装置、および記憶手段を具備
する音声合成システムにおいて音声を合成する方法であ
って、（ａ）該記憶手段に記憶されたデータベースから
１つの文字に対応するホルマント周波数の情報を読み取
る段階であって、該文字が該個人用計算機のキイボード
により入力されるもの、（ｂ）ホルマントの形状である
ホルマント情報を線形補間法により演算する段階であっ
て、該ホルマントの形状がホルマント周波数およびホル
マント周波数帯域幅により決定されるもの、（ｃ）特性
周波数により分類された複数の帯域濾波器によりホルマ
ント形状の濾波を行う段階であって、該濾波されたホル
マント形状が該デジタルアナログ変換装置によりアナロ
グ音声信号に変換されるデジタル音声信号であるもの、
そして、（ｄ）増幅器により該アナログ音声信号を調整
し、適切な音響レベルを生成させ、スピーカ手段から出
力させる段階、を具備することを特徴とする音声を合成
する方法、が提供される。

【０００５】

【実施例】本発明によるホルマントの線形転移区間の分
割による、音声合成方法を行う装置が図１に示される。
図１に示されるように、個人用計算機（ＰＣ）１を通ず
るキイボード１ａの文字データをインタフェイスするＰ
Ｃインタフェイス２と、上記ＰＣインタフェイス２を通
ずる文字をＡＳＣＩＩコードで受け入れながら音声合成
のためにシステムを制御する音声合成器３と上記ディジ
タル信号処理器３のプログラム処理中に必要なデータを
貯蔵するＲＡＭ５を上記音声合成器３のセレクタ信号を
デコードして上記ＲＯＭ４及びＲＡＭ５に出力するアド
レスデータベース６と上記音声合成器３とデータベース
及びアドレスバスの間のデータを入出力するバッファ７
と上記音声合成器３により合成されたディジタル音声信
号をアナルログ信号に変換するディジタルアナログ変換
器８と上記Ｄ／Ａ変換器８の出力信号を所定のレベルに
増幅器９で構成したものでこのように構成させた音声合
成処理ブロック図と“Ｙａ”についてのソナグラフを示
した図２、“Ｙａ”についてのホルマントモデリングを
示した図３、上記ＲＯＭ４のデータの構成を示した図４
及び動作の流れを示す流れ図である図５、図６を参照し
ながら本発明を詳細に説明すれば次の通りである。

【０００６】まづＲＯＭ４上のデータベースの構成につ
いて、音声信号は線形ホルマントの転移区間によって分
割させるが例えば図２は“Ｙａ”についてのソナグラフ
を示したものでこれを図３において同じく、３個の線形
ホルマントの転移区間（Ｄ−Ｄ３）に分割してからこれ
を図４においてと同じく各各の分割区間の始発点におい
てのホルマント周波数（Ｆｊ）と帯域幅（ＢＷｊ）、そ
れから分割の長さ（Ｌｉ）により構成されすべての音素
についてこのような形態でデータベースを構成し上記の
ＲＯＭ４に貯蔵する。

【０００７】以後ＰＣ１がキイボード１ａよりハングル
文字を入力しこれをＰＣインタフェイス７を通じて音声
合成器３にＡＳＩＩコードで入力すればその音声合成器
３は上記ＲＯＭ４に貯蔵されたプログラムを遂行して当
該音声を合成するので、このように合成された音声デー
タはディジタルアナログ変換器を通じてアナログ信号に
変換された後増幅器９を通じて所定のレベルに増幅され
スピーカ（ＳＰ）に印加されるので、そのスピーカ（Ｓ
Ｐ）から入力文字に該当する音声が出力される。以下上
記音声合成器３は上記ＰＣインタフェイスであるＲＯＭ
４からその文字に該当するフォーマント情報と長さの情
報をつづけて読むのであるが、まず一番目の分割につい
ての情報を読んでみる、次いでピッチとエネルギ制御プ
ログラムと適正ピッチとエネルギを計算した後、まず合
成時点（ｎ）においてのホルマントの周波数（Ｆｊ）と
帯域幅（ＢＷｊ）を線形補間法（ｌｉｎｅａｒｉｎｔｅ
ｒｐｏｌａｔｉｏｎ）により次のように計算する。

【０００８】すなわち、Ｆ（ｊ）＝｛Ｆ（ｉ＋１，ｊ）
−Ｆ（ｉ，ｊ）｝×ｎ／Ｌ（ｉ）、およびＢＷ（ｊ）＝
｛ＢＷ（ｉ＋１，ｊ）−ＢＷ（ｉ，ｊ）｝×ｎ／Ｌ
（ｉ）の式を用いて計算する。ここに、Ｆ（ｉ，ｊ）は
分割ｉの時点におけるホルマントの周波数、ＢＷ（ｉ，
ｊ）は分割ｉの時点におけるホルマントの帯域幅、Ｌ
（ｉ）は分割ｉの長さ、ｎはサンプルインデックスを、
それぞれあらわす。

【０００９】このように計算されたホルマント情報によ
り４個の帯域濾波器を構成し濾過信号（ｅｘｉｔａｔｉ
ｏｎｓｉｇｎａｌ）をその帯域濾波器を通じ順次に濾
波すれば音声信号が発生され、以後上記の音声信号にエ
ネルギを乗じたのちサンプルインデックスを増加させ
る。このような過程を反復して１つのピッチ区間におけ
る合成が完了すればその合成された信号の長さが与えら
れた分割の長さより大きいかを調べ、大きくなければ上
記のピッチのエネルギの計算段階を越えてこれまでの過
程を反復し、大きければ分割領域の合成が完了したもの
と判断して次の分割領域の合成を行い、以後現在の分割
領域が最後の分割領域であるとき、音声合成は完了す
る。

【００１０】

【発明の効果】本発明によれば、コーティングによる音
声の合成方法とホルマント規則合成方法を用いて音声を
合成可能にすることによってデータベースの容量を減少
することができるのみならずホルマント分析による音声
の合成方法より良好な音声を生成することができ、分析
方法が簡単で容易に実現できる利点がある。

【図面の簡単な説明】

【図１】本発明によるホルマントの線形転移区間の分割
による音声の合成方法を行う装置を示すブロック線図で
ある。

【図２】Ｙａについてのソナグラフを示す図である。

【図３】Ｙａについてのホルマントのモデリングを示す
図である。

【図４】ＲＯＭのデータの構成を示す図である。

【図５】本発明による方法における動作の流れを示す流
れ図である。

【図６】本発明による方法における動作の流れを示す流
れ図である。

【符号の説明】

１…個人用計算機１ａ…キイボード１ｂ…モニタ２…個人用計算機インタフェイス３…音声合成器４…ＲＯＭ５…ＲＡＭ６…アドレスデコーダ７…バッファ８…デジタルアナログ変換器９…増幅器ＳＰ…スピーカｉ…セグメントインデックスｎ…現在のサンプル

Claims

【特許請求の範囲】

【請求項１】個人用計算機、個人用計算機インタフェ
イス、音声合成装置、デジタルアナログ変換装置、およ
び記憶手段を具備する音声合成システムにおいて音声を
合成する方法であって、（ａ）該記憶手段に記憶された
データベースから１つの文字に対応するホルマント周波
数の情報を読み取る段階であって、該文字が該個人用計
算機のキイボードにより入力されるもの、（ｂ）ホルマ
ントの形状であるホルマント情報を線形補間法により演
算する段階であって、該ホルマントの形状がホルマント
周波数およびホルマント周波数帯域幅により決定される
もの、（ｃ）特性周波数により分類された複数の帯域濾
波器によりホルマント形状の濾波を行う段階であって、
該濾波されたホルマント形状が該デジタルアナログ変換
装置によりアナログ音声信号に変換されるデジタル音響
信号であるもの、そして、（ｄ）増幅器により該アナロ
グ音声信号を調整し、適切な音響レベルを生成させ、ス
ピーカ手段から出力させる段階、を具備することを特徴
とする音声を合成する方法。
【請求項２】下記の各段階、すなわち、（ｅ）サンプ
ルの数を増大させた後、１つのサンプルについての合成
過程が完了したか否かを点検する段階、（ｆ）前記の段
階（ｅ）において１つのサンプルについての過程が完了
したとき、サンプルインデックスの数がセグメントの長
さより小であるか否かを点検する段階、（ｇ）前記の段
階（ｅ）において１つのサンプルにおける過程が完了し
なかったとき、該複数の帯域濾波器によりホルマント形
状を濾波し、サンプルの数がセグメントの長さより小で
あるか否かを点検する段階、をさらに具備する請求項１
記載の方法。
【請求項３】下記の各段階、すなわち、（ｈ）サンプ
ルインデックスの数を０に設定した後、現在のセグメン
トが最後のセグメントであるか否かを点検する段階、
（ｉ）該点検の結果、最後のセグメントでなかったとき
は、該記憶手段に記憶されたデータベースからホルマン
ト周波数を読み取り、他のセグメントを合成し、該点検
の結果が前記以外であったときは、過程を終了させる段
階、をさらに具備する請求項１記載の方法。