JPS60205801A - 任意音声合成器 - Google Patents

任意音声合成器

Info

Publication number
JPS60205801A
JPS60205801A JP59062424A JP6242484A JPS60205801A JP S60205801 A JPS60205801 A JP S60205801A JP 59062424 A JP59062424 A JP 59062424A JP 6242484 A JP6242484 A JP 6242484A JP S60205801 A JPS60205801 A JP S60205801A
Authority
JP
Japan
Prior art keywords
pitch
interpolation
frame data
circuit
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59062424A
Other languages
English (en)
Inventor
Akira Fukui
福井 昭
Fujio Nakagawa
中川 富士夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP59062424A priority Critical patent/JPS60205801A/ja
Publication of JPS60205801A publication Critical patent/JPS60205801A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (発明の技術分野) 本発明は音声の合成回路、特に子音−母音(CV)母音
−子音−母音(VCV)等を結合単位とする任意語い音
声合成回路に関する。
(従来技術) 任意語い合成は、合成単位に、VCv音節や、CV音節
を用い、声道伝達特性を表わす音響パラメータにPAR
COR係数や、LSP係数を用い、C■音節またはVC
v音節番結合させる方式がある。
L8P−CV方式を例にとって説明すると、音響パラメ
ータであるLSP係数と、音源パラメータである音源強
度とピッチとからなるフレームデータをC■音節単位毎
に予め蓄えておき、任意語い合成時には、vt(母音定
常)部と、vc(母音部後半から後続の子音までのわた
り)部は各パラメータを補間したフレームデータを用い
又いる。
任意語い合成時のピッチパターンは、母音中心位置にお
ける点ピッチをアクセント形と音節数により定め、点ピ
ッチ間のピッチは補間によりめている。
ところで、従来の音声合成器は、予め定められたフレー
ム周期で、フレームデータを入カシ、フレームデータに
よってのみ音声を合成するものしかなかった。この種の
音声合成器を用いる為には。
vt部や、vc部のフレームデータを作成し、合成器に
入力する必要があった。さらに、ピッチは、vt部vc
部のみでな(cv部や無音部等の全区間に渡って補間し
、各7レームデータのピップを置換しなければならず、
合成器の制御は、複雑かつ、実時間性の要求される処理
であった。
(発明の目的) 本発明の目的は、合成器側で、vt部、VCil>のフ
レームデータ補間、全フレームに渡るピッチ補間を行な
うことにより、制御装置からみて制御の容易な任意音声
合成器を提供することにある。
(発明の要約) 本発明の任意0音声合成器は、声道伝達特性を表わす音
響パラメータと音源パラメータとからなるフレームデー
タから音声を合成する音声合成器において、 フレームデータを入力するフレームデータメモリと、 ピッチを入力するピッチメモリと。
フレームデータの結合方法を規定する結合データを入力
する結合データメモリと、 前記フレームデータに含まれる音響パラメータを補関す
る音響パラメータ補間回路と、前記ピッチを補間するピ
ッチ補間手段と、フレームデータに含まれる音源パラメ
ータと前記ピッチ補間手段の出力のピッチから音源信号
を発生ずる音源手段と。
該音源手段の出力により駆動され前記音響パラメータ補
間手段で補間された音響パラメータに従って音声を合成
する音声合成手段と、 前記結合データから音源手段と、ピッチ補間手段の補間
長と、音響パラメータ補間手段の補間長を制御する結合
制御手段とを有することを特徴とする。
(実施例) 次に図面を参照して詳細に説明する。
第1図は従来の音声合成器の一例を示すブロック図であ
る。入力端子11からフレーム周期、例えはI Q m
 s毎にフレームデータが入力され、フレームデータメ
モリ12に蓄えられる。フレームデータには音響パラメ
ータ、音源強度およびピッチが含まれ、音響パラメータ
は音響パラメータ補間回路13に、また音源強度とピッ
チは音源回路14にそれぞれ入力される。音響パラメー
タ補間回路13は、フレーム周期内で例えば標本化時間
毎に音響パラメータを補関し、その結果を音声合成回路
15に入力する。また音源回路14は入力された音源強
度とピッチから音声合成回路15を駆動する音源を発生
する。音声合成回路15は音源回路14からの音源を入
力とし、音響パラメータ補間回路13からの音響パラメ
ータをフィルタ係数とするフィルタで音声を合成し1合
成音声が出力端子16から出力される。
さて、CV音節単位で任意語合成を行う場合、あらかじ
めCv音節を分析してフレームデータをめ、このフレー
ムデータを蓄積しておき、合成時に、このフレームデー
タをつなぎ合わせて用いる。ところが、Cv音節全体の
フレームデータをそのままつなぎ合わせて合成したので
はCV音節の境界でフレームデータ間に断差ができ、な
めらかな音声を合成することができない。また、人間の
実際の音声は、連続的に発生した場合、前後に存在する
音節にjって、スペクトル情報が異なる。従って、ある
条件下で発声されたCv音節を分析したフレームデー、
夕を用いてそのままつなぎ合わせて合成したのでは、不
自然々音声となる。
そこで、自然な音声を合成するC■年単位任意語合成の
方法として、C■音節のフレームデータのすべてを用い
るのではなく第2図および第3図に示すような方法が用
いられる。まずパワー変化で代表した音声の特徴変化A
は子音部Cと母音部Vに分け≦れ、子音部との先頭から
母音部の前半(CV部)のフレームデータ、および母音
定常部(vt部)のあるフレームのフレームデータのみ
會蓄積しておく。ここで、この蓄積されたデータを以下
「Cvデータ」という。
合成時には第3図に示すように、斜線で示した部分はフ
レームデータが存在するので、そのデータを用い、また
vt部および音節結合部(vc部)のところでは前後の
フレームデータより内挿して用いることが行なわれる。
また、ピッチに関しては、音声合成に先立って計算され
た、語頭、各vt部の中央、語尾におけるピッチ(以下
「点ピッチ」と称す)を用い、その間は前後の点ピッチ
より内挿して用いる。
このような任意語合成方法を実現する場合、第1図に示
した従来の音声合成器を用いると、フレーム毎にフレー
ムデータを入力する必要があるため、第4図に示すよう
にvt部、vc部において破線で示したように内挿する
フレームデータを、合成器の制御装置側で作成する必要
がある。またピッチについても、合成器の制御装置が、
点ピッチよりフレーム毎にピッチをめ、さらに、フレー
ムデータ内のピッチを検出しズフレームデータ内のピッ
チが零の場合フレームデータ内のピッチをそのままとし
、フレームデータ内のピッチが零でない場合、フレーム
データ内のピッチを前述の点ピッチよりめたピッチで置
換えるという操作が必要である。
以上のように、従来の音声合成器を用いる場合は、フレ
ームデータの内挿、ピッチの算出、置換えが必要なため
、合成器の制御装置、が一度cvデータを読出して変更
してから合成器゛に書込むという手順を行わざるを得な
い。従って、合成器の制御装置の処理が複雑となり、処
理速度の向上がはかれながった。
第5図は本発明の一実施例を示すブロック図である。入
力端子50.フレームデータメモリ52゜音響パラメー
タ補間回路55.音声合成回路59゜および音声出力端
子60は第1図に示した従来例と同様の構成である。本
実施例ではさらに入力端子50に入力されたデータを分
配するデータ分配回路51.入力された点ピッチを記憶
するピッチメモリ53 、cv部、vt部、vc部等の
時間長を示す結合データを記憶する結合データメモリ5
4、この結合データメモリ54かもの結合データにより
ピッチ補間長が指示されてピッチメモリ53の出力のピ
ッチを補間するピッチ補間回路56゜このピッチ補間回
路56の出力である補間されたピッチ、フレームデータ
メモリ52かもの7レームデータ内の音源パラメータお
よび結合データから音源を発生する音源回路58.およ
び結合データによりピッチ補間回路56.音響パラメー
タ補間回路55.および音源回路58を制御する結合制
御回路57から構成される。
本実施例の構成は、語順及びvt部補間用フレームデー
タ入力時に、フレームデータ入力に先立って、現在のC
■音節のvc部、及び1次のCV音節のC部、7部、v
t部の各時間長(以下、「結合データ」と称す)と次の
C■音節の点ピッチを入力することにより、従来、合成
器制御装置が行っていたフレームデータピッチの補間を
合成器が行うようにしたものである。結合データ、ピッ
チの入力時期については、他にも考えられるが、どこで
入力するにしても同様に考えることができる。以下、本
実施例の各部について説明する。
入力データであるフレームデータ、点ピッチ、結合デー
タは、データ分配回路51によってそれぞれフレームデ
ータメモリ52.ピッチメモリ53゜および結合データ
メモリ54に蓄えられる。
結合制御回路57は音響パラメータ補間回路55゜ピッ
チ補間回路56.および音源回路58を第6図に示すフ
ローチャムトの順に従って制御する。
まずvt郡部補間用フレーム入力時即ち7部の処理終了
時に結合データが入力(処理601)されると、結合デ
ータよりフレームデータの補間長をめ、音響パラメータ
補間回路55、音源回路58に対して、それぞれ音響パ
ラメータ、音源強度の差分値算出指示を行う(処理60
2)。そして、現在の状態がvt部の中心かどうかをチ
ェックし、vt部の中心でなければ、音源発生指示処理
(処理605)へジャンプ(処理603)L、まだ、v
t部の中心のときは、結合データよりピッチの補間長を
め、ピッチ補間回路56に対してピッチ差分値算出指示
を行う(処理604)。
次に前記処理603あるいは処理604の結果に従って
音源回路58に対して音源発生指示を行う(処理605
)。さらに、音響ノくラメーク補間回路55、ピッチ補
間回路56、音源回路58に対して、それぞれ音響パラ
メータ、ピッチ、音源強度の補間指示を行い(処理60
6)、音響ノくラメータ補間回路55及び音源回路58
に指示した補間長分の補間処理が終了したかどうかをチ
ェックする。終了していない場合は前記処理603ヘジ
ヤンプする(処理607)。この処理607の結果終了
していれば現在の状態がvc部かどうかをチェックして
vc部の場合は処理602ヘジヤンプし、またvc部で
なければ次の処理609へ移る(処理608)。処理6
09では覗、在の状態がcv部かどうかをチェ、りする
。cv部ならば処理602へ、cv部でなければ、cv
部が終了してvt部に入ったことになるので、処理60
1ヘジヤンプする。
以上が、結合制御回路570通常の処理ループであるが
、語頭の場合、即ち音声合成の開始時は次の処理を行う
まずvt郡部補間用フレーム入力時同様に、結合データ
を入力する(処理613)。入力された結合データより
、フレームデータの補間長をめ音響パラメータ補間回路
55.音源回路58に対して、それぞれ音響パンメータ
、音源強度の差分値算出指示を行う(処理614)。処
理604と同様に、結合データよりピッチ補間長をめて
ピ、チ補間回路56に対してピッチ差分算出指示を行イ
、処1m 605ヘジヤンプする(処理615)。
次に、音響パラメータ補間回路55とピッチ補間回路5
6は、結合制御回路57からの指示に対して、同様の動
作をするので、第7図にまとめてフローチャートを示す
。以下に、第7図の処理を順を追って説明する。
結合制御回路57からの差分値算出指示があったかどう
かをチェックし、指示熱の場合は処理704ヘジヤンプ
し、また指示有の場合は処理702を実行する(処理7
01)。指示有の場合メモリ(フレームデータメモリ5
2またはピッチメモリ53)から次のデータを入力する
(処理702)。次にメモリから入力した値と現在の値
との差分値をめ、結合制御回路57でめた補間長で除算
して補間幅を算出する(処理703)。結合制御回路5
7からの補間指示があったかどうかをチェックし、指示
がなかった場合は、処理701ヘジヤンプし、また指示
があった場合は処理705を行なう(処理704)。処
理705は現在の値に補間幅を加えることにより補間を
行い処理701ヘジヤンプする。
音源回路58は、有声音源(パルス列)又は無示す。次
に、この処理を順を追りて説明する。
結合制御回路57かもの音源強度差分値算出指示があっ
たかどうかをチェックし、指示がなかった場合は処理8
04ヘジヤンプする(処理801)。
指示があった場合フレームデータメモリ52から次の音
源パラメータ(音源強度とピッチ)を入力する(処31
802 )。フレームデータメモリ52から入力した音
源強度と現在の一¥i1−源強度との差分値をめ、結合
制御回路52でめた補間長で除算して補N】帖を算出す
る(処理803)。次に結合制御回路52からの音源強
度用1」間指示があったかどうかをチェックし、指示が
女かったら処理806ヘジヤ:ブする(処理804)。
指示が有った場合はザ′在の音源強度に補間幅を加える
−0即ち、音源強トの補間を行う(処理805)。さり
に結上制御l!′l略52からの音源発生指示があった
かどうかを梼ニックし、指示がなかっfc場合は処理8
01ヘジャンプする(処理806)。指示があった場合
はフレームデータのピッチが零かどうかをチ、ツクしく
処理807)、零でなければピッチ補間回路56のピッ
チの間隔でパルス列を発生させて音声合成回路59を駆
動することにより有声音源発生する。そして、処理80
1ヘジヤンプする(処理808)。また前記処理807
においてフレームデータのピッチが零であった場合、擬
似ランダム雑音を発生させて音声合成回路59を駆動す
ることにより無声音、源発生する。そして、処理801
ヘジヤンプする(処理809)。
音声合成回路59は、音源回路58の出力を入力とし、
音響パラメータ補間rglve、55の出力を係数とす
る音声合成フィルタである。
以上が本実施例の説明であるが、本実施例によれば、フ
レームデータはvt部、vc部では入力する必敬がなく
、ピッチと結合データは結合単位(C■音節)に1回入
力すれはよい。また、フレームデータは合成器の例では
補間する必懺がないため、蓄積され□たデータをそのま
ま合成器に入力すればよい。従って、合成器制御装置の
負荷が大幅に軽減される。
以上の説明は、音源信号としてパルス列か、あるいは、
乱数を用いた任意音声合成の場合についてであるが、音
源として残差信号を用いる場合は、フレームデータの内
に残差信号と残差信号が存在することを示すフラグを設
けておき、資源回路内で該フラグを検出して残差信号が
存在する場合は残差信号をそのまま音源として用いれば
よい。また、登録語の合成(C■音節単位のフレームデ
ータを結合して合成するのでは々く、単語あるいは文単
位でフレームテークを蓄積しておく方法)に対しても、
結合データの中に登録語か任意語かを示すフラグを設け
ておき、登録語の場合は、結合制御回路が、音源回路に
対して強制的にフレームデータの音源パラメータを用い
る様な指示を与えるとともに、音響パラメータ補間回路
に対して補間長をフレーム長とすることにより容易に実
乱、できる。
(発明の効果) 本発明は以上説明したように1合成器制御装置は、点ピ
ッチと結合データを作成し、音声合成器へ入力すれば、
フレームデータはCvファイルの値をそのまま音声合成
器へ入力することができる。
従って、音声合成器へのフレームテーク転送はDMA(
ダイレクト−メモリ・アクセス)方式が使えるなど、容
易な制御で、任意語い音声を合成できる効果がある。
【図面の簡単な説明】
第1図は従来の音声合成器の一例を示すブロック図、第
2図はパワー変化で代表した音声の特徴変化の一例を示
す説明図、第3図は合成時におけるフレームデータの存
在状態を説明するだめの図。 第4図は従来の任意語合成時における内挿状態を説明す
るだめの図、第5図は本発明の一実施例を示すブロック
図、第6図は85図における結合制御回路の処理を示す
フローチャート、第7図は第5図における音物パラメー
タ補間回路およびピッチ補間回路の処理を示すフローチ
ャート、第8図は第5図における音声合成回路の処理を
示したフローチャートである。 50:入力端子、51:データ分配回路、52:フレー
ムデータメモリ、53:ピッチメモリ。 54:結合データメモリ、55:前書パラメータ補間回
路、56:ピッチ補間回路、57:結合制御回路、58
:音源回路、59:音声合成回路。 60:出力端子。 隼 2 図 A S−子哲部一千一#童部−H +CνfL νを却−−−一 某 IWJ 察 7 図 稟 3 図

Claims (1)

  1. 【特許請求の範囲】 声道伝達特性を表わす音響パラメータと音源パラメータ
    とからなるフレームデータから音声を合成する音声合成
    器において。 フレームデータを入力するフレームデータメモリと、 ピッチを入力するピッチメモリと、 フレームデータの結合方法を規定する結合データを入力
    する結合データメモリと、 前記フレームデータに含まれる音響パラメータを補間す
    る音響パラメータ補間手段と。 前記ピッチを補間するピッチ補間手段と、フレームデー
    タに含まれる音源パラメータと前記ピッチ補間手段の出
    力のピッチから音源信号を発生する音源手段と、 該音源手段の出力により駆動され前記音響パラメータ補
    間手段で補間された音響パラメータに従って音声を合成
    する音声合成手段と、 前記結合データから音源手段と、ピッチ補間手段の補間
    長と、音等パラメータ補間手段の補間長を制御する結合
    制御手段と。 左肩することと%歓と弯も社九告声者叙恩・。
JP59062424A 1984-03-30 1984-03-30 任意音声合成器 Pending JPS60205801A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59062424A JPS60205801A (ja) 1984-03-30 1984-03-30 任意音声合成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59062424A JPS60205801A (ja) 1984-03-30 1984-03-30 任意音声合成器

Publications (1)

Publication Number Publication Date
JPS60205801A true JPS60205801A (ja) 1985-10-17

Family

ID=13199756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59062424A Pending JPS60205801A (ja) 1984-03-30 1984-03-30 任意音声合成器

Country Status (1)

Country Link
JP (1) JPS60205801A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63285597A (ja) * 1987-05-18 1988-11-22 ケイディディ株式会社 音素接続形パラメ−タ規則合成方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63285597A (ja) * 1987-05-18 1988-11-22 ケイディディ株式会社 音素接続形パラメ−タ規則合成方式

Similar Documents

Publication Publication Date Title
US6064960A (en) Method and apparatus for improved duration modeling of phonemes
JPS62160495A (ja) 音声合成装置
JPH031200A (ja) 規則型音声合成装置
JPH086592A (ja) 音声合成方法及び装置
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JPH08254993A (ja) 音声合成装置
EP0391545A1 (en) Speech synthesizer
JP2600384B2 (ja) 音声合成方法
JPS60205801A (ja) 任意音声合成器
JPH0642158B2 (ja) 音声合成装置
JP3771565B2 (ja) 基本周波数パタン生成装置、基本周波数パタン生成方法、及びプログラム記録媒体
JP3089940B2 (ja) 音声合成装置
JP2703253B2 (ja) 音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JP2573587B2 (ja) ピッチパタン生成装置
JP3284634B2 (ja) 規則音声合成装置
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JPS61122700A (ja) 合成音声発声速度制御方式
JP2573586B2 (ja) 規則型音声合成装置
JPH0836397A (ja) 音声合成装置
JPS62134694A (ja) 規則合成方式
JPH056191A (ja) 音声合成装置
JP2878280B2 (ja) 音声合成装置
JPH09160595A (ja) 音声合成方法
JP2573585B2 (ja) 音声スペクトルパタン生成装置