JPH0632037B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH0632037B2
JPH0632037B2 JP60281438A JP28143885A JPH0632037B2 JP H0632037 B2 JPH0632037 B2 JP H0632037B2 JP 60281438 A JP60281438 A JP 60281438A JP 28143885 A JP28143885 A JP 28143885A JP H0632037 B2 JPH0632037 B2 JP H0632037B2
Authority
JP
Japan
Prior art keywords
parameter
data
synthesizing
syllable
interpolation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60281438A
Other languages
English (en)
Other versions
JPS62139599A (ja
Inventor
寛治 国澤
博 糸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP60281438A priority Critical patent/JPH0632037B2/ja
Publication of JPS62139599A publication Critical patent/JPS62139599A/ja
Publication of JPH0632037B2 publication Critical patent/JPH0632037B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Reciprocating, Oscillating Or Vibrating Motors (AREA)

Description

【発明の詳細な説明】 [技術分野] 本発明は、規則合成手段を用いたPARCOR方式の音
声合成装置に関するものである。
[背景技術] 一般に、音素や音節記号あるいは文字系列データだけを
入力とし、それらに対応する任意の合成音出力を得るこ
とができる規則合成法は、合成音の語彙数に制限がない
ので、非常に優れた音声合成方法である。しかしなが
ら、規則合成法で自然性、明瞭性の高い合成音を作るこ
とは容易でない。そこで、用途を限定するなどして実用
に耐え得ると思われるものが開発されてきている。ここ
に、比較的安価なLSIが提供されているPARCOR
方式[振幅パラメータと、ピッチパラメータと、スペク
トルパラメータであるところの偏相関係数(κパラメー
タ)とよりなる音声合成データを音声信号をサンプリン
グした定常フレームから抽出し、この音声合成データに
て音声を合成する方式]の音声合成手段を用いた規則合
成法として、(母音+子音+母音)形音節(VCV音
節)や、(子音+母音)形音節(CV音節)を単位とす
る規則合成法が提案されている。ここに、VCV音節は
770種類程度であり、CV音節は100種類程度であ
るから、記憶容量の点から言えばCV音節を単位とする
規則合成法の方が優れている。しかし、VCV音節を単
位とする方法では母音と母音を接続するだけで良い(V
1112+V2122)のに対して、CV
音節を単位とする方法では、母音と子音また母音(C
+CまたはC+V)を接続しなけれ
ばならないため、接続部分における補間特性が悪くなっ
て合成音の音質が悪くなるという問題があった。すなわ
ち、母音と母音、母音と有声子音とを接続するときには
パラメータを補間することになるが、PARCOR方式
のκパラメータは直線補間を行った場合の補間特性が悪
く、合成音の品質が低くなってしまい自然性、明瞭性に
欠ける音声になるという問題があった。
そこで、このような問題点を解決するものとして、発明
者等は声道断面積に基いて音節の接続部のパラメータを
補間するようにした音声合成装置を特願昭60−127
77号として出願(以下において基本例と称する)して
いる。すなわち、規則合成手段にて処理された音声合成
データにより音声を合成するPARCOR方式の音声合
成手段を具備した音声合成装置において、音節の接続部
におけるパラメータを声道断面積Ai上で直線補間した
後、κパラメータに変換するように上記規則合成手段を
形成して、自然性、明瞭性が良い合成音を得ることがで
きるようにしたものである。ここに、上記基本例は、声
道を直円筒縦続接続近似(詳しくは参考文献「音声情報
処理の基礎」(オーム社)の第10章を参照)した場合
に各声道断面積Aiは直線的に変化するであろうという考
えに基づいており、κパラメータ上で直線補間するより
も合成音の品質が高くなるものであり、κパラメータκ
iと声道断面積Ai,Ai+1との関係は κi=(Ai−Ai+1)/Ai+Ai+1)……(1) である。
しかしながら、このような基本例にあっては、合成音の
品質が高くなるものの、声道断面積上での直線補間の計
算に加えて、声道断面積からκパラメータに変換するた
めの割り算をする必要があり、この割り算が比較的大き
な負担となってしまうという問題があった。そこで、声
道断面積上で直線補間を行い、Ai,Ai+1を求めた後、変
換用テーブルを用いてκパラメータを求めるようにした
ものがあった。しかしながら、この場合にあっては、割
り算が不要になって演算処理が簡略化されるものの、2
次元の変換テーブルが必要になり、この変換テーブルに
要する記憶容量が非常に大きく(一般に、2次元のテー
ブルを形成するために要する記憶容量は1次元のテーブ
ルを形成するために要する記憶容量の2乗倍)になって
実現が困難になるといる問題があった。
[発明の目的] 本発明は上記の点に鑑みて為されたものであり、その目
的とするところは、自然性、明瞭性が良い合成音を得る
ことができ、しかも、計算処理量および記憶容量を少な
くすることができ、構成が簡単になってコストを安くす
ることができる音声合成装置を提供することにある。
[発明の開示] (実施例) 第1図は本発明一実施例を示すもので、子音と母音とよ
りなるCV音節を単位とした音節合成パラメータを記憶
する音節合成パラメータ記憶部1と、規則データを記憶
する規則データ記憶部2と、文字系列データのような合
成入力データD、音節合成パラメータDおよび規則
データDに基いて音声合成データDを演算するとと
もに、音節の接続部のパラメータを補間処理する演算部
3とで規則合成手段4を形成し、上記規則合成手段4に
て処理された音声合成データDにより音声を合成する
PARCOR方式の音声合成手段5を具備して成る音声
合成装置において、音節間の接続を行う際における先行
音節、後続音節の接続部の声道断面積を▲As i▼,▲A
s i+1▼、▲Ae i▼,▲Ae i+1▼とすると、 の値を求め、この値より予め記憶しているκパラメータ
の補間パターンを選択して補間を行うように演算部3を
形成したものである。なお、実施例にあっては各音節の
音節合成パラメータを得るための分析手段10はローパ
スフィルタを具備し原音声VをA/D変換するA/D
変換回路11と、差分回路12と、原音声Vの振幅、
周期、スペクトルを分析して合成パラメータ(振幅パラ
メータ、ピッチパラメータおよびκパラメータ)を形成
する分析回路13とで構成されており、分析を行う前に
差分などの逆フィルタリングを行うことにより、分析精
度を向上させて合成音の品質向上を図るようになってい
る。また、音声合成手段5の後段には、上記逆フィルタ
リングによる前処理をキャンセルするための逆差分回路
14およびローパスフィルタを具備したD/A変換回路
15が設けられている。
以下、実施例の動作原理について説明する。いま、声道
断面積上で直線補間することを考えた場合において、補
間の始まりの点すなわち先行するCV音節の最後の区間
の声道断面積を▲As i▼,▲As i+1▼、補間の終わりの
点すなわち後続のCV音節の最初の区間の声道断面積を
▲Ae i▼,▲Ae i+1▼とすると、求めたい点のκパラメ
ータは補間の始まりの点から求めたい点までの長さを
l、補間の始まりから終わりまでの長さをLとおくと、 となる。ここで、dκi/dx、dκi/dx2を求める
と、 両式において分子はどちらも定数である。また、0<▲
s i▼≦▲As i▼+Δix≦▲Ae i▼ または0<▲Ae i▼≦▲Ae i▼+Δix≦▲As i▼…
(8) 0<▲As i+1▼≦▲As i+1▼+Δi+1×≦▲Ae i+1▼ または0<▲Ae i+1x≦▲Ae i+1▼+Δi+1x≦▲A
s i+1▼……(9) (但し、Ai,Ai、Ai+1,Ai+1は声道断面積
であるから正の値をとる。) であるから、結局、x(0≦x≦1)に関なく常に正ま
たは負の値をとる。
ここにdκi/dxは常に正または負の値であるといること
はκiはxに関して単調な関数であることを意味し、d2
κi=dx2が常に正または負の値であることはκiはxに
関して変曲点を持たず、常に上に凸、下に凸の関数とな
ることを意味する。
これにより、κiのxに関する関数の形は の値を見ることによりある程度予測できると考えられ
る。第2図は、声道断面積上で直線補間した場合におけ
るκパラメータの変化の例を示している。
そこで、κiの関数の形としていくつかのパターンを用
意し、dκi/dx|x=0の値によってどのパターンに
属するかを決めることにより声道断面積上で直線補間す
る場合と近い効果を得ることができることになる。
以下、実施例の動作について第3図乃至第6図を用いて
具体的に説明する。第3図は音声合成動作を示すフロー
チャートであり、演算部3では、入力された発生音の文
字系列データから読み出すでべき音節を抽出し、抽出し
た音節に対応する音声合成データを音声合成パラメータ
記憶部1から読出す。次に、読み出された音声合成パラ
メータに基いて補間演算(後述)を行うとともに、規則
データによる音節長の決定を行い、κパラメータ系列、
ピッチパラメータ系列および振幅パラメータ系列を決定
する。このようにして作成された音声合成パラメータは
適宜データ圧縮され、音声合成用データとして記憶され
る。続いて、文字系列データから次の音節の抽出が行な
われて上述した動作が文末になるまで繰り返し行なわ
れ、文末になった時点で音声合成手段5による音声合成
が行なわれる。次に、音節の接続部におけるκパラメー
タの補間演算について説明する。いま、各CV音節また
はV音節のパラメータは定常部に達した点までのものが
音声合成パラメータ記憶部1に記憶してあり、最後の区
間のパラメータのリピート回数によって合成音の音節長
を調整するようになっている。また、音節の接続部にお
いては、先行する音節の最後の区間に対する声道断面積
と次の音節の最初の区間の声道断面積とからκパラメー
タの補間を行って接続する。第4図は各音節の非定常部
のκパラメータデータ▲Pi 1▼〜▲Pi 5▼、定常部のκ
パラメータデータPおよび各音節の最初、最後の区間
のκパラメータに対応する声道断面積データ▲Ai 1▼,
▲Ai 5▼の記憶状態、第5図はCV音節の接続例をそれ
ぞれ示しており、接続部においてはκパラメータ▲Ai 5
▼、▲Ai+1 1▼に基いて補間を行うようになっている。
なお、音声合成データとしては、この他に有声/無声判
定パラメータ、振幅パラメータ、ピッチパラメータなど
が必要であることは言うまでもない。次に、κパラメー
タの補間は、(10)式よりdκi/dx|x=0を求め、そ
の値より補間テーブル7を参照して補間パターンを選択
して補間を行うようになっている。第6図は、例えば、
4ステップで補間を行い、増加に関して3つ、減少に関
して3つのパターンがあるとしたときの補間テーブルの
パターンデータを示している。ここに、補間パターンを
選択するための計算が少しでも容易になるようにdκi
/dxの代わりに−1/2(dκi/dx)を求め、それに
対応したしきい値を容易することにし、そのときに、 となった場合にはパターン3を用いることになり、 1ステップ目の値 κ=▲κs i▼+(1/16)Δκi 2ステップ目の値 κ=▲κs i▼+(3/16)Δκi 3ステップ目の値 κ=▲κs i▼+(8/16)Δκi となる。但し、Δκi=▲κs i▼−▲κe i▼である。
補間のパターンについて、jステップ目の増分を Δ▲κj i▼=(n/a)Δκi nは整数 を求めておき、実際にΔ▲κj i▼を求めるときにその値
をn回加算するだけで良いので計算が容易になる。さら
にaを2のべき乗としておくと、Δκi/aの計算が非
常に容易になる。
このようにして補間した場合と、声道断面積上で実際に
直線補間してκパラメータに変換する場合の計算の複雑
さについて比較すると、前者の場合には一度−1/2(d
κi/dx|x=0)を計算する必要があり、後者は各ス
テップ毎にκ=(Ai−Ai+1)/(Ai+A
+1)の計算を行う必要がある。また、前者において
は、(10)式より−1/2(dκi/dx|x=0)の計算の
ために3回の乗算と1回の除算を必要とし、一見複雑な
計算のように見えるが、この計算値は補間のパターンを
選択するためのしきい値と比較するだけであるので、そ
れほどの精度を必要としない。一方後者においては、κ
iは実際のκパラメータであり、10ビット程度の精度
が必要であると考えられるので、κパラメータの計算精
度はかなり高精度が要求されることになり、補間計算は
後者よりも前者のほうがかなり容易になる。なお、補間
方法を用いた場合にあっても、声道断面積上で直線補間
した場合の効果は十分維持されることは言うまでもな
い。また、本実施例では、合成パラメータを圧縮してお
り、このようなデータ圧縮を行う場合には計算量が多く
なるが、記憶容量を小さくでき、総合的に見てコンパク
トで安価な音声合成装置が得られることになる。もちろ
んデータ圧縮を行わなくても良いことは言うまでもな
い。また、補間処理は、合成音の品質に大きな影響を与
える低次のκパラメータについてのみ行い、高次のκパ
ラメータについては直線補間するようにしても良い。
[発明の効果] 本発明は上述のように、子音と母音とよりなるCV音節
を単位とした音節合成パラメータを記憶する音節合成パ
ラメータ記憶部と、規則データを記憶する規則データ記
憶部と、文字系列データのような合成入力データ、音節
合成パラメータおよび規則データに基いて音声合成デー
タを演算するとともに、音節の接続部のパラメータを補
間処理する演算部とで規則合成手段を形成し、上記規則
合成手段にて処理された音声合成データにより音声を合
成するPARCOR方式の音声合成手段を具備して成る
音声合成装置において、音節間の接続を行う際における
先行音節、後続音節の接続部の声道断面積をそれぞれ▲
s i▼,▲As i+1▼、▲Ae i▼,▲Ae i+1▼とすると、 の値を求め、この値より予め記憶しているκパラメータ
の補間パターンを選択して補間を行うように演算部を形
成したものであり、声道断面積上で直線補間した場合と
同様の自然性、明瞭性が良い合成音を得ることができ、
しかも、補間計算量を少なくすることができるので、安
価なCPUを用いて演算部を形成でき、コストを安くす
ることができるという効果がある。
【図面の簡単な説明】
第1図は本発明一実施例のブロック回路図、第2図乃至
第6図は同上の動作説明図である。 1は音声合成パラメータ記憶部、2は規則データ記憶
部、3は演算部、4は規則合成手段、5は音声合成手
段、7は補間テーブルである。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】子音と母音とよりなるCV音節を単位とし
    た音節合成パラメータを記憶する音節合成パラメータ記
    憶部と、規則データを記憶する規則データ記憶部と、文
    字系列データのような合成入力データ、音節合成パラメ
    ータおよび規則データに基いて音声合成データを演算す
    るとともに、音節の接続部のパラメータを補間処理する
    演算部とで規則合成手段を形成し、上記規則合成手段に
    て処理された音声合成データにより音声を合成するPA
    RCOR方式の音声合成手段を具備して成る音声合成装
    置において、音節間の接続を行う際における先行音節、
    後続音節の接続部の声道断面積をそれぞれ▲As i▼,▲
    s i+1▼、▲Ae i▼,▲Ae i+1▼とすると、 の値を求め、この値より予め補間テーブルに記憶してい
    るκパラメータの補間パターンを選択して補間を行うよ
    うに演算部を形成したことを特徴とする音声合成装置。
JP60281438A 1985-12-13 1985-12-13 音声合成装置 Expired - Lifetime JPH0632037B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60281438A JPH0632037B2 (ja) 1985-12-13 1985-12-13 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60281438A JPH0632037B2 (ja) 1985-12-13 1985-12-13 音声合成装置

Publications (2)

Publication Number Publication Date
JPS62139599A JPS62139599A (ja) 1987-06-23
JPH0632037B2 true JPH0632037B2 (ja) 1994-04-27

Family

ID=17639170

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60281438A Expired - Lifetime JPH0632037B2 (ja) 1985-12-13 1985-12-13 音声合成装置

Country Status (1)

Country Link
JP (1) JPH0632037B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2937322B2 (ja) * 1988-04-04 1999-08-23 日本電気 株式会社 音声合成装置
US5783380A (en) * 1996-09-24 1998-07-21 Eastman Kodak Company Thermally processable imaging element
JP3901475B2 (ja) * 2001-07-02 2007-04-04 株式会社ケンウッド 信号結合装置、信号結合方法及びプログラム

Also Published As

Publication number Publication date
JPS62139599A (ja) 1987-06-23

Similar Documents

Publication Publication Date Title
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
KR100385603B1 (ko) 음성세그먼트작성방법,음성합성방법및그장치
US6332121B1 (en) Speech synthesis method
US5682502A (en) Syllable-beat-point synchronized rule-based speech synthesis from coded utterance-speed-independent phoneme combination parameters
JPH031200A (ja) 規則型音声合成装置
JP2010230699A (ja) 音声合成装置、プログラム、及び方法
US5715363A (en) Method and apparatus for processing speech
US7089187B2 (en) Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor
JPH0632037B2 (ja) 音声合成装置
JP2600384B2 (ja) 音声合成方法
JPH0744727A (ja) 画像作成方法およびその装置
JPH09319391A (ja) 音声合成方法
JP4533255B2 (ja) 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体
US5649058A (en) Speech synthesizing method achieved by the segmentation of the linear Formant transition region
JP2004125843A (ja) 音声合成方法
JPS5816297A (ja) 音声合成方式
JP2015064482A (ja) 音声合成装置
JP2003066983A (ja) 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JP2715437B2 (ja) マルチパルス符号化装置
JPS61172200A (ja) 音声合成装置
JPH1055193A (ja) 音声分析方法
JP3283657B2 (ja) 音声規則合成装置
JP2019070775A (ja) 信号解析装置、方法、及びプログラム
JP2002297175A (ja) テキスト音声合成装置、テキスト音声合成方法及びプログラム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体
JPS62141600A (ja) 音声合成装置