JPS5917440B2 - 音声分析合成方法 - Google Patents
音声分析合成方法Info
- Publication number
- JPS5917440B2 JPS5917440B2 JP56203933A JP20393381A JPS5917440B2 JP S5917440 B2 JPS5917440 B2 JP S5917440B2 JP 56203933 A JP56203933 A JP 56203933A JP 20393381 A JP20393381 A JP 20393381A JP S5917440 B2 JPS5917440 B2 JP S5917440B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- interpolated
- data
- clock period
- piece data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001308 synthesis method Methods 0.000 title claims description 21
- 238000004458 analytical method Methods 0.000 title claims description 20
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 238000003786 synthesis reaction Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000005236 sound signal Effects 0.000 claims description 9
- 238000000034 method Methods 0.000 description 23
- 239000011295 pitch Substances 0.000 description 13
- 230000002194 synthesizing effect Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 238000007796 conventional method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
Landscapes
- Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Seasonings (AREA)
- Electrophonic Musical Instruments (AREA)
Description
【発明の詳細な説明】
本発明は音声分析合成方法、特に音素片編集型音声分析
合成方法に関するものである。
合成方法に関するものである。
一般に、音素片編集型音声分析合成方法は、音声、特に
有声音の隣接波形間の強い類似性に基いて、原音声信号
から代表的な音素片データをピツチ単位で抽出し、抽出
した音素片データを音声合成制御情報にしたがつて複数
回繰り返しながら順次接続することによつて、音素片デ
ータを編集して所望の音声信号を合成する方法である。
有声音の隣接波形間の強い類似性に基いて、原音声信号
から代表的な音素片データをピツチ単位で抽出し、抽出
した音素片データを音声合成制御情報にしたがつて複数
回繰り返しながら順次接続することによつて、音素片デ
ータを編集して所望の音声信号を合成する方法である。
第1図は音素片編集型音声分析合成方法によつて合成さ
れた音声信号波形の一部を示す。
れた音声信号波形の一部を示す。
第1図は、音素片PHAを3回繰り返し、次いで音素片
PHBを接続し、PHBを2回繰り返すことによつて得
られた音声信号を示している。音素片編集型音声分析合
成方法は、音素片データを音声合成制御情報にしたがつ
て順次接続していくことにより音声信号を合成するので
、PARCOR方式、LSP方式、ホルマント合成方式
等のパラメータ分析合成方法と比較して、合成のための
手順が簡単で、汎用のマイクロプロセッサ等を使用して
容易に音声合成を実現できるという特徴を有する。
PHBを接続し、PHBを2回繰り返すことによつて得
られた音声信号を示している。音素片編集型音声分析合
成方法は、音素片データを音声合成制御情報にしたがつ
て順次接続していくことにより音声信号を合成するので
、PARCOR方式、LSP方式、ホルマント合成方式
等のパラメータ分析合成方法と比較して、合成のための
手順が簡単で、汎用のマイクロプロセッサ等を使用して
容易に音声合成を実現できるという特徴を有する。
しかしながら、この方法では第1図に示すように音素片
の波形及びピツチ周期が相異なる音素片の接続点で急激
に変化するために、音素片の繰り返しによる周期的なノ
イズ音が発生し、滑らかな音声信号を得にくいという問
題点があつた。
の波形及びピツチ周期が相異なる音素片の接続点で急激
に変化するために、音素片の繰り返しによる周期的なノ
イズ音が発生し、滑らかな音声信号を得にくいという問
題点があつた。
このような問題点を改善するために、2つの音素片の間
に補間演算により得られる補間音素片を挿入することが
従来より提案されてきた。すなわち、音声信号を一定の
サンプリング周期でサンプリングすることによつて得ら
れる音素片データ群の先行する音素片PHA(7)i番
目のデータ値をPHA(1)(1=1、2、・・・・・
・、NAlただしNAはPHAのデータ数)とし、後続
する音素片PHBのi番目のデータ値をPHB(1)(
1=1、2、・・・・・・、NBlただしNBはPHB
のデータ数)とする時、先行する音素片PHAと後続す
る音素片PHBの補間音素片PHI(:7)i番目のデ
ータ値PHI(1)を1式から求めるものである。
に補間演算により得られる補間音素片を挿入することが
従来より提案されてきた。すなわち、音声信号を一定の
サンプリング周期でサンプリングすることによつて得ら
れる音素片データ群の先行する音素片PHA(7)i番
目のデータ値をPHA(1)(1=1、2、・・・・・
・、NAlただしNAはPHAのデータ数)とし、後続
する音素片PHBのi番目のデータ値をPHB(1)(
1=1、2、・・・・・・、NBlただしNBはPHB
のデータ数)とする時、先行する音素片PHAと後続す
る音素片PHBの補間音素片PHI(:7)i番目のデ
ータ値PHI(1)を1式から求めるものである。
ただし、f(A,.B)は2つの音素片データA,Bの
補間関数を示す。ここで、2つの音素片データの補間は
、線形補間により求まるものとし、また2つの音素片の
間に挿入すべき補間音素片の個数をMとすれば、第j番
目の補間音素片のi番目のデータ値PHI(1.j)は
2式から求められる。
補間関数を示す。ここで、2つの音素片データの補間は
、線形補間により求まるものとし、また2つの音素片の
間に挿入すべき補間音素片の個数をMとすれば、第j番
目の補間音素片のi番目のデータ値PHI(1.j)は
2式から求められる。
後続する音素片のデータ値PHB(1)は、2式におい
てj=M+1とおくことにより求まるので、PHBを広
義の意味での補間音素片と呼ぶことにする。
てj=M+1とおくことにより求まるので、PHBを広
義の意味での補間音素片と呼ぶことにする。
また3式で定義されるを補間繰り返し回数と呼ぶことに
する。Mを使えば2式は4式で表わすことができる。た
だし、j=1、2、・・・・・・、質である。
する。Mを使えば2式は4式で表わすことができる。た
だし、j=1、2、・・・・・・、質である。
このような従来方法の問題点は、一般に音素片のピツチ
周期は音素片によつて異なり、したがつて音素片PHA
のデータ数NAと音素片PHBのデータ数NBの値が異
なるので、1式あるいは2式にしたがつて補間音素片の
音素片データを計算する時の音素片データの処理法にあ
つた。この場合、データ数が少ない方の音素片データに
最終データ値または零データを付加することによつて2
つの音素片のデータ数を同一にした後、補間音素片の音
素片データを求める。さらに滑らかで自然な音声信号を
得るためには、ピツチ周期も滑らかに変化させなければ
ならない。
周期は音素片によつて異なり、したがつて音素片PHA
のデータ数NAと音素片PHBのデータ数NBの値が異
なるので、1式あるいは2式にしたがつて補間音素片の
音素片データを計算する時の音素片データの処理法にあ
つた。この場合、データ数が少ない方の音素片データに
最終データ値または零データを付加することによつて2
つの音素片のデータ数を同一にした後、補間音素片の音
素片データを求める。さらに滑らかで自然な音声信号を
得るためには、ピツチ周期も滑らかに変化させなければ
ならない。
したがつて補間音素片のデータ数NIも先行する音素片
PHAのデータ数NAと後続する音素片PHBのデータ
数NBとから5式に示すような補間演算を行うことによ
つて求める。る関数を示す。
PHAのデータ数NAと後続する音素片PHBのデータ
数NBとから5式に示すような補間演算を行うことによ
つて求める。る関数を示す。
ここで、補間音素片のデータ数は線形補間により求まる
ものとし、Mを2つの音素片の間に挿入すべき補間音素
片の個数とすれば、第j番目の補間音素片のデータ数N
I(j)は6式により与えられる。
ものとし、Mを2つの音素片の間に挿入すべき補間音素
片の個数とすれば、第j番目の補間音素片のデータ数N
I(j)は6式により与えられる。
ただし、j=1、2・・・・・・、M+1である。した
がつて上記のようにして求めた音素片データを、補間に
よつて求めたデータ数だけ出力し、残りのデータは打ち
切る、という方法をとることによつて、ピツチ周期を滑
らかに変化させることが可能である。しかしながら、こ
の方法では強制的に補間音素片の残りのデータを打ち切
るので、打ち切りに伴うノイズ音が発生するという問題
点があつた。
がつて上記のようにして求めた音素片データを、補間に
よつて求めたデータ数だけ出力し、残りのデータは打ち
切る、という方法をとることによつて、ピツチ周期を滑
らかに変化させることが可能である。しかしながら、こ
の方法では強制的に補間音素片の残りのデータを打ち切
るので、打ち切りに伴うノイズ音が発生するという問題
点があつた。
第2図bにこのような従来方法によつて、同図aに示す
音素片PHAと同図bに示す音素片PHBとから求めた
補間音素片PHIを示す。第2図で補間音素片PHIは
音素片PHAと音素片PHBの真中に挿入する音素片で
あり、補間音素片のデータ値及びデータ数はともに線形
補間により求めたものである。第2図bに示されている
ように補間音素片の最終データ値は零になつていないの
で、これがノイズ音を発生する原因となる。
音素片PHAと同図bに示す音素片PHBとから求めた
補間音素片PHIを示す。第2図で補間音素片PHIは
音素片PHAと音素片PHBの真中に挿入する音素片で
あり、補間音素片のデータ値及びデータ数はともに線形
補間により求めたものである。第2図bに示されている
ように補間音素片の最終データ値は零になつていないの
で、これがノイズ音を発生する原因となる。
第2図でτはデータをサンプリングするときのクロツク
周期、iはサンプルデータの番号、tは時間、NA及び
NBはそれぞれ音素片PHA及びPHBのデータ数を示
す。
周期、iはサンプルデータの番号、tは時間、NA及び
NBはそれぞれ音素片PHA及びPHBのデータ数を示
す。
本発明は上記従来方法の問題点に鑑みてなされたもので
あり、その目的の1つは、音素片の波形及びピツチ周期
の変化が滑らかで自然な音声信号を合成することが可能
な音素片編集型音声分析合成方法を提供することにある
。
あり、その目的の1つは、音素片の波形及びピツチ周期
の変化が滑らかで自然な音声信号を合成することが可能
な音素片編集型音声分析合成方法を提供することにある
。
本発明の他の目的は、音声データの圧縮率が高く、した
がって音声データを記憶するためのメモリ容量が小さく
、コンパクトな音声合成装置を実現することが可能な音
声分析合成方法を提供することにある。
がって音声データを記憶するためのメモリ容量が小さく
、コンパクトな音声合成装置を実現することが可能な音
声分析合成方法を提供することにある。
本発明のさらに他の目的は、汎用のマイクロコンピユー
タのような簡単な制御回路で、自然な音声を合成できる
音声分析合成方法を提供することにある。
タのような簡単な制御回路で、自然な音声を合成できる
音声分析合成方法を提供することにある。
以下本発明による音声分析合成方法について詳細に説明
する。
する。
本発明による音声分析合成方法では、最初に、2つの音
素片の間を補間すべき音素片の音素片データに関し、そ
のデータ数を所定のデータ数Nに等しくする。
素片の間を補間すべき音素片の音素片データに関し、そ
のデータ数を所定のデータ数Nに等しくする。
原理的には異なるピツチ周期をもつ音素片のデータ数を
等しくするためには、音素片をサンプリングする時のク
ロツク周期を音素片のデータ数が一定になるように可変
しながらサンプリングすればよい。
等しくするためには、音素片をサンプリングする時のク
ロツク周期を音素片のデータ数が一定になるように可変
しながらサンプリングすればよい。
しかしながら、実際には音素片のサンプリングクロック
周期をピツチ周期に対応して可変させることは極めて困
難なものであるので、音素片を一定のサンプリングクロ
ツク周期でサンプリングした後、たとえばPROCEE
DINGSOFTHEIEEE誌の第69巻第3号(1
981年3月)の300頁から331頁にR.E.CR
OCHIEREとL.R.RABINERによつて著わ
された「INTERPOLATIONANDDECIM
ATIONOFDIGITALSIGNALSATUT
ORIALREVIEW」という標題の論文の中で詳細
に論述されているような方法でデータの補間あるいは間
引きを行つてデータ数の増減を行い所定のデータ数にす
る。
周期をピツチ周期に対応して可変させることは極めて困
難なものであるので、音素片を一定のサンプリングクロ
ツク周期でサンプリングした後、たとえばPROCEE
DINGSOFTHEIEEE誌の第69巻第3号(1
981年3月)の300頁から331頁にR.E.CR
OCHIEREとL.R.RABINERによつて著わ
された「INTERPOLATIONANDDECIM
ATIONOFDIGITALSIGNALSATUT
ORIALREVIEW」という標題の論文の中で詳細
に論述されているような方法でデータの補間あるいは間
引きを行つてデータ数の増減を行い所定のデータ数にす
る。
次にこのように一定のデータ数となつた音素片データの
先行する音素片書拮のi番目のデータ値PHA(1)(
1=1、2、・・・・・・、N)及び後続する音素片P
HBf)i番目のデータ値PHB(1)(1一1、2、
・・・・・・、N)より1式または2式にしたがつて補
間演算を行うことにより補間音素片PHI(f)i番目
のデータ値PHI(1)(1−1、2、・・・・・・、
N)を求める。
先行する音素片書拮のi番目のデータ値PHA(1)(
1=1、2、・・・・・・、N)及び後続する音素片P
HBf)i番目のデータ値PHB(1)(1一1、2、
・・・・・・、N)より1式または2式にしたがつて補
間演算を行うことにより補間音素片PHI(f)i番目
のデータ値PHI(1)(1−1、2、・・・・・・、
N)を求める。
本発明による方法では補間すべき音素片のデータ数は一
定であるので、従来方法のように−データ数が少ない方
の音素片データに人工的に最終データ値または零データ
を付加する必要はない。
定であるので、従来方法のように−データ数が少ない方
の音素片データに人工的に最終データ値または零データ
を付加する必要はない。
次に以上のようにして求めた補間音素片の音素片データ
を補間すべき音素片の音素片データに挿入することによ
つて補間音素片を含む音素片群の音素片データ列を求め
る。所望の音声信号を合成するにあたつて、このように
補間すべき音素片の先行する音素片と後続する音素片の
音素片データから補間演算を行うことにより補間音素片
を含む音素片群の音素片データ列を求めてもよいが、あ
らかじめ上記のような補間演算を行ない、補間音素片を
含む音素片群の音素片データ列の隣り合う音素片データ
の同一番目のデータ値の差分を求めることによつて差分
音素片データ列を求め、これをメモリに記憶しておけば
、音声合成時には加算演算のみによつて補間音素片を含
む音素片群の音素片データ列が求まることになり、音声
合成時の音素片データ列を求めるための演算を軽減する
ことができる。
を補間すべき音素片の音素片データに挿入することによ
つて補間音素片を含む音素片群の音素片データ列を求め
る。所望の音声信号を合成するにあたつて、このように
補間すべき音素片の先行する音素片と後続する音素片の
音素片データから補間演算を行うことにより補間音素片
を含む音素片群の音素片データ列を求めてもよいが、あ
らかじめ上記のような補間演算を行ない、補間音素片を
含む音素片群の音素片データ列の隣り合う音素片データ
の同一番目のデータ値の差分を求めることによつて差分
音素片データ列を求め、これをメモリに記憶しておけば
、音声合成時には加算演算のみによつて補間音素片を含
む音素片群の音素片データ列が求まることになり、音声
合成時の音素片データ列を求めるための演算を軽減する
ことができる。
すなわち補間音素片を含む音素片群の音素片データ列の
第j番目の音素片データ(j=Oは先頭の音素片データ
を表すものとして零から順に音素片データに番号をつけ
る。
第j番目の音素片データ(j=Oは先頭の音素片データ
を表すものとして零から順に音素片データに番号をつけ
る。
)のi番目のデータ値をPH(1.j)とすれば、第(
j−1)番目の音素片データと第j番目の音素片データ
の差分音素片データ△PH(1.j)は7式で与えられ
る。ただし、j−1、2c・・・・・、Nである。なお
本方法でいう差分と、たとえばDPCM方法でいう差分
とは差分の取り方が異なることに注意しなければならな
い。すなわち、DPCM方法では隣り合うサンプルデー
タ間の差分を取るのに対し、本方法でいう差分は7式に
示すように隣り合う音素片の対応するサンプルデータ間
の差分を取るという点が大きく異なる。次に上記音素片
データ列の先頭の音素片データ及び上記差分音素片デー
タ列をメモリに記憶する。
j−1)番目の音素片データと第j番目の音素片データ
の差分音素片データ△PH(1.j)は7式で与えられ
る。ただし、j−1、2c・・・・・、Nである。なお
本方法でいう差分と、たとえばDPCM方法でいう差分
とは差分の取り方が異なることに注意しなければならな
い。すなわち、DPCM方法では隣り合うサンプルデー
タ間の差分を取るのに対し、本方法でいう差分は7式に
示すように隣り合う音素片の対応するサンプルデータ間
の差分を取るという点が大きく異なる。次に上記音素片
データ列の先頭の音素片データ及び上記差分音素片デー
タ列をメモリに記憶する。
7式より8式が成立する。
8式より音声信号を合成するにあたつて、補間音素片を
含む音素片群の音素片データ列を得るためには、上記メ
モリから読み出した音素片データ列の先頭の音素片デー
タに、同様に上記メモリから読み出した差分音素片デー
タを順次加算すればよいことがわかる。
含む音素片群の音素片データ列を得るためには、上記メ
モリから読み出した音素片データ列の先頭の音素片デー
タに、同様に上記メモリから読み出した差分音素片デー
タを順次加算すればよいことがわかる。
このような差分音素片データによる補間方法を採用する
ことにより次のメリツトを生じる。
ことにより次のメリツトを生じる。
すなわち、音声信号を合成するにあたつて、補間音素片
を含む音素片群の音素片データ列が加算演算のみによつ
て求められるので、汎用のマイクロコンピユータのよう
な簡単な制御回路によつて実現可能であり、簡単な回路
構成で自然な音声を合成することができる。補間音素片
の音素片データを線形補間により求める時は、補間すべ
き音素片の先行する音素片PHA(7)i番目のデータ
値をPHA(1)、また後続する音素片PHB(7)i
番目のデータ値をPHB(1)とし、2つの音素片の間
に挿人する補間音素片の個数をMとすれば、2つの音素
片の間の第j番目の補間音素片PHIの第1番目の差分
データ値△PHI(1,.j)は9式で与えられる。
を含む音素片群の音素片データ列が加算演算のみによつ
て求められるので、汎用のマイクロコンピユータのよう
な簡単な制御回路によつて実現可能であり、簡単な回路
構成で自然な音声を合成することができる。補間音素片
の音素片データを線形補間により求める時は、補間すべ
き音素片の先行する音素片PHA(7)i番目のデータ
値をPHA(1)、また後続する音素片PHB(7)i
番目のデータ値をPHB(1)とし、2つの音素片の間
に挿人する補間音素片の個数をMとすれば、2つの音素
片の間の第j番目の補間音素片PHIの第1番目の差分
データ値△PHI(1,.j)は9式で与えられる。
ただし、j−1、2、・・・・・・、M+1である。線
形補間の場合、第9式に示すように補間すべき2つの音
素片の間で差分音素片データの値は一定となるので、補
間すべき音素片の間に挿入する補間音素片の個数に1を
加算した値と、補間すべき音素片の音素片データの先頭
の音素片データと上記補間すべき音素片の先行する音素
片と後続する音素片と音素片データの同一番目のデータ
値の差分を上記補間音素片の個数に1を加算した値で割
つた差分音素片データとをメモリに記憶すればよい。ま
た、所望の音声信号を合成するにあたつて、補間音素片
を含む音素片群の音素片データ列を得るためには、上記
メモリから読み出した音素片データの先頭の音素片デー
タに上記メモリから読み出した差分音素片データを上記
メモリから読み出した補間音素片の個数に1を加算した
値の回数を順次加算すればよい。
形補間の場合、第9式に示すように補間すべき2つの音
素片の間で差分音素片データの値は一定となるので、補
間すべき音素片の間に挿入する補間音素片の個数に1を
加算した値と、補間すべき音素片の音素片データの先頭
の音素片データと上記補間すべき音素片の先行する音素
片と後続する音素片と音素片データの同一番目のデータ
値の差分を上記補間音素片の個数に1を加算した値で割
つた差分音素片データとをメモリに記憶すればよい。ま
た、所望の音声信号を合成するにあたつて、補間音素片
を含む音素片群の音素片データ列を得るためには、上記
メモリから読み出した音素片データの先頭の音素片デー
タに上記メモリから読み出した差分音素片データを上記
メモリから読み出した補間音素片の個数に1を加算した
値の回数を順次加算すればよい。
差分音素片データによる一般の補間方法では、音素片群
の先頭の音素片はそのまま音素片データとして記憶する
ので、差分音素片データは、補間すべき音素片の数に補
間音素片の数を加算した値、すなわち補間音素片を含む
音素片群の音素片の数から1を減算した数だけ必要であ
るが、線形補間方法では、差分音素片データは、補間す
べき音素片の数から1を減算した数だけでよいので差分
音素片データを記憶しておくためのメモリ容量が小さく
て済むという特徴がある。
の先頭の音素片はそのまま音素片データとして記憶する
ので、差分音素片データは、補間すべき音素片の数に補
間音素片の数を加算した値、すなわち補間音素片を含む
音素片群の音素片の数から1を減算した数だけ必要であ
るが、線形補間方法では、差分音素片データは、補間す
べき音素片の数から1を減算した数だけでよいので差分
音素片データを記憶しておくためのメモリ容量が小さく
て済むという特徴がある。
また合成音声信号のピツチ周期を滑らかに変化させるこ
とは、補間音素片を含む音素片群の音素片データ列を出
力する時のクロツク周期を滑らかに変化させることによ
つて行う。
とは、補間音素片を含む音素片群の音素片データ列を出
力する時のクロツク周期を滑らかに変化させることによ
つて行う。
すなわち、補間すべき音素片の先行する音素片PHAの
クロツク周期をτA、後続する音素片PHBのクロツク
周期をτBとする時、PHAとPHBの補間音素片PH
Iのクロツク周期τIをO式より求める。
クロツク周期をτA、後続する音素片PHBのクロツク
周期をτBとする時、PHAとPHBの補間音素片PH
Iのクロツク周期τIをO式より求める。
ただし、h(τぃτB)は2つのクロツク周期τA、τ
Bの補間関数である。
Bの補間関数である。
補間音素片のクロツク周期を線形補間により求める場合
には、Mを2つの音素片の間に挿入する補間音素片の個
数とすれば、第j番目の補間音素片のクロック周期τ1
(j)は、◎式により与えられる。
には、Mを2つの音素片の間に挿入する補間音素片の個
数とすれば、第j番目の補間音素片のクロック周期τ1
(j)は、◎式により与えられる。
ただし、j=1、2、・・・・・・、M+1である。
次に上記補間音素片のクロツク周期を補間すべき音素片
のクロツク周期に挿入することにより、補間音素片を含
む音素片群のクロツク周期列を得る。次いで上記クロツ
ク周期列の隣り合うクロツク周期の差分を求めることに
よつて差分クロツク周期列を得る。
のクロツク周期に挿入することにより、補間音素片を含
む音素片群のクロツク周期列を得る。次いで上記クロツ
ク周期列の隣り合うクロツク周期の差分を求めることに
よつて差分クロツク周期列を得る。
次に上記クロツク周期列の先頭のクロツク周期と上記差
分クロック周期列をメモリに記憶する。
分クロック周期列をメモリに記憶する。
音声信号を合成するにあたつて、補間音素片を含む音素
片群のクロツク周期列を求める時には、上記メモリから
読み出したクロツク周期列の先頭のクロツク周期に上記
メモリから読み出した差分クロツク周期を順次加算すれ
ばよい。このような差分クロツク周期による補間方法を
採用することにより、補間音素片を含む音素片群のクロ
ツク周期列を加算演算のみによつて求めることができ、
音声合成時のクロツク周期列を求めるための演算を軽減
することができる。
片群のクロツク周期列を求める時には、上記メモリから
読み出したクロツク周期列の先頭のクロツク周期に上記
メモリから読み出した差分クロツク周期を順次加算すれ
ばよい。このような差分クロツク周期による補間方法を
採用することにより、補間音素片を含む音素片群のクロ
ツク周期列を加算演算のみによつて求めることができ、
音声合成時のクロツク周期列を求めるための演算を軽減
することができる。
また線形補間によつてクロツク周期を求める場合、補間
すべき2つの音素片の間で差分クロツク周期は一定とな
るので、補間すべき音素片の間に挿入する補間音素片の
個数に1を加算した値と補間すべき音素片の先頭の音素
片のクロツク周期と上記補間すべき音素片の先行する音
素片のクロツク周期と後続する音素片のクロツク周期の
差分を上記補間音素片の個数に1を加算した値で割つた
差分クロツク周期とをメモリに記憶する。
すべき2つの音素片の間で差分クロツク周期は一定とな
るので、補間すべき音素片の間に挿入する補間音素片の
個数に1を加算した値と補間すべき音素片の先頭の音素
片のクロツク周期と上記補間すべき音素片の先行する音
素片のクロツク周期と後続する音素片のクロツク周期の
差分を上記補間音素片の個数に1を加算した値で割つた
差分クロツク周期とをメモリに記憶する。
所望の音声信号を合成するにあたつて、補間音素片を含
む音素片群のクロツク周期列を求めるためには、上記メ
モリから読み出した補間すべき音素片の先頭の音素片の
クロツク周期に上記メモリから読み出した差分クロツク
周期を上記メモリから読み出した補間音素片の個数に1
を加算した値の回数を順次加算すればよい。
む音素片群のクロツク周期列を求めるためには、上記メ
モリから読み出した補間すべき音素片の先頭の音素片の
クロツク周期に上記メモリから読み出した差分クロツク
周期を上記メモリから読み出した補間音素片の個数に1
を加算した値の回数を順次加算すればよい。
差分音素片データの線形補間による場合と同様に、差分
クロツク周期の線形補間による場合は一般の補間による
場合と比較してメモリ容量が小さくてよい。
クロツク周期の線形補間による場合は一般の補間による
場合と比較してメモリ容量が小さくてよい。
またクロツク周期は一般に滑らかに変化するので、クロ
ツク周期の値と比較して差分クロツク周期の値の方がダ
イナミツク・レンジが小さくなり、したがつてデイジタ
ル化した時のビット数も小さくて済むので、この点から
もメモリ容量を小さくすることができる。第3図bに本
発明による方法の補間によつて同図aに示す音素片PH
Aと同図cに示す音素片PHBとから求めた補間音素片
PHIを示す。
ツク周期の値と比較して差分クロツク周期の値の方がダ
イナミツク・レンジが小さくなり、したがつてデイジタ
ル化した時のビット数も小さくて済むので、この点から
もメモリ容量を小さくすることができる。第3図bに本
発明による方法の補間によつて同図aに示す音素片PH
Aと同図cに示す音素片PHBとから求めた補間音素片
PHIを示す。
第3図は第2図に対応して書かれており、第3図A,e
の波形は、それぞれ第2図A,cの波形 Jと同一であ
るが、サンプリングクロツク周期が異なる。第3図で、
補間音素片PHIは音素片PHAと音素片PHBの真中
に挿入する音素片であり、補間音素片のデータ値及びサ
ンプリングクロツク周期はともに線形補間によつて求め
たもの 4である。第3図bより明らかなように、本発
明による補間方法では従来方法の第2図bで見られた補
間音素片のデータの打ち切りによる終端部の波形の急つ
激な変化は見られないので、従来方法のようにノイズ音
を発生させることなく、自然で滑らかな合成音声を得る
ことが可能である。
の波形は、それぞれ第2図A,cの波形 Jと同一であ
るが、サンプリングクロツク周期が異なる。第3図で、
補間音素片PHIは音素片PHAと音素片PHBの真中
に挿入する音素片であり、補間音素片のデータ値及びサ
ンプリングクロツク周期はともに線形補間によつて求め
たもの 4である。第3図bより明らかなように、本発
明による補間方法では従来方法の第2図bで見られた補
間音素片のデータの打ち切りによる終端部の波形の急つ
激な変化は見られないので、従来方法のようにノイズ音
を発生させることなく、自然で滑らかな合成音声を得る
ことが可能である。
第3図で、τA,τI,τBはそれぞれ音素片PHA,
PHI,PHBに対応するクロツク周期であり、iはサ
ンプルデータの番号、Nはデータ数を示す。
PHI,PHBに対応するクロツク周期であり、iはサ
ンプルデータの番号、Nはデータ数を示す。
尚、上記説明では、本発明による補間方法についてのみ
説明したが、もちろん、補間演算を行つた音素片と従来
の補間演算を行わない音素片を組み合わせて順次接続す
ることにより所望の音声信号を得ることも可能である。
説明したが、もちろん、補間演算を行つた音素片と従来
の補間演算を行わない音素片を組み合わせて順次接続す
ることにより所望の音声信号を得ることも可能である。
第4図に本発明による音声分析合成方法を実現する音声
合成装置の一実施例のプロツク図を示す。
合成装置の一実施例のプロツク図を示す。
第4図で、1は操作者が音声及び動作モードを指示する
ための操作指示部、2は汎用マイクロコンピユータ等の
制御部、3は音声発生プログラム、音素片データ等を記
憶しておくためのリード・オンリー・メモリ(ROM)
、4はプログラムの実行時に必要なデータの一時記憶あ
るいはその他の目的に使用するためのランダム・アクセ
ス・メモリ(RAM)、5はデイジタル信号をアナログ
信号に変換するDA変換器、6は増巾器、7はスピーカ
である。次に第4図に示す音声合成装置の動作について
説明する。
ための操作指示部、2は汎用マイクロコンピユータ等の
制御部、3は音声発生プログラム、音素片データ等を記
憶しておくためのリード・オンリー・メモリ(ROM)
、4はプログラムの実行時に必要なデータの一時記憶あ
るいはその他の目的に使用するためのランダム・アクセ
ス・メモリ(RAM)、5はデイジタル信号をアナログ
信号に変換するDA変換器、6は増巾器、7はスピーカ
である。次に第4図に示す音声合成装置の動作について
説明する。
操作指示部1よりの操作指示信号にしたがつて、リード
・オンリー・メモリ3に記憶された音声発生プログラム
により制御される制御部2の制御のもとに、リード・オ
ンリー・メモリ2に記憶された音素片データを、ランダ
ム・アクセス・メモリ4をデータの一時記憶メモリとし
てもちいながら、順次処理、接続し、所望の音声のディ
ジタル信号を合成する。
・オンリー・メモリ3に記憶された音声発生プログラム
により制御される制御部2の制御のもとに、リード・オ
ンリー・メモリ2に記憶された音素片データを、ランダ
ム・アクセス・メモリ4をデータの一時記憶メモリとし
てもちいながら、順次処理、接続し、所望の音声のディ
ジタル信号を合成する。
次いでDA変換器5でデイジタル信号をアナログ信号に
変換し、増巾器6でローパスフイルタ一により不要な高
周波信号を除去するとともに音声信号を増巾し、スピー
カ7を1駆動して所望の音声信号を得る。第5図は本発
明の音声分析合成方法による音声合成装置の補間による
音声信号の合成手順の一例を示すフローチヤートである
。
変換し、増巾器6でローパスフイルタ一により不要な高
周波信号を除去するとともに音声信号を増巾し、スピー
カ7を1駆動して所望の音声信号を得る。第5図は本発
明の音声分析合成方法による音声合成装置の補間による
音声信号の合成手順の一例を示すフローチヤートである
。
このフローチヤートは、補間音素片のデータ及びクロツ
ク周期をともに線形補間によつて求める場合のフローチ
ヤートである。
ク周期をともに線形補間によつて求める場合のフローチ
ヤートである。
以上説明したように本発明によれば、音素片の波形及び
ピツチの補間を行うことにより滑らかで自然な音声を合
成することが可能であり、また補間を行うことにより補
間によつて代用可能な音素片は不要となり、したがつて
その分音素片データ用メモリの容量を小さくすることが
でき、コンパクトな音声合成装置を実現することができ
る。
ピツチの補間を行うことにより滑らかで自然な音声を合
成することが可能であり、また補間を行うことにより補
間によつて代用可能な音素片は不要となり、したがつて
その分音素片データ用メモリの容量を小さくすることが
でき、コンパクトな音声合成装置を実現することができ
る。
さらに本発明による音声分析合成方法は、たとえば汎用
のマイクロコンピユータのような簡単な制御回路を有す
る音声合成装置で実現することが可能なので、簡単な構
成で高音質のまた安価な音声合成装置を提供することが
できる。また、このマイクロコンピユータの空き時間を
他の用途に適用すれば、音声出力機能の他にマイクロコ
ンピユータの高度な判断、制御機能を利用した極めて合
理的な家電製品、事務機器、端末機器、教育機器、ゲー
ム、おもちや等を実現することが可能である。
のマイクロコンピユータのような簡単な制御回路を有す
る音声合成装置で実現することが可能なので、簡単な構
成で高音質のまた安価な音声合成装置を提供することが
できる。また、このマイクロコンピユータの空き時間を
他の用途に適用すれば、音声出力機能の他にマイクロコ
ンピユータの高度な判断、制御機能を利用した極めて合
理的な家電製品、事務機器、端末機器、教育機器、ゲー
ム、おもちや等を実現することが可能である。
第1図は音素片編集型音声合析合成方法によつて合成さ
れた波形の一部を示す図、第2図A,b,cは従来の音
素片補間方法を説明するための波形図、第3図A,b,
cは本発明による音素片編集型音声分析合成方法に適合
する音素片補間方法を説明するための波形図、第4図は
本発明による音声分析合成方法を実現する音声合成装置
の一実施例のプロック図、第5図は第4図の装置におけ
る補間による音声信号の合成手順の一例を示すフローチ
ヤートである。 1・・・・・・操作指示部、2・・・・・・制御部、3
・・・・・・リード・オンリー・メモリ、4・・・・・
・ランダム・アクセス・メモリ、5・・・・・・DA変
換器、6・・・・・・増巾器、7・・・・・・スピーカ
。
れた波形の一部を示す図、第2図A,b,cは従来の音
素片補間方法を説明するための波形図、第3図A,b,
cは本発明による音素片編集型音声分析合成方法に適合
する音素片補間方法を説明するための波形図、第4図は
本発明による音声分析合成方法を実現する音声合成装置
の一実施例のプロック図、第5図は第4図の装置におけ
る補間による音声信号の合成手順の一例を示すフローチ
ヤートである。 1・・・・・・操作指示部、2・・・・・・制御部、3
・・・・・・リード・オンリー・メモリ、4・・・・・
・ランダム・アクセス・メモリ、5・・・・・・DA変
換器、6・・・・・・増巾器、7・・・・・・スピーカ
。
Claims (1)
- 【特許請求の範囲】 1 音素片データを音声合成制御情報にしたがつて順次
接続することにより音素片データを編集して所望の音声
信号を得るように構成すると共に、2つの音素片の間に
補間演算により得られる補間音素片を挿入することによ
り滑らかな音声信号を得るにあたつて、(a)2つの音
素片の間を補間すべき音素片に関し、その音素片データ
のデータ数を所定のデータ数に等しくするステップと、
(b)補間すべき音素片の先行する音素片と後続する音
素片の音素片データの同一番目のデータ値から補間演算
により補間音素片データを作成するステップと、(c)
上記補間音素片の音素片データを上記補間すべき音素片
の音素片データに挿入することによつて補間音素片を含
む音素片群の音素片データ列を得るステップと、(d)
上記補間すべき音素片の先行する音素片のクロック周期
と後続する音素片のクロック周期とから補間演算を行う
ことにより補間音素片のクロック周期を作成するステッ
プと、(e)上記補間音素片のクロック周期を上記補間
すべき音素片のクロック周期に挿入することにより補間
音素片を含む音素片群のクロック周期列を得るステップ
と、(f)上記クロック周期列の隣り合うクロック周期
の差分を求めることによつて差分クロック周期列を得る
ステップと、(g)上記クロック周期列の先頭のクロッ
ク周期及び上記差分クロック周期列をメモリに記憶する
ステップと、(h)上記メモリから読み出したクロック
周期列の先頭のクロック周期に上記メモリから読み出し
た差分クロック周期を順次加算することによつて補間音
素片を含む音素片群のクロック周期列を得るステップと
、(i)上記補間音素片を含む音素片群の音素片データ
列を上記クロック周期列で出力するステップと、を有す
ることを特徴とする音声分析合成方法。 2 音素片データを音声合成制御情報にしたがつて順次
接続することにより音素片データを編集し所望の音声信
号を得るように構成すると共に、2つの音素片の間に補
間演算により得られる補間音素片を挿入することにより
滑らかな音声信号を得るにあたつて、(a)2つの音素
片の間を補間すべき音素片に関し、その音素片データの
データ数を所定のデータ数に等しくするステップと、(
b)補間すべき音素片の先行する音素片と後続する音素
片の音素片データの同一番目のデータ値から補間演算に
より補間音素片の音素片データを作成するステップと、
(c)上記補間音素片の音素片データを上記補間すべき
音素片の音素片データに挿入することによつて補間音素
片を含む音素片群の音素片データ列を得るステップと、
(d)上記補間音素片のクロック周期は線形補間により
作成するものとし、メモリに補間すべき音素片の間に挿
入する補間音素片の個数に1を加算した値と、補間すべ
き音素片の先頭の音素片のクロック周期と、上記補間す
べき音素片の先行する音素片のクロック周期と後続する
音素片のクロック周期の差分を上記補間音素片の個数に
1を加算した値で割つた差分クロック周期とを記憶する
ステップと、(e)上記メモリから読み出した補間すべ
き音素片の先頭の音素片のクロック周期に上記メモリか
ら読み出した差分クロック周期を上記メモリから読み出
した補間音素片の個数に1を加算した値の回数順次加算
することによつて補間音素片を含む音素片群のクロック
周期列を得るステツプと、(f)上記補間音素片を含む
音素片群の音素片データ列を上記クロック周期列で出力
するステップと、を有することを特徴とする音声分析合
成方法。 3 音素片データを音声合成制御情報にしたがつて順次
接続することにより音素片データを編集して所望の音声
信号を得るように構成すると共に、2つの音素片の間に
補間演算により得られる補間音素片を挿入することによ
り滑らかな音声信号を得るにあたつて、(a)2つの音
素片の間を補間すべき音素片に関し、その音素片データ
のデータ数を所定のデータ数に等しくするステップと、
(b)補間すべき音素片の先行する音素片と後続する音
素片の音素片データの同一番目のデータ値から補間演算
により補間音素片の音素片データを作成するステップと
、(c)上記補間音素片の音素片データを上記補間すべ
き音素片の音素片データを挿入することによつて補間音
素片を含む音素片群の音素片データ列を得るステップと
、(d)上記音素片データ列の隣り合う音素片データの
同一番目のデータ値の差分を求めることによつて差分音
素片データ列を得るステップと、(e)上記音素片デー
タ列の先頭の音素片データ及び上記差分音素片データ列
をメモリに記憶するステップと、(f)上記メモリから
読み出した音素片データ列の先頭の音素片データに上記
メモリから読み出した差分音素片データを順次加算する
ことによつて補間音素片を含む音素片群の音素片データ
列を得るステップと、(g)上記補間すべき音素片の先
行する音素片のクロック周期と後続する音素片のクロッ
ク周期とから補間演算を行うことにより補間音素片のク
ロック周期を作成するステップと、(h)上記補間音素
片のクロック周期を上記補間すべき音素片のクロック周
期に挿入することにより補間音素片を含む音素片群のク
ロック周期列を得るステップと、(i)上記クロック周
期列の隣り合うクロック周期の差分を求めることによつ
て差分クロック周期列を得るステップと、(j)上記ク
ロック周期列の先頭のクロック周期及び上記差分クロッ
ク周期列をメモリに記憶するステップと、(k)上記メ
モリから読み出したクロック周期列の先頭のクロック周
期に上記メモリから読み出した差分クロック周期を順次
加算することによつて補間音素片を含む音素片群のクロ
ック周期列を得るステップと、(l)上記補間音素片を
含む音素片群の音素片データ列を上記クロック周期列で
出力するステツプと、を有することを特徴とする音声分
析合成方法。 4 音素片データを音声合成制御情報にしたがつて順次
接続することにより音素片データを編集して所望の音声
信号を得るように構成すると共に、2つの音素片の間に
補間演算により得られる補間音素片を挿入することによ
り滑らかな音声信号を得るにあたつて、(a)2つの音
素片の間を補間すべき音素片に関し、その音素片データ
のデータ数を所定のデータ数に等しくするステップと、
(b)補間すべき音素片の先行する音素片と後続する音
素片の音素片データの同一第目のデータ値から補間演算
により補間音素片の音素片データを作成するステップと
、(c)上記音素片データ列の隣り合う音素片データの
同一番目のデータ値の差分を求めることによつて差分音
素片データ列を得るステップと、(d)上記音素片デー
タ列の先頭の音素片データ及び上記差分音素片データ列
をメモリに記憶するステップと、(e)上記メモリから
読み出した音素片データ列の先頭の音素片データに上記
メモリから読み出した差分音素片データを順次加算する
ことによつて補間音素片を含む音素片群の音素片データ
列を得るステップと、(f)上記補間音素片のクロック
周期は線形補間により作成するものとし、メモリに補間
すべき音素片の間に挿入する補間音素片の個数に1を加
算した値と、補間すべき音素片の先頭の音素片のクロッ
ク周期と、上記補間すべき音素片の先行する音素片のク
ロック周期と後続する音素片のクロック周期の差分を上
記補間音素片の個数に1を加算した値で割つた差分クロ
ック周期とを記憶するステップと、(g)上記メモリか
ら読み出した補間すべき音素片の先頭の音素片のクロッ
ク周期に上記メモリから読み出した差分クロック周期を
上記メモリから読み出した補間音素片の個数に1を加算
した値の回数順次加算することによつて補間音素片を含
む音素片群のクロック周期列を得るステップと、(h)
上記補間音素片を含む音素片群の音素片データ列を上記
クロック周期列で出力するステップと、を有することを
特徴とする音声分析合成方法。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56203933A JPS5917440B2 (ja) | 1981-12-17 | 1981-12-17 | 音声分析合成方法 |
| US06/447,899 US4601052A (en) | 1981-12-17 | 1982-12-08 | Voice analysis composing method |
| DE19823246712 DE3246712A1 (de) | 1981-12-17 | 1982-12-17 | Verfahren zur zusammensetzung einer stimmenanalyse |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56203933A JPS5917440B2 (ja) | 1981-12-17 | 1981-12-17 | 音声分析合成方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58105198A JPS58105198A (ja) | 1983-06-22 |
| JPS5917440B2 true JPS5917440B2 (ja) | 1984-04-21 |
Family
ID=16482089
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56203933A Expired JPS5917440B2 (ja) | 1981-12-17 | 1981-12-17 | 音声分析合成方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5917440B2 (ja) |
-
1981
- 1981-12-17 JP JP56203933A patent/JPS5917440B2/ja not_active Expired
Also Published As
| Publication number | Publication date |
|---|---|
| JPS58105198A (ja) | 1983-06-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS623439B2 (ja) | ||
| CA1065490A (en) | Emphasis controlled speech synthesizer | |
| JPS63285598A (ja) | 音素接続形パラメ−タ規則合成方式 | |
| EP0351848B1 (en) | Voice synthesizing device | |
| US4601052A (en) | Voice analysis composing method | |
| JPH0122636B2 (ja) | ||
| JP2600384B2 (ja) | 音声合成方法 | |
| JPS5917440B2 (ja) | 音声分析合成方法 | |
| JPS58105199A (ja) | 音声分析合成方法 | |
| JPH0477320B2 (ja) | ||
| JPS6055398A (ja) | 電子楽器における波形形成方法 | |
| JPS6240718B2 (ja) | ||
| JPS5975294A (ja) | 楽音合成装置 | |
| JPH0235320B2 (ja) | ||
| JPS58100900A (ja) | 任意語の音声合成方法 | |
| JPS597996A (ja) | 音素片編集型音声合成方法 | |
| JPS59177597A (ja) | 楽音合成装置 | |
| JPS6295595A (ja) | 音声応答方式 | |
| JPS6212519B2 (ja) | ||
| JPH0536797B2 (ja) | ||
| JPS62141600A (ja) | 音声合成装置 | |
| JPH0363760B2 (ja) | ||
| JPS5898800A (ja) | 音素片編集型音声合成方式 | |
| JPH0695677A (ja) | 楽音合成装置 | |
| JPS63285596A (ja) | 音声合成における発話速度変更方式 |