JPH0266599A - 音声合成方式 - Google Patents

音声合成方式

Info

Publication number
JPH0266599A
JPH0266599A JP63219370A JP21937088A JPH0266599A JP H0266599 A JPH0266599 A JP H0266599A JP 63219370 A JP63219370 A JP 63219370A JP 21937088 A JP21937088 A JP 21937088A JP H0266599 A JPH0266599 A JP H0266599A
Authority
JP
Japan
Prior art keywords
pitch period
sound source
signal
speech
synthesized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63219370A
Other languages
English (en)
Inventor
Kazuhiko Iwata
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63219370A priority Critical patent/JPH0266599A/ja
Publication of JPH0266599A publication Critical patent/JPH0266599A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声合成方式に関する。
(従来の技術) 音声を合成する方式として、人間が発声した音声信号を
人間の声道の特性を表すパラメータと音源を表す信号と
に分離しておき、声道の特性を表すパラメータで表され
る特性を持った音声合成フィルタを構成し、音源を表す
信号を音声合成フィルタに入力し、このときの出力を合
成音声とする方式が知られている。声道の特性を表すパ
ラメータとしては、線形予測係数、線スペクトル対、ホ
ルマントなどのパラメータが知られている。一方、音源
を表す信号としては、声帯の振動を伴う有声音の音源と
してはパルス列が、声帯振動を伴わない無声音の音源と
してはランダム雑音が用いられることが多い。しがしな
がら、パルス列やランダム雑音を用いた場合の合成音声
の品質はかなり低い。合成音声の品質を向上させるため
に、パラメータによって声道の特性をモデル化した際の
モデル化誤差を音源として用いることもある。以下では
、このモデル化誤差のことを残差と呼ぶことにする。残
差を音源として用いる音声合成方式としては、例えば、
佐藤氏による日本音響学会昭和56年度秋季研究発表会
講演論文集1−2−16「音韻連鎖と残差波形を用いた
音声合成」(文献1)等で詳述されている。
一般に、予め人間が発声した音声をもとにして、合成音
声を生成する方式の場合、声帯の振動を伴う有声音区間
においては、もとの音声のピッチ周期と異なるピッチ周
期で合成しなければならない。このとき、先に上げた文
献でも述べられているが、残差を音源として用いる音声
合成方式においては、もとのピッチ周期よりも長いピッ
チ周期で合成する場合には、残差が不足する。そこで、
不足分の長さを補うために、値が零である信号を残差の
後ろに付は加えることによってピッチ周期の伸張を行う
。もとのピッチ周期よりも短いピッチ周期で合成する場
合には、残差を途中で打ち切ることによりピッチ周期の
短縮を行う。
第4図は、このような従来方式におけるピッチ周期の伸
張方法を説明するための図である。第4図の401は、
もとの残差の例を示す図、402は401のピッチ周期
を伸張したものの例を示す図、403は402を音声合
成フィルタに入力して得られた合成音声の例を示す図で
ある。図において、時間軸に垂直に引かれた実線は、ピ
ッチ区間の境界を示している。もとの残差のピッチ周期
は、第4図401のピッチ周期T1であるが、合成した
い音声のピッチ周期T2が第4図402に示すようにピ
ッチ周期T1よりも長い場合は、不足する長さを補うた
めに、値が零である信号(区間B)をもとの残差(区間
A)の後ろに付は加える。これを、音声合成フィルタに
入力し、第4図403に示すような合成音声を得る。こ
のようにして、もとのピッチ周期T1よりも長いピッチ
周期T2を持つ音声を合成していた。
(発明が解決しようとする問題点) このように、残差を音源として用いる音声合成方式では
、従来、残差のピッチ周期よりも長いピッチ周期で合成
する場合に、残差の後ろに零を付は加えることによって
不足分の長さを補っていた。しかしながら、もとのピッ
チ周期よりもかなり長い、例えば2倍以上の長さのピッ
チ周期で合成する場合には、合成される音声の音質が著
しく劣化してしまうという問題があった。
これに対して本発明は、残差を音源として用いる音声合
成方式において、もとの残差のピッチ周期よりも長いピ
ッチ周期で合成した場合にも、音質劣化の少ない良質な
合成音声を生成することができる音声合成方式を提供す
ることを目的としている。
(問題点を解決するための手段) 第1の本発明は、音声を声道特性を表すパラメータと音
源信号とに分離し、前記音源信号のピッチ周期が所望の
ピッチ周期となるように制御し、前記声道特性を表すパ
ラメータと前記所望のピッチ周期を持った音源信号とか
ら所望のピッチ周期を持った音声信号を合成する音声合
成方式において、音源信号を前記音源のスペクトル特性
を表す音源パラメータを用いてモデル化して、前記音源
パラメータと前記モデル化の誤差信号とに分離し、前記
モデル化の誤差信号のピッチ周期が所望のピッチ周期と
なるように制御し、前記音源パラメータと前記所望のピ
ッチ周期を持ったモデル化の誤差信号とから所望のピッ
チ周期を持った音源信号を合成し、前記声道特性を表す
パラメータと前記所望のピッチ周期を持った音源信号と
から所望のピッチ周期を持った音声信号を合成すること
を特徴とする特 また、第2の本発明は、音源パラメータとモデル化の誤
差信号を予め求めて格納しておき、前記格納されたモデ
ル化の誤差信号のピッチ周期が所望のピッチ周期となる
ように制御し、前記格納された音源パラメータと前記所
望のピッチ周期を持ったモデル化の誤差信号とを用いて
所望のピッチ周期の音源信号を生成することを特徴とす
る。
(作用) 本発明では、残差を音源として用いる音声合成方式にお
いて、合成したいピッチ周期かもとの音声のピッチ周期
よりも長い場合に、音声合成フィルタへの入力である残
差を前記残差のスペクトル特性を表すパラメータを用い
てモデル化する。このときのパラメータとしては、線形
予測係数、線スペクトル対、ケプストラム、改良ケプス
トラムなどを用いることができるが、ここでは、線形予
測係数を用いる場合を例にとって説明する。すなわち、
残差を線形予測分析すると、さらにその予測誤差が生じ
る。これにより、残差を線形予測係数と予測誤差とに分
離することができる。もとの残差のピッチ周期よりも長
いピッチ周期が必要な場合、従来方式では第4図に示す
ように、不足分を補うために、残差の後ろに零を付は加
えていた。
これに対して本発明では、残差を線形予測分析しておき
、残差の予測誤差に必要な長さの零を付は加えて残差の
線形予測フィルタに入力し、音声合成フィルタへの入力
となる音源を合成する。第3図は本発明の音声合成方式
におけるピッチ周期の伸張方法を説明するための図であ
る。第3図301は、もとの残差を線形予測分析した際
の予測誤差の例を示す図、302は301のピッチ周期
を伸張したものの例を示す図、303は302を残差の
線形予測フィルタに人力して得られた音源信号の例を示
す図、304は303を音声合成フィルタに入力して得
られた合成音声の例を示す図である。図において、時間
軸に垂直に引かれた実線は、ピッチ区間の境界を示して
いる。もとの残差のピッチ周期は、第3図301のピッ
チ周期T1であるが、合成したい音声のピッチ周期T2
が第3図302に示すようにピッチ周期T1よりも長い
場合は、第3図301の残差を線形予測分析した際゛の
予測誤差に(T2−T1)の長さの値が零である信号を
付は加える。これを残差の線形予測フィルタに入力する
ことにより、第3図303に示すようなピッチ周期がT
2である残差が合成される。
したがって、第3図303に示す残差では、もとの残差
では不足している区間Bの信号が、区間Aの信号を用い
て線形予測により合成され、補われていることになる。
これを、音声合成フィルタに人力し、第3図304に示
すような合成音声を得る。
このように、残差の不足する区間に零を付は加えている
従来方式とは異なり、不足する区間の信号をもとの残差
を用いて合成し、音声合成フィルタへの入力、すなわち
音源として用いる。このような方式により、もとの残差
のピッチ周期よりも長いピッチ周期で合成した場合でも
、音質劣化の少ない良質な合成音声を生成することが可
能となる。
(実施例) 第1図は、第1の本発明による音声合成方式を実現する
ための一実施例を示すブロック図である。
人間が発声した音声信号は、予め分析を行って声道特性
を表すパラメータと音源信号とに分離されている。声道
特性を表すパラメータとしては、線形予測係数、線スペ
クトル対、ケプストラム、改良ケプストラムなどを用い
ることができる。この声道特性を表すパラメータは、フ
ィルタパラメータ記憶部104に記憶される。一方、音
源信号は音源信号記憶部105に蓄えられる。
合成音声を得るには、まず、合成したい音声の声道特性
を表すパラメータと音源信号とを選択する信号を、フィ
ルタパラメータ選択信号入力端子101、音源信号選択
信号入力端子102がらそれぞれ人力する。また、合成
したい音声のピッチ周期をピッチ周期入力端子103か
ら人力する。
前記フィルタパラメータ選択信号にしたがってフィルタ
パラメータ記憶部104に蓄えられている声道特性を表
すパラメータが選択され、音声合成フィルタ部109に
送られる。また、音源信号記憶部105は、音源信号選
択信号入力端子102から人力された前記音源信号選択
信号にしたがって音源信号を選択し、音源信号分析部1
06に送る。音源信号分析部106は、スペクトル特性
を表すパラメータを用いて前記音源信号をモデル化し、
スペクトル特性を表すパラメータと、モデル化の誤差信
号とに分離する。前記音源信号のスペクトル特性を表す
パラメータとしては、線形予測係数、線スペクトル対、
ケプストラム、改良ケプストラムなどを用いることがで
きる。得られたスペクトル特性を表すパラメータは、音
源合成フィルタ部108に送られる。また、得られたモ
デル化の誤差信号は、ピッチ周期制御部107に送られ
る。ピッチ周期制御部107は、(作用)の項でも述べ
たように、前記モデル化の誤差信号とピッチ周期を前記
ピッチ周期入力端子103から人力されたピッチ周期と
等しい長さになるように制御し、音源合成フィルタ部1
08に送る。音源合成フィルタ部108は、前記スペク
トル特性を表すパラメータと前記ピッチ周期を制御され
たモデル化の誤差信号とを用い、前記入力されたピッチ
周期と等しい長さの音源信号を合成し、音声合成フィル
タ部109に送る。音声合成フィルタ部109は、前記
フィルタパラメータ記憶部104から送られた声道特性
を表すパラメータを用いて音声合成フィルタを形成し、
音源合成フィルタ部108によって合成された音源信号
を前記音声合成フィルタの入力として音声信号を合成し
、合成音声出力端子110に出力する。
上記の実施例では、合成時に音源信号分析部106で音
源信号のスペクトル特性を表すパラメータとモデル化の
誤差信号とを求め、これらを用いて音源合成フィルタ部
108において入力されたピッチ周期と等しい長さの音
源信号を生成していた。音源信号のスペクトル特性を表
すパラメータとモデル化の誤差信号を予めピッチごとに
分析して格納しておき、合成時にこれを読み出して用い
るようにすることもできる。これが第2の本発明の原理
である。第2図は、このような第2の本発明による音声
合成方式を実現するための一実施例を示すブロック図で
ある。前記音源信号選択信号入力端子202から入力さ
れた音源信号を選択する信号は、音源データ選択信号生
成部205に送られる。音源データ選択信号生成部20
5は、前記音源信号を選択する信号に基づいて、音源の
スペクトル特性を表すパラメータを選択する信号と、そ
れに対応するモデル化の誤差信号を選択する信号とを生
成し、それぞれ音源フィルタパラメータ記憶部206、
誤差信号記憶部207に送る。音源フィルタパラメータ
記憶部206は、選択された音源フィルタパラメータを
読み出し、音源合成フィルタ部208に送る。また、誤
差信号記憶部207は、選択された前記モデル化の誤差
信号を読み出し、前記読み出された誤差信号のピッチ周
期が、前記ピッチ周期入力端子203がら入力されたピ
ッチ周期と等しい長さになるように制御し、音源合成フ
ィルタ部208送る。上記以外の部分は第1図と同様で
あり、その動作は先の説明から明らかであるので説明を
省略する。
(発明の効果) 以上部べてきたように、本発明によれば、もとの残差の
ピッチ周期よりも短いピッチ周期で合成した場合は勿論
のこと、非常に長いピッチ周期で合成した場合にも、音
質劣化の少ない良質な合成音声を生成することが可能で
ある。したがって、本発明は、ピッチ周期を任意に変化
させる必要がある場合でも、音質劣化の少ない良質な合
成音声を生成することが可能な音声合成方式として有効
である。
【図面の簡単な説明】
第1図は第1の本発明による音声合成方式を実現するた
めの一実施例を示すブロック図、第2図は第2の本発明
による音声合成方式を実現するための一実施例を示すブ
ロック図、第3図は本発明の音声合成方式におけるピッ
チ周期の伸張方法を説明するための図、第4図は従来方
式におけるピッチ周期の伸張方法を説明するための図で
ある。 第1図において、101・・・フィルタパラメータ選択
信号入力端子、102・・・音源信号選択信号入力端子
、103・・・ピッチ周期入力端子、104・・、フィ
ルタパラメータ記憶部、105・・・音源信号記憶部、
10600.音源信号分析部、107・・・ピッチ周期
制御部、108・・・音源合成フィルタ部、109・・
・音声合成フィルタ部、110・・・合成音声出力端子
である。 また、第2図において、201・・・フィルタパラメー
タ選択信号入力端子、202 、、、音源信号選択信号
入力端子、203.・・ピッチ周期入力端子、204・
・・フィルタパラメータ記憶部、205・1.音源デー
タ選択信号生成部、206・・・音源フィルタパラメー
タ記憶部、207・・・誤差信号記憶部、2081.音
源合成フィルタ部、209・・・音声合成フィルタ部、
210・・・合成音声出力端子である。

Claims (2)

    【特許請求の範囲】
  1. (1)音声を声道特性を表すパラメータと音源信号とに
    分離し、前記音源信号のピッチ周期が所望のピッチ周期
    となるように制御し、前記声道特性を表すパラメータと
    前記所望のピッチ周期を持った音源信号とから所望のピ
    ッチ周期を持った音声信号を合成する音声合成方式にお
    いて、音声信号を前記音源信号のスペクトル特性を表す
    音源パラメータを用いてモデル化して、前記音源パラメ
    ータと前記モデル化の誤差信号とに分離し、前記モデル
    化の誤差信号のピッチ周期が所望のピッチ周期となるよ
    うに制御し、前記音源パラメータと前記所望のピッチ周
    期を持ったモデル化の誤差信号とから所望のピッチ周期
    を持った音源信号を合成し、前記声道特性を表すパラメ
    ータと前記所望のピッチ周期を持った音源信号とから所
    望のピッチ周期を持った音声信号を合成することを特徴
    とする音声合成方式。
  2. (2)特許請求の範囲第1項記載の音声合成方式におい
    て、音源パラメータとモデル化の誤差信号を予め求めて
    格納しておき、前記格納されたモデル化の誤差信号のピ
    ッチ周期が所望のピッチ周期となるように制御し、前記
    格納された音源パラメータと前記所望のピッチ周期を持
    ったモデル化の誤差信号とを用いて所望のピッチ周期の
    音源信号を生成することを特徴とする音声合成方式。
JP63219370A 1988-08-31 1988-08-31 音声合成方式 Pending JPH0266599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63219370A JPH0266599A (ja) 1988-08-31 1988-08-31 音声合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63219370A JPH0266599A (ja) 1988-08-31 1988-08-31 音声合成方式

Publications (1)

Publication Number Publication Date
JPH0266599A true JPH0266599A (ja) 1990-03-06

Family

ID=16734352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63219370A Pending JPH0266599A (ja) 1988-08-31 1988-08-31 音声合成方式

Country Status (1)

Country Link
JP (1) JPH0266599A (ja)

Similar Documents

Publication Publication Date Title
JPH031200A (ja) 規則型音声合成装置
KR20170107283A (ko) 자연어 음성인식의 성능향상을 위한 데이터 증강방법
JPH06266390A (ja) 波形編集型音声合成装置
WO2003010752A1 (fr) Appareil d'elargissement de la largeur de bande vocale et procede d'elargissement de la largeur de bande vocale
JPH086592A (ja) 音声合成方法及び装置
JPH08254993A (ja) 音声合成装置
JP2600384B2 (ja) 音声合成方法
JPH09319391A (ja) 音声合成方法
JPH0266599A (ja) 音声合成方式
JPH0266600A (ja) 音声合成方式
US7130799B1 (en) Speech synthesis method
JP3394281B2 (ja) 音声合成方式および規則合成装置
JPS6162100A (ja) マルチパルス型符号化復号化装置
JP3063088B2 (ja) 音声分析合成装置、音声分析装置及び音声合成装置
JP2615856B2 (ja) 音声合成方法とその装置
JP2844672B2 (ja) 声帯声道型音声分析装置
JP3074703B2 (ja) マルチパルス符号化装置
JP2709198B2 (ja) 音声合成方法
JP3284634B2 (ja) 規則音声合成装置
JPS61128299A (ja) 音声処理装置
JP2937322B2 (ja) 音声合成装置
JPH0594199A (ja) 残差駆動型音声合成装置
JP2797300B2 (ja) 音声合成装置
JPH09258796A (ja) 音声合成方法
JPS63244100A (ja) 音声分析装置および音声合成装置