JPS58162999A - 音声合成用駆動波抽出方法 - Google Patents

音声合成用駆動波抽出方法

Info

Publication number
JPS58162999A
JPS58162999A JP57046656A JP4665682A JPS58162999A JP S58162999 A JPS58162999 A JP S58162999A JP 57046656 A JP57046656 A JP 57046656A JP 4665682 A JP4665682 A JP 4665682A JP S58162999 A JPS58162999 A JP S58162999A
Authority
JP
Japan
Prior art keywords
signal
residual signal
waveform
speech
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57046656A
Other languages
English (en)
Inventor
新居 康彦
古屋 正久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP57046656A priority Critical patent/JPS58162999A/ja
Publication of JPS58162999A publication Critical patent/JPS58162999A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、音声分析合成方式における駆動波抽出方法に
関し、高品質の音声合成を可能とする駆動波抽出方法を
提供するものである。
音声分析合成方式とは、第1図a、bに示すように離散
的な音声信号に一定長の窓関係、例えば30m!I長の
ハミング窓等を掛けて切り出した有限個のデータから、
音声のスペクトル情報を表現するスペクトルパラメータ
(線形予測係数、バーコール係数または線スペクトル対
等)と、音源情報を表現する音源パラメータ(振幅、ピ
ッチ周期。
および有声無声判定)を分離して抽出し、この抽出した
パラメータを用いて元の音声信号を復元するものである
上記スペクトルパラメータは、声道フィルタの伝達特性
を規定し、また上記音源パラメータは、声道フィルタの
駆動信号を規定するものである。
音声信号には、周期性のある有声音部分と、雑音性の無
声音部分があるが、有声無声判定パラメータは、声道フ
ィルタの励振関数(駆動波形)を有声音と無声音で切換
えるだめのものである。
通常、有声音を合成する時は、励振関数としてパルス波
形や三角波形が用いられ、また無声音を合成する時は、
ランダムパルスが用いられている。
スペクトルパラメータは、音声信号を声゛道逆フィルタ
に通して得られる残差信号のスペクトルが白色化するよ
うに決定されるものである。また音源パラメータとして
、前記残差信号からエネルギー計算によって振幅が、ま
た自己相関法によって周期性の有無(有声無声判定)お
よびピッチ周期が抽出される。従って音声を合成する時
は、分析の際に得られる残差信号に相当する駆動信号を
音源パラメータから作り出して声道フィルタに入力すれ
ば良い。この場合、有声音を合成する時の駆動信号を一
様スベクトル分布を有するパルス波形を用い、その繰返
し周期と振幅を制御して作り出すのが一般的な方法であ
る。これは、スペクトルパラメータを抽出する際に、残
差信号のスペクトルを白色化するようにしているため、
合成の際にも、白色スペクトルをもつ信号で駆動するの
が理想的であるという理由による。
しかしながら、実際の音声分析では、逆フィルタの段数
が8段〜10段程度であり、また逆フィルタのモデルが
必ずしも音声信号の生成モデルと合致しないだめ、残差
信号のスペクトルは必ずしも理想的に白色化されるもの
ではない。従って、スペクトルパラメータでは表現しき
れないスペクトル情報が残差信号に含まれており、との
残差信号をパルス信号や三角波の繰返しでおきかえると
ころに合成音声の品質を劣化させる1つの原因が存在す
る。
本発明は、上記のような従来の音声合成方法における欠
点を除去するために、残差信号から切り出した波形(切
出残差駆動波と呼ぶ)を用い名ことにより、高品質の音
声合成を可能にするものであり、例えば、第2図に示す
音節/IL/の残差信号波形の中から最適な波形(第i
6フレームから切出した1ピッチ周期の波形)を抽出し
て駆動波形として用いることにより、高品質の音声合成
を可能とするものである。
残差信号の一部を切り出して駆動波形として使用する場
合、残差信号のどの部分から切り1′すかが問題となる
。本発明はこのような問題点を解決するための方法を提
供するものであり、以下に本発明の実施例について説明
する。
第3図すは、女声話者が発声した音節/2■/の音声エ
ネルギーの変化B、残差信号エネルギーの変化C1〔音
声エネルギー−〕/〔残差信号エネルギー〕の変化りを
示し、また第3図aは上記音節/Z U/の第40〜6
oフレームの範囲から切り出しだ駆動波形を用いて合成
した音声の品質評価結果ムを示している。この合成音声
の品質評価は7段階評定尺度法で行なったものであり、
合成音声の品質を(+3)〜(−3)の7段階で評価し
ている。なお第3図aでは(+O,S)〜(−1,0)
の範囲のみを示している。上記7段階評定尺度法におけ
る(+3)は自然で聞き易い音声に対応させ、(−3)
は鼻声、こもり声あるいは雑音の目立つ音声に対応させ
ている。第3図からも明らかなように、合成音声の品質
が最も良くなるのは、残差エネルギーCが最大となるフ
レームから切り出した残差信号波形を駆動波形として用
いた場合である。
第3図すにおける音声エネルギーの変化Bにおいて、第
30フレーム付近と第60フレーム付近に大きなピーク
があるが、前者は子音/Z/、後者は母音/U/の部分
に対応するものであり、母音部分において残差エネルギ
ーCが最大となるフレームから残差信号波形を切り出せ
ばよいことがわかる。
残差エネルギーが最大と外るフレームが決定されると、
次に何番目のデータから切り出せばよいかを決定しなけ
ればならない。
今、離散的な音声信号系列を(X (nl )とすると
、その離散的フーリエ変換X(k)は、 (タタシ、WN =e) (2rr/N ) )と表わ
される。Nはサンプル数である。
ここで、1(==Qとすれば直流成分のみが、として求
められる。
上記(2)式をHの関係とみなして、 とおく。X (0,N )は音声信号の積分値であり、
高周波成分の性質が抑制され、低周波成分の性質(ピッ
チ周期)が強く現われる。Nがオ度ピッチ周期となると
ころでは積分値は極小となる。
第4図は実際の音声信号x (nlについて積分値X(
0,N )を計算したものであり、X (0,N )が
極小となるNの値(N4)を求めることによってピッチ
周期が求まり、またこの点がピッチ周期の始まる時点と
よく一致することがわかる。
第4図aは実際の音声信号x (nl、第4図すは積分
値X (0,N ) 、第4図Cは残差信号etn+を
示している。
なお、ピッチの高調波成分が強い音声信号では、積分波
形X (0,N )がピッチの基本周期以外のサンプル
点でも極小となる個所が出現する7゜このような場合に
は、積分波形に平滑化処理を施してから極小値を求めれ
ばよいものである。
このように、本発明では、まず、残差信号エネルギーが
最大となるフレームを決定し、当該フレームに対応した
音声データについて(3)式のX(O。
N)を計算し、その極小値を与えるN、mを決定する。
次に第4図Cに示すように当該フレームの残差信号の第
(N−)番目のサンプル点から指定され、゛ た個数(に(通常は1ピッチ周期以内)のデータを駆動
波形として抽出するものである。
第5図は本発明による音声合成用駆動波抽出方法の流れ
図を示している。
本発明は上記のような構成であり、本発明によれば、抽
出する駆動波形の長さくサンプル数M)を指定するのみ
で、最適な残差駆動波を自動的に切り出せる利点があり
、さらに、このようにして切り出した残差駆動波を用い
て音声を合成すれば、極めて高品質の合成音声が得られ
る利点があるものである。
【図面の簡単な説明】
第1図a、bは従来の音声分析合成方式の概略図、第2
図は残差信号から駆動波を切り出す状態を示す図、第3
図aは女性の発声した音節/ZU/の残差駆動波を用い
た合成音声の評価結果を示す図、第3図すは女性の発声
した音節/Z U/の音声エネルギーB、残差信号エネ
ルギーC1およびエネルギー比を示す図、第4図a、b
、cはそれぞれ音声信号、その積分波形および残差信号
波形を示す図、第6図は本発明による音声合成用駆動波
抽出方法の流れ図である。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第3図 第4図 N島^ 第5図

Claims (1)

    【特許請求の範囲】
  1. (1)音声信号を逆フィルタリングして得られる残差信
    号のエネルギーが最大となるフレームを検出し、この検
    出されたフレームの音声信号を積分した信号が極小とな
    るサンプル点より所定のサンプル数の残差信号データを
    抽出して音声合成用駆動波とすることを特徴とする音声
    合成用駆動波抽出方法。 ?)音声信号を積分した信号を平滑化処理した後に、上
    記積分した信号が極小となるサンプル点を■めることを
    特徴とする特許請求の範囲第1項記載の音声合成用駆動
    波抽出方法。
JP57046656A 1982-03-23 1982-03-23 音声合成用駆動波抽出方法 Pending JPS58162999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57046656A JPS58162999A (ja) 1982-03-23 1982-03-23 音声合成用駆動波抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57046656A JPS58162999A (ja) 1982-03-23 1982-03-23 音声合成用駆動波抽出方法

Publications (1)

Publication Number Publication Date
JPS58162999A true JPS58162999A (ja) 1983-09-27

Family

ID=12753363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57046656A Pending JPS58162999A (ja) 1982-03-23 1982-03-23 音声合成用駆動波抽出方法

Country Status (1)

Country Link
JP (1) JPS58162999A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01197799A (ja) * 1988-02-02 1989-08-09 Meidensha Corp 音声合成装置の調音・音源パラメータ生成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01197799A (ja) * 1988-02-02 1989-08-09 Meidensha Corp 音声合成装置の調音・音源パラメータ生成方法

Similar Documents

Publication Publication Date Title
US9031834B2 (en) Speech enhancement techniques on the power spectrum
Shrawankar et al. Techniques for feature extraction in speech recognition system: A comparative study
Talkin et al. A robust algorithm for pitch tracking (RAPT)
JP2763322B2 (ja) 音声処理方法
Meseguer Speech analysis for automatic speech recognition
JP2904279B2 (ja) 音声合成方法および装置
Buza et al. Voice signal processing for speech synthesis
Acero Source-filter models for time-scale pitch-scale modification of speech
JPS58162999A (ja) 音声合成用駆動波抽出方法
Ohtsuka et al. Aperiodicity control in ARX-based speech analysis-synthesis method.
Jung et al. Pitch alteration technique in speech synthesis system
JP3035939B2 (ja) 音声分析合成装置
JPS5888798A (ja) 音声合成方式
JPS5965895A (ja) 音声合成方法
Lawlor A novel efficient algorithm for voice gender conversion
Shah et al. A novel filtering-based F 0 estimation algorithm with an application to voice conversion
JPS5961891A (ja) 残差信号符号化方法
KR940008839B1 (ko) 켑스트럼 분석에 의한 음성 파형코딩의 피치 변경 방법
KR930011736B1 (ko) 음성신호의 피치반분법에 의한 파형코딩과 혼성코딩의 피치 조절방법
Ishaq et al. Vowel enhancement in early stage spanish esophageal speech using natural glottal flow pulse and vocal tract frequency warping
JPS61259300A (ja) 音声合成方式
Krithiga et al. Improved tamil text to speech synthesis
JPS5965897A (ja) 残差信号符号化方法
Faycal et al. Pitch modification of speech signal using source filter model by linear prediction for prosodic transformations
Gokhale et al. Analysis and synthesis of speech using least P th norm filter design