JPH0244079B2 - - Google Patents
Info
- Publication number
- JPH0244079B2 JPH0244079B2 JP58181169A JP18116983A JPH0244079B2 JP H0244079 B2 JPH0244079 B2 JP H0244079B2 JP 58181169 A JP58181169 A JP 58181169A JP 18116983 A JP18116983 A JP 18116983A JP H0244079 B2 JPH0244079 B2 JP H0244079B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- analysis
- sections
- input
- units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Telephone Function (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、入力音声から周波数スペクトル包絡
と音源パラメータとを抽出する音声分析装置にお
いて、時間的に異なるタイミングで音声分析を行
う複数の音声分析部を備え、複数のパラメータ時
系列を抽出する音声分析装置に関するものであ
る。
と音源パラメータとを抽出する音声分析装置にお
いて、時間的に異なるタイミングで音声分析を行
う複数の音声分析部を備え、複数のパラメータ時
系列を抽出する音声分析装置に関するものであ
る。
一般に、入力音声からパラメータを抽出する音
声分析装置として、まずアナログの音声信号をデ
イジタルの音声信号に変換し、しかる後、音声周
波数スペクトルを表わすパラメータと音源を表わ
すパラメータとを抽出する装置があり、このよう
なパラメータを抽出する方式は、PARCORや
LSPと呼ばれる方式としても知られている。周波
数ペクトルの包絡は音声の音色、特徴を決めるも
のであり、音源パラメータは音の強弱、高低を決
めるものである。
声分析装置として、まずアナログの音声信号をデ
イジタルの音声信号に変換し、しかる後、音声周
波数スペクトルを表わすパラメータと音源を表わ
すパラメータとを抽出する装置があり、このよう
なパラメータを抽出する方式は、PARCORや
LSPと呼ばれる方式としても知られている。周波
数ペクトルの包絡は音声の音色、特徴を決めるも
のであり、音源パラメータは音の強弱、高低を決
めるものである。
従来の音声分析装置では、一定の周期でフレー
ム分析を行うため、フレーム位置による分析エラ
ーが少なくない。従つて、このような分析エラー
は、発声を複数回行うか、オペレータによる手直
しを行うかによりこれに対処していた。
ム分析を行うため、フレーム位置による分析エラ
ーが少なくない。従つて、このような分析エラー
は、発声を複数回行うか、オペレータによる手直
しを行うかによりこれに対処していた。
合成音を出力するため、そのパラメータを音声
分析装置を使つて得る場合、音声分析装置におけ
るフレーム位置に起因するような分析エラーがあ
ると、そのパラメータを使つた合成音の品質も悪
いものとなつてしまう。
分析装置を使つて得る場合、音声分析装置におけ
るフレーム位置に起因するような分析エラーがあ
ると、そのパラメータを使つた合成音の品質も悪
いものとなつてしまう。
本発明は、上記の考察に基づくものであつて、
1回の発声により得られる発声信号で分析エラー
のない良質のパラメータを得ることができる音声
分析装置を提供することを目的とするものであ
る。
1回の発声により得られる発声信号で分析エラー
のない良質のパラメータを得ることができる音声
分析装置を提供することを目的とするものであ
る。
そのために本発明の音声分析装置は、入力音声
から周波数スペクトル包絡と音源パラメータを抽
出する複数の音声分析部、及び上記複数の音声分
析部の夫々に対して時間的に異なるタイミング信
号を供給して異なるタイミングで音声分析を行う
ように制御する制御部を具備し、1つの入力音声
から分析結果として複数のパラメータ時系列を得
るように構成されたことを特徴とするものであ
り、さらには、上記複数の音声分析部対応に抽出
されたパラメータ時系列から合成音を生成する複
数の音声合成部、上記複数の音声分析部に供給さ
れる入力音声と上記複数の音声合成部の夫々で生
成された合成音との類似度を計算する複数の類似
度計算部、及び上記複数の類似度計算部で計算さ
れた類似度をもとに最も音声信号に類似した合成
音を生成するパラメータ時系列を分析結果として
選択する選択部を具備することを特徴とするもの
である。
から周波数スペクトル包絡と音源パラメータを抽
出する複数の音声分析部、及び上記複数の音声分
析部の夫々に対して時間的に異なるタイミング信
号を供給して異なるタイミングで音声分析を行う
ように制御する制御部を具備し、1つの入力音声
から分析結果として複数のパラメータ時系列を得
るように構成されたことを特徴とするものであ
り、さらには、上記複数の音声分析部対応に抽出
されたパラメータ時系列から合成音を生成する複
数の音声合成部、上記複数の音声分析部に供給さ
れる入力音声と上記複数の音声合成部の夫々で生
成された合成音との類似度を計算する複数の類似
度計算部、及び上記複数の類似度計算部で計算さ
れた類似度をもとに最も音声信号に類似した合成
音を生成するパラメータ時系列を分析結果として
選択する選択部を具備することを特徴とするもの
である。
以下、本発明の実施例を図面を参照しつつ説明
する。
する。
第1図は本発明の1実施例構成を示す図、第2
図は第1図に示す本発明の1実施例の応用例を示
す図、第3図は第1図に示す本発明の1実施例の
他の応用例を示す図である。図において、1は前
処理部、2−1ないし2−nは分析部、3は制御
部、4−1ないし4−nは合成部、5−1ないし
5−nは類似度計算部、6は選択部、7は音声分
割部を示す。
図は第1図に示す本発明の1実施例の応用例を示
す図、第3図は第1図に示す本発明の1実施例の
他の応用例を示す図である。図において、1は前
処理部、2−1ないし2−nは分析部、3は制御
部、4−1ないし4−nは合成部、5−1ないし
5−nは類似度計算部、6は選択部、7は音声分
割部を示す。
第1図において、前処理部1は、入力されたア
ナログの音声信号をデイジタルの音声信号に変換
したり、高音域を強調するような処理を施した
り、所謂入力された音声信号に対して前処理を施
すものである。分析部2−1ないし2−nは、
夫々時間的に異なるタイミングで周波数スペクト
ル包絡や音源パラメータを抽出し分析するもので
あり、制御部3は、分析部2−1ないし2−nに
夫々時間的に異なるタイミング信号を供給して分
析部2−1ないし2−nの動作を制御するもので
ある。以上のような構成により、1回の発声によ
る音声信号に対して複数の分析部2−1ないし2
−nから異なつたフレーム位置の分析結果である
複数のパラメータ時系列を抽出することができ
る。従つて、これらの複数のパラメータ時系列を
使つて試聴・比較を行い、その中からよりよいパ
ラメータを選択することができる。
ナログの音声信号をデイジタルの音声信号に変換
したり、高音域を強調するような処理を施した
り、所謂入力された音声信号に対して前処理を施
すものである。分析部2−1ないし2−nは、
夫々時間的に異なるタイミングで周波数スペクト
ル包絡や音源パラメータを抽出し分析するもので
あり、制御部3は、分析部2−1ないし2−nに
夫々時間的に異なるタイミング信号を供給して分
析部2−1ないし2−nの動作を制御するもので
ある。以上のような構成により、1回の発声によ
る音声信号に対して複数の分析部2−1ないし2
−nから異なつたフレーム位置の分析結果である
複数のパラメータ時系列を抽出することができ
る。従つて、これらの複数のパラメータ時系列を
使つて試聴・比較を行い、その中からよりよいパ
ラメータを選択することができる。
本発明の応用例を示したのが第2図である。第
2図において、合成部4−1ないし4−nは、
夫々分析部2−1ないし2−nにより得られたパ
ラメータ時系列を合成し、合成音を生成するもの
であり、類似度計算部5−1ないし5−nは、こ
の合成音と分析部2−1ないし2−nに供給され
る入力音声との類似度計算を行うものである。類
似度の尺度としては、スペクトル歪やケプストラ
ム距離等の方式が使用できる。選択部6は、類似
度計算部5−1ないし5−nによつて計算された
類似度をもとに最も原音(入力音声)に類似した
合成音を生成するパラメータ時系列を分析結果と
して選択するものである。このような構成により
フレーム位置に起因する分析エラーを除去し、よ
り品質の良い合成音を出力するためのパラメータ
を得ることができる。
2図において、合成部4−1ないし4−nは、
夫々分析部2−1ないし2−nにより得られたパ
ラメータ時系列を合成し、合成音を生成するもの
であり、類似度計算部5−1ないし5−nは、こ
の合成音と分析部2−1ないし2−nに供給され
る入力音声との類似度計算を行うものである。類
似度の尺度としては、スペクトル歪やケプストラ
ム距離等の方式が使用できる。選択部6は、類似
度計算部5−1ないし5−nによつて計算された
類似度をもとに最も原音(入力音声)に類似した
合成音を生成するパラメータ時系列を分析結果と
して選択するものである。このような構成により
フレーム位置に起因する分析エラーを除去し、よ
り品質の良い合成音を出力するためのパラメータ
を得ることができる。
さらに、本発明の他の応用例を示したのが第3
図である。第3図において、音声分割部7は、音
声区間を分割するものであり、ここで分割された
音声区間毎に、選択部6は、類似度計算部5−1
ないし5−nにより評価された複数の合成音のう
ち最も原音に類似した合成音を生成するパラメー
タ時系列を分析結果として選択する。音声区間の
分割は、無音の状態が一定長続いたことにより入
力音声を複数の音声区間に分解したり、或いは得
られたパラメータの変動量が一定値以下の区間の
存在により入力音声を複数の音声区間に分解した
りする方式を採用することができる。前者の一定
長の無音により分解する方式は、音声の区切りで
分解されるのに対し、後者のパラメータの変動量
が一定値以下の区間の存在により分解する方式
は、音声の母音の中間で分割される。音声の母音
の中間は安定しているので、この部分で音声区間
を分割し、最も原音に類似した合成音を生成する
パラメータ時系列を選択し、継ぎ合わせるもので
ある。なお、パラメータの変動量が一定値以下の
区間の存在を検出する場合の音声分割部7の入力
は、第3図における前処理部1の出力よりもむし
ろ分析部2−1ないし2−nの出力が供給される
方がよい。
図である。第3図において、音声分割部7は、音
声区間を分割するものであり、ここで分割された
音声区間毎に、選択部6は、類似度計算部5−1
ないし5−nにより評価された複数の合成音のう
ち最も原音に類似した合成音を生成するパラメー
タ時系列を分析結果として選択する。音声区間の
分割は、無音の状態が一定長続いたことにより入
力音声を複数の音声区間に分解したり、或いは得
られたパラメータの変動量が一定値以下の区間の
存在により入力音声を複数の音声区間に分解した
りする方式を採用することができる。前者の一定
長の無音により分解する方式は、音声の区切りで
分解されるのに対し、後者のパラメータの変動量
が一定値以下の区間の存在により分解する方式
は、音声の母音の中間で分割される。音声の母音
の中間は安定しているので、この部分で音声区間
を分割し、最も原音に類似した合成音を生成する
パラメータ時系列を選択し、継ぎ合わせるもので
ある。なお、パラメータの変動量が一定値以下の
区間の存在を検出する場合の音声分割部7の入力
は、第3図における前処理部1の出力よりもむし
ろ分析部2−1ないし2−nの出力が供給される
方がよい。
以上の説明から明らかなように、本発明によれ
ば、1回の発声による入力音声から複数の音声分
析部で異なつたフレーム位置のパラメータ時系列
を得、それらのパラメータを選択し得るようにし
たので、フレーム位置に起因する分析エラーや局
所的エラーを除去し、より品質の良い合成音を出
力するためのパラメータを容易に得ることができ
る。
ば、1回の発声による入力音声から複数の音声分
析部で異なつたフレーム位置のパラメータ時系列
を得、それらのパラメータを選択し得るようにし
たので、フレーム位置に起因する分析エラーや局
所的エラーを除去し、より品質の良い合成音を出
力するためのパラメータを容易に得ることができ
る。
第1図は本発明の1実施例構成を示す図、第2
図は第1図に示す本発明の1実施例の応用例を示
す図、第3図は第1図に示す本発明の1実施例の
他の応用例を示す図である。 1…前処理部、2−1ないし2−n…分析部、
3…制御部、4−1ないし4−n…合成部、5−
1ないし5−n…類似度計算部、6…選択部、7
…音声分割部。
図は第1図に示す本発明の1実施例の応用例を示
す図、第3図は第1図に示す本発明の1実施例の
他の応用例を示す図である。 1…前処理部、2−1ないし2−n…分析部、
3…制御部、4−1ないし4−n…合成部、5−
1ないし5−n…類似度計算部、6…選択部、7
…音声分割部。
Claims (1)
- 【特許請求の範囲】 1 入力音声から周波数スペクトル包絡と音源パ
ラメータを抽出する複数の音声分析部、及び上記
複数の音声分析部の夫々に対して時間的に異なる
タイミング信号を供給して異なるタイミングで音
声分析を行うように制御する制御部を具備し、1
つの入力音声から分析結果として複数のパラメー
タ時系列を得るように構成されたことを特徴とす
る音声分析装置。 2 入力音声から周波数スペクトル包絡と音源パ
ラメータを抽出する複数の音声分析部、上記複数
の音声分析部の夫々に対して時間的に異なるタイ
ミング信号を供給して異なるタイミングで音声分
析を行うよう制御する制御部、上記複数の音声分
析部対応に抽出されたパラメータ時系列から合成
音を生成する複数の音声合成部、上記複数の音声
分析部に供給される入力音声と上記複数の音声合
成部の夫々で生成された合成音との類似度を計算
する複数の類似度計算部、及び上記複数の類似度
計算部で計算された類似度をもとに最も入力音声
に類似した合成音を生成するパラメータ時系列を
分析結果として選択する選択部を具備することを
特徴とする音声分析装置。 3 特許請求の範囲第2項に記載された音声分析
装置において、入力音声を複数の音声区間に分割
する音声分割部を具備し、選択部は上記音声分割
部で分割された音声区間毎にパラメータ時系列を
選択するように構成されたことを特徴とする音声
分析装置。 4 特許請求の範囲第3項に記載された音声分析
装置において、音声分割部は、一定長の無音によ
り入力音声を複数の音声区間に分割するように構
成されたことを特徴とする音声分析装置。 5 特許請求の範囲第3項に記載された音声分析
装置において、音声分割部は、入力音声から抽出
されたパラメータの変動量が一定値以下の区間が
存在することにより、入力音声を複数の音声区間
に分割するように構成されたことを特徴とする音
声分析装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58181169A JPS6073590A (ja) | 1983-09-29 | 1983-09-29 | 音声分析装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58181169A JPS6073590A (ja) | 1983-09-29 | 1983-09-29 | 音声分析装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6073590A JPS6073590A (ja) | 1985-04-25 |
| JPH0244079B2 true JPH0244079B2 (ja) | 1990-10-02 |
Family
ID=16096088
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58181169A Granted JPS6073590A (ja) | 1983-09-29 | 1983-09-29 | 音声分析装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6073590A (ja) |
-
1983
- 1983-09-29 JP JP58181169A patent/JPS6073590A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6073590A (ja) | 1985-04-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1973102B1 (en) | Sound masking system and masking sound generation method | |
| Saitou et al. | Speech-to-singing synthesis: Converting speaking voices to singing voices by controlling acoustic features unique to singing voices | |
| JPH0833744B2 (ja) | 音声合成装置 | |
| JPH031200A (ja) | 規則型音声合成装置 | |
| EP0688010A1 (en) | Speech synthesis method and speech synthesizer | |
| RU2296377C2 (ru) | Способ анализа и синтеза речи | |
| US5369730A (en) | Speech synthesizer | |
| JPH0244079B2 (ja) | ||
| JP3197975B2 (ja) | ピッチ制御方法及び装置 | |
| JP2536169B2 (ja) | 規則型音声合成装置 | |
| JP3727885B2 (ja) | 音声素片生成方法と装置及びプログラム、並びに音声合成方法と装置 | |
| JP3289511B2 (ja) | 音声合成用音源データ作成方法 | |
| JPH04116700A (ja) | 音声分析・合成装置 | |
| KR100359988B1 (ko) | 실시간 화속 변환 장치 | |
| JP3241582B2 (ja) | 韻律制御装置及び方法 | |
| JP2995774B2 (ja) | 音声合成方式 | |
| JP2560277B2 (ja) | 音声合成方式 | |
| JP3967571B2 (ja) | 音源波形生成装置、音声合成装置、音源波形生成方法およびプログラム | |
| US6418406B1 (en) | Synthesis of high-pitched sounds | |
| JP3263136B2 (ja) | 信号のピッチ同期位置抽出方式及び信号合成方式 | |
| JP2548107B2 (ja) | 音声合成方法 | |
| JPS6159397A (ja) | 音声入力再生装置 | |
| JP2000242287A (ja) | 発声補助装置およびプログラム記録媒体 | |
| JPS63223697A (ja) | 音声規則合成用パラメ−タの作成方法 | |
| JPS61259300A (ja) | 音声合成方式 |