JPH0284699A - 音声分析合成装置 - Google Patents

音声分析合成装置

Info

Publication number
JPH0284699A
JPH0284699A JP63237102A JP23710288A JPH0284699A JP H0284699 A JPH0284699 A JP H0284699A JP 63237102 A JP63237102 A JP 63237102A JP 23710288 A JP23710288 A JP 23710288A JP H0284699 A JPH0284699 A JP H0284699A
Authority
JP
Japan
Prior art keywords
sound source
waveform
circuit
analysis
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63237102A
Other languages
English (en)
Other versions
JP2650355B2 (ja
Inventor
Hirohisa Tazaki
裕久 田崎
Kunio Nakajima
中島 邦男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63237102A priority Critical patent/JP2650355B2/ja
Publication of JPH0284699A publication Critical patent/JPH0284699A/ja
Application granted granted Critical
Publication of JP2650355B2 publication Critical patent/JP2650355B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声分析合成装置に関するものである。
〔従来の技術〕
音声の分析合成により音声情報の圧縮を行う方法として
、分析側で入力音声波形の周波数スペクトラム包絡形状
を表す特徴パラメータ(以降包絡パラメータと呼ぶ)と
ピンチ周期を抽出し、合成側において前記包絡パラメー
タとピッチ周期を用いて合成音声波形を生成する方式(
ボコーダと呼ばれている)が知られている。このボコー
ダ方式では、分析部において有声/無声判別を行い、有
声音と判別した場合にはさらにピンチ抽出を行う。
そして合成部において、前記有声/無声判別結果が有声
音である場合にはピッチ周期で繰り返すインパルス列、
無声音である場合には白色雑音を駆動音源として、包絡
パラメータを用いた合成フィルタを駆動することで合成
音声を得る。この方式は、比較的少ない伝送情報量で実
用上十分な明瞭性を持つ合成音声が得られる利点がある
ものの、人力音声に比べ個人性、自然性の欠落した貧弱
な音質であり、しばしば長時間の聴取に耐えないブザー
音を伴う欠点を持つ。
従来この音質改善法としては、例えば下記資料(1)に
示されるようなインパルス列等価音源を用いた有声音源
の改良法がある。
[高品質音声合成のためのインパルス列等価音源」電子
通信学会論文誌(1985−11)Vol、J68−^
N 0 、11−−−−−− (11有声音区間の予測
残差信号は分析フレーム長全体としてはその周波数スペ
クトルはほぼ平坦であるが、ピンチ周期長以下のPi 
FJtA時間の周波数スペクトルは高域強調区間と低域
強調区間がピッチ周期毎に繰り返す構造を持つ。資料f
l) (71)方式においては、分析フレーム全体の周
波数スペクトラムの平坦性を保ちつつ、極短時間の周波
数スペクトルにピッチ周期毎に繰り返す変動を与えた音
声音源(インパルス列等価音源と呼ぶ)を生成し、これ
を用いることで合成音声の音質に大きく寄竪する有声音
区間の品質を改善するというものであった。
第3°図はこの資料(11に示された従来の方式を表す
ブロック図である。まず音声波形が音声波形入力端子3
を介して分析部1内の包絡パラメータ抽出回路4と有声
/無声判別回路5とピンチ抽出回路6にそれぞれ入力さ
れる。包絡パラメータ抽出回路4は前記音声波形より包
絡パラメータの算出を行い、そのパラメータを包絡パラ
メータ伝送路15を介して合成部2内の合成フィルタ回
路22に伝送する。有声/無声判別回路5は前記音声波
形が有声音区間であるか否かを判別し、判別結果をピッ
チ抽出回路6に出力し、さらに有声/無声判別結果伝送
路16を介して合成部2内の音源切換回路21へ出力す
る。ピンチ抽出回路6は前記有声/無声判別結果が有声
音区間である場合に音声波形からピッチ周期分析を行い
、抽出されたと・ノチデータをピッチデータ伝送路17
を介して合成部2内のインパルス列等価音源生成回路2
4に出力する。合成部2内のインパルス列等価音源生成
回路24は予め与えられるlピッチ周期長のインパルス
列等価音源を前記ピッチ周期毎に繰り返し生成し音源切
換回路21に出力する。無声音源生成回路20は白色雑
音の生成を行い音源切換回路21に出)Jする。音源切
換回路21は前記有声/無声判別結果が有声音である場
合にインパルス列等価音源を遺沢し、有声音以外の場合
には白色雑音を選択し、選択した音源波形を合成フィル
タ回路22に出力する。そして合成フィルタ回路22は
、分析部l内の包絡パラメータ抽出回路4より入力され
た包絡パラメータ及び前記音源波形を用いて合成波形を
生成し合成波形出力端子23より出力するというもので
ある。
(発明が解決しようとするIKg) 以上説明したインパルス列等価音源を用いる従来の音声
分析合成装置では、合成音のブザー音的音質の若干の低
減効果が得られるが、本来、話者、音韻により変化する
音源を固定音源で表しているため、個人性、自然性の回
復はほとんどなく、十分な音質改善は得られないという
課題があった。
本発明の目的は、予測残差波形に含まれる音源情報を比
較的少ない情報量で伝送し、ボコーダ方式特有のブザー
音的で、個人性、自然性の欠落した音質を改善すること
にある。
〔課題を解決するための手段〕 本発明に係る音声分析合成装置は、一定長の分析フレー
ム毎に該当フレームが有声音区間であると判定された場
合にそのフレームの予測残差波形から1ピッチ周期長の
代表音源波形を切り出す代表音源抽出回路と、有限個の
音源ベクトルを記憶する符号帳メモリと、この音源ベク
トルの中から前記代表音源抽出回路で抽出された代表音
源に最も等価な音源ベクトルを最適音源ベクトルとして
選択する音源選択回路を備え、合成部において前記最適
音源ベクトルを用いて当該分析フレームの内の音源波形
を生成する音源生成回路と、この音源生成回路で生成さ
れた音源波形により合成波形を生成する合成フィルタを
備えるように構成したものである。
〔作用〕
この発明における代表音源生成回路は有声音声の一定長
の分析フレーム内の予測残差波形からピンチ周期長の代
表音源波形を切り出し、音源選択回路は当該フレームの
包絡パラメータを用いてこの代表音源から合成される合
成波形と最も波形歪が小さい合成波形を得る最適音源ベ
クトルを符号帳メモリ内の音源ベクトル群より選択し、
音源生成回路はこの最適音源ベクトルを当該分析フレー
ム内でピッチ周期毎に並べることで音源波形を生成する
予測残差信号により合成フィルタ回路を駆動することで
人力音声信号が再生されることから、この予測残差信号
を効率よく伝送することができればより入力音声信号に
近い合成音が得られることは明らかである。ボコーダの
音質に大きく影響する有声音区間における予測残差波形
を視ると、概形が良(領た波形がピッチ周期で繰り返す
構造を持っており、1分析フレーム内において一つのピ
ッチ長残差信号のみを切り出して伝送し、合成部ではこ
れをピンチ周期毎とに並べることで音源波形を生成する
ことにすれば、この予測残差信号に含まれる冗長度を大
幅に削減して伝送することができる。さらに予め用意し
た符号長ベクトル内から切り出して予測残差信号に対す
る最適音源ベクトルを選択する方式を用いることにより
、1分析フレーム当り数ビットの伝送情報量の付加によ
り効率よ(この音源情報の伝送が実現できる。
〔発明の実施例〕
以下、この発明の一実施例を第1図及び第2図について
説明する0図において、7は逆フィルタ回路、8は代表
音源抽出回路、9及び18は符号帳メモリ、10.11
及び22は合成フィルタ回路、12は波形歪算出回路、
13は比較回路、14は音源ベクトル番号伝送路、19
は1フレーム長音源生成回路である。1〜6.15〜1
7.20〜23は従来例と同じであるので説明を省略す
る。2aは予測残差波形、2bは代表音源波形、2Cは
選択音源ヘクトル、2dは1フレーム長音源波形である
分析部1内の逆フィルタ回路7は、包絡パラメータ抽出
回路4によって抽出された包絡パラメータを用いて、入
力端子3を介して入力された音声波形に逆フィルタ処理
を行い、得られた予測残差波形2aを代表音源抽出回路
8に出力する。代表音源抽出回路8は、有声/無声判別
回路5がを声音区間であると判別した場合に前記予測残
差波形2aから1ピッチ周期長の残差波形を代表音源波
形2bとして切り出し、得られた代表音源波形2bを合
成フィルタ回路lOに出力する。切り出し処理の方法と
しては例えば残差波形中振幅最大の部分の直前のゼロ交
差点から1ピンチ周期長の波形の切り出しを行う、予測
残差波形の中から振幅の大きな部分が先頭部近傍にくる
ように切り出すことで、記憶しておく音源ベクトルとし
て振幅の大きな部分が先頭部近傍にあるものだけにする
ことができ、音源ベクトル群の数を少なくできる0分析
部l内の符号長メモリ9は、記憶している有限個の音源
ベクトルを順次合成フィルタ回路11に出力する。
前記合成フィルタ回路10及び11は、各々入力された
音源ベクトルと上記包絡パラメータを用いて合成波形を
生成し、その合成波形を波形歪算出回路12に出力する
。波形歪算出回路12は、代表音源波形2aを用いて得
られた合成波形と符号帳メモリ9に記憶されていた各音
源ベクトルを用いて得られた合成波形の間の波形歪を算
出し、その結果を比較回路13に出力する。比較回路1
3は前記波形歪を比較し、最小の波形歪を与えた音源ベ
クトルの番号を音源ベクトル番号伝送路14を介して合
成部2内の符号帳メモIJ18に出力する。符号帳メモ
リ18は入力された音源ベクトル番号により指定された
選択音源ベクトル2cを1フレーム長音源生成回路19
に出力する。1フレーム長音源生成回路19は前記選択
音源ベクトル2cを、ピッチデータ伝送路17を介して
入力されたピッチ周期間隔で並べ立てることで1フレー
ム長音源波形2dを生成し、これを音源切換回路21に
出力する。音源切換回路21は有声/無声判別結果伝送
路16を介して入力された有声/無声判別結果が有声音
である場合に前記1フレーム長音源波形2dを選択し、
有声音以外の場合には白色雑音を選択し、選択した音源
波形を合成フィルタ回路22に出力する。そして合成フ
ィルタ回路22は、分析部1内の包絡パラメータ抽出回
路4より入力された包絡パラメータ及び前記音源波形を
用いて合成波形を生成し合成波形出力端子23より出力
する。
上記符号帳メモリ9内の有限個の音源ベクトルは、多く
の入力音声信号より上記分析部2内の代表音源抽出回路
8を用いて抽出した代表音源波形の集合中から所望の個
数だけ選択して予め容易する。その選択の方法としては
、例えば有声音区間の平均的なスペクトル包絡形状を持
つ合成フィルタ回路を構成し、この合成フィルタ回路を
前記代表音源波形の集合で駆動して得られる合成波形に
おける歪を最小にする基準のクラスタリング手法を用い
ることができる。
〔他の実施例の説明、他の用途への転用例の説明〕上記
実施例では、各演算処理を回路内で実現する例について
述べたが、これを信号処理プロセッサ等の汎用演算装置
によるソフトウェア処理により実現してもよい、また、
音源選択法として合成フィルタ出力波形における歪を最
小にする音源を選択する方式を述べたが、これを包絡パ
ラメータ及び音源波形をDFT等の周波数スペクトルで
表しその周波数軸上における歪を最小にするように選択
する方式とすることもできる。
〔発明の効果〕
以上のように、この発明によれば、比較的少ない伝送情
報量により効率よく品質のよい合成音を合成できる有声
音音源情報の伝送が可能であり、インパルス列等等価音
源等の従来の固定音源を用いた装置で問題であったボコ
ーダの合成音的な音が改善されたより自然で個人性豊か
な合成音が得られる。
【図面の簡単な説明】
第1図はこの発明の1実施例による音声分析合成装置を
示すブロック図、第2図はその実施例における代表音源
波形抽出と1フレーム長音源波形生成の様子を示す模式
図、第3図は従来の音声分析合成装置を示すブロック図
である・ 図において1は分析部、2は合成部、3は音声波形入力
端子、4は包絡パラメータ抽出回路、51よ有声/無声
判別回路、6はピッチ抽出回路、7は逆フィルタ回路、
8は代表音源抽出回路、9及び18は符号帳メモリ、1
0.11及び22は合成フィルタ回路、12は波形歪算
出回路、13は比較回路、14は音源ヘクトル番号伝送
路、15は包絡パラメータ伝送路、16は有声/無声判
別結果伝送路、17はピッチデータ伝送路、19は1フ
レーム長音源生成回路、20は無声音源生成回路、21
は音源切換回路、23は合成波形出力端子、24はイン
パルス列等価音′a生成回路である。2aは予測残差波
形、2bは代表音源波形、2cは選択音源ベクトル、2
dは1フレーム長音源波形である。 代理人   大  岩  増  雄 第2図

Claims (1)

    【特許請求の範囲】
  1. 音声波形の情報量圧縮を行う音声分析合成装置において
    、入力音声波形を一定長の分析フレーム単位にこの入力
    音声波形のスペクトル包絡パラメータを用いて逆フィル
    タリングし、当該分析フレームの予測残差波形を求める
    逆フィルタ回路と、この逆フィルタ回路で求められた予
    測残差波形から、この予測残差波形の持つ一ピッチ周期
    長分を切り出し当該分析フレームの代表音源波形とする
    代表音源抽出回路と、有限個の音源ベクトルを記憶する
    符号帳メモリと、前記周波数特徴パラメータを用いて構
    成された合成フィルタ回路と、この合成フィルタ回路を
    前記代表音源抽出回路で切り出された代表音源波形で駆
    動して得る合成波形とこの合成フィルタを前記符号帳メ
    モリ内の音源ベクトルで駆動して得る合成波形との歪が
    最小化するように前記符号幅メモリ内から最適音源ベク
    トルを選択する音源選択回路を分析部に備え、この分析
    部で求められた最適音源ベクトルを当該分析フレーム内
    でピッチ周期毎に繰り返し並べることで当該分析フレー
    ムの音源波形を生成する1フレーム長音源生成回路と、
    この1フレーム長音源生成回路で生成された音源波形を
    駆動源とし前記スペクトル包絡パラメータを用いて合成
    波形を求める合成フィルタ回路を合成部に備えることを
    特徴とする音声分析合成装置
JP63237102A 1988-09-21 1988-09-21 音声分析合成装置 Expired - Fee Related JP2650355B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63237102A JP2650355B2 (ja) 1988-09-21 1988-09-21 音声分析合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63237102A JP2650355B2 (ja) 1988-09-21 1988-09-21 音声分析合成装置

Publications (2)

Publication Number Publication Date
JPH0284699A true JPH0284699A (ja) 1990-03-26
JP2650355B2 JP2650355B2 (ja) 1997-09-03

Family

ID=17010443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63237102A Expired - Fee Related JP2650355B2 (ja) 1988-09-21 1988-09-21 音声分析合成装置

Country Status (1)

Country Link
JP (1) JP2650355B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06250694A (ja) * 1993-02-25 1994-09-09 Idou Tsushin Syst Kaihatsu Kk 音声符号化復号化装置
JP2003522965A (ja) * 1998-12-21 2003-07-29 クゥアルコム・インコーポレイテッド 周期的スピーチコーディング

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS634300A (ja) * 1986-06-24 1988-01-09 日本電気株式会社 音声符号化方法とその装置
JPS6337724A (ja) * 1986-07-31 1988-02-18 Fujitsu Ltd 符号化伝送装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS634300A (ja) * 1986-06-24 1988-01-09 日本電気株式会社 音声符号化方法とその装置
JPS6337724A (ja) * 1986-07-31 1988-02-18 Fujitsu Ltd 符号化伝送装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06250694A (ja) * 1993-02-25 1994-09-09 Idou Tsushin Syst Kaihatsu Kk 音声符号化復号化装置
JP2003522965A (ja) * 1998-12-21 2003-07-29 クゥアルコム・インコーポレイテッド 周期的スピーチコーディング
JP4824167B2 (ja) * 1998-12-21 2011-11-30 クゥアルコム・インコーポレイテッド 周期的スピーチコーディング

Also Published As

Publication number Publication date
JP2650355B2 (ja) 1997-09-03

Similar Documents

Publication Publication Date Title
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
JP3328080B2 (ja) コード励振線形予測復号器
US7149682B2 (en) Voice converter with extraction and modification of attribute data
JPH10307599A (ja) スプラインを使用する波形補間音声コーディング
WO1980002211A1 (en) Residual excited predictive speech coding system
US6064955A (en) Low complexity MBE synthesizer for very low bit rate voice messaging
JPH10319996A (ja) 雑音の効率的分解と波形補間における周期信号波形
AU6125594A (en) Method for generating a spectral noise weighting filter for use in a speech coder
JP3439307B2 (ja) 発声速度変換装置
JPH0284699A (ja) 音声分析合成装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP2841797B2 (ja) 音声分析・合成装置
JP3303580B2 (ja) 音声符号化装置
JP3515216B2 (ja) 音声符号化装置
JP3515215B2 (ja) 音声符号化装置
JP2004151423A (ja) 帯域拡張装置及び方法
JP3227608B2 (ja) 音声符号化装置および音声復号化装置
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JP2000298500A (ja) 音声符号化方法
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JPWO2003042648A1 (ja) 音声符号化装置、音声復号化装置、音声符号化方法および音声復号化方法
JPH03123399A (ja) 音声認識装置
JP2844590B2 (ja) 音声符号化方式とその装置
JPH09258796A (ja) 音声合成方法
JP2000099094A (ja) 時系列信号処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees