JPH0365560B2 - - Google Patents
Info
- Publication number
- JPH0365560B2 JPH0365560B2 JP58047625A JP4762583A JPH0365560B2 JP H0365560 B2 JPH0365560 B2 JP H0365560B2 JP 58047625 A JP58047625 A JP 58047625A JP 4762583 A JP4762583 A JP 4762583A JP H0365560 B2 JPH0365560 B2 JP H0365560B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction coefficient
- filter
- coefficient
- deformation
- linear prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001228 spectrum Methods 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000007906 compression Methods 0.000 claims description 6
- 230000006835 compression Effects 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 description 8
- 230000009466 transformation Effects 0.000 description 6
- 238000000034 method Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
Description
【発明の詳細な説明】
(A) 発明の技術分野
本発明は、音声分析合成装置、特に線形予測係
数に対応する形で、パワー・スペクトルを1/n
乗する圧縮を行つた上で変形予測係数を得ている
音声分析合成装置において、上記線形予測係数を
係数に用いて構成するフイルタに代えて、上記変
形予測係数に用いたフイルタに対してn回縦続に
信号を通過せしめる構成を採用した音声分析合成
装置に関するものである。
数に対応する形で、パワー・スペクトルを1/n
乗する圧縮を行つた上で変形予測係数を得ている
音声分析合成装置において、上記線形予測係数を
係数に用いて構成するフイルタに代えて、上記変
形予測係数に用いたフイルタに対してn回縦続に
信号を通過せしめる構成を採用した音声分析合成
装置に関するものである。
(B) 技術の背景と問題点
従来から、音声合成や音声認識などに用いるパ
ラメータの抽出に当つて、線形予測係数を抽出す
ることが行なわれている。そして上記音声合成や
音声認識に当つては、上記線形予測係数から入力
音声信号のスペクトル包絡情報を、例えば予測係
数自体を時間関数とみなしてフーリエ変換を行な
いそのスペクトルの逆スペクトルを算出すること
により、抽出したり、あるいは更に該スペクトル
包絡情報を用いてホルマント周波数などを求めた
りするようにされる。
ラメータの抽出に当つて、線形予測係数を抽出す
ることが行なわれている。そして上記音声合成や
音声認識に当つては、上記線形予測係数から入力
音声信号のスペクトル包絡情報を、例えば予測係
数自体を時間関数とみなしてフーリエ変換を行な
いそのスペクトルの逆スペクトルを算出すること
により、抽出したり、あるいは更に該スペクトル
包絡情報を用いてホルマント周波数などを求めた
りするようにされる。
しかし、スペクトル包絡情報を抽出する上記従
来公知の方式の場合には、得られた上記スペクト
ル包絡情報になどが入力音声のピツチ周波数など
に影響されるなどの問題を含んでいる。この問題
を解決すべく、本発明者らは、先に特願昭56−
188060号、特願昭56−188061号、特願昭57−
50431号などにおいて、入力音声から抽出された
パワー・スペクトルを例えば圧縮した上で、「変
形」予測係数α′を抽出するシステムについて提案
を行つた。即ち、一般にこの種の音声分析合成装
置においては、第1図に示す如き構成が採用され
て、線形予測係数αを得て例えばスペクトル包絡
情報P^(w)が抽出されていた点を改善し、第2
図図示の如く「変形」予測係数α′を得てれから変
形スペクトル包絡情報P^(w)を得た上で伸長し
てスペクトル包絡情報P^(w)を得るようにする
ことなどが明らかにされている。なお、第1図に
おいて、1はフーリエ変換処理部であつて離散的
な入力音声信号S(n)をフリーエ変換するもの、
2は2乗価抽出部であつて入力音声のパワー・ス
ペクトルP(w)を抽出するもの、3はフーリエ
逆変換処理部であつてパワー・スペクトルP(w)
に対してフーリエ逆変換をほどかして自己相関係
数R(n)を算出するもの、4は線形予測係数算
出部であつて自己相関係数R(n)にもとづいて
線形予測係数α(n)を算出するもの、5はフー
リエ変換処理部であつて線形予測係数α(n)を
時間関数とみなしてフーリエ変換を行なうもの、
6は2乗値抽出部、7は逆数処理部を表わしてい
る。なお、上記フーリエ変換処理部5と2乗抽出
部6と逆数処理部7とは、上記線形予測係数α
(n)から入力音声信号のスペクトル包絡情報P^
(w)を抽出するものと考えてよい。そして第2
図において、図中の符号1ないし7およびS
(n)、P(w)、P^(w)は第1図に対応し、8は
第2図においてうけられる変換処理部、9は逆変
換処理部を表している。
来公知の方式の場合には、得られた上記スペクト
ル包絡情報になどが入力音声のピツチ周波数など
に影響されるなどの問題を含んでいる。この問題
を解決すべく、本発明者らは、先に特願昭56−
188060号、特願昭56−188061号、特願昭57−
50431号などにおいて、入力音声から抽出された
パワー・スペクトルを例えば圧縮した上で、「変
形」予測係数α′を抽出するシステムについて提案
を行つた。即ち、一般にこの種の音声分析合成装
置においては、第1図に示す如き構成が採用され
て、線形予測係数αを得て例えばスペクトル包絡
情報P^(w)が抽出されていた点を改善し、第2
図図示の如く「変形」予測係数α′を得てれから変
形スペクトル包絡情報P^(w)を得た上で伸長し
てスペクトル包絡情報P^(w)を得るようにする
ことなどが明らかにされている。なお、第1図に
おいて、1はフーリエ変換処理部であつて離散的
な入力音声信号S(n)をフリーエ変換するもの、
2は2乗価抽出部であつて入力音声のパワー・ス
ペクトルP(w)を抽出するもの、3はフーリエ
逆変換処理部であつてパワー・スペクトルP(w)
に対してフーリエ逆変換をほどかして自己相関係
数R(n)を算出するもの、4は線形予測係数算
出部であつて自己相関係数R(n)にもとづいて
線形予測係数α(n)を算出するもの、5はフー
リエ変換処理部であつて線形予測係数α(n)を
時間関数とみなしてフーリエ変換を行なうもの、
6は2乗値抽出部、7は逆数処理部を表わしてい
る。なお、上記フーリエ変換処理部5と2乗抽出
部6と逆数処理部7とは、上記線形予測係数α
(n)から入力音声信号のスペクトル包絡情報P^
(w)を抽出するものと考えてよい。そして第2
図において、図中の符号1ないし7およびS
(n)、P(w)、P^(w)は第1図に対応し、8は
第2図においてうけられる変換処理部、9は逆変
換処理部を表している。
第2図図示においては2乗値抽出部2によつて
入力音声のパワー・スペクトルP(w)が得られ
るが、該パワー・スペクトルP(w)に対して例
えば P′(w)=〔P(w)〕1/n −(1) なる変換を与える変換処理部8を挿置するように
する。第2図図示の場合、入力音声信号S(n)
をフーリエ変換して絶対値をとつたパワー・スペ
クトルP(w)に対して第(1)式に示す如き変換を
行なつた上で、変形自己相関係数R′(n)、変形
予測係数α′(n)、変形スペクトル包絡情報P^(w)
を得てその上で、上記第(1)式の変換の逆変換を逆
変換処理部9において行なうようにする。即ち、
入力音声信号S(n)をフーリエ変換した後であ
つてフーリエ逆変換処理部3によつて逆変換する
までの間の周波数領域において、第(1)式に示す如
き変換を行ない、スペクトル包絡情報P^(w)を
抽出するに当つて、逆変換 P^(w)=P^′(w)n −(2) を行なうようにしている。
入力音声のパワー・スペクトルP(w)が得られ
るが、該パワー・スペクトルP(w)に対して例
えば P′(w)=〔P(w)〕1/n −(1) なる変換を与える変換処理部8を挿置するように
する。第2図図示の場合、入力音声信号S(n)
をフーリエ変換して絶対値をとつたパワー・スペ
クトルP(w)に対して第(1)式に示す如き変換を
行なつた上で、変形自己相関係数R′(n)、変形
予測係数α′(n)、変形スペクトル包絡情報P^(w)
を得てその上で、上記第(1)式の変換の逆変換を逆
変換処理部9において行なうようにする。即ち、
入力音声信号S(n)をフーリエ変換した後であ
つてフーリエ逆変換処理部3によつて逆変換する
までの間の周波数領域において、第(1)式に示す如
き変換を行ない、スペクトル包絡情報P^(w)を
抽出するに当つて、逆変換 P^(w)=P^′(w)n −(2) を行なうようにしている。
上記第2図図示の如く、変形予測係数α′を抽出
することによつて多くの利点を享受できるが、例
えば音声分析合成処理などにおいて、例えば第2
図図示の逆変換処理部9から得られたスペクトル
包絡情報P^(w)を用いて、上記圧縮処理が行わ
れない形での線形予測係数α(あるいは上述の圧
縮・伸長が行われた結果から得られることから線
形予測係数α″と言つてもよい)を再生し、当該
線形予測係数を係数とするフイルタを用いること
が必要となる。
することによつて多くの利点を享受できるが、例
えば音声分析合成処理などにおいて、例えば第2
図図示の逆変換処理部9から得られたスペクトル
包絡情報P^(w)を用いて、上記圧縮処理が行わ
れない形での線形予測係数α(あるいは上述の圧
縮・伸長が行われた結果から得られることから線
形予測係数α″と言つてもよい)を再生し、当該
線形予測係数を係数とするフイルタを用いること
が必要となる。
(C) 発明の目的と構成
本発明は、上述の点に鑑み、得られている変形
予測係数α′から線形予測係数α″を再生してフイル
タを構成する点を改善し、変形予測係数α′を係数
に用いたフイルタ(本明細書においては変形フイ
ルタと呼んでいる)を構成し、所望の処理を行い
得るようにすることを目的としている。そしてそ
のため、本発明の音声分析合成装置は、少なくと
も、入力音声からパワースペクトルを求める手段
と、 該求められたパワースペクトルについて1/n
乗する圧縮を行う変換処理部と、 該変換処理部からの出力にもとづいて予測係数
を算出する予測係数算出部とを有し、 当該予測係数算出部によつて上記ワパースペク
トルについて1/n乗した結果に対応した変形予
測係数を得ると共に、当該変形予測係数を出力し
た上で音声分析合成に利用する音声合成装置にお
いて、 上記変形予測係数α′を係数として用いており、
かつ頃Σαi′Z-iを有するフイルタをそなえ、当該
フイルタに対してn回縦続に信号を通過せしめて
フイルタ出力を得るようにした ことを特徴としている。以下図面を参照しつつ説
明する。
予測係数α′から線形予測係数α″を再生してフイル
タを構成する点を改善し、変形予測係数α′を係数
に用いたフイルタ(本明細書においては変形フイ
ルタと呼んでいる)を構成し、所望の処理を行い
得るようにすることを目的としている。そしてそ
のため、本発明の音声分析合成装置は、少なくと
も、入力音声からパワースペクトルを求める手段
と、 該求められたパワースペクトルについて1/n
乗する圧縮を行う変換処理部と、 該変換処理部からの出力にもとづいて予測係数
を算出する予測係数算出部とを有し、 当該予測係数算出部によつて上記ワパースペク
トルについて1/n乗した結果に対応した変形予
測係数を得ると共に、当該変形予測係数を出力し
た上で音声分析合成に利用する音声合成装置にお
いて、 上記変形予測係数α′を係数として用いており、
かつ頃Σαi′Z-iを有するフイルタをそなえ、当該
フイルタに対してn回縦続に信号を通過せしめて
フイルタ出力を得るようにした ことを特徴としている。以下図面を参照しつつ説
明する。
(D) 発明の実施例
第3図は音声合成に当つて残差信号にもとづい
て得られるピツチ周期とパワーと有声/無声情報
とを用いて音声合成を行う従来の構成例、第4図
は第3図に対応する本発明の一実施例、第5図は
波形符号化方式に用いられる従来の構成例、第6
図は第5図に対応する本発明の一実施例を示す。
て得られるピツチ周期とパワーと有声/無声情報
とを用いて音声合成を行う従来の構成例、第4図
は第3図に対応する本発明の一実施例、第5図は
波形符号化方式に用いられる従来の構成例、第6
図は第5図に対応する本発明の一実施例を示す。
第3図において、10は雑音成分、11はピツ
チ周期成分、12はパワー成分、13はフイルタ
であつて線形予測係数α(又はα″)を係数に用い
て構成されているもの、S(n)は合成音声を表
わしている。
チ周期成分、12はパワー成分、13はフイルタ
であつて線形予測係数α(又はα″)を係数に用い
て構成されているもの、S(n)は合成音声を表
わしている。
従来構成においては、上述の第(1)式に示す圧縮
処理を解除した状態の下で得られた線形予測係数
α(又はα″)が第3図図示のフイルタ13におけ
る係数として用いられる。なおZは時遅れ単位を
表わしている。しかし、本明細書冒頭に述べた如
く、第2図図示の構成で変形予測係数α′が得られ
ている状態からあらためて線形予測係数α″を生
成して利用することは好ましくなく煩雑である。
処理を解除した状態の下で得られた線形予測係数
α(又はα″)が第3図図示のフイルタ13におけ
る係数として用いられる。なおZは時遅れ単位を
表わしている。しかし、本明細書冒頭に述べた如
く、第2図図示の構成で変形予測係数α′が得られ
ている状態からあらためて線形予測係数α″を生
成して利用することは好ましくなく煩雑である。
本発明においては、上述の変形予測係数α′、変
形スペクトル包絡情報P^(w)、線形予測係数α、
スペストル包格情報P^(w)の関係が、
P^′(w)←……→α′ 〔P^′(w)〕n=P^(w) P^(w)←……→α″ の如き関係にある点に着目し、 (1/1+Σαi″Z-i)←……→(1/1+Σα′iZ
-i)n と対応するとみて、構成するようにしている。第
4図はその構成を示し、図示符号10、11、12、S
(n)は第3図に対応し、14は本発明にいう変
形フイルタの1つを表わしている。なお第4図に
おいては、変形フイルタ14のn個分を縦続に接
続していることを示しているが、例えば変形フイ
ルタ14−1のみを用いて、当該フイルタ14−
1のみを用いて、当該フイルタ14−1の出力を
入力側に戻すようにして信号をn回分縦続に通過
せしめるようにしてもよいことは言うまでもな
い。
形スペクトル包絡情報P^(w)、線形予測係数α、
スペストル包格情報P^(w)の関係が、
P^′(w)←……→α′ 〔P^′(w)〕n=P^(w) P^(w)←……→α″ の如き関係にある点に着目し、 (1/1+Σαi″Z-i)←……→(1/1+Σα′iZ
-i)n と対応するとみて、構成するようにしている。第
4図はその構成を示し、図示符号10、11、12、S
(n)は第3図に対応し、14は本発明にいう変
形フイルタの1つを表わしている。なお第4図に
おいては、変形フイルタ14のn個分を縦続に接
続していることを示しているが、例えば変形フイ
ルタ14−1のみを用いて、当該フイルタ14−
1のみを用いて、当該フイルタ14−1の出力を
入力側に戻すようにして信号をn回分縦続に通過
せしめるようにしてもよいことは言うまでもな
い。
第5図は波形符号化方式に用いられる従来の構
成例を示し、χは音声信号、εは残差信号、15
は送信側フイルタであつて線形予測係数α(又は
α″)を係数に用いて構成されるもの、16は受
信側フイルタであつて線形予測係数α(又はα″)
を係数に用いて構成されているものを表わしてい
る。
成例を示し、χは音声信号、εは残差信号、15
は送信側フイルタであつて線形予測係数α(又は
α″)を係数に用いて構成されるもの、16は受
信側フイルタであつて線形予測係数α(又はα″)
を係数に用いて構成されているものを表わしてい
る。
第6図図示の本発明の一実施例においては、送
信側フイルタ17および受信側フイルタ18とし
て、上述の変形予測係数α′を係数に用いて構成し
た変形フイルタ19を利用するようにしている。
そして、上記フイルタ15,16とフイルタ1
7,18との関係は、 (1+Σαi″Z-i)←……→(1+Σαi′Z-i)n とする対応関係をもつようにされている。なお、
第6図図示の場合も変形フイルタ19のn個分を
縦続に接続する必要はなく、要は信号が変形フイ
ルタ19をn回分通過するよう構成すれば足り
る。
信側フイルタ17および受信側フイルタ18とし
て、上述の変形予測係数α′を係数に用いて構成し
た変形フイルタ19を利用するようにしている。
そして、上記フイルタ15,16とフイルタ1
7,18との関係は、 (1+Σαi″Z-i)←……→(1+Σαi′Z-i)n とする対応関係をもつようにされている。なお、
第6図図示の場合も変形フイルタ19のn個分を
縦続に接続する必要はなく、要は信号が変形フイ
ルタ19をn回分通過するよう構成すれば足り
る。
(E) 発明の効果
以上説明した如く、本発明によれば、変形予測
係数α′をそのまま係数として用いたフイルタを利
用することが可能となる。
係数α′をそのまま係数として用いたフイルタを利
用することが可能となる。
第1図および第2図は本発明の前提問題を説明
する説明図、第3図は音声合成に当つて残差信号
にもとづいて得られるピツチ周期とパワーと有
声/無声情報とを用いて音声合成を行う従来の構
成例、第4図は第3図に対応する本発明の一実施
例、第5図は波形符号化方式に用いられる従来の
構成例、第6図は第5図に対応する本発明の一実
施例を示す。 図中、αまたはα″は線形予測係数、α′は変形予
測係数、13,15,16はフイルタ、14,1
9は変形フイルタを表わす。
する説明図、第3図は音声合成に当つて残差信号
にもとづいて得られるピツチ周期とパワーと有
声/無声情報とを用いて音声合成を行う従来の構
成例、第4図は第3図に対応する本発明の一実施
例、第5図は波形符号化方式に用いられる従来の
構成例、第6図は第5図に対応する本発明の一実
施例を示す。 図中、αまたはα″は線形予測係数、α′は変形予
測係数、13,15,16はフイルタ、14,1
9は変形フイルタを表わす。
Claims (1)
- 【特許請求の範囲】 1 少なくとも、入力音声からパワースペクトル
を求める手段と、 該求められたパワースペクトルについて1/n
乗する圧縮を行う変換処理部と、 該変換処理部からの出力にもとづいて予測係数
を算出する予測係数算出部とを有し、 当該予測係数算出部によつて上記パワースペク
トルについて1/n乗した結果に対応した変形予
測係数を得ると共に、当該変形予測係数を出力し
た上で音声分析合成に利用する音声分析合成装置
において、 上記変形予測係数α′を係数として用いており、
かつ頃Σαi′Z-iを有するフイルタをそなえ、当該
フイルタに対してn回縦続に信号を通過せしめて
フイルタ出力を得るようにした ことを特徴とする音声分析合成装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58047625A JPS59172689A (ja) | 1983-03-22 | 1983-03-22 | 音声分析合成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58047625A JPS59172689A (ja) | 1983-03-22 | 1983-03-22 | 音声分析合成装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS59172689A JPS59172689A (ja) | 1984-09-29 |
| JPH0365560B2 true JPH0365560B2 (ja) | 1991-10-14 |
Family
ID=12780391
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58047625A Granted JPS59172689A (ja) | 1983-03-22 | 1983-03-22 | 音声分析合成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59172689A (ja) |
-
1983
- 1983-03-22 JP JP58047625A patent/JPS59172689A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS59172689A (ja) | 1984-09-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0388104B1 (en) | Method for speech analysis and synthesis | |
| EP0822538B1 (en) | Method of transforming periodic signal using smoothed spectrogram, method of transforming sound using phasing component and method of analyzing signal using optimum interpolation function | |
| US20130046540A9 (en) | Restoration of high-order Mel Frequency Cepstral Coefficients | |
| Meseguer | Speech analysis for automatic speech recognition | |
| Cosi et al. | Lyon’s auditory model inversion: a tool for sound separation and speech enhancement | |
| US20040199381A1 (en) | Restoration of high-order Mel Frequency Cepstral Coefficients | |
| JP3871657B2 (ja) | 話速変換装置、方法、及びそのプログラム | |
| JPH0365560B2 (ja) | ||
| JPH0573093A (ja) | 信号特徴点の抽出方法 | |
| JPH08328593A (ja) | スペクトル分析方法 | |
| JP3398968B2 (ja) | 音声分析合成方法 | |
| JPH058839B2 (ja) | ||
| JP2711737B2 (ja) | 線形予測分析・合成方式の復号器 | |
| JPH06202695A (ja) | 音声信号処理装置 | |
| JP3223564B2 (ja) | ピッチ抽出方法 | |
| JP2898637B2 (ja) | 音声信号分析方法 | |
| JP4313740B2 (ja) | 残響除去方法、プログラムおよび記録媒体 | |
| JPH0318720B2 (ja) | ||
| JPS62278598A (ja) | 帯域分割型ボコ−ダ | |
| JPH1062460A (ja) | 信号分離装置 | |
| JPS60262200A (ja) | スペクトルパラメ−タ補間方法 | |
| JP2569472B2 (ja) | 音声分析装置 | |
| JPH03216699A (ja) | 音声合成装置の音源データ生成方法 | |
| JPS6113600B2 (ja) | ||
| JP2956938B2 (ja) | 音声分析装置 |