JPH0365560B2

JPH0365560B2 -

Info

Publication number: JPH0365560B2
Application number: JP58047625A
Authority: JP
Priority date: 1983-03-22
Filing date: 1983-03-22
Publication date: 1991-10-14
Also published as: JPS59172689A

Description

【発明の詳細な説明】 (A) 発明の技術分野本発明は、音声分析合成装置、特に線形予測係
数に対応する形で、パワー・スペクトルを１／ｎ
乗する圧縮を行つた上で変形予測係数を得ている
音声分析合成装置において、上記線形予測係数を
係数に用いて構成するフイルタに代えて、上記変
形予測係数に用いたフイルタに対してｎ回縦続に
信号を通過せしめる構成を採用した音声分析合成
装置に関するものである。

(B) 技術の背景と問題点従来から、音声合成や音声認識などに用いるパ
ラメータの抽出に当つて、線形予測係数を抽出す
ることが行なわれている。そして上記音声合成や
音声認識に当つては、上記線形予測係数から入力
音声信号のスペクトル包絡情報を、例えば予測係
数自体を時間関数とみなしてフーリエ変換を行な
いそのスペクトルの逆スペクトルを算出すること
により、抽出したり、あるいは更に該スペクトル
包絡情報を用いてホルマント周波数などを求めた
りするようにされる。

しかし、スペクトル包絡情報を抽出する上記従
来公知の方式の場合には、得られた上記スペクト
ル包絡情報になどが入力音声のピツチ周波数など
に影響されるなどの問題を含んでいる。この問題
を解決すべく、本発明者らは、先に特願昭56−
188060号、特願昭56−188061号、特願昭57−
50431号などにおいて、入力音声から抽出された
パワー・スペクトルを例えば圧縮した上で、「変
形」予測係数α′を抽出するシステムについて提案
を行つた。即ち、一般にこの種の音声分析合成装
置においては、第１図に示す如き構成が採用され
て、線形予測係数αを得て例えばスペクトル包絡
情報P^（ｗ）が抽出されていた点を改善し、第２
図図示の如く「変形」予測係数α′を得てれから変
形スペクトル包絡情報P^（ｗ）を得た上で伸長し
てスペクトル包絡情報P^（ｗ）を得るようにする
ことなどが明らかにされている。なお、第１図に
おいて、１はフーリエ変換処理部であつて離散的
な入力音声信号Ｓ（ｎ）をフリーエ変換するもの、
２は２乗価抽出部であつて入力音声のパワー・ス
ペクトルＰ（ｗ）を抽出するもの、３はフーリエ
逆変換処理部であつてパワー・スペクトルＰ（ｗ）
に対してフーリエ逆変換をほどかして自己相関係
数Ｒ（ｎ）を算出するもの、４は線形予測係数算
出部であつて自己相関係数Ｒ（ｎ）にもとづいて
線形予測係数α（ｎ）を算出するもの、５はフー
リエ変換処理部であつて線形予測係数α（ｎ）を
時間関数とみなしてフーリエ変換を行なうもの、
６は２乗値抽出部、７は逆数処理部を表わしてい
る。なお、上記フーリエ変換処理部５と２乗抽出
部６と逆数処理部７とは、上記線形予測係数α
（ｎ）から入力音声信号のスペクトル包絡情報P^
（ｗ）を抽出するものと考えてよい。そして第２
図において、図中の符号１ないし７およびＳ
（ｎ）、Ｐ（ｗ）、P^（ｗ）は第１図に対応し、８は
第２図においてうけられる変換処理部、９は逆変
換処理部を表している。

第２図図示においては２乗値抽出部２によつて
入力音声のパワー・スペクトルＰ（ｗ）が得られ
るが、該パワー・スペクトルＰ（ｗ）に対して例
えば P′（ｗ）＝〔Ｐ（ｗ）〕^1/n −(1) なる変換を与える変換処理部８を挿置するように
する。第２図図示の場合、入力音声信号Ｓ（ｎ）
をフーリエ変換して絶対値をとつたパワー・スペ
クトルＰ（ｗ）に対して第(1)式に示す如き変換を
行なつた上で、変形自己相関係数R′（ｎ）、変形
予測係数α′（ｎ）、変形スペクトル包絡情報P^（ｗ）
を得てその上で、上記第(1)式の変換の逆変換を逆
変換処理部９において行なうようにする。即ち、
入力音声信号Ｓ（ｎ）をフーリエ変換した後であ
つてフーリエ逆変換処理部３によつて逆変換する
までの間の周波数領域において、第(1)式に示す如
き変換を行ない、スペクトル包絡情報P^（ｗ）を
抽出するに当つて、逆変換 P^（ｗ）＝P^′（ｗ）ⁿ −(2) を行なうようにしている。

上記第２図図示の如く、変形予測係数α′を抽出
することによつて多くの利点を享受できるが、例
えば音声分析合成処理などにおいて、例えば第２
図図示の逆変換処理部９から得られたスペクトル
包絡情報P^（ｗ）を用いて、上記圧縮処理が行わ
れない形での線形予測係数α（あるいは上述の圧
縮・伸長が行われた結果から得られることから線
形予測係数α″と言つてもよい）を再生し、当該
線形予測係数を係数とするフイルタを用いること
が必要となる。

(C) 発明の目的と構成本発明は、上述の点に鑑み、得られている変形
予測係数α′から線形予測係数α″を再生してフイル
タを構成する点を改善し、変形予測係数α′を係数
に用いたフイルタ（本明細書においては変形フイ
ルタと呼んでいる）を構成し、所望の処理を行い
得るようにすることを目的としている。そしてそ
のため、本発明の音声分析合成装置は、少なくと
も、入力音声からパワースペクトルを求める手段
と、該求められたパワースペクトルについて１／ｎ
乗する圧縮を行う変換処理部と、該変換処理部からの出力にもとづいて予測係数
を算出する予測係数算出部とを有し、当該予測係数算出部によつて上記ワパースペク
トルについて１／ｎ乗した結果に対応した変形予
測係数を得ると共に、当該変形予測係数を出力し
た上で音声分析合成に利用する音声合成装置にお
いて、上記変形予測係数α′を係数として用いており、
かつ頃Σα_i′Z^-iを有するフイルタをそなえ、当該
フイルタに対してｎ回縦続に信号を通過せしめて
フイルタ出力を得るようにしたことを特徴としている。以下図面を参照しつつ説
明する。

(D) 発明の実施例第３図は音声合成に当つて残差信号にもとづい
て得られるピツチ周期とパワーと有声／無声情報
とを用いて音声合成を行う従来の構成例、第４図
は第３図に対応する本発明の一実施例、第５図は
波形符号化方式に用いられる従来の構成例、第６
図は第５図に対応する本発明の一実施例を示す。

第３図において、１０は雑音成分、１１はピツ
チ周期成分、１２はパワー成分、１３はフイルタ
であつて線形予測係数α（又はα″）を係数に用い
て構成されているもの、Ｓ（ｎ）は合成音声を表
わしている。

従来構成においては、上述の第(1)式に示す圧縮
処理を解除した状態の下で得られた線形予測係数
α（又はα″）が第３図図示のフイルタ１３におけ
る係数として用いられる。なおＺは時遅れ単位を
表わしている。しかし、本明細書冒頭に述べた如
く、第２図図示の構成で変形予測係数α′が得られ
ている状態からあらためて線形予測係数α″を生
成して利用することは好ましくなく煩雑である。

本発明においては、上述の変形予測係数α′、変
形スペクトル包絡情報P^（ｗ）、線形予測係数α、
スペストル包格情報P^（ｗ）の関係が、
P^′（ｗ）←……→α′ 〔P^′（ｗ）〕ⁿ＝P^（ｗ） P^（ｗ）←……→α″ の如き関係にある点に着目し、（１／１＋Σα_i″Z^-i）←……→（１／１＋Σα′_iZ
^-i）ⁿ と対応するとみて、構成するようにしている。第
４図はその構成を示し、図示符号10、11、12、Ｓ
（ｎ）は第３図に対応し、１４は本発明にいう変
形フイルタの１つを表わしている。なお第４図に
おいては、変形フイルタ１４のｎ個分を縦続に接
続していることを示しているが、例えば変形フイ
ルタ１４−１のみを用いて、当該フイルタ１４−
１のみを用いて、当該フイルタ１４−１の出力を
入力側に戻すようにして信号をｎ回分縦続に通過
せしめるようにしてもよいことは言うまでもな
い。

第５図は波形符号化方式に用いられる従来の構
成例を示し、χは音声信号、εは残差信号、１５
は送信側フイルタであつて線形予測係数α（又は
α″）を係数に用いて構成されるもの、１６は受
信側フイルタであつて線形予測係数α（又はα″）
を係数に用いて構成されているものを表わしてい
る。

第６図図示の本発明の一実施例においては、送
信側フイルタ１７および受信側フイルタ１８とし
て、上述の変形予測係数α′を係数に用いて構成し
た変形フイルタ１９を利用するようにしている。
そして、上記フイルタ１５，１６とフイルタ１
７，１８との関係は、（１＋Σα_i″Z^-i）←……→（１＋Σα_i′Z^-i）ⁿ とする対応関係をもつようにされている。なお、
第６図図示の場合も変形フイルタ１９のｎ個分を
縦続に接続する必要はなく、要は信号が変形フイ
ルタ１９をｎ回分通過するよう構成すれば足り
る。

(E) 発明の効果以上説明した如く、本発明によれば、変形予測
係数α′をそのまま係数として用いたフイルタを利
用することが可能となる。

【図面の簡単な説明】

第１図および第２図は本発明の前提問題を説明
する説明図、第３図は音声合成に当つて残差信号
にもとづいて得られるピツチ周期とパワーと有
声／無声情報とを用いて音声合成を行う従来の構
成例、第４図は第３図に対応する本発明の一実施
例、第５図は波形符号化方式に用いられる従来の
構成例、第６図は第５図に対応する本発明の一実
施例を示す。図中、αまたはα″は線形予測係数、α′は変形予
測係数、１３，１５，１６はフイルタ、１４，１
９は変形フイルタを表わす。

Claims

【特許請求の範囲】１少なくとも、入力音声からパワースペクトル
を求める手段と、該求められたパワースペクトルについて１／ｎ
乗する圧縮を行う変換処理部と、該変換処理部からの出力にもとづいて予測係数
を算出する予測係数算出部とを有し、当該予測係数算出部によつて上記パワースペク
トルについて１／ｎ乗した結果に対応した変形予
測係数を得ると共に、当該変形予測係数を出力し
た上で音声分析合成に利用する音声分析合成装置
において、上記変形予測係数α′を係数として用いており、
かつ頃Σα_i′Z^-iを有するフイルタをそなえ、当該
フイルタに対してｎ回縦続に信号を通過せしめて
フイルタ出力を得るようにしたことを特徴とする音声分析合成装置。