JP4968355B2

JP4968355B2 - 雑音抑圧の方法及び装置

Info

Publication number: JP4968355B2
Application number: JP2010068541A
Authority: JP
Inventors: 正徳加藤; 昭彦杉山
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2010-03-24
Filing date: 2010-03-24
Publication date: 2012-07-04
Anticipated expiration: 2025-05-31
Also published as: JP2010140063A

Description

本発明は、所望の音声信号に重畳されている雑音を抑圧するための雑音抑圧の方法及び装置に関する。

ノイズ・サプレッサは、所望の音声信号に重畳されている雑音（ノイズ）を抑圧する技術であり、周波数領域に変換した入力信号を用いて雑音成分のパワースペクトルを推定し、この推定パワースペクトルを入力信号から差し引くことにより、所望の音声信号に混在する雑音を抑圧するように動作する。雑音成分のパワースペクトルを継続的に推定することにより、非定常な雑音の抑圧にも適用することができる。ノイズ・サプレッサとしては、例えば、特許文献１に記載されている方式がある。図３６に、特許文献１に記載されたノイズ・サプレッサの構成を示す。

入力端子１１には、劣化音声信号（所望音声信号と雑音の混在する信号）が、サンプル値系列として供給される。劣化音声信号サンプルは、フレーム分割部１に供給され、Ｋ／２サンプル毎のフレームに分割される。ここに、Ｋは偶数とする。フレームに分割された劣化音声信号サンプルは、窓がけ処理部２に供給され、窓関数ｗ（ｔ）との乗算が行なわれる。第ｎフレームの入力信号ｙ_ｎ（ｔ）（ｔ＝０，１，．．．，Ｋ／２−１）に対するｗ（ｔ）で窓がけされた信号ｙ_ｎ（ｔ）バーは、次式で与えられる。

また、連続する２フレームの一部を重ね合わせ（オーバラップ）して窓がけすることも広く行なわれている。オーバラップ長としてフレーム長の５０％を仮定すれば、ｔ＝０，１，．．．，Ｋ／２−１に対して、

で得られるｙ_ｎ（ｔ）バー（ｔ＝０，１，．．．，Ｋ−１）が、窓がけ処理部２の出力となる。実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、抑圧係数を１に設定したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、ｗ（ｔ）＋ｗ（ｔ＋Ｋ／２）＝１となることを意味する。

以後、連続する２フレームの５０％をオーバラップして窓がけする場合を例として説明を続ける。ｗ（ｔ）としては、例えば次式に示すハニング窓を用いることができる。

窓がけされた出力ｙ_ｎ（ｔ）バーは、フーリエ変換部３に供給され、劣化音声スペクトルＹ_ｎ（ｋ）に変換される。劣化音声スペクトルＹ_ｎ（ｋ）は位相と振幅に分離され、劣化音声位相スペクトルａｒｇＹ_ｎ（ｋ）は逆フーリエ変換部９に、劣化音声振幅スペクトル｜Ｙ_ｎ（ｋ）｜は、多重乗算部１３と多重乗算部１６に供給される。

多重乗算部１３は、供給された劣化音声振幅スペクトル｜Ｙ_ｎ（ｋ）｜を用いて劣化音声パワースペクトルを計算し、推定雑音計算部５、周波数別ＳＮＲ（信号対雑音比）計算部６及び重みつき劣化音声計算部１４に伝達する。重みつき劣化音声計算部１４は、多重乗算部１３から供給された劣化音声パワースペクトルを用いて重みつき劣化音声パワースペクトルを計算し、推定雑音計算部５に伝達する。推定雑音計算部５は、劣化音声パワースペクトル、重みつき劣化音声パワースペクトル、及びカウンタ４から供給されるカウント値を用いて雑音のパワースペクトルを推定し、推定雑音パワースペクトルとして周波数別ＳＮＲ計算部６に伝達する。周波数別ＳＮＲ計算部６は、入力された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて周波数別にＳＮＲを計算し、後天的ＳＮＲとして推定先天的ＳＮＲ計算部７と雑音抑圧係数生成部８に供給する。

推定先天的ＳＮＲ計算部７は、入力された後天的ＳＮＲ、及び抑圧係数補正部１５から供給された補正抑圧係数を用いて先天的ＳＮＲを推定し、推定先天的ＳＮＲとして、雑音抑圧係数生成部８に伝達する。雑音抑圧係数生成部８は、入力として供給された後天的ＳＮＲ、推定先天的ＳＮＲ及び音声非存在確率記憶部２１から供給される音声非存在確率を用いて雑音抑圧係数を生成し、抑圧係数として抑圧係数補正部１５に伝達する。抑圧係数補正部１５は、入力された推定先天的ＳＮＲと抑圧係数を用いて抑圧係数を補正し、補正抑圧係数Ｇ_ｎ（ｋ）バーとして多重乗算部１６に供給する。多重乗算部１６は、フーリエ変換部３から供給された劣化音声振幅スペクトル｜Ｙ_ｎ（ｋ）｜を、抑圧係数補正部１５から供給された補正抑圧係数Ｇ_ｎ（ｋ）バーで重み付けすることによって強調音声振幅スペクトル｜Ｘ_ｎ（ｋ）｜バーを求め、逆フーリエ変換部９に伝達する。｜Ｘ_ｎ（ｋ）｜バーは、式（４）で与えられる。

逆フーリエ変換部９は、多重乗算部１６から供給された強調音声振幅スペクトル｜Ｘ_ｎ（ｋ）｜バーとフーリエ変換部３から供給された劣化音声位相スペクトルａｒｇＹ_ｎ（ｋ）を乗算して、強調音声Ｘ_ｎ（ｋ）バーを求める。すなわち、

を実行する。

得られた強調音声Ｘ_ｎ（ｋ）バーに逆フーリエ変換を施し、１フレームがＫサンプルから構成される時間領域サンプル値系列ｘ_ｎ（ｔ）バー（ｔ＝０，１，．．．，Ｋ−１）として、フレーム合成部１０に伝達する。フレーム合成部１０は、ｘ_ｎ（ｔ）バーの隣接する２フレームからＫ／２サンプルずつを取り出して重ね合わせ、

によって、強調音声ｘ_ｎ（ｔ）ハットを得る。得られた強調音声ｘ_ｎ（ｔ）ハット（ｔ＝０，１，．．．，Ｋ−１）が、フレーム合成部１０の出力として、出力端子１２に伝達される。

図３７は、図３６に含まれる多重乗算部１３の構成を示すブロック図である。多重乗算部１３は、乗算器１３０１_０〜１３０１_Ｋ−１、分離部１３０２、１３０３、多重化部１３０４を有する。多重化された状態で図３６のフーリエ変換部３から供給された劣化音声振幅スペクトルは、分離部１３０２及び１３０３において周波数別のＫサンプルに分離され、それぞれ乗算器１３０１_０〜１３０１_Ｋ−１に供給される。乗算器１３０１_０〜１３０１_Ｋ−１は、それぞれ入力された信号を２乗し、多重化部１３０４に伝達する。多重化部１３０４は、入力された信号を多重化し、劣化音声パワースペクトルとして出力する。

図３８は重みつき劣化音声計算部１４の構成を示すブロック図である。重みつき劣化音声計算部１４は、推定雑音記憶部１４０１、周波数別ＳＮＲ計算部１４０２、多重非線形処理部１４０５、及び多重乗算部１４０４を有する。推定雑音記憶部１４０１は、図３６の推定雑音計算部５から供給される推定雑音パワースペクトルを記憶し、１フレーム前に記憶された推定雑音パワースペクトルを周波数別ＳＮＲ計算部１４０２へ出力する。周波数別ＳＮＲ計算部１４０２は、推定雑音記憶部１４０１から供給される推定雑音パワースペクトルと図３６の多重乗算部１３から供給される劣化音声パワースペクトルを用いてＳＮＲを各周波数毎に求め、多重非線形処理部１４０５に出力する。多重非線形処理部１４０５は、周波数別ＳＮＲ計算部１４０２から供給されるＳＮＲを用いて重み係数ベクトルを計算し、重み係数ベクトルを多重乗算部１４０４に出力する。

多重乗算部１４０４は、図３６の多重乗算部１３から供給される劣化音声パワースペクトルと、多重非線形処理部１４０５から供給される重み係数ベクトルの積を周波数毎に計算し、重みつき劣化音声パワースペクトルを図３６の推定雑音記憶部５に出力する。多重乗算部１４０４の構成は、既に図３７を用いて説明した多重乗算部１３に等しいので、詳細な説明は省略する。

図３９は、図３８に含まれる周波数別ＳＮＲ計算部１４０２の構成を示すブロック図である。周波数別ＳＮＲ計算部１４０２は、除算部１４２１_０〜１４２１_Ｋ−１、分離部１４２２、１４２３、多重化部１４２４を有する。図３６の多重乗算部１３から供給される劣化音声パワースペクトルは、分離部１４２２に伝達される。図３８の推定雑音記憶部１４０１から供給される推定雑音パワースペクトルは、分離部１４２３に伝達される。劣化音声パワースペクトルは分離部１４２２において、推定雑音パワースペクトルは分離部１４２３において、それぞれ周波数成分に対応したＫサンプルに分離され、それぞれ除算部１４２１_０〜１４２１_Ｋ−１に供給される。除算部１４２１_０〜１４２１_Ｋ−１では、式（７）に従って、供給された劣化音声パワースペクトルを推定雑音パワースペクトルで除算して周波数別ＳＮＲγ_ｎ（ｋ）ハットを求め、多重化部１４２４に伝達する。

ここに、λ_ｎ−１（ｋ）は１フレーム前に記憶された推定雑音パワースペクトルである。多重化部１４２４は、伝達されたＫ個の周波数別ＳＮＲを多重化して、図３８の多重非線形処理部１４０５へ伝達する。

次に、図４０を参照しながら、図３８の多重非線形処理部１４０５の構成と動作について詳しく説明する。図４０は、重みつき劣化音声計算部１４に含まれる多重非線形処理部１４０５の構成を示すブロック図である。多重非線形処理部１４０５は、分離部１４９５、非線形処理部１４８５_０〜１４８５_Ｋ−１、及び多重化部１４７５を有する。分離部１４９５は、図３８の周波数別ＳＮＲ計算部１４０２から供給されるＳＮＲを周波数別のＳＮＲに分離し、非線形処理部１４８５_０〜１４８５_Ｋ−１に出力する。非線形処理部１４８５_０〜１４８５_Ｋ−１は、それぞれ入力値に応じた実数値を出力する非線形関数を有する。

図４１に、非線形関数の例を示す。ｆ_１を入力値としたとき、図４１に示される非線形関数の出力値ｆ_２は、

で与えられる。但し、ａとｂは任意の実数である。

非線形処理部１４８５_０〜１４８５_Ｋ−１は、分離部１４９５から供給される周波数別ＳＮＲを、非線形関数によって処理して重み係数を求め、多重化部１４７５に出力する。すなわち、非線形処理部１４８５_０〜１４８５_Ｋ−１はＳＮＲに応じた１から０までの重み係数を出力する。ＳＮＲが小さい時は１を、大きい時は０を出力する。多重化部１４７５は、非線形処理部１４８５_０〜１４８５_Ｋ−１から出力された重み係数を多重化し、重み係数ベクトルとして多重乗算部１４０４に出力する。

図３８の多重乗算部１４０４で劣化音声パワースペクトルと乗算される重み係数は、ＳＮＲに応じた値になっており、ＳＮＲが大きい程、すなわち劣化音声に含まれる音声成分が大きい程、重み係数の値は小さくなる。推定雑音の更新には一般に劣化音声パワースペクトルが用いられるが、推定雑音の更新に用いる劣化音声パワースペクトルに対して、ＳＮＲに応じた重みづけを行うことで、劣化音声パワースペクトルに含まれる音声成分の影響を小さくすることができ、より精度の高い雑音推定を行うことができる。なお、重み係数の計算に非線形関数を用いた例を示したが、非線形関数以外にも線形関数や高次多項式など、他の形で表されるＳＮＲの関数を用いる事も可能である。

図４２は、図３６に含まれる推定雑音計算部５の構成を示すブロック図である。雑音推定計算部５は、分離部５０１、５０２、多重化部５０３、及び周波数別推定雑音計算部５０４_０〜５０４_Ｋ−１を有する。分離部５０１は、図３６の重みつき劣化音声計算部１４から供給される重みつき劣化音声パワースペクトルを周波数別の重みつき劣化音声パワースペクトルに分離し、周波数別推定雑音計算部５０４_０〜５０４_Ｋ−１にそれぞれ供給する。分離部５０２は、図３６の多重乗算部１３から供給される劣化音声パワースペクトルを周波数別の劣化音声パワースペクトルに分離し、周波数別推定雑音計算部５０４_０〜５０４_Ｋ−１にそれぞれ出力する。周波数別推定雑音計算部５０４_０〜５０４_Ｋ−１は、分離部５０１から供給される周波数別重みつき劣化音声パワースペクトル、分離部５０２から供給される周波数別劣化音声パワースペクトル、及び図３６のカウンタ４から供給されるカウント値から周波数別推定雑音パワースペクトルを計算し、多重化部５０３へ出力する。多重化部５０３は、周波数別推定雑音計算部５０４_０〜５０４_Ｋ−１から供給される周波数別推定雑音パワースペクトルを多重化し、推定雑音パワースペクトルを図３６の周波数別ＳＮＲ計算部６と重みつき劣化音声計算部１４へ出力する。周波数別推定雑音計算部５０４_０〜５０４_Ｋ−１の構成と動作の詳細な説明は、図４３を参照しながら行う。

図４３は、図４２に含まれる周波数別推定雑音計算部５０４_０〜５０４_Ｋ−１の構成を示すブロック図である。周波数別推定雑音計算部５０４_０〜５０４_Ｋ−１は、更新判定部５２０、レジスタ長記憶部５０４１、推定雑音記憶部５０４２、スイッチ５０４４、シフトレジスタ５０４５、加算器５０４６、最小値選択部５０４７、除算部５０４８、カウンタ５０４９を有する。スイッチ５０４４には、図４２の分離部５０１から、周波数別重みつき劣化音声パワースペクトルが供給されている。スイッチ５０４４が回路を閉じたときに、周波数別重みつき劣化音声パワースペクトルは、シフトレジスタ５０４５に伝達される。シフトレジスタ５０４５は、更新判定部５２０から供給される制御信号に応じて、内部レジスタの記憶値を隣接レジスタにシフトする。シフトレジスタ長は、後述するレジスタ長記憶部５０４１に記憶されている値に等しい。シフトレジスタ５０４５の全レジスタ出力は、加算器５０４６に供給される。加算器５０４６は、供給された全レジスタ出力を加算して、加算結果を除算部５０４８に伝達する。

一方、更新判定部５２０には、カウント値、周波数別劣化音声パワースペクトル及び周波数別推定雑音パワースペクトルが供給されている。更新判定部５２０は、カウント値が予め設定された値に到達するまでは常に“１”を、到達した後は入力された劣化音声信号が雑音であると判定されたときに“１”を、それ以外のときに“０”を出力し、カウンタ５０４９、スイッチ５０４４、及びシフトレジスタ５０４５に伝達する。スイッチ５０４４は、更新判定部から供給された信号が“１”のときに回路を閉じ、“０”のときに開く。カウンタ５０４９は、更新判定部から供給された信号が“１”のときにカウント値を増加し、“０”のときには変更しない。シフトレジスタ５０４５は、更新判定部から供給された信号が“１”のときにスイッチ５０４４から供給される信号サンプルを１サンプル取り込むと同時に、内部レジスタの記憶値を隣接レジスタにシフトする。最小値選択部５０４７には、カウンタ５０４９の出力とレジスタ長記憶部５０４１の出力が供給されている。

最小値選択部５０４７は、供給されたカウント値とレジスタ長のうち、小さい方を選択して、除算部５０４８に伝達する。除算部５０４８は、加算器５０４６から供給された周波数別劣化音声パワースペクトルの加算値をカウント値又はレジスタ長の小さい方の値で除算し、商を周波数別推定雑音パワースペクトルλ_ｎ（ｋ）として出力する。Ｂ_ｎ（ｋ）（ｎ＝０，１，．．．，Ｎ−１）をシフトレジスタ５０４５に保存されている劣化音声パワースペクトルのサンプル値とすると、λ_ｎ（ｋ）は、

で与えられる。

ただし、Ｎはカウント値とレジスタ長のうち、小さい方の値である。カウント値はゼロから始まって単調に増加するので、最初はカウント値で除算が行なわれ、後にはレジスタ長で除算が行なわれる。レジスタ長で除算が行なわれることは、シフトレジスタに格納された値の平均値を求めることになる。最初は、シフトレジスタ５０４５に十分多くの値が記憶されていないために、実際に値が記憶されているレジスタの数で除算する。実際に値が記憶されているレジスタの数は、カウント値がレジスタ長より小さいときはカウント値に等しく、カウント値がレジスタ長より大きくなると、レジスタ長と等しくなる。

図４４は、図４３に含まれる更新判定部５２０の構成を示すブロック図である。更新判定部５２０は、論理和計算部５２０１、比較部５２０３、５２０５、閾値記憶部５２０４、５２０６、閾値計算部５２０７を有する。図３６のカウンタ４から供給されるカウント値は、比較部５２０３に伝達される。閾値記憶部５２０４の出力である閾値も、比較部５２０３に伝達される。比較部５２０３は、供給されたカウント値と閾値を比較し、カウント値が閾値より小さいときに“１”を、カウント値が閾値より大きいときに“０”を、論理和計算部５２０１に伝達する。

一方、閾値計算部５２０７は、図４３の推定雑音記憶部５０４２から供給される周波数別推定雑音パワースペクトルに応じた値を計算し、閾値として閾値記憶部５２０６に出力する。最も簡単な閾値の計算方法は、周波数別推定雑音パワースペクトルの定数倍である。その他に、高次多項式や非線形関数を用いて閾値を計算することも可能である。閾値記憶部５２０６は、閾値計算部５２０７から出力された閾値を記憶し、１フレーム前に記憶された閾値を比較部５２０５へ出力する。比較部５２０５は、閾値記憶部５２０６から供給される閾値と図４２の分離部５０２から供給される周波数別劣化音声パワースペクトルを比較し、周波数別劣化音声パワースペクトルが閾値よりも小さければ“１”を、大きければ“０”を論理和計算部５２０１に出力する。

すなわち、推定雑音パワースペクトルの大きさをもとに、劣化音声信号が雑音であるか否かを判別している。論理和計算部５２０１は、比較部５２０３の出力値と比較部５２０５の出力値との論理和を計算し、計算結果を図４３のスイッチ５０４４、シフトレジスタ５０４５及びカウンタ５０４９に出力する。このように、初期状態や無音区間だけでなく、有音区間でも劣化音声パワーが小さい場合には、更新判定部５２０は“１”を出力する。すなわち、推定雑音の更新が行われる。閾値の計算は各周波数毎に行われるため、各周波数毎に推定雑音の更新を行うことができる。

図４５は、図３６に含まれる推定先天的ＳＮＲ計算部７の構成を示すブロック図である。推定先天的ＳＮＲ計算部７は、多重値域限定処理部７０１、後天的ＳＮＲ記憶部７０２、抑圧係数記憶部７０３、多重乗算部７０４、７０５、重み記憶部７０６、多重重みつき加算部７０７、加算器７０８を有する。図３６の周波数別ＳＮＲ計算部６から供給される後天的ＳＮＲγ_ｎ（ｋ）（ｋ＝０，１，．．．，Ｋ−１）は、後天的ＳＮＲ記憶部７０２と加算器７０８に伝達される。後天的ＳＮＲ記憶部７０２は、第ｎフレームにおける後天的ＳＮＲγ_ｎ（ｋ）を記憶すると共に、第ｎ−１フレームにおける後天的ＳＮＲγ_ｎ−１（ｋ）を多重乗算部７０５に伝達する。

図３６の抑圧係数補正部１５から供給される補正抑圧係数Ｇ_ｎ（ｋ）バー（ｋ＝０，１，．．．，Ｋ−１）は、抑圧係数記憶部７０３に伝達される。抑圧係数記憶部７０３は、第ｎフレームにおける補正抑圧係数Ｇ_ｎ（ｋ）バーを記憶すると共に、第ｎ−１フレームにおける補正抑圧係数Ｇ_ｎ−１（ｋ）バーを多重乗算部７０４に伝達する。多重乗算部７０４は、供給されたＧ_ｎ（ｋ）バーを２乗してＧ^２ _ｎ−１（ｋ）バーを求め、多重乗算部７０５に伝達する。多重乗算部７０５は、Ｇ^２ _ｎ−１（ｋ）バーとγ_ｎ−１（ｋ）をｋ＝０，１，．．．，Ｋ−１に対して乗算してＧ^２ _ｎ−１（ｋ）バーγ_ｎ−１（ｋ）を求め、結果を多重重み付き加算部７０７に過去の推定ＳＮＲ９２２として伝達する。多重乗算部７０４及び７０５の構成は、既に図３７を用いて説明した多重乗算部１３に等しいので、詳細な説明は省略する。

加算器７０８の他方の端子には−１が供給されており、加算結果γ_ｎ（ｋ）−１が多重値域限定処理部７０１に伝達される。多重値域限定処理部７０１は、加算器７０８から供給された加算結果γ_ｎ（ｋ）−１に値域限定演算子Ｐ［・］による演算を施し、結果であるＰ［γ_ｎ（ｋ）−１］を多重重みつき加算部７０７に瞬時推定ＳＮＲ９２１として伝達する。ただし、Ｐ［ｘ］は式（１０）で定められる。

多重重みつき加算部７０７には、また、重み記憶部７０６から重み９２３が供給されている。多重重みつき加算部７０７は、これらの供給された瞬時推定ＳＮＲ９２１、過去の推定ＳＮＲ９２２、重み９２３を用いて推定先天的ＳＮＲ９２４を求める。重み９２３をαとし、ξ_ｎ（ｋ）ハットを推定先天的ＳＮＲとすると、ξ_ｎ（ｋ）ハットは、式（１１）によって計算される。

ここに、Ｇ^２ _−１（ｋ）γ_−１（ｋ）バー＝１とする。

図４６は、図４５に含まれる多重値域限定処理部７０１の構成を示すブロック図である。多重値域限定処理部７０１は、定数記憶部７０１１、最大値選択部７０１２_０〜７０１２_Ｋ−１、分離部７０１３、多重化部７０１４を有する。分離部７０１３には、図４５の加算器７０８から、γ_ｎ（ｋ）−１が供給される。分離部７０１３は、供給されたγ_ｎ（ｋ）−１をＫ個の周波数別成分に分離し、最大値選択部７０１２_０〜７０１２_Ｋ−１に供給する。最大値選択部７０１２_０〜７０１２_Ｋ−１の他方の入力には、定数記憶部７０１１からゼロが供給されている。最大値選択部７０１２_０〜７０１２_Ｋ−１は、γ_ｎ（ｋ）−１をゼロと比較し、大きい方の値を多重化部７０１４へ伝達する。この最大値選択演算は、式（１０）を実行することに相当する。多重化部７０１４は、これらの値を多重化して出力する。

図４７は、図４５に含まれる多重重みつき加算部７０７の構成を示すブロック図である。多重重みつき加算部７０７は、重みつき加算部７０７１_０〜７０７１_Ｋ−１、分離部７０７２、７０７４、多重化部７０７５を有する。分離部７０７２には、図４５の多重値域限定処理部７０１から、Ｐ［γ_ｎ（ｋ）−１］が瞬時推定ＳＮＲ９２１として供給される。分離部７０７２は、Ｐ［γ_ｎ（ｋ）−１］をＫ個の周波数別成分に分離し、周波数別瞬時推定ＳＮＲ９２１_０〜９２１_Ｋ−１として、重みつき加算部７０７１_０〜７０７１_Ｋ−１に伝達する。分離部７０７４には、図４５の多重乗算部７０５から、Ｇ^２ _ｎ−１（ｋ）バーγ_ｎ−１（ｋ）が過去の定ＳＮＲ９２２として供給される。

分離部７０７４は、Ｇ^２ _ｎ−１（ｋ）バーγ_ｎ−１（ｋ）をＫ個の周波数別成分に分離し、過去の周波数別推定ＳＮＲ９２２_０〜９２２_Ｋ−１として、重みつき加算部７０７１_０〜７０７１_Ｋ−１に伝達する。一方、重みつき加算部７０７１_０〜７０７１_Ｋ−１には、重み９２３も供給される。重みつき加算部７０７１_０〜７０７１_Ｋ−１は、式（１１）によって表される重みつき加算を実行し、周波数別推定先天的ＳＮＲ９２４_０〜９２４_Ｋ−１を多重化部７０７５に伝達する。多重化部７０７５は、周波数別推定先天的ＳＮＲ９２４_０〜９２４_Ｋ−１を多重化し、推定先天的ＳＮＲ９２４として出力する。重みつき加算部７０７１_０〜７０７１_Ｋ−１の動作と構成については、次に図４８を参照しながら説明する。

図４８は、図４７に含まれる重みつき加算部７０７１の構成を示すブロック図である。重みつき加算部７０７１は、乗算器７０９１、７０９３、定数乗算器７０９５、加算器７０９２、７０９４を有する。図４７の分離部７０７２から周波数別瞬時推定ＳＮＲ９２１が、図４７の分離部７０７４から過去の周波数別ＳＮＲ９２２が、図４５の重み記憶部７０６から重み９２３が、それぞれ入力として供給される。値αを有する重み９２３は、定数乗算器７０９５と乗算器７０９３に伝達される。定数乗算器７０９５は入力信号を−１倍して得られた−αを、加算器７０９４に伝達する。加算器７０９４のもう一方の入力としては１が供給されており、加算器７０９４の出力は両者の和である１−αとなる。１−αは乗算器７０９１に供給されて、もう一方の入力である周波数別瞬時推定ＳＮＲＰ［γ_ｎ（ｋ）−１］と乗算され、積である（１−α）Ｐ［γ_ｎ（ｋ）−１］が加算器７０９２に伝達される。一方、乗算器７０９３では、重み９２３として供給されたαと過去の推定ＳＮＲ９２２が乗算され、積であるαＧ^２ _ｎ−１（ｋ）バーγ_ｎ−１（ｋ）が加算器７０９２に伝達される。加算器７０９２は、（１−α）Ｐ［γ_ｎ（ｋ）−１］とαＧ^２ _ｎ−１（ｋ）バーγ_ｎ−１（ｋ）の和を、周波数別推定先天的ＳＮＲ９２４として出力する。

図４９は、図３６に含まれる雑音抑圧係数生成部８を示すブロック図である。雑音抑圧係数生成部８は、ＭＭＳＥＳＴＳＡゲイン関数値計算部８１１、一般化尤度比計算部８１２、及び抑圧係数計算部８１４を有する。以下、特許文献１に記載されている計算式をもとに、抑圧係数の計算方法を説明する。

フレーム番号をｎ、周波数番号をｋとし、γ_ｎ（ｋ）を図３６の周波数別ＳＮＲ計算部６から供給される周波数別後天的ＳＮＲ、ξ_ｎ（ｋ）ハットを図３６の推定先天的ＳＮＲ計算部７から供給される周波数別推定先天的ＳＮＲ、ｑを図３６の音声非存在確率記憶部２１から供給される音声非存在確率とする。また、η_ｎ（ｋ）＝ξ_ｎ（ｋ）ハット／（１−ｑ）、ｖ_ｎ（ｋ）＝（η_ｎ（ｋ）γ_ｎ（ｋ））／（１＋η_ｎ（ｋ））とする。ＭＭＳＥＳＴＳＡゲイン関数値計算部８１１は、図３６の周波数別ＳＮＲ計算部６から供給される後天的ＳＮＲ γ_ｎ（ｋ）、図３６の推定先天的ＳＮＲ計算部７から供給される推定先天的ＳＮＲ ξ_ｎ（ｋ）ハット及び図３６の音声非存在確率記憶部２１から供給される音声非存在確率ｑをもとに、各周波数毎にＭＭＳＥＳＴＳＡゲイン関数値を計算し、抑圧係数計算部８１４に出力する。各周波数毎のＭＭＳＥＳＴＳＡゲイン関数値Ｇ_ｎ（ｋ）は、

で与えられる。

ここに、Ｉ_０（ｚ）は０次変形ベッセル関数、Ｉ_１（ｚ）は１次変形ベッセル関数である。変形ベッセル関数については、非特許文献１に記載されている。

一般化尤度比計算部８１２は、図３６の周波数別ＳＮＲ計算部６から供給される後天的ＳＮＲ γ_ｎ（ｋ）、図３６の推定先天的ＳＮＲ計算部７から供給される推定先天的ＳＮＲ ξ_ｎ（ｋ）ハット及び図３６の音声非存在確率記憶部２１から供給される音声非存在確率ｑをもとに、周波数毎に一般化尤度比を計算し、抑圧係数計算部８１４に出力する。周波数毎の一般化尤度比Λ_ｎ（ｋ）は、

で与えられる。

抑圧係数計算部８１４は、ＭＭＳＥＳＴＳＡゲイン関数値計算部８１１から供給されるＭＭＳＥＳＴＳＡゲイン関数値Ｇ_ｎ（ｋ）と一般化尤度比計算部８１２から供給される一般化尤度比Λ_ｎ（ｋ）から周波数毎に抑圧係数を計算し、図３６の抑圧係数補正部１５へ出力する。周波数毎の抑圧係数Ｇ_ｎ（ｋ）バーは、

で与えられる。周波数別にＳＮＲを計算する代わりに、複数の周波数から構成される帯域に共通なＳＮＲを求めて、これを用いることも可能である。

図５０は、図３６に含まれる抑圧係数補正部１５を示すブロック図である。抑圧係数補正部１５は、周波数別抑圧係数補正部１５０１_０〜１５０１_Ｋ−１、分離部１５０２、１５０３及び多重化部１５０４を有する。

分離部１５０２は、図３６の推定先天的ＳＮＲ計算部７から供給される推定先天的ＳＮＲを周波数別成分に分離し、それぞれ周波数別抑圧係数補正部１５０１_０〜１５０１_Ｋ−１に出力する。分離部１５０３は、図３６の抑圧係数生成部８から供給される抑圧係数を周波数別成分に分離し、それぞれ周波数別抑圧係数補正部１５０１_０〜１５０１_Ｋ−１に出力する。周波数別抑圧係数補正部１５０１_０〜１５０１_Ｋ−１は、分離部１５０２から供給される周波数別推定先天的ＳＮＲと、分離部１５０３から供給される周波数別抑圧係数から、周波数別補正抑圧係数を計算し、多重化部１５０４へ出力する。多重化部１５０４は、周波数別抑圧係数補正部１５０１_０〜１５０１_Ｋ−１から供給される周波数別補正抑圧係数を多重化し、補正抑圧係数として図３６の多重乗算部１と推定先天的ＳＮＲ計算部７へ出力する。

次に図５１を参照しながら、周波数別抑圧係数補正部１５０１_０〜１５０１_Ｋ−１の構成と動作について詳細に説明する。

図５１は、抑圧係数補正部１５に含まれる周波数別抑圧係数補正部１５０１_０〜１５０１_Ｋ−１の構成を示すブロック図である。周波数別抑圧係数補正部１５０１は、最大値選択部１５９１、抑圧係数下限値記憶部１５９２、閾値記憶部１５９３、比較部１５９４、スイッチ１５９５、修正値記憶部１５９６及び乗算器１５９７を有する。

比較部１５９４は、閾値記憶部１５９３から供給される閾値と、図５０の分離部１５０２から供給される周波数別推定先天的ＳＮＲを比較し、周波数別推定先天的ＳＮＲが閾値よりも大きければ“０”を、小さければ“１”をスイッチ１５９５に供給する。スイッチ１５９５は、図５０の分離部１５０３から供給される周波数別抑圧係数を、比較部１５９４の出力値が“１”のときに乗算器１５９７に出力し、“０”のときに最大値選択部１５９１に出力する。すなわち、周波数別推定先天的ＳＮＲが閾値よりも小さいときに、抑圧係数の補正が行われる。乗算器１５９７は、スイッチ１５９５の出力値と修正値記憶部１５９６の出力値との積を計算し、最大値選択部１５９１に出力する。

一方、抑圧係数下限値記憶部１５９２は、記憶している抑圧係数の下限値を、最大値選択部１５９１に供給する。最大値選択部１５９１は、図５０の分離部１５０３から供給される周波数別抑圧係数、又は乗算器１５９７で計算された積と、抑圧係数下限値記憶部１５９２から供給される抑圧係数下限値とを比較し、大きい方の値を図５０の多重化部１５０４に出力する。すなわち、抑圧係数は抑圧係数下限値記憶部１５９２が記憶する下限値よりも必ず大きい値になる。

特開２００２−２０４１７号公報

１９８５年、数学辞典、岩波書店、３７４．Ｇページ１９７９年１２月、プロシーディングス・オブ・ザ・アイ・イー・イー・イー、第６７巻、第１２号（ＰＲＯＣＥＥＤＩＮＧＳＯＦＴＨＥＩＥＥＥ，ＶＯＬ．６７，ＮＯ．１２，ＰＰ．１５８６−１６０４，ＤＥＣ，１９７９）、１５８６〜１６０４ページ１９７９年４月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第２７巻、第２号（ＩＥＥＥＴＲＡＮＳＡＣＴＩＯＮＳＯＮＡＣＯＵＳＴＩＣＳ，ＳＰＥＥＣＨ，ＡＮＤＳＩＧＮＡＬＰＲＯＣＥＳＳＩＮＧ，ＶＯＬ．２７，ＮＯ．２，ＰＰ．１１３−１２０，ＡＰＲ，１９７９）、１１３〜１２０ページ

これまで説明した関連技術の方法では、音声区間と雑音区間を区別せずに、常に同一の計算方法で求めた抑圧係数を用いて雑音抑圧を行っていた。このため、音声区間で音声歪みが発生し、雑音区間での抑圧が不十分になるという問題があった。

本発明の目的は、音声区間と雑音区間を区別し、それぞれに適した計算方法で求めた抑圧係数を用いて雑音抑圧を行うことによって、音声区間での音声歪みを低減し、雑音区間において十分な抑圧を達成することのできる雑音抑圧の方法及び装置を提供することである。

本発明の雑音抑圧の方法及び装置では、無音部用係数と有音部係数に基づき、雑音抑圧
後に更に抑圧を行う後抑圧を用いることを特徴とする。

より具体的には、強調音声パワースペクトルと推定雑音パワースペクトルに基づいて無
音部用係数を計算する無音部用係数計算部と、有音部用係数を記憶する有音部用係数記憶
部と、得られた無音部用係数と有音部用係数をもとに後抑圧係数を計算するための後抑圧
係数計算部を備えていることを特徴とする。

本発明では、強調音声パワースペクトルと推定雑音パワースペクトルに基づいて計算された無音部用係数と、有音部用係数を用いて抑圧係数を補正するので、音声区間では有音部用係数に基づき抑圧を弱め、雑音区間では強調音声パワースペクトルと推定雑音パワースペクトルに応じた無音部用係数に基づき抑圧を強めるように後抑圧を行うことが可能となり、音声区間では歪みが少なく雑音区間では残留雑音が少ない強調音声を得ることができる。

本発明の第１の実施の形態を示すブロック図。本発明の第１の実施の形態に含まれる強調音声スペクトル補正部の構成を示すブロック図。図２に含まれる音声存在確率計算部の構成を示すブロック図。図３に含まれる平滑化部の構成を示すブロック図。図２に含まれる後抑圧係数計算部の構成を示すブロック図。図５に含まれる周波数別後抑圧係数計算部の構成を示すブロック図。図６に含まれる無音部用係数計算部の構成を示すブロック図。図７に含まれる係数計算部における非線形関数の一例を示す図。本発明の第２の実施の形態を示すブロック図。本発明の第２の実施の形態に含まれる強調音声スペクトル補正部の構成を示すブロック図。図１０に含まれる後抑圧係数計算部の構成を示すブロック図。図１１に含まれる周波数別後抑圧係数計算部の構成を示すブロック図。本発明の第３の実施の形態を示すブロック図。本発明の第３の実施の形態に含まれる強調音声スペクトル補正部の構成を示すブロック図。図１４に含まれる後抑圧係数計算部の構成を示すブロック図。図１５に含まれる周波数別後抑圧係数計算部の構成を示すブロック図。本発明の第４の実施の形態を示すブロック図。本発明の第４の実施の形態に含まれる強調音声スペクトル補正部の構成を示すブロック図。図１８に含まれる後抑圧係数計算部の構成を示すブロック図。図１９に含まれる周波数別後抑圧係数計算部の構成を示すブロック図。本発明の第５の実施の形態を示すブロック図。本発明の第５の実施の形態に含まれる推定先天的ＳＮＲ計算部の構成を示すブロック図。本発明の第５の実施の形態に含まれる抑圧係数補正部の構成を示すブロック図。図２３に含まれる周波数別抑圧係数補正部の構成を示すブロック図。本発明の第６の実施の形態を示すブロック図。本発明の第６の実施の形態に含まれる推定先天的ＳＮＲ計算部の構成を示すブロック図。本発明の第６の実施の形態に含まれる抑圧係数補正部の構成を示すブロック図。図２７に含まれる周波数別推定抑圧係数補正部の構成を示すブロック図。本発明の第７の実施の形態を示すブロック図。本発明の第７の実施の形態に含まれる強調音声振幅スペクトル補正部を示すブロック図。本発明の第８の実施の形態を示すブロック図。本発明の第８の実施の形態に含まれる強調音声振幅スペクトル補正部を示すブロック図。本発明の第８の実施の形態に含まれる音声存在確率計算部を示すブロック図。本発明の第９の実施の形態を示すブロック図。本発明の第９の実施の形態に含まれる音声存在確率計算部を示すブロック図。関連技術例の構成を示すブロック図。関連技術例の構成に含まれる多重乗算部の構成を示すブロック図。関連技術例の構成に含まれる重み付き劣化音声計算部の構成を示すブロック図。図３８に含まれる周波数別ＳＮＲ計算部の構成を示すブロック図。図３８に含まれる多重非線形処理部の構成を示すブロック図。非線形処理部における非線形関数の一例を示す図。関連技術例の構成に含まれる推定雑音計算部の構成を示すブロック図。図４２に含まれる周波数別推定雑音計算部の構成を示すブロック図。図４３に含まれる更新判定部の構成を示すブロック図。関連技術例の構成に含まれる推定先天的ＳＮＲ計算部の構成を示すブロック図。図４５に含まれる多重値域限定処理部の構成を示すブロック図。図４５に含まれる多重重みつき加算部の構成を示すブロック図。図４７に含まれる重みつき加算部の構成を示すブロック図。関連技術例の構成に含まれる雑音抑圧係数生成部の構成を示すブロック図。関連技術例の構成に含まれる抑圧係数補正部の構成を示すブロック図。図５０に含まれる周波数別抑圧係数補正部の構成を示すブロック図。

図１は本発明の実施の形態を示すブロック図である。図１と関連技術例である図３６とは、強調音声振幅スペクトル補正部１８を除いて同一である。以下、これらの相違点を中心に詳細な動作を説明する。

強調音声振幅スペクトル補正部１８には、フーリエ変換部３から劣化音声振幅スペクトル、推定雑音計算部５から推定雑音パワースペクトル、多重乗算部１６から強調音声振幅スペクトル、そして抑圧係数補正部１５から補正抑圧係数がそれぞれ供給されている。強調音声振幅スペクトル補正部１８は、これらの劣化音声振幅スペクトル、推定雑音パワースペクトル、強調音声振幅スペクトル、補正抑圧係数を用いて強調音声振幅スペクトルを補正し、逆フーリエ変換部９へ伝達する。強調音声振幅スペクトル補正部１８の構成と動作の詳細な説明は、図２を参照しながら行う。

図２は強調音声振幅スペクトル補正部１８の構成を示すブロック図である。強調音声振幅スペクトル補正部１８は、多重乗算部１７０、１７３、音声存在確率計算部１７１、後抑圧係数計算部１８２を有する。多重乗算部１７０は、図１の多重乗算部１６から供給される強調音声振幅スペクトルを用いて、強調音声パワースペクトルを計算し、音声存在確率計算部１７１へ伝達する。音声存在確率計算部１７１は、多重乗算部１７０及び図１の推定雑音計算部５から供給される強調音声パワースペクトル及び推定雑音パワースペクトルを用いて、音声存在確率を計算し、後抑圧係数計算部１８２に伝達する。音声存在確率計算部に供給されている強調音声パワースペクトルと推定雑音パワースペクトルは、共に劣化音声振幅スペクトルから計算されている。従って、音声存在確率は、本質的には劣化音声パワースペクトルを基に計算されていると言える。

後抑圧係数計算部１８２は、音声存在確率計算部１７１から供給された音声存在確率と、図１の抑圧係数補正部１５から供給された補正抑圧係数と、図１の推定雑音計算部５から供給された推定雑音と、図１の抑圧係数補正部１５から供給された補正抑圧係数を用いて、後抑圧係数を計算し、多重乗算部１７３に伝達する。多重乗算部１７３は、図１のフーリエ変換部から供給された劣化音声振幅スペクトルを、後抑圧係数計算部１７２から供給された後抑圧係数で重みづけすることによって補正強調音声振幅スペクトルを求め、図１の逆フーリエ変換部９に伝達する。多重乗算部１７０、１７３の構成は、図３７を用いて説明した多重乗算部１３に等しいので、詳細な説明は省略する。

音声存在確率計算部１７１及び後抑圧係数計算部１８２の構成と動作の詳細な説明は、図３及び図５を参照しながら行う。

図３は音声存在確率計算部１７１の構成を示すブロック図である。音声存在確率計算部１７１は、分離部１７００、１７０８、平均値計算部１７０１、１７０９、対数計算部１７０２、１７１０、乗算部１７０３、１７１１、平滑化係数記憶部１７０４、１７０６、平滑化部１７０５、１７０７、関数値計算部１７１２、１７１３、平均指標計算部１７１４、瞬時指標計算部１７１５、加算部１７１６を有する。

分離部１７００は、図２の多重乗算部１７０から供給される強調音声パワースペクトルを周波数別強調音声パワースペクトルに分離し、平均値計算部１７０１へ出力する。平均値計算部１７０１は、強調音声パワースペクトル｜Ｘ_ｎ（ｋ）｜^２バーのｋ＝０からＫ−１に対する総和をＫで除算し、計算結果を対数計算部１７０２へ伝達する。対数計算部１７０２は、平均値計算部１７０１から入力された平均値の対数を計算し、乗算器１７０３へ伝達する。乗算器１７０３は、供給された対数値を定数倍して、強調音声パワーＰＥ_ｎを求め、平滑化部１７０５、１７０７へ供給する。すなわち、第ｎフレームの強調音声パワーＰＥ_ｎは、

で与えられる。

一方、分離部１７０８は、図１の雑音推定計算部５から供給された推定雑音パワースペクトルを周波数別推定雑音パワースペクトルに分離し、平均値計算部１７０９へ出力する。平均値計算部１７０９は、周波数別推定雑音パワースペクトルλ_ｎ（ｋ）のｋ＝０からＫ−１に対する総和をＫで除算し、計算結果を対数計算部１７１０へ伝達する。対数計算部１７１０は、平均値計算部１７０９から供給された平均値の対数を計算し、乗算器１７１１へ伝達する。乗算器１７１１は、供給された対数値を定数倍して、推定雑音パワーＰＮ_ｎを求め、関数値計算部１７１２、１７１３へ供給する。すなわち、第ｎフレームの推定雑音パワーＰＮ_ｎは、

で与えられる。

入力信号に音声がどの程度含まれているかを表す指標は、推定雑音パワーＰＮ_ｎと強調音声パワーＰＥ_ｎの相対関係をもとに計算される。強調音声パワーＰＥ_ｎが推定雑音パワーＰＮ_ｎよりも大きければ、指標は音声の存在確率が高いことを示す。一般的に、推定雑音パワーＰＮ_ｎと強調音声パワーＰＥ_ｎは非定常信号であるため、音声区間において推定雑音パワーＰＮ_ｎが強調音声パワーＰＥ_ｎよりも大きくなる場合が発生する。逆に、雑音区間でも推定雑音パワーＰＮ_ｎが強調音声パワーＰＥ_ｎよりも大きくなることがある。従って、それぞれのパワーを補正せずに指標計算に用いると、誤った音声存在確率が得られる可能性がある。このため、音声存在確率計算の精度を向上するには、推定雑音パワーＰＮ_ｎと強調音声パワーＰＥ_ｎを適切に補正することが望ましい。また、複数の補正方法を導入し、複数の指標をもとに音声存在確率を計算すれば、精度は更に向上する。

本実施例では、強調音声パワーＰＥ_ｎは平滑化部１７１５と１７１６において平滑化処理を用いて、推定雑音パワーＰＮ_ｎは関数値計算部１７１２と１７１３において適切な関数を用いて、指標計算に適した値に補正される。指標としては、分析区間長がそれぞれ異なる瞬時指標と平均指標の二種類が計算される。

平滑化部１７０５は、平滑化係数記憶部１７０４から供給された平滑化係数を用いて、乗算器１７０３から供給された強調音声パワーＰＥ_ｎを時間方向に平滑化し、第一の平滑強調音声パワーを瞬時指標計算部１７１５へ供給する。平滑化部１７０７も同様に、平滑化係数記憶部１７０６から供給された平滑化係数を用いて、乗算器１７０３から供給された強調音声パワーＰＥ_ｎを時間方向に平滑化し、第二の平滑強調音声パワーを平均指標計算部１７１４へ供給する。基本的に、平滑化係数記憶部１７０４に記憶されている係数の方が、平滑化係数記憶部１７０６の係数よりも小さくなるように設定される。これは、平滑化係数の値が小さい程、平滑化部の時間方向平滑化効果が小さくなり、瞬時指標の計算に適しているためである。

関数値計算部１７１３は、乗算器１７１１から供給された推定雑音パワーＰＮ_ｎから第一の関数値を計算し、瞬時指標計算部１７１５へ供給する。関数値計算部１７１２も同様に、乗算器１７１１から供給された推定雑音パワーＰＮ_ｎから第二の関数値を計算し、平均指標計算部１７１４へ供給する。関数値の計算には、ダイナミックレンジの圧縮や拡大を行うために線形又は非線形関数や、分散を低減するために平滑化が用いられる。ダイナミックレンジの圧縮や拡大、分散の低減により、推定雑音パワーＰＮ_ｎの非定常性に起因する指標計算の精度劣化を低減できる。また、演算量を低減するために、関数値計算を省略し、推定雑音パワーＰＮ_ｎをそのまま指標計算に利用することも可能である。関数値計算部１７１２と１７１３では、例えば次のような関数が利用される。

但し、ＰＮ_ｎハットは関数値、ａ_ｆｃとｂ_ｆｃは実数である。

瞬時指標計算部１７１５は、平滑化部１７０５から供給された第一の平滑強調音声パワーと、関数値計算部１７１３から供給された第一の関数値を用いて、瞬時指標を計算し、加算部１７１６へ供給する。平均指標計算部１７１４は、平滑化部１７０７から供給された第二の平滑強調音声パワーと、関数値計算部１７１２から供給された第二の関数値を用いて、平均指標を計算し、加算部１７１６へ供給する。指標の計算には、強調音声パワーＰＥ_ｎと推定雑音パワーＰＮ_ｎの比を計算し、その比に応じて数値を大きくする方法が利用される。具体例としては、次のような計算方法が挙げられる。

但し、ＩＤＸ_ｎは指標、ＰＥ_ｎバーは平滑強調音声パワー、ＰＮ_ｎハットは関数値である。また、θ_ｉｄｘ、ａ_ｉｄｘとｂ_ｉｄｘは実数で、ａ_ｉｄｘはｂ_ｉｄｘ以上の値を有する。

比を計算するときに分母に定数を加えると、分母の値が定数よりも小さくならないので、比を計算する際に発散を防止できる。この他にも、強調音声パワーＰＥ_ｎと推定雑音パワーＰＮ_ｎの差や、差を強調音声パワーＰＥ_ｎで正規化した値を用いて計算することもできるが、詳細は省略する。

加算部１７１６は、平均指標計算部１７１４及び瞬時指標計算部１７１５から供給された平均指標及び瞬時指標の和を計算し、音声存在確率として図２の後抑圧係数計算部１７２へ伝達する。音声存在確率の計算には、加算以外にも、重みつき加算や乗算を用いることが可能である。音声存在確率の精度を改善するために、分析区間が異なる３種類以上の指標を計算しても良い。また、１種類の指標だけを利用し、計算を簡略化することも可能である。

平滑化部１７０５の構成と動作の詳細な説明は、図４を用いて行う。

図４は、図３の平滑化部１７０５の構成を示すブロック図である。平滑化部１７０５は、定数乗算器１７４１、乗算器１７４３、１７４４、加算器１７４２、１７４５、遅延器１７４６を有する。図３の乗算器１７０３から強調音声パワーＰＥ_ｎが、図３の平滑化係数記憶部１７０４から平滑化係数が、それぞれ入力として供給される。値δを有する平滑化係数は、定数乗算器１７４１と乗算器１７４４に伝達される。定数乗算器１７４１は、入力信号を−１倍して−δとし、これを加算器１７４２に伝達する。加算器１７４２のもう一方の入力としては１が供給されており、加算器１７４２の出力は両者の和である１−δとなる。１−δは乗算器１７４３に供給されて、もう一方の入力である強調音声パワーＰＥ_ｎと乗算され、積である（１−δ）ＰＥ_ｎが加算器１７４５に伝達される。

一方、乗算器１７４４では、平滑化係数として供給されたδと遅延器１７４６から供給された１フレーム前の平滑化強調音声パワーＰＥ_ｎ−１バーが乗算され、積であるδＰＥ_ｎ−１バーが加算器１７４５に伝達される。加算器１７４５は、（１−δ）ＰＥ_ｎとδＰＥ_ｎ−１バーの和を遅延器１７４６と図３の瞬時指標計算部１７１５に、平滑化強調音声パワーＰＥ_ｎバーとして、出力する。以上の計算は、式（１９）によって表すことができる。

平滑化部１７０７の構成は、平滑化部１７０５と同じである。但し、平滑化部１７０７は、平滑化係数記憶部１７０６から供給される平滑化係数を用いて、平滑化強調音声パワーを計算する。また、平滑化部１７０５と１７０７では、式（１９）の他に、移動平均を利用することも可能である。

図５は、図２の後抑圧係数計算部１８２の構成を示すブロック図である。後抑圧係数計算部１８２は、分離部１７２２、周波数別後抑圧係数計算部１８２１_０〜１８２１_Ｋ−１、多重化部１７２３を有する。分離部１７２２は、図１の抑圧係数補正部５から供給された補正抑圧係数を周波数別補正抑圧係数に分離し、周波数別後抑圧係数計算部１８２１_０〜１８２１_Ｋ−１に伝達する。周波数別後抑圧係数計算部１８２１_０〜１８２１_Ｋ−１は、図２の音声存在確率計算部１７１、図１の多重乗算部１６及び推定雑音計算部５からそれぞれ供給される音声存在確率、強調音声振幅スペクトル、推定雑音パワースペクトル、及び分離部１７２２から供給される周波数別補正抑圧係数を用いて、周波数別後抑圧係数を計算し、多重化部１７２３に伝達する。

周波数別後抑圧係数計算部１８２１_０〜１８２１_Ｋ−１の構成と動作の詳細な説明は、図６を参照しながら行う。

図６は、図５の周波数別後抑圧係数計算部１８２１_０〜１８２１_Ｋ−１の構成を示すブロック図である。周波数別後抑圧係数計算部１８２１は、有音部用係数記憶部１８３１、無音部用係数計算部１８３２、係数計算部１８３３、乗算器１８３４を有する。周波数別後抑圧係数計算部１８２１は、音声存在確率に応じて、周波数別後抑圧係数を計算する。音声存在確率が低ければ、無音部用係数の寄与率が高い係数を用いて、周波数別後抑圧係数の値を小さくする。このため、雑音区間での残留雑音を更に低減できる。逆に、音声存在確率が高い場合には、有音部用係数の寄与率が高い係数を用いて、周波数別後抑圧係数が周波数別補正抑圧係数と同等の値になるように補正する。また、周波数別後抑圧係数が周波数別補正抑圧係数よりも少し大きくなるように補正しても良い。以上から、音声存在確率が高い場合には、音声の過剰抑圧を防止できる。本実施例では、係数は各周波数毎に計算しているが、全帯域で共通の係数を求め、その係数を周波数別補正抑圧係数に適用すれば、係数の計算に必要な演算量を低減できる。

係数計算部１８３３は、有音部用係数記憶部１８３１と無音部用係数計算部１８３２からそれぞれ出力される有音部用係数と無音部用係数、及び図２の音声存在確率計算部１７１から供給される音声存在確率をもとに、係数を計算する。

音声存在確率をｐ、有音部用係数をＦＶ、無音部用係数をＦＵとした場合に、係数計算部１８３３から出力される係数Ｆは、式（２０）で与えられる。

係数の計算では、音声存在確率が大きければ、係数計算部１８３３の出力値に対する有音部用係数の寄与率を大きくする。式（２０）の計算方法では、音声存在確率をそのまま寄与率として利用している。

また、式（２１）に示すように、適当な関数Ｆ_ＳＦＣ、Ｇ_ＳＦＣを用いて有音部用と無音部用の係数を補正してから、音声存在確率を寄与率として利用することも可能である。

この他にも、音声存在確率が予め定められた値以上の場合は、有音部用係数を係数計算部１８３３から出力することもできる。そして、乗算器１８３４は、図５の分離部１７２２から供給される周波数別補正抑圧係数と、係数計算部１８３３から供給される係数の積を計算し、周波数別後抑圧係数として図５の多重化部１７２３に伝達する。

無音部用係数計算部１８３２は、図２の音声存在確率計算部１７１、図１の多重乗算部１６及び推定雑音計算部１からそれぞれ供給される音声存在確率、強調音声振幅スペクトル、推定雑音パワースペクトルを用いて、無音部用係数を求め、係数計算部１８３３へ供給する。雑音区間の残留雑音を低減するため、有音部用係数よりも小さな値を出力するように無音部用係数計算部１８３２を設計する。

無音部用係数計算部１８３２の構成と動作の詳細な説明は、図７を用いて行う。

図７は、図６の無音部用係数計算部１８３２の構成を示すブロック図である。無音部用係数計算部１８３２は、分離部１８５０、１８５５、平均値計算部１８５１、１８５６、音声パワー混合部１８５２、平滑化部１８５３、平滑化係数記憶部１８５４、平滑信号記憶部１８５８、除算部１８５７、１８６２、対数計算部１８５９、定数乗算部１８６０、係数計算部１８６１、指数計算部１８６３を有する。

分離部１８５０は、図１の多重乗算部１６から供給される強調音声パワースペクトルを周波数別強調音声パワースペクトルに分離し、平均値計算部１８５１へ伝達する。平均値計算部１８５１は、周波数別強調音声パワースペクトル｜Ｘ_ｎ（ｋ）｜^２バーのｋ＝０からＫ−１に対する総和をＫで除算し、強調音声パワーとして音声パワー混合部１８５２へ伝達する。音声パワー混合部１８５２は、平均値計算部１８５１から供給される強調音声パワーと、平滑信号記憶部１８５８から供給される１フレーム前の平滑強調音声パワーを、図２の音声存在確率計算部１７１から供給される音声存在確率に応じて混合し、混合した信号を平滑化部１８５３へ伝達する。混合の際、音声存在確率が高ければ、平均電力計算部１８５１から供給される強調音声平均パワーの比率を高くし、低ければ、平滑信号記憶部１８５８から供給される平滑強調音声パワーの比率を高くする。

平滑化部１８５３は、平滑化係数記憶部１８５４から供給される平滑化係数に応じて、音声パワー混合部１８５２から供給された混合信号を平滑化し、平滑強調音声パワーとして平滑信号記憶部１８５８と除算部１８５７に伝達する。音声パワー混合部の機能から明らかなように、音声存在確率が低い区間では、平滑化部１８５３は、１フレーム前の平滑強調音声パワーが多く含まれた信号を用いて、平滑強調音声パワーを計算する。従って、平滑強調音声パワーは殆ど更新されない。このため、平滑部１８５３からは、雑音区間においても、音声区間で計算された強調音声パワーが常に出力される。一方、音声存在確率が高い区間では、平滑化部１８５３は、強調音声平均パワーが多く含まれた信号を用いて、平滑強調音声パワーを計算する。

音声パワー混合部１８５２で利用されている音声存在確率は、図２の音声存在確率計算部１７１から供給されており、強調音声パワースペクトルと推定雑音パワースペクトルを基に計算されている。無音部用係数計算部１８３２にも、強調音声パワースペクトルと推定雑音パワースペクトルが入力されているので、音声パワー混合部１８５２で利用する音声存在確率を無音部用係数計算部１８３２の内部でも計算することが可能である。

また、図２の音声存在確率計算部１７１の場合と同様に、強調音声パワースペクトルと推定雑音パワースペクトルは、劣化音声振幅スペクトルをもとに計算されているので、音声パワー混合部１８５２で利用されている音声存在確率は、本質的には劣化音声振幅スペクトルから求められているといえる。

一方、分離部１８５５は、図１の推定雑音計算部５から供給された推定雑音パワースペクトルを周波数別推定雑音パワースペクトルに分離し、平均値計算部１８５６へ出力する。平均値計算部１８５６は、周波数別推定雑音パワースペクトルλ_ｎ（ｋ）のｋ＝０からＫ−１に対する総和をＫで除算し、計算結果を推定雑音平均パワーとして除算部１８５７へ伝達する。除算部１８５７は、平滑化部１８５３から供給される強調音声平均パワーを、平均値計算部１８５６から供給される推定雑音平均パワーで除算し、除算結果を対数計算部１８５９へ伝達する。対数計算部１８５９は、除算部１８５７から供給された除算結果の対数を計算し、対数値を定数乗算部１８６０へ伝達する。

この定数乗算部１８６０は、対数計算部１８５９から供給された対数値を定数倍して、演算結果を係数計算部１８６１に伝達する。係数計算部１８６１は、定数乗算部１８６０の出力から係数を求め、除算部１８６２へ伝達する。除算部１８６２のもう一方の入力としては１０が供給されているので、除算部１８６２は、係数計算部１８６１から供給された係数を１０で除算し、除算結果を指数計算部１８６３へ伝達する。指数部計算部１８６３は、除算部１８６２の出力の指数を計算し、演算結果を無音部用係数として図６の係数計算部１８３３へ伝達する。

除算部１８５７の演算結果は、強調音声平均パワーと推定雑音パワーの比、すなわちＳＮＲに相当する。従って、係数計算部１８６１は、ＳＮＲをもとに無音部の抑圧度を計算していることになる。ＳＮＲを計算する目的は、音声存在確率計算部１７１で求めた音声存在確率の信頼度を、係数の計算に反映することである。ＳＮＲが高い場合、すなわち音声存在確率の信頼度が高い場合には、音声を誤って抑圧する可能性が小さいので、係数を小さくし、抑圧度を増加させる。一方、音声存在確率の信頼度が低い場合には、音声を誤って抑圧することを防ぐため、係数を大きくし、抑圧度を減少させる。ＳＮＲから係数を求めることが重要なので、計算を簡略化するために、対数計算部１８５９と指数計算部１８６３のどちらか一方、もしくは両方を省略することが可能である。

また、予め適切に設定した定数を推定雑音平均パワーに加算してから除算を行えば、除算結果の発散を防ぐことができる。除算ではなく、除算の近似演算を利用しても、発散を防止できる。

本実施例では、強調音声平均パワーと推定雑音パワーを計算する際に、全帯域のパワースペクトルの平均値を用いたが、適当な帯域幅を持ったサブバンド毎に計算したパワースペクトルの平均値を用いる方法も有効である。各帯域毎に平均値を計算するので、全帯域の平均値を用いた場合よりも、各帯域で正確なＳＮＲを計算することが可能になる。

図８に、図７の係数計算部１８６１で係数を計算する際に用いる非線形関数の例を示す。ｆ_ｃｍを入力値としたとき、図８に示される非線形関数の出力値ｇ_ｃｍは、式（２２）で与えられる。

但し、ａ_ｃｍ，ｂ_ｃｍ，ｃ_ｃｍ，ｄ_ｃｍは正の実数である。

ｆ_ｃｍが大きくなればｇ_ｃｍが小さくなることが、式（２２）の非線形関数に求められる条件である。式（２２）の他にも、この条件を満たすような線形関数や高次多項式、重みつき加算を含む任意の関数を用いることができる。

図９は本発明の第２の実施の形態を示すブロック図である。図９と第１の実施例である図１とは、強調音声振幅スペクトル補正部２８を除いて同一である。強調音声振幅スペクトル補正部２８の構成と動作の詳細な説明は、図１０を参照しながら行う。

図１０は強調音声振幅スペクトル補正部２８の構成を示すブロック図である。図２に示した強調音声振幅スペクトル補正部１８とは、後抑圧係数計算部１８２が後抑圧係数計算部２８２に置換されていることを除いて同一である。後抑圧係数計算部２８２の構成と動作の詳細な説明は、図１１を参照しながら行う。

図１１は後抑圧係数計算部２８２の構成を示すブロック図である。図５に示した後抑圧係数計算部１８２とは、周波数別後抑圧係数計算部１８２１_０〜１８２１_Ｋ−１が周波数別後抑圧係数計算部２８２１_０〜２８２１_Ｋ−１に置換されていることを除いて同一である。周波数別後抑圧係数計算部２８２１_０〜２８２１_Ｋ−１の構成と動作の詳細な説明は、図１２を参照しながら行う。

図１２は、図１１の周波数別後抑圧係数計算部２８２１_０〜２８２１_Ｋ−１の構成を示すブロック図である。図６に示した周波数別後抑圧係数計算部１８２１とは、有音部用係数記憶部１８３１が有音部用係数計算部２８３１に置換されていることを除いて同一である。無音部用係数だけでなく、有音部用係数も計算するので、図６の周波数別後抑圧係数計算部よりも有音部で高音質を達成できる。

有音部用係数計算部２８３１は、図９の多重乗算部１６及び推定雑音計算部５からそれぞれ供給される強調音声パワースペクトルと推定雑音パワースペクトルを用いて、有音部用係数を求め、係数計算部１８３３へ供給する。推定雑音パワーが強調音声パワーよりも大きい場合、又は両パワーの大きさが同等の場合には、有音部用係数計算部２８３１は、推定雑音と強調音声のパワー比に応じて、１．０以上の値を出力する。これは、補正抑圧係数が適切な値よりも小さくなっている可能性があるので、音声区間で過剰抑圧となることを防ぐために行う。一方、推定雑音が強調音声よりも小さい場合には、音声区間で過剰抑圧が発生する可能性は低い。そこで、推定雑音と強調音声のパワー比とは無関係に、１．０以上の適切な定数値を出力する。

図１３は本発明の第３の実施の形態を示すブロック図である。図１３と第１の実施例である図１とは、強調音声振幅スペクトル補正部１７を除いて同一である。後述するように、強調音声振幅スペクトル補正部１７と１８の違いは、後抑圧係数の計算を行う際に、強調音声振幅スペクトル補正部１７が推定雑音パワースペクトルと強調音声パワースペクトルを利用しないところである。強調音声振幅スペクトル補正部１７の構成と動作の詳細な説明は、図１４を参照しながら行う。

図１４は強調音声振幅スペクトル補正部１７の構成を示すブロック図である。図２に示した強調音声振幅スペクトル補正部１８とは、後抑圧係数計算部１８２が後抑圧係数計算部１７２に置換されていることを除いて同一である。以下、この相違点を中心に詳細な動作を説明する。

後抑圧係数計算部１７２は、音声存在確率計算部１７１から供給された音声存在確率と、図１３の抑圧係数補正部１５から供給された補正抑圧係数を用いて、後抑圧係数を計算し、多重乗算部１７３に伝達する。後抑圧係数計算部１７２の構成と動作の詳細な説明は、図１５を用いて行う。

図１５は後抑圧係数計算部１７２の構成を示すブロック図である。図５に示した後抑圧係数計算部１８２とは、周波数別後抑圧係数計算部１８２１_０〜１８２１_Ｋ−１が周波数別後抑圧係数計算部１７２１_０〜１７２１_Ｋ−１に置換されていることを除いて同一である。以下、この相違点を中心に詳細な動作を説明する。

周波数別後抑圧係数計算部１７２１_０〜１７２１_Ｋ−１は、分離部１７２２から供給される周波数別補正抑圧係数と、図１４の音声存在確率計算部１７１から供給される音声存在確率を用いて、周波数別後抑圧係数を計算し、多重化部１７２３に伝達する。周波数別後抑圧係数計算部１７２１_０〜１７２１_Ｋ−１の構成と動作の詳細な説明は、図１６を用いて行う。

図１６は、図１５の周波数別後抑圧係数計算部１７２１_０〜１７２１_Ｋ−１の構成を示すブロック図である。周波数別後抑圧係数計算部１７２１は、有音部用下限値記憶部１６９１、無音部用下限値記憶部１６９２、下限値計算部１６９３、最大値選択部１６９４を有する。下限値計算部１６９３は、有音部用下限値記憶部１６９１から供給される有音部用下限値と、無音部用下限値記憶部１６９２から供給される無音部用下限値をもとに、図１４の音声存在確率計算部１７１から供給される音声存在確率に応じた下限値を計算し、最大値選択部１６９４へ伝達する。音声歪みを防止するため、有音部用下限値には、無音部用下限値よりも大きな値が設定される。下限値の計算では、音声存在確率が大きければ、下限値計算部１６９３の出力値に対する有音部用下限値の寄与率を大きくする。寄与率の設定には、式（２０）や式（２１）に示される方法を同様に用いることが可能である。

最大値選択部１６９４は、図１５の分離部１７２２から供給される周波数別補正抑圧係数と、下限値計算部１６９３から供給される下限値とを比較し、大きい方の値を図１５の多重化部１７２３へ伝達する。値が同じ場合まで考慮すると、後抑圧係数は下限値計算部１６９３が供給する下限値以上の値になる。従って、抑圧係数は音声存在確率に応じて設定された下限値以上の値になる。音声存在確率が高ければ、下限値は大きくなるので、音声区間において過剰抑圧がもたらす音声歪みを防止できる。一方、音声存在確率が低ければ、下限値は小さくなるので、雑音区間において十分な抑圧度を得ることができる。

図１７は本発明の第４の実施の形態を示すブロック図である。図１７と第一の実施例である図１とは、強調音声振幅スペクトル補正部２９を除いて同一である。強調音声振幅スペクトル補正部２９の構成と動作の詳細な説明は、図１８を参照しながら行う。

図１８は強調音声振幅スペクトル補正部２９の構成を示すブロック図である。図２に示した強調音声振幅スペクトル補正部１８とは、後抑圧係数計算部１８２が後抑圧係数計算部２９２に置換されていることを除いて同一である。後抑圧係数計算部２９２の構成と動作の詳細な説明は、図１９を参照しながら行う。

図１９は後抑圧係数計算部２９２の構成を示すブロック図である。図５に示した後抑圧係数計算部１８２とは、周波数別後抑圧係数計算部１８２１_０〜１８２１_Ｋ−１が周波数別後抑圧係数計算部２９２１_０〜２９２１_Ｋ−１に置換されていることを除いて同一である。周波数別後抑圧係数計算部２９２１_０〜２９２１_Ｋ−１の構成と動作の詳細な説明は、図２０を参照しながら行う。

図２０は、図１９の周波数別後抑圧係数計算部２９２１_０〜２９２１_Ｋ−１の構成を示すブロック図である。図１６に示した周波数別後抑圧係数計算部１７２１とは、有音部用下限値記憶部１６９１が有音部用下限値計算部２６９１に置換されていること、無音部用下限値記憶部１６９２が無音部用下限値計算部２６９２を除いて同一である。強調音声パワースペクトルと推定雑音パワースペクトルを基に、有音部用及び無音部用下限値を計算するので、図１６の周波数別後抑圧係数計算部よりも、無音部で残留雑音を、有音部で音声歪みを低減できる。

有音部用下限値計算部２６９１と無音部用下限値計算部２６９２は、図１７の多重乗算部１６及び推定雑音計算部１からそれぞれ供給される強調音声パワースペクトルと推定雑音パワースペクトルを用いて、有音部用下限値と無音部用下限値をそれぞれ求め、下限値計算部１６９３へ供給する。有音部用下限値計算部２６９１と無音部用下限値計算部２６９２は、推定雑音と強調音声のパワー比に応じて、それぞれの下限値を計算し、下限値計算部１６９３へ伝達する。基本的には、推定雑音パワーが強調音声パワーよりも大きくなる、すなわちＳＮＲが低くなれば、音声歪みを防止する目的で有音部用下限値を大きくする。

無音部での残留雑音量を小さく、有音部での過剰抑圧を防止するために、無音部用下限値を有音部用下限値以下の値にする。但し、ＳＮＲが低い場合には、有音部用下限値と無音部用下限値の差が大きくならないように制御する。下限値の差が大きすぎると、有音部と無音部の残留雑音量の差が大きくなり、結果的に音声区間で音声ひずみが発生しているように知覚されてしまう。逆に、ＳＮＲが高ければ、有音部の残留雑音は、音声成分にマスクされて知覚されにくくなる。従って、ＳＮＲが低いときのように、有音部と無音部の残留雑音量の差は、音声区間での音声ひずみ要因に殆どならない。

そこで、ＳＮＲが高い場合には、無音部用下限値と有音部用下限値の差を大きくして、無音部での残留雑音を十分に低減する。以上より、無音部用下限値は、有音部用下限値に依存した値に設定される。従って、基本的には、有音部下限値の場合と同様に、ＳＮＲが低くなれば、無音部用下限値も大きくする。推定雑音パワースペクトルと強調音声パワースペクトルの大きさを比較する場合は、それぞれの平均値や、図１１の無音部用係数計算で用いられている除算部１８５７の出力信号を用いることが好ましい。

図２１は本発明の第５の実施の形態を示すブロック図である。図２１と関連技術例のブロック図である図３６とは、推定先天的ＳＮＲ計算部７及び抑圧係数補正部１５が、推定先天的ＳＮＲ計算部７１及び抑圧係数補正部１９にそれぞれ置換されていることを除いて同一である。以下、これらの相違点を中心に詳細な動作を説明する。

推定先天的ＳＮＲ計算部７１には、多重乗算部１３から劣化音声パワースペクトル、推定雑音計算部５から推定雑音パワースペクトル、周波数別ＳＮＲ計算部６から後天的ＳＮＲ、抑圧係数補正部１９から補正抑圧係数が供給される。推定先天的ＳＮＲ計算部７１は、劣化音声パワースペクトル、推定雑音パワースペクトル、後天的ＳＮＲ及び補正抑圧係数を用いて、推定先天的ＳＮＲと音声存在確率を求める。そして、音声存在確率を抑圧係数補正部１９に、推定先天的ＳＮＲを雑音抑圧係数生成部８と抑圧係数補正部１９に伝達する。抑圧係数補正部１９は、推定先天的ＳＮＲ計算部７１から供給される推定先天的ＳＮＲと音声存在確率を用いて、雑音抑圧係数生成部８から供給される抑圧係数を補正し、補正抑圧係数として多重乗算部１６と推定先天的ＳＮＲ計算部７１へ伝達する。

抑圧係数補正部１９及び推定先天的ＳＮＲ計算部７１の構成と動作の詳細な説明は、図２２及び図２３を参照しながら行う。

図２２は推定先天的ＳＮＲ計算部７１の構成を示すブロック図である。図２２と関連技術例のブロック図である図４５との相違点は、推定先天的ＳＮＲ計算部７１が遅延器７１１、７１２、多重乗算部７１３、音声存在確率計算部７１４を有していることである。以下、これらの相違点を中心に詳細な動作を説明する。

遅延器７１２は、図２１の推定雑音計算部５から供給される第ｎフレームの推定雑音パワースペクトルλ_ｎ（ｋ）を保存すると同時に、保存してあった第ｎ−１フレームの推定雑音パワースペクトルλ_ｎ−１（ｋ）を音声存在確率計算部７１４に供給する。遅延器７１１は、図２１の多重乗算部１３から供給される第ｎフレームの劣化音声パワースペクトル｜Ｙ_ｎ（ｋ）｜^２を保存すると同時に、保存してあった第ｎ−１フレームの劣化音声パワースペクトル｜Ｙ_ｎ−１（ｋ）｜^２を多重乗算部７１３に供給する。多重乗算部７１３は、多重乗算部７０４から供給されるＧ^２ _ｎ−１（ｋ）バーと遅延器７１１から供給される｜Ｙ_ｎ−１（ｋ）｜^２をｋ＝０，１，．．．，Ｋ−１に対して乗算して、Ｇ^２ _ｎ−１（ｋ）バー｜Ｙ_ｎ−１（ｋ）｜^２を求め、演算結果を推定強調音声パワースペクトルとして音声存在確率計算部７１４へ伝達する。多重乗算部７１３の出力信号は、第ｎ−１フレームの強調音声パワースペクトルに一致するが、これを第ｎフレームの強調音声パワースペクトルの推定信号として扱うために、推定強調音声パワースペクトルという名称を用いている。

多重乗算部７０４から供給される抑圧係数は、一フレーム前に得られたものなので、抑圧係数と劣化音声パワースペクトルのフレーム番号を合わせて強調音声パワースペクトルを計算するために、遅延器７１１が導入されている。更に、音声存在確率の計算に用いる強調音声パワースペクトルと推定雑音パワースペクトルのフレーム番号を合わせるために、遅延器７１２が導入されている。しかし、数フレームの相違が音声存在確率の計算に与える影響は小さいことから、遅延器７１１と７１２のどちらか一方、もしくは両方を省略することが可能である。

音声存在確率計算部７１４は、多重乗算部７１３から供給される推定強調音声パワースペクトルと、遅延器７１２から供給される推定雑音パワースペクトルを用いて音声存在確率を計算し、図２１の抑圧係数補正部１９へ伝達する。多重乗算部７１３の構成は、既に図３７を用いて説明した多重乗算部２１に等しいので、詳細な説明は省略する。また、音声存在確率計算部７１４の構成は、図３を用いて説明した音声存在確率計算部１７１に等しいので、詳細な説明は省略する。

図２３は、図２１の抑圧係数補正部１９の構成を示すブロック図である。図５０に示した抑圧係数補正部１５とは、周波数別抑圧係数補正部１５０１_０〜１５０１_Ｋ−１が周波数別抑圧係数補正部１９０１_０〜１９０１_Ｋ−１に置換されていることを除いて同一である。以下、これらの相違点を中心に詳細な動作を説明する。

周波数別抑圧係数補正部１９０１_０〜１９０１_Ｋ−１は、分離部１５０２から供給される周波数別推定先天的ＳＮＲと、図２１の推定先天的ＳＮＲ計算部７１から供給される音声存在確率を用いて、分離部１５０３から供給される周波数別抑圧係数を補正し、周波数別補正抑圧係数として多重化部１５０４へ伝達する。周波数別抑圧係数補正部１９０１_０〜１９０１_Ｋ−１の構成と動作の詳細な説明は、図２４を用いて行う。

図２４は、図２３の周波数別抑圧係数補正部１９０１_０〜１９０１_Ｋ−１の構成を示すブロック図である。図２４では、図５１の周波数別抑圧係数補正部１５０１における最大値選択部１５９１及び抑圧係数下限値記憶部１５９２の代わりに、有音部用下限値記憶部１９２１、無音部用下限値記憶部１９２２、下限値計算部１９２３、及び最大値選択部１９２４が具備されている。以下、これらの相違点を中心に詳細な動作を説明する。

下限値計算部１９２３は、有音部用下限値記憶部１９２１から供給される有音部用下限値と、無音部用下限値記憶部１９２２から供給される無音部用下限値をもとに、図２１の推定先天的ＳＮＲ計算部７１から供給される音声存在確率に応じた下限値を計算し、最大値選択部１９２４へ伝達する。最大値選択部１９２４は、スイッチ１５９５又は乗算器１５９７の出力値と、下限値計算部１９２３から供給される下限値とを比較し、大きい方の値を補正抑圧係数として図２３の多重化部１５０４へ伝達する。値が同じ場合まで考慮すると、補正抑圧係数は下限値計算部１９２３が供給する下限値より以上の値になる。従って、抑圧係数が音声存在確率に応じて設定された下限値以上の値になるので、音声区間において過剰抑圧がもたらす音声歪みを防止できる。下限値計算部１９２３の構成は、図６を用いて既に説明した下限値計算部１６９３に等しいので、詳細な説明は省略する。

図２５は本発明の第６の実施の形態を示すブロック図である。図２５と関連技術例のブロック図である図３６とは、推定先天的ＳＮＲ計算部７及び抑圧係数補正部１５が推定先天的ＳＮＲ計算部７２及び抑圧係数補正部２０にそれぞれ置換されていることを除いて同一である。以下、これらの相違点を中心に詳細な動作を説明する。

推定先天的ＳＮＲ計算部７２には、多重乗算部１３から劣化音声パワースペクトル、推定雑音計算部５から推定雑音パワースペクトル、周波数別ＳＮＲ計算部６から後天的ＳＮＲ、抑圧係数補正部２０から補正抑圧係数が供給される。推定先天的ＳＮＲ計算部７２は、劣化音声パワースペクトル、推定雑音パワースペクトル、後天的ＳＮＲ及び補正抑圧係数を用いて、推定先天的ＳＮＲ、音声存在確率及び推定強調音声パワースペクトルを求める。そして、抑圧係数補正部２０に推定先天的ＳＮＲ、音声存在確率及び推定強調音声パワースペクトルを、雑音抑圧係数生成部８に推定先天的ＳＮＲをそれぞれ伝達する。抑圧係数補正部２０は、推定先天的ＳＮＲ計算部７２から供給される推定先天的ＳＮＲ、音声存在確率及び推定強調音声パワースペクトルを用いて、雑音抑圧係数生成部８から供給される抑圧係数を補正し、補正抑圧係数として多重乗算部１６と推定先天的ＳＮＲ計算部７２へ伝達する。推定先天的ＳＮＲ計算部７２及び抑圧係数補整正部２０の構成と動作の詳細な説明は、図２６及び図２７を参照しながら行う。

図２６は推定先天的ＳＮＲ計算部７２の構成を示すブロック図である。図２２の推定先天的ＳＮＲ計算部７１とは、多重乗算部７１３が多重乗算部７１５に置換されていることを除いて同一である。多重乗算部７１３は音声存在確率計算部７１４だけに推定強調音声パワースペクトルを供給していたが、多重乗算部７１５は図２５の抑圧係数補正部２０にも供給する。多重乗算部７１５の構成は、図２２を用いて既に説明した多重乗算部７１３に等しいので、詳細な説明は省略する。

図２７は抑圧係数補正部２０の構成を示すブロック図である。図５０の抑圧係数補正部１５とは、周波数別抑圧係数補正部１５０１_０〜１５０１_Ｋ−１が周波数別抑圧係数補正部２００１_０〜２００１_Ｋ−１に置換されていることを除いて同一である。以下、これらの相違点を中心に詳細な動作を説明する。

周波数別抑圧係数補正部２００１_０〜２００１_Ｋ−１には、分離部１５０２から周波数別推定先天的ＳＮＲ、図２５の推定雑音計算部５から推定雑音パワースペクトル、図２５の推定先天的ＳＮＲ計算部７２から音声存在確率と推定強調音声パワースペクトルがそれぞれ供給されている。周波数別推定先天的ＳＮＲ、推定雑音パワースペクトル、推定強調音声パワースペクトル及び音声存在確率を用いて、分離部１５０３から供給される周波数別抑圧係数を補正し、周波数別補正抑圧係数として多重化部１５０４へ伝達する。周波数別抑圧係数補正部２００１_０〜２００１_Ｋ−１の構成と動作の詳細な説明は、図２８を用いて行う。

図２８は、図２７の周波数別抑圧係数補正部２００１_０〜２００１_Ｋ−１の構成を示すブロック図である。図２８では、図５１の周波数別抑圧係数補正部１５０１における最大値選択部１５９１及び抑圧係数下限値記憶部１５９２の代わりに、有音部用補正係数記憶部２０１１、無音部用補正係数記憶部２０１２、補正係数計算部２０１３、及び乗算器２０１４が具備されている。以下、これらの相違点を中心に詳細な動作を説明する。

無音部用補正係数計算部２０１２は、図２５の推定先天的ＳＮＲ計算部７２から供給される音声存在確率と推定強調音声パワースペクトル、及び図２５の推定雑音計算部５から供給される推定雑音パワースペクトルを用いて無音部用補正係数を計算し、補正係数計算部２０１３へ供給する。補正係数計算部２０１３は、有音部用補正係数記憶部２０１１から供給される有音部用補正係数と、無音部用補正係数計算部２０１２から供給される無音部用補正係数をもとに、図２５の推定先天的ＳＮＲ計算部７２から供給される音声存在確率に応じた補正係数を計算し、乗算器２０１４へ伝達する。乗算器２０１４は、補正係数計算部２０１３から供給される補正係数と、スイッチ１５９５又は乗算器１５９７の出力値との積を計算し、補正抑圧係数として図２７の多重化部１５０４へ伝達する。音声存在確率に応じて計算された補正係数により抑圧係数が補正されるので、雑音区間において残留雑音を更に抑圧できる。無音部用補正係数計算部２０１２の構成は、既に図７を用いて説明した無音部用補正係数計算部１８３２に等しいので、詳細な説明は省略する。また、補正係数計算部２０１３の構成は、図６を用いて既に説明した補正係数計算部１８３３に等しいので、詳細な説明は省略する。

図２９は本発明の第７の実施の形態を示すブロック図である。図２９と第３の実施例である図１３との相違点は、音声非存在確率記憶部２１の代わりに遅延器２３と加算器２４が具備されていること、及び強調音声振幅スペクトル補正部１７が強調音声振幅スペクトル補正部２２に置換されていることである。以下、これらの相違点を中心に詳細な動作を説明する。

強調音声振幅スペクトル補正部２２から出力された音声存在確率は、遅延器２３に保存される。遅延器２３は、一フレーム前の音声存在確率を加算器２４へ伝達する。雑音抑圧係数が生成された後に、音声存在確率が計算されるため、雑音抑圧係数の生成に必要となる音声存在確率の計算には、一フレーム前の音声存在確率を利用する。加算器２４は、１から音声存在確率を差し引いた値を計算し、計算結果を音声非存在確率として、雑音抑圧係数生成部へ伝達する。図１３の第３の実施例では常に同じ音声非存在確率を用いて雑音抑圧係数の生成を行っていたが、本実施例では強調音声振幅スペクトル補正部で計算した音声存在確率を基に音声非存在確率を計算している。このため、関連技術よりも各入力信号に適した音声非存在確率を、雑音抑圧係数の生成に用いることが可能である。強調音声振幅スペクトル補正部２２の構成と動作の詳細な説明は、図３０を参照しながら行う。

図３０は、図２９の強調音声振幅スペクトル補正部２２の構成を示すブロック図である。図１４の強調音声振幅スペクトル補正部１７とは、音声存在確率計算部１７１が音声存在確率計算部２２１に置換されていることを除いて同一である。図１４の音声存在確率計算部１７１は、音声存在確率を後抑圧係数１７２のみに伝達しているが、図３０の音声存在確率計算部２２１は、更に図２９の遅延器２３にも伝達している。

図３１は、本発明の第８の実施の形態を示すブロック図である。図３１と第７の実施例である図２９との相違点は、遅延器２３の代わりに音声存在確率計算部２６が具備されていること、及び強調音声振幅スペクトル補正部２２が強調音声振幅スペクトル補正部２５に置換されていることである。音声存在確率計算部２６は、推定先天的ＳＮＲ計算部７から出力された推定先天的ＳＮＲを用いて、音声存在確率を計算し、加算器２４と強調音声振幅スペクトル補正部２５へ伝達する。第７の実施例である図２９とは異なり、雑音抑圧係数を生成する前に音声存在確率を計算するため、雑音抑圧係数生成部８は、一フレーム前に計算した音声存在確率を基に導出された音声非存在確率を用いる必要が無い。このため、本実施例の雑音抑圧係数生成部８は、第７の実施例の場合よりも正確な音声非存在確率を用いることが可能である。強調音声振幅スペクトル補正部２５と音声存在確率計算部２６の構成と動作の詳細な説明は、図３２及び図３３を参照しながら行う。

図３２は、図３１の強調音声振幅スペクトル補正部２５の構成を示すブロック図である。図３０の強調音声振幅スペクトル補正部２２とは、音声存在確率計算部２２１と多重乗算部１７０が削除されていること、及び後抑圧係数計算部１７２が後抑圧係数２５２に置換されていることを除いて同一である。後抑圧係数計算部は、図３１の音声存在確率計算部２６から出力された音声存在確率を基に、図３１の抑圧係数補正部１５から出力された補正抑圧係数から後抑圧係数を計算し、多重乗算部１７３へ伝達する。音声非存在確率を強調音声振幅スペクトル補正部の外部で計算している点が、図３０の後抑圧係数計算部１７２と図３２の後抑圧係数計算部２５２との相違点である。

図３３は、図３１の音声存在確率計算部２６の構成を示すブロック図である。図３の音声存在確率計算部１７１とは、分離部１７０８、平均値計算部１７０９、対数計算部１７１０、乗算器１７１１、関数値計算部１７１２、１７１３が削除されていること、平均指標計算部が１７１４から２６１４に、瞬時指標計算部が１７１５から２６１５に置換されていること、及び分離部１７００への入力が強調音声パワースペクトルから推定先天的ＳＮＲに置換されていることを除いて同一である。図３の音声存在確率計算部１７１と図３３の音声存在確率計算部２６の共通点は、音声と雑音の比に応じて指標を計算している点である。音声存在確率計算部１７１は、強調音声パワーと推定雑音パワーの双方を、指標計算に適した値に補正するが、音声存在確率計算部２６は推定先天的ＳＮＲを補正する。このため、音声存在確率計算部２６の方が少ない演算量で実現できる。以下、これらの相違点を中心に詳細な動作を説明する。

分離部１７００は、図３１の推定先天的ＳＮＲ計算部７から供給される推定先天的ＳＮＲを周波数別推定先天的ＳＮＲに分離し、平均値計算部１７０１へ出力する。平均値計算部１７０１は、周波数別推定先天的ＳＮＲξ_ｎ（ｋ）ハットのｋ＝０からＫ−１に対する総和をＫで除算し、計算結果を対数計算部１７０２へ伝達する。対数計算部１７０２は、平均値計算部１７０１から入力された平均値の対数を計算し、乗算器１７０３へ伝達する。乗算器１７０３は、供給された対数値を定数倍して、フルバンド推定先天的ＳＮＲΞ（ｎ）を求め、平滑部１７０５、１７０７へ供給する。すなわち、第ｎフレームのフルバンド推定先天的ＳＮＲΞ（ｎ）は、次式で与えられる。

平滑化部１７０５は、平滑化係数記憶部１７０４から供給された平滑化係数を用いて、乗算器１７０３から供給されたフルバンド推定先天的ＳＮＲΞ（ｎ）を時間方向に平滑化し、第一の平滑先天的ＳＮＲとして瞬時指標計算部２６１５へ供給する。平滑化部１７０７も同様に、平滑化係数記憶部１７０６から供給された平滑化係数を用いて、乗算器１７０３から供給されたフルバンド推定先天的ＳＮＲΞ（ｎ）を時間方向に平滑化し、第二の平滑先天的ＳＮＲとして平均指標計算部２６１４へ供給する。図３の音声存在確率計算部１７１を説明したときに述べたとおり、平滑化係数記憶部１７０４に記憶されている係数の方が、平滑化係数記憶部１７０６の係数よりも小さくなるように設定される。

瞬時指標計算部２６１５は、平滑化部１７０５から供給された第一の平滑先天的ＳＮＲを用いて、瞬時指標を計算し、加算部１７１６へ供給する。平均指標計算部２６１４は、平滑化部１７０７から供給された第二の平滑先天的ＳＮＲを用いて、平均指標を計算し、加算部１７１６へ供給する。指標の計算には、平滑先天的ＳＮＲに応じて数値を大きくする方法が利用される。具体例としては、次のような計算方法が挙げられる。

但し、ＩＤＸ２_ｎは指標、Ξ（ｎ）バーは平滑先天的ＳＮＲである。また、θ_ｉｄｘ２、ａ_ｉｄｘ２とｂ_ｉｄｘ２は実数で、ａ_ｉｄｘ２はｂ_ｉｄｘ２以上の値を有する。

図３４は、本発明の第９の実施の形態を示すブロック図である。図３４と第８の実施例である図３１との相違点は、音声存在確率計算部２６が音声存在確率計算部２７に置換されていることである。音声存在確率計算部２７は、周波数別ＳＮＲ計算部６から出力された後天的ＳＮＲと推定先天的ＳＮＲ計算部７から出力された推定先天的ＳＮＲを用いて、音声存在確率を計算し、加算器２４と強調音声振幅スペクトル補正部２５へ伝達する。音声存在確率計算部２７の構成と動作の詳細な説明は、図３５を参照しながら行う。

図３５は、図３４の音声存在確率計算部２７の構成を示すブロック図である。図３１の音声存在確率計算部２６とは、分離部１７００が２７００に、平均値計算部１７０１が２７０１に置換されていること、更に、分離部２７０３と平均値計算部２７０４、及びＳＮＲ混合部２７０５が具備されていることを除いて同一である。図３１の音声存在確率計算部２６との主な相違点は、対数計算部１７０２へ入力されるＳＮＲの推定精度が改善されている点である。以下、これらの相違点を中心に詳細な動作を説明する。

分離部２７００は、図３４の推定先天的ＳＮＲ計算部７から供給される推定先天的ＳＮＲを周波数別推定先天的ＳＮＲに分離し、平均値計算部２７０１へ出力する。平均値計算部２７０１は、周波数別推定先天的ＳＮＲξ_ｎ（ｋ）ハットのｋ＝０からＫ−１に対する総和をＫで除算し、計算結果を平均先天的ＳＮＲξ_ｎバーとしてＳＮＲ混合部２７０５へ伝達する。すなわち、第ｎフレームの平均先天的ＳＮＲξ_ｎバーは、次式で与えられる。

一方、分離部２７０３は、図３４の周波数別ＳＮＲ計算部６から供給される後天的ＳＮＲを周波数別後天的ＳＮＲに分離し、平均値計算部２７０４へ出力する。平均値計算部２７０４は、周波数別後天的ＳＮＲγ_ｎ（ｋ）のｋ＝０からＫ−１に対する総和をＫで除算し、計算結果を平均後天的ＳＮＲγ_ｎバーとしてＳＮＲ混合部２７０５へ伝達する。すなわち、第ｎフレームの平均後天的ＳＮＲγ_ｎバーは、

で与えられる。

ＳＮＲ混合部は、平均値計算部２７０１から供給される平均先天的ＳＮＲξ_ｎバーと、平均値計算部２７０３から供給される平均後天的ＳＮＲγ_ｎバーを用いて、混合ＳＮＲΞ_ｍｉｘ（ｎ）を計算し、対数計算部１７０２へ伝達する。混合ＳＮＲΞ_ｍｉｘ（ｎ）の計算には、平均先天的ＳＮＲξ_ｎバーに応じて数値を大きくする方法が利用される。具体例としては、次のような計算方法が挙げられる。

但し、Ｆ_ｍｉｘは平均先天的ＳＮＲξ_ｎバーの関数である。

Ｆ_ｍｉｘは、０から１までの実数を出力し、ξ_ｎバーが大きければ、大きな値を出力する。すなわち、ＳＮＲが高い場合には、平均先天的ＳＮＲξ_ｎバーよりも推定精度が高い平均後天的ＳＮＲγ_ｎバーを優先的に用いて混合ＳＮＲΞ_ｍｉｘ（ｎ）を計算する。このため、先天的ＳＮＲと後天的ＳＮＲの両方を用いて求めた混合ＳＮＲΞ_ｍｉｘ（ｎ）の推定精度は、先天的ＳＮＲだけを用いて求めたフルバンド推定先天的ＳＮＲΞ（ｎ）よりも高くなる。推定精度が高いＳＮＲを用いて音声存在確率を計算することが可能になるため、図３４の音声存在確率計算部２７は、図３１の音声存在確率計算部２６よりも高い精度を達成できる。

これまで説明した全ての実施の形態では、雑音抑圧の方式として、最小平均２乗誤差短時間スペクトル振幅法を仮定してきたが、その他の方法にも適用することができる。このような方法の例として、非特許文献２に開示されているウィーナーフィルタ法や、非特許文献３に開示されているスペクトル減算法などがあるが、これらの詳細な構成例については説明を省略する。

１フレーム分割部
２窓がけ処理部
３フーリエ変換部
４，５０４９カウンタ
５推定雑音計算部
６，１４０２周波数別ＳＮＲ計算部
７，７１，７２推定先天的ＳＮＲ計算部
８雑音抑圧係数生成部
９逆フーリエ変換部
１０フレーム合成部
１１入力端子
１２出力端子
１４重みつき劣化音声計算部
１５抑圧係数補正部
１７２，１８２，２５２，２８２，２９２後抑圧係数計算部
１３，１６，１７０，１７３，７０４，７０５，７１３，７１５，１４０４多重乗算部
１７，１８，２２，２５，２８，２９強調音声振幅スペクトル補正部
２１音声非存在確率記憶部
１７１，２２１，２６，２７，７１４音声存在確率計算部
１７４２，１７４５，７０８，５０４６，１７１６，７０９２，７０９４，２４加算器
７１１，７１２，１７４６，２３遅延器
１５９３，５２０４，５２０６閾値記憶部
１５９４，５２０３，５２０５比較部
１７０２，１７１０，１８５９対数計算部
１７０４，１７０６，１８５４平滑化係数記憶部
１７０５，１７０７，１８５３平滑化部
１７１２，１７１３関数値計算部
１７１４，２６１４平均指標計算部
１７１５，２６１５瞬時指標計算部
２７０５ＳＮＲ混合部
１８５２音声パワー混合部
１８５８平滑信号記憶部
１８６３指数計算部
７０７１_０〜７０７１_Ｋ−１重みつき加算部
７０６重み記憶部
５０３，１３０４，１４２４，１４７５，１５０４，１７２３，７０１４，７０７５多重化部
５０４_０〜５０４_Ｋ−１周波数別推定雑音計算部
５２０更新判定部
５２０７閾値計算部
１５９５，５０４４スイッチ
１８５７，１８６２，１４２１_０〜１４２１_Ｋ−１，５０４８除算部
５０１，５０２，１３０２，１３０３，１４２２，１４２３，１４９５，１５０２，１５０３，１７００，１７０８，１７２２，１８５０，１８５５，７０１３，７０７２，７０７４，２７００，２７０３分離部
１７０１，１７０９，１８５１，１８５６，２７０１，２７０４平均値計算部
７０１多重値域限定処理部
７０２後天的ＳＮＲ記憶部
７０３抑圧係数記憶部
７０７多重重みつき加算部
１４０１，５０４２推定雑音記憶部
９２１瞬時推定ＳＮＲ
９２１_０〜９２１_Ｋ−１周波数別瞬時推定ＳＮＲ
９２２過去の推定ＳＮＲ
９２２_０〜９２２_Ｋ−１過去の周波数別推定ＳＮＲ
９２４推定先天的ＳＮＲ
９２４_０〜９２４_Ｋ−１周波数別推定先天的ＳＮＲ
１４０５多重非線形処理部
１４８５_０〜１４８５_Ｋ−１，５０４２非線形処理部
１５０１_０〜１５０１_Ｋ−１，１９０１_０〜１９０１_Ｋ−１，２００１_０〜２００１_Ｋ−１周波数別抑圧係数補正部
１７２１_０〜１７２１_Ｋ−１，１８２１_０〜１８２１_Ｋ−１，２８２１_０〜２８２１_Ｋ−１，２９２１_０〜２９２１_Ｋ−１周波数別後抑圧係数計算部
１５９１，１６９４，１９２４，７０１２_０〜７０１２_Ｋ−１最大値選択部
１５９２抑圧係数下限値記憶部
１５９６修正値記憶部
１６９１，１９２１有音部用下限値記憶部
１６９２，１９２２無音部用下限値記憶部
２６９１有音部下限値計算部
２６９２無音部用下限値計算部
１６９３，１９２３下限値計算部
１８３１有音部用係数記憶部
２８３１有音部用係数計算部
１８３２無音部用係数計算部
１８３３，１８６１係数計算部
２０１１有音部用補正係数記憶部
２０１２無音部用補正係数記憶部
２０１３補正係数計算部
１３０１_０〜１３０１_Ｋ−１，１５９７，１７０３，１７１１，１７４３，１７４４，１８３４，２０１４，７０９１，７０９３乗算器
１７４１，１８６０，７０９５定数乗算器
５０４５シフトレジスタ
５０４７最小値選択部
５２０１論理和計算部
５０４１レジスタ長記憶部
７０１１定数記憶部
８１１ＭＭＳＥＳＴＳＡゲイン関数値計算部
８１２一般化尤度比計算部
８１４抑圧係数計算部

Claims

入力信号を周波数領域信号に変換し、
前記周波数領域信号に基づいて抑圧係数を定め、
前記周波数領域信号に基づいて音声と雑音の相対関係を求め、
前記相対関係に基づいて寄与率を定め、
前記寄与率と、予め定められた、第一仮最小抑圧係数および第二仮最小抑圧係数に基づいて最小抑圧係数を求め、
前記抑圧係数と前記最小抑圧係数とを比較し、
値が大きい方を補正抑圧係数とし、
前記補正抑圧係数を前記周波数領域信号に重みづけすることによって雑音を抑圧する雑音抑圧の方法であって、
前記最小抑圧係数は、
前記寄与率を重みとする、
前記第一仮最小抑圧係数と前記第二仮最小抑圧係数の重み付き和で定まることを特徴とする雑音抑圧の方法。
前記第一仮最小抑圧係数および前記第二仮最小抑圧係数は、前記周波数領域信号に基づいて求められることを特徴とする請求項１記載の雑音抑圧の方法。
入力信号を周波数領域信号に変換する変換部と、
前記周波数領域信号に基づいて抑圧係数を定める抑圧係数計算部と、
前記周波数領域信号に基づいて音声と雑音の相対関係を求める相対関係計算部と、
前記相対関係に基づいて寄与率を定め、前記寄与率と、予め定められた、第一仮最小抑圧係数および第二仮最小抑圧係数に基づいて最小抑圧係数を求める最小抑圧係数計算部と、
前記抑圧係数と前記最小抑圧係数とを比較し、値が大きい方を補正抑圧係数とする補正抑圧係数計算部と、
前記補正抑圧係数を前記周波数領域信号に重みづけする重みづけ演算部と、
を含む雑音抑圧の装置であって、
前記最小抑圧係数は、
前記寄与率を重みとする、
前記第一仮最小抑圧係数と前記第二仮最小抑圧係数の重み付き和で定まることを特徴とする雑音抑圧の装置。
前記第一仮最小抑圧係数および前記第二仮最小抑圧係数は、前記周波数領域信号に基づいて求められることを特徴とする請求項３記載の雑音抑圧の装置。