JPH10240294A - 雑音軽減方法及び雑音軽減装置 - Google Patents
雑音軽減方法及び雑音軽減装置Info
- Publication number
- JPH10240294A JPH10240294A JP9045879A JP4587997A JPH10240294A JP H10240294 A JPH10240294 A JP H10240294A JP 9045879 A JP9045879 A JP 9045879A JP 4587997 A JP4587997 A JP 4587997A JP H10240294 A JPH10240294 A JP H10240294A
- Authority
- JP
- Japan
- Prior art keywords
- input signal
- amplitude spectrum
- noise reduction
- frame length
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 入力信号を所定フレーム長切り出して、その
フレーム内の入力信号を直交変換して求めた振幅スペク
トルから推定雑音振幅スペクトルを減算して雑音軽減処
理するスペクトラルサブトラクションの雑音軽減方法及
び装置において、周波数軸上の狭い範囲に音声の振幅が
集中して存在するように直交変換長を可変制御して、推
定誤差成分によって誤って引き去られる音声振幅スペク
トル成分を減少させる。 【解決手段】 スペクトルサブトラクション部におい
て、フレーム長を入力信号における音声信号の基本周期
の自然数倍長として、フレーム長の直交変換と逆直交変
換を行うようにした。
フレーム内の入力信号を直交変換して求めた振幅スペク
トルから推定雑音振幅スペクトルを減算して雑音軽減処
理するスペクトラルサブトラクションの雑音軽減方法及
び装置において、周波数軸上の狭い範囲に音声の振幅が
集中して存在するように直交変換長を可変制御して、推
定誤差成分によって誤って引き去られる音声振幅スペク
トル成分を減少させる。 【解決手段】 スペクトルサブトラクション部におい
て、フレーム長を入力信号における音声信号の基本周期
の自然数倍長として、フレーム長の直交変換と逆直交変
換を行うようにした。
Description
【0001】
【発明の属する技術分野】本発明は背景雑音のある環境
下で用いられる音声通信システムや音声認識システムで
適用されるスペクトラルサブトラクションを用いた雑音
軽減方法及び雑音軽減装置に適応し得るものである。
下で用いられる音声通信システムや音声認識システムで
適用されるスペクトラルサブトラクションを用いた雑音
軽減方法及び雑音軽減装置に適応し得るものである。
【0002】
【従来の技術】従来、背景雑音を軽減するための方法と
して、まず音声に背景雑音の重畳した入力信号を一定長
のフレームに分割して、この一定長のフレーム長で離散
フーリエ変換(以降DFTと呼ぶ)して周波数スペクト
ルに変換し、これを振幅スペクトルと位相スペクトルに
分割する。次にこの入力信号の振幅スペクトルから、無
音区間から推定した推定雑音振幅スペクトルを、サブト
ラクションフィルタを用いて減算することで、背景雑音
の軽減された音声振幅スペクトルを推定する。そして、
先の位相スペクトルと合わせて背景雑音の軽減された音
声の周波数スペクトルとし、この音声の周波数スペクト
ルを逆離散フーリエ変換(以降IDFTと呼ぶ)して背景
雑音の軽減された出力信号を得るスペクトラルサブトラ
クションと呼ばれるものが、■Supprssion of acustic
noise in speech using spectralsubtraction■(STEVEN
F.BALL IEEE Trans.Acoust.,Speesh and Signal Pro
c.,vol.ASSP-29,pp.113-120,Apr.1979.) に示されてい
る。
して、まず音声に背景雑音の重畳した入力信号を一定長
のフレームに分割して、この一定長のフレーム長で離散
フーリエ変換(以降DFTと呼ぶ)して周波数スペクト
ルに変換し、これを振幅スペクトルと位相スペクトルに
分割する。次にこの入力信号の振幅スペクトルから、無
音区間から推定した推定雑音振幅スペクトルを、サブト
ラクションフィルタを用いて減算することで、背景雑音
の軽減された音声振幅スペクトルを推定する。そして、
先の位相スペクトルと合わせて背景雑音の軽減された音
声の周波数スペクトルとし、この音声の周波数スペクト
ルを逆離散フーリエ変換(以降IDFTと呼ぶ)して背景
雑音の軽減された出力信号を得るスペクトラルサブトラ
クションと呼ばれるものが、■Supprssion of acustic
noise in speech using spectralsubtraction■(STEVEN
F.BALL IEEE Trans.Acoust.,Speesh and Signal Pro
c.,vol.ASSP-29,pp.113-120,Apr.1979.) に示されてい
る。
【0003】図10はそのスペクトラルサブトラクショ
ンの動作を示し、次式 X(ω) = S(ω)・F(ω) ……(1) は入力信号の振幅スペクトルS(ω)をサブトラクション
フィルタF(ω)でフィルタリングすることにより、出力
音声の振幅スペクトルX(ω)を得ることを表す。また次
式、
ンの動作を示し、次式 X(ω) = S(ω)・F(ω) ……(1) は入力信号の振幅スペクトルS(ω)をサブトラクション
フィルタF(ω)でフィルタリングすることにより、出力
音声の振幅スペクトルX(ω)を得ることを表す。また次
式、
【0004】
【数1】
【0005】はスペクトラルサブトラクションで用いら
れる代表的なサブトラクションフィルタである。式(2)
において、S1(ω)は入力信号の振幅スペクトル項、|
N(ω)|は推定雑音振幅スペクトル項、rは雑音引き去
り率を表す定数である。
れる代表的なサブトラクションフィルタである。式(2)
において、S1(ω)は入力信号の振幅スペクトル項、|
N(ω)|は推定雑音振幅スペクトル項、rは雑音引き去
り率を表す定数である。
【0006】スペクトラルサブトラクションでは、無音
区間から推定した推定雑音振幅スペクトルが推定しよう
としている音声振幅スペクトルに重畳している実際の雑
音振幅スペクトルを越えてしまう周波数においては、そ
の差分が推定誤差成分として音声振幅スペクトル成分を
引き去るため、出力信号における音声信号を劣化させる
問題がある。この推定誤差成分は周波数軸上全体に広が
って存在する性質を持っている。スペクトラルサブトラ
クションではこの周波数軸上全体に広がって存在する推
定誤差成分による音声の劣化を、いかに少なくするかが
出力信号の品質を左右する。
区間から推定した推定雑音振幅スペクトルが推定しよう
としている音声振幅スペクトルに重畳している実際の雑
音振幅スペクトルを越えてしまう周波数においては、そ
の差分が推定誤差成分として音声振幅スペクトル成分を
引き去るため、出力信号における音声信号を劣化させる
問題がある。この推定誤差成分は周波数軸上全体に広が
って存在する性質を持っている。スペクトラルサブトラ
クションではこの周波数軸上全体に広がって存在する推
定誤差成分による音声の劣化を、いかに少なくするかが
出力信号の品質を左右する。
【0007】また、スペクトラルサブトラクションでは
以下の理由からあまり極端に短い点数長のDFTをもち
いることができない。極端にフレーム長を短くし点数の
少ないDFTを用いると、入力信号の振幅スペクトルの
雑音振幅スペクトル成分がフレーム間で不安定かつ大き
く変化するため、推定雑音振幅スペクトルと雑音振幅ス
ペクトルの間の推定誤差成分が大きくなり、出力信号の
劣化が大きくなってしまう。このためDFT長はある程
度以上の長さが必要とされている。例えば北米CDMA
(Code Division Multiple Access )方式自動車電話シス
テム■EnhancedVariable Rate Codec Service Option 3
for Wideband Spread Spectrum Digital Systems■(TI
A/EIA,IS-127)の雑音軽減装置では、 128点のDFTが
用いられている。
以下の理由からあまり極端に短い点数長のDFTをもち
いることができない。極端にフレーム長を短くし点数の
少ないDFTを用いると、入力信号の振幅スペクトルの
雑音振幅スペクトル成分がフレーム間で不安定かつ大き
く変化するため、推定雑音振幅スペクトルと雑音振幅ス
ペクトルの間の推定誤差成分が大きくなり、出力信号の
劣化が大きくなってしまう。このためDFT長はある程
度以上の長さが必要とされている。例えば北米CDMA
(Code Division Multiple Access )方式自動車電話シス
テム■EnhancedVariable Rate Codec Service Option 3
for Wideband Spread Spectrum Digital Systems■(TI
A/EIA,IS-127)の雑音軽減装置では、 128点のDFTが
用いられている。
【0008】しかし、 128点程度のDFTを行ってもサ
ブトラクションフィルタの係数が短時間内に更新される
ため、出力信号に不連続性が発生し「シュワシュワ」と
いった異音を発するという技術的課題が残る。この問題
を防ぐために、サブトラクションフィルタを構成する1
つの項である入力信号の振幅スペクトル項(式(2)の
S1(ω))を、前フレームの入力信号の振幅スペクトル
と適度に平滑化する手法が有効であり、北米CDMA方
式自動車電話システムで実用化されている。
ブトラクションフィルタの係数が短時間内に更新される
ため、出力信号に不連続性が発生し「シュワシュワ」と
いった異音を発するという技術的課題が残る。この問題
を防ぐために、サブトラクションフィルタを構成する1
つの項である入力信号の振幅スペクトル項(式(2)の
S1(ω))を、前フレームの入力信号の振幅スペクトル
と適度に平滑化する手法が有効であり、北米CDMA方
式自動車電話システムで実用化されている。
【0009】ここで、次式 S1(ω) = a|S(ω)| + (1−a)|PS(ω)| ……(3) はこの平滑化の一例を説明するものである。式(3)に
おいて、|S(ω)|は現フレームの入力信号の振幅スペク
トル、|PS(ω)|は前フレームの入力信号の振幅スペク
トル、aは平滑率である。この平滑化を用いる場合の平
滑化の度合を強くしすぎる(aを小さくする)と、サブ
トラクションフィルタが変形しすぎて、出力信号におけ
る音声信号にエコーがかかった感じになり、音が惚けて
しまう問題が発生するため、平滑化の度合はDFTの点
数長によって適切に決定されている。
おいて、|S(ω)|は現フレームの入力信号の振幅スペク
トル、|PS(ω)|は前フレームの入力信号の振幅スペク
トル、aは平滑率である。この平滑化を用いる場合の平
滑化の度合を強くしすぎる(aを小さくする)と、サブ
トラクションフィルタが変形しすぎて、出力信号におけ
る音声信号にエコーがかかった感じになり、音が惚けて
しまう問題が発生するため、平滑化の度合はDFTの点
数長によって適切に決定されている。
【0010】
【発明が解決しようとする課題】スペクトラルサブトラ
クションにおいてDFTが用いられるが、DFTはその
点数長が変わると音声をDFTした場合の振幅スペクト
ル形状が大きく変化する性質をもつことが知られてい
る。一般に有声音声の振幅スペクトル形状は図8(「デ
ィジタル音声処理」(古井著、東海大学出版会))のよ
うに基本周波数間隔で規則正しく並ぶ凸形状(微細構
造)と周波数軸上全体で見た場合の振幅の大きな偏り
(ホルマント構造)を持っている。有声音声ような周期
波形をDFTする場合はその周期(音声では基本周期に
相当)の自然数倍でDFTすれば、高調波成分(有声音
声の微細構造)を正確に知ることができる。
クションにおいてDFTが用いられるが、DFTはその
点数長が変わると音声をDFTした場合の振幅スペクト
ル形状が大きく変化する性質をもつことが知られてい
る。一般に有声音声の振幅スペクトル形状は図8(「デ
ィジタル音声処理」(古井著、東海大学出版会))のよ
うに基本周波数間隔で規則正しく並ぶ凸形状(微細構
造)と周波数軸上全体で見た場合の振幅の大きな偏り
(ホルマント構造)を持っている。有声音声ような周期
波形をDFTする場合はその周期(音声では基本周期に
相当)の自然数倍でDFTすれば、高調波成分(有声音
声の微細構造)を正確に知ることができる。
【0011】このことは例えば「ディジタル信号処理入
門」(城戸健一著、丸善株式会社)で述べられているDF
Tについての基本的性質である。DFTの点数長による
振幅スペクトル形状の変化を説明するため基本周期20点
の音声を例にとって説明する。この音声を、基本周期の
5倍に等しい 100点と、基本周期の自然数倍に等しくな
い 110点でDFTして振幅スペクトルを計算した場合の
模式図が、それぞれ図3と図4である。このように基本
周期に自然数倍の点数でDFTした場合にはそうでない
点数でDFTした場合に比べ微細構造の個々凸形状も先
鋭化し、ホルマント構造も鮮明になる。いいかえれば基
本周期の自然数倍に等しい点数でDFTした場合にはそ
うでない点数でDFTした場合に比べで振幅スペクトル
が少ない周波数に集中する効果が得られることになる。
門」(城戸健一著、丸善株式会社)で述べられているDF
Tについての基本的性質である。DFTの点数長による
振幅スペクトル形状の変化を説明するため基本周期20点
の音声を例にとって説明する。この音声を、基本周期の
5倍に等しい 100点と、基本周期の自然数倍に等しくな
い 110点でDFTして振幅スペクトルを計算した場合の
模式図が、それぞれ図3と図4である。このように基本
周期に自然数倍の点数でDFTした場合にはそうでない
点数でDFTした場合に比べ微細構造の個々凸形状も先
鋭化し、ホルマント構造も鮮明になる。いいかえれば基
本周期の自然数倍に等しい点数でDFTした場合にはそ
うでない点数でDFTした場合に比べで振幅スペクトル
が少ない周波数に集中する効果が得られることになる。
【0012】従来のスペクトラルサブトラクションで
は、必ずしも音声のピッチ長の自然数倍ではない一定フ
レーム長で一定長DFTを用いているため、推定しよう
とする音声の振幅スペクトルは、微細構造やホルマント
構造が惚けて広い周波数に振幅が広がってしまう。この
ため本来周波数軸上全体に広がっている推定誤差成分に
よって誤って引き去られる音声振幅スペクトル成分も大
きくなってしまう欠点があった。
は、必ずしも音声のピッチ長の自然数倍ではない一定フ
レーム長で一定長DFTを用いているため、推定しよう
とする音声の振幅スペクトルは、微細構造やホルマント
構造が惚けて広い周波数に振幅が広がってしまう。この
ため本来周波数軸上全体に広がっている推定誤差成分に
よって誤って引き去られる音声振幅スペクトル成分も大
きくなってしまう欠点があった。
【0013】この発明は以上の課題を解消するためなさ
れたもので、周波数軸上の狭い範囲に音声の振幅が集中
して存在するようにDFT長を可変制御して、推定誤差
成分によって誤って引き去られる音声振幅スペクトル成
分を減少させる雑音軽減方法及び雑音軽減装置を提供す
るものである。
れたもので、周波数軸上の狭い範囲に音声の振幅が集中
して存在するようにDFT長を可変制御して、推定誤差
成分によって誤って引き去られる音声振幅スペクトル成
分を減少させる雑音軽減方法及び雑音軽減装置を提供す
るものである。
【0014】
【課題を解決するための手段】この発明に係る雑音軽減
方法では、入力信号を所定フレーム長切り出して、その
フレーム内の入力信号を直交変換して求めた振幅スペク
トルから推定雑音振幅スペクトルを減算して雑音軽減処
理するスペクトラルサブトラクションの雑音軽減方法に
おいて、フレーム長を入力信号における音声信号の基本
周期の自然数倍長として、フレーム長の直交変換と逆直
交変換を行うようにした。
方法では、入力信号を所定フレーム長切り出して、その
フレーム内の入力信号を直交変換して求めた振幅スペク
トルから推定雑音振幅スペクトルを減算して雑音軽減処
理するスペクトラルサブトラクションの雑音軽減方法に
おいて、フレーム長を入力信号における音声信号の基本
周期の自然数倍長として、フレーム長の直交変換と逆直
交変換を行うようにした。
【0015】さらに次の発明に係る雑音軽減方法では、
スペクトラルサブトラクションでの入力信号の振幅スペ
クトルから推定雑音振幅スペクトルを減算するサブトラ
クションフィルタの入力信号の振幅スペクトル項に、前
フレームの入力信号の振幅スペクトルを平滑化により寄
与させる場合の寄与度を、現在処理しようとするフレー
ム長で制御するようにした。
スペクトラルサブトラクションでの入力信号の振幅スペ
クトルから推定雑音振幅スペクトルを減算するサブトラ
クションフィルタの入力信号の振幅スペクトル項に、前
フレームの入力信号の振幅スペクトルを平滑化により寄
与させる場合の寄与度を、現在処理しようとするフレー
ム長で制御するようにした。
【0016】さらに次の発明に係る雑音軽減方法では、
フレーム長を入力信号における音声信号の基本周期の自
然数倍長して決定する際にフレーム長が予め定められた
一定範囲に入るようにするようにした。
フレーム長を入力信号における音声信号の基本周期の自
然数倍長して決定する際にフレーム長が予め定められた
一定範囲に入るようにするようにした。
【0017】また次の発明に係る雑音軽減装置では、入
力信号を所定フレーム長切り出して、そのフレーム内の
入力信号を直交変換して求めた振幅スペクトルから推定
雑音振幅スペクトルを減算して雑音軽減処理するスペク
トラルサブトラクションの雑音軽減方法を用いる雑音軽
減装置において、フレーム長を入力信号における音声信
号の基本周期の自然数倍長として、フレーム長の直交変
換と逆直交変換を行うスペクトルサブトラクション部を
備えるようにした。
力信号を所定フレーム長切り出して、そのフレーム内の
入力信号を直交変換して求めた振幅スペクトルから推定
雑音振幅スペクトルを減算して雑音軽減処理するスペク
トラルサブトラクションの雑音軽減方法を用いる雑音軽
減装置において、フレーム長を入力信号における音声信
号の基本周期の自然数倍長として、フレーム長の直交変
換と逆直交変換を行うスペクトルサブトラクション部を
備えるようにした。
【0018】さらに次の発明に係る雑音軽減装置では、
スペクトラルサブトラクション部は、入力信号の振幅ス
ペクトルから推定雑音振幅スペクトルを減算するサブト
ラクションフィルタの入力信号の振幅スペクトル項に、
前フレームの入力信号の振幅スペクトルを平滑化により
寄与させる場合の寄与度を、現在処理しようとするフレ
ーム長で制御するようにした。
スペクトラルサブトラクション部は、入力信号の振幅ス
ペクトルから推定雑音振幅スペクトルを減算するサブト
ラクションフィルタの入力信号の振幅スペクトル項に、
前フレームの入力信号の振幅スペクトルを平滑化により
寄与させる場合の寄与度を、現在処理しようとするフレ
ーム長で制御するようにした。
【0019】さらに次の発明に係る雑音軽減装置では、
フレーム長を入力信号における音声信号の基本周期の自
然数倍長して決定する際に前記フレーム長が予め定めら
れた一定範囲に入るようにするようにした。
フレーム長を入力信号における音声信号の基本周期の自
然数倍長して決定する際に前記フレーム長が予め定めら
れた一定範囲に入るようにするようにした。
【0020】
【発明の実施の形態】以下図面を参照して、この発明の
実施の形態を説明する。
実施の形態を説明する。
【0021】実施の形態1.図1は本発明による実施の
形態1の雑音軽減方法を示し、 図2〜図6に本発明に
よる雑音軽減方法の処理を説明するスペクトル分布を示
す。すなわちまずステップSP1において、音声に雑音
の重畳した入力信号を基本周期分析して基本周期を算出
し、この基本周期長を自然数倍しフレーム長Mとする。
次にステップSP2において、ステップSP1で算出さ
れたフレーム長のフレーム信号をM点のDFTを行い入
力信号の周波数スペクトルを算出する。
形態1の雑音軽減方法を示し、 図2〜図6に本発明に
よる雑音軽減方法の処理を説明するスペクトル分布を示
す。すなわちまずステップSP1において、音声に雑音
の重畳した入力信号を基本周期分析して基本周期を算出
し、この基本周期長を自然数倍しフレーム長Mとする。
次にステップSP2において、ステップSP1で算出さ
れたフレーム長のフレーム信号をM点のDFTを行い入
力信号の周波数スペクトルを算出する。
【0022】続いてステップSP3では、推定雑音振幅
スペクトルの点数Nが、ステップSP2で算出した周波
数スペクトルの点数Mと異なる場合は推定雑音振幅スペ
クトルの点数をM点に変換する。例えば、点数Nの推定
雑音振幅スペクトルを直線補間により連続振幅スペクト
ルに変換して、これをM点サンプリングして点数Mの推
定雑音振幅スペクトルに変換する。
スペクトルの点数Nが、ステップSP2で算出した周波
数スペクトルの点数Mと異なる場合は推定雑音振幅スペ
クトルの点数をM点に変換する。例えば、点数Nの推定
雑音振幅スペクトルを直線補間により連続振幅スペクト
ルに変換して、これをM点サンプリングして点数Mの推
定雑音振幅スペクトルに変換する。
【0023】次のステップSP4では、入力信号の周波
数スペクトルと推定雑音振幅スペクトルからスペクトラ
ルサブトラクションの処理で音声の周波数スペクトルを
算出する。ステップSP5では、音声の周波数スペクト
ルをフレーム長M点のIDFTして雑音の軽減された出
力信号を得る。
数スペクトルと推定雑音振幅スペクトルからスペクトラ
ルサブトラクションの処理で音声の周波数スペクトルを
算出する。ステップSP5では、音声の周波数スペクト
ルをフレーム長M点のIDFTして雑音の軽減された出
力信号を得る。
【0024】この実施の形態1による雑音軽減方法によ
れば、フレーム長を音声の基本周期の自然数倍とするこ
とで振幅スペクトル形状は微細構造が先鋭化し、かつホ
ルマント構造が鮮明になって、周波数軸上の狭い範囲に
音声の振幅が集中して存在するようになり、周波数軸上
全体に広がっている推定誤差成分が音声の振幅スペクト
ルを誤って引き去ることが起きる周波数も減少すること
になる。これにより、出力音声の劣化を軽減することが
できる。
れば、フレーム長を音声の基本周期の自然数倍とするこ
とで振幅スペクトル形状は微細構造が先鋭化し、かつホ
ルマント構造が鮮明になって、周波数軸上の狭い範囲に
音声の振幅が集中して存在するようになり、周波数軸上
全体に広がっている推定誤差成分が音声の振幅スペクト
ルを誤って引き去ることが起きる周波数も減少すること
になる。これにより、出力音声の劣化を軽減することが
できる。
【0025】この効果を簡単に説明するため、基本周期
20点の音声を例にとる。この音声を基本周期の5倍の 1
00点と、基本周期の自然数倍と異なる 110点のDFTを
行った場合の振幅スペクトルは、それぞれ図3と図4の
ようになる。図2は推定誤差成分である。この音声の振
幅スペクトルのうち推定誤差成分に誤って引き去られる
成分は、基本周期 100点でDFTすれば図5のようにな
り、基本周期と異なる110点でDFTすれば、図6のよ
うになり、図5の成分は図6の成分より小さくなること
が分かる。
20点の音声を例にとる。この音声を基本周期の5倍の 1
00点と、基本周期の自然数倍と異なる 110点のDFTを
行った場合の振幅スペクトルは、それぞれ図3と図4の
ようになる。図2は推定誤差成分である。この音声の振
幅スペクトルのうち推定誤差成分に誤って引き去られる
成分は、基本周期 100点でDFTすれば図5のようにな
り、基本周期と異なる110点でDFTすれば、図6のよ
うになり、図5の成分は図6の成分より小さくなること
が分かる。
【0026】なおこの実施の形態1においては、入力信
号を周波数領域に変換する手段としてDFTを用いた
が、これに代え、ウエーブレット変換やDCT(Discre
te Cosine Transform)など、他のいかなる直交変換を用
いてもよい。
号を周波数領域に変換する手段としてDFTを用いた
が、これに代え、ウエーブレット変換やDCT(Discre
te Cosine Transform)など、他のいかなる直交変換を用
いてもよい。
【0027】実施の形態2.この実施の形態2の全体の
処理の流れは、実施の形態1について上述した図1と同
様であるが上述したステップSP4において、式(3)
における平滑率aを現フレームのフレーム長Mによって
制御するようにする。式(4)は平滑率aの制御の例で
ある。 a = M/100 ……(4)
処理の流れは、実施の形態1について上述した図1と同
様であるが上述したステップSP4において、式(3)
における平滑率aを現フレームのフレーム長Mによって
制御するようにする。式(4)は平滑率aの制御の例で
ある。 a = M/100 ……(4)
【0028】またフレーム長が可変であるために|S
(ω)|と|PS(ω)|の離散周波数の点数が異なる場
合、|PS(ω)|の点数はステップSP3と同様の処理
により|S(ω)|と同じの点数に変換してから平滑化を
行う。
(ω)|と|PS(ω)|の離散周波数の点数が異なる場
合、|PS(ω)|の点数はステップSP3と同様の処理
により|S(ω)|と同じの点数に変換してから平滑化を
行う。
【0029】この実施の形態による雑音軽減方法によれ
ば、平滑率aがDFTの点数長に応じて適応制御されて
いるので、DFTの点数長が短いときに平滑率aが大き
すぎることが原因で、前フレームの入力信号の振幅スペ
クトルの重みが不足して出力音声が「シュワシュワ」と
いった異音を発するのを防ぐことができ、またDFTの
点数長が長いときに平滑率aが小さすぎることが原因
で、前フレームの入力信号の振幅スペクトルの重みが大
きすぎて、音が惚けたりすることを防ぐことができる。
ば、平滑率aがDFTの点数長に応じて適応制御されて
いるので、DFTの点数長が短いときに平滑率aが大き
すぎることが原因で、前フレームの入力信号の振幅スペ
クトルの重みが不足して出力音声が「シュワシュワ」と
いった異音を発するのを防ぐことができ、またDFTの
点数長が長いときに平滑率aが小さすぎることが原因
で、前フレームの入力信号の振幅スペクトルの重みが大
きすぎて、音が惚けたりすることを防ぐことができる。
【0030】なおこの実施の形態2においても、入力信
号を周波数領域に変換する手段としてDFTを用いた
が、これに代え、ウエーブレット変換やDCT(Discre
te Cosine Transform)など、他のいかなる直交変換を用
いてもよい。
号を周波数領域に変換する手段としてDFTを用いた
が、これに代え、ウエーブレット変換やDCT(Discre
te Cosine Transform)など、他のいかなる直交変換を用
いてもよい。
【0031】実施の形態3.この実施の形態3の全体の
処理の流れは、実施の形態2と同様であるがステップS
P1において、入力信号の基本周期を算出して、この基
本周期長をある一定のM値範囲内(例えば51以上、 100
以下)に入るように自然数倍してフレーム長Mとする。
処理の流れは、実施の形態2と同様であるがステップS
P1において、入力信号の基本周期を算出して、この基
本周期長をある一定のM値範囲内(例えば51以上、 100
以下)に入るように自然数倍してフレーム長Mとする。
【0032】この実施の形態3による雑音軽減方法によ
れば、可変のフレーム長は予め定められた一定範囲に入
るようにしてあるので、音声の基本周期の抽出の誤り等
でフレーム長が短くなりすぎて推定誤差成分が増大して
出力信号を劣化させたり、フレーム長が長くなりなりす
ぎてDFTの演算量が増大することを防げる。
れば、可変のフレーム長は予め定められた一定範囲に入
るようにしてあるので、音声の基本周期の抽出の誤り等
でフレーム長が短くなりすぎて推定誤差成分が増大して
出力信号を劣化させたり、フレーム長が長くなりなりす
ぎてDFTの演算量が増大することを防げる。
【0033】なおこの実施の形態3においても、入力信
号を周波数領域に変換する手段としてDFTを用いた
が、これに代え、ウエーブレット変換やDCT(Discre
te Cosine Transform)など、他のいかなる直交変換を用
いてもよい。
号を周波数領域に変換する手段としてDFTを用いた
が、これに代え、ウエーブレット変換やDCT(Discre
te Cosine Transform)など、他のいかなる直交変換を用
いてもよい。
【0034】なおこの発明による雑音軽減方法を適応し
たスペクトラルサブトラクションを用いた(51〜 100点
の可変DFTを用いた)場合の、一定長(80点)のDF
Tを用いた従来のスペクトラルサブトラクションに対す
る出力信号(雑音軽減後)の音声区間での、入力信号に
おける音声信号とのSN比とCD(ケプストラム歪み)
値の改善値を図7に示す。各SN比の入力信号(横軸)
に対して、SN比とCD(ケプストラム歪み)値(縦
軸)が改善されていることがわかる。
たスペクトラルサブトラクションを用いた(51〜 100点
の可変DFTを用いた)場合の、一定長(80点)のDF
Tを用いた従来のスペクトラルサブトラクションに対す
る出力信号(雑音軽減後)の音声区間での、入力信号に
おける音声信号とのSN比とCD(ケプストラム歪み)
値の改善値を図7に示す。各SN比の入力信号(横軸)
に対して、SN比とCD(ケプストラム歪み)値(縦
軸)が改善されていることがわかる。
【0035】実施の形態4.図9は本発明による雑音軽
減装置の実施の形態を示し、図中10はAD(アナログ
ディジタル)変換部、11は音声/雑音区間判定部、1
2は振幅スペクトル算出部、13はメモリ、14はスペ
クトラルサブトラクション部である。まず入力信号はA
D変換器10でディジタル信号に変換され、音声雑音区
間判定部11、振幅スペクトル算出部12、スペクトル
サブトラクション部14に入力される。音声/雑音判定
部11では、所定区間の入力信号が音声区間か雑音区間
かが判定され、雑音区間であれば推定雑音振幅スペクト
ルの更新を指示するフラグが振幅スペクトル算出部12
に送信される。
減装置の実施の形態を示し、図中10はAD(アナログ
ディジタル)変換部、11は音声/雑音区間判定部、1
2は振幅スペクトル算出部、13はメモリ、14はスペ
クトラルサブトラクション部である。まず入力信号はA
D変換器10でディジタル信号に変換され、音声雑音区
間判定部11、振幅スペクトル算出部12、スペクトル
サブトラクション部14に入力される。音声/雑音判定
部11では、所定区間の入力信号が音声区間か雑音区間
かが判定され、雑音区間であれば推定雑音振幅スペクト
ルの更新を指示するフラグが振幅スペクトル算出部12
に送信される。
【0036】このフラグが送られた場合、振幅スペクト
ル算出部12は、雑音区間である現在の所定区間の振幅
スペクトルを算出して、これを推定雑音振幅スペクトル
としてメモリ13に格納することにより更新する。スペ
クトルサブトラクション部14は入力信号と推定雑音振
幅スペクトルを入力として基本周期の自然数倍長のDF
Tを用いて、雑音の軽減された音声を出力する。スペク
トラルサブトラクション部14は図1について上述した
実施の形態1ないし3で説明した処理を行なう。
ル算出部12は、雑音区間である現在の所定区間の振幅
スペクトルを算出して、これを推定雑音振幅スペクトル
としてメモリ13に格納することにより更新する。スペ
クトルサブトラクション部14は入力信号と推定雑音振
幅スペクトルを入力として基本周期の自然数倍長のDF
Tを用いて、雑音の軽減された音声を出力する。スペク
トラルサブトラクション部14は図1について上述した
実施の形態1ないし3で説明した処理を行なう。
【0037】このような構成によれば、基本周期の自然
数倍長のDFTを用いているので、出力音声の劣化を軽
減することができ、確実に雑音の軽減された音声を出力
し得る音声軽減装置を実現できる。なおこの雑音軽減装
置のスペクトルサブトラクション部14でも、入力信号
を周波数領域に変換する手段としてDFTを用いたが、
これに代え、ウエーブレット変換やDCT(Discrete C
osine Transform)など、他のいかなる直交変換を用いて
もよい。
数倍長のDFTを用いているので、出力音声の劣化を軽
減することができ、確実に雑音の軽減された音声を出力
し得る音声軽減装置を実現できる。なおこの雑音軽減装
置のスペクトルサブトラクション部14でも、入力信号
を周波数領域に変換する手段としてDFTを用いたが、
これに代え、ウエーブレット変換やDCT(Discrete C
osine Transform)など、他のいかなる直交変換を用いて
もよい。
【0038】
【発明の効果】以上の通りこの発明によれば、フレーム
長を音声の基本周期の自然数倍とすることで音声が本来
持っている周波数軸上の振幅スペクトル値の偏りである
ホルマント構造を最も鮮明する効果が得られる。一方無
音区間から推定した推定雑音スペクトルと音声振幅スペ
クトルに重畳している実際の雑音振幅スペクトルの差で
ある推定誤差成分は周波数軸上全体に広がっているため
に周波数軸上の狭い範囲に音声の振幅が集中して存在し
ている方が、推定誤差成分が音声の振幅スペクトルを誤
って引き去ることが起きる周波数も減少することにな
る。これにより出力信号における音声信号の劣化を軽減
し得る雑音軽減方法及び雑音軽減装置を実現できる。
長を音声の基本周期の自然数倍とすることで音声が本来
持っている周波数軸上の振幅スペクトル値の偏りである
ホルマント構造を最も鮮明する効果が得られる。一方無
音区間から推定した推定雑音スペクトルと音声振幅スペ
クトルに重畳している実際の雑音振幅スペクトルの差で
ある推定誤差成分は周波数軸上全体に広がっているため
に周波数軸上の狭い範囲に音声の振幅が集中して存在し
ている方が、推定誤差成分が音声の振幅スペクトルを誤
って引き去ることが起きる周波数も減少することにな
る。これにより出力信号における音声信号の劣化を軽減
し得る雑音軽減方法及び雑音軽減装置を実現できる。
【0039】さらに次の発明によれば、平滑化の度合が
DFTの点数長に適応して制御されるために、出力信号
が「シュワシュワ」といった異音を発したり、音が惚け
たりすることを未然に防止し得る雑音軽減方法及び雑音
軽減装置を実現できる。
DFTの点数長に適応して制御されるために、出力信号
が「シュワシュワ」といった異音を発したり、音が惚け
たりすることを未然に防止し得る雑音軽減方法及び雑音
軽減装置を実現できる。
【0040】さらに次の発明によれば、可変のフレーム
長は予め定められた一定範囲に入るようにしてあるの
で、音声の基本周期の抽出の誤り等でフレーム長が短く
なりすぎて推定誤差成分が増大して出力信号における音
声信号を劣化させたり、フレーム長が極端に長くなりD
FTの演算量が増大することを防げる。またサブトラク
ションフィルタを構成する1つの項である入力信号の振
幅スペクトル項に、前フレームの入力信号の振幅スペク
トルを寄与させる場合には、サブトラクションフィルタ
の精度が前フレームの入力信号の振幅スペクトルの周波
数分解能の低下に引きずられて劣化するのを防止し得る
雑音軽減方法及び雑音軽減装置を実現できる。
長は予め定められた一定範囲に入るようにしてあるの
で、音声の基本周期の抽出の誤り等でフレーム長が短く
なりすぎて推定誤差成分が増大して出力信号における音
声信号を劣化させたり、フレーム長が極端に長くなりD
FTの演算量が増大することを防げる。またサブトラク
ションフィルタを構成する1つの項である入力信号の振
幅スペクトル項に、前フレームの入力信号の振幅スペク
トルを寄与させる場合には、サブトラクションフィルタ
の精度が前フレームの入力信号の振幅スペクトルの周波
数分解能の低下に引きずられて劣化するのを防止し得る
雑音軽減方法及び雑音軽減装置を実現できる。
【図1】 本発明による雑音軽減方法の実施の形態の説
明に供するフローチャートである。
明に供するフローチャートである。
【図2】 図1の雑音軽減方法の処理の説明に供するス
ペクトル分布図である。
ペクトル分布図である。
【図3】 図1の雑音軽減方法の処理の説明に供するス
ペクトル分布図である。
ペクトル分布図である。
【図4】 図1の雑音軽減方法の処理の説明に供するス
ペクトル分布図である。
ペクトル分布図である。
【図5】 図1の雑音軽減方法の処理の説明に供するス
ペクトル分布図である。
ペクトル分布図である。
【図6】 図1の雑音軽減方法の処理の説明に供するス
ペクトル分布図である。
ペクトル分布図である。
【図7】 本発明による雑音軽減方法によるスペクトラ
ルサブトラクションのSN比とCD値の改善値の説明に
供するグラフである。
ルサブトラクションのSN比とCD値の改善値の説明に
供するグラフである。
【図8】 音声の振幅スペクトル形状の特徴の説明に供
するスペクトル分布図である。
するスペクトル分布図である。
【図9】 本発明による雑音軽減装置の実施の形態の構
成を示すブロック図である。
成を示すブロック図である。
【図10】 スペクトラルサブトラクションの動作を説
明するためのブロック図である。
明するためのブロック図である。
1 DFT 2 サブトラクションフィルタ 3 IDFT 10 AD変換部 11 音声/雑音区間判定部 12 振幅スペクトル算出部 13 メモリ 14 スペクトラルサブトラクション部
Claims (6)
- 【請求項1】 入力信号を所定フレーム長切り出して、
当該フレーム内の前記入力信号を直交変換して求めた振
幅スペクトルから推定雑音振幅スペクトルを減算して雑
音軽減処理するスペクトラルサブトラクションの雑音軽
減方法において、前記フレーム長を前記入力信号におけ
る音声信号の基本周期の自然数倍長として、前記フレー
ム長の直交変換と逆直交変換を行うことを特徴とする雑
音軽減方法。 - 【請求項2】 上記スペクトラルサブトラクションでの
上記入力信号の上記振幅スペクトルから上記推定雑音振
幅スペクトルを減算するサブトラクションフィルタの入
力信号の振幅スペクトル項に、前フレームの前記入力信
号の前記振幅スペクトルを平滑化により寄与させる場合
の寄与度を、現在処理しようとする上記フレーム長で制
御することを特徴とする請求項1に記載の雑音軽減方
法。 - 【請求項3】 上記フレーム長を上記入力信号における
音声信号の基本周期の自然数倍長して決定する際に前記
フレーム長が予め定められた一定範囲に入るようにする
ことを特徴とする請求項1に記載の雑音軽減方法。 - 【請求項4】 入力信号を所定フレーム長切り出して、
当該フレーム内の前記入力信号を直交変換して求めた振
幅スペクトルから推定雑音振幅スペクトルを減算して雑
音軽減処理するスペクトラルサブトラクションの雑音軽
減方法を用いる雑音軽減装置において、前記フレーム長
を前記入力信号における音声信号の基本周期の自然数倍
長として、前記フレーム長の直交変換と逆直交変換を行
うスペクトルサブトラクション部を備えることを特徴と
する雑音軽減装置。 - 【請求項5】 上記スペクトラルサブトラクション部
は、上記入力信号の上記振幅スペクトルから上記推定雑
音振幅スペクトルを減算するサブトラクションフィルタ
の入力信号の振幅スペクトル項に、前フレームの前記入
力信号の前記振幅スペクトルを平滑化により寄与させる
場合の寄与度を、現在処理しようとする上記フレーム長
で制御することを特徴とする請求項4に記載の雑音軽減
装置。 - 【請求項6】 上記フレーム長を上記入力信号における
音声信号の基本周期の自然数倍長して決定する際に前記
フレーム長が予め定められた一定範囲に入るようにする
ことを特徴とする請求項4に記載の雑音軽減方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9045879A JPH10240294A (ja) | 1997-02-28 | 1997-02-28 | 雑音軽減方法及び雑音軽減装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9045879A JPH10240294A (ja) | 1997-02-28 | 1997-02-28 | 雑音軽減方法及び雑音軽減装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH10240294A true JPH10240294A (ja) | 1998-09-11 |
Family
ID=12731521
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9045879A Pending JPH10240294A (ja) | 1997-02-28 | 1997-02-28 | 雑音軽減方法及び雑音軽減装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH10240294A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100745977B1 (ko) | 2005-09-26 | 2007-08-06 | 삼성전자주식회사 | 음성 구간 검출 장치 및 방법 |
| JP2023165667A (ja) * | 2022-05-05 | 2023-11-16 | ザ トラスティーズ オブ コロンビア ユニバーシティ イン ザ シティー オブ ニューヨーク | リアルタイムのノイズ除去ネットワークのためのダイナミックスライディングウィンドウ |
-
1997
- 1997-02-28 JP JP9045879A patent/JPH10240294A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100745977B1 (ko) | 2005-09-26 | 2007-08-06 | 삼성전자주식회사 | 음성 구간 검출 장치 및 방법 |
| US7711558B2 (en) | 2005-09-26 | 2010-05-04 | Samsung Electronics Co., Ltd. | Apparatus and method for detecting voice activity period |
| JP2023165667A (ja) * | 2022-05-05 | 2023-11-16 | ザ トラスティーズ オブ コロンビア ユニバーシティ イン ザ シティー オブ ニューヨーク | リアルタイムのノイズ除去ネットワークのためのダイナミックスライディングウィンドウ |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101120679B1 (ko) | 이득-제한된 잡음 억제 | |
| CA2732723C (en) | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction | |
| US6263307B1 (en) | Adaptive weiner filtering using line spectral frequencies | |
| JP4945586B2 (ja) | 信号帯域拡張装置 | |
| US8737641B2 (en) | Noise suppressor | |
| CN103238183B (zh) | 噪音抑制装置 | |
| JP5483000B2 (ja) | 雑音抑圧装置、その方法及びプログラム | |
| CN104823236B (zh) | 语音处理系统 | |
| JP2002527785A (ja) | 情報信号にある休止期間の間にノイズ推定値を更新する方法とシステム | |
| JP2001134287A (ja) | 雑音抑圧装置 | |
| JP2002149200A (ja) | 音声処理装置及び音声処理方法 | |
| WO2008085703A2 (en) | A spectro-temporal varying approach for speech enhancement | |
| US7917359B2 (en) | Noise suppressor for removing irregular noise | |
| JP4753821B2 (ja) | 音信号補正方法、音信号補正装置及びコンピュータプログラム | |
| WO2006123721A1 (ja) | 雑音抑圧方法およびその装置 | |
| WO1999050825A1 (en) | Noise reduction device and a noise reduction method | |
| EP1278185A2 (en) | Method for improving noise reduction in speech transmission | |
| JPH10240294A (ja) | 雑音軽減方法及び雑音軽減装置 | |
| JP2002023790A (ja) | 音声特徴量抽出装置 | |
| JP2002140100A (ja) | 騒音抑圧装置 | |
| JP2002244695A (ja) | 音声スペクトル改善方法、音声スペクトル改善装置、音声スペクトル改善プログラム、プログラムを記憶した記憶媒体 | |
| JP4538705B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
| JPH113094A (ja) | ノイズ除去装置 | |
| CN115527550B (zh) | 一种单麦克风子带域降噪方法及系统 | |
| JP2013130815A (ja) | 雑音抑圧装置 |