JP5374845B2 - 雑音推定装置と方法およびプログラム - Google Patents

雑音推定装置と方法およびプログラム Download PDF

Info

Publication number
JP5374845B2
JP5374845B2 JP2007193517A JP2007193517A JP5374845B2 JP 5374845 B2 JP5374845 B2 JP 5374845B2 JP 2007193517 A JP2007193517 A JP 2007193517A JP 2007193517 A JP2007193517 A JP 2007193517A JP 5374845 B2 JP5374845 B2 JP 5374845B2
Authority
JP
Japan
Prior art keywords
noise
signal
input signal
estimating
attenuation signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007193517A
Other languages
English (en)
Other versions
JP2009031425A (ja
Inventor
剛範 辻川
真 寺尾
亮輔 磯谷
隆行 荒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007193517A priority Critical patent/JP5374845B2/ja
Publication of JP2009031425A publication Critical patent/JP2009031425A/ja
Application granted granted Critical
Publication of JP5374845B2 publication Critical patent/JP5374845B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、雑音推定技術に関し、特に、雑音混じりの音声信号に含まれる雑音を推定する雑音推定装置と方法およびプログラムに関する。
この種の雑音推定装置は、例えば雑音と音声が混在する信号から雑音を推定するために用いられている。例えば特許文献1には、雑音混じり音声から信号中に含まれる雑音を推定できる雑音推定装置が開示されている。図4は、特許文献1に開示されている雑音推定装置の構成を示すブロック図である。以下、構成を概説する。雑音推定装置14は、推定雑音記憶部1401、周波数別SNR計算部1402、多重乗算部1404、多重非線形処理部1405を有する。推定雑音記憶部1401に記憶された過去の時刻の推定雑音パワースペクトルと現在の時刻の劣化音声パワースペクトル(雑音混じり音声スペクトル)から周波数別SNRを周波数別SNR計算部1402で計算し、定義された非線形関数で周波数別SNRを処理することにより重み係数ベクトルを多重非線形処理部1405で計算し、現在の時刻の劣化音声パワースペクトル(雑音混じり音声スペクトル)に多重乗算部1404で乗算して重みつき劣化音声パワースペクトル(推定雑音パワースペクトルの基になるパワースペクトル)を求める構成である。
また、非特許文献1には、過去の時刻の推定雑音スペクトルと現在の時刻の劣化音声スペクトル(雑音混じり音声スペクトル)から重みを計算し、重みを過去の時刻の推定雑音スペクトルに乗算することにより逐次的に更新する構成が開示されている。
特許文献2には、事前に準備した雑音なし音声のパタンに過去の時刻の推定雑音を混入し、雑音混じり音声のパタンを作成し、雑音なし音声のパタン、雑音混じり音声のパタンと、現在の時刻の雑音混じり音声とを用いて雑音を推定する構成が開示されている。
非特許文献2においても、同様に、事前に準備した雑音なし音声のパタン、過去の時刻の推定雑音を混入した雑音混じり音声のパタンと、現在の時刻の雑音混じり音声とを用いて雑音を推定する構成が開示されている。
特開2002−204175号公報(図2) 特開2004−264816号公報(図3) European Telecommunications Standards Institute,"Speech Processing, Transmission and Quality Aspects (STQ); Distributed speech recognition; Extended advanced front-end feature extraction algorithm; Compression algorithms; Back-end speech reconstruction algorithm, " ETSI ES 202 212 v1.1.1,2003年11月(15頁 式5.10) 藤本 雅清, 中村 哲, "Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定, "情報処理学会研究報告, 2005-SLP-59, pp.7-12, 2005年12月(8頁 図1)
なお、上記非特許文献1、2と特許文献1、2の全開示内容はその引用をもって本書に繰込み記載する。以下の分析は、本発明によって与えられたものである。
上記した雑音推定装置は、雑音混じり音声から信号中に含まれる雑音を推定することを意図したものであるが、下記の問題点を有している。
第1の問題点は、音声のパタンを使用しない特許文献1と非特許文献1の手法では、雑音の推定精度が低い、ということである。その理由は、推定雑音スペクトルの更新に用いる重みを、過去の時刻の推定雑音スペクトルと、現在の時刻の劣化音声スペクトル(雑音混じり音声スペクトル)のみから計算しているためである。
現在の時刻の劣化音声スペクトル(雑音混じり音声スペクトル)は、音声スペクトルと雑音スペクトルから構成されており、過去の時刻から現在の時刻への雑音スペクトルの変動を捕らえるためには、現在の時刻の音声スペクトルの情報が必要である。
第2の問題点は、音声のパタンを使用する特許文献2と非特許文献2の手法では、各時刻で雑音スペクトルを推定することが困難である、ということである。その理由は、雑音スペクトルを推定する際に、雑音混じり音声のパタンを使用する、ためである。雑音混じり音声のパタンは、雑音なし音声のパタンに過去の時刻の推定雑音を混入して作成するが、作成には多くの計算コストを要する。
したがって、本発明の目的は、少ない計算コストで高精度に雑音を推定できる雑音推定方法、雑音推定装置および雑音推定プログラムを提供することにある。
前記目的を達成する本発明は、概略を述べれば、以下のようなものである。
本発明の一つのアスペクト(側面)に係る方法は、雑音推定装置が入力信号中の雑音を推定する方法である。この方法は、入力信号に含まれる第1の雑音を推定するステップと、前記入力信号と前記第1の雑音を用いて第1の雑音減衰信号を求めるステップと、予め準備されている音声のパタンと第1の雑音減衰信号を用いて第2の雑音減衰信号を求めるステップと、第2の雑音減衰信号を用いて入力信号に含まれる第2の雑音を推定するステップと、を含む。
本発明に係る方法は、その第1の展開形態において、予め準備されている雑音のパタンを用いて第2の雑音を補正することにより、入力信号に含まれる第3の雑音を推定してもよい。
本発明の一つのアスペクト(側面)に係る装置は、入力信号に含まれる第1の雑音を推定する第1の雑音推定部と、前記入力信号と前記第1の雑音とを用いて第1の雑音減衰信号を求める第1の雑音減衰部と、前記第1の雑音減衰信号と、記憶部に予め用意されている音声のパタンとを用いて第2の雑音減衰信号を求める第2の雑音減衰部と、前記第2の雑音減衰信号を用いて、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定部と、を含む。本発明に係る装置は、他の展開形態において、記憶部に予め用意されている雑音のパタンを用いて、前記第2の雑音を補正することにより、前記入力信号に含まれる第3の雑音を推定する第3の雑音推定部をさらに備えた構成としてもよい。
本発明の一つのアスペクト(側面)に係るコンピュータプログラムは、入力信号に含まれる第1の雑音を推定する第1の雑音推定処理と、前記入力信号と前記第1の雑音とを用いて第1の雑音減衰信号を求める第1の雑音減衰処理と、前記第1の雑音減衰信号と、記憶部に予め用意されている音声のパタンとを用いて第2の雑音減衰信号を求める第2の雑音減衰処理と、前記第2の雑音減衰信号を用いて、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定処理と、をコンピュータに実行させるプログラムよりなる。本発明に係るプログラムは、他の展開形態において、記憶部に予め用意されている雑音のパタンを用いて、推定された前記第2の雑音を補正することにより、入力信号に含まれる第3の雑音を推定する第3の雑音推定処理を前記コンピュータ実行させるプログラムよりなる。
本発明によれば、入力信号から第1の雑音を減ずるように修正することにより、第1の雑音減衰信号を求め、第1の雑音減衰信号を音声のパタンを用いて補正することにより、第2の雑音減衰信号を求め、第2の雑音減衰信号を用いて第2の雑音を推定することにより、上記した関連技術よりも少ない計算コストで高精度に雑音を推定することができる。
以下、添付図面を参照して本発明の実施形態について詳細に説明する。図1は、本発明の第1の実施の形態に係る雑音推定システムの装置構成を示すブロック図である。
図1を参照すると、本実施の形態の雑音推定システム(雑音推定装置)は、
入力信号を受けて、第1の雑音を推定する第1の雑音推定部1と、
入力信号と第1の雑音を受けて、入力信号に含まれる雑音を減衰させた信号を生成し、第1の雑音減衰信号として出力する第1の雑音減衰部21と、
第1の雑音減衰信号と、音声パタン記憶部3からの音声パタンとを受けて、入力信号に含まれる雑音を減衰させた信号を生成し、第2の雑音減衰信号として出力する第2の雑音減衰部22と、
第2の雑音減衰信号を受けて、第2の雑音を求める第2の雑音推定部4と、
を有する。なお、図1には、入力信号は、一本の矢印で示されているが、1つの時系列信号に制限されるものではなく、複数の時系列信号であってもよいことは勿論である。
図3は、本発明の第1の実施の形態に係る雑音推定システムにおける処理手順を示す流れ図である。図1および図3を参照して、本実施の形態の雑音推定システムの詳細について以下に説明する。
雑音混じりの入力信号X(t)を、
X(t) = S(t) +N(t)
とする。ただし、tは時間のインデックス、S(t)は音声、N(t)は雑音である。
第1の雑音推定部1では、入力信号X(t)から、第1の雑音N~1(t)を求める(ステップS1)。
例として、以下のように所定期間(0 <= t < initLen-1)の間は、入力信号がノイズのみから構成されると仮定して、入力信号X(t)を平均化(時間平均)して、第1の雑音とする。
N~1(t) = ave[X(t)] (0 <= t < initLen-1) … (1)
ただし、ave[]は平均演算子である。
あるいは、入力信号X(t)のヒストグラムを作成し、最小値を第1の雑音とする。
あるいは、入力信号X(t)と、他の時刻τの第xの雑音N~x(τ)の両方を用いて、特許文献1や非特許文献1と同様に、第1の雑音N~1(t)を求めたり、他の時刻τで求めた第xの雑音N~x(τ)を、時刻tにおける第1の雑音N~1(t)とすれば、音声区間中に雑音が変動した場合においても、高精度に第1の雑音を求めることができる。
なお、第1の雑音は、上記したいくつかの例と異なる方法を用いて推定してもよい。
第1の雑音推定部1で、第1の雑音N~1(t)を求めた後、第1の雑音減衰部21で、第1の雑音減衰信号S~1(t)を求める(ステップS2)。例を以下に示す。入力信号から第1の雑音を差し引くことで第1の雑音減衰信号S~1(t)を求める。
S~1(t) = X(t) - N~1(t) … (2)
つぎに、第2の雑音減衰部22において、予め音声パタン記憶部3に記憶されている、音声のパタンを用いて第1の雑音減衰信号S~1(t)を補正することにより、第2の雑音減衰信号S~2(t)を求める(ステップS3)。例を以下に示す。
<S~1(t)> = Σ_{k=1}^{K}μs(k)P(k|S~1(t)) … (3)
ただし、
Σ_{k=1}^{K}は、k=1〜Kまでの和を表す演算子、
μs(k)はk番目のパタン、
P(k|S~1(t))は、S~1(t)がk番目のパタンである確率(S~1(t)とk番目のパタンとの距離)を表す。
なお、音声パタンを(多次元)確率分布とした場合には、
μs(k)は、k番目の分布における平均値、
P(k|S~1(t))は、S~1(t)が与えられたときのk番目の分布に対する事後確率を表す。
次に、第1の雑音N~1(t)と補正された第1の雑音減衰信号<S~1(t)>とを用いて、第2の雑音減衰信号S~2(t)を求める。
S~2(t) = <S~1(t)> / ( <S~1(t)> + N~1(t) ) × X(t) …(4)
もちろん、補正された第1の雑音減衰信号<S~1(t)>を、そのまま第2の雑音減衰信号S~2(t)としてもよい(S~2(t) = <S~1(t)>)。
また、第2の雑音減衰信号S~2(t)を、第1の雑音減衰信号S~1(t)とし、音声パタンを用いた雑音減衰処理を、複数回繰り返してもよい。
なお、ここで示した音声パタンを用いた雑音減衰の手法は、一例であり、当然、他の手法を用いることも可能である。
第2の雑音減衰部22で第2の雑音減衰信号S~2(t)を求めた後、第2の雑音減衰信号S~2(t)を用いて、第2の雑音推定部4で、第2の雑音N~2(t)を求める(ステップS4)。例として、以下の式(5)〜式(9)にしたがって導出してもよい。
N~2(t) = X(t) - S~2(t) … (5)
N~2(t) = N~1(t) + ( S~1(t) - S~2(t) ) … (6)
N~2(t) = N~1(t) × ( S~1(t) / S~2(t) ) … (7)
N~2(t) = ( N~1(t) / ( N~1(t) + S~2(t) ) ) × X(t) … (8)
N~2(t) = N~1(t) × ( ( S~1(t) + N~1(t) ) / ( S~2(t) + N~1(t) )) … (9)
また、第1の雑音から第2の雑音への補正度合いの調整パラメタをα(t)とし、以下の式(10)や式(11)のように、第2の雑音を推定することもできる。
N~2(t) = N~1(t) + α(t)Δ(t) … (10)
N~2(t) = N~1(t) + α(t)ave[Δ(t)] … (11)
ただし、Δ(t)は、式(5)〜式(9)の場合、以下の式(12)〜(16)である。
Δ(t) = X(t) - S~2(t) - N~1(t) … (12)
Δ(t) = S~1(t) - S~2(t) … (13)
Δ(t) = N~1(t) × ( ( S~1(t) / S~2(t) ) - 1 ) … (14)
Δ(t) = N~1(t) × ( X(t) / ( N~1(t) + S~2(t) ) - 1 ) … (15)
Δ(t) = N~1(t) × ( ( S~1(t) + N~1(t) ) / ( S~2(t) + N~1(t) ) - 1) … (16)
なお、第2の雑音減衰信号S~2(t)を利用した他の方法を用いて、第2の雑音を求めてもよいことは勿論である。
本発明の第1の実施の形態の作用効果について説明する。
本実施の形態では、予め準備した音声パタンを、利用しているため、計算コストが少ない。
また、入力信号と第1の雑音から求めた第1の雑音減衰信号を音声パタンで補正し、第2の雑音減衰信号を求め、その第2の雑音減衰信号を用いて、第2の雑音を求めるため、高精度に雑音を推定できる。
以上、前記第1の実施の形態では、第1の雑音推定部1、第1の雑音減衰部21、第2の雑音減衰部22、第2の雑音推定部4について説明したが、例えば、第2の雑音推定部4において第2の雑音を求める際に、
式(3)中の
P(k|S~1(t))という音声パタンからの距離、
P(k|S~2(t))という音声パタンからの距離、
に応じて式(10)、式(11)における、補正度合いα(t)を制御してもよい。
また、第2の雑音推定部4で推定した推定雑音N~2(t)を、第1の雑音N~1(t)とし、
第1の雑音減衰部21と第2の雑音減衰部22と第2の雑音推定部4の処理を繰り返してもよい。
また、繰り返す際に、式(3)中の
P(k|S~1(t))という音声パタンからの距離、
P(k|S~2(t))という音声パタンからの距離、
に応じて繰り返しを制御してもよい。
また、予め記憶部に記憶されている音声パタンを、入力信号X、第1の雑音減衰信号S~1、第2の雑音減衰信号S~2を用いて更新することも可能である。なお、図1の第1の雑音推定部1、第1の雑音減衰部21、第2の雑音減衰部22、第2の雑音推定部4は、雑音推定システムを構成するコンピュータ(あるいはデジタルシグナルプロセッサ等のプロセッサ)上で実行されるプログラムによりそれぞれの機能・処理を実現してもよい。
図2は、本発明の第2の実施の形態に係る雑音推定システムの構成を示すブロック図である。
図2における雑音推定システムと、図1に示した雑音推定システム(第1の実施の形態)とを比較すると、雑音パタン記憶部5と第3の雑音推定部6が追加されている。その他の構成、動作は、前記第1の実施の形態と同じである。以下では、前記第1の実施の形態との相違点である、雑音パタン記憶部5と第3の雑音推定部6の説明を行う。
第3の雑音推定部6では、雑音パタン記憶部5からの雑音パタンを用いて、第2の雑音N~2(t)を補正する。例として、以下の式(17)と(18)により、推定雑音N~(t)を求めることができる。
<N~2(t)> = Σ_{m=1}^{M}μn(m)P(m|N~2(t)) … (17)
N~3(t) = <N~2(t)> / ( S~2(t) + <N~2(t)> ) × X(t) … (18)
ただし、式(10)において
μn(m)は、m番目のパタン、
P(m|N~2(t))は、N~2(t)がパタンmである確率(N~2(t)とm番目のパタンとの距離)を表す。
なお、雑音パタンを(多次元)確率分布とした場合には、
μn(m)は、m番目の分布における平均値、
P(m|N~2(t))はN~2(t)が与えられたときのm番目の分布に対する事後確率を表す。
もちろん、補正された第2の雑音<N~2(t)>をそのまま第3の雑音N~3(t)としてもよい。
なお、ここで示した雑音パタンを用いた雑音推定方法はあくまでも一例であり、当然、他の手法を用いることも可能である。
本発明の第2の実施の形態の作用効果について説明する。
本実施の形態では、前記第1の実施の形態に加えて、第3の雑音推定部6を備え、雑音パタン記憶部5に記憶されている雑音パタンを利用しているため、より高精度に雑音を推定できる。
以上、前記第2の実施の形態では、第3の雑音推定部6について説明したが、例えば、 式(3)中の
P(k|S~1(t))という音声パタンからの距離、
P(k|S~2(t))という音声パタンからの距離、
式(17)の
P(m|N~2(t))という雑音パタンからの距離、
P(m|N~1(t))という雑音パタンからの距離、
P(m|N~3(t))という雑音パタンからの距離、
に応じて、補正度合いα(t)を制御してもよい。
また、第3の雑音推定部6で推定した第3の雑音N~3(t)を、あらたに、第1の雑音N~1(t)とし、第1の雑音減衰部21と、第2の雑音減衰部22と、第2の雑音推定部4と、第3の雑音推定部6の処理を繰り返してもよい。
処理を繰り返す際に、
式(3)中の
P(k|S~1(t))という音声パタンからの距離、
P(k|S~2(t))という音声パタンからの距離、
式(17)の
P(m|N~2(t))というパタンからの距離、
P(m|N~1(t))というパタンからの距離、
P(m|N~3(t))というパタンからの距離、
に応じて、繰り返しを制御してもよい。
また、予め記憶部に記憶されている音声パタンを、入力信号X、第1の雑音減衰信号S~1、第2の雑音減衰信号S~2を用いて更新し、雑音パタンを、入力信号X、第1の雑音N~1、第2の雑音N~2、第3の雑音N~3を用いて更新する、ようにしてもよい。
なお、図2の第1の雑音推定部1、第1の雑音減衰部21、第2の雑音減衰部22、第2の雑音推定部4、第3の雑音推定部6は、雑音推定システムを構成するコンピュータ(あるいはデジタルシグナルプロセッサ等のプロセッサ)上で実行されるプログラムによりそれぞれの機能・処理を実現してもよい。
以上、前記第1の実施の形態と前記第2の実施の形態は、本発明を雑音推定システムに適用した例を説明したが、本発明を、第2の雑音減衰信号S~2を出力する雑音減衰システムとして用いてもよいことは勿論である。
以上、本発明を上記各実施例に即して説明したが、本発明は、上記実施例の構成にのみ限定されるものでなく、本発明の原理に準ずる範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
本発明によれば、雑音混じりの信号から、雑音を推定するといった用途に適用できる。また、雑音混じりの信号から、雑音を減衰させるといった用途にも適用可能である。
本発明の第1の実施の形態に係る雑音推定システムの構成を示すブロック図である。 本発明の第2の実施の形態に係る雑音推定システムの構成を示すブロック図である。 本発明の第1の実施の形態に係る雑音推定システムにおける処理手順を示す流れ図である。 関連技術の雑音推定装置の構成を示すブロック図である。
符号の説明
1 第1の雑音推定部
21 第1の雑音減衰部
22 第2の雑音減衰部
3 音声パタン記憶部
4 第2の雑音推定部
5 雑音パタン記憶部
6 第3の雑音推定部

Claims (30)

  1. 入力信号に含まれる第1の雑音を推定するステップと、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求めるステップと、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求めるステップと、
    前記入力信号から前記第2の雑音減衰信号を減算することにより、前記入力信号に含まれる第2の雑音を推定するステップと、
    を含む、ことを特徴とする雑音推定方法。
  2. 入力信号に含まれる第1の雑音を推定するステップと、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求めるステップと、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求めるステップと、
    前記第1の雑音減衰信号と前記第2の雑音減衰信号との差分を、前記第1の雑音に加算することにより、前記入力信号に含まれる第2の雑音を推定するステップと、
    を含む、ことを特徴とする雑音推定方法。
  3. 入力信号に含まれる第1の雑音を推定するステップと、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求めるステップと、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求めるステップと、
    前記第1の雑音減衰信号と前記第2の雑音減衰信号との比を、前記第1の雑音に乗算することにより、前記入力信号に含まれる第2の雑音を推定するステップと、
    を含む、ことを特徴とする雑音推定方法。
  4. 入力信号に含まれる第1の雑音を推定するステップと、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求めるステップと、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求めるステップと、
    前記第1の雑音と、前記第1の雑音と前記第2の雑音減衰信号の和との比を、前記入力信号に乗算することにより、前記入力信号に含まれる第2の雑音を推定するステップと、
    を含むことを特徴とする雑音推定方法。
  5. 入力信号に含まれる第1の雑音を推定するステップと、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求めるステップと、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求めるステップと、
    前記第1の雑音と前記第1の雑音減衰信号の和と、前記第1の雑音と前記第2の雑音減衰信号の和との比を、前記第1の雑音に乗算することにより、前記入力信号に含まれる第2の雑音を推定するステップと、
    を含む、ことを特徴とする雑音推定方法。
  6. 前記第2の雑音を推定するステップが、前記第1の雑音から前記第2の雑音への補正度合いを制御するステップを含む、ことを特徴とする請求項1乃至のいずれか一に記載の雑音推定方法。
  7. 前記第2の雑音を推定するステップにおいて、前記第1の雑音から前記第2の雑音への補正度合いを制御するステップでは、
    予め用意されている音声のパタンと前記第1の雑音減衰信号との距離、
    予め用意されている音声のパタンと第2の雑音減衰信号との距離、
    のうち1つ以上の距離に応じて、
    前記第1の雑音から前記第2の雑音への補正度合いを制御する、ことを特徴とする請求項記載の雑音推定方法。
  8. 前記第2の雑音を推定するステップで推定された第2の雑音を第1の雑音として、
    前記第1の雑音減衰信号を求めるステップ、
    前記第2の雑音減衰信号を求めるステップ、
    前記第2の雑音を推定するステップ、
    の一連のステップを1回以上繰り返す、ことを特徴とする請求項1乃至のいずれか一に記載の雑音推定方法。
  9. 前記第1の雑音減衰信号を求めるステップ、
    前記第2の雑音減衰信号を求めるステップ、
    前記第2の雑音を推定するステップ
    の一連のステップを1回以上繰り返す際に、
    予め用意されている音声のパタンと第1の雑音減衰信号との距離、
    予め用意されている音声のパタンと第2の雑音減衰信号との距離、
    のうち1つ以上の距離に応じて、繰り返しを制御する、ことを特徴とする請求項記載の雑音推定方法。
  10. 前記第1の雑音を推定するステップが、ある時刻の前記第1の雑音を、前記入力信号と、前記時刻と異なる別の時刻で推定した前記第2の雑音とのうち少なくとも1つを用いて推定する、ことを特徴とする請求項1乃至のいずれか一に記載の雑音推定方法。
  11. 予め用意されている雑音のパタンを用いて、前記第2の雑音を補正することにより、前記入力信号に含まれる第3の雑音を推定するステップをさらに含む、ことを特徴とする請求項1乃至のいずれか一に記載の雑音推定方法。
  12. 請求項1乃至10のいずれか一に記載の雑音推定方法の各ステップを含み、さらに、該雑音推定方法によって推定された前記第2の雑音を少なくとも用いて、雑音減衰信号を得る、ことを特徴とする雑音減衰方法。
  13. 入力信号に含まれる第1の雑音を推定する第1の雑音推定部と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰部と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰部と、
    前記入力信号から前記第2の雑音減衰信号を減算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定部と、
    を含む、ことを特徴とする雑音推定装置。
  14. 入力信号に含まれる第1の雑音を推定する第1の雑音推定部と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰部と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰部と、
    前記第1の雑音減衰信号と前記第2の雑音減衰信号との差分を、前記第1の雑音に加算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定部と、
    を含む、ことを特徴とする雑音推定装置。
  15. 入力信号に含まれる第1の雑音を推定する第1の雑音推定部と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰部と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰部と、
    前記第1の雑音減衰信号と前記第2の雑音減衰信号との比を、前記第1の雑音に乗算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定部と、
    を含む、ことを特徴とする雑音推定装置。
  16. 入力信号に含まれる第1の雑音を推定する第1の雑音推定部と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰部と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰部と、
    前記第1の雑音と、前記第1の雑音と前記第2の雑音減衰信号の和との比を、前記入力信号に乗算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定部と、
    を含む、ことを特徴とする雑音推定装置。
  17. 入力信号に含まれる第1の雑音を推定する第1の雑音推定部と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰部と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰部と、
    前記第1の雑音と前記第1の雑音減衰信号の和と、前記第1の雑音と前記第2の雑音減衰信号の和との比を、前記第1の雑音に乗算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定部と、
    を含む、ことを特徴とする雑音推定装置。
  18. 前記第2の雑音推定部が、前記第1の雑音から前記第2の雑音への補正度合いを制御する手段を含むことを特徴とする請求項13乃至17のいずれか一に記載の雑音推定装置。
  19. 前記第1の雑音から前記第2の雑音への補正度合いを制御する手段が、
    前記予め用意されている音声のパタンと前記第1の雑音減衰信号との距離、
    前記予め用意されている音声のパタンと前記第2の雑音減衰信号との距離、
    のうち1つ以上の距離に応じて、前記第1の雑音から前記第2の雑音への補正度合いを制御する、ことを特徴とする請求項18記載の雑音推定装置。
  20. 前記第2の雑音推定部で雑音推定した第2の雑音を第1の雑音として、
    前記第1の雑音減衰部で第1の雑音減衰信号を求め、
    前記第2の雑音減衰部で第2の雑音減衰信号を求め、
    前記第2の雑音推定部で第2の雑音を推定する、
    上記一連の処理を1回以上繰り返す、ことを特徴とする請求項13乃至19のいずれか一に記載の雑音推定装置。
  21. 前記第1の雑音減衰部で第1の雑音減衰信号を求め、
    前記第2の雑音減衰部で第2の雑音減衰信号を求め、
    前記第2の雑音推定部で第2の雑音を推定する、
    上記一連の処理を1回以上繰り返す際、
    前記予め用意されている音声のパタンと前記第1の雑音減衰信号との距離、
    前記予め用意されている音声のパタンと前記第2の雑音減衰信号との距離、
    のうち1つ以上の距離に応じて繰り返しを制御する、ことを特徴とする請求項20記載の雑音推定装置。
  22. 前記第1の雑音推定部が、ある時刻の第1の雑音を、前記入力信号と前記時刻と異なる時刻で推定した第2の雑音とのうち少なくとも1つを用いて推定する、ことを特徴とする請求項13乃至21のいずれか一に記載の雑音推定装置。
  23. 記憶部に予め用意されている雑音のパタンを用いて、前記第2の雑音を補正することにより、前記入力信号に含まれる第3の雑音を推定する第3の雑音推定部をさらに備えている、ことを特徴とする請求項13記載の雑音推定装置。
  24. 請求項13乃至22のいずれか一に記載の雑音推定装置を備え、該雑音推定装置により推定された前記第2の雑音を少なくとも用いて、雑音減衰信号を得る、ことを特徴とする雑音減衰装置。
  25. 入力信号に含まれる第1の雑音を推定する第1の雑音推定処理と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰処理と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰処理と、
    前記入力信号から前記第2の雑音減衰信号を減算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定処理と、
    をコンピュータに実行させるプログラム。
  26. 入力信号に含まれる第1の雑音を推定する第1の雑音推定処理と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰処理と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰処理と、
    前記第1の雑音減衰信号と前記第2の雑音減衰信号との差分を、前記第1の雑音に加算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定処理と、
    をコンピュータに実行させるプログラム。
  27. 入力信号に含まれる第1の雑音を推定する第1の雑音推定処理と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰処理と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰処理と、
    前記第1の雑音減衰信号と前記第2の雑音減衰信号との比を、前記第1の雑音に乗算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定処理と、
    をコンピュータに実行させるプログラム。
  28. 入力信号に含まれる第1の雑音を推定する第1の雑音推定処理と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰処理と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰処理と、
    前記第1の雑音と、前記第1の雑音と前記第2の雑音減衰信号の和との比を、前記入力信号に乗算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定処理と、
    をコンピュータに実行させるプログラム。
  29. 入力信号に含まれる第1の雑音を推定する第1の雑音推定処理と、
    前記入力信号から前記第1の雑音を減じるように、第1の雑音減衰信号を求める第1の雑音減衰処理と、
    音声パタン記憶部に予め記憶されている音声パタンと、前記第1の雑音減衰信号が前記音声パタンである確率との重み付け和を用いて、第2の雑音減衰信号を求める第2の雑音減衰処理と、
    前記第1の雑音と前記第1の雑音減衰信号の和と、前記第1の雑音と前記第2の雑音減衰信号の和との比を、前記第1の雑音に乗算することにより、前記入力信号に含まれる第2の雑音を推定する第2の雑音推定処理と、
    をコンピュータに実行させるプログラム。
  30. 前記第2の雑音推定処理が、前記第1の雑音から前記第2の雑音への補正度合いを制御する、ことを特徴とする請求項25乃至29のいずれか一に記載のプログラム。
JP2007193517A 2007-07-25 2007-07-25 雑音推定装置と方法およびプログラム Active JP5374845B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007193517A JP5374845B2 (ja) 2007-07-25 2007-07-25 雑音推定装置と方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007193517A JP5374845B2 (ja) 2007-07-25 2007-07-25 雑音推定装置と方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2009031425A JP2009031425A (ja) 2009-02-12
JP5374845B2 true JP5374845B2 (ja) 2013-12-25

Family

ID=40402014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007193517A Active JP5374845B2 (ja) 2007-07-25 2007-07-25 雑音推定装置と方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5374845B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4989379B2 (ja) * 2007-09-05 2012-08-01 日本電信電話株式会社 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラム、および記録媒体
JP5768450B2 (ja) * 2011-03-31 2015-08-26 富士通株式会社 騒音推定装置及び騒音推定プログラム
JP6679881B2 (ja) * 2015-10-27 2020-04-15 沖電気工業株式会社 雑音推定装置、プログラム及び方法、並びに、音声処理装置
JP6716933B2 (ja) * 2016-02-02 2020-07-01 沖電気工業株式会社 雑音推定装置、プログラム及び方法、並びに、音声処理装置
CN113506582B (zh) * 2021-05-25 2024-07-09 北京小米移动软件有限公司 声音信号识别方法、装置及系统
CN113539291B (zh) * 2021-07-09 2024-06-25 北京声智科技有限公司 音频信号的降噪方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3933860B2 (ja) * 2000-02-28 2007-06-20 三菱電機株式会社 音声認識装置
US7139703B2 (en) * 2002-04-05 2006-11-21 Microsoft Corporation Method of iterative noise estimation in a recursive framework
JP3849679B2 (ja) * 2003-09-25 2006-11-22 ヤマハ株式会社 雑音除去方法、雑音除去装置およびプログラム
JP4765461B2 (ja) * 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム

Also Published As

Publication number Publication date
JP2009031425A (ja) 2009-02-12

Similar Documents

Publication Publication Date Title
US9449594B2 (en) Adaptive phase difference based noise reduction for automatic speech recognition (ASR)
US9047874B2 (en) Noise suppression method, device, and program
JP5374845B2 (ja) 雑音推定装置と方法およびプログラム
JP5435204B2 (ja) 雑音抑圧の方法、装置、及びプログラム
US20100010808A1 (en) Method, Apparatus and Computer Program for Suppressing Noise
JP4886715B2 (ja) 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
CN106558315B (zh) 异质麦克风自动增益校准方法及系统
CN103680515A (zh) 采用系数重用的比例自适应滤波器系数向量更新方法
CN114360566B (zh) 一种语音信号的降噪处理方法、装置以及存储介质
US9536539B2 (en) Nonlinear acoustic echo signal suppression system and method using volterra filter
JP5344251B2 (ja) 雑音除去システム、雑音除去方法および雑音除去プログラム
JP2008216721A (ja) 雑音抑圧の方法、装置、及びプログラム
WO2012070670A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JPWO2016009654A1 (ja) 雑音抑圧システムと雑音抑圧方法及びプログラムを格納した記録媒体
Malik et al. Double-talk robust multichannel acoustic echo cancellation using least-squares MIMO adaptive filtering: transversal, array, and lattice forms
CN108141202A (zh) 包括自适应模块和校正模块的分区块频域自适应滤波器设备
WO2012127740A1 (ja) 伝送路推定装置、伝送路推定方法、及び受信装置
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
US9584905B2 (en) Audio signal mixing
JP5228903B2 (ja) 信号処理装置および方法
WO2009050434A2 (en) Equation solving
WO2013032025A1 (ja) 信号処理装置、信号処理方法、およびコンピュータ・プログラム
JP5421877B2 (ja) エコー消去方法、エコー消去装置及びエコー消去プログラム
JP2011188357A (ja) ディジタルフィルタ及びフィルタ係数更新方法
JP2011100029A (ja) 信号処理方法、情報処理装置、及び信号処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100611

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130827

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130909

R150 Certificate of patent or registration of utility model

Ref document number: 5374845

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150