JP5528538B2 - 雑音抑圧装置 - Google Patents
雑音抑圧装置 Download PDFInfo
- Publication number
- JP5528538B2 JP5528538B2 JP2012504136A JP2012504136A JP5528538B2 JP 5528538 B2 JP5528538 B2 JP 5528538B2 JP 2012504136 A JP2012504136 A JP 2012504136A JP 2012504136 A JP2012504136 A JP 2012504136A JP 5528538 B2 JP5528538 B2 JP 5528538B2
- Authority
- JP
- Japan
- Prior art keywords
- power spectrum
- spectrum
- noise
- noise suppression
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02163—Only one microphone
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
実施の形態1.
図1に示す雑音抑圧装置は、入力端子1と、時間・周波数変換部2と、音声らしさ推定部3と、雑音スペクトル推定部4と、帯域分離部5と、帯域代表成分生成部(代表成分生成部)6と、雑音抑圧量生成部7と、帯域多重化部8と、雑音抑圧部9と、周波数・時間変換部10と、出力端子11とを備える。
入力端子1は、上述のような信号を受け付けて、入力信号y(t)として時間・周波数変換部2へ出力する。
ここで、nはフレーム番号、kはスペクトル番号、KはFFTポイント数の半分の値、N(n−1,k)は更新前の雑音スペクトル、Y(n,k)は雑音の可能性が高いと判断された現フレームの雑音スペクトル、N~(n,k)は更新後の雑音スペクトルである。ここでは電子出願の関係上、上式(2)中の“〜”(チルダ記号)を“~”と表記するが、以降の説明では更新後の雑音スペクトルのチルダ記号を省略する。また、α(k)は0〜1の値を取る所定の更新速度係数であり、比較的0に近い値に設定すると良い。ただし、周波数が高くなるに従って更新速度係数を大きくした方が良い場合もあるので、雑音の種類等に応じて更新速度係数を適宜調整することも可能である。
なお、図3ではサブバンドを均等分割した場合について例示したが、例えば図2の表のように臨界帯域幅で非均等分割した場合も同様の効果を奏することはいうまでもない。
ここで、v及びμは所定の係数であり、上述した最大事後確率法に関する文献ではv=0.126、μ=1.74が好適な値として例示がある。もちろん、この値以外であってもよく、入力信号及び雑音の態様に応じて適宜調整することができる。
サブバンド中央付近の周波数に属するパワースペクトルを優先して選択することにより、帯域分割幅が広い場合に事後SNRの推定精度が向上する効果がある。また、所定の閾値を越えたパワースペクトルが検出できた時点で探索を終了することで、代表パワースペクトル探索に要する処理量を削減できる効果がある。
上記実施の形態1では、帯域代表成分生成部6において、同一サブバンド内で最も値が大きいパワースペクトルを代表パワースペクトルに選択していたが、例えば、同一サブバンド内でパワースペクトルを値が大きい順に並び替えて、値が大きなパワースペクトルから大きな重みを付けて重み付き平均を求め、その値を代表パワースペクトルにしてもよい。
また、例えば、メジアン等の統計的手法を用いて、中央値を代表パワースペクトルにしてもよい。
また、重み付き平均に代えて、メジアン等の統計的手法を用いても同様な効果を得られる。
上記実施の形態1では、帯域代表成分生成部6において、音声らしさ評価値が閾値を越えると同一サブバンド内の最大値を持つパワースペクトルを代表パワースペクトルに選択し、一方、閾値未満なら同一サブバンド内の各パワースペクトルから平均値を求めて、この平均値をもつ代表パワースペクトルを生成するように切り替え制御を行う構成にしたが、例えば、下式(10)のように、音声らしさ評価値VADを重み付け係数にして、最大値と平均値の重み付き和を代表パワースペクトルにすることも可能である。
この式(10)は、音声らしさ評価値VADに応じて、連続的に最大値と平均値を切り替えることが可能である。入力信号が音声の可能性が高い場合には、音声らしさ評価値VADが大きくなるので、代表パワースペクトルは最大値の場合の重みが大きくなる。一方、雑音の可能性が高い場合には、音声らしさ評価値VADが小さくなるので、平均値の場合の重みが大きくなる。
上記実施の形態1では、帯域代表成分生成部6において、音声らしさ評価値に基づいて全サブバンドの代表パワースペクトル生成の切り替え制御を行っていたが、サブバンド毎に切り替え制御を行っても良い。例えば、帯域代表成分生成部6がサブバンド内のパワースペクトルの分散を計算し、分散が所定の閾値を越える場合には、そのサブバンドは音声成分を含むと判断して、代表パワースペクトルとして最大値を選択する方法に切り替える。一方、分散が所定の閾値を下回る場合には、代表パワースペクトルとして平均値を計算する方法に切り替える。
Claims (3)
- 時間領域の入力信号を周波数領域の信号であるパワースペクトルと位相スペクトルに変換する時間・周波数変換部と、
前記入力信号に重畳した雑音スペクトルを推定する雑音スペクトル推定部と、
前記パワースペクトルと前記雑音スペクトルとを用いて、雑音抑圧量を算出する雑音抑圧量生成部と、
前記雑音抑圧量に応じて前記パワースペクトルの振幅を抑圧する雑音抑圧部と、
前記位相スペクトルと前記雑音抑圧部で振幅抑圧された前記パワースペクトルとを時間領域の信号に変換する周波数・時間変換部とを備える雑音抑圧装置において、
前記時間・周波数変換部が変換した複数のパワースペクトルを1グループにまとめ、当該グループ内の前記複数のパワースペクトルのうち、値が大きいものを優先して選択して代表パワースペクトルにする代表成分生成部を備え、
前記雑音抑圧量生成部は、前記代表パワースペクトルを用いて雑音抑圧量を算出し、
前記入力信号が音声らしいかどうかの度合いを示す音声らしさ評価値を算出する音声ら
しさ推定部を備え、
前記代表成分生成部は、前記音声らしさ評価値に基づいた代表パワースペクトルを生成することを特徴とする雑音抑圧装置。 - 代表成分生成部は、音声らしさ評価値に基づいて、入力信号の音声らしさの度合いが高い場合にはグループ内の値の大きいパワースペクトルを優先して選択して代表パワースペクトルを生成し、当該入力信号の音声らしさの度合いが低い場合には当該グループ内の複数のパワースペクトルの平均値を求めて代表パワースペクトルを生成することを特徴とする請求項1記載の雑音抑圧装置。
- 代表パワースペクトルは、音声らしさ評価値を重み付け係数に用いた、グループ内の複数のパワースペクトルのうちの最大値とグループ内の複数のパワースペクトルの平均値の重み付き和であることを特徴とする請求項1記載の雑音抑圧装置。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2010/001649 WO2011111091A1 (ja) | 2010-03-09 | 2010-03-09 | 雑音抑圧装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2011111091A1 JPWO2011111091A1 (ja) | 2013-06-27 |
| JP5528538B2 true JP5528538B2 (ja) | 2014-06-25 |
Family
ID=44562942
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012504136A Active JP5528538B2 (ja) | 2010-03-09 | 2010-03-09 | 雑音抑圧装置 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US8989403B2 (ja) |
| EP (1) | EP2546831B1 (ja) |
| JP (1) | JP5528538B2 (ja) |
| CN (1) | CN102792373B (ja) |
| WO (1) | WO2011111091A1 (ja) |
Families Citing this family (28)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE112010005895B4 (de) | 2010-09-21 | 2016-12-15 | Mitsubishi Electric Corporation | Störungsunterdrückungsvorrichtung |
| CN103718241B (zh) * | 2011-11-02 | 2016-05-04 | 三菱电机株式会社 | 噪音抑制装置 |
| JP2013137361A (ja) * | 2011-12-28 | 2013-07-11 | Pioneer Electronic Corp | ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法 |
| JP2013148724A (ja) * | 2012-01-19 | 2013-08-01 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
| JP6361156B2 (ja) * | 2014-02-10 | 2018-07-25 | 沖電気工業株式会社 | 雑音推定装置、方法及びプログラム |
| WO2015130283A1 (en) | 2014-02-27 | 2015-09-03 | Nuance Communications, Inc. | Methods and apparatus for adaptive gain control in a communication system |
| US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
| DE112015006367B4 (de) * | 2015-03-24 | 2018-11-29 | Mitsubishi Electric Corporation | Aktive vibrationsgeräusch-steuervorrichtung |
| JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
| CN106571146B (zh) * | 2015-10-13 | 2019-10-15 | 阿里巴巴集团控股有限公司 | 噪音信号确定方法、语音去噪方法及装置 |
| KR20170051856A (ko) * | 2015-11-02 | 2017-05-12 | 주식회사 아이티매직 | 사운드 신호에서 진단 신호를 추출하는 방법 및 진단 장치 |
| CN106899869A (zh) * | 2015-12-25 | 2017-06-27 | 小米科技有限责任公司 | 调整电子设备音量的方法、装置及系统 |
| CN105812995B (zh) * | 2016-03-09 | 2018-11-09 | 西安航空学院 | 一种噪音滤除方法和装置 |
| JP6186040B2 (ja) * | 2016-04-28 | 2017-08-23 | パイオニア株式会社 | ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法 |
| CN106332266B (zh) * | 2016-08-23 | 2019-11-19 | 哈尔滨海能达科技有限公司 | 一种数据处理的方法及相关设备 |
| CN106356072A (zh) * | 2016-09-26 | 2017-01-25 | 郑州云海信息技术有限公司 | 一种电子降噪方法及其系统 |
| EP3324406A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
| EP3324407A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
| JP6892598B2 (ja) * | 2017-06-16 | 2021-06-23 | アイコム株式会社 | ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム |
| CN107393533B (zh) * | 2017-07-28 | 2019-12-10 | 侨伟运动器材(南京)有限公司 | 一种通过语音控制跑步机的装置 |
| GB2580057A (en) * | 2018-12-20 | 2020-07-15 | Nokia Technologies Oy | Apparatus, methods and computer programs for controlling noise reduction |
| JP7398895B2 (ja) * | 2019-07-31 | 2023-12-15 | 株式会社デンソーテン | ノイズ低減装置 |
| CN110600051B (zh) * | 2019-11-12 | 2020-03-31 | 乐鑫信息科技(上海)股份有限公司 | 用于选择麦克风阵列的输出波束的方法 |
| EP4060662B1 (en) * | 2019-12-13 | 2025-12-03 | Mitsubishi Electric Corporation | Information processing device, detection method, and detection program |
| CN112309418B (zh) * | 2020-10-30 | 2023-06-27 | 出门问问(苏州)信息科技有限公司 | 一种抑制风噪声的方法及装置 |
| CN115881146A (zh) * | 2021-08-05 | 2023-03-31 | 哈曼国际工业有限公司 | 用于动态语音增强的方法及系统 |
| CN114974288B (zh) * | 2022-05-12 | 2025-05-16 | 安克创新科技股份有限公司 | 风噪检测方法、装置及设备 |
| JP7716059B1 (ja) | 2024-06-21 | 2025-07-31 | 日本キャステム株式会社 | 音声検出装置および音声検出方法 |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04172530A (ja) | 1990-11-06 | 1992-06-19 | Kobe Nippon Denki Software Kk | 画面データ入力方式 |
| US5479560A (en) * | 1992-10-30 | 1995-12-26 | Technology Research Association Of Medical And Welfare Apparatus | Formant detecting device and speech processing apparatus |
| US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
| US6766292B1 (en) * | 2000-03-28 | 2004-07-20 | Tellabs Operations, Inc. | Relative noise ratio weighting techniques for adaptive noise cancellation |
| JP2002140100A (ja) * | 2000-11-02 | 2002-05-17 | Matsushita Electric Ind Co Ltd | 騒音抑圧装置 |
| DE60142800D1 (de) | 2001-03-28 | 2010-09-23 | Mitsubishi Electric Corp | Rauschunterdrücker |
| EP1253581B1 (en) * | 2001-04-27 | 2004-06-30 | CSEM Centre Suisse d'Electronique et de Microtechnique S.A. - Recherche et Développement | Method and system for speech enhancement in a noisy environment |
| JP4127511B2 (ja) * | 2003-03-12 | 2008-07-30 | クラリオン株式会社 | 音源選択方法及び音源選択装置 |
| JP4533126B2 (ja) * | 2004-12-24 | 2010-09-01 | 日本電信電話株式会社 | 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体 |
| DE602006008481D1 (de) * | 2005-05-17 | 2009-09-24 | Univ Waseda | Rauschunterdrückungsverfahren und -vorrichtungen |
| EP2555190B1 (en) | 2005-09-02 | 2014-07-02 | NEC Corporation | Method, apparatus and computer program for suppressing noise |
| JP4863713B2 (ja) * | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
| CN100543842C (zh) * | 2006-05-23 | 2009-09-23 | 中兴通讯股份有限公司 | 基于多统计模型和最小均方误差实现背景噪声抑制的方法 |
| JP5018193B2 (ja) * | 2007-04-06 | 2012-09-05 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
| EP2192579A4 (en) | 2007-09-19 | 2016-06-08 | Nec Corp | NOISE SUPPRESSION DEVICE, ITS METHOD AND PROGRAM |
| JP4660578B2 (ja) * | 2008-08-29 | 2011-03-30 | 株式会社東芝 | 信号補正装置 |
| US8737641B2 (en) * | 2008-11-04 | 2014-05-27 | Mitsubishi Electric Corporation | Noise suppressor |
-
2010
- 2010-03-09 WO PCT/JP2010/001649 patent/WO2011111091A1/ja not_active Ceased
- 2010-03-09 EP EP10847326.5A patent/EP2546831B1/en active Active
- 2010-03-09 CN CN201080065245.2A patent/CN102792373B/zh not_active Expired - Fee Related
- 2010-03-09 JP JP2012504136A patent/JP5528538B2/ja active Active
- 2010-03-09 US US13/581,544 patent/US8989403B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US8989403B2 (en) | 2015-03-24 |
| US20130003987A1 (en) | 2013-01-03 |
| EP2546831A1 (en) | 2013-01-16 |
| EP2546831B1 (en) | 2020-01-15 |
| CN102792373B (zh) | 2014-05-07 |
| CN102792373A (zh) | 2012-11-21 |
| WO2011111091A1 (ja) | 2011-09-15 |
| JPWO2011111091A1 (ja) | 2013-06-27 |
| EP2546831A4 (en) | 2014-04-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5528538B2 (ja) | 雑音抑圧装置 | |
| JP5127754B2 (ja) | 信号処理装置 | |
| JP4520732B2 (ja) | 雑音低減装置、および低減方法 | |
| JP5646077B2 (ja) | 雑音抑圧装置 | |
| JP5183828B2 (ja) | 雑音抑圧装置 | |
| WO2022068440A1 (zh) | 啸叫抑制方法、装置、计算机设备和存储介质 | |
| JP2004502977A (ja) | サブバンド指数平滑雑音消去システム | |
| KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
| JP5649488B2 (ja) | 音声判別装置、音声判別方法および音声判別プログラム | |
| JPWO2010113220A1 (ja) | 雑音抑圧装置 | |
| JP2017506767A (ja) | 話者辞書に基づく発話モデル化のためのシステムおよび方法 | |
| CN102132343A (zh) | 噪声抑制装置 | |
| JP5187666B2 (ja) | 雑音抑圧装置およびプログラム | |
| JP2016038551A (ja) | 雑音抑圧装置、方法及びプログラム | |
| JP5443547B2 (ja) | 信号処理装置 | |
| WO2020110228A1 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
| JP5466581B2 (ja) | 反響消去方法、反響消去装置及び反響消去プログラム | |
| JP4448464B2 (ja) | 雑音低減方法、装置、プログラム及び記録媒体 | |
| JP5840087B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
| JP4533126B2 (ja) | 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体 | |
| JP5772723B2 (ja) | 音響処理装置および分離マスク生成装置 | |
| JP5316127B2 (ja) | 音処理装置およびプログラム | |
| CN111226278B (zh) | 低复杂度的浊音语音检测和基音估计 | |
| JP2017009657A (ja) | 音声強調装置、および音声強調方法 | |
| JP6559576B2 (ja) | 雑音抑圧装置、雑音抑圧方法及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130723 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130913 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140318 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140415 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5528538 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
