JP5012995B2 - オーディオ信号処理装置及びオーディオ信号処理方法 - Google Patents
オーディオ信号処理装置及びオーディオ信号処理方法 Download PDFInfo
- Publication number
- JP5012995B2 JP5012995B2 JP2010505604A JP2010505604A JP5012995B2 JP 5012995 B2 JP5012995 B2 JP 5012995B2 JP 2010505604 A JP2010505604 A JP 2010505604A JP 2010505604 A JP2010505604 A JP 2010505604A JP 5012995 B2 JP5012995 B2 JP 5012995B2
- Authority
- JP
- Japan
- Prior art keywords
- level
- adjustment value
- level adjustment
- frame
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/01—Hearing devices using active noise cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Electric hearing aids
- H04R25/35—Electric hearing aids using translation techniques
- H04R25/356—Amplitude, e.g. amplitude shift or compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Electric hearing aids
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereo-Broadcasting Methods (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Control Of Amplification And Gain Control (AREA)
- Stereophonic System (AREA)
Description
A=(Abefore×(N−1)+Anow)/N ・・・(式1)
で求めることができる。
ΔS=S−S×A=S(1−A) ・・・(式2)
で表される。
ΔSmax=T1×(1−α)/N ・・・(式3)
で定義することが可能である。
N=T1×(1−α)/P ・・・(式4)
により、スムージングの時定数Nを算出する。
N1=T3×(1−α)/P1 ・・・(式5)
により算出される時定数N1を用いてもよい。
Claims (10)
- 入力されたオーディオ信号を所定の単位であるフレームに分割するフレーム分割部と、
前記フレームごとの前記オーディオ信号を時間領域の信号から周波数領域の信号である周波数信号へと変換する周波数変換部と、
前記フレームごとの前記周波数信号から各周波数のスペクトルのレベルを検出するレベル検出部と、
第1の閾値と、この第1の閾値よりも低いレベルに設定された第2の閾値との間のレベル範囲内のレベルを有するスペクトルのレベルを低減させるためのレベル調整値を前記フレームごとに設定する低減量設定処理を行うレベル調整値設定部と、
現在ノイズ低減処理対象としているフレームにおいて設定された前記レベル調整値に対して、当該フレームよりも時間的に1つ前のフレームで用いたレベル調整値との間で時間方向の平滑化処理であるスムージング処理を行うレベル調整値スムージング部と、
前記スムージング処理後の前記レベル調整値を保存する保存部と、
前記ノイズ低減処理対象としているフレームの前記スムージング処理後の前記レベル調整値を、当該フレームの前記周波数信号に乗算してレベル調整を行うスペクトル調整部と、
前記スペクトル調整部でレベル調整された前記周波数信号を時間領域のオーディオ信号に変換する逆周波数変換部と
を備えることを特徴とするオーディオ信号処理装置。 - 前記レベル調整値設定部は、前記フレーム内のスペクトルごとまたは周波数帯域ごとに前記レベル調整値を設定することを特徴とする請求項1に記載のオーディオ信号処理装置。
- 前記レベル調整値設定部は、前記第1の閾値よりレベルが高いスペクトル、および前記第2の閾値よりレベルが低いスペクトルのレベルを増大させるように前記レベル調整値を設定することを特徴とする請求項1又は2に記載のオーディオ信号処理装置。
- 前記レベル調整値スムージング部は、人間の耳が聞き取ることのできる最小の音圧レベルの周波数特性に基づく最小可聴限レベル値、前記第1の閾値、および前記レベル調整値設定部において前記ノイズ低減処理対象としているフレームに対して前記低減量設定処理で設定した前記レベル調整値を用いて、前記低減量設定処理で設定した前記レベル調整値に対するスムージングの時定数を決定することを特徴とする請求項1乃至3のいずれか1項に記載のオーディオ信号処理装置。
- 前記レベル調整値設定部は、さらに、前記第1の閾値以上のレベルに設定された第3の閾値と、前記第1の閾値以上かつ前記第3の閾値以下のレベルに設定された第4の閾値との間の範囲内のレベルを有する所定周波数帯域内のスペクトルのレベルを増加させるためのレベル調整値を前記フレームごとに設定する増幅量設定処理を行うことを特徴とする請求項1乃至4のいずれか1項に記載のオーディオ信号処理装置。
- 前記低減量設定処理および前記増幅量設定処理のうちのいずれか一方を選択して行うように前記レベル調整値設定部を制御する制御部をさらに備えることを特徴とする請求項5に記載のオーディオ信号処理装置。
- 前記第1乃至第4の閾値は、前記フレーム内のスペクトルごとまたは周波数帯域ごとに設定される値であることを特徴とする請求項5又は6に記載のオーディオ信号処理装置。
- 前記レベル調整値設定部は、前記増幅量設定処理において設定する前記レベル調整値に基づく増幅量の周波数特性が、前記オーディオ信号を含むコンテンツのジャンルに応じて変化するように前記レベル調整値を設定することを特徴とする請求項5乃至7のいずれか1項に記載のオーディオ信号処理装置。
- 前記レベル調整値スムージング部は、所定の音量に対応する人間の聴覚の周波数特性に基づく許容ノイズレベル値、前記第3の閾値、および前記レベル調整値設定部において前記ノイズ低減処理対象としているフレームに対して前記増幅量設定処理で設定した前記レベル調整値を用いて、前記増幅量設定処理で設定した前記レベル調整値に対するスムージングの時定数を決定することを特徴とする請求項5乃至8のいずれか1項に記載のオーディオ信号処理装置。
- フレーム分割部によって、入力されたオーディオ信号を所定の単位であるフレームに分割し、
周波数変換部によって、前記フレームごとの前記オーディオ信号を時間領域の信号から周波数領域の信号である周波数信号へと変換し、
レベル検出部によって、前記フレームごとの前記周波数信号から各周波数のスペクトルのレベルを検出し、
レベル調整設定部によって、第1の閾値と、この第1の閾値よりも低いレベルに設定された第2の閾値との間のレベル範囲内のレベルを有するスペクトルのレベルを低減させるためのレベル調整値を前記フレームごとに設定する低減量設定処理を行い、
レベル調整値スムージング部によって、現在ノイズ低減処理対象としているフレームにおいて設定された前記レベル調整値に対して、当該フレームよりも時間的に1つ前のフレームで用いたレベル調整値との間で時間方向の平滑化処理であるスムージング処理を行い、
保存部に、前記スムージング処理後の前記レベル調整値を保存し、
スペクトル調整部によって、前記ノイズ低減処理対象としているフレームの前記スムージング処理後の前記レベル調整値を、当該フレームの前記周波数信号に乗算してレベル調整を行い、
逆周波数変換部によって、前記スペクトル調整部でレベル調整された前記周波数信号を時間領域のオーディオ信号に変換する
ことを特徴とするオーディオ信号処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010505604A JP5012995B2 (ja) | 2008-03-24 | 2009-03-19 | オーディオ信号処理装置及びオーディオ信号処理方法 |
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008076605 | 2008-03-24 | ||
| JP2008076605 | 2008-03-24 | ||
| JP2008334908 | 2008-12-26 | ||
| JP2008334908 | 2008-12-26 | ||
| JP2010505604A JP5012995B2 (ja) | 2008-03-24 | 2009-03-19 | オーディオ信号処理装置及びオーディオ信号処理方法 |
| PCT/JP2009/055513 WO2009119460A1 (ja) | 2008-03-24 | 2009-03-19 | オーディオ信号処理装置及びオーディオ信号処理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2009119460A1 JPWO2009119460A1 (ja) | 2011-07-21 |
| JP5012995B2 true JP5012995B2 (ja) | 2012-08-29 |
Family
ID=41113655
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010505604A Active JP5012995B2 (ja) | 2008-03-24 | 2009-03-19 | オーディオ信号処理装置及びオーディオ信号処理方法 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US8355908B2 (ja) |
| EP (1) | EP2172930B1 (ja) |
| JP (1) | JP5012995B2 (ja) |
| AT (1) | ATE546812T1 (ja) |
| WO (1) | WO2009119460A1 (ja) |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9633667B2 (en) | 2012-04-05 | 2017-04-25 | Nokia Technologies Oy | Adaptive audio signal filtering |
| CN105378826B (zh) * | 2013-05-31 | 2019-06-11 | 诺基亚技术有限公司 | 音频场景装置 |
| JP2015206874A (ja) | 2014-04-18 | 2015-11-19 | 富士通株式会社 | 信号処理装置、信号処理方法、及び、プログラム |
| WO2015184525A1 (en) | 2014-06-05 | 2015-12-10 | Interdev Technologies | Systems and methods of interpreting speech data |
| CN104702343B (zh) * | 2015-02-04 | 2017-05-03 | 中国科学院信息工程研究所 | 声信道信息传输方法和系统 |
| TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
| US10346125B2 (en) * | 2015-08-18 | 2019-07-09 | International Business Machines Corporation | Detection of clipping event in audio signals |
| EP3783912B1 (en) * | 2018-04-17 | 2023-08-23 | The University of Electro-Communications | Mixing device, mixing method, and mixing program |
| US11516581B2 (en) | 2018-04-19 | 2022-11-29 | The University Of Electro-Communications | Information processing device, mixing device using the same, and latency reduction method |
| EP3783913A4 (en) | 2018-04-19 | 2021-06-16 | The University of Electro-Communications | MIXING DEVICE, MIXING METHOD AND MIXING PROGRAM |
| US11227610B1 (en) * | 2019-04-16 | 2022-01-18 | Wells Fargo Bank, P.A. | Computer-based systems for administering patterned passphrases |
| US11146607B1 (en) * | 2019-05-31 | 2021-10-12 | Dialpad, Inc. | Smart noise cancellation |
| CN119207487B (zh) * | 2024-09-12 | 2025-07-04 | 安徽艾德未来智能科技有限公司 | 一种用于蓝牙耳机的音频录音及转换方法 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03247011A (ja) * | 1990-02-23 | 1991-11-05 | Sony Corp | 雑音除去回路 |
| JPH06208395A (ja) * | 1992-10-30 | 1994-07-26 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | ホルマント検出装置及び音声加工装置 |
| JPH08221093A (ja) * | 1995-02-17 | 1996-08-30 | Sony Corp | 音声信号の雑音低減方法 |
| JP2001134287A (ja) * | 1999-11-10 | 2001-05-18 | Mitsubishi Electric Corp | 雑音抑圧装置 |
| JP2002527785A (ja) * | 1998-10-13 | 2002-08-27 | エヌシーティー グループ インコーポレーテッド | 情報信号にある休止期間の間にノイズ推定値を更新する方法とシステム |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4811404A (en) * | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
| GB8801014D0 (en) | 1988-01-18 | 1988-02-17 | British Telecomm | Noise reduction |
| JPH07193548A (ja) * | 1993-12-25 | 1995-07-28 | Sony Corp | 雑音低減処理方法 |
| US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
| US6377637B1 (en) | 2000-07-12 | 2002-04-23 | Andrea Electronics Corporation | Sub-band exponential smoothing noise canceling system |
| JP2002359899A (ja) | 2001-05-31 | 2002-12-13 | Canon Electronics Inc | 音声処理装置および補聴器 |
| US20040078199A1 (en) * | 2002-08-20 | 2004-04-22 | Hanoh Kremer | Method for auditory based noise reduction and an apparatus for auditory based noise reduction |
| US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
| JP2005086462A (ja) | 2003-09-09 | 2005-03-31 | Victor Co Of Japan Ltd | オーディオ信号再生装置のボーカル音帯域強調回路 |
| ES2294506T3 (es) * | 2004-05-14 | 2008-04-01 | Loquendo S.P.A. | Reduccion de ruido para el reconocimiento automatico del habla. |
| US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
| FR2923527B1 (fr) | 2007-11-13 | 2013-12-27 | Snecma | Etage de turbine ou de compresseur, en particulier de turbomachine |
| US8180635B2 (en) * | 2008-12-31 | 2012-05-15 | Texas Instruments Incorporated | Weighted sequential variance adaptation with prior knowledge for noise robust speech recognition |
-
2009
- 2009-03-19 US US12/452,795 patent/US8355908B2/en active Active
- 2009-03-19 JP JP2010505604A patent/JP5012995B2/ja active Active
- 2009-03-19 AT AT09725142T patent/ATE546812T1/de active
- 2009-03-19 WO PCT/JP2009/055513 patent/WO2009119460A1/ja not_active Ceased
- 2009-03-19 EP EP09725142A patent/EP2172930B1/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03247011A (ja) * | 1990-02-23 | 1991-11-05 | Sony Corp | 雑音除去回路 |
| JPH06208395A (ja) * | 1992-10-30 | 1994-07-26 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | ホルマント検出装置及び音声加工装置 |
| JPH08221093A (ja) * | 1995-02-17 | 1996-08-30 | Sony Corp | 音声信号の雑音低減方法 |
| JP2002527785A (ja) * | 1998-10-13 | 2002-08-27 | エヌシーティー グループ インコーポレーテッド | 情報信号にある休止期間の間にノイズ推定値を更新する方法とシステム |
| JP2001134287A (ja) * | 1999-11-10 | 2001-05-18 | Mitsubishi Electric Corp | 雑音抑圧装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20100128882A1 (en) | 2010-05-27 |
| EP2172930A1 (en) | 2010-04-07 |
| ATE546812T1 (de) | 2012-03-15 |
| US8355908B2 (en) | 2013-01-15 |
| EP2172930B1 (en) | 2012-02-22 |
| JPWO2009119460A1 (ja) | 2011-07-21 |
| WO2009119460A1 (ja) | 2009-10-01 |
| EP2172930A4 (en) | 2010-07-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5012995B2 (ja) | オーディオ信号処理装置及びオーディオ信号処理方法 | |
| JP5695677B2 (ja) | 単一再生モードにおいてラウドネス測定値を合成するシステム | |
| CN101609685B (zh) | 音频信号处理设备和音频信号处理方法 | |
| JP6328627B2 (ja) | 雑音検出及びラウドネス低下検出によるラウドネスコントロール | |
| CN102668374B (zh) | 音频录音的自适应动态范围增强 | |
| TWI535299B (zh) | 低音強化系統及其方法 | |
| US20120275625A1 (en) | Signal processing device, method thereof, program, and data recording medium | |
| EP1619793B1 (en) | Audio enhancement system and method | |
| CN104185870B (zh) | 声学信号处理装置和声学信号处理方法 | |
| US9093968B2 (en) | Sound reproducing apparatus, sound reproducing method, and recording medium | |
| JP5917518B2 (ja) | 知覚スペクトルアンバランス改善のための音声信号動的補正 | |
| CN103580632B (zh) | 自动响度控制系统及方法 | |
| US8634578B2 (en) | Multiband dynamics compressor with spectral balance compensation | |
| US20170346460A1 (en) | Adjusting dynamic range of an audio signal based on one or more dynamic equalization and/or dynamic range control parameters | |
| US20160210983A1 (en) | Method and electronic device | |
| CN103580631B (zh) | 自动响度控制系统及方法 | |
| WO2010013944A2 (en) | A method and an apparatus for processing an audio signal | |
| EP3827429B1 (en) | Compressor target curve to avoid boosting noise | |
| CN108768330B (zh) | 自动响度控制 | |
| JP4706666B2 (ja) | 音量制御装置及びコンピュータプログラム | |
| JP2001188599A (ja) | オーディオ信号復号装置 | |
| JP7427531B2 (ja) | 音響信号処理装置及び音響信号処理プログラム | |
| JP2012027101A (ja) | 音声再生装置、音声再生方法、プログラム、及び、記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20111012 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120508 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120521 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150615 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5012995 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |