JP7375904B2 - フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム - Google Patents
フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム Download PDFInfo
- Publication number
- JP7375904B2 JP7375904B2 JP2022502755A JP2022502755A JP7375904B2 JP 7375904 B2 JP7375904 B2 JP 7375904B2 JP 2022502755 A JP2022502755 A JP 2022502755A JP 2022502755 A JP2022502755 A JP 2022502755A JP 7375904 B2 JP7375904 B2 JP 7375904B2
- Authority
- JP
- Japan
- Prior art keywords
- optimization
- filter coefficient
- convex
- latent variable
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/156—Correlation function computation including computation of convolution operations using a domain transform, e.g. Fourier transform, polynomial transform, number theoretic transform
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/18—Methods or devices for transmitting, conducting or directing sound
- G10K11/26—Sound-focusing or directing, e.g. scanning
- G10K11/34—Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers
- H04R3/12—Circuits for transducers for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Computational Linguistics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Filters That Use Time-Delay Elements (AREA)
Description
この無歪制約条件を満たしつつ、不要な音源からの信号に対するゲインができるだけ小さくなるようにフィルタ係数wfを設定することで、音源dから到来する音の強調が達成できる。
まず、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法及び変形により得られる凸最適化問題を解く方法について説明する。次に、この方法を式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。最後に、音源強調以外に適用した例について説明する。
ここでは、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法と、変形により得られる凸最適化問題を解く方法とについて説明する。以下、次式により定義される潜在変数~wに関する最適化問題を考える。
ここでは、上記説明した、非凸最適化問題を凸最適化問題に変形したうえで最適値を求める汎用的な枠組みを、式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。
ここでは、別の適用例について説明する。具体的には、多数のスピーカを用いた局所再生システムについて説明する。
フィルタ係数最適化装置100は、M個(ただし、Mは1以上の整数)のマイク素子からなるマイクアレイを用いて、D個(ただし、Dは1以上の整数)の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を観測した信号(観測信号)から、目的音を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。観測信号はフィルタ係数の最適化に用いる入力データであるため、以下、観測信号のことを最適化用データということにする。
また、制約条件の別の例として、次式により表現されるものがある。
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FLMV_f(wf)+Σf=1 FΣd=1 DΛ(f,d),c_f,d(wf Haf,d))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,d(f=1, …, F, d=1, …, D)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,D) (f=1, …, F)を離散変数cf,1, …, cf,Dにより定義される離散変数とし、関数Λ(f,d),c_f,d (f=1, …, F, d=1, …, D)は次式で定義される変数γf,dに関する関数である(ただし、γf,d=wf Haf,d)。
ここでは、非凸最適化問題と等価な凸最適化問題を解くための一般的な実施形態について説明する。
フィルタ係数最適化装置100は、K個(ただし、Kは1以上の整数)の無向性スピーカを用いて構成され、予め定まったN+M個(ただし、N, Mは1以上の整数)の点のうち、N個の点では音を再生しつつM個の点では音が漏れないようにする局所再生システムのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。ここで、最適化用データとは潜在変数の最適化に用いる入力データ、または、潜在変数の最適化に用いる入力データと出力データの組である。
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FΣj=1 M|wf Hbf,j|2を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FΣj=1 M|wf Hbf,j|2+Σf=1 FΣi=1 NΛ(f,i),c_f,i(wf Haf,i))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,i(f=1, …, F, i=1, …, N)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,N) (f=1, …, F)を離散変数cf,1, …, cf,Nにより定義される離散変数とし、関数Λ(f,i),c_f,i (f=1, …, F, i=1, …, N)は次式で定義される変数γf,iに関する関数である(ただし、γf,i=wf Haf,i)。
図8は、上述の各装置を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部2020に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部2010、入力部2030、出力部2040などに動作させることで実施できる。
Claims (10)
- Dを1以上の整数とし、
D個の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する最適化部を含むフィルタ係数最適化装置であって、
Rf(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、LMV_f(wf)=wf HRfwf(f=1, …, F)をフィルタ係数wfに関するコスト関数とし、
前記最適化部は、所定の制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)に基づいて、前記最適値w*を計算するものであり、
前記所定の制約条件は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないものである
フィルタ係数最適化装置。 - 請求項3に記載のフィルタ係数最適化装置であって、
Cを1以上の整数、cf,d(f=1, …, F, d=1, …, D)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,D) (f=1, …, F)を離散変数cf,1, …, cf,Dにより定義される離散変数、Λ(f,d),c_f,d (f=1, …, F, d=1, …, D)を次式で定義される変数γf,dに関する関数(ただし、γf,d=wf Haf,d)とし、
前記最適化部は、前記最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FLMV_f(wf)+Σf=1 FΣd=1 DΛ(f,d),c_f,d(wf Haf,d))を解くことにより前記最適値w*を計算する
ことを特徴とするフィルタ係数最適化装置。 - 請求項4に記載のフィルタ係数最適化装置であって、
前記最適化部は、
周波数ビンfごとに、離散変数(cf,1, …, cf,D)がとり得るすべての値に対して、次式によりフィルタ係数wfの最適値の候補wf candidate[(cf,1, …, cf,D)]を計算する候補計算部と、
周波数ビンfごとに、前記候補wf candidate[(cf,1, …, cf,D)]のうち、コスト関数LMV_f(wf)+Σd=1 DΛ(f,d),c_f,d(wf Haf,d)の値を最小とする候補をフィルタ係数wfの最適値wf *とし、w*={w1 *, …, wF *}により前記最適値w*を得る最適値決定部とを含む
ことを特徴とするフィルタ係数最適化装置。 - Lconvexを潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)を潜在変数~wに関する関数とし、
潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))に基づいて、潜在変数~wの最適値~w*を計算する最適化部を含む潜在変数最適化装置であって、
Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域、Λd,c(d=1, …, D, c=1, …, C)を領域Sd,cで定義され、関数Ldを近似する凸関数、cd(d=1, …, D)を1, …, Cを値にとる離散変数とし、
前記最適化部は、前記最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1 DΛd,c_d(~w)))を解くことにより前記最適値~w*を計算する
潜在変数最適化装置。 - Dを1以上の整数とし、
フィルタ係数最適化装置が、D個の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する最適化ステップを含むフィルタ係数最適化方法であって、
Rf(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、LMV_f(wf)=wf HRfwf(f=1, …, F)をフィルタ係数wfに関するコスト関数とし、
前記最適化ステップは、所定の制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)に基づいて、前記最適値w*を計算するものであり、
前記所定の制約条件は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないものである
フィルタ係数最適化方法。 - Lconvexを潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)を潜在変数~wに関する関数とし、
潜在変数最適化装置が、潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))に基づいて、潜在変数~wの最適値~w*を計算する最適化ステップを含む潜在変数最適化方法であって、
Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域、Λd,c(d=1, …, D, c=1, …, C)を領域Sd,cで定義され、関数Ldを近似する凸関数、cd(d=1, …, D)を1, …, Cを値にとる離散変数とし、
前記最適化ステップは、前記最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1 DΛd,c_d(~w)))を解くことにより前記最適値~w*を計算する
潜在変数最適化方法。 - 請求項1ないし5のいずれか1項に記載のフィルタ係数最適化装置、請求項6または7に記載の潜在変数最適化装置のいずれかとしてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2020/008232 WO2021171532A1 (ja) | 2020-02-28 | 2020-02-28 | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2021171532A1 JPWO2021171532A1 (ja) | 2021-09-02 |
| JP7375904B2 true JP7375904B2 (ja) | 2023-11-08 |
Family
ID=77491189
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022502755A Active JP7375904B2 (ja) | 2020-02-28 | 2020-02-28 | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20230083284A1 (ja) |
| JP (1) | JP7375904B2 (ja) |
| WO (1) | WO2021171532A1 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022120773A1 (zh) * | 2020-12-11 | 2022-06-16 | 京东方科技集团股份有限公司 | 有机电致发光器件和显示装置 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012222518A (ja) | 2011-04-06 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | フィルタ設計における反射物の配置決定方法、装置、プログラム |
| US9668066B1 (en) | 2015-04-03 | 2017-05-30 | Cedar Audio Ltd. | Blind source separation systems |
| JP2018107697A (ja) | 2016-12-27 | 2018-07-05 | キヤノン株式会社 | 信号処理装置、信号処理方法及びプログラム |
| JP2020126138A (ja) | 2019-02-05 | 2020-08-20 | 日本電信電話株式会社 | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI458258B (zh) * | 2009-02-18 | 2014-10-21 | 杜比國際公司 | 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法 |
| FR3030807B1 (fr) * | 2014-12-23 | 2018-02-02 | Thales | Procede non lineaire d'estimation d'un melange de signaux |
| EP3582514B1 (en) * | 2018-06-14 | 2023-01-11 | Oticon A/s | Sound processing apparatus |
-
2020
- 2020-02-28 JP JP2022502755A patent/JP7375904B2/ja active Active
- 2020-02-28 WO PCT/JP2020/008232 patent/WO2021171532A1/ja not_active Ceased
- 2020-02-28 US US17/802,105 patent/US20230083284A1/en active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012222518A (ja) | 2011-04-06 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | フィルタ設計における反射物の配置決定方法、装置、プログラム |
| US9668066B1 (en) | 2015-04-03 | 2017-05-30 | Cedar Audio Ltd. | Blind source separation systems |
| JP2018107697A (ja) | 2016-12-27 | 2018-07-05 | キヤノン株式会社 | 信号処理装置、信号処理方法及びプログラム |
| JP2020126138A (ja) | 2019-02-05 | 2020-08-20 | 日本電信電話株式会社 | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2021171532A1 (ja) | 2021-09-02 |
| US20230083284A1 (en) | 2023-03-16 |
| JPWO2021171532A1 (ja) | 2021-09-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Vindrola et al. | Use of the filtered-x least-mean-squares algorithm to adapt personal sound zones in a car cabin | |
| Arteaga et al. | Improved source reconstruction in Fourier-based Near-field Acoustic Holography applied to small apertures | |
| Jin et al. | Multizone soundfield reproduction using orthogonal basis expansion | |
| US20210289304A1 (en) | Audio precompensation filter optimized with respect to bright and dark zones | |
| US9966081B2 (en) | Method and apparatus for synthesizing separated sound source | |
| JP2019078864A (ja) | 楽音強調装置、畳み込みオートエンコーダ学習装置、楽音強調方法、プログラム | |
| JP7375904B2 (ja) | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム | |
| JP5342521B2 (ja) | 局所再生方法、局所再生装置及びそのプログラム | |
| WO2021255925A1 (ja) | 目的音信号生成装置、目的音信号生成方法、プログラム | |
| JP6815956B2 (ja) | フィルタ係数算出装置、その方法、及びプログラム | |
| Jälmby et al. | Compression of room impulse responses for compact storage and fast low-latency convolution | |
| Comanducci et al. | Synthesis of soundfields through irregular loudspeaker arrays based on convolutional neural networks | |
| WO2021255786A1 (ja) | 音響エリア再生方法、および、音響エリア再生装置 | |
| JP7375905B2 (ja) | フィルタ係数最適化装置、フィルタ係数最適化方法、プログラム | |
| CN110677782B (zh) | 信号自适应噪声过滤器 | |
| JP7156064B2 (ja) | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム | |
| JP7583638B2 (ja) | オブジェクトベース音響レンダリング装置及びプログラム | |
| Tuna et al. | Data-driven local average room transfer function estimation for multi-point equalization | |
| JP7601231B2 (ja) | 音響特性計算装置、音響特性計算方法、プログラム | |
| JP7444243B2 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
| JP5583181B2 (ja) | 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム | |
| JP7173356B2 (ja) | Psd最適化装置、psd最適化方法、プログラム | |
| JP7776016B2 (ja) | 信号処理装置、信号処理方法、プログラム | |
| JP7173355B2 (ja) | Psd最適化装置、psd最適化方法、プログラム | |
| Jeon et al. | Driving function in wave field synthesis with integral approximation considering uneven contribution of loudspeaker units |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220707 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230926 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231009 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7375904 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |















