JP6059112B2 - 音源分離装置とその方法とプログラム - Google Patents
音源分離装置とその方法とプログラム Download PDFInfo
- Publication number
- JP6059112B2 JP6059112B2 JP2013171079A JP2013171079A JP6059112B2 JP 6059112 B2 JP6059112 B2 JP 6059112B2 JP 2013171079 A JP2013171079 A JP 2013171079A JP 2013171079 A JP2013171079 A JP 2013171079A JP 6059112 B2 JP6059112 B2 JP 6059112B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- signal
- microphone
- observed
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
複数の点音源(1,2,…Ni)から発音する音声を、複数のマイクロホン(1,2,…Nm)のm番目のマイクロホンで観測した場合、i番目の音源から到来する信号xt,f (i,m)は、時間周波数領域において以下のように表される。t(t=1,…Nt),f(f=1,…,Nf)は、時間と周波数のインデックスである。
この発明の音源分離方法は、上記した音源イメージxt,f (i,m)に含まれる重要なパラメータに着目することで、複数のマイクロホンごとに異なるアクティビティパタンの推定を可能にする。
この発明の音源分離装置100の性能を評価する目的で評価実験を行った。実験条件は次の通りとした。
Claims (7)
- 複数の音源から発せられる音源信号を複数のマイクロホンで収音した複数チャネルの観測信号と、上記複数のマイクロホンの各々で観測される上記複数の音源の各々からの信号の音圧が異なると仮定した観測信号のモデルを用いて、各マイクロホンごとに各音源に関する音源存在事後確率を推定するマイク別音源存在事後確率推定部と、
上記複数チャネルの観測信号と、上記音源存在事後確率を入力として、観測信号のモデルパラメータを推定するモデルパラメータ推定部と、
上記複数チャネルの観測信号と、上記音源存在事後確率と、上記モデルパラメータと、を入力として上記各マイクロホンごとに上記各音源からの到来信号を推定して出力する出力音推定部と、
を具備する音源分離装置。 - 請求項1に記載した音源分離装置において、
上記観測信号のモデルは、
m番目のマイクロホンで観測される信号ot,f (m)(但し、tは時間のインデックス、fは周波数のインデックスとする)が、上記複数の音源の各々から到来し当該m番目のマイクロホンで観測される到来信号のうち、最大の音圧を持つ到来信号と同値となるよう定義されたモデルであり、
上記到来信号のモデルは、
m番目のマイクロホンで観測されるi番目の音源からの到来信号xt,f (i,m)を、
i番目の音源のクリーン音声信号st,f (i)と、
i番目の音源からm番目のマイクロホンに到来する信号の音圧に対応する伝達関数βf (i,m)と、
i番目の音源からm番目のマイクロホンに到来する信号とm番目のマイクロホンで観測されるi番目の音源からの信号との差に対応するエラー項et,f (i,m)と、
により定義した確率モデルであり、
上記モデルパラメータは、上記音源のクリーン音声信号st,f (i)と上記伝達関数βf (i,m)と上記エラー項et,f (i,m)の分散σt,f (i,m)とである、
ことを特徴とする音源分離装置。 - 請求項2に記載した音源分離装置において、
更に、記憶部と反復処理部とを備え、
上記記憶部は上記観測信号のモデルパラメータ^θ(i)を記憶するものであり、
上記マイク別音源存在事後確率推定部は、上記マイクロホンmごとの観測信号ot,f (m)と上記記憶部に記憶されたモデルパラメータ^θ(i)とを入力として、当該マイクロホンmごとの観測信号ot,f (m)とモデルパラメータ^θ(i)とを上記観測信号のモデルに当てはめたときの上記観測信号ot,f (m)と上記観測信号のモデルパラメータ^θ(i)との同時確率に基づいて、上記マイクロホンmと音源iごとに音源存在事後確率^Mt,f (i,m)を推定するものであり、
上記モデルパラメータ推定部は、上記マイクロホンmごとの観測信号ot,f (m)と上記記憶部に記憶されたモデルパラメータ^θ(i)と上記音源存在事後確率^Mt,f (i,m)とを入力として、当該マイクロホンmごとの観測信号ot,f (m)とモデルパラメータ^θ(i)とを上記観測信号のモデルに当てはめたときの上記観測信号ot,f (m)と上記観測信号のモデルパラメータ^θ(i)との同時確率の対数に、上記音源存在事後確率^Mt,f (i,m)に対応する重みを乗じた値を、全ての観測信号について足し合わせた重み付き和が大きくなるように、上記記憶部に記憶された伝達関数βf (i,m)とエラー項et,f (i,m)の分散σt,f (i,m)とクリーン音声信号st,f (i)とを更新するものであり、
上記反復処理部は、所定の基準を満たすまで、上記マイク別音源存在事後確率推定部と上記モデルパラメータ推定部の処理を繰り返すものであり、
上記出力音推定部は、上記複数チャネルの観測信号と上記音源存在事後確率と上記記憶部に記憶されたパラメータ^θ(i)とを入力として上記音源iごとの到来信号xt,f (i,m)を計算するもの、
であることを特徴とする音源分離装置。 - 複数の音源から発せられる音源信号を複数のマイクロホンで収音した複数チャネルの観測信号と、上記複数のマイクロホンの各々で観測される上記複数の音源の各々からの信号の音圧が異なると仮定した観測信号のモデルを用いて、各マイクロホンごとに各音源に関する音源存在事後確率を推定するマイク別音源存在事後確率推定過程と、
上記複数チャネルの観測信号と、上記音源存在事後確率を入力として、観測信号のモデルパラメータを推定するモデルパラメータ推定過程と、
上記複数チャネルの観測信号と、上記音源存在事後確率と、上記モデルパラメータと、を入力として上記各マイクロホンごとに上記各音源からの到来信号を推定して出力する出力音推定過程と、
を備える音源分離方法。 - 請求項4に記載した音源分離方法において、
上記観測信号のモデルは、
m番目のマイクロホンで観測される信号ot,f (m)(但し、tは時間のインデックス、fは周波数のインデックスとする)が、上記複数の音源の各々から到来し当該m番目のマイクロホンで観測される到来信号のうち、最大の音圧を持つ到来信号と同値となるよう定義されたモデルであり、
上記到来信号のモデルは、
m番目のマイクロホンで観測されるi番目の音源からの到来信号xt,f (i,m)を、
i番目の音源のクリーン音声信号st,f (i)と、
i番目の音源からm番目のマイクロホンに到来する信号の音圧に対応する伝達関数βf (i,m)と、
i番目の音源からm番目のマイクロホンに到来する信号とm番目のマイクロホンで観測されるi番目の音源からの信号との差に対応するエラー項et,f (i,m)と、
により定義した確率モデルであり、
上記モデルパラメータは、上記音源のクリーン音声信号st,f (i)と上記伝達関数βf (i,m)と上記エラー項et,f (i,m)の分散σt,f (i,m)とである、
ことを特徴とする音源分離方法。 - 請求項5に記載した音源分離方法において、
更に、反復処理過程を備え、
上記マイク別音源存在事後確率推定過程は、上記マイクロホンmごとの観測信号ot,f (m)と記憶部に記憶されたモデルパラメータ^θ(i)とを入力として、当該マイクロホンmごとの観測信号ot,f (m)とモデルパラメータ^θ(i)とを上記観測信号のモデルに当てはめたときの上記観測信号ot,f (m)と上記観測信号のモデルパラメータ^θ(i)との同時確率に基づいて、上記マイクロホンmと音源iごとに音源存在事後確率^Mt,f (i,m)を推定するものであり、
上記モデルパラメータ推定過程は、上記マイクロホンmごとの観測信号ot,f (m)と上記記憶部に記憶されたモデルパラメータ^θ(i)と上記音源存在事後確率^Mt,f (i,m)とを入力として、当該マイクロホンmごとの観測信号ot,f (m)とモデルパラメータ^θ(i)とを上記観測信号のモデルに当てはめたときの上記観測信号ot,f (m)と上記観測信号のモデルパラメータ^θ(i)との同時確率の対数に、上記音源存在事後確率^Mt,f (i,m)に対応する重みを乗じた値を、全ての観測信号について足し合わせた重み付き和が大きくなるように、上記記憶部に記憶された伝達関数βf (i,m)とエラー項et,f (i,m)の分散σt,f (i,m)とクリーン音声信号st,f (i)とを更新するものであり、
上記反復処理過程は、所定の基準を満たすまで、上記マイク別音源存在事後確率推定過程と上記モデルパラメータ推定過程の処理を繰り返すものであり、
上記出力音推定過程は、上記複数チャネルの観測信号と上記音源存在事後確率と上記記憶部に記憶されたパラメータ^θ(i)とを入力として上記音源iごとの到来信号xt,f (i,m)を計算する過程、
であることを特徴とする音源分離方法。 - 請求項4乃至6の何れかに記載した音源分離方法を、コンピュータで処理するためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013171079A JP6059112B2 (ja) | 2013-08-21 | 2013-08-21 | 音源分離装置とその方法とプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013171079A JP6059112B2 (ja) | 2013-08-21 | 2013-08-21 | 音源分離装置とその方法とプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2015040934A JP2015040934A (ja) | 2015-03-02 |
| JP6059112B2 true JP6059112B2 (ja) | 2017-01-11 |
Family
ID=52695141
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013171079A Active JP6059112B2 (ja) | 2013-08-21 | 2013-08-21 | 音源分離装置とその方法とプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6059112B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6339520B2 (ja) * | 2015-04-01 | 2018-06-06 | 日本電信電話株式会社 | 音源分離装置、音源分離方法および音源分離プログラム |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008079256A (ja) * | 2006-09-25 | 2008-04-03 | Toshiba Corp | 音響信号処理装置、音響信号処理方法及びプログラム |
| JP5568530B2 (ja) * | 2011-09-06 | 2014-08-06 | 日本電信電話株式会社 | 音源分離装置とその方法とプログラム |
-
2013
- 2013-08-21 JP JP2013171079A patent/JP6059112B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2015040934A (ja) | 2015-03-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5568530B2 (ja) | 音源分離装置とその方法とプログラム | |
| JP4875656B2 (ja) | 信号区間推定装置とその方法と、プログラムとその記録媒体 | |
| KR20200145219A (ko) | 잡음 환경에 강인한 화자 인식을 위한 심화신경망 기반의 특징 강화 및 변형된 손실 함수를 이용한 결합 학습 방법 및 장치 | |
| JP4964204B2 (ja) | 複数信号区間推定装置、複数信号区間推定方法、そのプログラムおよび記録媒体 | |
| JP6723120B2 (ja) | 音響処理装置および音響処理方法 | |
| KR102087307B1 (ko) | 잔향 환경에 강인한 음원 방향 추정을 위한 심화 신경망 기반의 앙상블 음원 방향 추정 방법 및 장치 | |
| JP6594839B2 (ja) | 話者数推定装置、話者数推定方法、およびプログラム | |
| CN115668366A (zh) | 一种声学回声消除方法和系统 | |
| KR20190130533A (ko) | 음성 검출기를 구비한 보청기 및 그 방법 | |
| KR20220022286A (ko) | 잔향 제거 오토 인코더를 이용한 잔향 환경 임베딩 추출 방법 및 장치 | |
| JP5351856B2 (ja) | 音源パラメータ推定装置と音源分離装置とそれらの方法と、プログラムと記憶媒体 | |
| JP7760090B2 (ja) | ターゲット音源分離のための方法およびシステム | |
| KR101022457B1 (ko) | Casa 및 소프트 마스크 알고리즘을 이용한 단일채널 음성 분리방법 | |
| JP6059112B2 (ja) | 音源分離装置とその方法とプログラム | |
| JP6114053B2 (ja) | 音源分離装置、音源分離方法、およびプログラム | |
| Subba Ramaiah et al. | A novel approach for speaker diarization system using TMFCC parameterization and Lion optimization | |
| JP6285855B2 (ja) | フィルタ係数算出装置、音声再生装置、フィルタ係数算出方法及びプログラム | |
| JP6339520B2 (ja) | 音源分離装置、音源分離方法および音源分離プログラム | |
| EP3557576A1 (en) | Target sound emphasis device, noise estimation parameter learning device, method for emphasizing target sound, method for learning noise estimation parameter, and program | |
| Nakagome et al. | Efficient and stable adversarial learning using unpaired data for unsupervised multichannel speech separation | |
| US12417777B2 (en) | Information processing device and method for outputting a target sound signal from a mixed sound signal | |
| WO2019208137A1 (ja) | 音源分離装置、その方法、およびプログラム | |
| JP2010181467A (ja) | 複数信号強調装置とその方法と、プログラム | |
| Imoto et al. | Acoustic scene classification using asynchronous multichannel observations with different lengths | |
| Han et al. | Switching linear dynamic transducer for stereo data based speech feature mapping |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150629 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160624 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160705 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160729 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161206 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161208 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6059112 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
