WO2006085537A1

WO2006085537A1 - 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体

Info

Publication number: WO2006085537A1
Application number: PCT/JP2006/302092
Authority: WO
Inventors: Hiroshi Sawada; Shoko Araki; Ryo Mukai; Shoji Makino
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 2005-02-08
Filing date: 2006-02-07
Publication date: 2006-08-17
Anticipated expiration: 2007-08-08
Also published as: US20080215651A1; CN1942932A; JPWO2006085537A1; US7647209B2; EP1752969A8; CN1942932B; JP4406428B2; EP1752969A4; EP1752969A1

Abstract

　周波数領域変換部２が、複数のセンサで観測された前記混合信号を、周波数領域の混合信号に変換し、複素ベクトル生成部３が、周波数領域の混合信号を用いて複素ベクトルを生成し、正規化部４が、当該複素ベクトルの周波数依存性を排除した正規化ベクトルを生成し、クラスタリング部５が正規化ベクトルをクラスタリングし、クラスタを生成する。そして、分離信号生成部６がクラスタの情報を用いて周波数領域の分離信号を生成し、時間領域変換部７が、周波数領域の分離信号を時間領域の分離信号に変換する。

Description

信号分離装置、信号分離方法、信号分離プログラム及び記録媒体技術分野

[0001] 本発明は、信号処理の技術分野に属し、特に複数の源信号が空間内で混合された混合信号から源信号を抽出する技術に関する。

背景技術

[0002] 複数のセンサを用いることによりある信号を抽出してその他の信号を抑圧する従来の技術として、ビームフォーマ（beamformer) (ビームフォーミング（beamforming)とも呼ぶ）が広く知られている（例えば、非特許文献 1参照)。しかし、ビームフォーマでは、目的信号の方向に関する情報を必要とするため、そのような情報が得られない (または推定できな、)状況では利用しにく、と、う欠点がある。

また、より新しい別の技術としては、ブラインド信号分離（BSS : Blind Signal Separatio n)が挙げられる（例えば、非特許文献 2参照)。これは、上記ビームフォーマが必要とした情報を必要としな、と、う点で優れており、様々な状況での利用が期待されてヽる。以下、このブラインド信号分離による信号分離について説明する。

[0003] [ブラインド信号分離]

まず、ブラインド信号分離の定式ィ匕を行う。すべての信号はあるサンプリング周波数 fでサンプリングされ、離散的に表現されるものとする。また、 N個の信号が混合され s

て M個のセンサで観測されたとする。以下では、信号の発生源力センサまでの距離により信号が減衰 '遅延し、また壁などにより信号が反射して伝送路の歪みが発生しうる状況を扱う。このような状況で混合される信号は、信号源 kからセンサ q (qはセンサの番号を示す〔q= l, · ··, M〕。また、 kは信号源の番号を示す〔k= l, · ··, N〕。 ) へのインパルス応答 h (r)による畳み込み混合

qk

[0004] [数 1] x_q(t) =∑∑h_qk(r) s_k(t - r) … ( 1 )

k=l r=0 で表現できる。ここで tはサンプリング時刻を示している。また、 S (t)は、サンプリング時刻 tにおいて信号源力発せられる源信号を示しており、 X (t)は、サンプリング時刻 tにおいてセンサ qで観測される信号を示している。また、 rは掃引のための変数を示している。

一般的なインパルス応答 h (r)は、適当な時間経過後にパルス的な強い応答を持ち、時間と共に減衰していく。ブラインド信号分離の目的は、源信号 s (t),〜,s (t)や

1 N インパルス応答 h (r),-,h (r),-,h (r),-,h (r)を知らずに、観測信号 (以下「混

11 IN Ml N

合信号」と呼ぶ) X 号 s

1 ω,···,_χ ωのみから、源信

1 ω,···,8

N ωにそれぞれ対応する分離信号 y (t),〜,y (t)を求めることにある。

1 N

[0005] [周波数領域]

次に、従来のブラインド信号分離の手順について説明する。

ここでは周波数領域にぉ、て分離の操作を行う。そのためにセンサ qでの混合信号 X (t)に L点の短時間離散フーリエ変換（STFT: Short- Time Fourier Transform)を適 q

用し、周波数ごとの時間系列

[0006] [数 2]

(L/2)— 1

X_n(f,て) = ∑ x q_q(r + r)g(r)e-^^fr … （2)

r=-L/2 を求める。ここで fは周波数であり M),f/lv'-,f (L-l)/Lと離散化されている（f はサンプリング周波数)。また、 τは離散時間であり、 jは虚数単位である。さらに g(r)は窓関数である。窓関数としては、例えば、ハユング

[0007] [数 3]

などの g(0)にパワーの中心を持つ窓関数を用いる。この場合、 X (f, τ )は時刻 t= τ を中心とする混合信号 x (t)の周波数特性を表現する。なお、 X (f, τ )は Lサンプルにわたる情報を含んでいるため、すべてのてに対して X (f, τ )を求める必要はなぐ適当な間隔の τごとに X (f, τ )を求める。

周波数領域で処理を行うと、式（1)で示される時間領域での畳み込み混合が、 [0008] [数 4]

と各周波数での単純混合に近似表現でき、分離の操作が単純になる。ここで、 H (f) qk は源信号 kからセンサ qまでの周波数応答であり、 S (f, τ )は式（2)と同様な式に従つ k

て源信号 s (t)に短時間離散フーリエ変換を施したものである。ベ外ルを用いて式（ k

3)を表記すると、

[0009] [数 5]

X(f^)=∑H_k(f)S_k(f,r) … (4)

k=l となる。ここで、 X(f, τ )=[X (f, τ ) -,Χ (f, τ )]^Tは混合信号ベクトル、 H (f)=[H (f) ,

1 k lk

••·,Η (f)]^Tは信号源 kから各センサへの周波数応答をまとめたベクトルである。なお k

、 W^Tは Wの転置ベクトルを示す。

[独立成分分析による信号分離]

ブラインド信号分離手法の 1つとして、独立成分分析（ICA:Independent Component Analysis) による信号分離がある。この ICAによる手法では、混合信号ベクトル X(f, τ )のみから、 Ν行 Μ列の分離行列 W(f)及び分離信号ベクトル

Y(f, r)=W(f)X(f, τ) ·'·(5)

を算出する。ここで、分離行列 W(f)は、分離信号ベクトル Y(f,て )=[Y (f,て ) ,...,Y (f,

1 N τ)]^Τの各要素 (分離信号) Y (f, T),...,Y て）が互いに独立になるように算出され

1 Ν

る。そのためのアルゴリズムには、非特許文献 4に記載されているものなどがある。

[0010] ICAでは信号の独立性に着目して分離を行うため、得られる分離信号 Y (f, τ )

1

Y (f, τ )には、順序の任意性がある。信号の順序が入れ替わってもそれらの独立性

Ν

は保たれるからである。この順序の任意性の問題は、パーミュテーシヨン（permutation )の問題と呼ばれ、周波数領域での信号分離において非常に重要な問題である。そして、このパーミュテーシヨンの問題は、同じ源信号 S (f, τ )に対応する分離信号 Y (f k P

, τ )の添字 p力すべての周波数 fで同じになるように解決されなければならない。このパーミュテーシヨン問題を解決する従来手法として、例えば非特許文献 5に示されるものがある。この手法では、選択された 2つのセンサ（センサペア）の位置を基準として信号源の位置に関する情報 (方向と距離比)を推定する。そして、複数のセンサペアでの推定値を統合することで、より詳細な位置情報が得られる。そして、これらの位置情報としての推定値をクラスタリングし、同じクラスタに属する推定値は同じ信号源に対応するものとみなしてパーミュテーシヨン問題を解決する。

[0011] [時間周波数マスクによる信号分離]

また、他のブラインド信号分離手法として、時間周波数マスクによる方法がある。この手法は、信号源の数 Nとセンサ数 Mが M< Nの関係にある場合でも有効な信号分離抽出手法である。

この手法では信号のスパース性を仮定する。スパースとは、信号が殆どの離散時間 τにおいて 0であることを指す。信号のスパース性は、例えば、周波数領域での音声信号で確認される。信号のスパース性と相互独立性を仮定することで、複数の信号が同時に存在していても、各時間周波数ポイント (f, τ )では互いに重なって観測される確率が低いことを仮定できる。よって、各時間周波数ポイント (f, τ )の各センサにおける混合信号は、その時間周波数ポイント (f, τ )でアクティブな 1つの信号 s (f, τ )の

Ρ

み力成ると仮定できる。よって、混合信号ベクトルを適当な特徴量によりクラスタリングし、各クラスタ Cのメンバの時間周波数 (f, τ )に対応する混合信号 X (f, τ )を抽出 k

する時間周波数マスク M (f, τ )を推定し、

k

Y (f, τ ) =Μ (f, τ ) Χ (f, τ )

k k Q'

により、各信号を分離抽出する。ここで、 X (f, τ )は混合信号のうちの 1つであり、 Q ' Ε{1 , · · · ,Μ}である。

[0012] クラスタリングに用いる特徴量としては、例えば、 2つのセンサ（センサ qと基準センサ Q〔なお、 Qを基準値と呼び、基準値 Qに対応するセンサを基準センサ Qと表記する。〕）における混合信号の位相差

[0013] [数 6]

X_Q (f, t)

φ(ΐ, νη) = Ζ ^q … （8 )

Xo (f,て）力計算される信号の推定到来方向（Direction of Arrival ： DOA)

[0014] [数 7]

0(f,r) = cos ¹ ぃノ ~ · · · ( 9 )

2π - ΐ · ά を例示できる（例えば、非特許文献 3参照)。なお、 dはセンサ qと基準センサ Qとの距離であり、 cは信号速度である。また、クラスタリングには、 k-means法 (例えば、非特許文献 6参照）等を用いることができる。また、時間周波数マスク M (f, τ )としては、例え

k

ばそれぞれのクラスタ Cに属するメンバの平均値 0 〜 θ 〜 , · · ·, Θ 〜を求め、

k 1 2 N

[0015] [数 8]

otnerwise のようにして生成したものを用いることができる。ここで Δは信号を抽出する範囲を与える。この方法では、 Δを小さくすると、よい分離抽出性能が得られるが非線形型歪みは大きくなる。また、 Δを大きくすると、非線形型歪みは減少するが分離性能が劣化する。

その他、クラスタリングの特徴量として、 2つのセンサ（センサ qと基準センサ Q)における混合信号の位相差 (式 (8) )や両者のゲイン比

[0016] [数 9]

X_a (f,て)

α(ί, τ) =

X_Q (f,て) を用いてもよい。

非特許文献 1 : B. D. Van Veen and K. M. Buckley, Beamforming: a versatile approa ch to spacial filtering," IEEE ASSP Magazine, pp. 4-24, April 1988

非特許文献 2 : S. Haykin, eds, "Unsupervised Adaptive Filtering," John-Wiley & Son s, 2000, ISBN 0-471-29412-8

非特許文献 3 : S. Araki, S. Makino, A. Blin, R. Mukai, and H. Sawada, "Underdeterm ined blind separation for speech in real environments with sparseness and ICA, in P roc. ICASSP 2004, vol. Ill, May 2004, pp. 881-884

非特許文献 4 : A. Hyvarinen and J. Karhunen and E. Oja, "Independent Component Analysis," John Wiley & Sons, 2001, ISBN 0-471-40540

非特許文献 5 : R. Mukai, H. Sawada, S. Araki and S. Makino, "Frequency Domain Bli nd Source Separation using Small and Large Spacing Sensor Pairs, in Proc. of ISCA S 2004, vol. V, pp.1-4, May 2004.

非特許文献 6 : R. O. Duda, P. E. Hart, and D. G. Stork, Pattern Classification, Wile y Interscience, 2nd edition, 2000

発明の開示

発明が解決しょうとする課題

[0017] しかし、上述した従来の技術では、複数のセンサによる観測信号力得られた情報を容易かつ効率的に利用して信号分離処理を行うことができないという問題点があつた。

例えば、独立成分分析による信号分離の場合、正確にパーミュテーシヨン問題を解決するためには繁雑な操作が必要となるという問題がある。すなわち、従来のパーミュテーシヨン問題の解決手法では、センサペア毎に方向と距離比とが推定される。従つて、正確にパーミュテーシヨン問題を解決するためには複数のセンサペアでの推定値を統合する必要があった。また、この推定値には誤差が含まれているが、より誤差が少な!/、と思われるセンサペアを優先的に用いたり、誤差をうまく吸収できるように統合方法を工夫したりする必要があった。さらに、この従来手法では、信号源の位置に関する情報を推定する必要性から、センサの位置情報をあらかじめ取得しておかなければならないという問題点もあった。これはセンサを不規則に配置する場合に不利である。また、たとえセンサを規則的に配置するとしても、配置情報を厳密に知ることは困難であり、より正確なパーミュテーシヨン問題の解決のためにはキヤリブレーションなどの操作を必要とする。

[0018] また、従来の時間周波数マスクによる信号分離手法の場合、センサが 2個の場合のための手法しか提案されておらず、センサが 3個以上ある場合であっても、そのうち特定の 2つのセンサ q, Qのみの情報しか用いずに特徴量を計算していた。これは次元の低下を意味し、全てのセンサを用いる場合に比べて情報量が欠落する。そのため、全てのセンサの情報を効率的に使えず性能に限度があった。また、全てのセンサの情報を有効利用するには、例えば、非特許文献 5にならつて、複数のセンサペアで求めた特徴量を統合することも可能であろうが、この統合のためには、特徴量抽出のための更なる処理が必要であり、より統合誤差が少ないと思われるセンサペアを優先的に用いるなど、統合の際に工夫する必要があると思われる。さらに、この手法でも、センサの厳密な配置情報をあら力じめ知っておかなければならないという問題点がある。これは、センサを自由に配置する場合に不利である。また、たとえ規則的に配置するとしても、配置情報を厳密に知ることは困難であり、より正確な信号抽出のためにはキャリブレーションなどの操作を必要とする。

[0019] さらに、ブラインド信号分離の処理の基本は、センサで観測された混合信号を分離して、複数の分離信号を出力することである。しかし、すべての分離信号が重要なわけではなぐ一部の分離信号のみに目的とする目的信号が含まれていることもある。そのような場合、目的信号が含まれている分離信号を選択する必要があるが、従来のブラインド信号分離では、どの分離信号に目的信号が含まれているかという情報までは提供されない。従って、何らかの別の手段によって、どの分離信号に目的信号が含まれて、るかを判定しなければならな!/、。

[0020] 本発明はこのような点に鑑みてなされたものであり、複数のセンサによる観測信号力得られた情報を容易かつ効率的に利用して信号分離処理を行うことが可能な技術を提供することを目的とする。

課題を解決するための手段

[0021] 本発明では、上記課題を解決するために、まず、周波数領域変換部が、複数のセンサで観測された混合信号を、周波数領域の混合信号に変換する。次に、正規化部力当該周波数領域の混合信号を用いて生成された複素ベクトルを正規化し、当該複素ベクトルの周波数依存性を排除した正規化ベクトルを生成する。次に、クラスタリング部力当該正規ィ匕ベクトルをクラスタリングし、クラスタを生成する。そして、このクラスタを用いて信号分離処理を行う。

ここで、当該クラスタの生成には、混合信号を観測する各センサの厳密な位置情報を、入力情報として直接用いることは必要としない。また、各クラスタは、各信号源の位置に依存する情報に基づき形成される。これらより、本発明では、各センサの厳密な位置情報を用いることなぐ信号分離処理が可能となる。

[0022] また、本発明において好ましくは、正規ィ匕部は、複素ベクトルが具備する特定の 1 つの要素を基準として当該複素ベクトルの各要素の偏角を正規ィヒする第 1正規ィ匕部と、第 1正規ィ匕部で正規化された各要素の偏角を周波数に比例した値で除算する第 2正規化部とを有する。

これらの正規化後の複素ベクトルは、信号源の位置に依存したクラスタを形成する。これにより、各センサの厳密な位置情報を用いることなぐ信号分離処理を行うことが可能となる。

[0023] また、本発明において好ましくは、正規ィ匕部は、第 2正規化部で正規化された各要素からなるベクトルのノルムを所定の値に正規ィ匕する第 3正規ィ匕部をさらに有する。これらの正規化後の複素ベクトルは、信号源の位置に依存したクラスタを形成する。また、第 2正規ィ匕された各要素力もなるベクトルのノルムを正規ィ匕することにより、クラスタリングの処理が簡略ィ匕される。

また、好ましい第 1の本発明では、まず、周波数領域変換部が、複数のセンサで観測された混合信号を、周波数領域の混合信号に変換する。次に、分離行列算出部力周波数領域の混合信号を用いて、周波数毎に分離行列を算出し、逆行列算出部が、分離行列の一般ィ匕逆行列を算出する。次に、基底ベクトル正規化部が、一般化逆行列を構成する基底ベクトルの正規化を行い、正規化基底ベクトルを算出する。次に、クラスタリング部力正規ィ匕基底ベクトルをクラスタリングし、クラスタを生成する。その後、順列算出部が、クラスタの中心ベクトルと正規ィ匕基底ベクトルとを用い、分離行列の要素を並び替えるための順列を算出する。なお、基底ベクトルは、複素ベクトルに含まれる概念である。

[0024] この第 1の本発明では、基底ベクトルを正規ィ匕してクラスタリングし、パーミュテーシヨン問題解決のための順列を算出する。そのため、このクラスタリングに際し、センサの位置情報をあら力じめ取得しておく必要がない。さらに、この好ましい本発明では、正規ィ匕基底ベクトルのすべての要素を対象としてクラスタリングを行、、その結果からパーミュテーシヨン問題解決のための順列を算出する。そのため、従来のように推定結果を統合するための操作を必要としな、。

また、当該第 1の本発明において、より好ましくは、基底ベクトル正規化部は、基底ベクトルの周波数依存性を排除する正規化を行う。そして、より好ましくは、当該基底ベクトルの周波数依存性を排除する正規化は、基底ベクトルが具備する特定の 1つの要素を基準として当該基底ベクトルの各要素の偏角を正規化し、さらに、各要素の偏角を周波数に比例した値で除算する正規ィ匕である。このような正規ィ匕により、信号源の位置に依存したクラスタの形成が可能となる。

[0025] また、当該第 1の本発明において、より好ましくは、基底ベクトルの周波数依存性を排除する正規化は、基底ベクトル A (f) (p = l, ..., Ν、 Νは信号源の数)の各要素 A

P OP

(f) (q= l,…， M、 Mは混合信号を観測するセンサの数）に対し、

[0026] [数 10]

.arg[A_qp(f)/A_Qp(f)]

A p'i H Aqpi l exp ( 10)

J一 4fc-^]d の演算を行う正規ィ匕である。ただし、 expをネピア数とし、 arg[ ' ]を偏角とし、 fを周波数とし、 jを虚数単位とし、 cを信号の伝達速度とし、 Qを M以下の自然数から選択された基準値とし、 dを実数とする。すなわち、式（10)の演算によって行われる正規ィ匕は、基底ベクトルが具備する特定の 1つの要素を基準として当該基底ベクトルの各要素の偏角を正規化し、さらに、各要素の偏角を周波数に比例した値で除算する正規化である。この正規ィ匕により、周波数への依存性を排除できる。また、当該正規化には、センサの厳密な配置情報を必要としない。

[0027] また、上述の式（10)の実数 dは、要素 A (f)に対応する基準センサ Qと他のセンサ

QP

との最大距離 d であることが望ましい。クラスタリングの精度が一般的に向上するか max

らである。この詳細は後述する。

また、第 1の本発明において好ましくは、基底ベクトルを周波数に依存しない周波数正規化ベクトルに正規化し、この周波数正規ィ匕ベクトルをノルムが規定値をとる正規化基底ベクトルに正規化する。以上の二段階の正規化によって生成された正規化基底ベクトルは、周波数に依存せず、信号源の位置のみに依存する。なお、ノルムの正規化により、クラスタリングの処理が簡略ィ匕できる。

[0028] さらにまた、第 1の本発明において好ましくは、分離信号のエンベロープ (分離信号の絶対値の包絡線）とクラスタの中心ベクトルと正規ィ匕基底ベクトルとを用いて順列を算出する。これにより、より精度よくパーミュテーシヨン問題を解決することができる。また、好ましい第 2の本発明では、周波数領域変換部が、複数のセンサで観測された混合信号を周波数領域の混合信号に変換し、信号分離部が、周波数領域の混合信号を用い、周波数毎に分離行列と分離信号とを算出する。そして、目的信号選択部が、複数の分離信号から、目的信号を含むものを選択信号として選択する。その手順は、分離行列の一般ィ匕逆行列の列である基底ベクトルを正規ィ匕し、その正規ィ匕された基底ベクトルをクラスタリングし、そのクラスタの分散を指標として選択信号を決定するものである。なお、分離行列が正方行列の場合、「一般ィ匕逆行列」は逆行列に相当する。すなわち、ここでの一般ィ匕逆行列は、通常の逆行列をも含む概念である。

[0029] クラスタの分散を指標とすることで、センサに近い信号を目的信号として位置付け、そのような目的信号を含む分離信号を選択信号として選び出すことができる。その理由を以下に述べる。ここで、基底ベクトルの正規化は、複数の信号源から発せられた信号の畳み込み混合を所定のモデル (例えば、近距離場モデル）に近似した場合に、正規化された基底ベクトルが信号源の位置のみに依存したクラスタを形成するように行われる。しかし、実環境では、このようなモデルに反映されない様々な因子が存在する。例えば、近距離場モデルでは、信号が壁などに反射することによって生じる伝送歪みが反映されない。このような実環境とモデルとの乖離は、信号源力センサまでの距離が大きいほど大きくなり、センサに近い信号ほど小さくなる。従って、センサに近い信号ほど実環境に近い条件で正規ィ匕ができ、実環境とモデルとの乖離に起因するクラスタの分散を小さくできる。好ましい第 2の本発明では、この関係に着目し、クラスタの分散の大きさを指標として、センサに近い信号である目的信号を含む選択信号を抽出する。以上の操作により、目的信号を抽出し、他の妨害信号をある程度抑圧することができる。

[0030] しかし、分離行列及び分離信号の算出を独立成分分析 (ICA: Independent Compo nent Analysis)で行う場合、以上の処理によって完全に抑制できる妨害信号の数はセンサの数から 1を引いた数までである。すなわち、妨害信号の数がそれ以上の場合は抑圧しきれない残留成分が残る。そのため、本発明において好ましくは、更に、マスク生成部が、周波数領域の混合信号と基底ベクトルとを用いて時間周波数マスクを生成し、マスキング部が、この時間周波数マスクを、選択された選択信号に適用する。これにより、信号源の数がセンサ数より多い場合でも、選択信号に残留した妨害信号をより良く抑圧することができる。

[0031] 更に、第 2の本発明において好ましくは、マスク生成部は、周波数領域の混合信号を用いて白色化行列を生成し、白色化行列を用い、周波数領域の混合信号を要素とする混合信号ベクトルを変換した白色化混合信号ベクトルと、基底ベクトルを変換した白色化基底ベクトルとを算出し、白色化混合信号ベクトルと白色化基底ベクトルとがなす角度を時間周波数毎に算出し、この角度を要素とする関数を用いて時間周波数マスクを生成する。この時間周波数マスクを選択信号に適用することにより、選択信号に残留した妨害信号を更に抑圧できる。

[0032] また更に、第 2の本発明において好ましくは、白色化行列が、周波数を fとし、離散時間をてとし、混合信号ベクトルを X(f, τ )とし、ベクトル *を時間平均したベクトルをく *〉とし、ベクトル *の複素共役転置ベクトル (各要素の複素共役を採り転置したベタトル)を *^Ηとし、 R(f)=<X(f, τ ) 'X(f, τ )^H〉とした場合における V(f)=R(f)^_1/2である。そして、 Z(f,て )=V(f) -X(f, τ )の演算により、白色化混合信号ベクトル Z(f, τ )を算出し、基底ベクトルを A(f)とした場合における B(f)=V(f) 'A(f)の演算により、白色化基底ベクトル B(f)を算出する。また、ベクトル *の絶対値を I * Iとし、ベクトル *のノルムを II * IIとした場合における Θ (f,て )=cos^_1(|B^H(f) -Z(f, τ )|/ || B(f) I卜 II Z (f, z ) II)の演算により、角度 Θ て）を算出し、 a, g, Θ を実数とした場合における

Τ

ロジスティック関数 Μ ( Θ (f, z )) = a /(l+e^g- ^{(θ ¾τ)}" ^ΘΤ))を時間周波数マスクとして算出する。この時間周波数マスクを、抽出した選択信号に適用することにより、選択信号に残留した妨害信号を更に抑圧できる。

[0033] また、第 2の本発明において好ましくは、目的信号選択部は、基底ベクトルの周波数依存性を排除する正規化を行う。第 2の本発明において、より好ましくは、基底べクトルの周波数依存性を排除する正規化は、基底ベクトルが具備する特定の 1つの要素を基準 sとして当該基底ベクトルの各要素の偏角を正規ィ匕し、さらに、各要素の偏角を周波数に比例した値で除算する正規ィ匕である。またさらに、第 2の本発明において、好ましくは、基底ベクトルの周波数依存性を排除する正規化は、基底ベクトル A (

P

f) (pは自然数)の各要素 A (f) (q= l, ..., Μ、 Μは混合信号を観測するセンサの数

QP

)に対し、

[0034] [数 11]

の演算を行う正規ィ匕である。ただし、 expをネピア数とし、 arg [ ' ]を偏角とし、 fを周波数とし、 jを虚数単位とし、 cを信号の伝達速度とし、 Qを M以下の自然数から選択された基準値とし、 dを実数とする。このような正規ィ匕により、複数の信号源から発せられた信号の畳み込み混合を所定のモデルに近似した場合に、正規ィ匕された基底べタトルが信号源の位置に依存したクラスタを形成することとなる。その結果、上述のようにクラスタの分散の大きさを指標として、目的信号が含まれる分離信号を選択することが可能となる。なお、当該正規ィ匕には、センサの厳密な配置情報を必要としない

[0035] またさらに、上述の式（11)の実数 dは、基準センサ Qと他のセンサとの最大距離 d ma であることが望ましい。クラスタリングの精度が一般的に向上するからである。この詳細は後述する。

また、第 2の本発明において好ましくは、目的信号選択部は、分散が最小となるクラスタを選択し、選択されたクラスタに対応する分離信号を目的信号が含まれるものとして選択する。これにより、モデルからの乖離が最も少ない信号 (例えば、センサに最も近、信号)を目的信号として抽出することができる。

[0036] また、好ましい第 3の本発明では、まず、周波数領域変換部が、複数のセンサで観測された混合信号を周波数領域の混合信号に変換する。次に、ベクトル正規化部が、周波数領域の混合信号から構成される混合信号ベクトルの正規化を行い、正規ィ匕ベクトルを算出する。そして、クラスタリング部力正規ィ匕ベクトルをクラスタリングし、クラスタを生成する。その後、分離信号生成部が、 k番目のクラスタに属する正規ィ匕べクトルの時間周波数に対応する混合信号ベクトルから所定番目の要素を抽出し、これを k番目の要素とした分離信号ベクトルを生成する。

[0037] ここで、第 3の本発明では、全てのセンサで観測された混合信号を正規ィ匕してクラスタリングを行い、各クラスタの情報を用いて分離信号ベクトルを生成している。これは、全てのセンサの情報を同時に用いて分離信号を抽出していることを意味する。また、この処理では、センサの厳密な配置情報を必要としない。以上より、第 3の本発明では、センサの厳密な配置情報を必要とすることなぐ全ての観測信号から得られた情報を容易かつ効率的に利用して信号分離を行うことができる。

また、第 3の本発明において、好ましくは、ベクトル正規ィ匕部は、周波数領域の混合信号から構成される混合信号ベクトルの周波数依存性を排除する正規化を行う。また、さら〖こ好ましくは、混合信号ベクトルの周波数依存性を排除する正規化は、混合信号ベクトルが具備する特定の 1つの要素を基準として当該基底ベクトルの各要素の偏角を正規化し、さらに、各要素の偏角を周波数に比例した値で除算する正規ィ匕である。またさらに好ましくは、混合信号ベクトルの周波数依存性を排除する正規ィ匕は、混合信号ベクトルの各要素 X (f, τ ) (q= l, ..., Μ、 Μは混合信号を観測するセンサの数）に対し、

[0038] [数 12]

の演算を行う正規ィ匕である。ただし、 expをネピア数とし、 arg [ ' ]を偏角とし、 jを虚数単位とし、 cを信号の伝達速度とし、 Qを M以下の自然数から選択された値とし、 dを実数とし、 fを周波数とし、てを離散時間とする。これにより、周波数の依存性を排除できる。これにより、信号源の位置に依存したクラスタを形成できる。なお、当該正規化には、センサの厳密な配置情報を必要としな!/、。

[0039] また、上述の式（12)の実数 dは、要素 X (f, τ )に対応するセンサと他のセンサと

Q

の最大距離 d であることが望ましい。クラスタリングの精度が一般的に向上するから max

である。この詳細は後述する。

また、第 3の本発明において、好ましくは、ベクトル正規ィ匕部は、混合信号ベクトルの周波数依存性を排除する正規化と、ノルムを規定値にする正規化とを行う。これにより、クラスタリングの処理が簡略ィ匕される。

発明の効果

[0040] 以上のように、本発明では、複数のセンサによる観測信号力得られた情報を容易かつ効率的に利用して信号分離処理を行うことができる。

例えば、第 1の発明では、厳密なセンサ配置に係る情報の事前取得や煩雑な操作を必要とせずに正確にパーミュテーシヨン問題を解決できる。また、第 2の発明では、目的信号の方向に関する情報を知ることなぐ複数の信号源から発せられた信号が混合された混合信号から目的信号を抽出することができる (たとえ N>Mであったとしても)。また、第 3の発明では、センサの厳密な配置情報を必要とすることなぐ全ての観測信号力も得られた情報を容易かつ効率的に利用して信号分離を行うことができる（たとえ N>Mであったとしても）。

図面の簡単な説明

[0041] [図 1]図 1は、本発明の原理を備えた信号分離装置の機能構成を例示したブロック図である。

[図 2]図 2は、第 1の実施の形態における信号分離装置のハードウェア構成を例示したブロック図である。

[図 3]図 3は、第 1の実施の形態における信号分離装置のブロック図の例示である。

[図 4]図 4Aは、図 3におけるパーミュテーシヨン問題解決部の詳細を例示したブロック図である。図 4Bは、図 4Aの基底ベクトル正規ィ匕部の詳細を例示したブロック図である。

[図 5]図 5は、第 1の実施の形態における信号分離装置の処理の全体を説明するためのフローチャートである。

[図 6]図 6は、第 1の実施の形態の正規ィ匕処理の詳細を説明するためのフローチヤ一トである。

[図 7]図 7Aは、 d Z2≥dである場合における、ノラメータ d毎の正規ィ匕基底ベクトル max

の要素 A " (f)とその偏角 arg[A " (f)]との関係を説明するための複素平面図である。図 7Bは、 d /2< d< d である場合における、パラメータ d毎の正規ィ匕基底べタトルの要素 A " (f)とその偏角 arg[A " (f)]との関係を説明するための複素平面図である。

[図 8]図 8Aは、 d=d である場合における、パラメータ d毎の正規ィ匕基底ベクトルの要素 A " (f)とその偏角 arg[A " (f)]との関係を説明するための複素平面図である。図 8Bは、 d>d である場合における、パラメータ d毎の正規ィ匕基底ベクトルの要素 A

max q

" (f)とその偏角 arg[A " (f)]との関係を説明するための複素平面図である。

[図 9]図 9は、第 2の実施の形態における信号分離装置のブロック図の例示である。

[図 10]図 10Aは、図 9におけるパーミュテーシヨン問題解決部の詳細を例示したブロック図である。図 10Bは、図 10Aの順列修正部の詳細を例示したブロック図である。

[図 11]図 11は、第 2の実施の形態における信号分離装置の処理の全体を説明するためのフローチャートである。

[図 12]図 12は、図 11におけるステップ S58の例を説明するためのフローチャートである。

[図 13]図 13は、図 11におけるステップ S58の例を説明するためのフローチャートである。

[図 14]図 14Aは、第 1の実施の形態及び第 2の実施の形態による音源分離実験条件を示した図である。図 14Bは、第 1の実施の形態及び第 2の実施の形態による音源分離実験結果を示した図である。

[図 15]図 15Aは、第 1の実施の形態及び第 2の実施の形態による音源分離実験条件を示した図である。図 15Bは、第 1の実施の形態及び第 2の実施の形態による音源分離実験結果を示した図である。

[図 16]図 16は、第 3の実施の形態における信号分離装置の構成を例示したブロック図である。

[図 17]図 17Aは、図 16における目的信号選択部の詳細構成を例示したブロック図である。図 17Bは、図 17Aにおける基底ベクトルクラスタリング部の詳細構成を例示したブロック図である。

[図 18]図 18Aは、図 16における時間周波数マスキング部の詳細構成を例示したプロック図である。図 18Bは、図 18Aにおけるマスク生成部の詳細を例示したブロック図である。

[図 19]図 19は、第 3の実施の形態における信号分離処理の全体を説明するためのフローチャートである。

[図 20]図 20は、第 3の実施の形態における目的信号選択部の処理の詳細を説明するためのフローチャートである。

[図 21]図 21Aは、ステップ S112の周波数正規ィ匕の詳細を説明するためのフローチヤートである。図 21Bは、ステップ S113のノルム正規化の詳細を説明するためのフロ一チャートである。

[図 22]図 22は、選択信号の選択手順 (ステップ S 115)の詳細を例示したフローチヤートである。

[図 23]図 23は、図 19におけるステップ S104の詳細を説明するためのフローチャートである。

[図 24]図 24Aは、二種類の実数パラメータ Θ , gに対し、式 (46)に従って算出され

T

た時間周波数マスク M (f, τ )を例示した図である。図 24Βは、ある時間周波数位置 (f, τ )において目的信号 (1 (f) =1とする）に対応するベクトル V(f) 'H (f)の他に、妨害信

1

号に対応ベクトルする V (f) 'H (f) , V(f) -H (f)が共存することを示した図である。

2 3

[図 25]図 25は、第 4の実施の形態における信号分離装置のブロック図の例示である

[図 26]図 26は、第 4の実施の形態における信号分離装置の処理を説明するためのフローチャートである。

[図 27]図 27は、第 5の実施の形態における信号分離装置のブロック図の例示である

[図 28]図 28Aは、図 27における時間周波数マスキング部の詳細構成を示すブロック図である。図 28Bは、図 28Aのマスク生成部の詳細構成を示すブロック図である。

[図 29]図 29は、第 5の実施の形態における時間周波数マスクの生成処理を説明するためのフローチャートである。

[図 30]図 30Aは、図 29におけるステップ S171の詳細を説明するためのフローチヤートである。図 30Bは、図 29におけるステップ S172の詳細を説明するためのフローチャートである。

[図 31]図 31Aは、第 3の実施の形態及び第 4の実施の形態による効果を示すための実験条件を示した図である。図 31Bは、 ICAのみの場合 (第 4の実施の形態）と、 ICA と時間周波数マスキングの両方を組み合わせた場合 (第 3の実施の形態）の SIRの平均改善量を示す表である。

[図 32]図 32は、第 6の実施の形態における信号分離装置のブロック図の例示である

[図 33]図 33は、図 32における信号分離部の詳細を例示したブロック図である。

[図 34]図 34は、第 6の実施の形態における信号分離装置の処理の全体を説明するためのフローチャートである。

[図 35]図 35Aは、図 34に示したステップ S202の処理の詳細を説明するためのフロ一チャートである。図 35Bは、図 34に示したステップ S203の処理の詳細を説明するためのフローチャートである。

[図 36]図 36は、図 34に示したステップ S205の処理の詳細を説明するためのフローチャートである。

[図 37]図 37Aは、 d Z2≥dの場合における、パラメータ d毎のノルム正規化ベクトル max

X" (f, て )の要素 X " (f, τ )と、その偏角 arg[X " (f, て；)]との関係を説明するための複素平面図である。図 37Bは、 d /2< d< d の場合における、パラメータ d毎のノル max max

ム正規ィ匕ベクトル X" (f, τ )の要素 X " (f, τ )と、その偏角 arg[X " (f, τ；)]との関係を説明するための複素平面図である。

[図 38]図 38Aは、 d=d の場合における、パラメータ d毎のノルム正規化ベクトル X" max

(f, て )の要素 X " (f, て )と、その偏角 arg[X " (f, て；)]との関係を説明するための複素平面図である。図 38Bは、 d>d の場合における、パラメータ d毎のノルム正規化べ max

タトル X" (f, τ )の要素 X " (f, τ )と、その偏角 arg[X " (f, τ；)]との関係を説明するための複素平面図である。

[図 39]図 39Aは、第 6の実施の形態による音源分離実験条件を示した図である。図 3

9Bは、第 6の実施の形態による音源分離実験結果を示した図である。

[図 40]図 40Aは、第 6の実施の形態による音源分離実験条件を示した図である。図 4 OBは、第 6の実施の形態による音源分離実験結果を示した図である。

[図 41]図 41Aは、第 6の実施の形態による音源分離実験条件を示した図である。図 4

1Bは、第 6の実施の形態による音源分離実験結果を示した図である。

符号の説明

[0042] 1, 10, 200, 1001, 1200, 1300, 2001 信号分離装置

発明を実施するための最良の形態

[0043] 以下、本発明の実施の形態を図面を参照して説明する。

〔原理〕

まず、本発明の原理について説明する。

図 1は、本発明の原理を備えた信号分離装置 1の機能構成を例示したブロック図である。なお、後述のように、信号分離装置 1は、例えば、公知のノイマン型のコンビュータに所定のプログラムを実行させることにより構成される。

信号分離装置 1は、複数の信号源から発せられた源信号の混合からなる混合信号を当該源信号に分離する装置である。図 1に例示するように、信号分離装置 1は、周波数領域変換部 2と、複素ベクトル生成部 3と、正規化部 4と、クラスタリング部 5とを有している。ここで、正規ィ匕部 4は、複素ベクトルが具備する特定の 1つの要素を基準として当該複素ベクトルの各要素の偏角を正規ィ匕する第 1正規ィ匕部 4aと、第 1正規ィ匕部 4aで正規化された各要素の偏角を周波数に比例した値で除算する第 2正規ィ匕部 4bと、第 2正規ィ匕部 4bで正規ィ匕された各要素力なるベクトルのノルムを所定の値に正規化する第 3正規化部 4cとを有する。なお、第 1正規化部 4a及び第 2正規化部 4b により、複素ベクトルの周波数依存性が排除される (周波数正規化)。

[0044] 信号分離装置 1によって信号分離処理を行う場合、まず、複数のセンサで観測された混合信号 (時間領域の信号)が周波数領域変換部 2に入力される。周波数領域変換部 2は、短時間離散フーリエ変換等によって、複数のセンサで観測された混合信号 (時間領域の信号)を、周波数領域の混合信号に変換する。次に、複素ベクトル生成部 3が、当該周波数領域の混合信号を用い、複素数の要素からなる複素ベクトルを生成する。次に、正規化部 4が、当該複素ベクトルを正規化し、当該複素ベクトルの周波数依存性を排除した正規化ベクトルを生成する。 [0045] 図 1の例の正規ィ匕では、まず、第 1正規化部 4aが、時間周波数毎に、当該複素べタトルが具備する特定の 1つの要素を基準として当該複素ベクトルの各要素の偏角を正規化する。これにより、複素ベクトルの各要素の偏角は、源信号の位相や振幅に依存せず、各センサに対する信号源の相対位置や周波数のみに依存することになる (詳細は後述)。次に、第 2正規化部 4bが、第 1正規化部 4aで正規化された各要素の偏角を周波数に比例した値で除算する。これにより、各複素ベクトルの各要素の周波数依存性が排除され、複素べ外ルは、各センサに対する各信号源の相対位置のみに依存したものに正規化される。さらに、第 3正規化部 4cが、第 2正規化部 4bで正規化された各要素からなるベクトルのノルムを所定の値に正規化する。

[0046] 次に、クラスタリング部 5が、このような正規ィ匕が行われた正規ィ匕ベクトルのクラスタリングを行い、クラスタを生成する。これらのクラスタは、各センサに対する各信号源の相対位置のみに依存したものになる。分離信号生成部 6は、これらのクラスタを利用して各種の信号分離処理を行い、周波数領域の分離信号を生成する。最後に、時間領域変換部が、周波数領域の分離信号を時間領域の分離信号に変換する。上述のように、これらのクラスタを生成するために、各センサの厳密な位置情報を事前に取得しておく必要はない。また、これらのクラスタの生成には、全てのセンサでの観測信号の情報が用いられている。すなわち、本発明では、複数のセンサによる観測信号力も得られた情報を容易かつ効率的に利用して信号分離処理を行うことができる。

[0047] なお、ノルムを正規ィ匕しなくても、クラスタリングの方法を工夫することにより、各センサに対する各信号源の相対位置のみに依存したクラスタを生成することは可能である。しかし、クラスタリングの処理を簡略ィ匕するため、第 3正規ィ匕部 4cによるノルムの正規ィ匕を行うことが望ましい。

以下、本発明の各実施の形態を詳細に説明する。

〔第 1の実施の形態（「第 1の本発明」の例)〕

まず、本発明における第 1の実施の形態について説明する。

[0048] 本形態は、上述の原理により、厳密なセンサ配置に係る情報の事前取得や煩雑な操作を必要とせずに正確にパーミュテーシヨン問題を解決する形態である。なお、本形態では、後述する「基底ベクトル」が上述の「複素ベクトル」に相当する。

<ノヽードウエア構成 >

図 2は、第 1の実施の形態における信号分離装置 10のハードウェア構成を例示したブロック図である。

図 2に例示するように、この例の信号分離装置 10は、 CPU (Central Processing Uni t) 10a、入力部 10b、出力部 10c、補助記憶装置 10f、 RAM (Random Access Memo ry) 10d、 ROM (Read Only Memory) lOe及びバス lOgを有している。

[0049] この例の CPUlOaは、制御部 10aa、演算部 10ab及びレジスタ 10ac有し、レジスタ 10acに読み込まれた各種プログラムに従って様々な演算処理を実行する。また、この例の入力部 10bは、データが入力される入力ポート、キーボード、マウス等であり、出力部 10cは、データを出力する出力ポート、ディスプレイ等である。補助記憶装置 1 Ofは、例えば、ハードディスク、 MO (Magneto- Optical disc)、半導体メモリ等であり、本形態の信号分離処理を実行するための信号分離プログラムを格納した信号分離プログラム領域 lOfa及びセンサで観測された時間領域の混合信号等の各種データが格納されるデータ領域 10fbを有している。また、 RAMlOdは、例えば、 SRAM (S tatic Random Access Memory)、 DRAM (Dynamic Random Access Memory)等であり、信号分離プログラムが書き込まれる信号分離プログラム領域 10da及び各種データが書き込まれるデータ領域 10dbを有している。また、この例のバス 10gは、 CPU1 0a、入力部 10b、出力部 10c、補助記憶装置 10f、 RAM10d及びROM10eを通信可能に接続している。

[0050] くハードウェアとソフトウェアとの協働 >

この例の CPUlOaは、読み込まれた OS (Operating System)プログラムに従い、補助記憶装置 10fの信号分離プログラム領域 lOfaに格納されている信号分離プロダラムを、 RAMlOdの信号分離プログラム領域 10daに書き込む。同様に CPUlOaは、補助記憶装置 10fのデータ領域 10fbに格納されている時間領域の混合信号等の各種データを RAMlOdのデータ領域 10dbに書き込む。さらに、 CPUlOaは、この信号分離プログラムや各種データが書き込まれた RAMlOd上のアドレスをレジスタ 10 acに格納する。そして、 CPUlOaの制御部 10aaは、レジスタ 10acに格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示す RAMlOd上の領域力もプログラムやデータを読み出し、そのプログラムが示す演算を演算部 lOabに順次実行させ、その演算結果をレジスタ lOacに格納していく。

[0051] 図 3は、このように CPUlOaに信号分離プログラムが読み込まれることにより構成される信号分離装置 10のブロック図の例示である。また、図 4Aは、図 3におけるパーミュテーシヨン問題解決部 140の詳細を例示したブロック図であり、図 4Bは、図 4Aの基底ベクトル正規ィ匕部 142の詳細を例示したブロック図である。

図 3に例示するように、信号分離装置 10は、メモリ 100、周波数領域変換部 120、分離行列算出部 130、パーミュテーシヨン問題解決部 140、分離信号生成部 150、時間領域変換部 160及び制御部 170を有している。また、この例のパーミュテーション問題解決部 140は、逆行列算出部 141 (「複素ベクトル生成部」に対応）、基底べクトル正規ィ匕部 142 (「正規ィ匕部」に対応）、クラスタリング部 143、順列算出部 144及び並び替え部 145を有しており、基底ベクトル正規ィ匕部 142は、周波数正規化部 142a 及びノルム正規ィ匕部 142bを有している。また、周波数正規ィ匕部 142aは、第 1正規化部 142aaと第 2正規ィ匕部 142abとを有している。さらに、制御部 170は一時メモリ 1 71を有している。

[0052] ここでメモリ 100及び一時メモリ 171は、レジスタ 10ac、補助記憶装置 1 Ofのデータ領域 10fb或いは RAMlOdのデータ領域 10db等に相当する。また、周波数領域変換部 120、分離行列算出部 130、パーミュテーシヨン問題解決部 140、分離信号生成部 150、時間領域変換部 160及び制御部 170は、 CPUlOaに OSプログラムや信号分離プログラムが読み込まれることにより構成されるものである。

なお、図 3及び図 4における破線の矢印は理論上の情報の流れを示し、実線の矢印は実際のデータの流れを示す。また、これらの図において制御部 170に出入りするデータの流れに対応する矢印は省略してあり、図 4における実際のデータの流れに対応する矢印も省略してある。

[0053] <処理 >

次に、本形態の信号分離装置 10の処理について説明する。なお、以下では、 N個の源信号が混合され、 M個のセンサで観測された状況を取り扱う。また、前処理において、各センサで観測された時間領域の混合信号 x (t) (q=l,...,M)がメモリ 100の記憶領域 101に格納され、信号の伝達速度 c、 M以下の自然数から選択された基準値 Q (M個のセンサ力選択された 1つの基準センサの添字番号)及び実数 dの各パラメータが記憶領域 107に格納されているものとする。

[0054] 図 5は、第 1の実施の形態における信号分離装置 10の処理の全体を説明するためのフローチャートである。以下、この図に沿って、本形態における信号分離装置 10の処理を説明していく。

[周波数領域変換部 120の処理]

まず、周波数領域変換部 120において、メモリ 100の記憶領域 101から時間領域の混合信号 X (t)を読み出し、これらを短時間離散フーリエ変換等によって周波数毎の時系列の信号（「周波数領域の混合信号」と呼ぶ) X (f, て ) (q=l,...,M)に変換し、メモリ 100の記憶領域 102に格納する（ステップ Sl)。

[0055] [分離行列算出部 130の処理]

次に、分離行列算出部 130において、メモリ 100の記憶領域 102から周波数領域の混合信号 X (f, τ )を読み出す。周波数領域の混合信号 X (f, τ )を読み出した分離行列算出部 130は、これら力らなる混合信号ベクトル X (f, τ ) =[X (f, τ ) ,...,Χ (f,

1

て )]^Tを用い、独立成分分析 (ICA)によって、周波数毎に第 1の分離行列 W (f)と分離信号ベクトル Y (f, て ) =[Y (f, τ ) ,..., Y (f, て

1 Ν )]^Tとを算出する。そして、算出された第

1の分離行列 W (f)はメモリ 100の記憶領域 103に格納される（ステップ S2)。

[0056] ここで、分離行列算出部 130において算出された第 1の分離行列 W (f)には、順序の任意性が含まれている。よって、以下のようにパーミュテーシヨン問題解決部 140 において、第 1の分離行列 W (f)を順序の任意性を解決した第 2の分離信号 W， (f)に変更する。

[パーミュテーシヨン問題解決部 140の処理]

まず、逆行列算出部 141において、メモリ 100の記憶領域 103から第 1の分離行列 W (f)を読み出し、そのムーア ·ペンローズ (Moore-Penrose)型一般化逆行列 W+ (f) =[ A (f) ,...,A (f) ] (M=Nの場合は逆行列 W^_1 (f)に一致)を計算し、これを構成する基底

1 N

ベクトル A (f) =[A (f) ,...,A (f) ]^T (p=l，...，N)をメモリ 100の記憶領域 104に格納する (ステップ S3)。なお、 M=Nの場合、 W+(f)は逆行列 W— ^f)に一致する。

[0057] 次に、基底ベクトル正規ィ匕部 142において、メモリ 100の記憶領域 104から基底べタトル A (f) (p=l,...,N、 M),f/L,"-,f (L- 1) /L)を読み出し、これらを正規化した正規化基底ベクトル A " (f)を算出し、メモリ 100の記憶領域 106に格納する (ステップ S4)

P

。なお、基底ベクトル正規化部 142は、全ての基底ベクトル A (f) (p=l,...,N、 M),f/L,

P s

•••，f (L-l) /L)を正規ィ匕し、それらを周波数に依存せず、信号源の位置のみに依存 s

する正規化基底ベクトル A " (f)に正規化する。その結果、それらをクラスタリングした

P

際に、各クラスタが各信号源に対応するようになる。この正規ィ匕を適切に行わないとクラスタが形成されない。また、本形態における正規化は周波数正規化とノルム正規化との二段階からなる。周波数正規化は、周波数正規ィ匕部 142a (図 4B)において、基底ベクトルを周波数に依存しな、周波数正規ィ匕ベクトルに正規ィ匕するものである。ノルム正規ィ匕は、ノルム正規ィ匕部 142bにおいて、周波数正規ィ匕ベクトルをノルムが規定値 (この例では 1)をとる正規化基底ベクトルに正規化するものである。これらの正規ィ匕処理の詳細については後述する。

[0058] 次に、クラスタリング部 143において、メモリ 100の記憶領域 106から正規ィ匕基底べタトル A " (f)を読み出し、これらの正規化基底ベクトル A " (f)をクラスタリングして N個

P P

のクラスタ C (k=l，...，N)を生成し、各クラスタ Cとそれらのセントロイド（中心ベクトル） η を特定する情報をメモリ 100の記憶領域 108, 109に格納する (ステップ S5)。このクラスタリングは、例えば、各クラスタ Cの要素（正規化基底ベクトル A " (f) )と各クラスタ Cのセントロイド 7? との間の二乗和 Uの総和 U

[0059] [数 13]

u_k =∑_Av"_(f)_eCk |A_v"(f) - Ti_k||² を最小値ィ匕することを基準に行われる。この最小値化は、例えば、非特許文献 6などで解説されている k-meansクラスタリングを用いることによって効果的に行うことができる。なお、クラスタ Cのセントロイド 7} は、

[0060] [数 14] ∑_Av"(_f)e A_v"(f)/ | C_k

∑A_v"(f_)ec_k A_v (f)/ | C_k によって計算される。ここで I C Iはクラスタ Cにおける要素（正規ィ匕基底ベクトル A ' k k v

' (f) )の数である。また、ここでは、距離としてユークリッド距離の自乗を用いているが、これを一般ィ匕したミンコフスキー距離などを用いてもよい。なお、正規化基底べタトル A " (f)がクラスタを形成する理由については後述する。

P

次に、順列算出部 144において、メモリ 100の記憶領域 106から正規ィ匕基底べタトル A " (f)を、記憶領域 109から各クラスタ Cのセントロイド 7? をそれぞれ読み出す。

p k k

そして、順列算出部 144は、これらを用い、第 1の分離行列 W(f)の要素を並び替えるための順列 Π ({1,2,· ··,Ν}から {1,2,· ··,Ν}への全単射な関数)を周波数 f毎に算出し、 f

メモリ 100の記憶領域 110に格納する（ステップ S6)。なお、この順列 Πは、

f

[0061] [数 15] n_f = _argmin_n∑^||Ti_k -A_n(k) ''(f)||² … （1 3 ) によって決定される。ここで式（13)における argmin ·は、 ·を最小値ィ匕する Πを意味

Π

する。また、この式における A " (f)は、 Πによって正規化基底ベクトル A " (f)に並 n (k) k び替えられる正規化基底ベクトルを意味する。すなわち、 n (k)行目の正規化基底べタトル A " (f)は、 Πによって k列目の正規化基底ベクトル A " (f)となる。なお、式（1 n (k) f k

3)に従って順列 Πを決定する手順としては、例えば、採り得るすべての順列 Π (Ν！ f

通り）に対して

[0062] [数 16]

を算出し、その最小値に対応する Πを順列 Πとして決定する手順を例示できる。以 f

下にこの具体例を示す。

[順列 Π決定の具体例 1]

f

信号源の数 Nが 3であり、ある周波数 fにおける正規化基底ベクトル A " (f) , A " (f)

1 2

, A " (f)と各セントロイド r? , η , η との距離の自乗力以下の表に示されるものであつたとする。

[0063] [表 1]

この場合、式（13)により得られる順列は、

Π :[1,2,3]→[2,3,1]

f

となる。なぜなら、

V 一 A , '(f) - A' '(f

1 π (1) II ²= )

1 2 1 1²=o.i

V 一 A , '(f) A' '(f)

2 π (2) II ²= -

2 3 1 1²=0.2

V 一 A , '(f)

3 π (3) II ²= - A' '(f)

3 1 1 1²=0.15

という組合せが、

[数 17]

を最小とする力である (順列 Π決定の具体例 1の説明終わり）。

f

しかし、この手順は Nが大きくなると現実的ではない。そのため、その近似法として、順番に II η -A "(f) II ²を最小値化する A "(f)を重複がないように選択してい k n(k) Π (k)

き、この選択された A " (f)を正規化基底ベクトル A " (f)に移す順列を順列 Πとす n(k) k f る手順等を用いてもよい。以下、上述の [順列 Π決定の具体例 1]と同じ条件に対し、 f

この近似法を適用して順列 πを決定する手順を示す。

f

[0065] [順列 Π決定の具体例 2]

f

まず、上記の表 1の場合、距離の自乗の最小値は 0.1 (正規化基底ベクトル A " (f)

2 と各セントロイド r? との距離の自乗)であるため、 Π (1) =2を決定する。そして、正規化基底ベクトル A " (f)と各セントロイド 7? とに関連する行と列とを消すと以下のようになる。

[0066] [表 2] ' (f) Α₂' ' (f) A₃" (f) 2 0. 9 0. 2

n 3 0. 15 この表 2の場合、距離の自乗の最小値は 0. 15 (正規化基底ベクトル A "(f)と各セ

1 ントロイド r? との距離の自乗)であるため、 Π (3) =1を決定する。そして、最後に Π(

3

2)に残りの 3を割り当てる（[順列 Π決定の具体例 2]の説明終わり）。

f

次に、並び替え部 145において、メモリ 100の記憶領域 103から第 1の分離行列 W (f)を、記憶領域 110から順列 Πを読み出す。そして、並び替え部 145は、この第 1 f

の分離行列 W(f)の行を順列 Πに従って並び替えた第 2の分離行列 W' (f)を生成し f

てメモリ 100の記憶領域 111に格納する (ステップ S7)。なお、第 1の分離行列 W(f) の行を順列 Πに従って並び替えるとは、上述のムーア'ペンローズ型一般ィ匕逆行列 f

W+(f)における要素 A " (f)力 A " (f)への並び替えに対応する並び替えを、第 1 n(k) k

の分離行列 W(f)に対して行うことを意味する。すなわち、第 1の分離行列 W(f)の順 o

列 Π (k)行目が第 2の分離行列 W' (f)の k行目になるように並び替える。上述の [順 f

en

列 Π決定の具体例 1, 2]の場合、第 1の分離行列 W(f)の 2, 3, 1行目力それぞれ f

第 2の分離行列 W，（f)の 1, 2, 3行目になる。

[0067] [分離信号生成部 150の処理]

その後、分離信号生成部 150において、メモリ 100の記憶領域 102から周波数領域の混合信号 X (f, τ )を、記憶領域 111から第 2の分離行列 W' (f)を読み出す。そして、分離信号生成部 150は、周波数領域の混合信号 X (f, τ )からなる混合信号べクトル X(f,て )=[X (f, τ ),..., X (f,て )]^Tと第 2の分離行列 W' (f)とを用い、分離信号べク

1 M

トル

を算出し、これらの各要素である周波数領域の信号（「周波数領域の混合信号」と呼ぶ) Y (f, τ )をメモリ 100の記憶領域 112に格納する（ステップ S8)。

P

[0068] [時間領域変換部 160の処理]

最後に時間領域変換部 160において、メモリ 100の記憶領域 112から周波数領域の分離信号 Y (f, τ )を読み出し、これを添え字 ρ毎に (Y (f, τ )毎に)短時間逆フーリェ変換等によって時間領域の分離信号 y (t)に変換し、これらの時間領域の分離信号 y (t)をメモリ 100の記憶領域 113に格納する (ステップ S9)。

[正規化処理の詳細 (ステップ S4の詳細） ]

次に、前述した基底ベクトル正規ィ匕部 142における正規ィ匕処理の詳細 (ステップ S4 の詳細）について説明する。

[0069] 図 6は、この正規ィ匕処理の詳細を説明するためのフローチャートである。

まず、制御部 170 (図 3)においてパラメータ pに 1を代入し、これを一時メモリ 171に格納する (ステップ Sl l)。また、制御部 170においてパラメータ qに 1を代入し、これを一時メモリ 171に格納する (ステップ S12)。次に、周波数正規ィ匕部 142a (図 4)において、メモリ 100の記憶領域 107から前述のパラメータ d, c, Qを読み出し、一時メモリ 171からパラメータ p, qを読み出し、基底ベクトル A (f)の要素 A (f)に対し、

[0070] [数 18]

( 1 4 )

の演算を行い、当該演算結果 A ，（f)を周波数正規ィ匕ベクトル A，（f)の各要素 A ，（f

)としてメモリ 100の記憶領域 105に格納する (ステップ SI 3)。なお、 arg[ ' ]は偏角を意味し、 jは虚数単位を意味する。

より詳細には、まず、周波数正規ィ匕部 142aの第 1正規ィ匕部 142aaが、基底べタトル A (f)の特定の 1つの要素 A (f)を基準として当該基底ベクトル A (f)の各要素 A ( f)の偏角を、以下の演算によって正規ィ匕する。

[0071] [数 19]

Aqp " ' (f ) =1 (f ) I exp { j - argtAqp (f ) / A_Qp (f )] } … （1 5 ) 次に、周波数正規ィ匕部 142aの第 2正規ィ匕部 142ab力第 1正規化部 142aaで正規化された各要素 A '" (f)の偏角を、以下のように周波数 fに比例した値 4fc— で除算する。

[0072] [数 20]

次に、制御部 170において、一時メモリ 171に格納されたパラメータ qが q = Mを満たす力否かを判断する（ステップ S 14)。ここで q = Mでなければ、制御部 170は、 q + 1の演算結果を新たなパラメータ qの値とし、これを一時メモリ 171に格納し (ステップ S 15)、処理をステップ S 13へ戻す。一方、 q = Mであれば、制御部 170は、さらに p = Nを満たすか否かを判断する (ステップ S 16)。

[0073] ここで p=Nでなければ、制御部 170において、 p+ 1の演算結果を新たなパラメ一タ pの値とし、これを一時メモリ 171に格納し (ステップ S17)、処理をステップ S12へ戻す。一方、 p=Nであれば、制御部 170においてパラメータ pに 1を代入し、これを一時メモリ 171に格納し (ステップ S18)、ノルム正規ィ匕部 142bにおける処理を開始する。まず、ノルム正規ィ匕部 142bにおいて、メモリ 100の記憶領域 105から周波数正規化ベクトル A，（f)の各要素 A ，（f)を読み出し、

P QP

[0074] [数 21]

A_p'(f) … （1 7 )

の演算を行って、周波数正規化ベクトル A，（f)のノルム

P II A， (f)

P IIを求め、周波数正規化ベクトル A，（f)及びそのノルム II A， (f) IIを一時メモリ 171に格納する（ステップ

P P

S19)。

次に、ノルム正規ィ匕部 142bにおいて、一時メモリ 171から周波数正規ィ匕ベクトル A

P

，（f)及びそのノルム II A， (f)

P IIを読み出し、

A " (f) =A，（f) / || A，（f) II - (18)

P P P

の演算を行って正規ィ匕基底ベクトル A " (f)を求め、これをメモリ 100の記憶領域 10

P

6に格納する（ステップ S 20)。

[0075] その後、制御部 170において、一時メモリ 171に格納されたパラメータ pが p=Nを満たす力否かを判断する (ステップ S21)。ここで p=Nでなければ、制御部 170は、 p + 1の演算結果を新たなパラメータ pの値とし、これを一時メモリ 171に格納し (ステツプ S22)、ステップ S19の処理に戻す。一方、 p=Nであれば、制御部 170は、ステツプ S4の処理を終了させる。

このように生成された正規ィ匕基底ベクトル A " (f)は、周波数に依存せず、信号源の

P

位置のみに依存するベクトルとなる。その結果、この正規化基底ベクトル A " (f)はクラ

P

スタを形成することになる。以下にこの理由を説明する。

[0076] [正規化基底ベクトル A " (f)がクラスタを形成する理由]

P

基底ベクトル A (f)の各要素 A (f)は、源信号 pに対応する信号源 kからセンサ qへ

P QP

の周波数応答 H に比例した (ある複素数スカラが掛カつた)ものになっている。これ

qk

らの複素数スカラは離散時間に応じて (すなわち位相に応じて)変化するが、源信号 pとセンサ qとに対応する複素数スカラと、源信号 pとセンサ Qとに対応する複素数スカラとの相対値は、離散時間が変化しても一定である (周波数 fが同じであれば)。すなわち、周波数 fが同じであれば、源信号 pとセンサ qとに対応する複素数スカラの偏角と、源信号 pとセンサ Qとに対応する複素数スカラの偏角との相対値は一定である。

[0077] 前述のように、周波数正規ィ匕部 142aの第 1正規ィ匕部 142aaは、基底ベクトル A (f)

P

の特定の 1つの要素 A (f)を基準として当該基底ベクトル A (f)の各要素 A (f)の偏

Qp P QP 角を正規化する。これにより、上述の複素数スカラの位相に起因する不確定性を取り除き、源信号 pとセンサ qとに対応する基底ベクトル A (f)の要素 A (f)の偏角を、源信

P QP

号 pと基準センサ Q (基準値 Qに対応）とに対応する基底ベクトル A (f)の要素 A (f)

P QP

の偏角に対する相対値として表現する。なお、この場合、要素 A (f)の偏角に対応

QP

する当該相対値は 0と表現される。信号源 kからセンサ qへの周波数応答を、反射や残響の無い直接波モデルで近似して考える。すると、上記の第 1正規化部 142aa〖こより正規化された偏角は、信号源 kからセンサへの波の到達時間差と周波数 fの双方に比例したものになる。ここでの到達時間差とは、信号源 kからの波がセンサ qに到達するまでの時間と、当該波が基準センサ Qに到達するまでの時間との時間差である。

[0078] また、前述のように、第 2正規ィ匕部 142abは、第 1正規ィ匕部 142aaで正規ィ匕された各要素 A "' (f)の偏角を周波数 fに比例した値で除算する。これにより、各要素 A "'

QP QP

(f)を、それらの偏角の周波数依存性を排除した各要素 A ' (f)に正規化する。これ

QP

により、正規化された各要素 A ' (f)は、直接波モデルに従えば、信号源 kからセンサへの波の到達時間差のみに依存するものとなる。ここで、信号源 kからセンサへの波の到達時間差は、信号源 k,センサ q,基準センサ Qの相対位置にのみ依存する。そのため、信号源 k,センサ q,基準センサ Qが同じであれば、周波数 fが異なっても各要素 A ' (f)の偏角は同一となる。従って、周波数正規化ベクトル A ' (f)は、周波数 f には依存せず、信号源 kの位置のみに依存する。

[0079] そのため、周波数正規化ベクトル A ' (f)のノルムを正規化した正規化基底ベクトル

P

A "(f)のクラスタリングによって、同じ信号源毎に対応するクラスタが形成される。な

P

お、実際の環境では、反射や残響などの影響により、直接波モデルは厳密には満たされな、が、後述の実験結果に示すとおり十分に良、近似となって、る。

次に、正規化基底ベクトル A "(f)がクラスタを形成する理由を、モデルを用いて説

P

明する。前述した式（1)に示されるインパルス応答 h (r)を直接波 (近距離場)混合モ qk

デルを用いて近似し、周波数領域で表すと

[0080] [数 22]

H_qk(f) = exp[-j2 f_C- dqk-dQk)] … (19)

°qk となる。ここで、 d は信号源 kとセンサ qとの間の距離であり、また、減衰 1/d は、距離

qk qk d によって決まり、遅延 (d - d )/cは、基準センサ Qの位置で正規ィ匕された距離に qk qk Qk

よって決まる。

また、独立成分分析 (ICA)における順序の任意性とスケーリングの任意性とを考慮すると、基底ベクトル A (f)と式 (4)における信号源 kから各センサへの周波数応答を

P

まとめたベクトル H (f)との間には、以下の関係が成り立つ。

k

[0081] A (ΐ)= ε ·Η (f), A (ΐ)= ε ·Η (f) ·'·(20)

Ρ Ρ k qp Ρ qk

ここで、 ε はスケーリングの任意性を表現する複素スカラ値であり、添え字 kと qが

P

異なる可能性が順序の任意性を表現している。ここで、式（16) (18) (19) (20)より、 [0082] [数 23]

となる。この式力も分力るように、正規化基底ベクトル A " (f)の各要素 A " (f)は、周

P QP

波数 fからは独立であり、信号源 kとセンサ qの位置のみに依存する。従って、正規ィ匕基底ベクトル A " (f)をクラスタリングすると、同じ信号源ごとに対応するクラスタが形成

P

される。

同様なことは、信号の減衰を考慮して!/ヽな!ヽ近距離場混合モデルでモデル化した場合にも言える。すなわち、前述した式（1)に示される畳み込み混合モデルを、減衰を無視した近距離場混合モデルで近似し、周波数領域で表すと

[0083] [数 24]

H_qk (f ) = exp[- ]2πίο"¹ (d_qk - d_Qk )] … ( 22 ) となる。この場合、式（16) (18) (20) (22)より、

[0084] [数 25]

. π (a_qk - "Qk)

( 23 )

八 ^XP一 J

2 d となる。この場合も、正規化基底ベクトル A " (f)の各要素 A " (f)は、周波数 fからは

P QP

独立であり、信号源 kとセンサ qの位置のみに依存している。

さらに、近距離場混合モデルだけではなぐ遠距離場混合モデルでも同様なことがいえる。すなわち、前述した式（1)に示される畳み込み混合モデルを遠距離場混合モデルで近似し、周波数領域で表すと

[0085] [数 26]

H_qk(f ) = βχρΗ2π&-¹ II SE_q - SE_Q || cose_k ^qQ] - ( 24) となる。なお、 SE及び SEはセンサ q, Qの位置を示すベクトルである。また Θ ^qQは、 q Q k センサ q, Qを結ぶ直線と、センサ q, Qの中心点と信号源 kとを結ぶ直線と、で成す角度を示す。この場合、式（16) (18) (20) (24)より、

[0086] [数 27]

となる。この場合も、正規化基底ベクトル A " (f)の各要素 A " (f)は、周波数 fからは

P QP

また、式（21)力もパラメータ dの値は、 d>d /2であることが望ましく（d は要素 max max

A (f)に対応する基準センサ Qと他のセンサとの最大距離 d を意味する。）、より好

Qp max

ましくは d≥d であることが望ましぐさらにより好ましくは d=d であることが望まし max max いことが分かる。以下、この理由について説明する。

[0087] 図 7及び図 8は、パラメータ d毎の正規ィ匕基底ベクトルの要素 A "(f)とその偏角 arg[

QP

A "(f)]との関係を説明するための複素平面図である。なお、これらにおける横軸は

QP

実軸を縦軸は虚軸を示して、る。

図 7Aは d Z2≥dの場合における複素平面図である。ここで上述の d の定義より max max

、任意の q及び kに対し d - d の絶対値は d 以下となる。よって d Z2≥dの場合、 qk QK max max

(π/2) · (ά - d )/d≤- π, (π/2) · ((1 - d )/d≥ πと成り得る。その結果、式（21) qk Qk qk Qk

で表される A "(f)の偏角 arg[A " (f)]は、 2 πを超える a ≤arg[A "(f)]≤ a (a ≤ qp QP 1 QP 2 1

- π、 α ≥ π)の範囲に分布する可能性がある。そのため、異なる正規化基底べタト

2

ルの要素 A "(f)の偏角が一致する可能性があり、前述したクラスタリングにおいて、異なる正規化基底ベクトル A " (f)を同じクラスタにクラスタリングしてしまう可能性があ

P

る。よって、 d>d Z2であることが望ましい。しかし、この偏角の重複範囲に対応す max

る正規化基底ベクトル A " (f)のサンプルが存在しないならば d Z2≥dとしても問題 p max

はない。

[0088] 図 7Bは d /2<d<d の場合における複素平面図である。この場合、- π < (π/ max max

2) - (d - d )/d<- π/2, π/2< (π/2) · ((1 - d )/d< πと成り得る。その結果、式（ qk Qk qk Qk

21)で表される A "(f)の偏角 arg[A "(f)]は、 β ≤arg[A "(f)]≤ j8 (~π < β く— qp QP 1 QP 2 1 π/2、 π/2< β く π )の範囲に分布する可能性がある。そのため、- π <arg[A " (f

2 qp

)]<- π/2及び π/2く arg[A " (f)]く πの範囲において、異なる周波数正規化べタトル要素間の偏角の差の増加に伴い、これらの周波数正規ィ匕べ外ル要素間の距離が単調増加しないこともありうる。これは、前述したクラスタリングの精度を低下させる可能性がある。よって d≥d であることがより望ましい。

max

[0089] 図 8Aは d=d の場合における複素平面図であり、図 8Bは d>d の場合における複素平面図である。ここで d>d の場合、- π/2く（π/2) · ((1 - d )/d<0, 0< (π/ max qK Qk

2) - (d — d )Α π/2と成り得る。その結果、式（21)で表される A "(f)の偏角 arg[A

Q Qk qp

"(f)]は、図 8Bに示すように、 γ ≤arg[A "(f)]≤ γ (~π/2< γ <0、 0< γ く π qp 1 qp 2 1 2

/2)の範囲に分布する。そして、 dが大きくなればなるほどその分布範囲は狭くなつていき、狭い範囲にクラスタが密集していく。これは、前述したクラスタリングの精度を低下させる。

[0090] これに対し、 d = d である場合、— π/2≤ (π/2) · ((1 — d )/d<0, 0く（π/2) · ((1 max qk Qk qk

-d )Αΐ≤ π/2と成り得る。その結果、式（21)で表される A "(f)の偏角 arg[A "(f)]

Qk qp qp は図 8Aに示すように- 7u/2≤arg[A " (f)]≤ π /2の範囲に分布する。この場合、周波数正規ィ匕ベクトルの要素間における偏角の差の増加に対して、それらの距離も単調増加するという関係を維持しつつ、できるだけ広い範囲にクラスタを分散させることができる。その結果、一般的にクラスタリングの精度を向上させることができる。

〔第 2の実施の形態（「第 1の本発明」の例)〕

次に本発明における第 2の実施の形態について説明する。

[0091] 第 1の実施の形態では、基底ベクトル力得られる情報によりパーミュテーシヨン問題を解決した力本形態では、これに特開 2004— 145172号公報や「H. Sawada, R. Mukai, b. Araki, b. Ma ino, A Robust ana Precise Method for Solving the Permuta tion Problem of Frequency-Domain Blind Source Separation," IEEE Trans. Speech a nd Audio processing, vol. 12, no.5, pp.530—538, Sep.2004. (以下「参考文献」と呼ぶ)」で示されているような分離信号のエンベロープの情報を統合することで、より精度よくパーミュテーシヨン問題を解決する。なお、これらの文献では、基底ベクトルの代わりに信号源の方向に関する情報が利用されて、る。

[0092] 以下では、第 1の実施の形態との相違点を中心に説明を行い、これと共通する事項については説明を省略する。

<構成>

図 9は、第 2の実施の形態における信号分離装置 200のブロック図の例示である。なお、本形態の信号分離装置 200も CPUlOa (図 2)に信号分離プログラムが読み込まれることにより構成されるものである。また、図 10Aは、図 9におけるパーミュテ一シヨン問題解決部 240の詳細を例示したブロック図であり、図 10Bは、図 10Aの順列修正部 247の詳細を例示したブロック図である。なお、図 9及び図 10において第 1の実施の形態と共通する部分については第 1の実施の形態と同じ符号を付した。また、図 9及び図 10における破線の矢印は理論上の情報の流れを示し、実線の矢印は実際のデータの流れを示す。また、これらの図において制御部 170に出入りするデータの流れに対応する矢印は省略してあり、図 10における実際のデータの流れに対応する矢印も省略してある。

[0093] 本形態の第 1の実施の形態のとの相違点は、主にパーミュテーシヨン問題解決部 2 40の構成である。すなわち、本形態のパーミュテーシヨン問題解決部 240は、第 1の実施の形態のパーミュテーシヨン問題解決部 140に、順列評価部 246と順列修正部 247とを付カ卩したものとなっている（図 9,図 10A)。なお、順列評価部 246は、周波数毎に順列の信頼度を評価するものであり、順列修正部 247は、順列の信頼度が低いと評価された周波数に対し、分離信号のエンベロープを用いて新たな順列を算出するものである。また、順列修正部 247は、判定部 247aと分離信号生成部 247bとェンべロープ算出部 247cと順列再算出部 247dと再並び替え部 247eを有している（図 10B)。また、本形態では、順列算出部 144と順列修正部 247とによって請求項 4の「順列算出部」を構成している。

[0094] <処理 >

図 11は、第 2の実施の形態における信号分離装置 200の処理の全体を説明するためのフローチャートである。以下、この図に沿って、本形態における信号分離装置 200の処理を説明していく。

ステップ S51から S57の処理は、第 1の実施の形態におけるステップ S1から S7までと同じであるため説明を省略する。本形態では、このステップ S57の処理の後に、順列評価部 246において、周波数毎に順列 Πの信頼度を評価し、順列 Πの信頼度が

f f

低いと評価された周波数に対し、分離信号のエンベロープを用いて順列 Π 'を算出

f し、この周波数のみについて第 2の分離行列 W' (f)の行を順列 Π 'に従って並び替

f

えて第 3の分離行列 W" (f)を生成し、メモリ 100の記憶領域 110に格納する (ステップ S58)。なお、この処理の詳細については後述する。 [0095] その後、分離信号生成部 150において、メモリ 100の記憶領域 102から周波数領域の混合信号 X (f, τ )を、記憶領域 111から第 3の分離行列 W" (f)を読み出す。そして、分離信号生成部 150は、周波数領域の混合信号 X (f, τ )からなる混合信号べタトル X (f, て ) =[X (f, τ ) ,..., X (f, て )]^Tと第 3の分離行列 W" (f)とを用い、分離信号べ

1 M

タトル

Y (f, T ) =W" (f) -X (f, τ )

を算出し、周波数領域の分離信号 Y (f, τ )をメモリ 100の記憶領域 112に格納する（

Ρ

ステップ S 59)。

[0096] 最後に時間領域変換部 160において、メモリ 100の記憶領域 112から周波数領域の分離信号 Y (f, τ )を読み出し、これを添え字 ρ毎に時間領域の分離信号 y (t)に変

P P

換し、これらの時間領域の分離信号 y (t)をメモリ 100の記憶領域 113に格納する (ス

P

テツプ S60)。

[ステップ S58の処理の詳細」

図 12及び図 13は、図 11におけるステップ S58の例を説明するためのフローチヤ一トである。以下、このフローチャートに沿ってステップ S58の詳細を説明していく。

[0097] まず、制御部 170においてパラメータ fに 0を代入し、集合 Fを空集合とし、これらを示す情報を一時メモリ 171に格納する (ステップ S71)。次に、順列評価部 246において、メモリ 100の記憶領域 110に格納された順列 Πの信頼度を周波数毎に評価し

f

、その評価結果 trust (f)を一時メモリ 171に格納する (ステップ S72)。ここで、順列 Π

f の信頼性が高いとは、例えば、正規化基底ベクトル A " (f)力それぞれに対応する

P

セントロイドに十分近いということである。また、正規化基底ベクトル A " (f)力それ k P

ぞれに対応するセントロイド 7? に十分近いかどうかは、例えば、正規化基底ベクトル k

A " (f)とセントロイド r? との距離力 sクラスタ cの分散 u / I c Iより小さいかどうか、 p k k k k

すなわち、

U /|C |> || r? —A " (f) II ² - (26)

k k k n(k)

により判定できる。よって、このステップでは、例えばまず、順列評価部 246において、メモリ 100の記憶領域 105から正規ィ匕基底ベクトル A " (f)を、記憶領域 109からセ

P

ントロイド r? を、記憶領域 110から順列 Πをそれぞれ読み出す。そして、順列評価部 246は、周波数 f毎に、式（26)を満たすか否かを判断し、満たす場合には trust (f) =1を、満たさない場合には trust (f)=0を出力し、一時メモリ 171に格納する。

[0098] 次に、順列修正部 247の判定部 247aが、一時メモリ 171から周波数 f毎に評価結果 trust (f)を読み出し、 trust (f)=lであるか否かを判断する（ステップ S73)。ここで、 tr ust(f)=0である場合、そのままステップ S76の処理に進む。一方、 trust(f)=lである場合、制御部 170において、集合 Fと {f}の和集合を新たな集合 Fとして一時メモリ 171 に格納し (ステップ S74)、再並び替え部 247eにおいて、この周波数 fにおける第 2の分離行列 W' (f)を第 3の分離行列 W" (f)としてメモリ 100の記憶領域 111に格納し (ステツプ S75)、ステップ S76に進む。

[0099] ステップ S76では、制御部 170において、一時メモリ 171に格納されたパラメータ f の値が mL-l)f /Lを満たすか否かを判断し (ステップ S76)、これを満たさなければ f+ s

f /Lの演算結果を新たなパラメータ fの値として (ステップ S 77)—時メモリ 171に格納 s

し、ステップ S72に戻る。

一方、 mL-l)f/Lを満たす場合、分離信号生成部 247bにおいて、集合 Fに属しな s

い周波数 fを 1つ選択する。そして、分離信号生成部 247bは、この周波数 fとその近傍であって集合 Fに属する全ての周波数 g(gEF, |g-l1≤ δ , δは定数）とに対し、メモリ 100の記憶領域 102から周波数領域の混合信号 X(f, τ )=[X (f, τ ) , ···, X (f, τ

1

)]^Τ, Χ(_§, τ)=[Χ (_§, τ), ···, X (g, ]^Tを読み出し、記憶領域 111から第 2の分離

1

行列 W' (f),W (g)を読み出し、

Y(f, =W， (f) -X(f, τ)

によって分離信号 Υ(ί·, τ)=[Υ (ΐ, τ), -, Y (f, r)]^T, Υ(_§, τ)=[Υ (g, τ ) , ···, Υ (g,

I N I N

τ)]^Τを算出して一時メモリ 171に格納する (ステップ S78)。

[0100] 次に、エンベロープ算出部 247cにおいて、一時メモリ 171から全ての周波数領域の分離信号 Y (f, τ ) , Y (g, τ )を読み出し、これらのエンベロープ

Ρ Ρ

v^f( r)=|Y (")|

P P

ν⁸( τ)=|Υ (g, r)|

P P

を算出して一時メモリ 171に格納する (ステップ S79)。そして、順列再算出部 247dにおいて、周波数の差 δ以下の近傍における相関 cor の和の最大値

[0101] [数 28]

N _f

R_f =max_n ∑ ^οοτ{ν_Π(1ί) ,ν . ^g)

|g-f|<6k=l ^{11 W} を算出して一時メモリに格納する (ステップ S80)。ここで、 Π'は周波数 gに対し、既に決定された順列である。なお、この式における相関 cor( , Ψ)は、 2つの信号 Φ, Ψの相関を示し、以下のように定義される。

ΟΟΓ(Φ, Ψ) = «Φ, Ψ>-<Φ>·<Ψ»/(σ ·σ )

Φ ψ

ただし、く ζ〉は ζの時間平均であり、 σ は Φの標準偏差である。また、 V ^fは、

Φ n(k)

Πによってエンベロープ V ^f ( τ )に並び替えられるエンベロープを意味する。すなわち k

、 n(k)列目のエンベロープ V ^fは、 Π，によって k番目のエンベロープ v^f( となる n(k) k

[0102] また、順列再算出部 247dにお、て、この相関 corの和を最大値ィ匕する順列

[0103] [数 29]

N _f

n_f'=argmax_n ∑ cor ¾_(k) ,ν , ^g)

|g-f|≤5k=l ^{n (k}) を算出してメモリ 100の記憶領域 110に格納する (ステップ S81)。ここで、 Π'は周波数 gに対し、既に決定された順列である。なお、 argmax vは、 vを最大値ィ匕する Π

Π

を意味する。

次に、制御部 170において集合 ζ }(ζ =argm_axR)との和集合を新たな集合 F f f

として一時メモリ 171に格納する (ステップ S82)。そして、再並び替え部 247eにおいて、 f= ζとし、第 2の分離行列 W' (f)の行を順列 Π，に従って並び替えた第 3の分離 f

行列 W" (f)を生成し、これをメモリ 100の記憶領域 111に格納する（ステップ S83)。

[0104] 次に、制御部 170において、一時メモリ 171に格納された集合 Fが全ての離散化された周波数 M),f/L,"',f (L-l)/Lの要素を有するか否かを判断する (ステップ S84)。ここで、集合 Fが全ての離散化された周波数 M),f/L,"',f (L- 1)/Lの要素を有しないのであれば、制御部 170は、処理をステップ S 78に戻す。一方、集合 Fが全ての離散化された周波数 M),f/lv',f (L-l) /Lの要素を有するのであれば、制御部 170は、ステツプ S58の処理を終了させる。

なお、以上の方法を用いず、前述した特開 2004— 145172号公報や「参考文献」に記載されたその他の方法を用い、ステップ S58の処理を実行してもよい。

[0105] <実験結果 >

次に、上述した第 1の実施の形態及び第 2の実施の形態による音源分離実験結果を示す。

[実験結果 1]

1つ目の実験は不規則なセンサ配置によるものである。実験条件は図 14Aに示す通りである。ここでは 4つの無指向性マイクを不規則に配置したものを用いた力これらの配置情報としては、マイク間隔の上限が 4cmであるということだけを信号分離装置に与えた。音源の数は 3つであり、 3秒間の英語の音声をスピーカから流した。結果を図 14Bに SIR (signa to- interference ratio)によって示す。大きい SIRほど分離性能が良いことを示す。ここではパーミュテーシヨン問題を解決する 4種類の手法に関して結果を比較した。 Envは分離信号のエンベロープ |Y (f, τ ) Iの情報のみを用いたも

P

の、 Basisは正規ィ匕基底ベクトル A " (f)のクラスタリングによるもの（第 1の実施の形態

P

の手法）、 Basis+Envはそれら 2種類の情報を統合してより精度良く問題を解決したもの（第 2の実施の形態の手法）、 Optimalは源信号 sとインパルス応答 h (r)を知って k qk

得た最適な順列によるものである。

[0106] 結果を考察すると、 Envだけでは性能にばらつきがある力第 1の実施の形態の Bas isはそれだけで十分な分離性能を得ている。また、双方を統合した第 2の実施の形態の Basis+Envの結果はほぼ Optimalに近、。このように不規則なセンサ配置を用いた場合でも、本発明により、周波数領域でのブラインド信号分離が高性能で達成された

[実験結果 2]

2つ目の実験は規則的なセンサ配置によるものである。実験条件は図 15Aに示す通りである。 3つの無指向性マイクを直線状に 4cm間隔で配置した。音源の数は同様に 3つであり、 3秒問の英語の音声をスピーカ力流した。結果を図 15Bに示す。この実験では、従来技術として示した信号源の位置に関する推定値をクラスタリングする方法も比較対象とし、 6種類の手法に関して結果を比較した。 DOAは信号の到来方向（DOA:direction-of-arrival)の推定値のみでパーミュテーシヨン問題を解決したもの、 DOA+Envはさらに分離信号のエンベロープ情報を統合したものある。

[0107] 従来技術である DOA及び DOA + Envと、本発明である Basis及び Basis+Envの結果を比較すると、従来手法が適用可能である規則的なセンサ配置に対しても、総じて本発明により結果が改善されていることがわかる。なお、演算量に関しては、従来技術とほぼ同等であった。

<第 1, 2の実施の形態の特徴 >

以上より、上述した第 1, 2の実施の形態の特徴をまとめると以下のようになる。

(1)センサの配置情報を厳密に知る必要がなぐある基準センサ力他のセンサへの距離の上限のみを知ればよいため、不規則なセンサ配置を採用でき、さらに位置をキャリブレーションする必要が無、。 (2)基底ベクトルから得られる情報をすベて用いてクラスタリングを行うためパーミュテーシヨン問題をより正確に解決することができ

、信号分離の性能が向上する。

[0108] なお、本発明は上述の実施の形態に限定されるものではない。例えば、上述した各実施の形態では、一般ィ匕行列としてムーア'ペンローズ型一般ィ匕逆行列を用いたが他の一般化行列を利用する形態でもよヽ。

また、第 1の実施の形態では、周波数正規ィ匕部 142aの第 1正規ィ匕部 142aaが、基底ベクトル A (f)の特定の 1つの要素 A (f)を基準とし、式（15)によって当該基底べ

P QP

タトル A (f)の各要素 A (f)の偏角を正規化することとした。しかし、例えば、以下のよ

P QP

うな式に従って、第 1正規化部 142aaが、基底ベクトル A (f)の特定の 1つの要素 A (

P QP

f)を基準として、当該基底ベクトル A (f)の各要素 A (f)の偏角を正規化する構成で

P QP

あってもよい。

[0109] [数 30] Aqp-'^f ) H Α^(ΐ) I exp{j - (argtA^if ) - A_Qp*(f )])} … （27-1)

Aqp-'-Cf) =| AqpCf)! expij-CargtAqpC^-argtAQpCf)])} … （27-2) Α_φ ' ' ' (f ) =| A ^ (f ) I exp { j · <i(arg[A_qp (f ) / A_Qp (f )])} … (27-3) ただし、 ·*は、 'の複素共役である。また、 φ {·}は関数であり、クラスタリング精度の観点から好ましくは単調増加関数であることが望ましい。

また、周波数正規ィ匕部 142aが式（14)の代わりに、

[数 31] . ^ £^ ] ·.· ₍₂₈— D

4tc~ d .arg [ ^f)' )] ... ） ' p.^arg [ りト [ ] … （）

4fc d

< arg[A。_p(f)/A_0p(f)])

Α_α '(f) = p- ら ^φ , ^Qp … (28-4)

w 4fc^_1d 等の演算によって周波数正規ィ匕を行うこととしてもよい。ただし、は定数である (例えば、 /0 =1)。

また、上述の実施の形態では、ノルム正規化部 142bにおいてノルムが 1になるような正規ィ匕を行った力ノルムカ^以外の規定値となるように正規ィ匕を行ってもよい。さらに、ノルム正規ィ匕部 142bを設けず、ノルム正規ィ匕を行わない構成であってもよい。この場合、クラスタリング部 143は、周波数正規化ベクトル A，（f)のクラスタリングを行

P

うこと〖こなる。しかし、周波数正規化ベクトル A，（f)は、ノルムが統一されていない。そ

P

こで、この場合のクラスタリング基準は、ベクトルがノルムを含めて似ているかどうかではなぐベクトルの方向のみが似ている力^うかになる。これは、類似度を用いた評価になる。類似度の 1つとしてコサイン距離

cos0= | A '^H(f). r? I /( || A '(f) II - II η

ρ k ρ k II)

を例示できる。ここで Θは、周波数正規化ベクトル A， (f)と、セントロイド 7? のベクトル

P k とがなす角度である。コサイン距離を用いる場合、クラスタリング部 143は、コサイン距離の総和

[0111] [数 32]

Ui =∑ A_n ''( (ff))eeCC;i i

を最小値ィ匕するクラスタを生成する。なお、セントロイド 7? は、各クラスタのメンバの平

k

均として算出する。

さらに、上記の第 2の実施の形態では、周波数毎に順列の信頼度を評価し、順列の信頼度が低いと評価された周波数に対し、分離信号のエンベロープを用いて新たな順列を算出することとした。しかし、分離信号のエンベロープとクラスタの中心べタトルと正規ィ匕基底ベクトルとを一度に統合して順列を算出することとしてもよい。

[0112] また、まず分離信号のエンベロープを用いて順列を算出し、その順列の信頼度を周波数毎に評価し、信頼度が低いと評価された周波数に対して、第 1の実施の形態の手法を適用して新たな順列を算出することとしてもよい。

さらに、上記の第 2の実施の形態では、第 2の分離行列 W' (f)を用いて分離信号のエンベロープを算出したが、第 1の分離行列 W(f)或いはその行を並び替えた分離行列を用いてエンベロープを算出する構成としてもょ、。

また、パラメータ dは、全てのセンサ qに対して同一であってもよいし、各センサ qに対応して複数の値を設定しておいてもい。例えば、基準センサとセンサ qとの距離を、それぞれのセンサ qに対応するパラメータ dの値としてもよい。

[0113] 〔第 3の実施の形態（「第 2の本発明」の例)〕

次に、本発明における第 3の実施の形態について説明する。

本形態は、前述の原理を用い、目的信号の方向に関する情報を知ることなぐ複数の信号源から発せられた信号が混合された混合信号から目的信号を抽出する形態である。

<構成>

本形態の信号分離装置も、第 1の実施の形態と同様、公知のノイマン型のコンビュータに信号分離プログラムが読み込まれることにより構成される。図 16は、第 3の実施の形態における信号分離装置 1001の構成を例示したブロック図である。

[0114] この図に例示するように、信号分離装置 1001は、記憶領域 1101〜1114を有するメモリ 1100、周波数領域変換部 1120、信号分離部 1130、目的信号選択部 1140、時間周波数マスキング部 1150 (「分離信号生成部」に相当）、時間領域変換部 116 0、制御部 1170及び一時メモリ 1180を有する。ここでメモリ 1100及び一時メモリ 11 80は、例えば、レジスタ 10ac、補助記憶装置 10fのデータ領域 10fb或いは RAMI 0dのデータ領域 10db (図 2)の少なくとも一部に相当する力特にこれに限定されない。また、周波数領域変換部 1120、信号分離部 1130、目的信号選択部 1140、時間周波数マスキング部 1150、時間領域変換部 1160、制御部 1170及び一時メモリ 1180は、例えば、 CPUlOa (図 2)に OSプログラムや信号分離プログラムが読み込まれることにより構成されるものである。

[0115] 図 17Aは、図 16における目的信号選択部 1140の詳細構成を例示したブロック図であり、図 17Bは、図 17Aにおける基底ベクトルクラスタリング部 1142の詳細構成を例示したブロック図である。

これらの図に例示するように、目的信号選択部 1140は、逆行列算出部 1141 (「複素ベクトル生成部」に対応）、基底ベクトルクラスタリング部 1142及び選択部 1143を有している。また、基底ベクトルクラスタリング部 1142は、周波数正規化部 1142a (「正規ィ匕部」を構成）、ノルム正規ィ匕部 1142b (「正規ィ匕部」を構成）、クラスタリング部 1 142c及び分散判定部 1142dを有している。また、周波数正規ィ匕部 1142aは、第 1 正規化部 1142aa及び第 2正規ィ匕部 1142abを有して、る。

[0116] 図 18Aは、図 16における時間周波数マスキング部 1150の詳細構成を例示したブロック図であり、図 18Bは、図 18Aにおけるマスク生成部 1151の詳細を例示したブロック図である。

これらの図に例示するように、時間周波数マスキング部 1150は、マスク生成部 115 1及びマスキング部 1152を有している。また、マスク生成部 1151は、白色化行列生成部 1151a、白色化部 1151b、角度計算部 1151c及び関数演算部 115 Idを有している。

[0117] なお、図 16〜図 18における実線の矢印は実際のデータの流れを示し、破線の矢印は理論上の情報の流れを示す力制御部 1 170及び一時メモリ 1180に出入りするデータの流れは省略してある。また、信号分離装置 1001は制御部 1170の制御のもと各処理を実行する。また、特に示さない限り、制御部 1170は、必要なデータを一時メモリ 1180に読み書きしながら各処理を実行して、く。

<処理 >

次に、本形態における信号分離装置 1001の処理について説明する。

[0118] 空間内に N個の信号源 k (k E {l ,2,...,N})が存在し、それらの信号 s (t) (tはサンプリ k

ング時刻）が混合され、 M個のセンサ q (_q e{l ,2,...,M})で混合信号 Xとして観測されるとする。本形態では、混合信号 X (t) ,...,x (t)のみから、何れかの信号源力も発せ

1

られた目的信号を抽出してその他の妨害信号を抑圧した信号 y (t)を算出する。なお、信号源の数 Nはセンサの数 Mよりも多くても少なくてもよぐまた同数であってもよい。さらに、信号源の数 Nを事前に知る必要もなぐまた信号源の数が数えられないような状況であっても構わな、。

[0119] [処理の全体]

図 19は、第 3の実施の形態における信号分離処理の全体を説明するためのフローチャートである。以下、この図を用いて本形態における信号分離処理の全体を説明する。

まず、前処理において、 M個のセンサで観測された時間領域の混合信号 X (t) (q≡ {1 ,...,M})をメモリ 1100の記憶領域 1101に格納しておく。信号分離処理が開始されると、まず、周波数領域変換部 1120において、メモリ 1100の記憶領域 1101から時間領域の混合信号 X (t)を読み出す。そして、周波数領域変換部 1120は、これらを短時間フーリエ変換などにより周波数領域の混合信号 X (f, て )に変換し、メモリ 110 0の記憶領域 1102に格納する（ステップ S 101)。

[0120] 次に、信号分離部 1130において、メモリ 1100の記憶領域 1102から周波数領域の混合信号 X (f, τ )を読み出す。この例の信号分離部 1130は、読み出した混合信号 X (f, τ )を要素とする混合信号ベクトル X (f, て ) =[X (f, τ ) , · · · ,Χ (f, て )]^Tに、独立 q 1

成分分析 (ICA)を適用し、周波数 f毎に M行 M列の分離行列 W (f) =[W (f) ,... ,W (f)

1

]^H ( * ^Hは行列 *の複素共役転置行列）と分離信号ベクトル Y (f, r ) =W(f) -X (f, τ ) - - - (30)

とを算出する (ステップ S 102)。なお、算出された分離行列 W (f)はメモリ 1100の記憶領域 1103に格納される。また、分離信号ベクトル Y (f, τ ) =[Y (f, τ ) ,〜,Y (f, τ )]^Τを

1

構成する分離信号 Υ (f, τ ) (p e{l,..,M})は、記憶領域 1107に格納される。ステップ

P

S 102の詳細については後述する。

[0121] 次に、目的信号選択部 1140において、メモリ 1100の記憶領域 1103から分離行列 W (f)を読み出し、その一般ィ匕逆行列の列である基底ベクトルを正規ィ匕し、その正規ィ匕された基底ベクトルをクラスタリングする。そして、目的信号選択部 1140は、そのクラスタの分散を指標として、メモリ 1100の記憶領域 1107の分離信号から目的信号を含む選択信号 Y (f, τ )とそれに対応する基底ベクトル A (f)とを周波数 f毎に

i (f) K0

選択し、メモリ 1100の記憶領域 1111に格納する (ステップ S103)。なお、本形態では、センサに近ぐそのためセンサで観測されるパワーがその他の源信号と比べて支配的であり、さらに情報として有用である信号を目的信号として抽出する。このステツプ S 103の詳細については後述する。

[0122] 次に、時間周波数マスキング部 1150において、メモリ 1100の記憶領域 1102から周波数領域の混合信号 X (f, τ )を読み出し、記憶領域 1104から選択信号 Y (f, τ )に対応する基底ベクトル A (f)を読み出し、これらを用いて時間周波数マスク M (f,

1 (f)

τ )を生成して記憶領域 1112に格納する（ステップ S104)。なお、ステップ S104の処理（時間周波数マスキング部 1150の処理）の詳細については後述する。

次に、時間周波数マスキング部 1150において、メモリ 1100の記憶領域 1107から目的信号選択部 1140で選択された選択信号 Y (f, τ )を読み出し、記憶領域 1112

1 (f)

力も時間周波数マスク M (f, τ )を読み出す。そして、時間周波数マスキング部 1150 は、この時間周波数マスク M (f, τ )を選択信号 Y (f, τ )に適用し、選択信号 Y (f,

ΚΟ Kf) て )に残存する妨害信号成分をより一層抑圧したマスク処理選択信号 Y ' (f, τ )を生成し、メモリ 1100の記憶領域 1113に格納する（ステップ S105)。なお、このステップ S 105の処理の詳細（時間周波数マスキング部 1150の処理）については後述する。

[0123] 最後に、時間領域変換部 1160において、メモリ 1100の記憶領域 1113から、周波数領域における選択された分離信号 Y ' (f, _τ )を読み出し、それに短時間逆フーリェ変換などを施して時間領域の分離信号 y (t)を生成し、メモリ 1100の記憶領域 111

4に格納する（ステップ S 106)。

[ステップ S 102の処理 (信号分離部 1130の処理)の詳細]

前述のように、この例の信号分離部 1130は、独立成分分析 (ICA)によって、混合信号ベクトル X(f, τ )=[X (f, τ ),···, X (f, τ )]^Tから M行 M列の分離行列 W(f)=[W (f)

1 M 1

,...,W (1")]と分離信号べ外ル丫(1 て）=[丫（1 て）,"-,丫（f, ]^Tとを算出する (ステツ

1

プ S102)。独立成分分析 (ICA)は、分離信号ベクトル Y(f, τ)=[Υ (f, T ) ,〜,Y (f, τ

1

)]^Tの各要素が互いに独立になるように分離行列 W(f)を算出する手法であり、そのァルゴリズムとしては、非特許文献 4に記載されてヽるものなど様々なものが紹介されている。なお、独立成分分析 (ICA)は、パワーが小さぐガウス性が高い妨害信号よりも、パワーが大きぐ非ガウス性が高い本形態の目的信号をより有利に分離抽出できる手法である。

[0124] [ステップ S 103の処理（目的信号選択部 1140の処理)の詳細]

独立成分分析 (ICA)では、信号の独立性に着目してそれらの分離を行うため、得られる分離信号 Y (f, τ )には順序の任意性がある。その順序が入れ替わっても独立性

Ρ

が保たれる力である。従って、目的信号に対応する分離信号を周波数毎に選択しなければならない。目的信号選択部 1140では、以下に示す処理により、この選択を行う。

図 20は、第 3の実施の形態における目的信号選択部 1140の処理の詳細を説明するためのフローチャートである。以下では、この図を用い、目的信号選択部 1140の処理の詳細を説明する。

[0125] まず、逆行列算出部 1141において、周波数毎にメモリ 1100の記憶領域 1103から Μ行 Μ列の分離行列 W(f)を読み出し、それらの逆行列

W(f)^_1=[A (f),...,A (f)] (ただし、その列 A (f)=[A (f),...,A (f)]^T "（31)

1 p lp p を算出する。

ここで、式（30)の両辺に式（31)を掛け合わせることにより、周波数領域の混合信号 X(f, の分解

[0126] [数 33] X(f，T) =∑₌₁A_p(f)Y_p(f，T) … ( 32 ) を得ることができる。この A (f)は基底ベクトルであり、それぞれが各周波数の分離信

P

号 Y (f, τ )毎に対応する。式（31)のように算出された基底ベクトル A (f)はメモリ 110

P P

0の記憶領域 1104に格納される（ステップ S 111)。

次に、基底ベクトルクラスタリング部 1142において、全ての基底ベクトル A (f) (p=l,

P

… 、 M),f/lv",f (L-l)/L)を正規ィ匕する。この正規ィ匕は、複数の信号源から発せられた信号の畳み込み混合を所定のモデル (例えば、近距離場モデル）に近似した場合に、正規化された基底ベクトル A (f)が信号源の位置のみに依存したクラスタを

P

形成するように行われる。この例では、第 1の実施の形態と同様な周波数正規化とノルム正規化とを行う。

[0127] 周波数正規化は、基底ベクトルクラスタリング部 1142の周波数正規ィ匕部 1142a ( 図 17B)において行われる。すなわち、周波数正規化部 1142aにおいて、メモリ 110 0の記憶領域 1104の基底ベクトル A (f) (p=l,...,M、M),f/lv",f (L-l)/L)を読み出 p s s

し、これらを周波数に依存しない周波数正規ィ匕ベクトル A ' (f)に正規ィ匕してメモリ 110

P

0の記憶領域 1105に格納する (ステップ S 112)。なお、この正規化は基底ベクトル A

P

(f)の要素 A (f)毎に行われる（詳細は後述)。ノルム正規化は、基底ベクトルクラスタ

QP

リング部 1142のノルム正規ィ匕部 1142b (図 17B)において行われる。すなわち、ノルム正規ィ匕部 1142bにお、て、メモリ 1100の記憶領域 1105から周波数正規化べタトル A ' (f)を読み出し、これらをノルムが規定値 (この例では 1)をとる正規ィ匕基底べタト

P

ル A " (f)に正規化してメモリ 1100の記憶領域 1106に格納する（ステップ SI 13)。な

P

お、この正規ィ匕は周波数正規ィ匕ベクトル A ' (f)毎に行われる（詳細は後述)。

P

[0128] 基底ベクトルの正規化が終了すると、次にクラスタリング部 1142c (図 17B)において、正規化基底ベクトル A " (f)によって形成される M個のクラスタ C (ie{l,...,M})を

P

同定する。この例の場合、クラスタリング部 1142cにおいて、メモリ 1100の記憶領域 1106から正規化基底ベクトル A " (f)を読み出し、これらをクラスタリングして M個のク

P

ラスタ C (i=l,...,M)を生成し、各クラスタ Cを特定する情報 (例えば、各クラスタに属する正規化基底ベクトル A " (f)を示す情報）と各クラスタ Cのセントロイド（中心ベクトル）

P η iとをそれぞれメモリ 1100の記憶領域 1109, 1110に格納する（ステップ S114)。なお、このクラスタリングは、例えば、各クラスタ Cの要素（正規ィ匕基底ベクトル A " (f) )と各クラスタ Cのセントロイド 7?との間の二乗和 Uの総和 U

[0129] [数 34] … （33 )

を最小値ィ匕することを基準に行われる。この最小値化は、例えば、非特許文献 6などで解説されている k-meansクラスタリングを用いることによって効果的に行うことができる。なお、クラスタ Cのセントロイド 7}は、

[0130] [数 35]

∑_Λ "び) _eC. A_v"(f)/ | Ci |

= ... ( 34 )

|∑ "(₀ "(り/ | || によって計算される。ここで I C I はクラスタ Cにおける要素（正規ィ匕基底ベクトル A " (f) )の数であり、 II * IIはベクトル *のノルムである。また、ここでは、距離としてュークリツド距離の自乗を用いているが、これを一般ィ匕したミンコフスキー距離などを用いてもよい。

M個のクラスタ C力得られると、次に分散判定部 1142d (図 17B)において、目的信号に対応するクラスタを選択し、選択したクラスタを示す選択情報 I (f)をメモリ 1100 の記憶領域 1111に格納する (ステップ S 115)。なお本形態では、クラスタの分散 U./I c.|を指標に、目的信号を含む分離信号が選択される。すなわち、本形態における基底ベクトルの正規ィ匕は、複数の信号源から発せられた信号の畳み込み混合を所定のモデルに近似した場合に、正規化された基底ベクトルが信号源の位置のみに依存したクラスタを形成するように行われる。しかし、実環境では、このようなモデルに反映されない様々な因子が存在し、このような実環境とモデルとの乖離は、信号源カもセンサまでの距離が大きいほど大きくなる。例えば、近距離場モデルでは、信号が壁などに反射することによる反射波成分が考慮されておらず、直接波成分に対する反射波成分の割合は、信号源がセンサ力も離れるに従って大きくなる。そのため、信号がセンサ力も離れるに従ってモデルが成り立ちに《なる。その結果、センサに近い信号ほど実環境に近、条件で正規ィ匕ができ、実環境とモデルとの乖離に起因するクラスタの分散を小さくできる。本形態ではセンサに近い信号を目的信号とするため、分散の小さ、クラスタを目的信号に対応するクラスタとして選択すればよ!、ことになる。なお、この選択手順 (ステップ S 115)の詳細については後述する。

[0131] 各周波数 fに対する選択情報 I (f)が算出されると、次に、各周波数 fにおける選択信号 Y (f, て )とそれに対応する基底ベクトル A (f)とを選択する。すなわち、まず、選択部 1143において、メモリ 1100の記憶領域 1111から選択情報 1 (f)を読み出す。そして、選択部 1143は、この選択情報 1 (f)に対応する分離信号を選択信号 Y (f, τ ) として記憶領域 1107から読み出し、それに対応する基底ベクトル A (f)を記憶領域 1104から読み出し、これらを記憶領域 1111に格納する（ステップ S 116)。

[0132] 次に、ステップ S 112, 113 (図 20)の正規化の詳細を示す。

[ステップ S 112 (周波数正規化）の詳細]

図 21Aは、ステップ S 112の周波数正規化の詳細を説明するためのフローチャートである。

まず、制御部 1170 (図 16)においてパラメータ pに 1を代入し、これを一時メモリ 11 80に格納する (ステップ S 121)。また、制御部 1170においてパラメータ qに 1を代入し、これを一時メモリ 1180に格納する (ステップ S 122)。次に、周波数正規化部 114 2a (図 17B)において、メモリ 1100の記 '慮領域 1108力ら前述のノラメータ d, c, Qを読み出し、記憶領域 1104から基底ベクトル A (f)の要素 A (f)を読み出し、一時メモリ 1180からパラメータ p, qを読み出す。そして、この周波数正規ィ匕部 1142aは、基底ベクトル A (f)の要素 A (f)に対し、

[0133] [数 36]

. arg[A_qp(f)/A_Qp(f)]

Aqp'C H AqpC I expl j ( 3 5 )

4fc^_1d の演算を行い、当該演算結果 A ，（f)を周波数正規ィ匕ベクトル A，（f)の各要素 A ，（f

)としてメモリ 1100の記憶領域 1105に格納する（ステップ S 123)。なお、 arg [ ' ]は偏角を意味し、 expはネピア数を意味し、 jは虚数単位を意味する。より詳細には、前述の式（15) (16)の演算によって、この正規化を行う。

次に、制御部 1170において、一時メモリ 1180に格納されたパラメータ qが q = Mを満たすか否かを判断する（ステップ S 124)。ここで q = Mでなければ、制御部 1170は、 q+ 1の演算結果を新たなパラメータ qの値とし、これを一時メモリ 1180に格納し (ステツプ S 125)、処理をステップ S 123へ戻す。一方、 q = Mであれば、制御部 1170は、さらに p = Mを満たす力否かを判断する（ステップ S 126)。

[0134] ここで p = Mでなければ、制御部 1170は、 p + 1の演算結果を新たなパラメータの値とし、これを一時メモリ 1180に格納し (ステップ S127)、処理をステップ S122へ戻す。一方、 ρ = Μであれば、制御部 1170は、ステップ S112の処理を終了させる（ステツプ S112 (周波数正規化)の詳細の説明終わり）。

[ステップ S 113 (ノルム正規化）の詳細]

図 21Bは、ステップ S113のノルム正規化の詳細を説明するためのフローチャートである。

[0135] まず、制御部 1170において、パラメータ ρに 1を代入し、これを一時メモリ 1180に格納する（ステップ S131)。次に、ノルム正規化部 1142bにおいて、メモリ 1100の記憶領域 1105から周波数正規ィ匕ベクトル A，（f)の各要素 A ，（f)を読み出し、

P QP

[0136] [数 37]

の演算を行って、周波数正規化ベクトル A，（f)のノルム

P II A， (f)

P IIを求め、周波数正規化ベクトル A，（f)及びそのノルム

P II A， (f)

P IIを一時メモリ 1180に格納する（ステツプ S132)。

次に、ノルム正規ィ匕部 1142bにおいて、一時メモリ 1180から周波数正規ィ匕べタトル A，（f)及びそのノルム II A， (f) IIを読み出し、

P P

A " (f) =A ' (f) / || A，（f)

P P P II - (39)

の演算を行って正規ィ匕基底ベクトル A " (f)を求め、これをメモリ 1100の記憶領域 1

P

106【こ格糸内する（ステップ S 133)。その後、 ff¾御咅 1170【こお!ヽて、一時メモリ 1180 に格納されたパラメータ pが P = Mを満たすか否かを判断する (ステップ S 134)。ここで p = Mでなければ、制御部 1170は、 p + 1の演算結果を新たなパラメータ pの値とし、これを一時メモリ 1180に格納し (ステップ S135)、ステップ S132の処理に戻す。一方、 p = Mであれば、制御部 1170は、ステップ S113の処理を終了させる。なお、正規化基底ベクトル A " (f)がクラスタを形成する理由は、第 1の実施の形態で示した

P

通りである (ステップ S 113 (ノルム正規化）の詳細の説明終わり）。

[0137] このように生成された正規ィ匕基底ベクトル A " (f)は、第 1の実施の形態で示した通り

P

、周波数に依存せず、信号源の位置のみに依存するベクトルとなる。

[選択信号の選択手順 (ステップ S 115)の詳細]

次に、前述した選択信号の選択手順 (ステップ S 115)の詳細を例示する。クラスタの選択手順 1 :

第 1の例は、最も分散が小さいクラスタを目的信号に対応するクラスタとして選択するものである。図 22は、この第 1の例を説明するためのフローチャートである。

[0138] この場合、まず分散判定部 1142d (図 17B)おいて、メモリ 1100の記憶領域 1109 力クラスタ C (i E{l,...,M})を特定する情報を読み出し、さらに記憶領域 1106, 111 0から、それぞれ正規化基底ベクトル A " (f) EC及びセントロイド 7?を読み出す。そし

P

て、分散判定部 1142dは、各 iについて、式（33)のようにを求め、 Cに属する要素 (正規化基底ベクトル A " (f) )の数をカウントすることにより I C Iを求め、クラスタ C の分散 U/|C.|を算出して一時メモリ Ι ΙδΟに格納する。そして、分散判定部 l l⁴²dは、この一時メモリ 1180に格納された分散 U/|C |から最小なものを選択し、それに対応するクラスタを示す情報をクラスタ選択情報

L =argmin U/|C |…（40)

として一時メモリ 1180に格納する（ステップ S 141)。なお、式（40)における argmin * は、 *を最小にする iを意味する。

[0139] 次に、制御部 1170 (図 16)において、パラメータ fに 0を代入し、これを一時メモリ 1 180に格納する（ステップ S 142)。

次に、分散判定部 1142dは、一時メモリ 1180からクラスタ選択情報 _tを読み出し、メモリ 1100の記憶領域 1110からクラスタ選択情報に対応するセントロイド η を読み出す。また、分散判定部 1142dは、メモリ 1100の記憶領域 1106から正規ィ匕基底ベクトル A " (f) (p E{l,...,M})を読み出す。そして、分散判定部 1142dは、周波数 f

P

毎に選択情報

I (f) =argmin || A " (f) - r? || ² …（41)

P P

を算出し、記憶領域 1111に格納する (ステップ S 143)。

[0140] 次に、制御部 1170において、一時メモリ 1180からパラメータ fを読み出し、 - 1) •f/Lであるか否かを判断する（ステップ S 144)。ここで - 1) 'f/Lでなければ、制御部 1170は、このパラメータ fに f/Lを加算した値を新たな fとして一時メモリ 1180に s

格納し (ステップ S 145)、処理をステップ S 143に戻す。一方、 -1) 'f/Lであれば s

、制御部 1170は、ステップ S115の処理を終了させる。

クラスタの選択手順 2 :

第 2の例は、予め定められたしきい値よりも分散が小さいクラスタを目的信号に対応するクラスタとして選択するものである。なお、このしきい値は、例えば実験結果又は経験に基づき定められる値であり、事前にメモリ 1100に格納しておくものである。

[0141] この場合、ステップ S141 (図 22)の処理の代わりに、分散判定部 1142dにおいて、まず各クラスタの分散 ι ι^ιを公知の並び替えアルゴリズムによって昇順或いは降順に並び替える。そして、分散判定部 1142dは、メモリ 1100に格納されたしきい値を読み取り、分散 U/|C.|がしきい値よりも小さくなるクラスタを選択し、選択したクラスタに対応する添字 iの集合をクラスタ選択情報 tとして一時メモリ 1180に格納する。それ以外は、クラスタの選択手順 1と同様である。

クラスタの選択手順 3 :

第 3の例は、最も分散の小さいクラスタだけではなぐ最も分散が小さいクラスタから所定番目に分散が小さいクラスタまで (例えば、最も分散の小さいクラスタ力も 3番目に分散が小さいクラスタまで)を目的信号に対応するクラスタとして選択するものである。

[0142] この場合、ステップ S141 (図 22)の処理の代わりに、分散判定部 1142dにおいて、まず各クラスタの分散 l iCiiを、公知の並び替えアルゴリズムによって昇順或いは降順に並び替える。そして、分散判定部 1142dは、最も分散 U/|C |が小さいクラスタから所定番目に分散 ι ι^ιが小さいクラスタまでを選択する。この選択後、分散判定部

1142dは、選択したクラスタに対応する添字 iの集合をクラスタ選択情報 tとして一時メモリ 1180に格納する。それ以外は、クラスタの選択手順 1と同様である。

なお、クラスタの選択手順 1の代わりに分散の小ささが 2番目以降のいずれかのクラスタを選択することとしてもよく、上述したクラスタの選択手順の一部を組み合わせた手順を適用してもよい (ステップ S115の説明終わり Zステップ S103の処理（目的信号選択部 1140の処理)の詳細の説明終わり）。

[0143] [時間周波数マスキング部 1150の処理 (ステップ S 104, S 105)の詳細]

次に、時間周波数マスキング部 1150の処理について説明する。前述のように、時間周波数マスキング部 1150は、目的信号選択部 1140で選択された選択信号 Y (f , τ )に残存する妨害信号成分をさらに抑圧するものである。以下ではまず、なぜ選択信号 Y (f, τ )に妨害信号が残存するのかにつ、て説明する。

前述した式 (30)を選択信号のみに関して書くと、

(f) 'X(f, τ) 〜（42)

となる。また、これに式 (4)を代入して周波数 fを省略して書くと、

[0144] [数 38]

Y_i(T) = W_I ^H-H,-S_i(T) + ∑W_R ^H-H_K-S_k( ) … (43)

k=l,...,I-l,I+l，···, N と表記できる。もし N≤Mであれば、独立成分分析 (ICA)により、 W^H-H =0,^Vke{l,...

I k

,1-1,1+1,...,N}を満たすような \^を設定することが可能である。そのため、式 (43)の第二項は 0になる。しかし、より一般的に信号源数 Νがセンサ数 Μよりも多い場合には、 W^H-H ≠0,^Vk≡ κとなる κ {1,…，ト 1,Ι+1,...,Ν }が存在してしまう。その場合、選択

I k

信号 Y (f)は不必要な残留成分 (妨害信号の残留成分）

[0145] [数 39]

を含んでしまう（以後 fを省略せず)。

時間周波数マスキング部 1150の目的は、この選択信号 Y (f, τ )に含まれる不必要な残留成分を抑圧し、選択信号 Y^f, τ )よりも妨害信号の残留成分が少ないマスク処理選択信号 Y'(f, τ )を生成することである。そのために、時間周波数マスキング部 1150は、まずマスク生成部 1151 (図 18)において、妨害信号の残留成分を有する時間周波数スロットに対して小さな値を採り、妨害信号の残留成分が少ない時間周波数スロットに対して大きな値を採る時間周波数マスク 0≤M(f,て )≤1を生成する。そして、マスキング部 1152において、

Y '(f, r)=M(f, τ)·Υ (f, τ) ·'·(44)

に従ってマスキング処理を行ヽ、マスク処理選択信号 Υ ' (f, τ )を出力する。以下、

1(f)

この詳細について説明する。

[0146] [ステップ S 104 (マスク生成部 1151)の処理の詳細]

図 23は、図 19におけるステップ S104の詳細を説明するためのフローチャートである。以下、この図を用い、ステップ S 104 (マスク生成部 1151)の処理の詳細を説明する。

この例のマスク生成部 1151は、周波数領域の混合信号ベクトル X(f, τ )を白色化する空間（白色化空間）におヽて、混合信号ベクトル X (f,て )と選択信号に対応する基底ベクトル A (f)とのなす角度 0 (f, τ)を求め、その角度 0 (f, τ)に基づき、

i(f) ι(£) ι(£)

時間周波数マスクを生成する。なお、白色化とは、混合信号ベクトル X(f, τ )を線形に変形し、その共分散行列が単位行列と等しくなるようにすることである。

[0147] そのためにまず、白色化行列生成部 1151aにおいて、周波数領域の混合信号 X ( f, τ )を用い、混合信号ベクトル X(f, τ )を白色化空間に移す白色化行列 V(f)を生成する（ステップ S151)。この例の場合、白色化行列生成部 1151aは、メモリ 1100の記憶領域 1102から混合信号 X (f, τ )を読み出し、 R(f)=<X(f, τ ) -X(f, τ )^Η> とした

Q て場合における V(f)=R(f) ^_1/2を白色化行列 V(f)として算出し、これを記憶領域 1112 に格納する。なお、〈*〉はベクトル *を時間平均したベクトルを意味し、 * は*の複素共役転置を意味し、 R^_1/2は、 R"¹²-R- (R— ^1/2)^H=I(Iは単位行列)を満たす行列を意味する。また、白色化行列 V(f)を算出する代表的な方法として、 R(f)を固有値分解 R(f)=E(f) -D(f) 'E(f)^H(E(f)はュ-タリ行列、 D(f)は対角行列）し、 V(f)=D(f)"¹²- E(f)^Hの演算を行う方法を例示できる。なお、 D(f)— ^1/2は、対角行列 D(f)の各要素の (- 1/2)乗した対角行列と等価となるため、対角行列 D (f)の各要素の (-1/2)乗することによって算出できる。

[0148] 次に、白色化部 1151bにおいて、この白色化行列 V(f)を用い、混合信号ベクトル X

(f, τ )を白色化空間に写像した白色化混合信号べ外ル Z(f, τ )と、基底べ外ル A (f)を白色化空間に写像した白色化基底ベクトル B (f)とを算出する (ステップ S 152

1(f)

)。この例の場合、まず白色化部 1151bにおいて、メモリ 1100の記憶領域 1102から混合信号 X (f, τ )を、記憶領域 1111から選択信号 Y (f, τ )に対応する基底べタト q ΚΟ

ル A (f)を、記憶領域 1112から白色化行列 V(f)をそれぞれ読み出す。そして、白色化部 1151bは、 Z(f,て )=V(f) -X(f, τ )の演算により白色化混合信号ベクトル Z(f, τ)を算出し、 B (f)=V(f)-A (f)の演算により白色化基底べ外ル B (f)を算出し

i(f) ι(£) ι(£)

、これらをメモリ 1100の記憶領域 1112に格納する。

[0149] 次に、角度計算部 1151cにおいて、白色化混合信号ベクトル Z(f, τ )と白色化基底ベクトル B (f)とがなす角度 Θ (f, τ )を時間周波数毎に算出する (ステップ S153)

i(f) Κ0

。この例の場合、まず角度計算部 1151cにおいて、メモリ 1100の記憶領域 1112から白色化混合信号ベクトル Z(f, τ )と白色化基底ベクトル B (f)とを読み出す。そして

1(f)

、角度計算部 1151cは、

Θ _f (f.r)^"^^ "(f)-Z(f,r)|/||B_f (f) II · ||Z(f,r) || ) … (45)

Κΰ Κΰ Κΰ

の演算により、各時間周波数スロットに対して角度 Θ (f, τ )を算出し、記憶領域 11 12に格納する。なお、式 (45)における I * Iはベクトル *の絶対値を意味し、 II *

IIはベクトル *のノルムを意味する。

[0150] 次に、関数演算部 1151dにおいて、角度 Θ (f, τ )を要素とする関数である時間周波数マスク M(f, τ )を生成する (ステップ SI 54)。この例の場合、関数演算部 1151 dにおいて、まず、メモリ 1100の記憶領域 1108から実数パラメータ Θ , gを、記憶領

T

域 1112から角度 Θ (f, τ )を、それぞれ読み出す。そして、関数演算部 1151dは、

1(f)

口ジスティック関数

を時間周波数マスク M (f, τ )として算出する。なお、実数パラメータ θ , gは、それぞ

T

れ時間周波数マスク M(f, τ )の転移点と傾き度を指定するパラメータであり、前処理によって記憶領域 1108に格納しておいたものである。図 24Aに、二種類の実数パラメータ Θ , gに対し、式 (46)に従って算出された時間周波数マスク M(f, τ )を例示す

Τ

る。この図に例示すように、実数パラメータ Θ 力、さいほど、時間周波数マスク M(f,

T

τ )が大きな値 (この例では 1)をとる領域が狭くなる。これは実数パラメータ Θ が小さ

Τ

いほど、マスク処理選択信号 Υ ' (f, τ )に残存する妨害信号成分が少なくなるが、その反面、マスク処理選択信号 Υ ' (f, τ )が不自然なものとなると!/ヽつた傾向に現れる

1(f)

。例えば、音声信号を目的信号とする場合、実数パラメータ Θ を小さくするほどミュ

Τ

ージカルノイズ (musical noise)が大きくなる。また、実数パラメータ gが大きくなるほど時間周波数マスク M(f, τ )の波形 (大きな値 (この例では 1)力小さな値 (この例では 0)への遷移）は急峻になる。ここで、できるだけマスク処理選択信号 Υ ' (f, τ )に残存する妨害信号成分を減らし、マスク処理選択信号 Υ ' (f, τ )を自然な信号とするた

1(f)

めには実数パラメータ gを小さくし、時間周波数マスク M(f, τ )の波形を滑らかなものとすることが望ましい。

[0151] なお、これらの実数パラメータ 0 , gを周波数毎に設定しておく構成としてもよい。

T

また、さらに実数パラメータ αを導入し、ロジスティック関数

Μ( θ (ΐ, τ )) =

^(ί'^τ)~^ΘΎ)) -(47)

を時間周波数マスク M(f, τ )としてもよい。さらに、角度 Θ (f, τ )が 0に近い領域に

1(f)

おいて大きな値を採り、角度 Θ (f, τ )が大きな領域において小さな値を採る 0≤M( Θ (f, τ ))≤ 1の関数であれば、他の関数を時間周波数マスク M(f, τ )として用いてもよい (ステップ S104(マスク生成部 1151)の処理の詳細の説明終わり）。

[0152] [ステップ S 105 (マスキング部 1152)の処理の詳細]

マスキング部 1152は、メモリ 1100の記憶領域 1111から選択信号 Y (f, τ )を、記

1(f)

憶領域 1112から時間周波数マスク M(f, τ )をそれぞれ読み出す。そして、マスキング部 1152は、

Y '(f, r )=M(f, τ ) ·Υ (f, τ )…（48)

の演算によってマスク処理選択信号 Υ ' (f, τ )を求め、これをメモリ 1100の記憶領

1(f)

域 1113に格納する（ステップ S 105 (マスキング部 1152)の処理の詳細の説明終わり)。 [0153] [時間周波数マスキングの効果]

次に、上述した時間周波数マスク M(f,て )によるマスキングの効果について説明する。

信号源のスパース性が高ぐ信号源 S (f, τ )がゼロに近くなる可能性が高いなら、 k

式 (4)は、

[0154] [数 40]

X(f , τ) « H_k (f ) - S_k (f , τ) , k e {1,..., N} - (49) として近似される。なお、式 (49)における kは各信号源に対応する添字であり、時間周波数位置 (f, τ )毎に決まる。よって、目的信号が唯一アクティブ或いはそれに近い時間周波数位置 (f, τ )では、白色化混合信号ベクトル Z(f, τ )は、

[0155] [数 41]

Z(f ,て) V(f ) · H _I(f ) (f ) . S _I(f ) (f , τ) V(f ) · A_I(f ) (f) . Y_I(f ) (f,て）と近似できる。ここで、 Y (f, τ )はスカラ値である。また、前述のように白色化基底べタトル B (f)は、

1(f)

B (f)=V(f) - A (f) ---(50)

ΚΟ Kf)

である。以上より、目的信号が唯一アクティブ或いはそれに近い時間周波数位置 (f, τ )では、白色化混合信号ベクトル Z(f, τ )と白色化基底ベクトル B (f)とがなす角度 Θ (f, τ )は 0に近くなることが分かる。そして、前述のように時間周波数マスク M(f,

1(f)

て )は、角度 Θ (f, τ )が 0に近い領域において大きな値を採るのである。よって、時間周波数マスク M(f, τ )は、目的信号が唯一アクティブ或いはそれに近い時間周波数位置 (ί·, τ )における選択信号 Υ て）をマスク処理選択信号 Υ '(ί·, τ )として抽

Kf) Κ0

出するものと、える（式 (48)参照)。

[0156] 一方、仮に I(f)=lとおいた場合、目的信号が殆どアクティブでない時間周波数位置

(f, τ )では、白色化混合信号ベクトル Z(f, τ )は、

[0157] [数 42]

… (51) と近似できる。ここで、信号源の Nが、センサの数 Mと同等かそれより少ないならば、白色化空間でのベクトル V(f) ·Η (f),...,V(f) ·Η (f)は互いに直交する。なお、式（51

1 k

)の3 て）はスカラ値である。これより、白色化混合信号ベクトル Z(f, と白色化基 k

底ベクトル B (f)とがなす角度 Θ (f, τ )が大きくなることがわかる。また Ν>Μでも、 i(f) Κ0

白色化基底ベクトル B (f) (I(f)=l)は、目的信号以外のベクトル V(f)'H (f),...,V(f)-

1 2

H (f)とは大きい角度を持つ傾向がある。以上より、目的信号が殆どアクティブでない k

時間周波数位置 (f, τ )では、角度 Θ (f, τ )が大きな値を採ることが分かる。そして、時間周波数マスク M (f, τ )は、角度 Θ (f, τ )が 0から離れた領域にぉ、て小さな値を採るのであるから、目的信号が殆どアクティブでない時間周波数位置 (f,て )における選択信号 Y (f, τ )をマスク処理選択信号 Υ ' (f, τ )力も排除するものと!/、える (式 i(f) Κ0

(28)参照)。

[0158] 以上より、時間周波数マスク M (f, τ )による時間周波数マスキング処理は、選択信号 Y (f, τ )に残存する妨害信号成分をより一層抑圧するものであることがわかる。なお、この時間周波数マスキング処理は、音声や音楽などスパース性を持つ信号に対して特に有効である。スパース性が低い場合、目的信号がアクティブである時間周波数位置 (f, τ )であっても他の妨害信号成分も多く含まれ、式 (49)の近似が成り立たなくなり、角度 0 (f, τ )が 0から離れてしまうからである。すなわちスパースでな

1(f)

V、場合、例えば、図 24Βのように、ある時間周波数位置 (f,て )にお、て目的信号 (I (f )=1とする）に対応するベクトル V(f) ·Η (f)の他に、妨害信号に対応するベクトル V(f)

1

•H (f), V(f)-H (f)力共存すること〖こなる。この例の場合、白色化混合信号ベクトル Z

2 3

(f,て )は、

[0159] [数 43]

… （52) となるため、白色化混合信号ベクトル Z (f,て )と白色化基底ベクトル B (f)とがなす角

1(f)

度 0 (f, τ )も 0から離れてしまう。これは目的信号がアクティブである時間周波数位

1(f)

置 (f, τ )の信号をマスク処理選択信号 Υ ' (f, τ )力排除してしまう可能性があることを示している。また、この時間周波数マスキング処理は、目的信号のパワーが妨害信号のパワーに比べて十分に大きい場合に特に有効である。すなわち、目的信号のパワーが妨害信号のパワーに比べ十分に大きい場合、たとえスパース性が低ぐ目的信号がァクテイブである時間周波数位置 (f, τ )に他の妨害信号成分も含まれる状況であっても、式 (49)の近似が比較的成り立ち、角度 Θ (f, τ )が 0に近づくからである。例えば、目的信号のパワーが妨害信号のパワーに比べ十分に大きい場合、式（52)における妨害信号の寄与度は低くなり、白色化混合信号ベクトル Z (f, τ )と白色化基底べタトル B (f)とがなす角度 Θ (f, て )も 0に近づく。これは、目的信号がアクティブである時間周波数位置 (f, て )の信号が、マスク処理選択信号 Y ' (f, τ )力ら排除されてしま

1 (f)

う可能性を低くできることを示して、る。また、マスク処理選択信号 Υ ' (f, τ )に尚も

1 (f)

残存する妨害信号成分を相対的に低くできることを意味している (ステップ S105 (マスキング部 1152)の処理の詳細の説明終わり）。

[0160] 〔第 4の実施の形態（「第 2の本発明」の例)〕

次に、本発明における第 4の実施の形態について説明する。

本形態は、第 3の実施の形態の変形例であり、時間周波数マスクによる処理を行わない点のみが第 3の実施の形態と相違する。以下では、第 3の実施の形態との相違点を中心に説明し、第 3の実施の形態と共通する事項については説明を省略する。

<構成>

図 25は、第 4の実施の形態における信号分離装置 1200のブロック図の例示である

[0161] 図 25に例示するように、本形態の信号分離装置 1200の信号分離装置 1001との相違点は、メモリ 1100に記憶領域 1112, 1113を有しない点、及び時間周波数マスキング部 1150を有しな、点である。

<処理 >

次に、本形態における信号分離装置 1200の処理について説明する。図 26は、第 4の実施の形態における信号分離装置 1200の処理を説明するためのフローチャートである。以下では、第 3の実施の形態との相違点を中心に説明する。

[0162] まず、第 3の実施の形態と同様に、周波数領域変換部 1120において、メモリ 1100 の記憶領域 1101から時間領域の混合信号 x (t)を読み出す。そして、周波数領域変換部 1120は、これらを短時間フーリエ変換などにより周波数領域の混合信号 X (f, τ )に変換し、メモリ 1100の記憶領域 1102に格納する（ステップ S 161)。

次に、信号分離部 1130において、メモリ 1100の記憶領域 1102から周波数領域の混合信号 X (f, τ )を読み出す。この例の信号分離部 1130は、読み出した混合信号 X (f, τ )を要素とする混合信号ベクトル X (f, て ) =[X (f, τ ) , · · ·,Χ (f, て )]^Tに、独立 q 1

成分分析 (ICA)を適用し、周波数 f毎に M行 M列の分離行列 W (f) =[W (f) ,...,W (f)

1

f ( * ^Hは行列 *の複素共役転置行列）と分離信号ベクトル Y (f, τ ) =W (f) -X (f, τ )とを算出する (ステップ S162)。なお、算出された分離行列 W (f)はメモリ 1100の記憶領域 1103に格納される。また、分離信号ベクトル Y (f, τ ) =[Y (f, τ ) ,〜,Y (f, τ )]^Τを

1

構成する分離信号 Υ (f, τ ) (p e{l,..,M})は記憶領域 1107に格納される。

P

[0163] 次に、目的信号選択部 1140において、メモリ 1100の記憶領域 1103から分離行列 W (f)を読み出し、その一般ィ匕逆行列の列である基底ベクトルを正規ィ匕し、その正規ィ匕された基底ベクトルをクラスタリングする。そして、目的信号選択部 1140は、そのクラスタの分散を指標として、メモリ 1100の記憶領域 1107の分離信号から選択信号 Y (f, τ )を周波数 f毎に選択し、メモリ 1100の記憶領域 1111に格納する (ステツプ S163)。

次に、時間領域変換部 1160において、メモリ 1100の記憶領域 1111から選択された分離信号 Y (f, τ )を読み出し、それに短時間逆フーリエ変換などを施して時間領域の分離信号 y (t)を生成し、メモリ 1100の記憶領域 1114に格納する (ステップ S16 4)。

[0164] 〔第 5の実施の形態（「第 2の本発明」の例)〕

次に、本発明における第 5の実施の形態について説明する。

本形態は、第 3の実施の形態の変形例であり、時間周波数マスクの生成方法のみが第 3の実施の形態と相違する。以下では、第 3の実施の形態との相違点を中心に説明し、第 3の実施の形態と共通する事項については説明を省略する。

<構成>

図 27は、第 5の実施の形態における信号分離装置 1300のブロック図の例示である。また、図 28Aは、図 27における時間周波数マスキング部 1350の詳細構成を示すブロック図であり、図 28Bは、図 28Aのマスク生成部 1351の詳細構成を示すブロック図である。なお、これらの図において第 3の実施の形態と共通する部分については、第 3の実施の形態の図と同じ符号を付した。

[0165] 図 27に例示するように、本形態の信号分離装置 1300の信号分離装置 1001との相違点は、信号分離装置 1300が、時間周波数マスキング部 1150の代わりに時間周波数マスキング部 1350を有する点、メモリ 1100力記憶領域 1108, 1112の代わりに記憶領域 1308, 1312を有する点である。また、図 28Aに示すように、時間周波数マスキング部 1350は、マスク生成部 1351及びマスキング部 1152を有する。また、図 28Bに示すように、マスク生成部 1351は、周波数正規化部 1351a、ノルム正規化部 1351b、セントロイド抽出部 1351c、自乗距離算出部 135 Id及び関数生成部 1 351eを有している。また、周波数正規ィ匕部 1351aは、第 1正規ィ匕部 1351aa及び第 2正規ィ匕部 135 labを有しており、セントロイド抽出部 1351cは、セントロイド選択部 1 35 lea及びノルム正規化部 135 lcbを有している。

[0166] <マスク生成処理 >

本形態と第 3の実施の形態との相違点は、時間周波数マスクの生成処理 (ステップ S104)のみである。以下では、本形態の時間周波数マスクの生成処理のみを説明する。

図 29は、第 5の実施の形態における時間周波数マスクの生成処理を説明するためのフローチャートである。また、図 30Aは、図 29におけるステップ S171の詳細を説明するためのフローチャートである。また図 30Bは、図 29におけるステップ S172の詳細を説明するためのフローチャートである。以下、これらの図を用い、本形態の時間周波数マスクの生成処理を説明する。

[0167] まず、マスク生成部 1351の周波数正規化部 1351aが、メモリ 1100の記憶領域 11 02に格納されている周波数領域の混合信号 X (f,て）から構成される混合信号べタトル X (f, τ )を、周波数に依存しない周波数正規化ベクトル X' (f, τ )に正規化し (周波数正規化）、当該周波数正規化ベクトル X' (f, τ )の各要素 X (f, τ )をメモリ 1100 の記憶領域 1312に格納する（ステップ S 171)。 [周波数正規ィ匕処理 (ステップ S171)の詳細]

以下に、この周波数正規ィ匕処理 (ステップ S171)の詳細を説明する。

[0168] まず、制御部 1170 (図 27)においてパラメータ qに 1を代入し、これを一時メモリ 1 180に格納する（ステップ S181)。次に、周波数正規化部 1351a (図 28B)において、メモリ 1100の記憶領域 1308から前述のパラメータ d, c, Qを読み込み、記憶領域 1102から各 (f, τ )に対応する混合信号ベクトル X (f, τ )の要素 X (f, τ )を読み込み、一時メモリ 1180からパラメータ qを読み込む。そして、周波数正規ィ匕部 1351aは、 [数 44]

の演算を行い、当該演算結果を周波数正規化ベクトル X' (f, τ ) =[Χ ' (f, τ ) ,.,.,Χ ' (f,

1

τ )]^Τの各要素として、メモリ 1100の記憶領域 1312に格納する (ステップ S182)。なお、 arg [ · ]は偏角を意味し、 jは虚数単位を意味する。

より詳細には、まず、周波数正規ィ匕部 1351aの第 1正規ィ匕部 1351aaが、混合信号ベクトル X (f, τ )の特定の 1つの要素 X (f, τ )を基準として当該混合信号ベクトル X (f, τ )の各要素 X (f, τ )の偏角を、以下の演算によって正規ィ匕する。

[0170] [数 45]

X_q-(f,r) H X_q(f, ) | exp{j - arg[X_q(f,r)/X_Q(f,r)]} … ( 54 ) 次に、周波数正規ィ匕部 1351aの第 2正規ィ匕部 1351ab力第 1正規ィ匕部 1351aa で正規化された各要素 X '" (f, τ )の偏角を、以下のように周波数 fに比例した値 4fc— ¹ dで除算する。

[0171] [数 46]

次に、制御部 1170において、一時メモリ 1180に格納されたパラメータ qが q = Mを満たす力否かを判断する（ステップ S183)。ここで q = Mでなければ、制御部 1170は、 q+ 1の演算結果を新たなパラメータ qの値とし、これを一時メモリ 1180に格納し (ステツプ S184)、処理をステップ S 182へ戻す。一方、 q = Mであれば、制御部 1170はステップ S171の処理を終了させ、以下のステップ S 172の処理を実行させる（周波数正規ィ匕処理 (ステップ S171)の詳細終わり）。

[0172] 次に、マスク生成部 1351のノルム正規化部 1351b力メモリ 1100の記憶領域 131 2に格納されている各要素 X (f, τ )からなる周波数正規化ベクトル X' (f, τ )を、ノルムが所定の値 (この例では 1)になるノルム正規ィ匕ベクトル X， '（f, τ )に正規化し (ノルム正規化）、それら各要素 X " (f, τ )を記憶領域 1312に格納する (ステップ S17 2)。

[ノルム正規化処理 (ステップ S 172)の詳細]

以下に、このノルム正規ィ匕処理 (ステップ S 172)の詳細を説明する。

[0173] まず、ノノレム正規ィ匕咅 1351b (図 28B)において、メモリ 1100の記'隐領域 1312力ら、各 (f, τ )に対応する周波数正規化ベクトル X' (f, τ ) =[Χ ' (f, τ ) ,.,.,Χ ' (f, τ )]^Τを

1

読み込む。そして、ノルム正規ィ匕部 1351bは、

[0174] [数 47]

の演算を行ってそれらのノルム II X' (f, τ ) IIを求め、周波数正規ィ匕ベクトル X' (f, τ ) 及びノルム II X' (f, τ ) IIを一時メモリ 1180に格納する（ステップ S185)。

次に、ノルム正規ィ匕部 1351bは、一時メモリ 1180から各 (f, τ )に対応する周波数正規化ベクトル X' (f, τ )及びノルム II X' (f, τ ) IIを読み出し、

X" (f, r ) =X' (f, T ) / || X' (f, τ ) ||

の演算を行ってノルム正規化ベクトル X" (f, τ )を求める（ステップ S 186)。

[0175] 求められたノルム正規化ベクトル X" (f, τ )は、メモリ 1100の記憶領域 1312に格納される。これによりステップ S 172の処理が終了する（ノルム正規化処理 (ステップ S 17 2)の詳細の説明終わり）。

次に、セントロイド抽出部 1351cのセントロイド選択部 1351caが、一時メモリ 1180 力もクラスタ選択情報 tを読み込み (ステップ S141参照）、このクラスタ選択情報 t に対応するセントロイド r? ^をメモリ 1100の記憶領域 1110から読み込む (ステップ S1 73)。次に、ノルム正規ィ匕部 135 lcbが、セントロイド選択部 135 leaが読み込んだセントロイド 7? のノルムを所定の値 (ステップ S 172の所定の値〔この例では 1〕）に正規化する。このノルム正規化後のセントロイド 7} をノルム正規化セントロイド 7} ，と呼ぶ (ステップ S174)。なお、ノルム正規化の手順は、ステップ S185, S186と同様である。また、ノルム正規化セントロイド η ，は、メモリ 1100の記憶領域 1312に格納される

[0176] 次に、自乗距離算出部 1351dが、メモリ 1100の記憶領域 1312から、ノルム正規化ベクトル X" (f, て )とノルム正規ィ匕セントロイド 7? ，とを読み込み、それらの距離の自乗

DS (f, τ ) = || η ，― Χ，，(ί·, τ ) || ²

を算出し (ステップ S 175)、その距離の自乗 DS (f, τ )をメモリ 1100の記憶領域 1312 に格納する。

次に、関数生成部 1351eが、メモリ 1100の記憶領域 1312から距離の自乗 DS (f, τ )を読み込み、これを変数とする関数を用いて時間周波数マスク M (f, τ )を生成し、メモリ 1100の記憶領域 1312に格納する (ステップ S176)。具体的には、関数生成部 1351eは、例えば、メモリ 1100の記憶領域 1308から実数パラメータ g, Dを読み

T

込み、以下のロジスティック関数を時間周波数マスク M (DS (f, τ ) )として生成する。なお、 Dは事前に記憶領域 1308に格納しておいたものである。また、 eはネピア数で

T

ある。

[0177] [数 48] 攀 ^(f，て ^{)) =} _{1 + e}g卿 - W … （^{5 6 )} そして、以上のように生成された時間周波数マスク M (DS (f, τ ) )は、第 3の実施の形態と同様、マスキング部 1152でのマスキング処理に用いられる。

〔実験結果〕

第 3,第 4の実施の形態の効果を示すために、マイクロホンに近い主要音声を強調して抽出する実験を行った。この実験では、図 31 Αに示す実験条件でインパルス応答 h (r)を測定した。ここでは、カクテルパーティの状況を再現するようにスピーカを qk

配置した。また、全てのスピーカの音量はほぼ等しくなるようにし、特別なスピーカの音量のみが著しく大きくならないようにした。マイクロホンでの混合は、 8kHzでサンプリングした 6秒間の英語音声を、測定したインパルス応答と畳み込むことにより作成した。マイクロホン配置は、図 31Aに示すように 3次元的にした力信号分離装置を実装したシステム（装置）には、基準マイクロホン (Mic.2)とその他のマイクロホン間の最大距離 (3.5cm)のみを情報として与え、詳細なマイクロホン配置は与えていない。各実験において、マイクロホンに近い 4つのスピーカ位置（al20,bl20,cl20,cl70)の中力も 1つを目的音源として選び、残りの 3つのスピーカは無音状態にした。マイクロホン力離れた 6個のスピーカは、各実験で常に妨害音として作動させた。抽出結果は Input SIR— Output SIRである; R (signal— to— interference ratio)の改善量によつ飞評価した。この値が大きいほど、より良く目的音声を抽出し、他の妨害音をより抑圧できたことを意味する。これら 2種類の SIRは、

[数 49]

InputSIR = 10 log₁₀ ^{11 1} ~~ - ( d Β )

<|∑_k≠1∑_rh_lk(r)- s_k(t -り I 〉_t ハ _{+ +}c_TD mi , ,_R ,

OutputSIR = lOlogjo ( dB)

によって定義される。ここで、 u_lk(r) =∑^∑¾w_]q(r) . h_qk(r - r) は s (t)力ら y (t)へのインパルス応答である。

k 1

実験は、各目的音源位置に対して、 7つの音声（目的音声 1個と妨害音声 6個)力なる組合せを 16種類作成して行った。図 31Bは、 ICAのみの場合 (第 4の実施の形態）と、 ICAと時間周波数マスキングの両方を組み合わせた場合 (第 3の実施の形態）との SIRの平均改善量を示す表である。 SIRの改善量は、目的音源の位置によって多少左右されるが、おおむね良好な結果を得ている。位置 al20と bl20とでの結果が良いのは、妨害音が異なった位置から到来するからである。位置 cl20と cl70は、 2次元的に見ると、同様の方向から多くの妨害音が到来するため困難な位置に思えるが、実際に位置 cl70での結果は大変良力つた。これは、 cl70の高さが妨害音と異なり、 3 次元状に配列されたマイクロホンによって、本システムが高さの違いを自動的に利用して抽出処理を行っているからである。また、図 31Bの表によると、時間周波数マスキングにより性能が改善されることが分かる。時間周波数マスクを決定する式 (46)に対して図 31Aに示す 3種類のパラメータを用いた。より小さい Θ を用いることで、より大

T

きい SIR改善量が達成されている。しかしながら、小さい Θ によるいくつかの音は、不

T

自然な音 (musical noise)を伴った。実験の結果、多くの場合においてパラメータ（ 0

T

,g) = (0.333 π ,20)が、十分に妨害音の抑圧を行、ながら、かつ自然な音を出力することを確認した。

[0179] 〔変形例等〕

なお、本発明は上述の第 3から第 5の実施の形態に限定されるものではない。例えば、上述した各実施の形態では、信号分離部 1130において Μ行 Μ列の分離行列 W (f)を算出することとしたが、 N行 M列など正方行列以外の分離行列 W(f)を算出する構成としてもよい。この場合、基底ベクトルは、分離行列 W (f)の一般ィ匕逆行列 W+ (f ) (例えばムーア ·ペンローズ（Moore- Penrose)型一般化逆行列）の各列となる。

また、第 3の実施の形態では、時間周波数マスクを用いて選択信号 Y (f, τ )から

Kf)

妨害信号成分をさらに抑制したマスク処理選択信号 Υ ' (f, τ )を生成することとした力他の方法によって妨害信号成分を抑制したマスク処理選択信号 Υ ' (f, τ )を生成することとしてもよい。例えば、信号源が 2個だけである場合、抽出された分離信号 Y (f, τ ) , Y (f, τ )の大きさを比較し、 I Y (f, τ ) I > I Y (f, τ ) Iならば Υ (f, τ )を

1 2 1 2 1 マスク処理選択信号 Υ ' (f, τ )として抽出し、 Y (f, τ ) Y (f, τ ) Υ (

1 (f) I 1 Iく I 2 Iならば

2 f, τ )をマスク処理選択信号 Υ ' (f, τ )として抽出する時間周波数マスクを生成し、分離信号 Y (f, τ ) , Y (f, τ )を要素とするベクトルに掛け合わせることとしてもよい。

1 2

[0180] さらに、上述の第 3の実施の形態では、信号分離部 1130が独立成分分析 (ICA)を用いて分離行列と分離信号とを算出することとしたが、時間周波数マスク (時間周波数毎のマスクを意味し、例えば、 1か 0の値をとるバイナリマスク）によって観測信号から分離信号を抽出し（例えば、「〇. Yilmaz and S. Rickard, "Blind separation of speec h mixtures via time-frequency masking, IEEE Trans, an SP, vol. 52, no. 7, pp. 183 0-1847, 2004.」参照）、その算出結果力も分離行列を生成することとしてもよい。また、上述の第 3の実施の形態では、周波数正規ィ匕部 1142aの第 1正規ィ匕部 114 2aaが、基底ベクトル A (f)の特定の 1つの要素 A (f)を基準とし、式（35)の一部であ

P QP

る式（15)によって当該基底ベクトル A (f)の各要素 A (f)の偏角を正規化することと

P QP

した。しかし、例えば、前述した式 (27-1)〜（27-3)等に従って、第 1正規化部 1142a aが、基底ベクトル A (f)の特定の 1つの要素 A (f)を基準として、当該基底ベクトル A

P QP

(f)の各要素 A (f)の偏角を正規ィ匕する構成であってもよ!/、。

P QP

[0181] また、周波数正規ィ匕部 1142aが、式（35)の代わりに、前述した式 (28-1)〜（28-4) 等の演算によって周波数正規ィ匕を行うこととしてもよい。

また、上述の第 3の実施の形態では、ノルム正規化部 1142bにおいてノルムが 1になるような正規ィ匕を行った力ノルムが 1以外の規定値となるように正規ィ匕を行ってもよい。さらに、ノルム正規ィ匕部 1142bを設けず、ノルム正規ィ匕を行わない構成であつてもよい。この場合のクラスタリングは、前述した通り、ベクトルの方向の類似度を基準にして行う。

[0182] また、パラメータ dは、全てのセンサ qに対して同一であってもよ!/、し、各センサ qに対応して複数の値を設定しておいてもよい。例えば、基準センサとセンサ qとの距離を、それぞれのセンサ qに対応するパラメータ dの値としてもよ、。

〔第 6の実施の形態（「第 3の本発明」の例)〕

次に、本発明における第 6の実施の形態について説明する。

本形態は、前述の原理を用い、センサの厳密な配置情報を必要とすることなぐ全ての観測信号力得られた情報を容易かつ効率的に利用して信号分離を行う形態である。本形態では、後述する「混合信号ベクトル」が前述の「複素ベクトル」に相当する。

[0183] <構成 >

本形態の信号分離装置 2001も、第 1の実施の形態と同様、公知のノイマン型のコンピュータに信号分離プログラムが読み込まれることにより構成される。図 32は、第 6 の実施の形態における信号分離装置 2001の構成を例示したブロック図である。また、図 33は、図 32における信号分離部 2120の詳細を例示したブロック図である。なお、これらの図における実線の矢印は実際のデータの流れを示し、破線の矢印は理論的な情報の流れを示す。また、これらの図において制御部 2140に出入りするデータの流れに対応する矢印は省略してある。

[0184] 図 32,図 33に例示するように、信号分離装置 2001は、メモリ 2100、周波数領域変換部 2110 (「複素ベクトル生成部」に相当する機能を含む)、信号分離部 2120、時間領域変換部 2130及び制御部 2140を有している。また、この信号分離部 2120 は、周波数正規化部 2121 (「正規化部」を構成）、ノルム正規化部 2122 (「正規化部」を構成）、クラスタリング部 2123及び分離信号生成部 2124を有している。また、周波数正規ィ匕部 2121は、第 1正規ィ匕部 2121a及び第 2正規ィ匕部 2121bを有している。また、制御部 2140は一時メモリ 2141を有している。

[0185] ここでメモリ 2100及び一時メモリ 2141は、レジスタ 10ac、補助記憶装置 10f及び R AMIOd等に相当する。また、周波数領域変換部 2110、信号分離部 2120、時間領域変換部 2130及び制御部 2140は、 CPUlOaに OSプログラムや信号分離プロダラムが読み込まれ、 CPUlOaがこれらを実行することにより構成されるものである。

<処理 >

次に、本形態の信号分離装置 2001の処理について説明する。なお、以下では、 N 個の源信号が混合され、 M個のセンサで観測された状況を取り扱う。また、前処理において、各センサで観測された時間領域の混合信号 X (t) (q=l,...,M)がメモリ 2100 の記憶領域 2101に格納され、信号の伝達速度 c、 M以下の自然数から選択された基準値 Q, Q' (それぞれ M個のセンサ力も選択された基準センサの添字番号)及び実数 dの各パラメータが記憶領域 2105に格納されているものとする。

[0186] 図 34は、本形態における信号分離装置 2001の処理の全体を説明するためのフロ一チャートである。以下、この図に沿って、本形態における信号分離装置 2001の処理を説明していく。

[処理の全体]

まず、周波数領域変換部 2110において、メモリ 2100の記憶領域 2101から時間領域の混合信号 X (t)を読み出し、これらを短時間離散フーリエ変換等によって周波数毎の時系列信号（「周波数領域の混合信号」と呼ぶ) X (f, て ) (q=l ,… 、 i≡0,f/L, - , f (L-l) /L、 f はサンプリング周波数）に変換し、メモリ 2100の記憶領域 2102に格納する（ステップ S 201)。

[0187] 次に、信号分離部 2120の周波数正規ィ匕部 2121において、メモリ 2100の記憶領域 2102から周波数領域の混合信号 X (f, τ )を読み出す。周波数領域の混合信号 X (f, τ )を読み出した周波数正規ィ匕部 2121は、これらからなる混合信号ベクトル X (f, て ) =[X (f, て ) , ...,X (f, て )]^Tを、周波数 fに依存しない周波数正規化ベクトル X

1 ， (f, て

)に正規化する (ステップ S202)。生成された各周波数正規化ベクトル X ' (f, τ )はメモリ 2100の記憶領域 2103に格納される。なお、ステップ S202の処理の詳細については後述する。

[0188] 次に、信号分離部 2120のノルム正規化部 2122において、メモリ 2100の記憶領域 2103から各周波数正規ィ匕ベクトル X， (f, τ )を読み込み、これらをノルムが所定の値 (例えば 1)になるノルム正規ィ匕ベクトル X" (f, τ )に正規化する。そして、ノルム正規化部 2122は、生成した各ノルム正規ィ匕ベクトル X" (f, τ )をメモリ 2100の記憶領域 2 104に格納する（ステップ S203)。なお、この詳細については後述する。

次に、信号分離部 2120のクラスタリング部 2123において、メモリ 2100の記憶領域 2104から各ノルム正規ィ匕ベクトル X" (f, τ )を読み込み、これらをクラスタリングし、クラスタを生成する。そして、クラスタリング部 2123は、各クラスタを特定するクラスタ情報じ（k (k=l ,...,N)番目のクラスタのメンバ X" (f, τ )を特定する情報）をメモリ 2100の k

記憶領域 2106に格納する（ステップ S204)。なお、この詳細については後述する。

[0189] 次に、信号分離部 2120の分離信号生成部 2124において、メモリ 2100の記憶領域 2106, 2105からクラスタ情報 C及び基準値 Q 'を読み込む。そして、分離信号生 k

成部 2124は、クラスタ情報 C及び基準値 Q 'を用い、 k番目のクラスタに属するノル k

ム正規化ベクトル X" (f, て )に対応する混合信号ベクトル X (f, τ )から Q，番目の要素 X (f, τ )を記憶領域 2102から抽出し、これを k番目の要素 Y (f, τ )とした分離信号べ

Q， k

タトル Y (f, τ )を生成する。そして、分離信号生成部 2124は、生成した分離信号べクトル Y (f, τ )をメモリ 2100の記憶領域 2107に格納する（ステップ S 205)。なお、この詳細については後述する。

[0190] 最後に、時間領域変換部 2130において、メモリ 2100の記憶領域 2107から分離信号ベクトル Y (f, τ )を読み込み、その分離信号成分 Y (f, τ )を添字 k毎に短時間逆 k

フーリエ変換等により、時間領域の分離信号 y (t)

k に変換する。そして、時間領域変換部 2130は、変換した時間領域の分離信号 y (t)をメモリ 2100の記憶領域 2108 k

に格納する（ステップ S 206)。

次に、各処理の詳細について説明する。

[周波数正規ィ匕部 2121 ·ノルム正規ィ匕部 2122の処理の詳細]

周波数正規化部 2121及びノルム正規化部 2122は、全ての混合信号ベクトル X (f, τ ) =[Χ (f, T ) ,...,X (f, ]^T (M),f /L, " - ,f (L- 1) /L)を正規ィ匕し、それらを周波数に

1 s s

依存せず、信号源の位置のみに依存するノルム正規化ベクトル X" (f, て )に正規化する。これにより、それらをステップ S204でクラスタリングした際に、各クラスタが各信号源のみに対応するようになる。この正規ィ匕を適切に行わないとクラスタが形成されない。前述した通り、本形態における正規ィ匕は、周波数正規化とノルム正規化とからなる。周波数正規化は、周波数正規ィ匕部 2121において、混合信号ベクトル X (f, τ )を周波数に依存しない周波数正規化ベクトル X' (f, て )に正規ィ匕するものである。ノルム正規化は、ノルム正規ィ匕部 2122において、周波数正規化ベクトル X' (f, τ )をノルムが規定値 (この例では 1)をとるノルム正規ィ匕ベクトル X" (f, τ )に正規ィ匕するものである。以下にこれらの正規ィ匕の詳細を説明する。

[0191] [周波数正規ィ匕部 2121における処理の詳細 (ステップ S202の処理の詳細）] 図 35Αは、図 34に示したステップ S202の処理の詳細を説明するためのフローチヤートである。以下、この図に沿ってステップ S202の処理の詳細を説明する。

まず、制御部 2140 (図 32)においてパラメータ qに 1を代入し、これを一時メモリ 21 41に格納する（ステップ S211)。次に、周波数正規ィ匕部 2121 (図 32,図 33)において、メモリ 2100の記憶領域 2105から前述のパラメータ d, c, Qを読み込み、記憶領域 2102から各 (f, τ )に対応する混合信号ベクトル X (f, τ )の要素 X (f, τ )を読み込み、一時メモリ 2141からパラメータ qを読み込む。そして、周波数正規ィ匕部 2121は、

[0192] [数 50]

の演算を行い、当該演算結果を周波数正規化ベクトル X' (f, τ)=[Χ ' (f, τ ) ,.,.,Χ ' (f,

1

τ )]^Τの各要素として、メモリ 2100の記憶領域 2103に格納する (ステップ S212)。なお、 arg [ · ]は偏角を意味し、 jは虚数単位を意味する。

より詳細には、まず、周波数正規ィ匕部 2121の第 1正規ィ匕部 2121aが、混合信号べタトル X(f, τ )の特定の 1つの要素 X (f, τ )を基準として当該混合信号ベクトル X(f, τ )の各要素 X (f, τ )の偏角を、以下の演算によって正規ィ匕する。

[0193] [数 51]

X_q"'(f,T)HX_q(f, )|exp{j.arg[X_q(f,r)/X_Q(f,T)]} … （61) 次に、周波数正規ィ匕部 2121の第 2正規ィ匕部 2121bが、第 1正規ィ匕部 2121aで正規化された各要素 X '"(f, τ )の偏角を、以下のように周波数 fに比例した値 4fc— で除算する。

[0194] [数 52] arg[X '"(ί,τ)]

X。'(f,て )=|X。'"(f,T)|_eXp J- (62)

4fc一¹ d 次に、制御部 2140において、一時メモリ 2141に格納されたパラメータ qが q = Mを満たす力否かを判断する（ステップ S213)。ここで q = Mでなければ、制御部 2140は、 q+1の演算結果を新たなパラメータ qの値とし、これを一時メモリ 2141に格納し (ステツプ S214)、処理をステップ S212へ戻す。一方、 q = Mであれば、制御部 2140はステップ S202の処理を終了させ、以下のステップ S203の処理を実行させる。

[0195] [ノルム正規ィ匕部 2122における処理の詳細 (ステップ S203の詳細） ]

図 35Bは、図 34に示したステップ S203の処理の詳細を説明するためのフローチヤートである。以下、この図に沿ってステップ S303の処理の詳細を説明する。

ノノレム正規ィ匕咅 2122(図 32,図 33)において、メモリ 2100の記'隐領域 2103力ら、各 (f, τ )に対応する周波数正規化ベクトル X' (f, τ)=[Χ ' (f,て ) ,.,.,Χ ' (f,て；)] 'を読み込む。そして、ノルム正規化部 2122は、

[0196] [数 53]

||x'(f，て )| ∑_q ^M x_q'(f,て))² の演算を行ってそれらのノルム II X' (f, て ) IIを求め、周波数正規ィ匕ベクトル X' (f, τ ) 及びノルム II X' (f, τ ) IIを一時メモリ 2141に格納する（ステップ S221)。

次に、ノルム正規ィ匕部 2122は、一時メモリ 2141から各 (f, て )に対応する周波数正規化ベクトル X' (f, τ )及びノルム II X' (f, τ ) IIを読み出し、

X" (f,

T ) / || X' (f, T ) II - (63)

の演算を行ってノルム正規化ベクトル X" (f, τ )を求める（ステップ S222)。求められた各ノルム正規化ベクトル X" (f, τ )は、メモリ 2100の記憶領域 2104に格納される。これによりステップ S203の処理が終了する。

[0197] このように生成されたノルム正規ィ匕ベクトル X" (f, て )は、周波数に依存せず、信号源の位置のみに依存するベクトルとなる。その結果、このノルム正規ィ匕ベクトル X" (f, て )はクラスタを形成すること〖こなる。以下にこの理由を説明する。

[ノルム正規ィ匕ベクトル X" (f, て )がクラスタを形成する理由]

本形態では源信号のスパース性を仮定しているので、混合信号ベクトル X (f, τ )の各要素 X て）は、源信号 ρに対応する信号源 kからセンサ qへの周波数応答 Η に比例した (ある複素数スカラである源信号 S (f, τ )が掛力つた)ものになっている (X (f

k q

, τ ) =Η (f, T ) - S (f, τ ) )。

qk k

[0198] これらの源信号 S (f, τ )は離散時間に応じて (すなわち位相に応じて)変化するが、

k

当然ながら、周波数 fが同じであれば、センサ qで観測される源信号 S (f, τ )の偏角と

k

、基準センサ Qで観測される源信号 S (f, τ )の偏角との相対値は離散時間が変化し

k

ても一定である。

前述のように、周波数正規ィ匕部 2121の第 1正規ィ匕部 2121aは、混合信号ベクトル X (f, τ )の特定の 1つの要素 X (f, τ )を基準として当該混合信号ベクトル X (f, τ )の

Q

各 X (f, τ )の偏角を正規化する。

[0199] これにより、上述の源信号 S (f, τ )の位相に起因する不確定性を取り除き、源信号 ρ とセンサ qとに対応する混合信号ベクトル X (f, τ )の各要素 X (f, τ )の偏角を、源信号 pと基準センサ Q (基準値 Qに対応)とに対応する混合信号ベクトル X (f, て )の要素 X

Q

(f, て )の偏角に対する相対値として表現する。なお、この場合、要素 X (f, て )の偏角

Q

に対応する相対値は 0と表現される。

信号源 kからセンサ qへの周波数応答を、反射や残響の無!、直接波モデルで近似して考える。すると、上記の第 1正規ィ匕部 2121aにより正規ィ匕された偏角は、信号源 k力もセンサへの波の到達時間差と周波数 fの双方に比例したものになる。ここでの到達時間差とは、信号源 kからの波がセンサ qに到達するまで時間と、当該波が基準センサ Qに到達するまでの時間との時間差である。

[0200] また、前述のように、第 2正規ィ匕部 2121bは、第 1正規ィ匕部 2121aで正規ィ匕された各要素 X "' (f, て )の偏角を周波数 fに比例した値で除算する。これにより、各要素 X ' " (f, τ )を、それらの偏角の周波数依存性を排除した各要素 X ' (f, τ )に正規化する。これにより、正規化された各要素 X ' (f, τ )は、直接波モデルに従えば、信号源 kからセンサへの波の到達時間差のみに依存するものとなる。ここで、信号源 kからセンサへの波の到達時間差は、信号源 k,センサ q,基準センサ Qの相対位置にのみ依存する。そのため、信号源 k,センサ q,基準センサ Qが同じであれば、周波数 fが異なっても各要素 X ' (f, τ )の偏角は同一となる。従って、周波数正規化ベクトル X' (f, τ )は、周波数 fには依存せず、信号源 kの位置のみに依存する。そのため、周波数正規化ベクトル X' (f, τ )のノルムを正規化したノルム正規化ベクトル X" (f, τ )のクラスタリングによって、同じ信号源毎に対応するクラスタが形成される。なお、実際の環境では、反射や残響などの影響により、直接波モデルは厳密には満たされないが、後述の実験結果に示すとおり十分に良、近似となって、る。

[0201] 次に、ノルム正規ィ匕ベクトル X" (f, τ )がクラスタを形成する理由を、モデルを用いて説明する。

前述した式（1)に示されるインパルス応答 h (r)を直接波 (近距離場)混合モデルを

qk

用いて近似し、周波数領域で表すと、

[0202] [数 54] H_qk(f) = ^¾χρΗ2πί·(Γ - d_Qk)] ( 6 4 )

qk となる。：で、 d は信号源 kとセンサ qとの間の距離であり、 γ (ί)は周波数に依存した定数である。また、減衰 γ (f)/d は、距離 d と定数 γ (f)によって決まり、遅延 qk qk (d qk

-d ) /cは、基準センサ Qの位置で正規ィ匕された距離によって決まる。

Qk

また、信号のスパース性を仮定すると、各時間周波数 (f, て )において以下の関係が成り立つ。

[0203] X (f, τ ) =Η (f, T ) - S (f, τ ) (65)

ここで、式（62) (63) (64) (65)より、

[数 55]

X_D"(f,て)

( 6 6 )

d_qkD 2 d ik となる。

この式力ら分力、るように、ノルム正規ィ匕ベクトル X" (f, τ )の各要素 X " (f, τ )は、周波数 fからは独立であり、信号源 kとセンサ qの位置のみに依存する。従って、ノルム正規ィ匕ベクトルをクラスタリングすると、同じ信号源ごとに対応するクラスタが形成される。

[0205] また、同様なことは、信号の減衰を考慮していない近距離場混合モデルや遠距離場混合モデルでモデルィ匕した場合にも言える（1の実施の形態と同様)。

また、第 1の実施の形態と同様、式 (66)から、ノラメータ dの値は、 d>d Z2であ max ることが望ましく（d は要素 X " (f, て )に対応する基準センサと他のセンサとの最大 max Q

距離を意味する。）、より好ましくは d≥d であることが望ましぐさらにより好ましくは d

max

=d であることが望ましいことが分かる。

max

図 37及び図 38は、パラメータ d毎のノルム正規化ベクトル X" (f, τ )の要素 X " (f, τ )と、その偏角 arg[X " (f, て；)]との関係を説明するための複素平面図である。なお、これらにおける横軸は実軸を縦軸は虚軸を示して、る。

[0206] 図 37Aは d Z2≥dの場合における複素平面図である。ここで上述の d の定義より、任意の q及び kに対し d - d の絶対値は d 以下となる。よって d Z2≥dの場合 qk Qk max max

、（π/2) · ((1 - d )/d≤- π, (π/2) · ((1 - d )/d≥ πと成り得る。その結果、式（66 qk Qk qk Qk

)で表される X " (f, τ)の偏角 arg[X " (f, τ )]は、 2 πを超える α ≤arg[X " (f, τ)] q q 1 Q

≤ ( ≤-π, ≥ π )の範囲に分布する可能性がある。そのため、異なるノルム

2 1 2

正規化ベクトル X" (f, τ )の要素 X " (f, τ )の偏角が一致する可能性があり、前述したクラスタリングにおいて、異なるノルム正規ィ匕ベクトル X" (f, τ )を同じクラスタにクラスタリングしてしまう可能性がある。よって、 d>d Z2であることが望ましい。しかし、 max

この偏角の重複範囲に対応するノルム正規化ベクトル X"(f, τ )のサンプルが存在しないならば d

max Z2≥dとしても問題はない。

[0207] 図 37Bは d /2<d<d の場合における複素平面図である。この場合、- π < ( max max

π/2) · (ά -d )/d<- π/2, π/2< (π/2) · ((1 - d )/d< πと成り得る。その結果、 qk Qk qk Qk

式 (66)で表される X " (f, τ )の偏角 arg[X " (f, τ )]は、 β ≤arg[X " (f, τ)]≤ β ( q q 1 Q 2

—πぐ β <-π/2, π/2< β く π )の範囲に分布する可能性がある。そのため、- π

1 2

<arg[X " (f， τ)]<- π/2及び 7u/2<arg[X " (f， τ )]< πの範囲において、異なるノルム正規ィ匕ベクトル X" (f, τ )の要素間における偏角の差の増加に伴い、これらの要素間の距離が単調増加しないこともありうる。これは、前述したクラスタリングの精度を低下させる可能性がある。よって d≥d であることがより望ましい。

max

[0208] 図 38Aは d=d の場合における複素平面図であり、図 38Bは d>d の場合にお max max

ける複素平面図である。ここで d>d の場合、- π/2く（π/2) · ((1 - d )/d<0, 0< max qk Qk

(π/2) · (ά - d )Α π/2と成り得る。その結果、式 (66)で表される X " て）の偏 qk Qk q

角 arg[X " (f， τ)]は、図 38Bに示すように、 y ≤arg[X " (f, τ)]≤ γ (~π/2< y q 1 q 2 1 く 0、 0< y < π/2)の範囲に分布する。そして、 dが大きくなればなるほどその分布

2

範囲は狭くなつていき、狭い範囲にクラスタが密集していく。これは、前述したクラスタリングの精度を低下させる。

[0209] これに対し、 d = d である場合、— π/2≤ (π/2) · ((1 — d )/d<0, 0く（π/2) · ((1 max qk Qk qk

- d )/d≤ π/2と成り得る。その結果、式 (66)で表される X " (f, τ )の偏角 arg[X " (f

Qk q q

, τ)]は図 38Aに示すように- 7u/2≤arg[X " (f, τ )]≤ π /2の範囲に分布する。この場合、ノルム正規ィ匕ベクトル X" (f, τ )の要素間における偏角の差の増加に対して、それらの距離も単調増加するという関係を維持しつつ、できるだけ広い範囲にクラスタを分散させることができる。その結果、一般的にクラスタリングの精度を向上させることができる（[周波数正規ィ匕部 2121 ·ノルム正規ィ匕部 2122の処理の詳細]の説明終わり）。

[0210] [クラスタリング部 2123の処理の詳細 (ステップ S204の詳細） ]

前述のようにクラスタリング部 2123は、メモリ 2100の記憶領域 2104からノルム正規化ベクトル X" (f, τ )を読み込み、これらをクラスタリングして Μ個のクラスタを生成する。このクラスタリングは、例えば、各クラスタのメンバ (X" (f, z )≡C )と各クラスタのセ k

ントロイドとの間の二乗和 uの総和 U

k k

[0211] [数 56]

^Uk ⁼∑x"(f, _eCk |X"(^f，て) - ¾f を最小化することを基準に行われる。この最小化は、例えば、非特許文献 6などで解説されている k-meansクラスタリングを用いることによって効果的に行うことができる。なお、クラスタ情報 Cが示すクラスタのセントロイド（中心ベクトル） η は、

k k

[0212] [数 57]

∑X"₍f， _eCkx"(f，て) /| c_k l

¾ =

∑x"(f ^c.x' ¹，て) zi ^ck I によって計算される。ここで I c I はクラスタ情報 cが示すクラスタのメンバ (ノルム正 k k

規化ベクトル X" (f, τ ) )の数である。また、ここでは、距離としてユークリッド距離の自乗を用いて、るが、これを一般ィ匕したミンコフスキー距離などを用いてもょヽ（ [クラスタリング部 2123の処理の詳細]の説明終わり）。

[分離信号生成部 2124の処理の詳細 (ステップ S205の詳細） ]

図 36は、図 34に示したステップ S 205の処理の詳細を説明するためのフローチヤートである。以下、この図に沿ってステップ S205の処理の詳細を説明する。

まず、制御部 2140 (図 32)において、全てのパラメータ k (k = l , · · · , N)及び時間周波数 (f, τ ) (定義された範囲における全ての fと τ )に対する Y (f, τ )の値を 0に k

初期化し、これらをメモリ 2100の記憶領域 2107に格納する（ステップ S230)。

次に、制御部 2140においてパラメータ kに 1を代入し、これを一時メモリ 2141に格納する（ステップ S231)。次に、分離信号生成部 2124 (図 32,図 33)において、メモリ 2100の記憶領域 2106のクラスタ情報 Cを読み込み、これが示す k番目のクラスタ k

のメンバ（ノルム正規ィ匕ベクトル X" (f, τ ) )を抽出し、これらを一時メモリ 2141に格納する (ステップ S232)。次に、分離信号生成部 2124は、ステップ S232で一時メモリ 2 141に格納された各ノルム正規ィ匕ベクトル X" (f, τ )を参照し、これらに対応する時間周波数 (f, τ )の各混合信号ベクトル X (f, τ )をメモリ 2100の記憶領域 2102から読み込み、これらを一時メモリ 2141に格納する (ステップ S233)。次に、分離信号生成部 2124は、メモリ 2100の記憶領域 2105から基準値 Q，を読み込み、一時メモリ 2141 から、ステップ S233で格納された混合信号ベクトル X (f, τ )の Q '番目の要素 X (f, τ )を抽出する (各時間周波数 (f, て )について)。そして、分離信号生成部 2124は、抽出した要素 X (f, τ )を分離信号ベクトル Y (f, τ )の k番目の要素 Y (f, τ )としてメモ

Q k

リ 2100の記憶領域 2107の値を更新する (ステップ S234)。すなわち、この例の分離信号生成部 2124は、

[0214] [数 58]

として要素 Y (f

k , を抽出する。

次に、制御部 2140において、一時メモリ 2141に格納されたパラメータ kが k=Nを満たす力否かを判断する（ステップ S235)。ここで k=Nでなければ、制御部 2140は、 k+ 1の演算結果を新たなパラメータ kの値とし、これを一時メモリ 2141に格納し (ステツプ S236)、処理をステップ S232へ戻す。一方、 k=Nであれば、制御部 2140はステップ S205の処理を終了させる（[分離信号生成部 2124の処理の詳細]の説明終わり）。

[0215] <実験結果 >

次に、本形態による音源分離実験結果を示す。ここでは、本形態の効果を示すために二種類の信号分離の実験を行った。

1つ目の実験は、 2つのセンサによる分離実験である。その実験条件は図 39Aに示す通りである。信号源の数は 3つであり、 6秒間の英語の音声をスピーカから流した。また、この実験結果を図 39Bの表に示す。この表では、 SIR (signaH:o-interference ra tio)の向上量を示している。大きい数字ほど分離性能が良いことを示す。ここでは、分離前のセンサでの観測結果 [InputSIR]と、 DOAによるクラスタリングによる結果 [D OA (Previous) ]と、本形態（正規化によるクラスタリング）による結果 [Normalized obse r. vector (Proposed) ]を示している。この結果より、 2つのセンサの場合、本形態の方法によって、 DOAのみによるクラスタリング結果と同等の性能で信号分離が可能であることが確認できた。

[0216] 2つ目の実験は、不規則なセンサ配置によるものである。実験条件は図 40Aに示す通りである。この実験では、 4つの無指向性マイク（センサ）を直線的ではない配置とした。また、これらの配置情報としては、マイク間隔の上限が 4cmであるということだけを分離システムに与えた。信号源の数は 4つであり、 6秒問の英語の音声をスピー力力流した。このようなセンサや信号源の配置において DOAを使おうとすると、それぞれのセンサペア毎に DOAを推定→センサペア毎にクラスタリング→全てのセンサペアについでのクラスタリング結果を統合、という繁雑な処理を行う必要がある。しかし、本形態の方法ではそのような繁雑な統合処理を行うことなぐ図 40Bの表に示すような高い分離性能を得ることができる。また、 2つ目の実験を図 41Aのような条件で行った場合も同様に図 41Bの表に示すような高い分離性能を得ることができた。

[0217] <第 6の実施の形態の特徴 >

以上より、上述した実施の形態の特徴をまとめると以下のようになる。

(1)混合信号ベクトル力得られる情報をすベて用いてクラスタリングを行うため、全てのセンサの情報を有効に活用でき、信号分離の性能が向上する。

(2)センサの配置情報を厳密に知る必要がないため、不規則なセンサ配置を採用でき、さらにセンサ位置をキャリブレーションする必要が無い。

<変形例等 >

なお、本発明は、上述の第 6の実施の形態に限定されるものではない。例えば、第 6の実施の形態では、周波数正規ィ匕部 2121の第 1正規ィ匕部 2121aが、混合信号べタトル X(f, τ )の特定の 1つの要素 X (f, τ )を基準として当該混合信号ベクトル X(f, τ )の各要素 X (f, τ )の偏角を、式 (61)の演算によって正規ィ匕することとした。しかし、例えば、以下のような式に従って、周波数正規ィ匕部 2121の第 1正規ィ匕部 2121aが、混合信号ベクトル X(f, τ )の特定の 1つの要素 X (f, τ )を基準として当該混合信号べタトル X(f, τ )の各要素 X (f, τ )の偏角を正規化する構成であってもよい。

[0218] [数 59]

X_q'"(f,T)=|X_q(f,^|_eXp{j.(_arg[X_q(f,_T).X_Q*(f,T)])}

X_q ' ' ' (f ,て) =| X_q (f ,て) I exp { j - 0(arg[X_q (f , τ) / X_Q (f, τ)])} ただし、 ·*は、 'の複素共役である。また、 Φ {·}は関数であり、クラスタリング精度の観点から好ましくは単調増加関数であることが望ましい。

また、周波数正規ィ匕部 2121が式 (60)の代わりに、

[0219] [数 60] arg[X_q(f,r)/X_Q(f, )]

入。 ( て)： /⁰

q 4fc- arg[X_q(f₅r)-X_Q*(f,t)]

4fc d

arg[X_q(f,T)]-arg[X_Q(f,r)]

Xq (f ,て） = i

q 4f_C-

^X"^f 4^d 等の演算によって周波数正規ィ匕を行うこととしてもよい。ただし、は定数である (例えば、 /0 =1)。

また、上述の第 6の実施の形態では、ノルム正規化部 2122においてノルムが 1になるような正規ィ匕を行った力ノルムが 1以外の規定値となるように正規ィ匕を行ってもよい。さら〖こ、ノルム正規ィ匕部 2122を設けず、ノルム正規ィ匕を行わない構成であってもよい。この場合、クラスタリング部 2123は、周波数正規化ベクトル X' (f, τ )のクラスタリングを行うことになる。しかし、周波数正規ィ匕ベクトル X' (f, τ )は、ノルムが統一されていない。そこで、この場合のクラスタリング基準は、ベクトルがノルムを含めて似ているかどうかではなぐベクトルの方向のみが似ているかどうかになる。これは、類似度を用いた評価になる。類似度の 1つとしてコサイン距離

cos Θ = I X'^H(f, r ) - r? | /( || X'(f, r ) ||

k · | k || )

を例示できる。ここで Θは、周波数正規ィ匕ベクトル X' (f, τ )と、セントロイド 7? のべタト

k ルとがなす角度である。コサイン距離を用いる場合、クラスタリング部 2123は、コサイン距離の総和

[0220] [数 61]

を最小値ィ匕するクラスタを生成する。なお、セントロイド η は、各クラスタのメンバの平

k

均として算出する。

また、上述した基準値 Q, Q'は互いに等しくてもよぐ異なっていてもよい。また、パラメータ dは、全てのセンサ qに対して同一であってもよいし、各センサ qに対応して複数の値を設定しておいてもよい。例えば、基準センサとセンサ qとの距離を、それぞれのセンサ qに対応するパラメータ dの値としてもよ、。

[0221] また、分離信号生成部 2124において、

[0222] [数 62]

「X_Q,(f,て） X"(f,r)eC_k

Y_k(f,て) =

0 otnerwise とする代わりに、ノ

[数 63]

「1 X"(f,て) _ec_k

M_k(f,r) =

0 otherwise を作成し、

Y (f, τ )=Μ (f, τ )Χ (f, τ )

k k Q，として分離信号ベクトル Y (f, τ )の k番目の要素 Y (f, τ )を得ることとしてもよ!/ヽ。

k

さらに、上述の各実施の形態では、フーリエ変換及び逆フーリエ変換によって周波数領域と時間領域との間の変換を行うこととした力 wavelet変換、 DFTフィルタバンク、ポリフェイズフィルタバンクなどを用い、この変換を行うこととしてもよい（例えば、「R. E. Crochiere, L. R. Rabiner, "Multirate Digital Signal Processing. Eaglewood Cliffs, NJ: Printice- Hall, 1983 (ISBN 0-13-605162-6) )。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しな、範囲で適宜変更が可能であることは、うまでもな!/、。

[0224] また、上述の各実施の形態の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。これらの処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、 DVD (Digital Versatile Disc)、 DV D— RAM (Random Access Memory)、 CD— ROM (Compact Disc Read Only Memo ry)ゝ CD— R (Recordable) ZRW (Rewritable)等を、光磁気記録媒体として、 MO (M agneto- Optical disc)等を、半導体メモリとして EEP— ROM (Electronically Erasable and Programmable-Read Only Memoryリ等用ヽること; ^できる。

[0225] また、このプログラムの流通は、例えば、そのプログラムを記録した DVD、 CD-R

OM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サ一バコンピュータカ他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよ!/、。

また、上述した実施形態とは別の実行形態として、コンピュータが可搬型記録媒体力直接このプログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータ力プログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サ一バコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆる ASP (Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。

[0226] また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとした力これらの処理内容の少なくとも一部をノ、一ドウア的に実現することとしてもよ、。

産業上の利用可能性

[0227] 本技術により、様々な妨害信号が発生する実環境において、目的の信号を精度良く取り出すことが可能となる。音信号に対する応用例としては、例えば、音声認識器のフロントエンドとして働く音声分離システムなどが挙げられる。話者とマイクが離れた位置にあり、マイクが話者の音声以外を集音してしまうような状況でも、そのようなシステムを使うことで、話者の音声のみを取り出して正しく音声を認識することができる。

Claims

請求の範囲

[1] 複数の信号源から発せられた源信号の混合からなる混合信号を、当該源信号に分離する信号分離装置であって、

複数のセンサで観測された前記混合信号を、周波数領域の混合信号に変換する周波数領域変換部と、

前記周波数領域の混合信号を用いて生成された複素ベクトルを正規化し、当該複素ベクトルの周波数依存性を排除した正規化ベクトルを生成する正規化部と、前記正規ィ匕ベクトルをクラスタリングし、クラスタを生成するクラスタリング部と、を有する。

[2] 請求項 1に記載の信号分離装置であって、

前記正規化部は、

前記複素ベクトルが具備する特定の 1つの要素を基準として当該複素ベクトルの各要素の偏角を正規ィ匕する第 1正規ィ匕部と、

前記第 1正規化部で正規化された各要素の偏角を周波数に比例した値で除算する第 2正規化部と、を有する。

[3] 請求項 2に記載の信号分離装置であって、

前記正規化部は、

前記第 2正規ィ匕部で正規化された各要素力なるベクトルのノルムを所定の値に正規化する第 3正規化部をさらに有する。

[4] 複数の信号源から発せられた源信号の混合からなる混合信号を、当該源信号に分離する信号分離装置であって、

前記周波数領域の混合信号を用いて、周波数毎に分離行列を算出する分離行列算出部と、

前記分離行列の一般化逆行列を算出する逆行列算出部と、

前記一般化逆行列を構成する基底ベクトルの正規化を行!ヽ、正規化基底ベクトルを算出する基底ベクトル正規化部と、前記正規ィ匕基底ベクトルをクラスタリングし、クラスタを生成するクラスタリング部と、前記クラスタの中心ベクトルと前記正規ィ匕基底ベクトルとを用い、前記分離行列の要素を並び替えるための順列を算出する順列算出部と、を有する。

[5] 請求項 4記載の信号分離装置であって、

前記基底ベクトル正規化部は、

前記基底ベクトルの周波数依存性を排除する正規化を行う。

[6] 請求項 5記載の信号分離装置であって、

前記基底ベクトルの周波数依存性を排除する正規化は、

前記基底ベクトルが具備する特定の 1つの要素を基準として当該基底ベクトルの各要素の偏角を正規化し、さらに、各要素の偏角を周波数に比例した値で除算する正規化である。

[7] 請求項 5記載の信号分離装置であって、

前記基底ベクトルの周波数依存性を排除する正規化は、

前記基底ベクトル A (f) (p = l, ..., Ν、 Νは前記信号源の数)の各要素 A (f) (q =

P OP

1, M、 Mは前記混合信号を観測するセンサの数）に対し、 expをネピア数とし、 a rg[ ' ]を偏角とし、 fを周波数とし、 jを虚数単位とし、 cを信号の伝達速度とし、 Qを M 以下の自然数から選択された基準値とし、 dを実数とした場合における、

[数 64]

. arg[A_q£(f)/A₀p(f)]

A p'CO H AqpC I expl

J 4fc -¹ d の演算によって行われる正規ィ匕である。

[8] 請求項 7記載の信号分離装置であって、

記 dは、

前記要素 A (f)に対応する基準センサと他のセンサとの最大距離 d である。

Qp max

[9] 請求項 4記載の信号分離装置であって、

前記基底ベクトル正規化部は、

前記基底ベクトルの周波数依存性を排除する正規化と、ノルムを規定値にする正規化とを行う。 [10] 複数の信号源から発せられた源信号の混合からなる混合信号を、当該源信号に分離する信号分離装置であって、

複数のセンサで観測された前記混合信号を周波数領域の混合信号に変換する周波数領域変換部と、

前記分離行列の一般化逆行列を算出する逆行列算出部と、

前記一般化逆行列を構成する基底ベクトルの正規化を行!ヽ、正規化基底ベクトルを算出する基底ベクトル正規化部と、

前記正規ィ匕基底ベクトルをクラスタリングし、クラスタを生成するクラスタリング部と、前記周波数領域の混合信号と前記分離行列或いはその行を並び替えた分離行列とから求めた分離信号のエンベロープと、前記クラスタの中心ベクトルと、前記正規化基底ベクトルとを用い、前記分離行列の要素を並び替えるための順列を算出する順列算出部と、を有する。

[11] 複数の信号源から発せられた源信号の混合からなる混合信号を、当該源信号に分離する信号分離装置であって、

前記周波数領域の混合信号を用い、周波数毎に分離行列と分離信号とを算出する信号分離部と、

前記分離行列の一般ィ匕逆行列の列である基底ベクトルを正規ィ匕し、その正規化された基底ベクトルをクラスタリングし、そのクラスタの分散を指標として前記分離信号から、目的信号を含む選択信号を選択する目的信号選択部と、を有する。

[12] 請求項 11に記載の信号分離装置であって、

更に、前記周波数領域の混合信号と前記基底べ外ルとを用いて時間周波数マスクを生成するマスク生成部と、

前記時間周波数マスクを前記目的信号選択部で選択された前記選択信号に適用し、マスク処理選択信号を生成するマスキング部と、を有する。 [13] 請求項 12に記載の信号分離装置であって、

前記マスク生成部は、

前記周波数領域の混合信号を用いて白色化行列を生成する白色化行列生成部と前記白色化行列を用い、前記周波数領域の混合信号を要素とする混合信号べタトルを変換した白色化混合信号ベクトルと、前記基底ベクトルを変換した白色化基底ベクトルとを算出する白色化部と、

前記白色化混合信号ベクトルと前記白色化基底ベクトルとがなす角度を時間周波数毎に算出する角度計算部と、

前記角度を要素とする関数である前記時間周波数マスクを生成する関数演算部と、を有する。

[14] 請求項 13に記載の信号分離装置であって、

前記白色化行列は、

周波数 ¾·とし、離散時間を τとし、前記混合信号ベクトルを X(f, τ )とし、ベクトル * を時間平均したベクトルをく * > とし、ベクトル *の複素共役転置ベクトルを * ^Ηとし、 R (f) =<X (f, τ ) · X (f, τ ) ^Η> とした場合における V (f) =R (f) ^_1/2であり、

前記白色化部は、

Z(f,て )=V(f) -X(f, τ )の演算により、前記白色化混合信号べ外ル Z(f, τ )を算出し、前記基底ベクトルを A(f)とした場合における B(f)=V(f) 'A(f)の演算により、前記白色化基底ベクトル B (f)を算出し、

前記角度計算部は、

ベクトル *の絶対値を I * Iとし、ベクトル *のノルムを II * IIとした場合における

Θ (f, r )=cos-¹(|B^H(f) -Z(f, r )|/ || B(f) || · || Z(f, r ) || )の演算により、前記角度 θ て）を算出し、

前記関数演算部は、

a, g, Θ を実数とした場合におけるロジスティック関数 Μ( θ (f, ) = _a/(l+e^g'^((H

T

f' ^_eT))を前記時間周波数マスクとして算出する。

[15] 請求項 12に記載の信号分離装置であって、前記マスク生成部は、

前記周波数領域の混合信号を用いて生成された混合信号べ外ル X (f, τ )を、周波数に依存しない周波数正規ィヒベクトル X' (f, τ )に正規化する周波数正規化部と、前記周波数正規化ベクトル X' (f, τ )を、ノルムが所定の値になるノルム正規ィ匕べクトル X" (f, て )に正規化する第 1ノルム正規化部と、

前記選択信号に対応するセントロイド r? を抽出するセントロイド選択部と、前記選択信号に対応するセントロイド r? を、そのノルムが前記所定の値になるノルム正規化セントロイド r? ，に正規化する第 2ノルム正規化部と、

前記周波数正規化ベクトル X' (f, て )と前記ノルム正規ィ匕セントロイド η ，との距離の自乗 DS (f, T )を算出する自乗距離算出部と、

前記距離の自乗 DS (f, τ )を要素とする関数を用いた前記時間周波数マスクを生成する

関数生成部と、を有する。

[16] 請求項 11に記載の信号分離装置であって、

前記目的信号選択部は、

[17] 請求項 16記載の信号分離装置であって、

前記基底ベクトルの周波数依存性を排除する正規化は、

[18] 請求項 17記載の信号分離装置であって、

前記基底ベクトルの周波数依存性を排除する正規化は、

前記基底ベクトル A (f) (pは自然数)の各要素 A (f) (q = l , ..., Μ、 Μは前記混合信号を観測するセンサの数）に対し、 expをネピア数とし、 arg [ ' ]を偏角とし、 fを周波数とし、 jを虚数単位とし、 cを信号の伝達速度とし、 Qを M以下の自然数から選択された基準値とし、 dを実数とした場合における、

[数 65] '(O H AqpC I

の演算によって行われる正規ィ匕である。

[19] 請求項 18記載の信号分離装置であって、

前記実数 dは、

前記基準値 Qに対応する基準センサと他のセンサとの最大距離 d maxである。

[20] 請求項 11記載の信号分離装置であって、

前記目的信号選択部は、

前記基底ベクトルの周波数依存性を排除する正規化と、ノルムを規定値にする正規化とを行う。

[21] 請求項 11に記載の信号分離装置であって、

前記目的信号選択部は、

分散が最小となるクラスタを選択し、選択されたクラスタに対応する前記分離信号を前記選択信号として選択する。

[22] 複数の信号源から発せられた源信号の混合からなる混合信号を、当該源信号に分離する信号分離装置であって、

前記周波数領域の混合信号から構成される混合信号ベクトルの正規化を行!ヽ、正規化ベクトルを算出するベクトル正規化部と、

前記正規ィ匕ベクトルをクラスタリングし、クラスタを生成するクラスタリング部と、 k番目の前記クラスタに属する前記正規ィ匕ベクトルの時間周波数に対応する前記混合信号ベクトルから所定番目の要素を抽出し、これを k番目の要素とした分離信号べタトルを生成する分離信号生成部と、を有する。

[23] 請求項 22に記載の信号分離装置であって、

前記ベクトル正規化部は、

前記周波数領域の混合信号から構成される混合信号ベクトルの周波数依存性を排除する正規化を行う。 [24] 請求項 23記載の信号分離装置であって、

前記混合信号ベクトルの周波数依存性を排除する正規化は、

前記混合信号ベクトルが具備する特定の 1つの要素を基準として当該基底ベクトルの各要素の偏角を正規化し、さらに、各要素の偏角を周波数に比例した値で除算する正規ィ匕である。

[25] 請求項 24記載の信号分離装置であって、

Mを前記センサの数とし、 q= l, ..., Mとし、前記混合信号ベクトルの各要素を X (f , τ )とし、 expをネピア数とし、 arg[ ' ]を偏角とし、 jを虚数単位とし、 cを信号の伝達速度とし、 Qを M以下の自然数から選択された値とし、 dを実数とし、 fを周波数とし、 τ を離散時間とした場合における、

[数 66]

の演算によって行われる。

[26] 請求項 25記載の信号分離装置であって、

記 dは、

前記要素 X (f, τ )に対応するセンサと他のセンサとの最大距離 d である。

Q max

[27] 請求項 22に記載の信号分離装置であって、

前記ベクトル正規化部は、

前記混合信号ベクトルの周波数依存性を排除する正規化と、ノルムを規定値にする正規化とを行う。

[28] 複数の信号源から発せられた源信号の混合からなる混合信号を、当該源信号に分離する信号分離方法であって、

複数のセンサで観測された前記混合信号を周波数領域の混合信号に変換して出力する過程と、

入力された前記周波数領域の混合信号を用い、周波数毎に分離行列を算出して出力する過程と、入力された前記分離行列の一般化逆行列を算出して出力する過程と、入力された前記一般化逆行列を構成する基底ベクトルの正規化を行!ヽ、正規化基底ベクトルを算出して出力する過程と、

入力された前記正規ィ匕基底ベクトルをクラスタリングし、クラスタを生成して出力する過程と、

入力された前記クラスタの中心ベクトルと前記正規化基底ベクトルとを用い、前記分離行列の要素を並び替えるための順列を算出して出力する過程と、を有する。

[29] 複数の信号源から発せられた源信号の混合からなる混合信号を、当該源信号に分離する信号分離方法であって、

入力された前記周波数領域の混合信号を用い、周波数毎に分離行列と分離信号とを算出して出力する過程と、

入力された前記分離行列の一般ィ匕逆行列の列である基底ベクトルを正規ィ匕し、その正規ィ匕された基底ベクトルをクラスタリングし、そのクラスタの分散を指標として、入力された前記分離信号から、目的信号を含む選択信号を選択する過程と、を有する

[30] 複数の信号源から発せられた源信号の混合からなる混合信号を、当該源信号に分離する信号分離方法であって、

入力された前記周波数領域の混合信号から構成される混合信号ベクトルの正規化を行い、正規ィ匕べ外ルを算出して出力する過程と、

入力された前記正規ィ匕ベクトルをクラスタリングし、クラスタを生成して出力する過程と、

k番目の前記クラスタに属する前記正規ィ匕ベクトルの時間周波数に対応する前記混合信号ベクトルから所定番目の要素を抽出し、これを k番目の要素とした分離信号ベクトルを生成して出力する過程と、を有する。請求項 1から 27の何れかに記載の信号分離装置としてコンピュータを機能させるための信号分離プログラム。

請求項 31記載の信号分離プログラムを格納したコンピュータ読み取り可能な記録媒体。