JP5190859B2

JP5190859B2 - 音源分離装置、音源分離方法、音源分離プログラム及び記録媒体

Info

Publication number: JP5190859B2
Application number: JP2006311718A
Authority: JP
Inventors: 哲則小林; 健三赤桐; 晋太郎高田
Original assignee: Waseda University
Current assignee: Waseda University
Priority date: 2006-11-17
Filing date: 2006-11-17
Publication date: 2013-04-24
Anticipated expiration: 2026-11-17
Also published as: JP2008131183A

Description

本発明は音源分離装置、音源分離方法、音源分離プログラム及び記録媒体に関し、例えば携帯電話機等の携帯通信端末や、カーナビゲーションシステムのような音声操作を行える車載機器等において種々の雑音を除去してユーザの音声のみをマイクロフォンで受音する必要がある場合に適用して好適なものである。

携帯電話を用いて画像情報を取り扱う機会が増えるにつれ、携帯電話を口元にあてる使い方よりも、口元から離して画像を見ながら会話したり音声認識を行う使い方が、使い勝手の上から望まれると考えられる。しかし、このためには、より高い対環境雑音性能が要求される。またロボットとの対話や、カーナビゲーションシステム等の車載機器についての音声による操作、会議の議事録作成等、接話型マイクロフォンの利用をユーザに課すことが不自然となる用途も多い。このような用途においては、システム側に設置したマイクロフォンによりユーザの音声を収音し、認識処理することが望まれる。

しかしながら、発話者（ユーザ）から離れたところに設置したマイクロフォンで収音し、音声認識を行う場合には、雑音音源からの妨害音が周壁等ではね返えることによりあらゆる方向に拡散して周囲一様から到来する雑音（以下、これを拡散性雑音と呼ぶ）によってＳ／Ｎ比（信号対雑音比）が悪化し、その結果、マイクロフォンでユーザの音声のみを収音し難くなり、音声認識の精度が極度に劣化してしまうという問題があった。

このような問題点を解決するために、ユーザの音声と拡散性雑音とを分離する技術として、２つの無指向性マイクロフォンからの受音信号を用いて二乗コヒーレンス（ＭＳＣ：Magnitude Squared Coherence）関数を算出し、その算出結果であるＭＳＣ値に基づいて拡散性雑音を解析して目的音だけを抽出する音源分離装置が考えられている（例えば、非特許文献１参照）。

因みにこのＭＳＣ値は、低域から高域までの周波数帯域の間で「０」から「１」の範囲で変動し、「０」に近づくほどその周波数において信号が拡散性信号であり、「１」に近づくほど信号が指向性信号であることを表している。

そして、この音源分離装置では、ＭＳＣ値に基づいたフィルタリングを行うことにより、マイクロフォンから出力された受音信号から拡散性雑音の混合分に相当する周波数成分を低減し、これにより拡散性雑音を除去した目的音を取得し得るようになされている。
ＵｓｉｎｇｔｈｅｃｏｈｅｒｅｎｅｆｕｎｃｔｉｏｎｆｏｒｎｏｉｓｅｒｅｄｕｃｔｉｏｎＩＥＥＰｒｏｃｅｅｄｉｎｇｓＶｏｌ．１３９Ｎｏ３Ｊｕｎｅ１９９２Ｒ．Ｌｅ．Ｂｏｕｑｕｉｎ

しかしながら、かかる構成の音源分離装置では、ＭＳＣ値が低域の周波数帯域において「１」に近づく値を示したままであることから、ＭＳＣ値に基づいたフィルタリングを行っても、拡散性雑音の周波数帯域のうち低域成分について除去し難いという問題があった。

ここでＭＳＣ値を用いて拡散性雑音の周波数帯域のうち低域成分を除去するには、マイクロフォンの間隔を２０ｃｍ以上離せば、低域成分において僅かにＭＳＣ値を下げることもできるが、この場合音源分離装置が大型化してしまい、携帯電話機等の小型通信端末に対して搭載し得ないという問題があった。

従って、携帯電話機等の小型通信端末においては、目的音の到来方向以外の任意方向から到来する指向性妨害音を除去しつつ、同時に拡散性雑音をも除去するような構成について未だ実現されていない。

本発明は以上の点を考慮してなされたもので、拡散性雑音の高域の周波数成分だけでなく、低域の周波数成分についても確実に除去し得るとともに、従来よりも一段と小型化を図ることができる音源分離装置、音源分離方法、音源分離プログラム及び記録媒体を提供することを目的とする。

本発明の請求項１記載の音源分離装置は、所定方向から到来する目的音と、前記所定方
向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する
音源分離装置において、間隔を置いて配置され、所定位置での目的音方向とヌル方向と
を異ならせ、前記目的音方向を軸として回転させたときに指向特性が同一である複数の指
向性マイクロフォンと、前記指向性マイクロフォンから出力された受音信号に基づいてク
ロスパワースペクトル強度値を算出する算出手段と、前記クロスパワースペクトル強度値
に基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータ
により、前記拡散性雑音とその他の音を分離する分離手段とを備えた音源分離装置であって、
前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号とを入力として、前記算出手段によってそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を使用し、
前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを前記分離手段の入力とすることを特徴とするものである。

本発明の請求項２記載の音源分離装置は、所定方向から到来する目的音と、前記所定方
向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する
音源分離装置において、間隔を置いて配置された、指向特性の最大感度方向に目的音を配
置し、かつ指向特性の最大感度軸が概略マイクロフォンを結ぶ軸と同一である複数の指向
性マイクロフォンと、前記指向性マイクロフォンから出力された受音信号に基づいてクロ
スパワースペクトル強度値を算出する算出手段と、前記クロスパワースペクトル強度値に
基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータに
より、前記拡散性雑音とその他の音を分離する分離手段とを備えた音源分離装置であって、
前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号とを入力として、前記算出手段によってそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を使用し、
前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを前記分離手段の入力とすることを特徴とするものである。

本発明の請求項３記載の音源分離装置は、前記解析パラメータが二乗コヒーレンス値であることを特徴とするものである。

本発明の請求項４記載の音源分離装置は、前記指向性マイクロフォンの指向特性が１次差分特性であることを特徴とするものである。

本発明の請求項５記載の音源分離装置は、前記指向性マイクロフォンの指向特性がカージオイド特性であることを特徴とするものである。

本発明の請求項６記載の音源分離装置は、前記指向性マイクロフォンの指向特性のヌル方向が目的音方向と直角をなすことを特徴とするものである。

本発明の請求項７記載の音源分離装置は、前記クロスパワースペクトル強度値を算出する前記指向性マイクロフォン対の指向特性が互いに逆方向であることを特徴とするものである。

本発明の請求項８記載の音源分離装置は、前記指向性マイクロフォンの配置位置が携帯機器の端面であることを特徴とするものである。

本発明の請求項９記載の音源分離装置は、前記指向性マイクロフォン配置が携帯機器の正面及び背面であることを特徴とするものである。

本発明の請求項１０記載の音源分離装置は、前記複数の解析パラメータの補正操作値が
、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と、前記無目的音状
態での受音信号から得られた二乗コヒーレンス値との差分値であることを特徴とするもの
である。

本発明の請求項１１記載の音源分離装置は、前記複数の解析パラメータの補正操作値が
、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態
での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である１と前記無目的
音状態での受音信号から得られた二乗コヒーレンス値の差分値の比であることを特徴とす
るものである。

本発明の請求項１２記載の音源分離装置は、前記分離手段は、前記受音信号の周波数成分に関する前記複数の指向性マイクロフォンの組み合わせから前記算出手段で算出された複数の解析パラメータと、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である１と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値の比との中から少なくとも２個の前記解析パラメータもしくは該解析パラメータの補正操作値を選びだし、各周波数帯域毎の最小値及び線形結合値のうち少なくとも一方により前記拡散性雑音とその他の音を分離することを特徴とするものである。

本発明の請求項１３記載の音源分離方法は、所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離方法において、間隔を置いて配置され、所定位置での目的音方向とヌル方向とを異ならせ、前記目的音方向を軸として回転させたときに指向特性が同一である複数の指向性マイクロフォンを用い、前記指向性マイクロフォンから出力された受音信号に基づいて、クロスパワースペクトル強度値を算出し、前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する音源分離方法であって、各前記マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号のそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて、前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを用いて前記拡散性雑音とその他の音を分離することを特徴とするものである。

本発明の請求項１４記載の音源分離方法は、所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離方法において、間隔を置いて配置された、指向特性の最大感度方向に目的音を配置し、かつ指向特性の最大感度軸が概略マイクロフォンを結ぶ軸と同一である複数の指向性マイクロフォンを用い、各前記マイクロフォンから出力された受音信号に基づいて、クロスパワースペクトル強度値を算出し、前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する音源分離方法であって、前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号のそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて、前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを用いて前記拡散性雑音とその他の音を分離することを特徴とする。

本発明の請求項１５記載の音源分離方法は、前記解析パラメータが二乗コヒーレンス値であることを特徴とするものである。

本発明の請求項１６記載の音源分離方法は、前記指向性マイクロフォンの指向特性が１次差分特性であることを特徴とするものである。

本発明の請求項１７記載の音源分離方法は、前記指向性マイクロフォンの指向特性がカージオイド特性であることを特徴とするものである。

本発明の請求項１８記載の音源分離方法は、前記指向性マイクロフォンの指向特性のヌル方向が前記目的音方向と直角をなすことを特徴とするものである。

本発明の請求項１９記載の音源分離方法は、前記クロスパワースペクトル強度値を算出する前記指向性マイクロフォン対の指向特性が、互いに逆方向であることを特徴とするものである。

本発明の請求項２０記載の音源分離方法は、前記指向性マイクロフォンの配置位置が携帯機器の端面であることを特徴とするものである。

本発明の請求項２１記載の音源分離方法は、前記指向性マイクロフォンの配置が携帯機器表面及び背面であることを特徴とするものである。

本発明の請求項２２記載の音源分離方法は、前記複数の解析パラメータの補正操作値が、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値であることを特徴とするものである。

本発明の請求項２３記載の音源分離方法は、前記複数の解析パラメータの補正操作値が、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である１と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値の比であることを特徴とするものである。

本発明の請求項２４記載の音源分離方法は、前記受音信号の周波数成分に関する複数のマイクロフォンの組み合わせから得られる複数の解析パラメータを算出して、前記複数の解析パラメータと、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、値１と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値の比との中から、少なくとも２個の前記解析パラメータもしくは該解析パラメータの補正操作値を選びだし、各周波数帯域毎の最小値及び線形結合値のうち少なくとも一方により前記拡散性雑音とその他の音を分離することを特徴とするものである。

本発明の請求項２５記載の音源分離プログラムは、請求項１３〜２４のうちいずれか１項記載の音源分離方法をコンピュータに実行させるためのものである。

本発明の請求項２６記載の記録媒体は、請求項１３〜２４のうちいずれか１項記載の音源分離方法をコンピュータに実行させるためのものである。

本発明の請求項１及び２記載の音源分離装置と、請求項１３及び１４記載の音源分離方法とによれば、指向性マイクロフォンから出力された受音信号を基に算出されたクロスパワースペクトル強度値を用いて解析パラメータを算出するようにしたことにより、低域の周波数帯域でも低くなった解析パラメータを得ることができ、この解析パラメータを用いて受音信号の周波数成分の解析を行なうことで、各指向性マイクロフォン間の間隔を所定以上の距離まで離さなくても拡散性雑音の低域の周波数成分も確実に除去できる。従って、低域の周波数成分についても確実に除去しつつ、従来よりも一段と小型化を図ることができると同時に目的音そのものは指向性特性のNULL方向にはないことによって、目的音のレベル低下による演算精度低下が起こらず、正確なMSCを求めることができる。

また本発明の請求項１２記載の音源分離装置と、請求項２３記載の音源分離方法によれば、複数の解析パラメータを基にして最小値もしくは線形結合による値を用いることによって、個々の解析パラメータを用いたときよりも、各周波数帯域毎に拡散性雑音の低減を最適に行うことができる。

また本発明の請求項２４記載の音源分離方法によれば、拡散性雑音の低減に用いる受音信号を得るマイクロフォンの受音信号を用いて、指向性雑音も低減することができる。このことによって共用化したマイクロフォン、アンプ及びA/Dによって、指向性雑音及び拡散性雑音を同時に低減することができ、システム全体のコストを低減することができる。

以下図面に基づいて本発明の実施の形態を詳述する。

（１）第１の実施の形態
図１において、１は全体としてスティックタイプの携帯電話機を示し、ほぼ偏平矩形状に形成された筐体２の正面2a上部に日時等の各種情報を表示する表示部３が設けられているとともに、当該筐体２の正面2a下部に各種操作情報を入力し得る複数の操作キーからなる操作部４が設けられている。

この携帯電話機１は、テレビ電話モード時に通話相手から送信された映像信号及び音声信号を受信すると、その映像信号に基づく映像を表示部３に表示するとともに、その音声信号に基づく音声をスピーカ５から出力し得る。

これに加えてこの携帯電話機１では、筐体２の正面2aに設けられた撮像部６によってユーザ自身の顔を撮像しながら、筐体２の下端面2cの４隅近くに設けた無指向性の前部無指向性マイクロフォンＭＣ１，ＭＣ３と、同じく無指向性の後部無指向性マイクロフォンＭＣ２，ＭＣ４との合計４つの無指向性マイクロフォンによってユーザの音声を集音し、かくして通話相手とテレビ電話による通話を行なえ得る。

実際上、携帯電話機１の筐体面としての下端面2cには、一方の前部角側に設けた前部無指向性マイクロフォンＭＣ１と対向させて一方の後部角側に後部無指向性マイクロフォンＭＣ２が設けられており、これら前部無指向性マイクロフォンＭＣ１と後部無指向性マイクロフォンＭＣ２とが対として機能し、一つの指向性マイクロフォンを構成し得る。

また、筐体２の下端面2cには、前部無指向性マイクロフォンＭＣ１に対向させて他方の前部角側に前部無指向性マイクロフォンＭＣ３が設けられているとともに、当該前部無指向性マイクロフォンＭＣ３と対向させて他方の後部角側に後部無指向性マイクロフォンＭＣ４が設けられており、これら前部無指向性マイクロフォンＭＣ３と後部無指向性マイクロフォンＭＣ４とが対として機能し、一つの指向性マイクロフォンを構成し得る。

つまりこれら前部無指向性マイクロフォンＭＣ１と後部無指向性マイクロフォンＭＣ２のマイクロフォン対ならびに前部無指向性マイクロフォンＭＣ３と後部無指向性マイクロフォンＭＣ４のマイクロフォン対は、筐体２の正面2a及び背面2b方向にそれぞれ受音感度が高い双指向性パターン及びヌルを持つカージオイド（単一指向性パターン）を形成している。

そして、これら前部無指向性マイクロフォンＭＣ１，ＭＣ３及び後部無指向性マイクロフォンＭＣ２，ＭＣ４は、ユーザの音声を目的音として集音するとともに、当該目的音の到来方向とは異なる任意方向から到来する指向性雑音や、雑音音源からの各種雑音が周壁等ではね返えることによりあらゆる方向に拡散して周囲一様から到来する指向性のない拡散性雑音を同時に集音し得る。

かかる構成に加えて、この携帯電話機１には、図２に示すような音源分離装置10が内蔵されており、この音源分離装置10によって、前部無指向性マイクロフォンＭＣ１から出力された受音信号Ｘ1（ｔ）と、後部無指向性マイクロフォンＭＣ２から出力された受音信号Ｘ2（ｔ）と、前部無指向性マイクロフォンＭＣ３から出力された受音信号Ｘ3（ｔ）と、後部無指向性マイクロフォンＭＣ４から出力された受音信号Ｘ4（ｔ）とを用いて音源分離処理を実行することにより、指向性雑音及び拡散性雑音を除去し、これによりユーザの音声に相当する目的音スペクトルＦ15（ω）（後述する）を生成し得るようになされている。

これにより携帯電話機１では、目的音スペクトルＦ15（ω）だけを通話相手の携帯電話機へ送信して指向性雑音及び拡散性雑音を除去した目的音（すなわちユーザの音声）を、通話相手の携帯電話機のスピーカから出力させたり、或いは音声認識処理等の各種処理に目的音スペクトルＦ15（ω）を利用し得るようになされている。

実際上、この音源分離装置10は、第１雑音除去部７、第２雑音除去部８及び合成部９を備えており、これら第１雑音除去部７及び第２雑音除去部８において音源分離処理のうち指向性雑音除去処理を実行することにより、受音信号Ｘ1（ｔ），Ｘ2（ｔ）及び受音信号Ｘ3（ｔ），Ｘ4（ｔ）から指向性雑音を除去した指向性雑音除去音声スペクトルＦ5（ω）及び指向性雑音除去音声スペクトルＦ6（ω）をそれぞれ生成する。

そして、合成部９は、指向性雑音除去音声スペクトルＦ5（ω）と指向性雑音除去音声スペクトルＦ6（ω）とを合成することにより合成スペクトルＦ7（ω）を生成するようになされている。

また、音源分離装置10は、音源分離処理のうち拡散性雑音除去処理を実行することにより、出力信号としての受音信号Ｘ1（ｔ），Ｘ2（ｔ），Ｘ3（ｔ），Ｘ4（ｔ）に基づいて解析パラメータとしての二乗コヒーレンス（以下、これを単にＭＳＣ（Magnitude Squared Coherence）と呼ぶ）データを生成し、これを用いて合成スペクトルＦ7（ω）から拡散性雑音を除去した目的音スペクトルＦ15（ω）を生成するようになされている。

ここではまず始めに音源分離処理のうち、第１雑音除去部７及び第２雑音除去部８でそれぞれ行われる指向性雑音除去処理について以下説明する。

この場合、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２は、それぞれユーザの音声を集音し、かくして得られた受音信号Ｘ1（ｔ），Ｘ2（ｔ）を第１指向性制御部11に送出するようになされている。

第１指向性制御部11は、図３に示すように、加算回路12を備えており、当該加算回路12において、前部無指向性マイクロフォンＭＣ１から出力された受音信号Ｘ1（ｔ）と、後部無指向性マイクロフォンＭＣ２から出力された受音信号Ｘ2（ｔ）との差をとる処理を行ない双指向性信号Ｄ1（ｔ）（すなわち、Ｘ1（ｔ）−Ｘ2（ｔ））を生成し、これを周波数分析部13（図２）へ送出する。

ここで、この双指向性信号Ｄ1（ｔ）を周波数解析して得られるスペクトル（以下、これを双指向性スペクトルと呼ぶ）｜Ｆ1（ω）｜の指向特性は、図４に示す点線のように、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２を結んだｘ軸上を中心に横「８」の字状の双指向性パターンP1となる。

なお、この実施の形態の場合、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２は、筐体２の下端面2cに配置されていることにより、双指向性パターンP1により筐体２の正面2a及び背面2b側での受音感度が最大となり、筐体２の正面2a及び背面2b間の中間位置で、かつ正面2aと平行する平面上で受音感度が理論上０となり最小になる。

これに加えて、このとき第１指向性制御部11では、前部無指向性マイクロフォンＭＣ１からの受音信号Ｘ1（ｔ）を遅延回路14に送出し、当該遅延回路14で受音信号Ｘ1（ｔ）を、前部無指向性マイクロフォンＭＣ１から後部無指向性マイクロフォンＭＣ２までの音波伝播時間だけ遅延させ、これにより得られた遅延信号Ｘ1’（ｔ）を加算回路15に送出する。

加算回路15では、遅延信号Ｘ1’（ｔ）と、後部無指向性マイクロフォンＭＣ２からの受音信号Ｘ2（ｔ）との差をとった単一指向性信号Ｄ2（ｔ）（すなわち、１次差分特性となるＸ1’（ｔ）−Ｘ2（ｔ））を生成し、これを周波数分析部13へ送出する。

ここで単一指向性信号Ｄ2（ｔ）を周波数分析部13で周波数解析して得られるスペクトル（以下、これを単一指向性スペクトルと呼ぶ）｜Ｆ2（ω）｜の指向特性は、図４に示す点線のように、ｘ軸上を中心にして図中左側（筐体２の正面2a側）にヌルを有した単一指向性パターンP2となる。

このように単一指向性パターンP2では、筐体２の正面2a側にヌルが形成されることにより筐体２の正面2a方向から到来する音の受音感度が最小となる。

また、これに加えて第１指向性制御部11は、後部無指向性マイクロフォンＭＣ２からの受音信号Ｘ2（ｔ）を遅延回路20に送出し、当該遅延回路20で受音信号Ｘ2（ｔ）を、前部無指向性マイクロフォンＭＣ１から後部無指向性マイクロフォンＭＣ２までの音波伝播時間だけ遅延させ、これにより得られた遅延信号Ｘ2’（ｔ）を加算回路21に送出する。

加算回路21では、遅延信号Ｘ2’（ｔ）と、前部無指向性マイクロフォンＭＣ１からの受音信号Ｘ1（ｔ）との差をとった単一指向性信号Ｄ3（ｔ）（すなわち、１次差分特性となるＸ2’（ｔ）−Ｘ1（ｔ））を生成し、これを周波数分析部13へ送出する。

ここで単一指向性信号Ｄ3（ｔ）を周波数分析部13で周波数解析して得られるスペクトル（以下、これを単一指向性スペクトルと呼ぶ）｜Ｆ3（ω）｜の指向特性は、図４に示す点線のように、ｘ軸の図中右側（筐体２の背面2b側）にヌルを有した単一指向性パターンP3となる。

このように単一指向性パターンP3では、筐体２の背面2b側にヌルが形成されることにより筐体２の背面2b方向から到来する音の受音感度が最小となる。

周波数分析部13は、単一指向性信号Ｄ2（ｔ）、単一指向性信号Ｄ3（ｔ）及び双指向性信号Ｄ1（ｔ）を高速フーリエ変換（ＦＦＴ：First Fourier Transform）することにより周波数領域に変換し、これにより得られた単一指向性スペクトルＦ2（ω）、単一指向性スペクトルＦ3（ω）及び双指向性スペクトルＦ1（ω）を切替部16に送出する。

切替部16は、ユーザが操作部４を操作することにより得られる操作情報に基づいて切替動作し、周波数分析部13から受け取った単一指向性スペクトルＦ2（ω）及び単一指向性スペクトルＦ3（ω）のうちいずれか一方を選択し、選択した単一指向性スペクトルＦ2（ω）又は単一指向性スペクトルＦ3（ω）を指向性雑音分離部17に送出するようになされている。

具体的には、ユーザが筐体２の正面2aに顔を向け、表示部３を視認しながら自己の音声を前部無指向性マイクロフォンＭＣ１，ＭＣ３及び後部無指向性マイクロフォンＭＣ２，ＭＣ４で集音して通話相手とテレビ電話による通話を行なうテレビ電話モードの場合、指向性雑音除去用として筐体２の正面2a側から到来する目的音（すなわちユーザ自身の音声）をスペクトル・サブトラクション（ＳＳ：Spectral Subtraction）法等により、強調させる単一指向性パターンP2が切替部16で選択される。なおこの場合、目的音が到来する目的音方向とは、音源であるユーザから筐体２の正面2aへ向かう方向ｖ（図１）となる
これにより切替部16は、筐体２の正面2a側から到来する目的音の受音感度が低く、かつ背面2b側から到来する指向性雑音の受音感度が高い単一指向性スペクトルＦ2（ω）のみを指向性雑音分離部17へ送出する。

またユーザーが前部無指向性マイクロフォンＭＣ１，ＭＣ３及び後部無指向性マイクロフォンＭＣ２，ＭＣ４で撮像対象からの音声等を集音しながら筐体２の背面2b側に有するカメラ（図示せず）により静止画もしくは動画を撮像する録画モードのときには、筐体２の背面2b側から到来する撮像対象からの目的音（例えば、撮像対象である友人の音声）をスペクトル・サブトラクション（ＳＳ）法等により、強調させる単一指向性パターンP3が切替部16で選択されるようにする。なお、この場合、目的音が到来する目的音方向とは、音源である撮像対象から筐体２の背面2bへ向かう方向（図示せず）となる。

これにより切替部16は、筐体２の背面2b側から到来する目的音の受音感度が低く、かつ正面2a側から到来する指向性雑音の受音感度が高い単一指向性スペクトルＦ3（ω）のみを指向性雑音分離部17へ送出する。

指向性雑音分離部17では、例えば切替部16において単一指向性スペクトルＦ2（ω）が選択された場合、スペクトラル・サブトラクション（ＳＳ）法を用いて、周波数帯域毎に、双指向性スペクトルＦ1（ω）のパワーγから、単一指向性スペクトルＦ2（ω）のパワーδに係数Ｋを乗じた値（Ｋ×δ）を減じ、これにより筐体２の背面2b側から到来する指向性雑音等を除去した指向性雑音除去音声スペクトルＦ5（ω）を生成し、これを合成部９に送出する。

一方、切替部16において単一指向性スペクトルＦ3（ω）が選択された場合、指向性雑音分離部17では、スペクトラル・サブトラクション（ＳＳ）法を用いて、周波数帯域毎に、双指向性スペクトルＦ1（ω）のパワーγから、単一指向性スペクトルＦ3（ω）のパワーδに係数Ｋを乗じた値（Ｋ×δ）を減じ、これにより筐体２の正面2a側から到来する指向性雑音等を除去した指向性雑音除去音声スペクトルＦ5（ω）を生成し、これを合成部９に送出する。

なお、係数Ｋは、例えば、双指向性スペクトルＦ1（ω）のパワーγと、単一指向性スペクトルＦ2（ω）のパワーδとの差の大きさや、双指向性スペクトルＦ1（ω）のパワーγと、単一指向性スペクトルＦ3（ω）のパワーδとの差の大きさに依存する係数等である。

また、例えば双指向性スペクトルＦ1（ω）のパワーγの方が、単一指向性スペクトルＦ2（ω）や単一指向性スペクトルＦ3（ω）のパワーδに係数Ｋを乗じた値（Ｋ×δ）よりも小さくなる周波数帯域においては、例えば、一定のルールで定められた最小値（各周波数帯域につき一定の値でもよく、単一指向性スペクトルＦ2（ω）や単一指向性スペクトルＦ3（ω）の周波数帯域毎の各パワーの値に比例する値等でもよい。）を算出値としてもよく、あるいはゼロとしてもよい。

以上では前部無指向性マイクロフォンＭＣ１から出力される受音信号Ｘ1（ｔ）と、後部無指向性マイクロフォンＭＣ２から出力されるＸ2（ｔ）とによって指向性雑音除去音声スペクトルＦ5（ω）を得る指向性雑音除去処理について説明したが、同様の指向性雑音除去処理は前部無指向性マイクロフォンＭＣ３から出力される受音信号Ｘ3（ｔ）と、後部無指向性マイクロフォンＭＣ４から出力される受音信号Ｘ4（ｔ）とを用いて周波数分析部25、切替部26及び指向性雑音分離部27によっても行なわれ、さらにもう１つの指向性雑音除去音声スペクトルＦ6（ω）を生成し、これを合成部９に送出するようになされている。

実際上、第２指向性制御部30は、図３に示したように、加算回路31において、前部無指向性マイクロフォンＭＣ３から出力された受音信号Ｘ3（ｔ）と、後部無指向性マイクロフォンＭＣ４から出力された受音信号Ｘ4（ｔ）との差をとる処理を行ない双指向性信号Ｄ8（ｔ）（すなわち、Ｘ3（ｔ）−Ｘ4（ｔ））を生成し、これを第２雑音除去部８の周波数分析部25へ送出する。

なお、この双指向性信号Ｄ8（ｔ）を周波数分析部25で周波数解析して得られる双指向性スペクトル｜Ｆ8（ω）｜の指向特性は、前部無指向性マイクロフォンＭＣ３及び後部無指向性マイクロフォンＭＣ４を結ぶｙ軸を中心とし、筐体２の正面2a及び背面2b側での受音感度が最大となる横「８」の字状の双指向性パターン（図４の双指向性パターンP1と同じ形状）となる。

これに加えて、このとき第２指向性制御部30では、前部無指向性マイクロフォンＭＣ３からの受音信号Ｘ3（ｔ）を、遅延回路32で前部無指向性マイクロフォンＭＣ３から後部無指向性マイクロフォンＭＣ４までの音波伝播時間だけ遅延させ、これにより得られた遅延信号Ｘ3’（ｔ）を加算回路33に送出し、受音信号Ｘ4（ｔ）との差をとった単一指向性信号Ｄ9（ｔ）（すなわち、Ｘ3’（ｔ）−Ｘ4（ｔ））を生成して、これを第２雑音除去部８の周波数分析部25へ送出する。

なお、単一指向性信号Ｄ9（ｔ）を周波数分析部25で周波数解析して得られる単一指向性スペクトル｜Ｆ9（ω）｜の指向特性は、ｙ軸を中心とし、筐体２の正面2a側にヌルが形成されて筐体２の背面2b方向への受音感度が最大となる単一指向性パターン（図４の単一指向性パターンP2と同じカージオイド）となる。

また、これに加えて第２指向性制御部30は、後部無指向性マイクロフォンＭＣ４からの受音信号Ｘ4（ｔ）を、遅延回路34で前部無指向性マイクロフォンＭＣ３から後部無指向性マイクロフォンＭＣ４までの音波伝播時間だけ遅延させ、これにより得られた遅延信号Ｘ4’（ｔ）を加算回路35に送出し、受音信号Ｘ3（ｔ）との差をとった単一指向性信号Ｄ10（ｔ）（すなわち、Ｘ4’（ｔ）−Ｘ3（ｔ））を生成して、これを第２雑音除去部８の周波数分析部25へ送出する。

なお、単一指向性信号Ｄ10（ｔ）を周波数分析部25で周波数解析して得られる単一指向性スペクトル｜Ｆ10（ω）｜の指向特性は、ｙ軸を中心とし、筐体２の背面2b側にヌルが形成されて筐体２の正面2a方向への受音感度が最大となる単一指向性パターンP3aとなる。

そして、切替部26は、第１雑音除去部７の切替部16と同様に動作し、テレビ電話モード時、筐体２の正面2a側から到来する目的音を減衰させる単一指向性パターンとなる単一指向性スペクトルＦ9（ω）を選択し得る。これにより切替部26は、筐体２の正面2a側から到来する目的音の受音感度が低い単一指向性スペクトルＦ9（ω）を指向性雑音分離部27へ送出する。

これに対して録画モード時には、筐体２の背面2b側から到来する撮像対象からの目的音を減衰させる単一指向性パターンとなる単一指向性スペクトルＦ10（ω）が切替部26で選択され得る。これにより切替部26は、筐体２の背面2b側から到来する撮像対象からの目的音の受音感度が低い単一指向性スペクトルＦ10（ω）のみを指向性雑音分離部27へ送出する。

指向性雑音分離部27では、スペクトラル・サブトラクション（ＳＳ：Spectral Subtraction）法を用いて、周波数帯域毎に、双指向性スペクトルＦ8（ω）のパワーγから、単一指向性スペクトルＦ9（ω）又は単一指向性スペクトルＦ10（ω）のパワーδに係数Ｋを乗じた値（Ｋ×δ）を減じ、これによりモード選択に応じて筐体２の背面2b側又は正面2a側から到来する指向性雑音等を除去した指向性雑音除去音声スペクトルＦ6（ω）を生成し、これを合成部９に送出する。

合成部９は、第１雑音除去部７からの指向性雑音除去音声スペクトルＦ5（ω）と、第２雑音除去部８からの指向性雑音除去音声スペクトルＦ6（ω）との和として合成スペクトルＦ7（ω）を得ることで、指向性雑音に比してユーザの音声を目的音として一段と強調して集音し得るようになされている。

次に音源分離処理のうち、例えば筐体２の正面2a方向から目的音が到来するテレビ電話モード時において指向性雑音成分を除去した合成スペクトルＦ7（ω）から拡散性雑音成分を除去する拡散性雑音除去処理について以下説明する。

第１指向性制御部11は、前部無指向性マイクロフォンＭＣ１からの受音信号Ｘ1（ｔ）と、後部無指向性マイクロフォンＭＣ２からの受音信号Ｘ2（ｔ）とに基づいて生成した単一指向性信号Ｄ3（ｔ）を周波数分析部40へ送出する。

また、第２指向性制御部30は、前部無指向性マイクロフォンＭＣ３からの受音信号Ｘ3（ｔ）と、後部無指向性マイクロフォンＭＣ４からの受音信号Ｘ4（ｔ）とに基づいて生成され単一指向性信号Ｄ10（ｔ）を周波数解析部40へ送出する。

なお、ここで単一指向性信号Ｄ10（ｔ）を周波数分析部40で周波数解析して得られる単一指向性スペクトル｜Ｆ10（ω）｜の指向特性は、y軸を中心にして筐体２の背面2b側にヌルが形成されて筐体２の正面2a方向への受音感度が最大となり、かつ背面2b側の受音感度が最小となる単一指向性パターンP3a（図４）となる。

周波数分析部40は、第１指向制御部11から得られる単一指向性信号Ｄ3（ｔ）と、第２指向制御部30から得られる単一指向性信号Ｄ10（ｔ）とを、高速フーリエ変換することにより周波数領域に変換し、これにより得られた単一指向性スペクトルＦ3（ω）及び単一指向性スペクトルＦ10（ω）をＭＳＣ算出部41に送出する。

因みに、この場合、目的音が到来する目的音方向ｖ側にヌルが形成されると、目的音の受音感度が低下するため、筐体２の正面2a側から目的音が到来するテレビ電話モード時においては、筐体２の正面2a側の受音感度が高い単一指向性スペクトルＦ3（ω）及び単一指向性スペクトルＦ10（ω）を用いるが、これら指向性の方向が同じ出力信号を用いてＭＳＣ算出部41でＭＳＣ関数の演算（後述する）を行なうと、この計算結果として低域まで含めて全周波数帯域で低いＭＳＣ値が得られない。

従って、周波数分析部40は、低域を含む全周波数帯域でＭＳＣ値を小さくするために、単一指向性スペクトルＦ3（ω）及び単一指向性スペクトルＦ10（ω）のうちいずれか一方に替えて、例えば前部無指向性マイクロフォンＭＣ３から出力された受音信号Ｘ3（ｔ）を周波数領域に変換し、これにより得られる無指向性スペクトルＦ11（ω）をＭＳＣ算出部41へ送出する。

なお、この実施の形態の場合には、前部無指向性マイクロフォンＭＣ３から出力された受音信号Ｘ3（ｔ）を用いているが、本発明はこれに限らず、前部無指向性マイクロフォンＭＣ１から出力された受音信号Ｘ1（ｔ）、後部無指向性マイクロフォンＭＣ２から出力された受音信号Ｘ2（ｔ）又は後部無指向性マイクロフォンＭＣ４から出力された受音信号Ｘ4（ｔ）のいずれかを用いるようにしても良い。

実際上、ＭＳＣ算出部41は、単一指向性スペクトルＦ3（ω）及び単一指向性スペクトルＦ10（ω）を受け取ると、単一指向性スペクトルＦ3（ω）を自乗したパワースペクトル強度値Ｗ_ｘｘと、単一指向性スペクトルＦ10（ω）を自乗したパワースペクトル強度値Ｗ_ｙｙとを算出するとともに、単一指向性スペクトルＦ3（ω）及び単一指向性スペクトルＦ10（ω）間のクロスパワースペクトル強度値Ｗ_ｘｙを算出する。

そして、ＭＳＣ算出部41は、この計算結果を利用して、下記式（１）に基づき所定の観測周波数帯域におけるＭＳＣ関数の演算を行なうことにより、低域から高域までの各周波数帯域におけるＭＳＣ値を算出し、これらをＭＳＣデータＭ１としてスムージング部42に送出する。因みに、ここで「^＊」は複素共役を示している。

この場合、ＭＳＣ算出部41では、単一指向性スペクトルＦ3（ω）と、単一指向性スペクトルＦ10（ω）とを用いてＭＳＣ値を算出することにより、ＭＳＣ値のうち高域成分について「１」以下に抑えることができる。

かかる構成に加えて、ＭＳＣ算出部41は、単一指向性スペクトルＦ10（ω）に替えて前部無指向性マイクロフォンＭＣ３の出力たる無指向性スペクトルＦ11（ω）を周波数分析部40から受け取ると、当該単一指向性スペクトルＦ10（ω）に替えて無指向性スペクトルＦ11（ω）を用いて上述したＭＳＣ関数の演算を行なう。

この場合、ＭＳＣ算出部41は、単一指向性スペクトルＦ3（ω）を自乗したパワースペクトル強度値Ｗ_ｘｘと、無指向性スペクトルＦ11（ω）を自乗したパワースペクトル強度値Ｗ_ｙｙと、単一指向性スペクトルＦ3（ω）及び無指向性スペクトルＦ11（ω）間のクロスパワースペクトル強度値Ｗ_ｘｙとを算出し、これら計算結果を利用して、上記式（１）に基づき所定の観測周波数帯域におけるＭＳＣ関数の演算を行なう。

これによりＭＳＣ算出部41は、低域から高域までの各周波数帯域におけるＭＳＣ値を算出し、これらをＭＳＣデータＭ１としてスムージング部42に送出する。このようにして単一指向性スペクトルＦ3（ω）及び無指向性スペクトルＦ11（ω）を用いて算出したＭＳＣ値は、図５の実線で示すように、高域成分だけでなく低域成分も含めて全周波数帯域に亘って低い値に抑制され得る。すなわち、この場合、ＭＳＣ算出部41では、特に低域の周波数帯域においてもＭＳＣ値を「１」よりも低い値に抑えるようになされている。

スムージング部42は、入力されたＭＳＣデータＭ１について時間に関するスムージング処理を行なう。スムージング処理は以下の式（２）に基づいて行われる。

ここでαは時間平均化の程度を変えるための乗数で、例えばα＝０．８の値がとられる。またβは拡散性雑音低減に関する緩和乗数で、拡散性雑音低減の程度を調整する。
例えばβとしては、β＝０．５の値がとられる。かくしてスムージング部42は、ＭＳＣデータm1に対して時間に関するスムージング処理を施したＭＳＣデータm2を得、これを拡散性雑音分離部43に送出する。

拡散性雑音分離部43では、合成部９から受け取った合成スペクトルＦ7（ω）を自乗した後、スムージング部42から受け取ったスムージング処理されたＭＳＣデータm2に基づいた値を、当該自乗した合成スペクトルＦ7（ω）に対して各周波数帯域毎に乗することにより、当該時間に関するスムージング処理を施したＭＳＣデータm2でフィルタリングを行い、合成スペクトルＦ7（ω）を修正し、目的音のみの目的音スペクトルＦ15（ω）を得る。

このように拡散性雑音分離部43では、合成スペクトルＦ7（ω）のパワー値をＭＳＣ値に対応させて低減させ、高域での周波数帯域だけでなく、低域での周波数帯域においても拡散性雑音成分を除去した目的音スペクトルＦ15（ω）を生成し得る。

このようにして拡散性雑音と目的音とを分離した後には、会話を行う通話相手の携帯電話機等に送信したり、事前に適応処理又は学習処理を行って得られた音響モデルを用いて音声認識を行うことができる。

この際、拡散性雑音分離部43による処理で得られた周波数領域上の信号である目的音スペクトルＦ15（ω）を、時間領域上の信号である音声波形に変換する合成処理を行なった後、雑音を付与して周波数分析を行ない、その後、音声認識を行ってもよい。また、雑音の付与は、時間領域上ではなく、周波数領域上で行ってもよい。

以上の構成において、音源分離装置10では、単一指向性スペクトルＦ3（ω）と、単一指向性スペクトルＦ10（ω）とを用いてＭＳＣ値を算出するようにしたことにより、ＭＳＣ値のうち高域成分について「１」以下に抑えることができる。

また、音源分離装置10では、単一指向性スペクトルＦ10（ω）に替えて無指向性スペクトルＦ11（ω）を用い、単一指向性スペクトルＦ3（ω）及び無指向性スペクトルＦ11（ω）を基にＭＳＣ値を算出するようにしたことにより、低域成分も含めてさらに全周波数帯域においてＭＳＣ値を従来よりも低い値にできる。

特に、低域の周波数帯域においては、従来のように無指向性マイクロフォンからのスペクトルのみを用いてＭＳＣ関数を演算すると、図５の点線で示すように、ＭＳＣ値が「１」となり、このようなＭＳＣ値を用いても拡散性雑音を除去することができない。

これ対して本発明においては目的音方向ｖが既知であることを活用して、空間フィルタを用いる場合にも空間フィルタの指向特性が安定で大きな方向に目的音を設定でき、かくして良好な目的音をとりだせる。そして、低域の周波数帯域においてＭＳＣ値を最大値である「１」よりも低い値に抑えることができるので、当該ＭＳＣ値を用いることにより低域の周波数帯域においても拡散性雑音を除去できる。

また、この音源分離装置10では、前部無指向性マイクロフォンＭＣ１からの受音信号Ｘ1（ｔ）及び後部無指向性マイクロフォンＭＣ２からの受音信号Ｘ2（ｔ）を用いてスペクトラル・サブトラクション（ＳＳ）法によって指向性雑音を除去するようにしたことにより、指向性雑音を除去するために別途マイクロフォン等を設ける必要がなく、その分だけ複雑な構成となることを防止し、装置全体として小型化を図ることができる。

さらに、この音源分離装置10では、指向性雑音を除去するために利用される前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２からの単一指向性信号Ｄ3（ｔ）と、同じく指向性雑音を除去するために利用される前部無指向性マイクロフォンＭＣ３からの受音信号Ｘ3（ｔ）とを利用して、ＭＳＣ算出部41、スムージング部42及び拡散性雑音分離部43によって拡散性雑音除去処理を行なうようにしたことにより、指向性雑音だけでなく、低域周波数帯域を含めて拡散性雑音を同時に除去できる統合的な装置を実現できる。

このように前部無指向性マイクロフォンＭＣ１，ＭＣ３及び後部無指向性マイクロフォンＭＣ２，ＭＣ４（アンプやＡ／Ｄも含め）を共用化して指向性雑音及び拡散性雑音を同時に低減することができるので、指向性雑音除去専用マイクロフォン及び拡散性雑音除去専用マイクロフォン等をそれぞれ個別に設けない分だけ、システム全体として簡易な構成とし、コスト低減を図ることができる。

さらに、この実施の形態においては、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２による単一指向性パターンP3の最大感度軸方向と、前部無指向性マイクロフォンＭＣ３及び後部無指向性マイクロフォンＭＣ４による単一指向性パターンP3aの最大感度軸方向とが、互いに同じ方向になるように形成され、当該最大感度軸方向から目的音（ユーザの音声）を到来させるようにしたことで、指向性雑音と同時に拡散性雑音の低減を行なうことができる。

また、ＭＳＣ値の算出のために、単一指向性スペクトルＦ10（ω）に替えて無指向性スペクトルＦ11（ω）を用いることにより、さらに全周波数帯域においてＭＳＣ値を従来よりも低い値にでき、かくして低域周波数帯域も含めて全周波数帯域で拡散性雑音を除去することができる。

なお、この実施の形態の場合、前部無指向性マイクロフォンＭＣ１，ＭＣ３及び後部無指向性マイクロフォンＭＣ２，ＭＣ４は、無指向性であることから、振幅位相周波数特性の乱れを抑制できるとともに、風雑音の低減を図ることもできる。

以上の構成によれば、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフ
ォンＭＣ２と、前部無指向性マイクロフォンＭＣ３及び後部無指向性マイクロフォンＭＣ４とを目的音が到来する目的音方向ｖに間隔を置いて配置し、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２を結ぶｘ軸がその指向特性の最大感度軸と同一となり、かつ前部無指向性マイクロフォンＭＣ３及び後部無指向性マイクロフォンＭＣ４を結ぶｙ軸がその指向特性の最大感度軸と同一となるようにした。

また、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２による単一指向性信号Ｄ3（ｔ）と、前部無指向性マイクロフォンＭＣ３及び後部無指向性マイクロフォンＭＣ４からの単一指向性信号Ｄ10（ｔ）との２個の出力信号を用いてクロスパワースペクトル強度値を算出し、このクロスパワースペクトル強度値に基づいて、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２の出力信号と、前部無指向性マイクロフォンＭＣ３及び後部無指向性マイクロフォンＭＣ４と出力信号とに基づいた周波数成分のＭＳＣデータm1（解析パラメータ）をＭＳＣ算出部41で算出し、このＭＳＣデータm1に基づいて拡散性雑音とその他の音を拡散性雑音分離部43で分離するようにした。これにより指向性雑音と同時に拡散性雑音の低減を行なうことができる。

また、単一指向性スペクトルＦ10（ω）に替えて無指向性スペクトルＦ11（ω）を用いてＭＳＣ値の算出を行なうようにしたことにより、低域も含めてさらに全周波数帯域においてＭＳＣ値を従来よりも一段と低い値にでき、かくして低域周波数帯域も含めて全周波数帯域で拡散性雑音を除去することができる。

従って、この音源分離装置10では、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２間の間隔や、前部無指向性マイクロフォンＭＣ３及び後部無指向性マイクロフォンＭＣ４間の間隔を従来のように所定以上の距離まで離さなくても、低域周波数帯域で低くなったＭＳＣ値により、拡散性雑音について高域の周波数成分だけでなく、低域の周波数成分についても確実に除去できるので、従来よりも前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２間の間隔や、前部無指向性マイクロフォンＭＣ３及び後部無指向性マイクロフォンＭＣ４間の間隔を狭めることができ、かくして一段と小型化を図ることができる。よって携帯電話機等の小型通信端末に対しても確実に搭載することができる。

なお、本発明は、上記の実施の形態に限定されるものではなく、種々の変形実施が可能である。例えば、上述した第１の実施の形態においては、スペクトラル・サブトラクション（ＳＳ）法を用いて指向性雑音を除去した指向性雑音除去音声スペクトルを生成するようにした場合について述べたが、本発明はこれに限らず、バイナリマスク法を用いて指向性妨害音を除去した指向性妨害音除去音声スペクトルを生成するようにしても良い。

実際上、スペクトラル・サブトラクション（ＳＳ）法の替わりにバイナリマスク法を用いた場合、指向性雑音分離部は、双指向性スペクトルＦ1（ω）と、例えば単一指向性スペクトルＦ2（ω）との間で同一の周波数帯域の各パワーの大小の比較を周波数帯域毎に行い、それぞれの周波数帯域で双指向性スペクトルＦ1（ω）の方が単一指向性スペクトルＦ2（ω）よりも大きい時、双指向性スペクトルＦ1（ω）の方のパワーを、分離して得られるスペクトルに帰属させる帯域選択を行なう。

なお、筐体２の背面2b側から目的音が到来する録画モードにおいては、筐体２の背面2b側の受音感度が高い単一指向性スペクトルＦ2（ω）及び単一指向性スペクトルＦ9（ω）と、例えば無指向性スペクトルＦ11（ω）をＭＳＣ算出部41に送出する構成とし、これら単一指向性スペクトルＦ2（ω）及び単一指向性スペクトルＦ9（ω）、若しくは単一指向性スペクトルＦ2（ω）及び単一指向性スペクトルＦ9（ω）のいずれかの替わり無指向性スペクトルＦ11（ω）を用いてＭＳＣデータを算出すれば、上述した実施の形態と同様の効果を得ることができる。

（２）第２の実施の形態
図１との対応部分に同一符号を付して示す図６は第２の実施の形態による折り畳み式携帯電話機50を示すもので、この折り畳み式携帯電話機50は、表示部３、スピーカ５及びカメラ６が正面51aに設けられた表示部筐体51と、操作部４及び４つの無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８が筐体面としての正面52aに設けられた操作部筐体52とがヒンジ部53を介して折り畳み及び展開可能に構成されている。

実際上、この折り畳み式携帯電話機50は、スティックタイプの携帯電話機１（図１）の筐体２に比べて表示部筐体51及び操作部筐体52の厚さ寸法が極力薄くなるように形成されていることから、無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８が下端面52cではなく、ユーザの音声（目的音）が到来する目的音方向ｖと直角方向となる操作部筐体52の正面52a四隅にそれぞれ配置された構成を有する。

この実施の形態の場合には、無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８
は、所定位置での目的音方向ｖとヌル方向とを異ならせ、所定位置での目的音方向ｖを軸として回転させたときに、同一となる指向性を形成するように、折り畳み式携帯電話機50の操作面としての操作部筐体52の正面52aに設けられている。なお、本発明はこれに限らず、所定位置での目的音方向ｖとヌル方向とを異ならせ、所定位置での目的音方向ｖを軸として回転させたときに、同一となる指向性を形成できれば、無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８を折り畳み式携帯電話機50の表示面としての表示部筐体51の正面51aに設けるようにしても良い。

図２との対応部分に同一符号を付して示す図７のように、折り畳み式携帯電話機50に内蔵されている音源分離装置54は、テレビ電話モード及び表示部筐体52の背面側に有するカメラ（図示せず）で撮像する録画モードの両モード時において、上述した第１の実施の形態と同様に、無指向性マイクロフォンＭＣ５，ＭＣ６から出力された受信信号Ｘ1（ｔ），Ｘ2（ｔ）を用いて、第１指向性制御部11により、双指向性信号Ｄ1（ｔ）、単一指向性信号Ｄ2（ｔ）及び単一指向性信号Ｄ3（ｔ）を生成し、これらを第１雑音除去部54の周波数分析部13へ送出するとともに、単一指向性信号Ｄ3（ｔ）を周波数解析部40にも送出する。

周波数分析部13は、これら双指向性信号Ｄ1（ｔ）、単一指向性信号Ｄ2（ｔ）及び単一指向性信号Ｄ3（ｔ）の周波数解析を行い、双指向性スペクトルＦ1（ω）、単一指向性スペクトルＦ2（ω）及び単一指向性スペクトルＦ3（ω）を求めた後、これらを指向性雑音分離部56へ送出する。

ここで双指向性スペクトル｜Ｆ1（ω）｜の指向特性は、図８に示すように、無指向性マイクロフォンＭＣ５及び無指向性マイクロフォンＭＣ６を結ぶｘ´軸を中心として、操作部筐体52の両側面側での受音感度が最大となる縦「８」の字状の双指向性パターンP１となる。また、単一指向性スペクトル｜Ｆ2（ω）｜の指向特性は、ｘ´軸を中心として、操作部筐体52の一側面側にヌルが形成されて受音感度が最小となる単一指向性パターンP2なり、単一指向性スペクトル｜Ｆ3（ω）｜の指向特性は、ｘ´軸を中心として、単一指向性パターンP2とは逆方向に操作部筐体52の他側面側にヌルが形成されて受音感度が最小となる単一指向性パターンP3となる。

指向性雑音分離部56は、単一指向性スペクトルＦ3（ω）と、双指向性スペクトルＦ1（ω）とを用いて、スペクトラル・サブトラクション（ＳＳ）法を行ない、各周波数における単一指向性スペクトルＦ3（ω）の大きさから、双指向性スペクトルＦ1（ω）の大きさを差し引くことにより、図８に示すように、操作部筐体52の側面側から到来する雑音を低減したスペクトルを生成する。

この時同時に指向性雑音分離部56は、一方の無指向性マイクロフォンＭＣ６の設置された側の空間（図８では右側空間）から到来する、目的音を含む音に対する利得が、目的音方向ｖから他方の無指向性マイクロフォンＭＣ５の設置された側の空間（図８では左側空間）方向にずれるとき、急激に小さくなることを利用して、目的音に対する指向性を高めるように働く。

また、指向性雑音分離部56は、単一指向性スペクトルＦ2（ω）と、双指向性スペクトルＦ1（ω）とを用いて、スペクトラル・サブトラクション（ＳＳ）法を行ない、各周波数における単一指向性スペクトルＦ2（ω）の大きさから、双指向性スペクトルＦ1（ω）の大きさを差し引くことにより、操作部筐体52の側面側から到来する雑音を低減したスペクトルを生成する。

この時同時に指向性雑音分離部56は、他方の無指向性マイクロフォンＭＣ５の設置された側の空間（図８では左側空間）から到来する、目的音を含む音に対する利得が、目的音方向ｖから一方の無指向性マイクロフォンＭＣ６の設置された側の空間（図８では右側空間）方向にずれるとき、急激に小さくなることを利用して、目的音に対する指向性を高めるように働く。

また、これに加えて指向性雑音分離部56は、以上で作られた２種のスペクトルについてミニマイゼーション処理を行なうようになされている。

ここでミニマイゼーション処理は、周波数帯域毎に各パワーの大小を比較して劣勢な方のパワーを目的音のスペクトルとして帰属させる処理であり、これにより指向性雑音分離部56は、スペクトル統合処理を行い指向性雑音を除去した指向性雑音除去音声スペクトルＦ20（ω）を生成し、これを合成部57へ送出する。

因みに、ミニマイゼーションによるスペクトル統合処理では、同一の周波数帯域のパワー同士を比較し、各周波数帯域で劣勢の方のパワーが選択され、これらを音声の音声スペクトルとして帰属させることにより、音声と指向性雑音とを分離することができる。

なお、ミニマイゼーションによるスペクトル統合処理は、各周波数帯域毎の劣勢の方のパワーを捨てることなく、指向性雑音除去音声スペクトルＦ20（ω）として帰属させ得る。

かかる構成に加えて無指向性マイクロフォンＭＣ６と対角線上に配置された無指向性マイクロフォンＭＣ７は、無指向性マイクロフォンＭＣ５とともに、第３指向性制御部58に接続されており、当該無指向性マイクロフォンＭＣ５から出力された受音信号Ｘ1（ω）と、無指向性マイクロフォンＭＣ７から出力された受音信号Ｘ3（ω）とが第３指向性制御部58に送出される。

周波数分析部59及び指向性雑音分離部60からなる第２雑音除去部55と、第３指向性制御部58とは、先に説明した第１雑音除去部54と第１指向性制御部11と同様の構成からなり、指向性雑音除去音声スペクトルＦ20（ω）の生成処理と同様の生成処理を実行し得ることにより、無指向性マイクロフォンＭＣ５からの受音信号Ｘ1（ω）と、無指向性マイクロフォンＭＣ７からの受音信号Ｘ3（ω）とに基づいて指向性雑音除去音声スペクトルＦ21（ω）を生成し得るようになされている。

なお、この場合、第３指向性制御部58は、第１指向性制御部11と同様に加算回路や遅延回路（図示せず）が設けられており、これら加算回路等により、無指向性マイクロフォンＭＣ５からの受音信号Ｘ1（ｔ）及び無指向性マイクロフォンＭＣ７からの受音信号Ｘ3（ｔ）との差をとる処理を行って双指向性信号Ｄ22（ｔ）（すなわち、Ｘ1（ｔ）−Ｘ3（ｔ））を生成し、周波数分析部59を介して指向性雑音分離部60に送出する。

ここで双指向性信号Ｄ22（ｔ）を周波数分析部59で周波数解析して得られる双指向性スペクトル｜Ｆ22（ω）｜の指向特性は、無指向性マイクロフォンＭＣ５及び無指向性マイクロフォンＭＣ７を結ぶ軸を中心として、操作部筐体52の上端（すなわちヒンジ部53側）及び下端面52c方向での受音感度が最大となる縦「８」の字状の双指向性パターン（図示せず）となる。

また、第３指向性制御部58は、遅延回路で無指向性マイクロフォンＭＣ５から無指向性マイクロフォンＭＣ７までの音波伝播時間だけ、当該無指向性マイクロフォンＭＣ７からの受音信号Ｘ3（ｔ）を遅延させた遅延信号Ｘ3’（ｔ）と、受音信号Ｘ1（ｔ）との差をとった単一指向性信号Ｄ23（ｔ）（すなわち、Ｘ3’（ｔ）−Ｘ1（ｔ））を生成し、周波数分析部59を介して指向性雑音分離部60に送出する。

ここで単一指向性信号Ｄ23（ｔ）を周波数分析部59で周波数解析して得られる単一指向性スペクトル｜Ｆ23（ω）｜の指向特性は、無指向性マイクロフォンＭＣ５及び無指向性マイクロフォンＭＣ７を結ぶ軸を中心として、操作部筐体52のヒンジ部53側にヌルが形成されて操作部筐体52のヒンジ部53方向への受音感度が最小となる単一指向性パターン（図示せず）となる。

さらに、第３指向性制御部58は、遅延回路で無指向性マイクロフォンＭＣ５から無指向性マイクロフォンＭＣ７までの音波伝播時間だけ、当該無指向性マイクロフォンＭＣ５からの受音信号Ｘ1（ｔ）を遅延させた遅延信号Ｘ1’（ｔ）と、受音信号Ｘ3（ｔ）との差をとった単一指向性信号Ｄ24（ｔ）（すなわち、Ｘ1’（ｔ）−Ｘ3（ｔ））を生成し、周波数分析部59を介して指向性雑音分離部60に送出する。

ここで単一指向性信号Ｄ24（ｔ）を周波数分析部59で周波数解析して得られる単一指向性スペクトル｜Ｆ24（ω）｜の指向特性は、無指向性マイクロフォンＭＣ５及び無指向性マイクロフォンＭＣ７を結ぶ軸を中心として、操作部筐体52の下端面52c側にヌルが形成されて操作部筐体52の下端面52c方向への受音感度が最小となる単一指向性パターン（図示せず）となる。

指向性雑音除去部60は、上述した指向性雑音除去部56と同様にスペクトラル・サブトラクション（ＳＳ）法を行ない、各周波数帯域毎に単一指向性スペクトルＦ23（ω）の大きさから、双指向性スペクトルＦ22（ω）の大きさを差し引くことにより、操作部筐体52の上下端方向（図８）から到来する雑音を低減したスペクトルを生成する。

また、指向性雑音分離部60は、スペクトラル・サブトラクション（ＳＳ）法を行ない、各周波数帯域毎に単一指向性スペクトルＦ24（ω）の大きさから、双指向性スペクトルＦ22（ω）の大きさを差し引くことにより、操作部筐体52の上下端方向から到来する雑音を低減したスペクトルを生成する。

これに加えて指向性雑音分離部60は、以上で作られた２種のスペクトルについて、上述と同じミニマイゼーション処理を行ない、スペクトル統合して指向性雑音を除去した指向性雑音除去音声スペクトルＦ21（ω）を生成し、これを合成部57へ送出する。

合成部57は、第１雑音除去部54からの指向性雑音除去音声スペクトルＦ20（ω）と、第２雑音除去部55からの指向性雑音除去音声スペクトルＦ21（ω）とをミ二マイゼーション処理して合成スペクトルＦ7（ω）を得ることで、指向性雑音に比してユーザの音声を目的音として一段と強調して集音し得るようになされている。

つまり、ｘ´軸方向である無指向性マイクロフォンＭＣ５及び無指向性マイクロフォンＭＣ６を結ぶ軸方向からの指向性雑音を除去することと、無指向性マイクロフォンＭＣ５及び無指向性マイクロフォンＭＣ７を結ぶ軸方向からの指向性雑音を除去することとを、ミニマイゼーション処理によって同時に実現し、ｘ´軸方向と、無指向性マイクロフォンＭＣ５及び無指向性マイクロフォンＭＣ７を結ぶ軸方向ともに利得が制限されたビーム状指向性とするように制限を加えるためである。

一方、音源分離処理のうち、合成スペクトルＦ7（ω）から拡散性雑音成分を除去する本発明の拡散性雑音除去処理については、上述した第１の実施の形態と同様にして実行され得る。

すなわち、周波数解析部40は、第２指向制御部61から得られる単一指向性信号Ｄ4（ｔ）と、第１指向制御部11から得られる単一指向性信号Ｄ3（ｔ）とを、高速フーリエ変換することにより周波数領域に変換し、これにより得られた単一指向性スペクトルＦ3（ω）及び単一指向性スペクトルＦ4（ω）をＭＳＣ算出部41に送出する。

ＭＳＣ算出部41は、この計算結果を利用して、上記式（１）に基づき所定の観測周波数帯域におけるＭＳＣ値を算出し、この低域から高域までの周波数帯域において変化するＭＳＣ値をＭＳＣデータm3としてスムージング部42に送出する。

スムージング部42は、ＭＳＣデータm3に対して時間に関するスムージング処理を施したＭＳＣデータm4を得、これを拡散性雑音分離部43に送出する。

拡散性雑音分離部43では、合成部57からの合成スペクトルＦ7（ω）を自乗し、ＭＳＣデータm4を基にＭＳＣ値を各周波数帯域毎に乗することにより、当該ＭＳＣデータm4でフィルタリングを行い、目的音のパワースペクトルを修正する。

このように拡散性雑音分離部43では、合成スペクトルＦ7（ω）のパワー値をＭＳＣ値に対応させて低減させ、高域の周波数帯域だけでなく低域の周波数帯域においても拡散性雑音成分を除去した目的音スペクトルＦ15（ω）を生成し得る。

以上の構成によれば、目的音方向ｖと直角をなす方向である操作部筐体52の正面52aに、互いの位置関係が長方形の頂点の位置をなすように４つの無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８を設けるようにした。

このように無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８によって形成され
た指向特性を、所定位置での目的音方向ｖを軸として回転させたときに、同一となる無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８によって、テレビ電話モード時及び録画モード時のとき、指向性雑音を除去する構成の携帯電話機50であっても、上述した第１の実施の形態と同様に、低域周波数帯域でも低くなったＭＳＣ値を算出し、このＭＳＣ値を用いて合成スペクトルＦ7（ω）の周波数成分の解析を行なえ、目的音と拡散性雑音とを分離することができる。

従って、音源分離装置54では、無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８間の間隔を所定距離以上まで離さずに、低域周波数帯域でも低くなったＭＳＣ値により、拡散性雑音について高域の周波数成分とともに低域の周波数成分についても確実に除去できるので、従来よりも無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８間の間隔を狭めることができ、かくして一段と小型化を図ることができる。

またこの実施の形態においては、無指向性マイクロフォンＭＣ５及び無指向性マイクロフォンＭＣ６による単一指向性パターンP3と、無指向性マイクロフォンＭＣ７及び無指向性マイクロフォンＭＣ８による単一指向性パターンP4とが、互いにヌルを対向させ、最大感度軸方向が互いに逆方向に形成され、当該最大感度軸方向と直交する方向から目的音（ユーザの音声）を到来させるようにしたことで、低域周波数帯域も含めて全周波数帯域で拡散性雑音を効率的に除去させることができる。

（３）第３の実施の形態
図２との対応部分に同一符号を付して示す図９は、第３の実施の形態による音源分離装置70を示し、この音源分離装置70は、上述した第１の実施の形態と異なり、筐体２（図１）の下端面2cに２つの無指向性の前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２のみを用いて、指向性雑音成分及び拡散性雑音成分を除去し得る点で異なるものである。

この場合、音源分離装置70は、先ず始めに通話時にユーザが声を発していない状態（以下、これを無目的音状態と呼ぶ）において、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２で周囲の指向性雑音や拡散性雑音を集音する。

音源分離装置70は、このとき前部無指向性マイクロフォンＭＣ１から出力された受音信号Ｘ1n（ｔ）と、後部無指向性マイクロフォンＭＣ２から出力された受音信号Ｘ2n（ｔ）とをそのまま周波数分析部13へ送出し、当該周波数分析部13において受音信号Ｘ1n（ｔ）及び受音信号Ｘ2n（ｔ）を高速フーリエ変換することにより周波数領域に変換し、当該受音信号Ｘ1n（ｔ）から得られた無目的音スペクトルＦX1n（ω）及び受音信号Ｘ2n（ｔ）から得られた無目的音スペクトルＦX2n（ω）をＭＳＣ算出部41に送出する。

ＭＳＣ算出部41は、無目的音スペクトルＦX1n（ω）を自乗したパワースペクトル強度値Ｗ_ｘｘと、無目的音スペクトルＦX2n（ω）を自乗したパワースペクトル強度値Ｗ_ｙｙとを算出するとともに、この無目的音スペクトルＦX1n（ω）及び無目的音スペクトルＦX2n（ω）間のクロスパワースペクトル強度値Ｗ_ｘｙを算出する。

ＭＳＣ算出部41は、この計算結果を利用して、上記した第１の実施の形態の式（１）に基づき所定の観測周波数帯域におけるＭＳＣ関数の演算を行なうことにより、無目的音状態での低域から高域までの各周波数帯域におけるＭＳＣ値を算出し、これらをＭＳＣデータm5として差分算出部72に送出する。

そして、その後、ユーザが声を発して通話相手と実際に通話が開始された状態（以下、これを目的音受音状態と呼ぶ）になると、この音源分離装置70は、ユーザの音声を目的音として前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２で集音し得る。

指向性制御部71は、前部無指向性マイクロフォンＭＣ１からの受音信号Ｘ1（ｔ）及び後部無指向性マイクロフォンＭＣ２からの受音信号Ｘ2（ｔ）をそのまま周波数分析部13へ送出し、当該周波数分析部13において受音信号Ｘ1（ｔ）及び受音信号Ｘ2（ｔ）を高速フーリエ変換することにより周波数領域に変換し、当該受音信号Ｘ1（ｔ）から得られたＭＳＣ用音声スペクトルＦX1（ω）及び受音信号Ｘ2（ｔ）から得られたＭＳＣ用音声スペクトルＦX2（ω）をＭＳＣ算出部41に送出する。

ＭＳＣ算出部41は、ＭＳＣ用音声スペクトルＦX1（ω）を自乗したパワースペクトル強度値Ｗ_ｘｘと、ＭＳＣ用音声スペクトルＦX2（ω）を自乗したパワースペクトル強度値Ｗ_ｙｙとを算出するとともに、このＭＳＣ用音声スペクトルＦX1（ω）及びＭＳＣ用音声スペクトルＦX2（ω）間のクロスパワースペクトル強度値Ｗ_ｘｙを算出する。

ＭＳＣ算出部41は、この計算結果を利用して、上記した第１の実施の形態の式（１）に基づき所定の観測周波数帯域におけるＭＳＣ関数の演算を行なうことにより、目的音受音状態での低域から高域までの各周波数帯域におけるＭＳＣ値を算出し、これらをＭＳＣデータm6として差分算出部72に送出する。

差分算出部72は、無目的音状態での受音信号Ｘ1n（ｔ）及び受音信号Ｘ2n（ｔ）から得られたＭＳＣデータm5と、目的音受音状態での受音信号Ｘ1（ｔ）及び受音信号Ｘ2（ｔ）から得られた解析パラメータとしてのＭＳＣデータm6との各周波数帯域毎に差分を算出し、目的音受音状態において算出したＭＳＣデータm6を、無目的音状態において算出したＭＳＣデータm5によって補正する。

そして、差分算出部72は、このようにして各周波数帯域毎に算出した補正操作値としての差分ＭＳＣ値を差分ＭＳＣデータm7としてスムージング部42に送出する。

スムージング部42は、差分ＭＳＣデータm7について時間に関するスムージング処理を行ない、これにより得られた差分ＭＳＣデータm8を拡散性雑音分離部43に送出する。

そして、これと同時に指向性制御部71は、上述した第１の実施の形態と同様に、前部無指向性マイクロフォンＭＣ１からの受音信号Ｘ1（ｔ）及び後部無指向性マイクロフォンＭＣ２からの受音信号Ｘ2（ｔ）に基づいて加算回路や遅延回路等により双指向性信号Ｄ1（ｔ）、単一指向性信号Ｄ2（ｔ）及び単一指向性信号Ｄ3（ｔ）を生成し、これらを周波数解析部13に送出する。

周波数解析部13は、双指向性信号Ｄ1（ｔ）、単一指向性信号Ｄ2（ｔ）及び単一指向性信号Ｄ3（ｔ）を高速フーリエ変換することにより周波数領域に変換し、これにより得られた双指向性信号Ｄ1（ｔ）の双指向性スペクトルＦ1（ω）を指向性雑音分離部17に送出するとともに、単一指向性信号Ｄ2（ｔ）の単一指向性スペクトルＦ2（ω）と、単一指向性信号Ｄ3（ｔ）の単一指向性スペクトルＦ3（ω）とを切替部16に送出する。

切替部16は、ユーザによるテレビ電話モード又は録画モードの選択により操作部４の操作に応じて切替動作し、周波数分析部13から受け取った単一指向性スペクトルＦ2（ω）及び単一指向性スペクトルＦ3（ω）のうちいずれか一方を選択して、単一指向性スペクトルＦ2（ω）又は単一指向性スペクトルＦ3（ω）を指向性雑音分離部17に送出する。

指向性雑音分離部17では、スペクトラル・サブトラクション（ＳＳ）法を用いて、周波数帯域毎に、双指向性スペクトルＦ1（ω）のパワーγから、例えばテレビ電話モード時では単一指向性スペクトルＦ2（ω）（録画モード時では単一指向性スペクトルＦ3（ω））のパワーδに係数Ｋを乗じた値（Ｋ×δ）を減じ、これにより筐体６の正面6a側から到来する指向性雑音を除去した指向性雑音除去音声スペクトルＦ5（ω）を生成し、これを拡散性雑音分離部43に送出する。

拡散性雑音分離部43では、指向性雑音除去音声スペクトルＦ5（ω）を指向性雑音分離部17から受け取ると、当該指向性雑音除去音声スペクトルＦ5（ω）を自乗した後、差分ＭＳＣデータm8を各周波数帯域毎に乗することにより、当該差分ＭＳＣデータm8でフィルタリングを行い、指向性雑音除去音声スペクトルＦ5（ω）を修正し、目的音のみの目的音スペクトルＦ15（ω）を生成し得る。

このようにして拡散性雑音分離部43では、指向性雑音除去音声スペクトルＦ5（ω）のパワー値を、無目的音状態と目的音受音状態とでのＭＳＣ値の差分をとった差分ＭＳＣ値に対応させて低減させ、高域の周波数帯域だけでなく低域の周波数帯域においても拡散性雑音成分を除去した目的音スペクトルＦ15（ω）を生成し得るようになされている。

以上の構成によれば、無目的音状態での前部無指向性マイクロフォンＭＣ１からの受音信号Ｘ1n（ｔ）及び後部無指向性マイクロフォンＭＣ２からの受音信号Ｘ2n（ｔ）と、目的音受音状態での前部無指向性マイクロフォンＭＣ１からの受音信号Ｘ1（ｔ）及び後部無指向性マイクロフォンＭＣ２からの受音信号Ｘ2（ｔ）とを入力として、周波数分析部13を介してＭＳＣ算出部41で各周波数帯域毎にそれぞれＭＳＣ値を算出するとともに、差分算出部72においてこれらＭＳＣ値の各周波数帯域毎での差分ＭＳＣ値を算出し、これら差分値としての差分ＭＳＣ値を用いて拡散性除去処理を行なうようにした。

従って、音源分離装置70では、２つの前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２間の間隔を所定以上の距離まで離さなくても、低域周波数帯域で低くなった差分ＭＳＣ値により、拡散性雑音について高域の周波数成分とともに低域の周波数成分についても確実に除去できるので、従来よりも前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２間の間隔を狭めることができ、かくして一段と小型化を図ることができる。

また、この音源分離装置70では、指向性雑音を除去するために用いられる前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２を用い、これら前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２から得られる無目的音状態での受音信号Ｘ1n（ｔ）及び受音信号Ｘ2n（ｔ）と、目的音受音状態での受音信号Ｘ1（ｔ）及び受音信号Ｘ2（ｔ）とに基づき差分ＭＳＣデータm8を生成して、この差分ＭＳＣデータm8を基に拡散性雑音除去処理を行なうようにしたことにより、前部無指向性マイクロフォンＭＣ１及び後部無指向性マイクロフォンＭＣ２のみで指向性雑音だけでなく、拡散性雑音をも同時に除去できる統合的な装置を実現できる。

（４）第４の実施の形態
図６との対応部分に同一符号を付して示す図１０は、第４の実施の形態による折り畳み式携帯電話機80を示し、この折り畳み式携帯電話機80は、上述した第２の実施の形態における４つの無指向性マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８に替えて、操作部筐体52の一方の側面52dに指向性マイクロフォンＭＣ10を設けるとともに、当該一方の側面52dと対向した他方の側面52eに指向性マイクロフォンＭＣ11が設けられている。

この場合、一方の指向性マイクロフォンＭＣ10の指向特性は、図１１に示すように、指向性マイクロフォンＭＣ10及び指向性マイクロフォンＭＣ11を結んだｘ´´軸と、指向特性の最大感度軸とが同一であり、図中右側（操作部筐体52の他方の側面52e側）にヌルを有した単一指向性パターンP10となるように配置されている。

また、他方の指向性マイクロフォンＭＣ11の指向特性は、ｘ´´軸と、指向特性の最大感度軸とが同一で、かつ図中左側（操作部筐体52の一方の側面52d側）にヌルを有した単一指向性パターンP11となるように配置されている。

このように指向性マイクロフォンＭＣ10及び指向性マイクロフォンＭＣ11は、互いに逆方向に指向特性の最大感度を有するように配置されている。

また、指向性マイクロフォンＭＣ10及び指向性マイクロフォンＭＣ11は、当該指向性マイクロフォンＭＣ10からの受音信号Ｘ10（ｔ）と、指向性マイクロフォンＭＣ11からの受音信号Ｘ11（ｔ）とに基づいて、ｘ´´軸を指向特性の最大感度軸の中心とした横「８」の字状の双指向性パターンP11を形成し得るようになされている。

そして、上述した第２の実施の形態と同様にして、折り畳み式携帯電話機80では、単一指向性パターンP10の指向性マイクロフォンＭＣ10から得た受音信号Ｘ10（ｔ）に基づく単一指向性スペクトルと、単一指向性パターンP11の指向性マイクロフォンＭＣ11から得た受音信号Ｘ11（ｔ）に基づく単一指向性スペクトルと、双指向性パターンP11を形成する指向性マイクロフォンＭＣ10及び指向性マイクロフォンＭＣ11からの出力信号に基づく双指向性スペクトルとを生成する。

そして、折り畳み式携帯電話機80に内蔵した音源分離装置は、スペクトラル・サブトラクション（ＳＳ）法を行ない、各周波数における単一指向性スペクトルの大きさから、双指向性スペクトルの大きさを差し引くことにより、操作部筐体52の側面52e，52d方向にあたるｘ´´軸方向側から到来する雑音を低減した２種のスペクトルを生成した後、ミニマイゼーション処理を行なう。

かくしてこの折り畳み式携帯電話機80ではミニマイゼーション処理によって音声と指向性雑音とを分離した指向性雑音除去音声スペクトルを生成できる。

また、指向性雑音除去音声スペクトルから拡散性雑音成分を除去する本発明の拡散性雑音除去処理については、単一指向性パターンP10の指向特性信号と、単一指向性パターンP11の指向特性信号とを用いて、上述した第１の実施の形態と同様にして実行され、指向性雑音除去音声スペクトルのパワー値をＭＳＣ値に対応させて低減させ、高域の周波数帯域だけでなく低域の周波数帯域においても拡散性雑音成分を除去した目的音スペクトルＦ8（ω）を生成し得る。

以上の構成において、折り畳み式携帯電話機80では、上述した第２の実施の形態と同様に、指向性マイクロフォンＭＣ10及び指向性マイクロフォンＭＣ11を結んだｘ´´軸方向からの指向性雑音を除去できるとともに、高域から低域にかけて全周波数帯域で拡散性雑音を除去できる。

また、この折り畳み式携帯電話機80では、第２の実施の形態に比してマイクロフォンの数を低減することができるので、装置全体として簡易な構成にできる。

なお、上述した実施の形態においては、折り畳み式携帯電話機80の操作部筐体52における一方の側面52dに指向性マイクロフォンＭＣ10を設け、他方の側面52eに指向性マイクロフォンＭＣ11を設けるようにした場合について述べたが、本発明はこれに限らず、図６との対応部分に同一符号を付して示す図１２のように、折り畳み式携帯電話機90の操作部筐体52の正面52a下部に指向性マイクロフォンＭＣ13を設け、当該指向性マイクロフォンＭＣ13に対向する背面52f下部に指向性マイクロフォンＭＣ14を設ける等この他種々の位置に指向性マイクロフォンを設けるようにしても良い。

この場合、図１３に示すように、一方の指向性マイクロフォンＭＣ13の指向特性は、指向性マイクロフォンＭＣ13及び指向性マイクロフォンＭＣ14を結んだ、ｘ´´´軸と、指向特性の最大感度軸とが同一で、かつ操作部筐体52の背面52ｆ側にヌルを有した単一指向性パターンP13となるように配置される。

また、他方の指向性マイクロフォンＭＣ14の指向特性は、ｘ´´´軸と指向特性の最大感度軸とが同一で、かつ操作部筐体52の正面52aにヌルを有した単一指向性パターンP14となるように配置される。

このように指向性マイクロフォンＭＣ13及び指向性マイクロフォンＭＣ14は、互いに逆方向に指向特性の最大感度を有するように配置され、かつ受音信号Ｘ13（ｔ）及び受音信号Ｘ14（ｔ）に基づいて、ｘ´´´軸を指向特性の最大感度軸の中心とし、正面52a側及び背面52ｆ側が最大感度となる双指向性パターンP15を形成し得るようになされている。

これにより折り畳み式携帯電話機90では、上述した第１の実施の形態と同様に、音源分離処理のうち指向性雑音除去処理を実行することにより、受音信号Ｘ13（ｔ）及び受音信号Ｘ14（ｔ）から指向性雑音成分を除去した指向性雑音除去音声スペクトルを生成する。

また、指向性雑音除去音声スペクトルから拡散性雑音成分を除去する本発明の拡散性雑音除去処理については、単一指向性パターンP13の指向特性信号と、双指向性パターンP15の指向特性信号とを用いて、上述した第１の実施の形態と同様にして実行され、指向性雑音除去音声スペクトルのパワー値をＭＳＣ値に対応させて低減させ、高域の周波数帯域だけでなく低域の周波数帯域においても拡散性雑音成分を除去した目的音スペクトルＦ8（ω）を生成し得る。

以上の構成において、折り畳み式携帯電話機90では、操作部筐体52と側面方向（図１２中の左右方向）及び正面52a背面52f方向から到来する指向性雑音を除去できるとともに、高域から低域にかけて全周波数帯域で拡散性雑音を除去できる。

（５）他の実施の形態
以上、本発明の第１〜第４の実施の形態について説明したが、本発明は、当該第１〜第
４の実施の形態に限定されるものではなく、種々の変形実施が可能である。例えば、第２
の実施の形態において表示部筐体51の正面51aや背面等のこの他種々の箇所にマイクロフ
ォンＭＣ５等の各種マイクロフォンを設けるようにしても良い。所定位置での目的音方向ｖとヌル方向とを異ならせ、当該目的音方向ｖを軸として回転させたときに指向特性が同一となるように指向性マイクロフォン、またそのような指向性を形成する無指向性マイクロフォンを種々の箇所に設けるようにしても良い。

また、第２の実施の形態においては、マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８から選択した２個の組み合わせのマイクロフォン対の出力信号２個に遅延差を与えた後、差をとることで得られた指向性信号を複数個生成し、この指向性信号２個づつで、複数のクロスパワースペクトル強度値を算出して、当該クロスパワースペクトル強度値に基づいて、マイクロフォンＭＣ５，ＭＣ６，ＭＣ７，ＭＣ８の出力信号における周波数成分のＭＳＣデータを複数個求め、複数個のＭＳＣデータの各周波数最小値により目的音と拡散性雑音とを分離するようにしても良い。

このような場合には、複数個のＭＳＣデータの各周波数最小値を用いることから、各周波数帯域毎に合成スペクトルＦ7（ω）に含まれる拡散性雑音成分を確実に除去することができる。

さらに、第２の実施の形態においては、複数の指向性信号を高速フーリエ変換することにより周波数スペクトルに変換して各周波数スペクトルを大きさ成分と位相成分とに分け、当該大きさ成分（以下、これをマグニチュードと呼ぶ）サンプルのうち最小のマグニチュードサンプル（以下、これを最小マグニチュードサンプルと呼ぶ）を選択して、これを利用して各周波数帯域毎に合成スペクトルＦ7（ω）に含まれる拡散性雑音成分を除去するようにしても良い。

この場合、最小マグニチュードサンプルを選択して、指向性信号の生成に用いた無指向性マイクロフォン対の出力信号の差分信号における各周波数スペクトルのマグニチュードサンプルとの間で、マグニチュード差分値を算出してこれを拡散性分離部の入力とし、マグニチュード差分値を用いて各周波数帯域毎に合成スペクトルＦ7（ω）に含まれる拡散性雑音成分を確実に除去することができる。

さらに、第２の実施の形態においては、複数の無指向性マイクロフォンで生成した複数の指向性信号を高速フーリエ変換し、これにより得られた各周波数スペクトルの最小マグニチュードサンプルを選択して、指向性信号の生成に用いた無指向性マイクロフォン対の出力信号の差分信号における各周波数スペクトルのマグニチュードサンプルとの間で、最小マグニチュードサンプル値の方が大きいときに、当該最小マグニチュードサンプル値を出力とし、それ以外は出力値を概略０として拡散性分離部の入力とするようにしても良い。

このような場合でも最小マグニチュードサンプル値及び概略０の出力値から、各周波数帯域毎に合成スペクトルＦ7（ω）に含まれる拡散性雑音成分を確実に除去することができる。

さらに、上述した実施の形態のうち任意に選択した実施の形態を組み合わせた音源分離装置を実現するようにしても良い。

例えば、第２の実施の形態による音源分離装置50においても、第３の実施の形態のように、無目的音状態のときに前部無指向性マイクロフォンＭＣ５及び後部無指向性マイクロフォンＭＣ６を無指向性として機能させ、このとき得られた受音信号に基づいて上記式（１）を用いＭＳＣデータを生成し、その後、目的音受音状態で得られた受音信号に基づいてＭＳＣデータを生成した後、これらＭＳＣデータの差分でなる補正操作値としての差分ＭＳＣデータを得て拡散性雑音を除去するようにしても良い。

また、例えば、第２の実施の形態において、複数のＭＳＣデータや差分ＭＳＣデータを同時に生成し、これらＭＳＣデータや差分ＭＳＣデータのうち各周波数帯域毎に適宜最小値のものを選定し、これにより拡散性雑音を除去するようにしても良い。

すなわち、例えば閾値として所定周波数帯域を設定しておき、当該所定周波数帯域よりも高域の周波数帯域においては、差分ＭＳＣ値を用いるとともに、当該所定周波数帯域よりも低い周波数帯域では、指向性を持たせたマイクロフォンＭＣ５及びマイクロフォンＭＣ６等によって生成したＭＳＣデータm4を用い、これにより状況に応じた最適な拡張性雑音除去処理を行なうことができる。

さらに、上述した第２の実施の形態においては、マイクロフォンＭＣ５及びマイクロフォンＭＣ６と、マイクロフォンＭＣ７及びマイクロフォンＭＣ８とで２つの指向性マイクロフォンを構築するようにした場合について述べたが、本発明はこれに限らず、３つの第１〜第３マイクロフォンを設け、これら第１〜第３マイクロフォンによって２つの指向性マイクロフォンを構築するようにしても良い。

このように３つの第１〜第３マイクロフォンを用いる場合には、互いの位置関係が二等辺三角形や三角形の頂点の位置をなすように３つの第１〜第３マイクロフォンが配置され、これら第１〜第３マイクロフォンからそれぞれ出力される受音信号に対して適宜、遅延処理を施すことにより、第１マイクロフォン及び第２マイクロフォンにより指向性マイクロフォンを構築するとともに、第１マイクロフォン及び第３マイクロフォンにより他の指向性マイクロフォンを構築させるようにしても良く、この場合、拡散性雑音を除去できるという上述した効果と同様の効果を得ることができるとともに、マイクロフォン数を減らすことができ、一段と小型化を図ることができる。

さらに、この第２の実施の形態においては、目的音受音状態での受音信号から得られたＭＳＣ値と無目的音状態での受音信号から得られた無目的音ＭＳＣ値の差分値と、ＭＳＣ値の最大値である１と当該無目的音ＭＳＣ値の差分値との比を求め、これを補正操作値としての差分ＭＳＣ値として用いて各周波数帯域毎に合成スペクトルＦ7（ω）に含まれる拡散性雑音成分を除去するようにしても良い。

さらに、目的音受音状態での受音信号から得られたＭＳＣデータと無目的音状態での受音信号から得られた無目的音ＭＳＣデータの差分ＭＳＣ値を算出するとともに、当該差分ＭＳＣ値と最大値である１及び無目的音ＭＳＣ値の差分値の比とを算出し、これらを選択的に利用して拡散性雑音とその他の音を分離するようにしても良い。

実際上、この場合、複数の指向性マイクロフォンからの受音信号の組み合わせを基にＭＳＣ算出部で算出された複数のＭＳＣデータと、目的音受音状態での受音信号から得られたＭＳＣデータと無目的音状態での受音信号から得られた無目的音ＭＳＣデータの差分ＭＳＣ値からなる差分ＭＳＣデータと、上述した差分値の比との中から少なくとも２個を選びだし、各周波数帯域毎の最小値を利用することにより拡散性雑音とその他の音を分離することができる。

さらに、上述した第１〜第４の実施の形態において、上述した例により複数個のＭＳＣデータを算出し、これら複数のＭＳＣデータの各周波数線形加算値により目的音と拡散性雑音とを分離するようにしても良い。このような場合には、複数個のＭＳＣデータの各周波数線形加算値を用いて、ＭＳＣデータの重み付けすることで、各周波数帯域毎に合成スペクトルＦ7（ω）に対して最適な特性を与えて、各周波数帯域毎に合成スペクトルＦ7（ω）に含まれる拡散性雑音成分を確実に除去できる。

また、上述した第１〜第４の実施の形態においては、携帯電話機１や折り畳み式携帯電話機50，80，90内のＨＤＤに予め格納された音源分離プログラムをＣＰＵがＲＡＭ上に展開し、当該音源分離プログラムに従って音源分離処理を行なうようになされているが、本発明はこれに限らず、音源分離プログラムが格納されたプログラム格納媒体を用いて携帯電話機１や折り畳み式携帯電話機50，80，90にインストールすることにより上述の処理を行なうようにしても良い。

このように上述した一連の処理を実行するための音源分離プログラムをインストールして実行可能な状態にするためのプログラム格納媒体としては、例えばフロッピー（登録商標)ディスク、ＣＤ−ＲＯＭ（Compact Disc-Read Only Memory ）、ＤＶＤ（Digital Versatile Disc ）等のパッケージメディアのみならず、音源分離プログラムが一時的もしくは永続的に格納される半導体メモリや磁気ディスク等で実現しても良い。またこれらプログラム格納媒体に音源分離プログラムを格納する手段としては、ローカルエリアネットワークやインターネット、ディジタル衛星放送等の有線及び無線通信媒体を利用しても良く、ルータやモデム等の各種通信インターフェースを介して格納するようにしても良い。特に半導体メモリや磁気ディスク等で実現した場合、インターネットを介してのデータのダウンロードによって不特定多数の顧客に対し販売を行なうビジネスモデルを構築できる。ダウンロードを行った顧客は、使用するＰＣ（パーソナル・コンピュータ）やさらに転送した先の機器において、プログラムを使用し、音源分離を実行することができる。

さらに、上述した実施の形態においては、上述の処理を携帯電話機１や折り畳み式携帯電話機50，80，90に適用するようにした場合について述べたが、本発明はこれに限らず、ＰＤＡ（Personal Data Assistant）等の小型通信端末や、ナビゲーションシステム等に搭載された音声認識装置、さらには補聴器等のような目的音と指向性雑音及び拡散性雑音とを分離する必要がある他の種々の装置に適用するようにしても良い。

第１の実施の形態による携帯電話機の外観構成を示す概略図である。第１の実施の形態による本発明の音源分離装置の回路構成を示すブロック図である。第１指向性制御部及び第２指向性制御部の詳細構成を示すブロック図である。第１の実施の形態による第１指向性制御部及び第２指向性制御部で形成される単一指向性パターン及び双指向性パターンを示す概略図である。ＭＣＳ値と周波数帯域との関係を示すグラフである。第２の実施の形態による折り畳み式携帯電話機の外観構成を示す概略図である。第２の実施の形態による本発明の音源分離装置の回路構成を示すブロック図である。第２の実施の形態による第１指向性制御部及び第２指向性制御部で形成される単一指向性パターン及び双指向性パターンを示す概略図である。第３の実施の形態による本発明の音源分離装置の回路構成を示すブロック図である。第４の実施の形態における折り畳み式携帯電話機に対する指向性マイクロフォンの配置を示す概略図である。第４の実施の形態における指向性マイクロフォンの単一指向性パターン及び双指向性パターンの様子を示す概略図である。第４の実施の形態における指向性マイクロフォンの他の配置を示す概略図である。第４の実施の形態における他の配置位置での指向性マイクロフォンの単一指向性パターン及び双指向性パターンの様子を示す概略図である。

符号の説明

10、54、70 音源分離装置
41 ＭＳＣ算出部（算出手段）
43 拡散性雑音分離部（分離手段）
ＭＣ１、ＭＣ３前部無指向性マイクロフォン
ＭＣ２、ＭＣ４後部無指向性マイクロフォン
ＭＣ５、ＭＣ６、ＭＣ７、ＭＣ８無指向性マイクロフォン
ＭＣ10、ＭＣ11、ＭＣ13、ＭＣ14 指向性マイクロフォン

Claims

所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離装置において、
間隔を置いて配置され、所定位置での目的音方向とヌル方向とを異ならせ、前記目
的音方向を軸として回転させたときに指向特性が同一である複数の指向性マイクロフォン
と、
前記指向性マイクロフォンから出力された受音信号に基づいてクロスパワースペクトル
強度値を算出する算出手段と、
前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメ
ータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する拡散性雑音分離手段とを備えた音源分離装置であって、
前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号とを入力として、前記算出手段によってそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて、
前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを前記拡散性雑音分離手段の入力とすることを特徴とする音源分離装置。
所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離装置において、
間隔を置いて配置された、指向特性の最大感度方向に目的音を配置し、かつ指向特性の
最大感度軸が概略マイクロフォンを結ぶ軸と同一である複数の指向性マイクロフォンと、
前記指向性マイクロフォンから出力された受音信号に基づいてクロスパワースペクトル
強度値を算出する算出手段と、
前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメ
ータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する拡散性雑音分離手段とを備えた音源分離装置であって、
前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号とを入力として、前記算出手段によってそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて、
前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを前記拡散性雑音分離手段の入力とすることを特徴とする音源分離装置。
前記解析パラメータが二乗コヒーレンス値であることを特徴とする請求項１又は２記載の音源分離装置。
前記指向性マイクロフォンの指向特性が１次差分特性であることを特徴とする請求項１〜３のうちいずれか１項記載の音源分離装置。
前記指向性マイクロフォンの指向特性がカージオイド特性であることを特徴とする請求項４の音源分離装置。
前記指向性マイクロフォンの指向特性のヌル方向が目的音方向と直角をなすことを特徴とする請求項１〜５のうちいずれか１項記載の音源分離装置。
前記クロスパワースペクトル強度値を算出する前記指向性マイクロフォン対の指向特性が互いに逆方向であることを特徴とする請求項１〜６のうちいずれか１項記載の音源分離装置。
前記指向性マイクロフォンの配置位置が携帯機器の端面であることを特徴とする請求項１〜７のうちいずれか１項記載の音源分離装置。
前記指向性マイクロフォン配置が携帯機器の正面及び背面であることを特徴とする請求項１〜７のうちいずれか１項記載の音源分離装置。
前記複数の解析パラメータの補正操作値が、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と、前記無目的音状態での受音信号から得られた二乗コヒーレンス値との差分値であることを特徴とする請求項１〜９のうちいずれか１項記載の音源分離装置。
前記複数の解析パラメータの補正操作値が、
前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態
での受音信号から得られた二乗コヒーレンス値の差分値と、
最大値である１と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差
分値の比であることを特徴とする請求項１〜９のうちいずれか１項記載の音源分離装置。
前記拡散性雑音分離手段は、
前記受音信号の周波数成分に関する前記複数の指向性マイクロフォンの組み合わせから
前記算出手段で算出された複数の解析パラメータと、
目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音
信号から得られた二乗コヒーレンス値の差分値と、
前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態
での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である１と前記無目的
音状態での受音信号から得られた二乗コヒーレンス値の差分値の比との中から少なくとも２個の前記解析パラメータもしくは該解析パラメータの補正操作値を選びだし、各周波数帯域毎の最小値及び線形結合値のうち少なくとも一方により前記拡散性雑音とその他の音を分離することを特徴とする請求項１〜９のうちいずれか１項記載の音源分離装置。
所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離方法において、
間隔を置いて配置され、所定位置での目的音方向とヌル方向とを異ならせ、前記目的
音方向を軸として回転させたときに指向特性が同一である複数の指向性マイクロフォンを
用い、前記指向性マイクロフォンから出力された受音信号に基づいて、クロスパワースペ
クトル強度値を算出し、
前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する音源分離方法であって、
各前記マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号のそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて、
前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを用いて前記拡散性雑音とその他の音を分離することを特徴とする音源分離方法。
所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離方法において、
間隔を置いて配置された、指向特性の最大感度方向に目的音を配置し、かつ指向特性の
最大感度軸が概略マイクロフォンを結ぶ軸と同一である複数の指向性マイクロフォンを用
い、前記指向性マイクロフォンから出力された受音信号に基づいて、クロスパワースペク
トル強度値を算出し、
前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメ
ータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する音源分離方法であって、
各前記マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号のそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて、
前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを用いて前記拡散性雑音とその他の音を分離することを特徴とする音源分離方法。
前記解析パラメータが二乗コヒーレンス値であることを特徴とする請求項１３又は１４の音源分離方法。
前記指向性マイクロフォンの指向特性が１次差分特性であることを特徴とする請求項１３〜１５のうちいずれか１項記載の音源分離方法。
前記指向性マイクロフォンの指向特性がカージオイド特性であることを特徴とする請求項１６の音源分離方法。
前記指向性マイクロフォンの指向特性のヌル方向が前記目的音方向と直角をなすことを特徴とする請求項１３〜１７のうちいずれか１項記載の音源分離方法。
前記クロスパワースペクトル強度値を算出する前記指向性マイクロフォン対の指向特性が、互いに逆方向であることを特徴とする請求項１３〜１８のうちいずれか１項記載の音源分離方法。
前記指向性マイクロフォンの配置位置が携帯機器の端面であることを特徴とする請求項１３〜１９のうちいずれか１項記載の音源分離方法。
前記指向性マイクロフォンの配置が携帯機器表面及び背面であることを特徴とする請求項１３〜１９のうちいずれか１項記載の音源分離方法。
前記複数の解析パラメータの補正操作値が、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値であることを特徴とする請求項１３〜２１記載の音源分離方法。
前記複数の解析パラメータの補正操作値が、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である１と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値の比であることを特徴とする請求項１３〜２１記載の音源分離方法。
前記受音信号の周波数成分に関する複数のマイクロフォンの組み合わせから得られる複数の解析パラメータを算出して、前記複数の解析パラメータと、
目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音
信号から得られた二乗コヒーレンス値の差分値と、
前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態
での受音信号から得られた二乗コヒーレンス値の差分値と、値１と前記無目的音状態での
受音信号から得られた二乗コヒーレンス値の差分値の比との中から、少なくとも２個の前記解析パラメータもしくは該解析パラメータの補正操作値を選びだし、各周波数帯域毎の最小値及び線形結合値のうち少なくとも一方により前記拡散性雑音とその他の音を分離することを特徴とする請求項１３〜２１のうちいずれか１項記載の音源分離方法。
請求項１３〜２４のうちいずれか１項記載の音源分離方法をコンピュータに実行させるための音源分離プログラム。
請求項１３〜２４のうちいずれか１項記載の音源分離方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。