WO2016194945A1

WO2016194945A1 - 集音装置、及び集音装置の制御方法

Info

Publication number: WO2016194945A1
Application number: PCT/JP2016/066181
Authority: WO
Inventors: 高田　直樹; 文彬中島
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2015-06-01
Filing date: 2016-06-01
Publication date: 2016-12-08
Anticipated expiration: 2017-12-01
Also published as: CN108141663B; EP3306950A1; JP2016225884A; JP6611474B2; US10237648B2; EP3306950A4; CN108141663A; EP3306950B1; US20180295443A1

Abstract

部品点数の低減や構造の複雑化を抑えつつ、発話者の音声を高精度に取得し易い集音装置、及び集音装置の制御方法を提供する。　音声処理部３５は、発話者である乗員の音声を取得する動作モード（発話モード、通話モード）か否かを判定する（ステップＳ１Ａ）。音声処理部３５は、他の動作モード（音声再生モード、頭部位置測定モード）であった場合に、マイクアレイの指向性を乗員の外側、又は無指向に設定し（ステップＳ４Ａ、Ｓ５Ａ）、マイクアレイの入力音声を取得する。また、音声処理部３５は、乗員の音声を取得する動作モード（発話モード、通話モード）の場合に、マイクアレイの指向性を乗員に向ける（ステップＳ２Ａ）。

Description

集音装置、及び集音装置の制御方法

　本発明は、複数のマイクを並べたマイクアレイの指向性を制御可能な集音装置、及び集音装置の制御方法に関する。

　車のダッシュボードや天井、ハンドルなどにマイクを搭載し、ハンズフリー通話や音声認識を行う車載装置が知られている。この種の集音を行う装置（以下、集音装置）には、さらに高性能化する為に、複数のマイクを並べたマイクアレイを備え、ビームフォーミング制御によりマイクアレイの指向性を制御するものが提案されている（例えば、特許文献１参照）。
　この特許文献１では、自動車に備えられたバックミラー又は座席の位置に基づいて自動車内の発話者の頭部の位置を検出する位置検出器を備え、検出された頭部の位置、及び各マイクの位置に基づいて指向性演算処理を行うようにしている。

国際公開第２００９／１５７１９５号

　しかし、従来の構成は、バックミラー又は座席の位置を物理的に検出する位置検出器が必要であり、部品点数の増減や構造の複雑化を招きやすい。
　本発明は、上述した事情に鑑みてなされたものであり、部品点数の低減や構造の複雑化を抑えつつ、発話者の音声を高精度に取得し易い集音装置、及び集音装置の制御方法を提供することを目的とする。

　なお、この明細書には、２０１５年６月１日に出願された日本国特許出願・特願２０１５－１１１６５７号の全ての内容が含まれる。
　上記目的を達成するために、本発明は、複数のマイクを並べたマイクアレイの指向性を制御可能な集音装置において、発話者の音声を取得する第１状態か否かを判定する判定部と、前記第１状態ではない第２状態の場合に、前記マイクアレイの指向性を前記発話者の外側、又は無指向に設定して前記マイクアレイの入力音声を取得し、前記第１状態の場合に、前記マイクアレイの指向性を前記発話者に向ける制御部とを備えることを特徴とする。

　上記構成において、前記マイクアレイは前記発話者の後方に配置され、前記制御部は、前記第１状態の場合に、前記マイクアレイの指向性を前記発話者の後頭部から首までの範囲に設定するようにしても良い。

　また、上記構成において、前記制御部は、前記第２状態で取得した前記入力音声に基づいて周囲ノイズを取得し、前記第１状態の場合に、前記マイクアレイの入力音声から前記周囲ノイズを除去するノイズ除去処理を行うようにしても良い。

　また、上記構成において、前記集音装置は、所定のスピーカーを介して音声を出力する音声出力部を有するとともに、動作モードとして、前記発話者の音声を取得する発話モードと、前記スピーカーを介して音声を出力するとともに前記発話者の音声を取得する通話モードとを備え、前記第２状態は、前記発話モード、及び前記通話モードにおける前記発話者の音声を取得しない状態を含むようにしても良い。

　また、上記構成において、前記動作モードとして、前記スピーカーから出力されて前記発話者で反射した反射音を取得し、前記反射音に基づいて前記発話者の位置を特定する位置特定モードを備え、前記第２状態は、前記位置特定モードの状態を含み、前記第１状態では、前記位置特定モードで特定した前記発話者の位置に応じて前記マイクアレイの指向性を制御するようにしても良い。

　また、上記構成において、前記音声出力部は、前記スピーカーを介して音声を出力する音声出力モードのときに、超音波の信号を前記スピーカーから出力してその反射音を取得し、前記反射音に基づいて前記発話者の位置を特定する位置特定処理を行うようにしても良い。

　また、上記構成において、前記マイクアレイと前記スピーカーは、前記発話者の後方に配置される筐体に配置されるようにしても良い。また、上記構成において、前記筐体は、ヘッドレストであるようにしても良い。

　また、本発明は、複数のマイクを並べたマイクアレイの指向性を制御可能な集音装置の制御方法において、発話者の音声を取得する第１状態か否かを判定するステップと、前記第１状態ではない第２状態の場合に、前記マイクアレイの指向性を前記発話者の外側、又は無指向に設定して前記マイクアレイの入力音声を取得し、前記第１状態の場合に、前記マイクアレイの指向性を前記発話者に向けるステップとを実行することを特徴とする。

　本発明では、発話者の音声を取得する第１状態か否かを判定し、前記第１状態ではない第２状態の場合に、前記マイクアレイの指向性を前記発話者の外側、又は無指向に設定して前記マイクアレイの入力音声を取得し、前記第１状態の場合に、前記マイクアレイの指向性を前記発話者に向けるので、マイクアレイの指向性を発話者の外側、又は無指向に設定したときの入力音声に基づいて、発話時の音声処理に役立つ情報である周囲ノイズや発話者の位置情報を得ることが可能になる。この得た情報を用いて、発話時に周囲ノイズの除去や指向性制御などの音声処理を行うことが可能となり、専用の位置検出器などが不要である。従って、部品点数の低減や構造の複雑化を抑えつつ、発話者の音声を高精度に取得し易くなる。

図１は、第１実施形態に係るヘッドレスト装置の使用例を示した図である。図２は、ヘッドレスト装置の斜視図である。図３は、ヘッドレスト装置の側断面図である。図４は、ヘッドレスト装置を乗員の頭と共に上方から見た図である。図５は、音声入出力ユニットの電気的構成を示すブロック図である。図６は、マイクアレイの指向性に関する制御を示すフローチャートである。図７は、頭部位置測定モード時の制御を示すフローチャートである。図８は、音声再生モード時の制御を示すフローチャートである。図９は、発話モード時の制御を示すフローチャートである。図１０は、通話モード時の制御を示すフローチャートである。

　以下、図面を参照して本発明の実施の形態について説明する。
（第１実施形態）
　図１は第１実施形態に係るヘッドレスト装置１１の使用例を示した図である。図２はヘッドレスト装置１１の斜視図であり、図３はヘッドレスト装置１１の側断面図である。なお、各図において、乗員Ｍを基準にした各方向のうちの前方を符号Ｆを付して示し、上方を符号Ｕを付して示し、左方を符号Ｌを付して示している。
　図１に示すように、このヘッドレスト装置１１は、車両（本実施形態では自動車）に設けられた乗員用シート１２に設置され、この乗員用シート１２に着座する乗員（本実施形態では運転者）Ｍの頭ＭＨの後方に配置されるヘッドレストとして機能する。なお、このヘッドレスト装置１１は、自動車に限らず、飛行機、船舶、電車などの様々な車両に採用できる。また、このヘッドレスト装置１１は、車両に採用する場合に限らず、オフィスチェアやソファーなどのオフィスや住宅で使用される家具にも応用可能であり、要はヘッドレストを備える機器に広く適用可能である。

　このヘッドレスト装置１１は、ヘッドレスト装置１１の外形状を形成する中空の筐体１３と、筐体１３から下方に延びる左右一対のヘッドレストステー１４とを備えている。
　筐体１３には、衝撃緩和用のクッション材（不図示）と、音声入出力ユニット２１とが収容されている。音声入出力ユニット２１は、左右一対のスピーカー２２と、複数のマイクロフォン（以下、マイクと言う）２３と、回路基板２４とを備えており、回路基板２４の制御の下、スピーカー２２を介して音声を出力し、マイク２３を介して外部音声を入力（集音）する。これによって、ヘッドレスト装置１１は音声の入出力機能を具備する。

　図２及び図３に示すように、音声入出力ユニット２１は、前後方向に短い薄型に形成され、筐体１３の前側空間に収容される。このように前後方向に薄いコンパクト形状にすることにより、様々な形状のヘッドレスト（つまり、様々な形状の筐体１３）に音声入出力ユニット２１を収容し易くなる。
　また、筐体１３は、ヘッドレストステー１４を介して上下に移動自在であり、且つ、ヘッドレストステー１４に対して前後に傾動自在（図３中、傾動方向を矢印Ｋで示す）である。これによって、乗員Ｍの頭ＭＨの位置に合わせて筐体１３の位置を適切に調整可能である。

　左右一対のスピーカー２２は、筐体１３の前板部１３Ａに左右に間隔を空けて配置され、前方に向けて音を出力する。これらスピーカー２２には、上下方向に長い縦長のスピーカーが用いられる。これにより、乗員Ｍの頭ＭＨの位置が上下に変動しても、乗員Ｍの頭ＭＨに向けて音声を出力可能である。また、ヘッドレスト装置１１を上下させることによっても、乗員Ｍの体格の違いによって頭ＭＨの位置が異なったとしても、乗員Ｍの頭ＭＨに向けて音声を出力可能である。
　また、複数のマイク２３は、左右のスピーカー２２の間に配置され、少なくともヘッドレスト前方の音を集音可能に設けられる。これらマイク２３の後方、且つ、左右のスピーカー２２の間に回路基板２４が配置されている。このようにして、マイク２３、回路基板２４及びスピーカー２２をコンパクトに配置し、全体の小型化が図られている。

　なお、本実施形態では、回路基板２４にマイク２３が装着されているが、マイク２３を回路基板２４から離して設けるようにしても良い。
　また、音声入出力ユニット２１は筐体１３の前側空間に収容されるので、筐体１３の角度が変わってもスピーカー２２及び各マイク２３を前方に向けたレイアウトを維持できる。

　図４はヘッドレスト装置１１を乗員Ｍの頭ＭＨと共に上方から見た図である。
　図４に示すように、ヘッドレスト装置１１の筐体１３の前方には、乗員Ｍの頭ＭＨが位置するので、左右一対のスピーカー２２の音を乗員Ｍの左右の耳へ向けて効率良く出力することができる。
　複数（本構成では２個）のマイク２３は、左右に間隔を空けて同じ高さに配置されており、ヘッドレスト前方からの音をそれぞれ集音する。これらマイク２３自体は無指向性マイクが使用され、乗員Ｍの声を含む周囲の音を広く集音することができる。

　なお、乗員Ｍが話した際には、乗員Ｍの後頭部から首（頸椎）の範囲の皮膚を通して声帯の音声が後方に出ており、この音声を集音することにより乗員Ｍの声を的確に集音できる。また、本実施形態のマイク２３は左右に間隔を空けて配置されているので、特に左右からの音を異なる位相で集音することができ、左右の音を判別し易い。

　図３に示すように、マイク２３前方の開口部（マイク開口部）２３Ｋは、音声入出力ユニット２１の設置角度やヘッドレストの角度調整位置が変わっても影響を受けないように、前方に行くほど拡径するすり鉢状の開口形状に形成されている。これによって、音声入出力ユニット２１がどのようなレイアウトやヘッドレストの調整角度であっても、乗員Ｍの後頭部から首の間で後方に発せられる乗員Ｍの音声などを拾い易くなり、様々な車種への展開がし易い。

　図４に示すように、ヘッドレスト装置１１の左右両端部は、音を通さない音カット構造とされる。これにより、左右のスピーカー２２から後方などに漏れる音声がカットされ、マイク２３に入る音への影響を抑えることができる。なお、音カット構造は、スピーカー２２後方に吸音材を設ける等の公知の音カット構造を適用すれば良い。

　図５は音声入出力ユニット２１の電気的構成を示すブロック図である。
　回路基板２４は、コネクタ３１、３２、ＤＣ－ＤＣ変換器３３、通信部３４、音声処理部３５、アンプ３６、及びリモートコントロール３７を実装して構成されている。
　コネクタ３１には、車両電源４１が供給されるとともに、乗員Ｍが操作する操作部４２の操作信号が入力される。また、他のコネクタ３２には、マイク２３がそれぞれ接続される。ＤＣ－ＤＣ変換器３３は、車両電源４１からの電力を所定の電力に直流変換し、音声入出力ユニット２１の各部に供給する。

　通信部３４は、他の機器（不図示）と通信する通信装置として機能し、本実施形態では、Ｂｌｕｅｔｏｏｔｈ（登録商標）などの通信規格に従った近距離無線通信を行う。この通信部３４は、受信結果を音声処理部３５に出力し、また、音声処理部３５を介して入力したマイク音声を他の機器に送信する。なお、通信は無線通信に限らず、有線通信でも良い。
　他の機器は、例えば、携帯電話（スマートフォンを含む）、タブレット端末、カーオーディオ、及びカーナビゲーション装置などである。

　音声処理部３５は、マイクアンプを備えた音響ＤＳＰ（Digital Signal Pocessor）で構成される。この音声処理部３５は、予め記憶された制御プログラムを実行することにより、現在の動作状態（動作モードなど）を判定する判定部、この音声入出力ユニット２１の各部を制御する制御部、及び、各種演算処理を行う演算処理部、各マイク２３からの入力音声を増幅する音声増幅部などとして機能する。この音声処理部３５及び通信部３４によって、後段に説明するように、他の機器と音声入出力ユニット２１との連係処理が実現される。
　音声処理部３５が行う演算処理には、マイク入力のビームフォーミング制御（演算）処理、マイク入力のノイズレベルに応じた再生出力制御（スピーカー出力を間引く演算処理を含む）、頭部位置測定モードのテストトーン出力、マイク入力により距離演算処理、マイク音声の音声認識処理などがある。

　ビームフォーミング制御処理は、複数のマイク２３を有するマイクアレイ２３Ａの指向性を制御する処理である。より具体的には、音源から各マイク２３への音波伝搬がそれぞれ異なることに基づき特定の方向からの音を強調、或いは低減する。例えば、複数種類の指向性パターンを有し、パターンの切り替えや各パターンのパラメータの変更により、乗員Ｍの音声を高精度に集音する指向性パターンに切り替えたり、周囲の音声（ノイズなど）を高精度に集音する指向性パターンに切り替えたりする。
　マイク入力のノイズレベルに応じた再生出力制御は、周囲ノイズの影響を小さくするように音量制御、或いは周波数制御する処理である。以下、各マイク２３を特に区別する必要がない場合はマイクアレイ２３Ａと表記する。

　頭部位置測定モードは、スピーカー２２からテスト信号を出力し、マイクアレイ２３Ａで集音した反射音に基づき乗員Ｍの頭ＭＨの位置を測定するモードである。このモードでは、乗員Ｍの頭ＭＨとマイクアレイ２３Ａとの間の離間距離Ｌ１（図４参照）を算出する位置特定処理が実施される。この離間距離Ｌ１は、ビームフォーミング制御によって頭ＭＨにマイクアレイ２３Ａの指向性を制御する際に用いられる。
　なお、これらの処理は公知の処理を広く適用することができる。これらによって、シート位置や乗員Ｍの体格、マイクアレイ２３Ａとの離間距離Ｌ１などの影響による乗員Ｍの集音音声の品質劣化や音声認識率の劣化を抑えることができる。

　ところで、指向性などの精度を上げるために耳や頭の位置をセンサーで特定する構成にした場合、非常に複雑なシステムとなってしまい、大幅なコストアップを招いてしまう。また、乗員Ｍが顔を動かすことを考慮すると、顔の周りにアームなどでマイクアレイ２３Ａを設置した場合にマイクアレイ２３Ａなどが邪魔になるおそれがあり、エアバッグ動作時の影響を考慮する必要も生じる。
　本実施形態では、乗員Ｍの頭ＭＨの後方にマイクアレイ２３Ａを配置し、マイクアレイ２３Ａの指向性を制御することによって乗員Ｍの声を集音する。これにより、部品点数の低減や構造の複雑化を抑え、乗員Ｍの顔の動きを阻害することなく、音声認識やハンズフリー通話などを実現できるようにしている。

　アンプ３６は、音声処理部３５の制御の下、通信部３４を介して取得した音声データに基づきスピーカー２２を駆動し、音声データに対応する音声をスピーカー２２から出力させる。このアンプ３６にデジタルアンプを適用することで、アンプ３６の小型化などが可能になる。
　リモートコントロール３７は、操作部４２の操作信号に基づいて音声処理部３５の動作を制御する。操作部４２は、乗員Ｍの操作を受け付け、音声入出力ユニット２１の動作モードなどを切り替える。

　この動作モード（動作状態）には、乗員Ｍの頭ＭＨの位置（図４に示す離間距離Ｌ１）を測定する頭部位置測定モード、他の機器から送られた音声（楽曲やナビゲーション音声など）を再生する音声再生モード、乗員Ｍの発話音声を認識する発話モード、及び、携帯電話を用いたハンズフリー通話を実現する通話モードなどがある。

　次に、この音声入出力ユニット２１の動作を説明する。
　図６はマイクアレイ２３Ａの指向性に関する制御を示すフローチャートである。
　この図に示すように、この音声入出力ユニット２１において、音声処理部３５は乗員（発話者）Ｍの音声を取得する所定の動作モードか否かを判定しており（ステップＳ１Ａ）、この判定結果に応じて、マイクアレイ２３Ａの指向性（指向性パターン）を変更する制御を行うようになっている（ステップＳ２Ａ、Ｓ４Ａ、Ｓ５Ａ）。

　詳述すると、音声処理部３５は、乗員Ｍの音声を取得する動作モード（発話モード、通話モード）の場合（ステップＳ１Ａ；ＹＥＳ）、マイクアレイ２３Ａの指向性を乗員Ｍに向ける（ステップＳ２Ａ）。一方、音声処理部３５は、上記動作モードでない場合（ステップＳ１Ａ；ＮＯ）、音声再生モードか否かを判定し（ステップＳ３Ａ）、音声再生モードの場合（ステップＳ３Ａ；ＹＥＳ）、マイクアレイ２３Ａの指向性制御を解除し、或いは、マイクアレイ２３Ａの指向性を乗員Ｍの外側である左右に向ける（ステップＳ４Ａ）。なお、マイクアレイ２３Ａの指向性制御を解除するか、乗員Ｍの左右外側へ向けるかは、ユーザ（乗員Ｍなど）が設定する初期設定などに従えば良い。
　また、音声再生モードでない場合（ステップＳ３Ａ；ＮＯ）、音声処理部３５は、マイクアレイ２３Ａの指向性制御を解除する（ステップＳ５Ａ）。なお、指向性制御を解除した場合は無指向となる。

　次いで、各動作モードのときのスピーカー２２及びマイクアレイ２３Ａに関する制御を説明する。
　図７は頭部位置測定モード時の制御（位置特定処理）を示すフローチャートである。
　頭部位置測定モードの場合、音声処理部３５は、マイクアレイ２３Ａの指向性制御を解除した後（ステップＳ５Ａ）、テスト信号（例えば、テストトーン）をスピーカー２２から出力させ（ステップＳ２Ｂ）、マイクアレイ２３Ａによりテスト信号の反射音を取得する（ステップＳ３Ｂ）。
　この場合、スピーカー２２の音は、乗員Ｍの頭ＭＨで反射してマイクアレイ２３Ａに集音される。より具体的には、乗員Ｍの後頭部から首までのいずれかの範囲で反射したテスト信号の音などがマイクアレイ２３Ａに集音される。音声処理部３５は、マイク２３の入力音声から反射音を特定する処理を行うことにより、テスト信号の反射音を取得する。

　次に、音声処理部３５は、上記反射音の遅延時間（テスト信号を出力してからマイク２３に集音されるまでの時間）に基づいて、スピーカー２２の音が反射した箇所との距離、つまり、乗員Ｍの後頭部から首までの範囲との距離である離間距離Ｌ１を算出する（ステップＳ４Ｂ）。そして、音声処理部３５は、算出した離間距離Ｌ１の情報を不図示のメモリに記憶し（ステップＳ５Ｂ）、この離間距離Ｌ１の情報を、ビームフォーミング制御の指向性を設定するためのフォーミング制御情報に活用する（ステップＳ６Ｂ）。
　すなわち、音声処理部３５は、マイクアレイ２３Ａの指向性を制御する際に、上記離間距離Ｌ１に基づいて、乗員Ｍの後頭部から首までの範囲からの音を効率良く集音できるようにマイクアレイ２３Ａの指向性を設定する。この指向性の設定は、複数の指向性パターンの中から最適な指向性パターンを選択する処理などの公知の制御を適用すれば良い。

　なお、この頭部位置測定モードは、マイクアレイ２３Ａの指向性制御を行う動作モード（例えば、発話モードや通話モード）への移行前に行われる。例えば、発呼時や着信音が鳴っていて通話状態になる前などに行っても良い。

　図８は音声再生モード時の制御を示すフローチャートである。
　なお、音声再生モードは、他の機器から送られた音声（曲やナビゲーション音声など）を再生する動作モードであるため、スピーカー２２から対応する音声が出力される。
　音声再生モードの場合、音声処理部３５は、マイクアレイ２３Ａの指向性制御を解除し、或いは、マイクアレイ２３Ａの指向性を乗員Ｍの外側である左右に向けた状態で（ステップＳ４Ａ）、マイクアレイ２３Ａの入力音声を取得する（ステップＳ２Ｃ）。

　この入力音声は、周囲ノイズと、スピーカー出力の音声（反射音を含む）とを含む音声である。音声処理部３５は、取得した音声からスピーカー出力分の音声を間引く演算処理を行うことにより周囲ノイズを抽出し、このノイズレベルの平均音圧を、実際のノイズレベルとして検出する（ステップＳ３Ｃ）。
　音声処理部３５は、検出したノイズの情報（本実施形態ではノイズレベル）を不図示のメモリに記憶し（ステップＳ４Ｃ）、このノイズの情報に基づいてスピーカー出力の音量、及び音響特性を自動調整する（ステップＳ５Ｃ）。

　自動調整の内容としては、例えば、ノイズレベルに予め定めた閾値以上の変化があった場合、一定のスロープで緩やかにボリュームレベルを調整する。また、ノイズレベルが大きいほど音量を増大し、ノイズレベルが下がったら音量を下げるシンプルな制御でも良い。また、音響特性の制御として、ノイズレベルが大きいほど低域及び高域を増強して聞きやすくするイコライジング制御などを行うようにしても良い。

　このステップＳ２Ｃ～Ｓ５Ｃの処理を適宜に繰り返すことにより、音声再生モードの間、周囲ノイズのレベルを精度良く検出できるとともに、この周囲ノイズに応じた音声再生を行って乗員Ｍなどに聞きやすくすることができる。
　なお、ノイズの情報として、ノイズレベルだけを記憶する場合に限らず、ノイズの周波数などの情報を記憶するようにしても良い。その場合、ノイズの周波数を音量制御や音響特性の制御に活用し、そのノイズの影響を抑制することが好ましい。

　図９は発話モード時の制御を示すフローチャートである。
　前提として、音声処理部３５は、音声認識（又は音声操作）の開始を指示する発話スイッチが乗員Ｍなどにより操作されたことを検出すると、発話モードに移行する。
　図９に示すように、音声処理部３５は、発話スイッチの操作を検出すると（ステップＳ１Ｄ）、頭部位置測定モードにて取得された離間距離Ｌ１に基づいて、マイクアレイ２３Ａの指向性を乗員Ｍ（後頭部から首までのいずれかの範囲）に向ける（ステップＳ２Ａ）。次いで、音声処理部３５は、マイクアレイ２３Ａの入力音声を取得し、ビームフォーミング制御により乗員Ｍからの音声を取得する（ステップＳ３Ｄ）。

　このようにして取得した音声は、マイクアレイ２３Ａの指向性を乗員Ｍに向けているため、乗員Ｍの音声を確実に含む音声データではあるが、エンジン音などの周囲ノイズを含む可能性が高い。周囲ノイズの影響が大きい場合には高精度に音声認識できなくなる。
　そこで、音声処理部３５は、音声再生モード時に取得した周囲ノイズの情報に基づいて、取得した音声（音声データ）から周囲ノイズを除去するノイズリダクション処理を行い（ステップＳ４Ｄ）、その後に音声認識処理を行う（ステップＳ５Ｄ）。

　このように、マイクアレイ２３Ａの指向性を乗員Ｍに向け、且つ、周囲ノイズを除去して音声認識するので、乗員Ｍの声を高精度に取得でき、高精度に音声認識することができる。この音声認識処理の後、音声処理部３５は、音声認識結果を、通信部３４を介して他の機器に送信する（ステップＳ６Ｄ）。これにより、乗員Ｍの音声に基づいて他の機器を音声操作などすることができる。
　その後、音声処理部３５は、マイクアレイ２３Ａの指向性制御を解除し、或いは、マイクアレイ２３Ａの指向性を乗員Ｍの外側である左右に向ける（ステップＳ７Ｄ）。

　ここで、発話モード時であっても、ステップＳ７Ｄの後、音声処理部３５は、上述したステップＳ３Ｃ、Ｓ３Ｄに記載するような周囲ノイズの検出、及び記憶を行う。これにより、乗員Ｍの音声を取得しないタイミングを利用して効率良く周囲ノイズの情報を取得できる。これにより、メモリに記憶されるノイズの情報を最新の情報に更新できる。以上が発話モード時のスピーカー２２及びマイクアレイ２３Ａに関する制御である。

　図１０は通話モード時の制御を示すフローチャートである。
　前提として、音声処理部３５は、Ｂｌｕｅｔｏｏｔｈなどで通信接続された携帯電話が通話状態（発信又は着信状態）になったことを検出すると、通話モードに移行する。
　図１０に示すように、音声処理部３５は、携帯電話が通話状態になったことを検出すると（ステップＳ１Ｅ）、記憶された離間距離Ｌ１に基づいて、マイクアレイ２３Ａの指向性を乗員Ｍ（後頭部から首までのいずれかの範囲）に向ける（ステップＳ２Ｅ）。このステップＳ２Ｅの処理は、上述したステップＳ２Ａの処理と同じである。

　次いで、音声処理部３５は、マイクアレイ２３Ａの入力音声を取得し、ビームフォーミング制御により乗員Ｍからの音声を効率良く取得する（ステップＳ３Ｅ）。このステップＳ３Ｅについても、上述したステップＳ３Ｄの処理と同じである。
　なお、通話モードの場合、音声処理部３５の制御の下、電話の相手からの音声を通信部３４を介して取得し、スピーカー２２から出力する処理も並行して実行される。

　ステップＳ３Ｅの処理の後、音声処理部３５は、エコーキャンセル処理、及びノイズリダクション処理を行う（ステップＳ４Ｅ）。エコーキャンセル処理は、マイクアレイ２３Ａがスピーカー２２から再生される音を集音することによって起こるエコーを消去する処理であり、公知の処理を広く適用可能である。
　ノイズリダクション処理は、記憶された周囲ノイズの情報に基づいて、取得した音声（音声データ）から周囲ノイズを除去する処理であり、上述したステップ４Ｄの処理と同じである。これによって、周囲ノイズを除去した乗員Ｍの音声を取得できる。

　そして、音声処理部３５は、エコーキャンセル処理、及びノイズリダクション処理を行った後の音声のデータを、通信部３４を介して携帯電話に送信する（ステップＳ５Ｅ）。これによって、エコーが無くノイズが除去された乗員Ｍの音声を電話の相手先に送ることができる。
　その後、音声処理部３５は、Ｂｌｕｅｔｏｏｔｈなどで通信接続された携帯電話の通話状態の解除を検出すると（ステップＳ６Ｅ）、マイクアレイ２３Ａの指向性制御を解除し、或いは、マイクアレイ２３Ａの指向性を乗員Ｍの外側である左右に向ける（ステップＳ７Ｅ）。

　ここで、通話モードであっても、発話モードの場合と同様に、マイクアレイ２３Ａの指向性を乗員Ｍの外側に向けたステップＳ７Ｅの後、音声処理部３５は、上述したステップＳ３Ｃ、Ｓ３Ｄに記載するような周囲ノイズの検出、及び記憶を行う。これにより、乗員Ｍの音声を取得しないタイミングを利用して効率良く周囲ノイズの情報を取得できる。これにより、メモリに記憶されるノイズの情報を最新の情報に更新できる。以上が通話モード時のスピーカー２２及びマイクアレイ２３Ａに関する制御である。

　以上説明したように、本実施形態に係るヘッドレスト装置１１は、音声処理部３５が、発話者である乗員Ｍの音声を取得する状態（「第１状態」という）として、乗員Ｍの音声を取得する動作モード（発話モード、通話モード）か否かを判定する判定部として機能するともに（図６のステップＳ１Ａ参照）、第１状態ではない第２状態として、他の動作モード（音声再生モード、頭部位置測定モード）であった場合に、マイクアレイ２３Ａの指向性を乗員Ｍの外側、又は無指向に設定してマイクアレイ２３Ａの入力音声を取得し、第１状態の動作モードの場合に、マイクアレイ２３Ａの指向性を乗員Ｍに向ける制御部として機能する。

　これにより、マイクアレイ２３Ａの指向性を乗員Ｍの外側、又は無指向に設定したときの入力音声に基づいて、発話時の音声処理に役立つ情報である周囲ノイズや乗員Ｍの位置情報を得ることが可能になる。この得た情報を用いて、発話時に周囲ノイズの除去や指向性制御などの音声処理を行うことが可能となり、専用の位置検出器などが不要である。従って、部品点数の低減や構造の複雑化を抑えつつ、乗員Ｍの音声を高精度に取得し易くなる。

　しかも、マイクアレイ２３Ａは発話者である乗員Ｍの後方に配置され、音声処理部３５は、上記第１状態の動作モード（発話モード、通話モード）の場合に、マイクアレイ２３Ａの指向性を乗員Ｍの後頭部から首までの範囲に設定するので、乗員Ｍの後方にて乗員Ｍの音声を効率良く取得できる。
　また、音声処理部３５は、第２状態の動作モード（音声再生モード）で取得した入力音声に基づいて周囲ノイズを取得し（図８参照）、第１状態の動作モード（発話モード、通話モード）の場合に、マイクアレイ２３Ａの入力音声から周囲ノイズを除去するノイズリダクション処理（ノイズ除去処理）を行うので、周囲ノイズを高精度且つ容易に取得し易く、十分なノイズ除去をし易くなる。

　また、音声処理部３５及びアンプ３６は、スピーカー２２を介して音声を出力する音声出力部として機能し、乗員Ｍの音声を取得する発話モードと、スピーカー２２を介して音声を出力するとともに乗員Ｍの音声を取得する通話モードの場合であっても、乗員Ｍの音声を取得しない状態（第２状態に相当）のときに、マイクアレイ２３Ａの指向性を乗員Ｍの外側、又は無指向に設定してマイクアレイ２３Ａの入力音声を取得し（図９のステップＳ７Ｄ、図１０のステップＳ７Ｅなど）、周囲ノイズの検出、及び記憶を行う。これにより、乗員Ｍの音声を取得する動作モードのときでも周囲ノイズを取得でき、最新の周囲ノイズを得やすくなる。

　また、スピーカー２２及びマイクアレイ２３Ａを用いて乗員Ｍの位置を特定する頭部位置特定モードの場合（第２状態に相当）にも、マイクアレイ２３Ａを無指向に設定してマイクアレイ２３Ａの入力音声を取得するので、乗員Ｍで反射した反射音を取得して乗員Ｍの位置情報を精度良く取得できる。この位置情報を用いることにより、乗員Ｍの音声を高精度に取得可能にマイクアレイ２３Ａの指向性を制御できる。

　また、マイクアレイ２３Ａとスピーカー２２は、乗員Ｍの後方に配置される筐体１３に配置されているので、専用の位置検出器などが不要で、優れた集音性能と音声出力機能を備えるコンパクトな装置を提供できる。
　しかも、筐体１３は、ヘッドレストであるため、既存のヘッドレストのスペースを利用してマイクアレイ２３Ａとスピーカー２２を配置できる。

（第２実施形態）
　第２実施形態のヘッドレスト装置１１は、スピーカー２２を介して音声を出力する動作モード（音声出力モード）のときに、音声処理部３５の制御の下、超音波の信号をテスト信号としてスピーカー２２から出力し、このテスト信号の反射音をマイクアレイ２３Ａを介して取得し、この反射音に基づいて乗員Ｍの位置を特定する位置特定処理を行う。この位置特定処理を行うこと以外は、第１実施形態と同様である。
　上記音声出力モードは、例えば、他の機器から送られた音声（楽曲やナビゲーション音声など）を再生する音声再生モード、及び通話モード、或いは、いずれか一方のモードでも良い。

　超音波の信号は可聴域外であるため、乗員Ｍには認識されず、また、指向性が鋭く反射音も正確に測定し易い。これにより、曲再生やハンズフリー通話などを行いながら乗員Ｍの位置を精度良く特定でき、且つ、乗員Ｍに不快感も与えることもない。これにより、第１実施形態の各種効果に加え、乗員Ｍに聞かせる音声を出力しながら乗員Ｍの位置を高精度に取得可能になる。
　さらに、乗員Ｍの位置を任意のタイミングで特定できるようになり、最新の情報を得やすくなる。従って、乗員Ｍの位置に基づくスピーカー２２の指向性制御を精度良く行うことが可能である。

　なお、超音波の信号には、スピーカー２２が出力可能な超音波帯域を用いれば良い。但し、近年の楽曲には可聴帯域外の音が含まれることがあるため、楽曲に使用される周波数帯域外の周波数を用いることが好ましい。また、この位置特定処理は、第１実施形態の頭部位置測定モードの代わりに行えばよいので、頭部位置測定モードを省略することが可能である。

　上述した実施形態は、あくまでも本発明の一実施の態様を例示するものであって、本発明の趣旨を逸脱しない範囲で任意に変形、及び応用が可能である。
　例えば、マイクアレイ２３Ａのマイク２３の数は２個に限らず、また、スピーカー２２についても、低音用或いは高音用のスピーカーを追加しても良い。
　また、ヘッドレストとして機能するヘッドレスト装置１１、及びその制御方法に本発明を適用する場合を説明したが、ヘッドレストとして機能する装置に限らず、複数のマイク２３を並べたマイクアレイ２３Ａの指向性を制御可能な集音装置、及びその制御方法に本発明を広く適用可能である。

　また、上述した各実施形態では、上記制御を行うための制御プログラムをヘッドレスト装置１１に予め記憶しておく場合を説明したが、これに限らず、この制御プログラムを、磁気記録媒体、光記録媒体、半導体記録媒体などのコンピューターが読み取り可能な記録媒体に格納し、コンピューターが記録媒体からこの制御プログラムを読み取って実行するようにしても良い。また、この制御プログラムを、通信ネットワーク（電気通信回線）を介して配信サーバーなどからダウンロードできるようにしてもよい。

　１１　ヘッドレスト装置（集音装置）
　１３　筐体
　２１　音声入出力ユニット
　２２　スピーカー
　２３　マイク
　２３Ａ　マイクアレイ
　３４　通信部
　３５　音声処理部（判定部、制御部）
　３６　アンプ

Claims

　複数のマイクを並べたマイクアレイの指向性を制御可能な集音装置において、
　発話者の音声を取得する第１状態か否かを判定する判定部と、
　前記第１状態ではない第２状態の場合に、前記マイクアレイの指向性を前記発話者の外側、又は無指向に設定して前記マイクアレイの入力音声を取得し、前記第１状態の場合に、前記マイクアレイの指向性を前記発話者に向ける制御部と
　を備えることを特徴とする集音装置。
　前記マイクアレイは前記発話者の後方に配置され、
　前記制御部は、前記第１状態の場合に、前記マイクアレイの指向性を前記発話者の後頭部から首までの範囲に設定することを特徴とする請求項１に記載の集音装置。
　前記制御部は、前記第２状態で取得した前記入力音声に基づいて周囲ノイズを取得し、前記第１状態の場合に、前記マイクアレイの入力音声から前記周囲ノイズを除去するノイズ除去処理を行うことを特徴とする請求項１又は２に記載の集音装置。
　前記集音装置は、所定のスピーカーを介して音声を出力する音声出力部を有するとともに、動作モードとして、前記発話者の音声を取得する発話モードと、前記スピーカーを介して音声を出力するとともに前記発話者の音声を取得する通話モードとを備え、
　前記第２状態は、前記発話モード、及び前記通話モードにおける前記発話者の音声を取得しない状態を含むことを特徴とする請求項１乃至３のいずれか一項に記載の集音装置。
　前記動作モードとして、前記スピーカーから出力されて前記発話者で反射した反射音を取得し、前記反射音に基づいて前記発話者の位置を特定する位置特定モードを備え、
　前記第２状態は、前記位置特定モードの状態を含み、
　前記第１状態では、前記位置特定モードで特定した前記発話者の位置に応じて前記マイクアレイの指向性を制御することを特徴とする請求項４に記載の集音装置。
　前記音声出力部は、前記スピーカーを介して音声を出力する音声出力モードのときに、超音波の信号を前記スピーカーから出力してその反射音を取得し、前記反射音に基づいて前記発話者の位置を特定する位置特定処理を行うことを特徴とする請求項４に記載の集音装置。
　前記マイクアレイと前記スピーカーは、前記発話者の後方に配置される筐体に配置されていることを特徴とする請求項４乃至６のいずれか一項に記載の集音装置。
　前記筐体は、ヘッドレストであることを特徴とすることを特徴とする請求項７に記載の集音装置。
　複数のマイクを並べたマイクアレイの指向性を制御可能な集音装置の制御方法において、
　発話者の音声を取得する第１状態か否かを判定するステップと、
　前記第１状態ではない第２状態の場合に、前記マイクアレイの指向性を前記発話者の外側、又は無指向に設定して前記マイクアレイの入力音声を取得し、前記第１状態の場合に、前記マイクアレイの指向性を前記発話者に向けるステップとを実行することを特徴とする集音装置の制御方法。