WO2024252750A1

WO2024252750A1 - ノイズキャンセル装置、ノイズキャンセル方法及びプログラム

Info

Publication number: WO2024252750A1
Application number: PCT/JP2024/009443
Authority: WO
Inventors: 伸一高山; 亮太藤井
Original assignee: Panasonic Intellectual Property Management Co Ltd
Current assignee: Panasonic Intellectual Property Management Co Ltd
Priority date: 2023-06-05
Filing date: 2024-03-11
Publication date: 2024-12-12
Anticipated expiration: 2025-12-05
Also published as: JPWO2024252750A1

Abstract

ノイズキャンセル装置は、収音デバイスが配置されている音響空間内の状況に関するデータを取得する取得部と、データの内容或いは種別を判定する判定部と、内容或いは種別に基づいて、収音デバイスにより収音された音響空間内の音信号に含まれるノイズ音をキャンセルするためのノイズキャンセルモデルを選択する選択部と、選択されたノイズキャンセルモデルを用いて、音信号に含まれるノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力する出力制御部と、を備える。

Description

ノイズキャンセル装置、ノイズキャンセル方法及びプログラム

　本開示は、ノイズキャンセル装置、ノイズキャンセル方法及びプログラムに関する。

　特許文献１には、周囲のノイズ等が大きい場合の利用者による発声のしにくさを改善する音声入出力方式が開示されている。具体的には、この音声入出力方式は、オーディオ音と周辺ノイズと利用者の発声音声とが同時に音響空間内に存在する場合に、マイクロホンの出力信号から、利用者の発声のエコー成分、オーディオ信号に対応する成分、周辺ノイズをそれぞれ消去することにより、利用者の発声音声のみを抽出する。特に、音声入出力方式は、周辺ノイズ等の音圧レベルを考慮したゲインを算出し、発声音声の各周波数帯域の信号レベルを音声補正用フィルタで補正した後にスピーカから出力する。これにより、利用者は自分が発声した音声の内容を明瞭に聴くことができる。

日本国特開２００１－９４３７０号公報

　特許文献１の構成では、マイクロホンの出力信号と利用者の発声音声の信号との差分信号を周辺ノイズとして消去する。このため、周辺ノイズを消去する際に、利用者の発声音声以外の音信号を抑圧してしまう。したがって、利用者の発声音声以外の音信号として、例えば音響空間内での臨場感を示唆する音信号（例えばオンライン懇親会での乾杯の拍手音、オンライン展示会での周囲の騒音）も抑圧されてしまう。つまり、音響空間内での臨場感が損なわれる可能性があった。特に、近年流行している人工知能（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）を用いた学習済みモデルによってノイズ消去を行う場合、利用者の発声音声以外の音信号を抑圧するため、同様にその音響空間内の臨場感が損なわれる可能性が高く、改善の余地があった。

　本開示は、上述した従来の事情に鑑みて案出され、ユーザの周囲の音響空間内の臨場感を損なことなく、周囲のノイズ音を効率的に消去するノイズキャンセル装置、ノイズキャンセル方法及びプログラムを提供することを目的とする。

　本開示は、収音デバイスが配置されている音響空間内の状況に関するデータを取得する取得部と、前記データの内容或いは種別を判定する判定部と、前記内容或いは種別に基づいて、前記収音デバイスにより収音された前記音響空間内の音信号に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択する選択部と、選択された前記ノイズキャンセルモデルを用いて、前記音信号に含まれる前記所望ノイズ音以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力する出力制御部と、を備える、ノイズキャンセル装置を提供する。

　また、本開示は、ノイズキャンセル装置により実行されるノイズキャンセル方法であって、収音デバイスが配置されている音響空間内の状況に関するデータを取得するステップと、前記データの内容或いは種別を判定するステップと、前記内容或いは種別に基づいて、前記収音デバイスにより収音された前記音響空間内の音信号に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択するステップと、選択された前記ノイズキャンセルモデルを用いて、前記音信号に含まれる前記所望ノイズ音以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力するステップと、を有する、ノイズキャンセル方法を提供する。

　また、本開示は、コンピュータであるノイズキャンセル装置に、収音デバイスが配置されている音響空間内の状況に関するデータを取得するステップと、前記データの内容或いは種別を判定するステップと、前記内容或いは種別に基づいて、前記収音デバイスにより収音された前記音響空間内の音信号に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択するステップと、選択された前記ノイズキャンセルモデルを用いて、前記音信号に含まれる前記所望ノイズ音以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力するステップと、を実現させるための、プログラムを提供する。

　本開示によれば、ユーザの周囲の音響空間内の臨場感を損なことなく、周囲のノイズ音を効率的に消去できる。

実施の形態１に係るオンライン処理システムのシステム構成例を示す図図１のＰＣのハードウェア構成例を示すブロック図実施の形態１に係るモデル選択テーブルの内容例を示す図実施の形態１に係るモデル選択のタイムチャート例を示す図実施の形態１に係るＰＣの動作手順例を時系列に示すフローチャート実施の形態２に係るＰＣのハードウェア構成例を示すブロック図実施の形態２に係るモデル選択テーブルの内容例を示す図実施の形態２に係るモデル選択のタイムチャート例を示す図実施の形態２に係るＰＣの動作手順例を時系列に示すフローチャート図９のステップＳｔ１３の詳細な動作手順例を示すフローチャート図９のステップＳｔ１７の詳細な動作手順例を示すフローチャート実施の形態３に係るＰＣのハードウェア構成例を示すブロック図実施の形態３に係るモデル選択テーブルの内容例を示す図実施の形態３に係るＰＣの動作手順例を時系列に示すフローチャート

　以下、適宜図面を参照しながら、本開示に係るノイズキャンセル装置、ノイズキャンセル方法及びプログラムを具体的に開示した実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になることを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるものであり、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。

＜実施の形態１＞
　実施の形態１では、本開示に係るノイズキャンセル装置の一実施態様として、複数人がネットワークを介してデータ通信可能に接続されたＰｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ（ＰＣ）とそのＰＣに接続されたマイクとをそれぞれ用いて行うオンラインミーティング等のイベントを実行するオンライン処理システムを例示する（図１参照）。

　まず、図１を参照して、実施の形態１に係るオンライン処理システム１００のシステム構成例について説明する。図１は、実施の形態１に係るオンライン処理システム１００のシステム構成例を示す図である。オンライン処理システム１００は、イベント予定データベースＤＢ１と、ネットワークＮＷ１を介して相互にデータ通信可能に接続されたｎ（ｎ：２以上の整数）台のＰＣ１０、２０、…、Ｎ０と、を少なくとも含む。ＰＣ１０、２０、…、Ｎ０のそれぞれに対応するように、それぞれのＰＣの使用者であるユーザＳＰ１、ＳＰ２、…、ＳＰｎの発話音声等の音を収音するためのマイクＭＣ１、ＭＣ２、…、ＭＣｎが接続されている。

　ネットワークＮＷ１は、有線ネットワーク、無線ネットワーク、或いは有線ネットワーク及び無線ネットワークの組み合わせ、のいずれでもよい。有線ネットワークは、例えば有線Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ（ＬＡＮ）、或いは、有線Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ（ＷＡＮ）等でよい。無線ネットワークは、例えば無線ＬＡＮ、無線ＷＡＮ、或いは、セルラー無線通信等でよい。

　以下、説明を分かり易くするために、イベントの開催者であるユーザＳＰ１を中心として、ユーザＳＰ１が使用するマイクＭＣ１により収音された音信号に含まれるユーザＳＰ１の周囲のノイズ音をキャンセル（消去）するＰＣ１０の構成及び動作を主に説明する。ユーザＳＰ１がイベントの開催者である場合、他のユーザＳＰ２、…、ＳＰｎはそれぞれイベントの参加者となる。なお、ユーザＳＰ１、ＳＰ、…、ＳＰｎの役割はオンライン処理システム１００を用いて実行されるイベントの内容に応じて適宜決められれば良く、ユーザＳＰ１が開催者であることに限定されず、他のユーザが開催者であっても構わない。

　イベント予定データベースＤＢ１は、オンライン処理システム１００を用いて実行される各種のイベントごとに、そのイベントの内容を示すデータ（イベント予定データＩＶＬ１）を保持管理している。イベント予定データＩＶＬ１は、例えばイベントの識別情報であるイベントＩＤ、イベント内容或いはイベント種別、イベントの開始時刻、及び、イベントの終了時刻の各項目からなる実データをイベントごとに有するレコード単位で構成されている。例えば、イベントＩＤ「０００１」のイベントは、イベント内容が「オンラインミーティング」（図１では図示略）であり、開始時刻が「１０：００」で終了時刻が「１１：００」である。同様に、イベントＩＤ「０００２」のイベントは、イベント内容が「オンライン飲み会」（図１では図示略）であり、開始時刻が「１９：００」で終了時刻が「２１：００」である。

　ＰＣ１０は、本開示に係るノイズキャンセル装置の一例であり、マイクＭＣ１により収音された音信号に含まれるユーザＳＰ１の周囲のノイズ音をキャンセルするためのノイズキャンセルモデル（後述参照）をイベント予定データベースＤＢ１のイベント予定データＩＶＬ１に基づいて選択する。ＰＣ１０は、選択したノイズキャンセルモデルを用いて、マイクＭＣ１により収音された音信号に含まれるノイズ音をキャンセルするノイズキャンセル処理を施し、ノイズキャンセル処理後の音信号（出力音声信号）を出力する。出力音声信号の出力形態は、スピーカＳＰＫ１（図２参照）から出力してもよいし、他のＰＣ２０、…、Ｎ０に送信してもよいし、それらの組み合わせであってもよい。なお、ＰＣ１０の構成及び動作の説明は、他のＰＣ２０、…、Ｎ０の一部或いは全部に同様に適用しても構わない。

　マイクＭＣ１は、周知のマイクロホンの構成と同一でよく、ユーザＳＰ１がいる音響空間内の音（例えばユーザＳＰ１の発話音声、ユーザＳＰ１の周囲のノイズ音）を収音し、その収音された音の電気信号（音信号）をＰＣ１０に送る。ＰＣ１０には、マイクＭＣ１により収音された音信号が入力される（図２参照）。また、マイクＭＣ１は、イベント中に他のＰＣ２０、…、Ｎ０のそれぞれから送られてくる音声信号がＰＣ１０のスピーカＳＰＫ１（図２参照）から出力された音を収音する。この収音した音声信号には、他のユーザＳＰ２、…、ＳＰｎのそれぞれの発話音声だけでなく、それぞれのユーザがいる音響空間内の臨場感を示唆する音（例えば拍手音、周囲の騒音）が含まれることがある。

　スピーカＳＰＫ１は、周知のスピーカの構成と同一でよく、ＰＣ１０によってノイズキャンセル処理された後の出力音声信号を出力する。また、スピーカＳＰＫ１は、他のＰＣ２０、…、Ｎ０のそれぞれから送られてＰＣ１０が受信した音声信号を出力する。

　次に、図２を参照して、図１のＰＣ１０のハードウェア構成例について説明する。図２は、図１のＰＣ１０のハードウェア構成例を示すブロック図である。ＰＣ１０は、マイクＭＣ１及びイベント予定データベースＤＢ１のそれぞれからデータ信号の入力が可能に接続され、更に、スピーカＳＰＫ１にデータ信号の出力が可能に接続されている。ＰＣ１０は、汎用的なコンピュータ装置であり、本開示に係るノイズキャンセル装置の一態様として、パーソナルコンピュータ以外にスマートフォン或いはタブレット端末で構成されても構わない。ＰＣ１０は、プロセッサＰＲＣ１と、メモリ１１と、をハードウェア構成として少なくとも含む。なお、ＰＣ１０は、ユーザＳＰ１の操作を受け付けるマウス等の入力デバイスも更に含む構成としてよい。

　プロセッサＰＲＣ１は、ＰＣ１０の全体的な動作を司るコントローラとして機能し、ＰＣ１０の各部の動作を統括するための制御処理、ＰＣ１０の各部との間のデータ信号／制御信号の入出力処理、データ信号／制御信号の演算処理及びデータ信号／制御信号の記憶処理を行う。プロセッサＰＲＣ１は、例えばＣｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ（ＣＰＵ）、Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ（ＤＳＰ）、Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ（ＦＰＧＡ）、或いは、Ｇｒａｐｈｉｃａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ（ＧＰＵ）により構成されてよい。プロセッサＰＲＣ１は、メモリ１１と協働しながら、マイクＭＣ１により収音された音信号（以下、「入力音信号」と便宜的に称する場合がある）を入力し、この入力音信号に対して各種の信号処理（例えばノイズキャンセル処理）を施す。

　メモリ１１は、少なくともＲｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ（ＲＯＭ）及びＲａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ（ＲＡＭ）を備える。ＲＯＭは、プロセッサＰＲＣ１が実行する各種の処理を規定するプログラムとそのプログラムの実行に必要となるデータとを関連付けて保存している。ＲＡＭは、プロセッサＰＲＣ１が取得或いは生成したデータ若しくは情報を一時的に保存する。メモリ１１は、プロセッサＰＲＣ１による処理の実行中に適宜参照される。また、メモリ１１は、複数個のノイズキャンセルモデルを保存している。図２の図示例では、３つのノイズキャンセルモデルＭ１、Ｍ２、Ｍ３のそれぞれがメモリ１１から読み出されてプロセッサＰＲＣ１にロードされているが、３つに限定されない。ノイズキャンセルモデルＭ１～Ｍ３のそれぞれは、ＡＩ（人工知能）を搭載し、予め機械学習等によって学習されて形成されたモデルのデータ或いはパラメータセットである。ノイズキャンセルモデルＭ１～Ｍ３のそれぞれは、入力となる入力音信号に含まれる、各モデルに応じた「消去しないノイズ音」（所望ノイズ音の一例）以外のノイズをキャンセル（消去）する。また、メモリ１１は、図３に示すモデル選択テーブルＴＢＬ１を保存している。ノイズキャンセルモデル及びモデル選択テーブルＴＢＬ１については図３を参照して後述する。

　ここで、プロセッサＰＲＣ１が機能的に実行する処理の実行主体の構成例を詳述する。プロセッサＰＲＣ１は、イベント内容判定部１２と、利用モデル選択部１３と、ノイズキャンセル処理部１４と、セレクタ１５と、音声出力部１６と、送信部１７と、を機能的に備える。なお、イベント内容判定部１２、利用モデル選択部１３、ノイズキャンセル処理部１４、およびセレクタ１５のうちのすべて、あるいは少なくとも１つが、ネットワークＮＷ１を介して互いにデータ通信を行うアプリケーションにより実現可能な機能として組み込まれて動作してもよい。

　イベント内容判定部１２は、取得部及び判定部の一例であり、イベント予定データベースＤＢ１との間のインターフェースとしての機能を備える。イベント内容判定部１２は、イベント予定データベースＤＢ１から読み出したイベント予定データＩＶＬ１の内容を判定し、その判定結果を利用モデル選択部１３に送る。例えば、イベント内容判定部１２は、イベントＩＤ「０００１」のイベント予定データＩＶＬ１を読み出した場合、そのイベント内容が「オンラインミーティング」（図示略）であり、開始時刻が「１０：００」で終了時刻が「１１：００」であると判定する。また、イベント内容判定部１２は、イベントＩＤ「０００２」のイベント予定データＩＶＬ１を読み出した場合、そのイベント内容が「オンライン飲み会」（図示略）であり、開始時刻が「１９：００」で終了時刻が「２１：００」であると判定する。このとき、イベント予定データＩＶＬ１は、イベント予定データベースＤＢ１からの読み出されたイベント予定データに代えて、イベント開催者であるユーザＳＰ１がイベント予定データベースＤＢ１を介さずに直接入力したイベント予定データであってもよい。この場合、ユーザＳＰ１が使用するＰＣ１０に接続された表示デバイスを介してイベント内容（種別）を入力する画面が表示され、ユーザＳＰ１は、入力デバイスを介してイベント内容（種別）をＰＣ１０に入力する。

　利用モデル選択部１３は、選択部の一例であり、イベント内容判定部１２からの判定結果を入力し、更に、メモリ１１からモデル選択テーブル（図３参照）を読み出す。利用モデル選択部１３は、入力した判定結果とモデル選択テーブル（図３参照）とに基づいて、マイクＭＣ１からの入力音信号（つまり、ユーザＳＰがいる音響空間内でマイクＭＣ１により収音された音のデータ信号）に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択する。利用モデル選択部１３は、選択したノイズキャンセルモデルを示す結果データをノイズキャンセル処理部１４に送る。また、入力した判定結果の代わりに、イベント開催者であるユーザＳＰ１が直接入力したイベント予定データが使用される場合、ノイズキャンセルモデルが選択されるだけでなく、入力した判定結果に基づき選択されたノイズキャンセルモデルをイベント期間中に新たなノイズキャンセルモデルとして切り替えることができる。

　ここで、図３及び図４を参照して、モデル選択テーブルＴＢＬ１及びノイズキャンセルモデルの選択例について説明する。図３は、実施の形態１に係るモデル選択テーブルＴＢＬ１の内容例を示す図である。図４は、実施の形態１に係るモデル選択のタイムチャート例を示す図である。モデル選択テーブルＴＢＬ１は、イベント予定名ごとに、「イベント予定名」と「イベント種別」と「消去しないノイズ音」と「ノイズキャンセルモデル」とを対応付けた複数行レコードにより構成される。

　図３に示すように、「イベント予定名」は、図１のオンライン処理システム１００を用いて実行されるイベントの名称である。図３の例では「オンライン飲み会」、「オンライン内見」、「オンライン講演会」、「オンラインミーティング」が示されているがこれらに限定されなくてよい。

　「イベント種別」は、「イベント予定名」が示すイベントの種別である。「オンライン飲み会」の種別は「飲み会」、「オンライン内見」の種別は「内見」、「オンライン講演会」の種別は「講演」、「オンラインミーティング」の種別は「通常会議」である。

　「消去しないノイズ音」は、所望ノイズ音の一例であり、「ノイズキャンセルモデル」によってイベント期間中の雰囲気（臨場感）が損なわれないように消去されないノイズ音の種別を示す。「ノイズキャンセルモデル」は、「消去しないノイズ音」を消去せずかつ「消去しないノイズ音」以外のノイズ音を消去するように予め機械学習等によって形成されたモデルである。種別「飲み会」の場合には「ノイズキャンセルモデル２」によって「拍手」のノイズ音が消去されず、「拍手」以外のノイズ音が消去される。ノイズキャンセルモデル２は、図１のノイズキャンセルモデルＭ１～Ｍ３のうちいずれか１つであってよい。種別「内見」の場合には「ノイズキャンセルモデル３」によって「周囲環境騒音」のノイズ音が消去されず、「周囲環境騒音」以外のノイズ音が消去される。ノイズキャンセルモデル３は、図１のノイズキャンセルモデルＭ１～Ｍ３のうちいずれか１つであってよい。種別「講演」の場合には「ノイズキャンセルモデル４」によって「笑い声、拍手」のノイズ音が消去されず、「笑い声、拍手」以外のノイズ音が消去される。ノイズキャンセルモデル４は、図１のノイズキャンセルモデルＭ１～Ｍ３のうちいずれか１つであってよい。種別「通常会議」の場合には「ノイズキャンセルモデル１」によって全てのノイズ音が消去される。ノイズキャンセルモデル１は、図１のノイズキャンセルモデルＭ１～Ｍ３のうちいずれか１つであってよい。

　図４の横軸は時間を示す。図４に示すように、利用モデル選択部１３は、イベント内容判定部１２からの判定結果が「オンライン飲み会」或いは「飲み会」である場合、そのイベントＩＶ１の期間中（例えば時刻ｔ１～時刻ｔ２の期間中）、モデル選択テーブルＴＢＬ１の「オンライン飲み会」或いは「飲み会」のレコードに対応する「ノイズキャンセルモデル２」を、ノイズキャンセル処理部１４が使用するべきノイズキャンセルモデルとして選択する。

　また、利用モデル選択部１３は、イベント内容判定部１２からの判定結果が「オンラインミーティング」或いは「通常会議」である場合、そのイベントＩＶ２の期間中（例えば時刻ｔ１～時刻ｔ２の期間中）、モデル選択テーブルＴＢＬ１の「オンラインミーティング」或いは「通常会議」のレコードに対応する「ノイズキャンセルモデル１」を、ノイズキャンセル処理部１４が使用するべきノイズキャンセルモデルとして選択する。

　ノイズキャンセル処理部１４は、出力制御部の一例であり、利用モデル選択部１３からの結果データにしたがって、その結果データに相当するノイズキャンセルモデルのデータ或いはパラメータセットをセレクタ１５に選択させて取得する。ノイズキャンセル処理部１４は、セレクタ１５を介して取得したノイズキャンセルモデルを用いて、マイクＭＣ１からの入力音信号に含まれるノイズ音のうち、ノイズキャンセルモデルで消去されないノイズ音以外のノイズ音をキャンセルするためのノイズキャンセル処理を施す。ノイズキャンセル処理部１４は、ノイズキャンセル処理後の音信号である出力音声信号を音声出力部１６及び送信部１７のそれぞれに送る。

　音声出力部１６は、ノイズキャンセル処理部１４からの出力音声信号をスピーカＳＰＫ１から出力する。

　送信部１７は、ノイズキャンセル処理部１４からの出力音声信号を、ネットワークＮＷ１を介して他のＰＣ２０、…、Ｎ０のそれぞれに送信する。なお、送信部１７は、プロセッサＰＲＣ１の一部を構成するものとして図示しているが、プロセッサＰＲＣ１とは別体で設けられてもよい。

　次に、図５を参照して、実施の形態１に係るＰＣ１０の動作手順例について説明する。図５は、実施の形態１に係るＰＣ１０の動作手順例を時系列に示すフローチャートである。図５に示す各処理は、主にプロセッサＰＲＣ１（図２参照）によって実行される。図５に示す処理は、例えば１つのイベントごとに実行され、そのイベントが開始された時或いはその開始直前のタイミングに実行される。

　図５において、プロセッサＰＲＣ１は、ＰＣ１０と接続されているイベント予定データベースＤＢ１から少なくとも１つのイベント予定データＩＶＬ１を取得して読み出す（ステップＳｔ１）。プロセッサＰＲＣ１は、ステップＳｔ１で読み出したイベント予定データＩＶＬ１に基づいて、そのイベント予定データＩＶＬ１で特定されるイベントのイベント種別（内容）を判定する（ステップＳｔ２）。例えば、プロセッサＰＲＣ１は、イベントＩＤ「０００１」のイベント予定データＩＶＬ１を読み出した場合、そのイベント種別（内容）が「オンラインミーティング」であると判定する。このとき、イベント予定データＩＶＬ１は、イベント予定データベースＤＢ１からの読み出されたイベント予定データに代えて、イベント開催者であるユーザＳＰ１がイベント予定データベースＤＢ１を介さずに直接入力したイベント予定データであってもよい。

　プロセッサＰＲＣ１は、ステップＳｔ２で判定したイベント種別（内容）とメモリ１１から読み出したモデル選択テーブルＴＢＬ１とに基づいて、イベント種別に対応するノイズキャンセルモデルを選択する（ステップＳｔ３）。つまり、プロセッサＰＲＣ１は、ステップＳｔ２で判定したイベント種別のイベント期間中にそのイベントの臨場感を損ねないために、そのイベント種別（内容）に対応する「消去しないノイズ音」以外のノイズ音のみキャンセルするためのノイズキャンセルモデルを選択する。プロセッサＰＲＣ１は、ステップＳｔ３で選択したノイズキャンセルモデルをメモリ１１から読み出して取得する（ステップＳｔ４）。

　プロセッサＰＲＣ１は、ステップＳｔ４で取得したノイズキャンセルモデルを用いて、マイクＭＣ１からの入力音信号に含まれる、ノイズキャンセルモデルに対応する「消去しないノイズ音」以外のノイズ音を消去するためのノイズキャンセル処理を施す（ステップＳｔ５）。プロセッサＰＲＣ１は、ステップＳｔ５で行ったノイズキャンセル処理後の出力音声信号を出力する（ステップＳｔ６）。この出力音声信号の出力形態は、スピーカＳＰＫ１（図２参照）から出力してもよいし、他のＰＣ２０、…、Ｎ０に送信してもよいし、それらの組み合わせであってもよい。プロセッサＰＲＣ１がイベント終了の旨の入力を検知した場合（ステップＳｔ７、ＹＥＳ）、図５に示すプロセッサＰＲＣ１の処理は終了する。

　一方、イベント終了の旨の入力がされていない場合（ステップＳｔ７、ＮＯ）、プロセッサＰＲＣ１の処理はステップＳｔ１に戻る。つまり、プロセッサＰＲＣ１は、イベント開始されてからイベント終了するまでの期間中、ステップＳｔ１～ステップＳｔ７の一連処理を繰り返し実行する。

　以上により、実施の形態１に係るオンライン処理システム１００では、ノイズキャンセル装置の一例としてのＰＣ１０は、収音デバイス（マイクＭＣ１）が配置されている音響空間内の状況に関するデータ（例えばイベント予定データＩＶＬ１）を取得し、そのデータの内容或いは種別を判定する。ＰＣ１０は、その判定した内容或いは種別に基づいて、収音デバイスにより収音された音響空間内の音信号（入力音信号）に含まれる、ノイズキャンセルモデルに応じた「消去しないノイズ音」以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択する。ＰＣ１０は、選択されたノイズキャンセルモデルを用いて、入力音信号に含まれるノイズキャンセルモデルに応じた「消去しないノイズ音」以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力する。これにより、ＰＣ１０は、ユーザＳＰ１の周囲の音響空間内で行われているイベントの臨場感を損なうことなく、イベントの臨場感とは関係の無い余計な周囲のノイズ音を効率的にキャンセル（消去）することができる。したがって、ユーザは、イベントの臨場感が損なわれずにかつ周囲のノイズ音を気にすることなく快適にイベントを行うことができる。

＜実施の形態２＞
　実施の形態２では、実施の形態１のイベント期間中に同一のノイズキャンセルモデルを継続使用する形態とは異なり、イベント期間中とは直接関係なく、何かしらの発話が音声認識されたことを契機として一定期間中においてその音声認識結果に対応する「消去しないノイズ音」以外のノイズ音を消去するためのノイズキャンセルモデルを選択する例を説明する。

　実施の形態２に係るオンライン処理システムの構成例は実施の形態１に係るオンライン処理システム１００の構成例と同一であってもよいし、異なってもよい。以下の説明を簡単にするために、実施の形態２に係るオンライン処理システムの構成例は実施の形態１に係るオンライン処理システム１００の構成例と同一であると例示して説明する。但し、実施の形態２では、ＰＣ１０は、イベント予定データベースＤＢ１からイベント予定データＩＶＬ１を読み出して取得する必要は必ずしも無い。

　まず、図６を参照して、実施の形態２に係るノイズキャンセル装置の一例としてのＰＣ１０Ａのハードウェア構成例について説明する。図６は、実施の形態２に係るＰＣ１０Ａのハードウェア構成例を示すブロック図である。ＰＣ１０Ａは、マイクＭＣ１からデータ信号の入力が可能に接続され、更に、スピーカＳＰＫ１にデータ信号の出力が可能に接続されている。ＰＣ１０Ａは、汎用的なコンピュータ装置であり、本開示に係るノイズキャンセル装置の一態様として、パーソナルコンピュータ以外にスマートフォン或いはタブレット端末で構成されても構わない。ＰＣ１０Ａは、プロセッサＰＲＣ１Ａと、メモリ１１と、をハードウェア構成として少なくとも含む。なお、ＰＣ１０Ａは、ユーザＳＰ１の操作を受け付けるマウス等の入力デバイスも更に含む構成としてよい。

　ＰＣ１０Ａの説明において、図２のＰＣ１０の構成及び動作と同一の構成及び動作を行うものには同一の符号を付与して説明を簡略化或いは省略し、異なる内容について説明する。

　メモリ１１は、図７に示すモデル選択テーブルＴＢＬ１Ａを保存している。モデル選択テーブルＴＢＬ１Ａについては図７を参照して後述する。

　ここで、プロセッサＰＲＣ１Ａが機能的に実行する処理の実行主体の構成例を詳述する。プロセッサＰＲＣ１Ａは、音声認識処理部１８と、発話内容判定部１９と、利用モデル選択部１３Ａと、ノイズキャンセル処理部１４と、セレクタ１５と、音声出力部１６と、送信部１７と、受信部ＲＣ１と、を機能的に備える。

　受信部ＲＣ１は、ネットワークＮＷ１を介して送信された受話音声信号を受信する。この受話音声信号は、例えばＰＣ２０側のマイクＭＣ２により収音された人、機械等が発する音の音信号でもよいし、ＰＣＮ０側のマイクＭＣｎにより収音された人、機械等が発する音の音信号でもよいし、それらの組み合わせであってもよい。受信部ＲＣ１が受信した受話音声信号は、マイクＭＣ１により収音された音の音信号と同様に音声認識処理部１８に入力される。

　音声認識処理部１８は、取得部の一例であり、マイクＭＣ１により収音された音の音信号と受信部ＲＣ１からの受話音声信号とを入力音信号として入力し、その入力音信号を入力とした音声認識処理を実行する。音声認識処理部１８は、音声認識処理の結果データを発話内容判定部１９に送る。ここで音声認識処理部１８が行う音声認識処理の方式は公知技術であってよく、実施の形態２においてその方式は特に問わない。

　発話内容判定部１９は、判定部の一例であり、音声認識処理部１８からの音声認識処理の結果データに基づいて、その結果データが示す発話内容を判定する。発話内容判定部１９は、発話内容の判定結果データを利用モデル選択部１３Ａに送る。ここで発話内容判定部１９が発話内容を判定する方式は公知技術であってよく、実施の形態２においてその方式は特に問わない。なお、図６では音声認識処理部１８と発話内容判定部１９とを別構成として設けてあるが、機能的に両者が一体的に構成されても構わない。

　利用モデル選択部１３Ａは、選択部の一例であり、発話内容判定部１９からの判定結果を入力し、更に、メモリ１１からモデル選択テーブル（図７参照）を読み出す。利用モデル選択部１３Ａは、入力した判定結果とモデル選択テーブル（図７参照）とに基づいて、マイクＭＣ１からの入力音信号（つまり、ユーザＳＰがいる音響空間内でマイクＭＣ１により収音された音のデータ信号）に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択する。利用モデル選択部１３Ａは、選択したノイズキャンセルモデルを示す結果データをノイズキャンセル処理部１４に送る。

　ここで、図７及び図８を参照して、モデル選択テーブルＴＢＬ１Ａ及びノイズキャンセルモデルの選択例について説明する。図７は、実施の形態２に係るモデル選択テーブルＴＢＬ１Ａの内容例を示す図である。図８は、実施の形態２に係るモデル選択のタイムチャート例を示す図である。モデル選択テーブルＴＢＬ１Ａは、発話内容ごとに、「発話内容」と「消去しないノイズ音」と「ノイズキャンセルモデル」とを対応付けた複数行レコードにより構成される。

　図７に示すように、「発話内容」は、マイクＭＣ１により収音された音（例えばユーザＳＰ１が発話した音声、ユーザＳＰ以外の周囲の物体から生じている音）を入力とした音声認識処理及び発話内容判定処理に基づいて得られた発話内容である。図７の例では「乾杯」、「機械の調子」、「ご清聴ありがとうございました」が示されているがこれらに限定されなくてよい。

　「消去しないノイズ音」は、所望ノイズ音の一例であり、「ノイズキャンセルモデル」によってユーザＳＰ１がいる音響空間内の雰囲気（臨場感）が損なわれないように消去されないノイズ音の種別を示す。「ノイズキャンセルモデル」は、「消去しないノイズ音」を消去せずかつ「消去しないノイズ音」以外のノイズ音を消去するように予め機械学習等によって形成されたモデルである。発話内容「乾杯」の場合には「ノイズキャンセルモデル２」によって「拍手」のノイズ音が消去されず、「拍手」以外のノイズ音が消去される。ノイズキャンセルモデル２は、図１のノイズキャンセルモデルＭ１～Ｍ３のうちいずれか１つであってよい。発話内容「機械の調子」の場合には「ノイズキャンセルモデル３」によって「工場騒音」のノイズ音が消去されず、「工場騒音」以外のノイズ音が消去される。ノイズキャンセルモデル３は、図１のノイズキャンセルモデルＭ１～Ｍ３のうちいずれか１つであってよい。発話内容「ご清聴ありがとうございました」の場合には「ノイズキャンセルモデル２」によって「拍手」のノイズ音が消去されず、「拍手」以外のノイズ音が消去される。

　例えばマイクＭＣ１が工場部門内に配置されたマイクであり、マイクＭＣ２、ＭＣ３のそれぞれが工場管理部門内に配置されたマイクである場合を想定する。この場合、本実施の形態では、ＰＣ１０Ａは、マイクＭＣ１、ＭＣ２、ＭＣ３のそれぞれにより収音された音の音信号を入力音信号とし、その入力音信号に対応する発話内容（例えば「機械の調子」）に含まれる工場騒音をキャンセルしないためのノイズキャンセルモデル３を選択することが可能となる。これにより、ＰＣ１０Ａは、マイクＭＣ１、ＭＣ２、ＭＣ３のそれぞれが配置されている工場内で行っているリモート通話或いはオンラインミーティングの際に、その臨場感を損ねない程度に工場内で発生している機械音をキャンセルしないで他の余計なノイズ音をキャンセルすることができる。

　図８の横軸は時間を示す。図８のシナリオＳＣＮ１に示すように、利用モデル選択部１３Ａは、発話内容判定部１９からの判定結果が「乾杯」である場合、時刻ｔ１で「乾杯」の発話が開始されて時刻ｔ３で「乾杯」の発話が終了された後の一定期間（時刻ｔ３から時刻ｔ４までの期間）、モデル選択テーブルＴＢＬ１Ａの「乾杯」のレコードに対応する「ノイズキャンセルモデル２」を、ノイズキャンセル処理部１４が使用するべきノイズキャンセルモデルとして選択する。

　また、図８のシナリオＳＮＣ２に示すように、利用モデル選択部１３Ａは、発話内容判定部１９からの判定結果が「乾杯」である場合、時刻ｔ１で「乾杯」の発話が開始されて時刻ｔ５で発話内容判定部１９からの判定結果が「機械の調子」となるまでの期間（時刻ｔ３から時刻ｔ５までの期間）、モデル選択テーブルＴＢＬ１Ａの「乾杯」のレコードに対応する「ノイズキャンセルモデル２」を、ノイズキャンセル処理部１４が使用するべきノイズキャンセルモデルとして選択する。更に、利用モデル選択部１３Ａは、時刻ｔ５で割り込んできた発話内容判定部１９からの判定結果「機械の調子」に基づいて、時刻ｔ５で「機械の調子」の音が収音開始されて時刻ｔ６で「機械の調子」の音が収音終了された後の一定期間（時刻ｔ６から時刻ｔ２までの期間）、モデル選択テーブルＴＢＬ１Ａの「機械の調子」のレコードに対応する「ノイズキャンセルモデル３」を、ノイズキャンセル処理部１４が使用するべきノイズキャンセルモデルとして選択する。

　図８のシナリオＳＣＮ３に示すように、利用モデル選択部１３Ａは、発話内容判定部１９からの判定結果が何も無い場合、発話内容判定部１９からの発話内容が入力されていない間の時刻ｔ１から時刻ｔ２までの期間、モデル選択テーブルＴＢＬ１Ａに拘わらず、全てのノイズ音をキャンセルするための「ノイズキャンセルモデル１」を、ノイズキャンセル処理部１４が使用するべきノイズキャンセルモデルとして選択する。

　次に、図９～図１１を参照して、実施の形態２に係るＰＣ１０Ａの動作手順例について説明する。図９は、実施の形態２に係るＰＣ１０Ａの動作手順例を時系列に示すフローチャートである。図１０は、図９のステップＳｔ１３の詳細な動作手順例を示すフローチャートである。図１１は、図９のステップＳｔ１７の詳細な動作手順例を示すフローチャートである。図９～図１１に示す各処理は、主にプロセッサＰＲＣ１Ａ（図６参照）によって実行される。図９に示す処理は、例えばマイクＭＣ１により音が収音される度に実行される。

　図９において、プロセッサＰＲＣ１Ａは、ユーザＳＰ１がいる音響空間内に配置されているマイクＭＣ１により収音された入力音信号の音声認識処理を実行する（ステップＳｔ１１）。プロセッサＰＲＣ１Ａは、ステップＳｔ１１での音声認識処理の結果データに基づいて、その音声認識処理が示す発話内容を判定する（ステップＳｔ１２）。例えば、プロセッサＰＲＣ１は、入力音信号の音声認識処理の結果データが「それでは、ＡＡさんの門出を祝って、乾杯！」である場合、発話内容が「乾杯」であると判定する。

　プロセッサＰＲＣ１Ａは、ステップＳｔ１２で判定した発話内容とメモリ１１から読み出したモデル選択テーブルＴＢＬ１Ａとに基づいて、発話内容に対応するノイズキャンセルモデルを選択する（ステップＳｔ１３）。つまり、プロセッサＰＲＣ１Ａは、ステップＳｔ１２で判定した発話内容が収音された期間中にその雰囲気の臨場感を損ねないために、その発話内容に対応する「消去しないノイズ音」以外のノイズ音のみキャンセルするためのノイズキャンセルモデルを選択する。このステップＳｔ１３の処理の詳細については、図１０を参照して後述する。プロセッサＰＲＣ１Ａは、ステップＳｔ１３で選択したノイズキャンセルモデルをメモリ１１から読み出して取得する（ステップＳｔ１４）。

　プロセッサＰＲＣ１Ａは、ステップＳｔ１４で取得したノイズキャンセルモデルを用いて、マイクＭＣ１からの入力音信号に含まれる、ノイズキャンセルモデルに対応する「消去しないノイズ音」以外のノイズ音を消去するためのノイズキャンセル処理を施す（ステップＳｔ１５）。プロセッサＰＲＣ１Ａは、ステップＳｔ１５で行ったノイズキャンセル処理後の出力音声信号を出力する（ステップＳｔ１６）。この出力音声信号の出力形態は、スピーカＳＰＫ１（図２参照）から出力してもよいし、他のＰＣ２０、…、Ｎ０に送信してもよいし、それらの組み合わせであってもよい。プロセッサＰＲＣ１Ａは、ノイズキャンセルモデルの戻し要否を判定する（ステップＳｔ１７）。このステップＳｔ１７の処理の詳細については、図１１を参照して後述する。

　プロセッサＰＲＣ１ＡがＰＣ１０Ａの動作終了の入力を検知した場合（ステップＳｔ１８、ＹＥＳ）、図９に示すプロセッサＰＲＣ１Ａの処理は終了する。

　一方、ＰＣ１０Ａの動作終了の旨の入力がされていない場合（ステップＳｔ１８、ＮＯ）、プロセッサＰＲＣ１Ａの処理はステップＳｔ１１に戻る。つまり、プロセッサＰＲＣ１Ａは、動作終了するまでの期間中、ステップＳｔ１１～ステップＳｔ１８の一連処理を繰り返し実行する。

　ここで、図１０を参照して、図９のステップＳｔ１３の詳細な動作手順について説明する。

　図１０において、プロセッサＰＲＣ１Ａは、ステップＳｔ１２で判定した発話内容に基づいて、現在使用中のノイズキャンセルモデルを新たに切り替えるための発話を検知したか否かを判定する（ステップＳｔ１３－１）。ノイズキャンセルモデルを新たに切り替えるための発話が検知されていないと判定された場合には（ステップＳｔ１３－１、ＮＯ）、プロセッサＰＲＣ１Ａの処理は終了する。

　一方、プロセッサＰＲＣ１Ａは、現在使用中のノイズキャンセルモデルを新たに切り替えるための発話を検知したか否かを判定した場合には（ステップＳｔ１３－２、ＹＥＳ）、ステップＳｔ１２で判定した発話内容とメモリ１１から読み出したモデル選択テーブルＴＢＬ１Ａとに基づいて、発話内容に対応するノイズキャンセルモデルを選択する（ステップＳｔ１３－２）。ステップＳｔ１３－２の後、プロセッサＰＲＣ１Ａの処理は終了する。

　ここで、図１１を参照して、図９のステップＳｔ１７の詳細な動作手順について説明する。

　図１１において、プロセッサＰＲＣ１Ａは、ステップＳｔ１４で使用するためにノイズキャンセルモデルを切り替えた時点から一定時間（ｔ：既定値）が経過したか否かを判定する（ステップＳｔ１７－１）。ノイズキャンセルモデルを切り替えた時点から一定時間（ｔ：既定値）が経過していないと判定された場合には（ステップＳｔ１７－１、ＮＯ）、プロセッサＰＲＣ１Ａの処理は終了する。この場合、プロセッサＰＲＣ１Ａは、現在使用中のノイズキャンセルモデルの使用を継続する。

　一方、プロセッサＰＲＣ１Ａは、ノイズキャンセルモデルを切り替えた時点から一定時間（ｔ：既定値）が経過したと判定した場合（ステップＳｔ１７－２、ＹＥＳ）、ステップＳｔ１４でノイズキャンセルモデルを切り替える前に使用していた元のノイズキャンセルモデルの使用に切り替える（ステップＳｔ１７－２）。ステップＳｔ１７－２の後、プロセッサＰＲＣ１Ａの処理は終了する。

　以上により、実施の形態２に係るオンライン処理システム１００では、ノイズキャンセル装置の一例としてのＰＣ１０Ａは、収音デバイス（マイクＭＣ１）が配置されている音響空間内の状況に関するデータ（例えばマイクＭＣ１により収音された入力音信号の音声認識結果が示す発話内容を示すデータ）を取得し、そのデータの内容或いは種別を判定する。ＰＣ１０Ａは、その判定した内容或いは種別に基づいて、収音デバイスにより収音された音響空間内の音信号（入力音信号）に含まれる、ノイズキャンセルモデルに応じた「消去しないノイズ音」以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択する。ＰＣ１０Ａは、選択されたノイズキャンセルモデルを用いて、入力音信号に含まれるノイズキャンセルモデルに応じた「消去しないノイズ音」以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力する。これにより、ＰＣ１０Ａは、ユーザＳＰ１の周囲の音響空間内で行われている発話時の雰囲気（臨場感）を損なうことなく、その雰囲気の臨場感とは関係の無い余計な周囲のノイズ音を効率的にキャンセル（消去）することができる。したがって、ユーザＳＰ１は、周囲の雰囲気の臨場感が損なわれずにかつ周囲のノイズ音を気にすることなく快適に処理を行うことができる。

＜実施の形態３＞
　実施の形態３では、実施の形態１及び実施の形態２を組み合わせた形態であり、イベント期間中はそのイベント予定データ（実施の形態１参照）に応じたノイズキャンセルモデルを選択し、そのイベント期間中に発話された内容に応じてノイズキャンセルモデルを割込み的に選択する例を説明する。

　実施の形態３に係るオンライン処理システムの構成例は実施の形態１、２に係るオンライン処理システム１００の構成例と同一であってもよいし、異なってもよい。以下の説明を簡単にするために、実施の形態３に係るオンライン処理システムの構成例は実施の形態１に係るオンライン処理システム１００の構成例と同一であると例示して説明する。

　まず、図１２を参照して、実施の形態３に係るノイズキャンセル装置の一例としてのＰＣ１０Ｂのハードウェア構成例について説明する。図１２は、実施の形態３に係るＰＣ１０Ｂのハードウェア構成例を示すブロック図である。ＰＣ１０Ｂは、マイクＭＣ１及びイベント予定データベースＤＢ１のそれぞれからデータ信号の入力が可能に接続され、更に、スピーカＳＰＫ１にデータ信号の出力が可能に接続されている。ＰＣ１０Ｂは、汎用的なコンピュータ装置であり、本開示に係るノイズキャンセル装置の一態様として、パーソナルコンピュータ以外にスマートフォン或いはタブレット端末で構成されても構わない。ＰＣ１０Ｂは、プロセッサＰＲＣ１Ｂと、メモリ１１と、をハードウェア構成として少なくとも含む。なお、ＰＣ１０Ｂは、ユーザＳＰ１の操作を受け付けるマウス等の入力デバイスも更に含む構成としてよい。なお、図１２では図示を省略しているが、図６のように、ＰＣ１０Ａは、外部のＰＣから送られてくる受話音声信号を受信して音声認識処理部１８に送る受信部ＲＣ１の構成を、更に備えてもよい。

　ＰＣ１０Ｂの説明において、図２のＰＣ１０或いは図６のＰＣ１０Ａの構成及び動作と同一の構成及び動作を行うものには同一の符号を付与して説明を簡略化或いは省略し、異なる内容について説明する。

　メモリ１１は、図１３に示すモデル選択テーブルＴＢＬ１Ｂを保存している。モデル選択テーブルＴＢＬ１Ｂについては図１３を参照して後述する。

　ここで、プロセッサＰＲＣ１Ｂが機能的に実行する処理の実行主体の構成例を詳述する。プロセッサＰＲＣ１Ｂは、イベント内容判定部１２と、音声認識処理部１８と、発話内容判定部１９と、利用モデル選択部１３Ｂと、ノイズキャンセル処理部１４と、セレクタ１５と、音声出力部１６と、送信部１７と、を機能的に備える。

　利用モデル選択部１３Ｂは、選択部の一例であり、イベント内容判定部１２からの判定結果を入力し、更に、メモリ１１からモデル選択テーブル（図１３参照）を読み出す。利用モデル選択部１３Ｂは、入力した判定結果とモデル選択テーブル（図１３参照）とに基づいて、マイクＭＣ１からの入力音信号（つまり、ユーザＳＰがいる音響空間内でマイクＭＣ１により収音された音のデータ信号）に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択する。利用モデル選択部１３Ｂは、選択したノイズキャンセルモデルを示す結果データをノイズキャンセル処理部１４に送る。

　また、利用モデル選択部１３Ｂは、イベント期間中に発話内容判定部１９からの判定結果を入力する場合がある。この場合、利用モデル選択部１３Ｂは、メモリ１１からモデル選択テーブル（図１３参照）を読み出す。利用モデル選択部１３Ｂは、発話内容判定部１９からの判定結果とモデル選択テーブル（図１３参照）とに基づいて、マイクＭＣ１からの入力音信号（つまり、ユーザＳＰがいる音響空間内でマイクＭＣ１により収音された音のデータ信号）に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを割込み的に選択する。この場合に、イベント期間中に使用するためのノイズキャンセルモデル（言い換えると、イベント予定データに応じて選択されたノイズキャンセルモデル）とは異なるノイズキャンセルモデルが選択されることもある。利用モデル選択部１３Ｂは、選択したノイズキャンセルモデルを示す結果データをノイズキャンセル処理部１４に送る。

　ここで、図１３を参照して、モデル選択テーブルＴＢＬ１Ｂについて説明する。図１３は、実施の形態３に係るモデル選択テーブルＴＢＬ１Ｂの内容例を示す図である。モデル選択テーブルＴＢＬ１Ｂは、図３のモデル選択テーブルＴＢＬ１と図７のモデル選択テーブルＴＢＬ１Ａとが組み合わされたテーブルである。モデル選択テーブルＴＢＬ１Ｂは、ノイズキャンセルモデルを選択する際、モデル選択テーブルＴＢＬ１の内容よりも、モデル選択テーブルＴＢＬ１Ａの内容を優先的に選択する。

　例えば、オンラインミーティングのイベントが開始されるにあたってノイズキャンセルモデル１が選択されてそのイベント期間中に、「乾杯」という発話が検知かつ判定された場合、利用モデル選択部１３Ｂは、ノイズキャンセルモデル１の使用中に、「乾杯」という発話内容に対応するノイズキャンセルモデル２を割込み的に選択して切り替える。

　他には例えば、オンライン講演会のイベントが開始されるにあたってノイズキャンセルモデル３が選択されてそのイベント期間中に、「乾杯」という発話が検知かつ判定された場合、利用モデル選択部１３Ｂは、ノイズキャンセルモデル３の使用中に、「乾杯」という発話内容に対応するノイズキャンセルモデル２を割込み的に選択して切り替える。

　次に、図１４を参照して、実施の形態３に係るＰＣ１０Ｂの動作手順例について説明する。図１４は、実施の形態３に係るＰＣ１０Ｂの動作手順例を時系列に示すフローチャートである。図１４に示す各処理は、主にプロセッサＰＲＣ１Ｂ（図１２参照）によって実行される。図１４に示す処理は、例えば１つのイベントごとに実行され、そのイベントが開始された時或いはその開始直前のタイミングに実行される。また、図１４の説明において、図５或いは図９の処理と同一の処理については同一のステップ番号を付与して説明を簡略化或いは省略し、異なる内容について説明する。

　図１４において、ステップＳｔ２での判定結果はプロセッサＰＲＣ１Ｂに入力される。しかし、ステップＳｔ１１及びステップＳｔ１２において、マイクＭＣ１により収音された入力音信号に図１３に示す発話内容が検知かつ判定されなければ、ステップＳｔ１２の処理結果はプロセッサＰＲＣ１Ｂには入力されない。

　プロセッサＰＲＣ１Ｂは、ステップＳｔ２での判定結果だけを入力した場合には、ステップＳｔ２で判定したイベント種別（内容）とメモリ１１から読み出したモデル選択テーブルＴＢＬ１とに基づいて、イベント種別に対応するノイズキャンセルモデルを選択する（ステップＳｔ３１）。

　一方、プロセッサＰＲＣ１Ｂは、ステップＳｔ２での判定結果及びステップＳｔ１２での判定結果の両方を入力した場合には、図１３のモデル選択テーブルＴＢＬ１Ｂに基づいて、ステップＳｔ１２で判定された発話内容に対応するノイズキャンセルモデルを割込み的に切り替えるように選択する（ステップＳｔ３１）。ステップＳｔ３１以降の処理については、図９に示すステップＳｔ１４以降の処理と同様であるため、詳細な説明は省略する。

　以上により、実施の形態３に係るオンライン処理システム１００では、ノイズキャンセル装置の一例としてのＰＣ１０Ｂは、収音デバイス（マイクＭＣ１）が配置されている音響空間内の状況に関するデータ（例えばイベント予定データＩＶＬ１、或いは、イベント予定データＩＶＬ１及びマイクＭＣ１により収音された入力音信号の音声認識結果が示す発話内容を示すデータ）を取得し、そのデータの内容或いは種別を判定する。ＰＣ１０Ｂは、その判定した内容或いは種別に基づいて、収音デバイスにより収音された音響空間内の音信号（入力音信号）に含まれる、ノイズキャンセルモデルに応じた「消去しないノイズ音」以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択する。ＰＣ１０Ｂは、選択されたノイズキャンセルモデルを用いて、入力音信号に含まれるノイズキャンセルモデルに応じた「消去しないノイズ音」以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力する。これにより、ＰＣ１０Ｂは、ユーザＳＰ１の周囲の音響空間内で行われているイベント期間中の雰囲気或いはそのイベント期間中に起きた発話時の雰囲気（臨場感）を損なうことなく、その雰囲気の臨場感とは関係の無い余計な周囲のノイズ音を効率的にキャンセル（消去）することができる。したがって、ユーザＳＰ１は、周囲の雰囲気の臨場感が損なわれずにかつ周囲のノイズ音を気にすることなく快適に処理を行うことができる。

＜本開示の技術について＞
　以上説明したように、本開示には以下に示す技術思想が開示されている。

＜技術１＞
　収音デバイス（マイクＭＣ１）が配置されている音響空間内の状況に関するデータを取得する取得部（イベント内容判定部１２、音声認識処理部１８と、
　前記データの内容或いは種別を判定する判定部（イベント内容判定部１２、発話内容判定部１９）と、
　前記内容或いは種別に基づいて、前記収音デバイスにより収音された前記音響空間内の音信号に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択する選択部（利用モデル選択部１３）と、
　選択された前記ノイズキャンセルモデルを用いて、前記音信号に含まれる前記所望ノイズ音以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力する出力制御部（ノイズキャンセル処理部１４、音声出力部１６）と、を備える、
　ノイズキャンセル装置。
　これにより、ノイズキャンセル装置は、ユーザＳＰ１の周囲の音響空間内で行われているイベントの臨場感を損なうことなく、イベントの臨場感とは関係の無い余計な周囲のノイズ音を効率的にキャンセル（消去）することができる。

＜技術２＞
　前記データは、前記音響空間内で行われるイベントの種別を含むスケジュールデータであり、
　前記選択部は、前記イベントの種別に基づいて、前記ノイズキャンセルモデルを選択する、
　技術１に記載のノイズキャンセル装置。
　これにより、ノイズキャンセル装置は、音響空間内で行われるイベントの種別に応じて適切にノイズキャンセルモデルを選択できる。

＜技術３＞
　前記スケジュールデータは、前記イベントの開始時刻及び終了時刻の情報を含み、
　前記選択部は、前記イベントの期間中に前記ノイズキャンセルモデルを継続使用するように選択する、
　技術１又は技術２に記載のノイズキャンセル装置。
　これにより、ノイズキャンセル装置は、イベントの開始時刻及び終了時刻を考慮した開催期間中において同一のノイズキャンセルモデルを継続使用できる。

＜技術４＞
　前記取得部は、前記データとして、前記収音デバイスにより収音された前記音信号を音声認識した結果データを取得し、
　前記判定部は、前記音声認識の前記結果データが示すユーザの発話内容を判定し、
　前記選択部は、前記発話内容の判定結果に基づいて、前記ノイズキャンセルモデルを選択する、
　技術１～３のうちいずれか一項に記載のノイズキャンセル装置。
　これにより、ノイズキャンセル装置は、マイクＭＣ１により収音された入力音信号に含まれる音声等の音声認識結果がユーザの発話内容を示す場合に、その発話時の雰囲気の臨場感を損ねないように適切なノイズキャンセルモデルを選択かつ使用できる。

＜技術５＞
　前記選択部は、前記ノイズキャンセルモデルを選択してから一定時間が経過した場合に、前記選択の前に使用していた他のノイズキャンセルモデルに切り替える、
　技術１～４のうちいずれか一項に記載のノイズキャンセル装置。
　これにより、ノイズキャンセル装置は、一定時間の経過によって選択したノイズキャンセルモデルの使用状況が落ち着くと想定可能であり、選択前の元のノイズキャンセルモデルに戻すことで適切なノイズキャンセル処理を実行できる。

＜技術６＞
　前記選択部は、前記ノイズキャンセルモデルを選択してから一定時間が経過するまで、選択した前記ノイズキャンセルモデルを継続使用するように選択する、
　技術４又は技術５に記載のノイズキャンセル装置。
　これにより、ノイズキャンセル装置は、切り替えたノイズキャンセルモデルの使用に適する期間が一定時間であると想定可能であり、その一定時間が経過するまでは切り替えの契機となった雰囲気の臨場感を損ねないように適切にノイズキャンセル処理を実行できる。

＜技術７＞
　前記データは、前記音響空間内で行われるイベントの種別を含むスケジュールデータと、前記収音デバイスにより収音された前記音信号の音声認識結果データと、を有し、
　前記選択部は、前記イベントの期間中に前記イベントの種別に基づく第１ノイズキャンセルモデル（例えばノイズキャンセルモデル１）を使用するよう選択し、かつ、前記イベントの期間中に前記音声認識結果データが示す発話内容が検知された場合に前記発話内容に基づく第２ノイズキャンセル（例えばノイズキャンセルモデル２）を割り込んで使用するよう選択する、
　技術１～６のうちいずれか一項に記載のノイズキャンセル装置。
　これにより、ノイズキャンセル装置は、イベント期間中に突発的にユーザ等の発話があった場合にその発話によってイベントに対応して選択したノイズキャンセルモデルによって発話時の臨場感を損ねることが無いように、その発話に応じたノイズキャンセルモデルを選択することによってその雰囲気に応じた適切なノイズキャンセル処理を実行できる。

＜技術８＞
　ノイズキャンセル装置により実行されるノイズキャンセル方法であって、
　収音デバイスが配置されている音響空間内の状況に関するデータを取得するステップと、
　前記データの内容或いは種別を判定するステップと、
　前記内容或いは種別に基づいて、前記収音デバイスにより収音された前記音響空間内の音信号に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択するステップと、
　選択された前記ノイズキャンセルモデルを用いて、前記音信号に含まれる前記所望ノイズ音以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力するステップと、を有する、
　ノイズキャンセル方法。
　これにより、ノイズキャンセル方法によれば、ユーザＳＰ１の周囲の音響空間内で行われているイベントの臨場感を損なうことなく、イベントの臨場感とは関係の無い余計な周囲のノイズ音を効率的にキャンセル（消去）することができる。

＜技術９＞
　コンピュータであるノイズキャンセル装置に、
　収音デバイスが配置されている音響空間内の状況に関するデータを取得するステップと、
　前記データの内容或いは種別を判定するステップと、
　前記内容或いは種別に基づいて、前記収音デバイスにより収音された前記音響空間内の音信号に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択するステップと、
　選択された前記ノイズキャンセルモデルを用いて、前記音信号に含まれる前記所望ノイズ音以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力するステップと、を実現させるための、
　プログラム。
　これにより、プログラムがインストールされたノイズキャンセル装置は、ユーザＳＰ１の周囲の音響空間内で行われているイベントの臨場感を損なうことなく、イベントの臨場感とは関係の無い余計な周囲のノイズ音を効率的にキャンセル（消去）することができる。

　以上、添付図面を参照しながら各種の実施の形態について説明したが、本開示はかかる例に限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても本開示の技術的範囲に属すると了解される。また、発明の趣旨を逸脱しない範囲において、上述した各種の実施の形態における各構成要素を任意に組み合わせてもよい。

　なお、本出願は、２０２３年６月５日出願の日本特許出願（特願２０２３－０９２７２９）に基づくものであり、その内容は本出願の中に参照として援用される。

　本開示は、ユーザの周囲の音響空間内の臨場感を損なことなく、周囲のノイズ音を効率的に消去するノイズキャンセル装置、ノイズキャンセル方法及びプログラムとして有用である。

１０、２０、Ｎ０　ＰＣ
１１　メモリ
１２　イベント内容判定部
１３、１３Ａ　利用モデル選択部
１４　ノイズキャンセル処理部
１５　セレクタ
１６　音声出力部
１７　送信部
１８　音声認識処理部
１９　発話内容判定部
１００　オンライン処理システム
ＤＢ１　イベント予定データベース
Ｍ１、Ｍ２、Ｍ３　ノイズキャンセルモデル
ＭＣ１、ＭＣ２、ＭＣｎ　マイク
ＰＲＣ１、ＰＲＣ１Ａ　プロセッサ

Claims

　収音デバイスが配置されている音響空間内の状況に関するデータを取得する取得部と、
　前記データの内容或いは種別を判定する判定部と、
　前記内容或いは種別に基づいて、前記収音デバイスにより収音された前記音響空間内の音信号に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択する選択部と、
　選択された前記ノイズキャンセルモデルを用いて、前記音信号に含まれる前記所望ノイズ音以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力する出力制御部と、を備える、
　ノイズキャンセル装置。
　前記データは、前記音響空間内で行われるイベントの種別を含むスケジュールデータであり、
　前記選択部は、前記イベントの種別に基づいて、前記ノイズキャンセルモデルを選択する、
　請求項１に記載のノイズキャンセル装置。
　前記スケジュールデータは、前記イベントの開始時刻及び終了時刻の情報を含み、
　前記選択部は、前記イベントの期間中に前記ノイズキャンセルモデルを継続使用するように選択する、
　請求項２に記載のノイズキャンセル装置。
　前記取得部は、前記データとして、前記収音デバイスにより収音された前記音信号を音声認識した結果データを取得し、
　前記判定部は、前記音声認識の前記結果データが示すユーザの発話内容を判定し、
　前記選択部は、前記発話内容の判定結果に基づいて、前記ノイズキャンセルモデルを選択する、
　請求項１に記載のノイズキャンセル装置。
　前記選択部は、前記ノイズキャンセルモデルを選択してから一定時間が経過した場合に、前記選択の前に使用していた他のノイズキャンセルモデルに切り替える、
　請求項４に記載のノイズキャンセル装置。
　前記選択部は、前記ノイズキャンセルモデルを選択してから一定時間が経過するまで、選択した前記ノイズキャンセルモデルを継続使用するように選択する、
　請求項４又は５に記載のノイズキャンセル装置。
　前記データは、前記音響空間内で行われるイベントの種別を含むスケジュールデータと、前記収音デバイスにより収音された前記音信号の音声認識結果データと、を有し、
　前記選択部は、前記イベントの期間中に前記イベントの種別に基づく第１ノイズキャンセルモデルを使用するよう選択し、かつ、前記イベントの期間中に前記音声認識結果データが示す発話内容が検知された場合に前記発話内容に基づく第２ノイズキャンセルを割り込んで使用するよう選択する、
　請求項１に記載のノイズキャンセル装置。
　ノイズキャンセル装置により実行されるノイズキャンセル方法であって、
　収音デバイスが配置されている音響空間内の状況に関するデータを取得するステップと、
　前記データの内容或いは種別を判定するステップと、
　前記内容或いは種別に基づいて、前記収音デバイスにより収音された前記音響空間内の音信号に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択するステップと、
　選択された前記ノイズキャンセルモデルを用いて、前記音信号に含まれる前記所望ノイズ音以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力するステップと、を有する、
　ノイズキャンセル方法。
　コンピュータであるノイズキャンセル装置に、
　収音デバイスが配置されている音響空間内の状況に関するデータを取得するステップと、
　前記データの内容或いは種別を判定するステップと、
　前記内容或いは種別に基づいて、前記収音デバイスにより収音された前記音響空間内の音信号に含まれるノイズ音の一部を構成する所望ノイズ音以外のノイズ音をキャンセルするためのノイズキャンセルモデルを選択するステップと、
　選択された前記ノイズキャンセルモデルを用いて、前記音信号に含まれる前記所望ノイズ音以外のノイズ音をキャンセルするノイズキャンセル処理を施した出力音声信号を出力するステップと、を実現させるための、
　プログラム。