以下、本発明を実施するための形態の一例として、機器システムと機器システムが行う音量の調整方法について説明する。
<遠隔会議における議事録の作成方法の一例>
まず、図1を参照して、パノラマ画像とアプリの画面を用いた議事録の作成方法の概略を説明する。図1は、遠隔会議中に実行されたアプリの画面を周囲のパノラマ画像と共に保存する記録情報の作成の概略を説明する図である。図1に示すように、図示する自拠点102にいるユーザーが遠隔会議サービスシステム90を利用して、他の拠点101と遠隔会議を行っている。
本実施形態の記録情報作成システム100は、周囲360°を撮像可能な撮像手段及びマイクとスピーカを備えたミーティングデバイス60が、周囲を撮像した情報を処理することで取得した水平パノラマ画像(以下、パノラマ画像という)と、端末装置10が実行するアプリケーション(以下、アプリという)が作成する画面と、を用いて、記録情報(議事録など)を作成する。音声については、記録情報作成システム100は、遠隔会議アプリ42が受信する音声と、ミーティングデバイス60が取得する音声とを合成して、記録情報に含める。以下、概略を説明する。
(1) 端末装置10では、後述する情報記録アプリ41と遠隔会議アプリとが動作している。この他、資料表示用のアプリなども動作していてよい。情報記録アプリ41は、端末装置10が出力する音声(遠隔会議アプリが他の拠点から受信した音声を含む。)をミーティングデバイス60に送信する。ミーティングデバイス60は、自身が取得している音声と、遠隔会議アプリの音声とをミキシング(合成)する。
(2) ミーティングデバイス60はマイクを備え、音声を取得した方向に基づき、パノラマ画像から話者を切り出す処理を行い、話者画像を作成する。ミーティングデバイス60は、パノラマ画像と話者画像の両方を端末装置10に送信する。
(3) 端末装置10で動作する情報記録アプリ41は、パノラマ画像203と話者画像204を表示できる。情報記録アプリ41は、ユーザーが選択した任意のアプリ画面(例えば遠隔会議アプリの画面103)と、パノラマ画像203と話者画像204と、を結合する。例えば、左側にパノラマ画像203と話者画像204、右側に遠隔会議アプリの画面103が配置されるように、パノラマ画像203、話者画像204、アプリの画面103を結合する(以下、結合画像105という)。なおアプリ画面は、遠隔会議アプリ等の各アプリケーションが表示する画面情報(後述)の例である。(3)の処理は繰り返し実行されるので、結合画像105は動画となる(以下、結合画像動画という)。また、情報記録アプリ41は、結合画像動画に合成された音声を結合して音声付きの動画を作成する。
なお、本実施形態では、パノラマ画像203、話者画像204、アプリの画面103を結合する例を説明するが、情報記録アプリ41がこれらを別々に保存し、再生時に画面に配置してもよい。
(4) 情報記録アプリ41は、編集作業(ユーザーによる不要箇所のカット)を受け付け、結合画像動画を完成させる。結合画像動画は記録情報の一部を構成する。
(5) 情報記録アプリ41は、作成した結合画像動画(音声付き)をストレージサービスシステム70に送信し保存しておく。
(6) また、情報記録アプリ41は、結合画像動画から音声のみを抽出しておき(結合前の音声を取っておいてもよい)、抽出した音声を、情報処理システム50に送信する。情報処理システム50は音声をテキストデータに変換する音声認識サービスシステム80に送信し、音声をテキスト化する。テキストデータには、録画開始から何分後に話したか、というデータも含まれる。
なお、リアルタイムのテキスト化の場合、ミーティングデバイス60が情報処理システム50に直接音声を送信する。ミーティングデバイス60はテキストデータをリアルタイムに情報記録アプリ41に送信する。
(7) 情報処理システム50は、結合画像動画を格納したストレージサービスシステム70に、テキストデータを追加で格納する。テキストデータは記録情報の一部を構成する。
なお、情報処理システム50は、ユーザーに対し利用したサービスに応じた課金処理を実行できる。例えば、課金はテキストデータ量、結合画像動画のファイルサイズ、処理時間などに基づいて算出される。
このように、結合画像動画には、ユーザーを含む周囲のパノラマ画像や話者画像が表示され、更に、遠隔会議アプリ42など、遠隔会議中に表示されたアプリの画面が表示される。遠隔会議の参加者や参加者でない者が、結合画像動画を議事録として閲覧した場合、遠隔会議中の様子が臨場感と共に再現される。
<処理の概略>
続いて、図2を参照して、端末装置10が、電子黒板2をミュートする処理について説明する。図2は、端末装置10が、電子黒板2のマイク及びスピーカをミュートする処理について説明する図である。ミーティングデバイス60と電子黒板2はそれぞれ、マイクとスピーカを持っている。ミーティングデバイス60が出力した音声は電子黒板2のマイクで集音され、電子黒板2が遠隔会議サービスシステムに送信する。遠隔会議サービスシステム90は音声を端末装置10に送信し、ミーティングデバイス60が出力する。このサイクルが繰り返されるとハウリングが発生する場合がある。逆に、電子黒板2が出力した音声はミーティングデバイス60のマイクで集音され、端末装置10が遠隔会議サービスシステム90に送信する。遠隔会議サービスシステム90は音声を電子黒板2に送信し、電子黒板2が出力する。このサイクルが繰り返されるとハウリングが発生する場合がある。
そこで、本実施形態のミーティングデバイス60は以下のようにしてハウリングを抑制する。
(1) ユーザーが電子黒板2を操作して会議への参加を指示する。
(2) 電子黒板2がQRコード(登録商標)等の二次元コード8を表示する。二次元コード8には電子黒板2のIPアドレスや機器識別情報等、電子黒板2に関する情報が含まれている。
(3) ミーティングデバイス60が二次元コードを撮像し、デコードすることで、電子黒板2のIPアドレスや機器識別情報等が得られる。
(4) 端末装置10は、IPアドレスを宛先に電子黒板2のAPI(Application Programming Interface)を呼び出すなどして、電子黒板2にミュートを要求する。あるいは、端末装置10は、機器識別情報を指定して情報処理システム50を介し、電子黒板2にミュートを要求する。
このように、本実施形態のミーティングデバイス60は、二次元コードを表示した電子黒板2をミュートするので、機器を誤らずに適切な機器をミュートできる。また、ユーザーは、会議の参加者の中心にあるミーティングデバイス60で音声を出力し、電子黒板2が集音するマイクをミュートにしたいが、従来技術ではそのような制御はできなかった。本実施形態では上記のように機器を誤ることがない。
<用語について>
音量の調整とは、主に音量を小さくすることをいう。音量の調整には、マイクが集音する音量、又は、スピーカが発生する音量の少なくとも一方の音量を調整することをいう。調整の1つに消音(ミュート)がある。音量の調整には、マイクが検知できない程度の小さい音量に制御することを含んでよい。本実施形態では、音量の調整は、単に消音という用語で説明される。
情報の入力手段は、画像、音声、電波等を入力する手段であればよく、例えばカメラ(撮像手段)、マイク、近距離無線通信が相当する。
情報の出力手段は、画像の表示手段、音声、電波等を出力する手段であればよく、例えばディスプレイや投影装置、スピーカ、近距離無線通信が相当する。
第二の機器に関する情報は、第二の機器と通信において第二の機器を特定できる情報である。第二の機器に関する情報は、例えば、機器識別情報又はIPアドレス等である。第二の機器に関する情報は、電子黒板が今ミュート状態なのか否かを含んでよい。
ミーティングデバイスが取得したミーティングデバイスの周囲の画像情報は、ミーティングデバイスがミーティングデバイスを囲む、周囲の空間(例えば水平方向で180°~360°の空間)を撮像して取得した画像情報であり、ミーティングデバイスが撮像した曲面の画像情報に対して、所定の処理を行うことで取得した画像をいう。所定の処理とは撮像した曲面の画像に対する平面化処理など、撮像した情報から周囲の画像情報を作成するための各種処理である。所定の処理には周辺の画像を作成する処理に加え、話者画像を切り出す処理、周辺の画像や話者画像等を結合する結合処理を含めてもよい。本実施形態では、周囲の画像は、パノラマ画像という用語で説明される。パノラマ画像はおおむね水平方向に180°~360°の画角がある画像である。ミーティングデバイスは1台でパノラマ画像を撮像しなくてもよく、通常の画角の撮像装置が複数個、組み合わされていてもよい。ミーティングデバイスは拠点での会議や周囲の状況把握のためにテーブル等の設置場所に設置して使用することを想定しているが、この他、監視(セキュリティ・防災など)、見守り(育児や介護など)、現場の状況分析(ソリューションやマーケティングなど)を行うために用いるデバイスであってもよい。
記録情報とは、情報記録アプリ41が記録する情報であり、ある1つの会議(ミーティング)の識別情報に紐づく情報として閲覧可能に記憶・保存された情報であって、例えば以下の情報を含む情報である。
・選択したアプリ(遠隔会議アプリなど)が表示する画面情報と、デバイスが取得したデバイスの周囲の画像情報、などに基づいて作成する動画情報。
・会議(ミーティング)中に、遠隔会議アプリ(端末装置)と、拠点のミーティングデバイスとで取得し合成した音声情報。
・取得した音声をテキスト化したテキスト情報。
・その他、会議(ミーティング)に関連する関連情報であるデータや画像。例えば会議中に用いた資料ファイル、追加したメモ、テキスト化データの翻訳データ、会議中にクラウド電子黒板サービスで作成した画像やストロークデータなど。
等である。情報記録アプリ41が遠隔会議アプリの画面や、拠点の会議の様子を録画した場合、記録情報が、実施した会議の議事録となる場合がある。議事録は記録情報の例であり遠隔会議や拠点側で行った内容に応じて記録情報の呼び方が変わり、例えばコミュニケーションの記録、拠点状況の記録などと言ってもよい。また記録情報は、例えば、動画ファイル(結合画像動画等)、音声ファイル、テキストデータ(音声が音声認識されたテキストデータ)、文書ファイル、画像ファイル、表形式ファイルなど、複数の形式のファイルを含み、ファイルは会議の識別情報に対して互いに関連づいているため、閲覧時にまとめて、あるいは選択的に、時系列で閲覧可能となっている。
テナントとは、サービスの提供者からサービスを受けることを契約したユーザーのグループ(企業や自治体、これらの一部の組織等)である。本実施形態の記録情報の作成やテキストデータへの変換は、テナントがサービス提供元と契約しているために実行される。
遠隔コミュニケーションとは、物理的に離れた拠点にいる相手と、ソフトウェアや端末装置を活用することによって音声や映像を通じたコミュニケーションを取ることをいう。遠隔コミュニケーションの一例に遠隔会議があり、会議は、会合、ミーティング、打ち合わせ、相談、契約等の申し込み、集会、寄り合い、集まり、セミナー、講習会、勉強会、ゼミ、研修会等と呼ばれてもよい。
拠点とは、活動のよりどころとする場所をいう。拠点の例として会議室がある。会議室は、主に会議に使用することを目的に設置された部屋のことである。拠点はこのほか自宅や、受付や店舗、倉庫や屋外の現場など様々な場所であってもよく、端末装置やデバイス等を設置できる箇所のある場所や空間であればよい。
音声とは人間が発する言語音や周囲の音等であり、音声データは音声をデータ化したものであるが、本実施形態では、厳密に区別せずに説明する。
第一の機器は、コミュニケーションに関する情報を処理する機器であり、本実施形態では、ミーティングデバイス60という用語で説明される。第一の機器は、周囲を撮像する撮像装置、音声を取得するマイク、ビーコンを受信する機能を有しているとよい。また、第一の機器はスピーカを有していてよい。
第二の機器は、情報を表示する装置であればよい。本実施形態では電子黒板という用語で説明される。電子黒板は、電子ホワイトボード、電子情報ボード、などと呼ばれてよい。電子黒板2と同等の装置としてプロジェクタが知られている。この他、第一の機器は、デジタルサイネージ、テレビ、ディスプレイ、複合機、テレビ会議端末などでもよい。
<システム構成例>
続いて、図3を参照して、記録情報作成システム100のシステム構成を説明する。図3は、記録情報作成システム100の構成例を示す。図3では、遠隔会議を行う複数の拠点のうち1つの拠点(自拠点102)を示し、自拠点102における端末装置10がネットワークを介して情報処理システム50と、ストレージサービスシステム70と、遠隔会議サービスシステム90と、通信する。自拠点102には更に、ミーティングデバイス60と電子黒板2が配置され、端末装置10はこのミーティングデバイス60とUSBケーブル等を介して通信可能に接続されている。なお、ミーティングデバイス60、及び、電子黒板2、又は、更に情報処理システム50を含めて、これらは機器システムとして動作する。
端末装置10では、少なくとも情報記録アプリ41と遠隔会議アプリ42とが動作する。遠隔会議アプリ42は、他の拠点101の端末装置10とネットワーク上の遠隔会議サービスシステム90を介して通信することができ、各拠点のユーザー同士が遠隔地から会議できるようになっている。情報記録アプリ41は、遠隔会議アプリ42が実施する遠隔会議における記録情報を、情報処理システム50及びミーティングデバイス60の機能を使って作成する。
なお、本実施形態では、遠隔会議中の記録情報を作成する例を説明するが、会議は、遠隔の拠点と通信する会議でなくてもよい。つまり、会議は1拠点内の参加者のみが参加する会議でもよい。この場合、ミーティングデバイス60が撮像する画像と集音した音声がそれぞれ合成なしに保存される他、情報記録アプリ41の処理に変更はない。
端末装置10には通常の画角のカメラが内蔵されており(外付けでもよい)、端末装置10を操作するユーザー107を含む正面の画像を撮像している。通常の画角とは、パノラマ画像でない画像であるが、本実施形態では、主に全天球画像のように曲面でない平面画像である。したがって、ユーザーは、情報記録アプリ41を意識することなく、遠隔会議アプリ42を使用した従来の遠隔会議が可能である。情報記録アプリ41やミーティングデバイス60は、端末装置10の処理負荷増を除けば遠隔会議アプリ42に影響を与えない。なお、遠隔会議アプリ42はミーティングデバイス60が撮像するパノラマ画像や話者画像を遠隔会議サービスシステム90に送信することも可能である。
情報記録アプリ41はミーティングデバイス60と通信して記録情報を作成する。情報記録アプリ41はまた、ミーティングデバイス60が取得した音声と遠隔会議アプリ42が他の拠点から受信した音声との合成等を行う。ミーティングデバイス60は、パノラマ画像の撮像装置、マイク、及び、スピーカを備えたミーティング用のデバイスである。端末装置10が有するカメラは正面の限られた範囲しか撮像できないが、ミーティングデバイス60はミーティングデバイス60を囲む全周囲(必ずしも全周囲でなくてもよい)を撮像できる。ミーティングデバイス60は図3に示す複数の参加者106を常に画角に収めることができる。
この他、ミーティングデバイス60は、パノラマ画像からの話者画像の切り出し等を行う。なお、ミーティングデバイス60は、机の上に限らず自拠点102のどこに配置されてもよい。ミーティングデバイス60は全天球画像を撮像できるので、例えば天井に配置されてもよい。
情報記録アプリ41は、端末装置10で実行中のアプリの一覧表示、上記した記録情報のための画像合成(結合画像動画の作成)、結合画像動画の再生、編集の受け付け等を行う。また、情報記録アプリ41は、実施された又はこれから実施される予定の遠隔会議のリスト表示、等を行う。遠隔会議のリストは、記録情報に関する情報に使用され、ユーザーが遠隔会議と記録情報とを結びつけることができる。
遠隔会議アプリ42は、他の拠点101の他の端末装置との通信接続、画像及び音声の送受信、画像の表示や音声の出力等により、端末装置が他の端末装置と遠隔コミュニケーションを行うアプリケーションである。遠隔会議アプリは、遠隔コミュニケーションアプリ、遠隔情報共通アプリなどと言うこともできる。
なお、情報記録アプリ41及び遠隔会議アプリ42はWebアプリでもネイティブアプリでもよい。Webアプリとは、Webサーバー上のプログラムとWebブラウザ上のプログラムやネイティブアプリが協働して処理を行うアプリであり、端末装置10へのインストールが不要なアプリである。ネイティブアプリとは、端末装置10にインストールして利用されるアプリである。本実施形態では、両者ともネイティブアプリであるとして説明する。
端末装置10は、例えば、PC(Personal Computer)、スマートフォン、タブレット端末等、通信機能を備えた汎用的な情報処理装置でよい。端末装置10は、この他、電子黒板2、ゲーム機、PDA(Personal Digital Assistant)、ウェアラブルPC、カーナビ、産業機械、医療機器、ネットワーク家電等でもよい。端末装置10は情報記録アプリ41と遠隔会議アプリ42が少なくとも動作する装置であればよい。
電子黒板2は、ペンや指等の入力手段でタッチパネルに手書きされたデータをディスプレイに表示する。電子黒板2は、有線又は無線で端末装置10等と通信することができ、端末装置10が表示する画面を取り込んでディスプレイに表示することができる。電子黒板2は、手書きデータをテキストデータに変換したり、他の拠点の電子黒板2とディスプレイに表示される情報を共有したりすることができる。電子黒板2は、タッチパネルを有さない単なる白板にプロジェクタが映像を投影する形態のものでもよい。また、電子黒板2は、タッチパネルを備えたタブレット端末、ノートPC(Personal Computer)、PDA(Personal Digital Assistant)、ゲーム機等でもよい。
電子黒板2は、情報処理システム50と通信することができる。電子黒板2は、例えば、電源オンされた後、情報処理システム50にポーリングしたりWebソケットなどの双方向通信を利用したりして、情報処理システム50から情報を受信できる。
情報処理システム50は、ネットワーク上に配置された一台以上の情報処理装置である。情報処理システム50は、情報記録アプリ41と協働して処理を行う1つ以上のサーバーアプリと、基盤サービスを有している。このサーバーアプリは、遠隔会議のリストの管理、遠隔会議で記録された記録情報の管理、各種設定やストレージパスの管理等を行う。基盤サービスは、ユーザー認証や契約、課金処理等を行う。
なお、情報処理システム50の機能の全て又は一部は、クラウド環境に存在してもよいし、オンプレミス環境に存在してもよい。情報処理システム50は複数台のサーバー装置により構成されてもよいし、一台の情報処理装置により構成されてもよい。例えば、サーバーアプリと基盤サービスが別々の情報処理装置より提供されてよいし、更にサーバーアプリ内の機能ごとに情報処理装置が存在してもよい。情報処理システム50と次述するストレージサービスシステム70、音声認識サービスシステム80が一体でもよい。
ストレージサービスシステム70は、ネットワーク上の記憶手段であり、ファイル等の保存を受け付けるストレージサービスを提供する。ストレージサービスシステム70としてはOne Drive(登録商標)、Google Workspace(登録商標)、DropBox(登録商標)等が知られている。ストレージサービスシステム70は、オンプレミスのNAS(Network Attached Storage)等でもよい。
音声認識サービスシステム80は、音声データに音声認識を行いテキストデータに変換するサービスを提供する。音声認識サービスシステム80は、汎用的な商用サービスでもよいし、情報処理システム50の機能の一部でもよい。また音声認識サービスシステム80はユーザーやテナント毎、会議毎に異なるサービスシステムを設定して用いてもよい。
<ハードウェア構成例>
図4を参照して、本実施形態に係る情報処理システム50及び端末装置10のハードウェア構成について説明する。
<<情報処理システム及び端末装置>>
図4は、本実施形態に係る情報処理システム50及び端末装置10の一例のハードウェア構成を示す図である。図4に示されているように、情報処理システム50及び端末装置10はコンピュータによって構築されており、CPU501、ROM502、RAM503、HD(Hard Disk)504、HDD(Hard Disk Drive)コントローラ505、ディスプレイ506、外部機器接続I/F(Interface)508、ネットワークI/F509、バスライン510、キーボード511、ポインティングデバイス512、光学ドライブ514、メディアI/F516を備えている。
これらのうち、CPU501は、情報処理システム50及び端末装置10全体の動作を制御する。ROM502は、IPL等のCPU501の駆動に用いられるプログラムを記憶する。RAM503は、CPU501のワークエリアとして使用される。HD504は、プログラム等の各種データを記憶する。HDDコントローラ505は、CPU501の制御にしたがってHD504に対する各種データの読み出し又は書き込みを制御する。ディスプレイ506は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F508は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F509は、ネットワークを利用してデータ通信をするためのインターフェースである。バスライン510は、図4に示されているCPU501等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
また、キーボード511は、文字、数値、又は各種指示などの入力に使用される複数のキーを備えた入力手段の一種である。ポインティングデバイス512は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。光学ドライブ514は、着脱可能な記録媒体の一例としての光記憶媒体513に対する各種データの読み出し又は書き込みを制御する。なお、光記憶媒体513は、CD,DVD、Blu-ray(登録商標)等でよい。メディアI/F516は、フラッシュメモリ等の記録メディア515に対するデータの読み出し又は書き込み(記憶)を制御する。
<<ミーティングデバイス>>
図5を用いて、ミーティングデバイス60のハードウェア構成を説明する。図5は、360°の動画を撮像可能なミーティングデバイス60のハードウェア構成図の一例である。以下では、ミーティングデバイス60は撮像素子を使用した、デバイスの周囲360°の動画を所定の高さで撮像する装置とするが、撮像素子は1つでも2つ以上のいくつでもよい。また、必ずしも専用装置である必要はなくPCやデジタルカメラ、スマートフォン等に後付けの360°動画の撮像ユニットを取り付けることで、実質的に同じ機能を有するようにしてもよい。
図5に示されているように、ミーティングデバイス60は、撮像ユニット601、画像処理ユニット604、撮像制御ユニット605、マイク608、音処理ユニット609、CPU(Central Processing Unit)611、ROM(Read Only Memory)612、SRAM(Static Random Access Memory)613、DRAM(Dynamic Random Access Memory)614、操作部615、外部機器接続I/F616、通信部617、アンテナ617a、音声センサー618、及び、スピーカ619を有している。
このうち、撮像ユニット601は、半球画像を結像するための360°の画角を有する広角レンズ(いわゆる魚眼レンズ)602と、各広角レンズに対応させて設けられている撮像素子603(イメージセンサー)を備えている。撮像素子603は、魚眼レンズ602による光学像を電気信号の画像データに変換して出力するCMOS(Complementary Metal Oxide Semiconductor)センサーやCCD(Charge Coupled Device)センサーなどの画像センサー、この画像センサーの水平又は垂直同期信号や画素クロックなどを生成するタイミング生成回路、この撮像素子の動作に必要な種々のコマンドやパラメータなどが設定されるレジスタ群などを有している。なお撮像ユニット601は360°カメラであってもよく、ミーティングデバイス60の周囲360°を撮像可能な撮像手段の例である。
撮像ユニット601の撮像素子603(イメージセンサー)は、各々、画像処理ユニット604とパラレルI/Fバスで接続されている。一方、撮像ユニット601の撮像素子603は、撮像制御ユニット605とは、シリアルI/Fバス(I2Cバス等)で接続されている。画像処理ユニット604、撮像制御ユニット605及び音処理ユニット609は、バス610を介してCPU611と接続される。更に、バス610には、ROM612、SRAM613、DRAM614、操作部615、外部機器接続I/F616、通信部617、音声センサー618及びスピーカ619なども接続される。
画像処理ユニット604は、撮像素子603から出力される画像データをパラレルI/Fバスを通して取り込み、画像データに対して所定の処理を施して、魚眼映像からパノラマ画像や話者画像のデータを作成する。更に、 画像処理ユニット604は、パノラマ画像と話者画像等を合成処理して、1つの動画を出力する。
撮像制御ユニット605は、一般に撮像制御ユニット605をマスタデバイス、撮像素子603をスレーブデバイスとして、I2Cバスを利用して、撮像素子603のレジスタ群にコマンド等を設定する。必要なコマンド等は、CPU611から受け取る。また、撮像制御ユニット605は、同じくI2Cバスを利用して、撮像素子603のレジスタ群のステータスデータ等を取り込み、CPU611に送る。
また、撮像制御ユニット605は、操作部615の撮像開始ボタンが押下されたタイミングあるいはPCから撮像開始指示を受信したタイミングで、撮像素子603に画像データの出力を指示する。ミーティングデバイス60によっては、ディスプレイ(例えば、PCやスマートフォンのディスプレイ)によるプレビュー表示機能や動画表示に対応する機能を持つ場合もある。この場合は、撮像素子603からの画像データの出力は、所定のフレームレート(フレーム/秒)によって連続して行われる。
また、撮像制御ユニット605は、後述するように、CPU611と協働して撮像素子603の画像データの出力タイミングの同期をとる同期制御手段としても機能する。なお、本実施形態では、ミーティングデバイス60にはディスプレイが設けられていないが、表示部を設けてもよい。
マイク608は、音を音(信号)データに変換する。音処理ユニット609は、マイク608a、マイク608b、マイク608cから出力される音声データをI/Fバスを通して取り込み、これらの音声データをミキシングして所定の処理を施す。音処理ユニット609はまた、マイク608a、マイク608b、マイク608cから入力される音声レベル(音量)から音源(発話者)の方向を判断する。
スピーカ619は、入力された音声データを音声に変換する。マイク608とスピーカ619は入出力手段の一例である。入出力手段は1つの構成としてまとまっている必要はなく、入力手段と出力手段を別々に構成してもよい。
CPU611は、ミーティングデバイス60の全体の動作を制御すると共に必要な処理を実行する。ROM612は、ミーティングデバイス60を動作させるための種々のプログラムを記憶している。SRAM613及びDRAM614はワークメモリであり、CPU611で実行するプログラムや処理途中のデータ等を記憶する。特にDRAM614は、画像処理ユニット604での処理途中の画像データや処理済みの正距円筒射影画像のデータを記憶する。
操作部615は、撮像開始ボタン615aなどの操作ボタンの総称である。ユーザーは操作部615を操作することで、撮像や録画を開始する他、電源ON/OFFの実行、通信接続の実行、種々の撮像モードや撮像条件などの設定を入力する。
外部機器接続I/F616は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、PC(Personal Computer)、ディスプレイ、プロジェクタ、電子黒板等である。外部機器接続I/F616は例えばUSB端子、HDMI(登録商標)端子等を備えていてもよい。DRAM614に記憶された動画データや画像データは、この外部機器接続I/F616を介して外部端末に送信されたり、外付けのメディアに記録されたりする。また、複数の外部機器接続I/F616を用い、例えば、ミーティングデバイス60で撮像し取得した画像情報をPCへUSBを介して送信して記録しながら、PCからミーティングデバイス60へ映像(例えば遠隔会議アプリで表示する画面情報など)を取得し、更にミーティングデバイス60からHDMIで他の外部機器(ディスプレイ、プロジェクタ、電子黒板等)へ送信して表示してもよい。
通信部617は、ミーティングデバイス60に設けられたアンテナ617aを介して、Wi-Fi等の無線通信技術によって、インターネット経由でクラウドサーバと通信し、記憶した動画データや画像データをクラウドサーバに送信してもよい。また、通信部617は、BLE(Bluetooth Low Energy。登録商標)やNFC等の近距離無線通信技術を用いて付近のデバイスと通信可能でもよい。
音声センサー618は、ミーティングデバイス60の周辺(水平面)の360°においてどの方向から音声が大きい音で入力されたかを特定するために、360°の音声情報を取得するセンサーである。音処理ユニット609は入力した360°の音声パラメータに基づき、最も強い方向を特定して360°における音声入力方向を出力する。
なお、他のセンサー(方位・加速度センサーやGPS等)が方位・位置・角度・加速度等を算出し、画像補正や位置情報付加に用いてもよい。
また画像処理ユニット604は、パノラマ画像の作成を次の方法で行う。CPU611は、球面映像を入力するイメージセンサーから入力されたRAWデータをBayer変換(RGB補完処理)等の所定のカメラ映像処理を行って魚眼映像(曲面の映像)を作成する。更に作成した魚眼映像(曲面の映像)に対してDeWarp処理(歪み補正処理)を行い、ミーティングデバイス60の周辺の360°が写ったパノラマ画像(平面の映像)を作成する。
CPU611は話者画像の作成を次の方法で行う。CPU611は周辺の360°が写ったパノラマ画像(平面の映像)から、話者を切り出した話者画像を作成する。CPU611は、音声センサー618及び音処理ユニット609を用いて出力した360°から特定した音声入力方向を、話者の方向として、上記パノラマ画像から話者画像を切り出す。このとき音声入力方向から人の画像を切り出す方法は、360°から特定した音声方向を中心に30°を切り取って、その中で顔検出を実施して切り出す。CPU611は、更に切り出した話者画像のうち、直近で発言のあった特定人数分(3名等)の話者画像を特定する。
パノラマ画像と、1以上の話者画像は個別に情報記録アプリ41に送信されてもよいし、ミーティングデバイス60がこれらから1枚の画像を作成して、情報記録アプリ41に送信してもよい。本実施形態では、パノラマ画像と1以上の話者画像は個別にミーティングデバイス60から情報記録アプリ41に送信されるものとする。
図6は、ミーティングデバイス60の撮像範囲を説明する図である。図6(a)に示すように、ミーティングデバイス60は水平方向に360°の範囲を撮像する。図6(b)に示すように、ミーティングデバイス60は、ミーティングデバイス60の高さに水平な方向を0°とし、上下に所定の角度を撮像範囲とする。
図7は、パノラマ画像と話者画像の切り出しを説明する図である。図7に示すように、ミーティングデバイス60が撮像する画像は球体の一部110をなすため、三次元の形状を有している。ミーティングデバイス60は、図6(b)で示したように、上下の所定角度と左右の所定角度ごとに画角を区切って透視投影変換を行う。透視投影変換を水平方向360°の全体で隙間なく行うことで、所定数の平面画像が得られるので、所定数の平面画像を左右に連結することでパノラマ画像111が得られる。また、ミーティングデバイス60はパノラマ画像から音声方向を中心に所定の範囲で顔検出を実施して、顔の中心から左右に15°(全体で30°)を切り出すことで、話者画像112を作成する。
<<電子黒板>>
図8は、電子黒板2のハードウェア構成図である。図8に示されているように、電子黒板2は、CPU(Central Processing Unit)401、ROM(Read Only Memory)402、RAM(Random Access Memory)403、SSD(Solid State Drive)404、ネットワークI/F405、及び、外部機器接続I/F(Interface)406を備えている。
これらのうち、CPU401は、電子黒板2全体の動作を制御する。ROM402は、IPL(Initial Program Loader)等のOSの起動に用いられるプログラムを記憶する。RAM403は、CPU401のワークエリアとして使用される。SSD404は、電子黒板2用のプログラム等の各種データを記憶する。ネットワークI/F405は、通信ネットワークとの通信を制御する。外部機器接続I/F406は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリ430、外付け機器(マイク440(入力手段の一例)、スピーカ450(出力手段の一例)、カメラ460)である。
また、電子黒板2は、キャプチャデバイス411、GPU412、ディスプレイコントローラ413、接触センサー414、センサコントローラ415、電子ペンコントローラ416、近距離通信回路419、及び近距離通信回路419のアンテナ419a、電源スイッチ422及び選択スイッチ類423を備えている。
これらのうち、キャプチャデバイス411は、外付けのPC(Personal Computer)470のディスプレイの表示情報を静止画又は動画として表示させる。GPU(Graphics Processing Unit)412は、グラフィクスを専門に扱う半導体チップである。ディスプレイコントローラ413は、GPU412からの出力画像をディスプレイ480等へ出力するために画面表示の制御及び管理を行う。接触センサー414は、ディスプレイ480上に電子ペン490やユーザーの手H等が接触したことを検知する。センサコントローラ415は、接触センサー414の処理を制御する。接触センサー414は、赤外線遮断方式による座標の入力及び座標の検出を行う。この座標の入力及び座標の検出する方法は、ディスプレイ480の上側両端部に設置された2つ受発光装置が、ディスプレイ480に平行して複数の赤外線を放射し、ディスプレイ480の周囲に設けられた反射部材によって反射されて、受光素子が放射した光の光路と同一の光路上を戻って来る光を受光する方法である。接触センサー414である受発光装置は、物体によって赤外線が遮断された位置(受光素子上の位置)をセンサコントローラ415に出力し、センサコントローラ415が、これらの2つの位置情報から物体の接触位置である座標位置を特定する。電子ペンコントローラ416は、電子ペン490とBluetooth通信することで、ディスプレイ480へのペン先のタッチやペン尻のタッチの有無を判断する。近距離通信回路419は、NFC(Near Field Communication)やBluetooth(登録商標)等の通信回路である。電源スイッチ422は、電子黒板2の電源のON/OFFを切り換えるためのスイッチである。選択スイッチ類423は、例えば、ディスプレイ480の表示の明暗や色合い等を調整するためのスイッチ群である。
更に、電子黒板2は、バスライン410を備えている。バスライン410は、図8に示されているCPU401等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
なお、接触センサー414は、赤外線遮断方式に限らず、静電容量の変化を検知することにより接触位置を特定する静電容量方式のタッチパネルでもよい。接触センサー414は、対向する2つの抵抗膜の電圧変化によって接触位置を特定する抵抗膜方式のタッチパネルでもよい。接触センサー414は、接触物体が表示部に接触することによって生じる電磁誘導を検知して接触位置を特定する電磁誘導方式のタッチパネルでもよい。この他、接触センサー414は種々の検出手段を用いてもよい。また、電子ペンコントローラ416が、電子ペン490のペン先及びペン尻だけでなく、電子ペン490のユーザーが握る部分や、その他の電子ペンの部分のタッチの有無を判断するようにしてもよい。
<機能について>
次に、図9を参照して、記録情報作成システム100が有する機能構成について説明する。図9は、記録情報作成システム100における端末装置10、ミーティングデバイス60、及び、情報処理システム50の機能をブロックに分けて説明する機能ブロック図の一例である。
<<端末装置>>
端末装置10で動作する情報記録アプリ41は、通信部11、操作受付部12、表示制御部13、アプリ画面取得部14、音声取得部15、デバイス通信部16、録画制御部17、音声データ処理部18、録画再生部19、アップロード部20、編集処理部21、コード解析部22、消音要求部23、音声データ解析部24、及び、ビーコンデータ解析部25を有している。端末装置10が有するこれら各部は、図4に示されている各構成要素のいずれかが、HD504からRAM503に展開された情報記録アプリ41に従ったCPU501からの命令によって動作することで実現される機能、又は機能する手段である。また、端末装置10は、図4に示されているHD504等によって構築される記憶部1000を有している。記憶部1000には情報記憶部1001が構築されている。
通信部11は、ネットワークを介して情報処理システム50と各種の情報を通信する。操作受付部12は、情報記録アプリ41に対する各種の操作を受け付ける。表示制御部13は情報記録アプリ41に設定されている画面遷移にしたがって情報記録アプリ41においてユーザーインターフェースとなる各種の画面を表示する。
アプリ画面取得部14は、ユーザーが選択したアプリが表示する画面情報、又は、デスクトップ画面の画面情報などをOS(Operating System)等から取得する。ユーザーが選択したアプリが遠隔会議アプリ42の場合、遠隔会議アプリ42が生成する画面(各拠点の端末装置カメラによる端末装置ユーザーの撮像画像、共有している資料の表示画像、参加者アイコンや参加者名等を含む画像)が得られる。アプリが表示する画面情報(アプリ画面)は、実行中のアプリケーションがウィンドウとして表示し、情報記録アプリケーションが画像として取得する情報である。アプリケーションのウィンドウは、ウィンドウの領域をデスクトップイメージ全体における領域として描画されモニター等に表示される。アプリが表示する画面情報は、OS(Operating System)のAPIや表示するアプリのAPI等を介して、他のアプリケーション(情報記録アプリケーション等)が、画像ファイルや、連続した複数の画像から構成される動画ファイルとして取得可能である。また、デスクトップ画面の画面情報は、OSが生成するデスクトップ画面の画像から構成される情報であり、同様に画像ファイルや動画ファイルとして、OSのAPIを介して取得可能である。これらの画像ファイルの形式はビットマップ、PNG、その他の形式であってもよい。また動画ファイルの形式はMP4、その他の形式でもよい。
音声取得部15は、端末装置10が遠隔会議アプリ42から遠隔会議において受信された音声データを取得する。なお、音声取得部15が取得する音声は、端末装置10が集音する音声は含まれず、遠隔会議において受信された音声データのみである点に注意されたい。ミーティングデバイス60が別に、音声を集音しているためである。
デバイス通信部16は、USBケーブルなどを利用してミーティングデバイス60と通信する。デバイス通信部16は、無線LANやBluetooth(登録商標)等でミーティングデバイス60と通信してよい。デバイス通信部16は、パノラマ画像と話者画像をミーティングデバイス60から受信し、音声取得部15が取得した音声データをミーティングデバイス60に送信する。デバイス通信部16は、ミーティングデバイス60で合成された音声データを受信する。
録画制御部17は、デバイス通信部16が受信したパノラマ画像と話者画像、及び、アプリ画面取得部14が取得したアプリの画面を結合し、結合画像を作成する。また、録画制御部17は繰り返し作成する結合画像を時系列に接続して結合画像動画を作成し、合成された音声データを結合画像動画に結合して音声付きの結合画像動画を作成する。なお、パノラマ画像と話者画像の結合は、ミーティングデバイス60が行ってもよい。また、パノラマ画像、話者画像、アプリ画面、パノラマ画像と話者画像からなる画像などの各画像からなる動画を、それぞれ別個の動画ファイルとしてストレージサービスシステム70に記憶してもよい。その場合、パノラマ動画、話者動画、アプリ画面の動画、パノラマ画像と話者画像の結合動画を、閲覧時に呼び出して1つの表示画面で表示してもよい。
音声データ処理部18は、録画制御部17が抽出する結合画像動画に結合された音声データ、又は、ミーティングデバイス60から受信した合成後の音声データの、テキストデータへの変換を情報処理システム50に要求する。
録画再生部19は、結合画像動画の再生を行う。結合画像動画は、録画中は端末装置10に保存され、その後、情報処理システム50にアップロードされる。
アップロード部20は、遠隔会議が終了すると、結合画像動画を情報処理システム50に送信する。
編集処理部21は、ユーザーの操作に応じて、結合画像動画の編集(一部の削除、つなぎ合わせ等)を実行する。
コード解析部22は、パノラマ画像に含まれる二次元コード又はバーコードを検出すると共に、二次元コード又はバーコードを解析して会議参加情報を取得する。会議参加情報は、会議で使用可能な機器であること、機器情報記憶部3001に記憶された電子黒板2の機器識別情報、会議ID(ユーザーが選択した)、電子黒板2のIPアドレス等である。機器識別情報はシリアル番号やUUID(Universally Unique Identifier)などでよい。機器識別情報はユーザーが設定したものでもよい。会議IDは会議の予約時に採番されるか、又は、録画の開始時に採番される。会議IDは遠隔会議サービスシステムが決定した会議IDと紐付けられてよい。
消音要求部23は、ミーティングデバイス60が会議参加情報を取得できると、電子黒板2に対しミュートを要求する。
音声データ解析部24は、電子黒板2が出力する音声データをスペクトル解析して(フーリエ変換して)音声データに含まれる周波数を検出し、特定の周波数を二進数のビットデータに変換することで音声信号に含まれる会議参加情報を復号する。なお、音声データ解析部24は、音声認識により会議参加情報を取得してもよい。
ビーコンデータ解析部25は、ミーティングデバイス60から送信されたビーコンデータに含まれる会議参加情報を取得する。
図10は、情報記憶部1001が記憶している動画記録情報を示す。動画記録情報は、会議ID、録画ID、更新日時、タイトル、アップロード、保存先等の各項目を有している。ユーザーが情報処理システム50にログインすると、情報記録アプリ41は情報処理システム50の会議情報記憶部5001から会議情報をダウンロードする。会議情報に含まれる会議IDなどが動画記録情報に反映される。図10の動画記録情報は、あるユーザーが操作する端末装置10が保持するものである。
・会議IDは、開催された遠隔会議を識別する識別情報である。会議IDは、会議管理システム9に遠隔会議の予定が登録された際に採番されるか、又は、情報記録アプリ41からの要求で情報処理システム50が採番する。なお会議管理システム9は、会議及び遠隔会議の予定や、遠隔会議を開始するURL(会議リンク)、会議で利用する機器の予約情報などを登録するためのシステムであり、端末装置10からネットワークを介して接続するスケジューラ等である。また会議管理システム9は登録した予定等を情報処理システム50に送信することが可能である。
・録画IDは、遠隔会議において録画された結合画像動画を識別する識別情報である。録画IDはミーティングデバイス60が採番するが、情報記録アプリ41や情報処理システム50が採番してもよい。同じ会議IDに異なる録画IDが付与されるのは、遠隔会議の途中で録画が終了したが、何らかの理由で再開した場合を示す。
・更新日時は、結合画像動画が更新された(録画が終了した)日時である。結合画像動画が編集された場合、編集された日時である。
・タイトルは、会議の会議名である。会議管理システム9への会議の登録時に設定されてもよいし、ユーザーが任意に設定してもよい。
・アップロードは、結合画像動画が情報処理システム50にアップロードされたか否かを示す。
・保存先は、ストレージサービスシステム70において、結合画像動画とテキストデータが保存されている場所(URLやファイルパス)を示す。したがって、ユーザーはアップロードされた結合画像動画を任意に閲覧できる。なお、結合画像動画とテキストデータは、例えばURLに続いて別々のファイル名で保存される。
<<ミーティングデバイス>>
図9に戻って説明する。ミーティングデバイス60は、端末通信部61、パノラマ画像作成部62、話者画像作成部63、集音部64、音声合成部65、及び、近距離無線通信部66を有している。ミーティングデバイス60が有するこれら各部は、図5に示されている各構成要素のいずれかが、ROM612からDRAM614に展開されたプログラムに従ったCPU611からの命令によって動作することで実現される機能、又は機能する手段である。端末通信部61は、USBケーブルなどを利用して端末装置10と通信する。端末通信部61は、有線ケーブルで接続されるだけでなく、無線LANやBluetooth(登録商標)等で端末装置10と通信可能であればよい。
パノラマ画像作成部62はパノラマ画像を作成する。話者画像作成部63は話者画像を作成する。これらの作成方法は図6、図7にて説明した。なお、パノラマ画像作成部62は会議参加情報が含まれる二次元コードを取得する取得部でもある。
集音部64は、ミーティングデバイス60が有するマイクが取得する音声を音声データ(デジタル)に変換する。これにより、端末装置10側の拠点でユーザーや参加者が発言した内容が集音される。なお、集音部64は会議参加情報が含まれる音声信号を取得する取得部でもある。
音声合成部65は、端末装置10から送信された音声と集音部64が集音した音声を合成する。これにより、他の拠点101で発言された音声と、自拠点102の発言がまとめられる。
近距離無線通信部66(第一の近距離無線通信部の一例)は、Bluetooth(登録商標)、Wi-Fiなどの電波(ビーコン)を受信し、復調することでデータを取り出す。なお、近距離無線通信部66は会議参加情報が含まれるビーコンデータを取得する取得部でもある。
<<情報処理システム>>
情報処理システム50は、通信部51、認証部52、画面生成部53、コミュニケーション管理部54、機器管理部55、テキスト変換部56を有する。情報処理システム50が有するこれら各部は、図4に示されている各構成要素のいずれかが、HD504からRAM503に展開されたプログラムに従ったCPU501からの命令によって動作することで実現される機能、又は機能する手段である。また、情報処理システム50は、図4に示されているHD504等によって構築される記憶部5000を有している。記憶部5000には、会議情報記憶部5001、録画情報記憶部5002、対応付け情報記憶部5003が構築される。
通信部51は、端末装置10と各種の情報を送受信する。通信部51は、例えば、遠隔会議のリストを端末装置10に送信したり、音声データの認識要求を端末装置10から受信したりする。
認証部52は、端末装置10を操作するユーザーを認証する。認証部52は、例えば、通信部51によって受信された認証要求に含まれている認証情報(ユーザーID及びパスワード)が予め保持する認証情報と一致するか否かにより、ユーザーを認証する。なお、認証情報は、ICカードのカード番号、顔や指紋などの生体認証情報等でもよい。また、認証部52は、外部の認証システムやOAUTHなどの認証方法で認証してもよい。
画面生成部53は端末装置10が表示する画面情報の生成を行う。端末装置10がネイティブアプリを実行する場合は、画面情報は端末装置10が保持しており、表示される情報がXML等で送信される。端末装置10がWebアプリを実行する場合は、画面情報は、HTML、XML、CSS(Cascade Style Sheet)、及びJavaScript(登録商標)等により作成される。
コミュニケーション管理部54は、各ユーザーのアカウント又は情報処理システム50に付与されたシステム用のアカウントで、遠隔会議に関する情報を会議管理システム9から取得する。コミュニケーション管理部54は、予約された会議の会議情報を会議IDと対応付けて会議情報記憶部に記憶させる。また、コミュニケーション管理部54は、テナントに所属するユーザーに閲覧権限がある会議情報を取得する。会議には会議IDが設定されているので、会議IDにより遠隔会議と記録情報が対応付けられる。
機器管理部55は、電子黒板2又はミーティングデバイス60の機器識別情報を受信した場合、会議に対し、会議で使用される電子黒板2とミーティングデバイス60を対応付けて対応付け情報記憶部5003に保存する。したがって、会議IDと電子黒板2の機器識別情報とミーティングデバイス60の機器識別情報が対応付けられる。会議IDには結合画像動画も対応付けられるので、オブジェクトデータと結合画像動画も対応付けられる。また、機器管理部55は、録画が終了されると(会議が終了すると)、対応付け情報記憶部5003から対応付けを削除する。
テキスト変換部56は、端末装置10からテキストデータへの変換を要求された音声データを外部の音声認識サービスシステム80を利用してテキストデータに変換する。テキスト変換部56自身が変換してもよい。
図11は、コミュニケーション管理部54が管理する、会議情報記憶部5001に記憶された会議情報の一例である。コミュニケーション管理部54は上記のアカウントを使ってテナントに所属する当該ユーザーが閲覧権限のある遠隔会議のリストを取得できる。本実施形態では、遠隔会議を例にしているが、遠隔会議のリストには1つの会議室だけで開催される会議も含まれている。なお閲覧権限は、端末装置10の情報記録アプリから直接、コミュニケーション管理部54が管理する会議情報に対して付与されてもよい。またテナントに所属するユーザーに閲覧権限がある遠隔会議の情報には、ユーザーが作成した会議の情報と、ユーザーが他のユーザーによって閲覧権限を与えられた会議の情報とが含まれる。
会議情報は会議IDで管理され、参加者、タイトル(会議名)、開始日時、終了日時、場所などと対応付けられている。これらは会議情報の一例であり、会議情報は、他にも情報を含みうる。
・参加者の項目は、会議の参加者である。
・タイトルの項目は、会議名や会議の議題など、会議の内容を表す。
・開始日時の項目は、会議が開始される予定の日時である。
・終了日時の項目は、会議が終了する予定の日時である。
・場所の項目は、会議の開催場所であり、例えば会議室や、支社名、建屋などである。
・電子黒板の項目は、会議で使用された電子黒板2の機器識別情報である。
・ミーティングデバイスの項目は、会議で使用されたミーティングデバイス60の機器識別情報である。
図10,図11に示すように、会議IDにより会議で録画された結合画像動画が特定される。
録画情報記憶部5002に記憶されている録画情報は図10と同様でよい。ただし、情報処理システム50では、テナントに所属する全てのユーザーが録画した結合画像動画のリストを有する。保存先(クラウドストレージシステムのURL等のパス情報)は、ユーザーが所望の保存先情報を端末装置10の情報記録アプリ41のユーザー設定画面等で入力し、録画情報記憶部5002に記憶してもよい。
図12は、対応付け情報記憶部5003に記憶された、会議IDに対し、電子黒板2の機器識別情報とミーティングデバイス60の機器識別情報が対応付けられた対応付け情報を示す。会議参加から会議終了(退室)までこの対応付け情報が保持される。
<<電子黒板>>
図13は、電子黒板2の機能をブロックに分けて説明する機能ブロック図である。電子黒板2は、接触位置検出部31、描画データ生成部32、データ記録部33、表示制御部34、コード生成部35、通信部36、音声データ生成部37、近距離無線通信部38、及び、I/F39を有する。電子黒板2が有する各機能は、図8に示されている各構成要素のいずれかが、SSD404からRAM403上に展開されたプログラムに従ったCPU401からの命令によって動作することで実現される機能又は手段である。
接触位置検出部31は接触センサー414に対し電子ペン490が接触した位置の座標を検出する。描画データ生成部32は電子ペン490のペン先が接触した座標を接触位置検出部31から取得する。描画データ生成部32はこの座標点列を補間することで接続してストロークデータを生成する。
表示制御部34は手書きデータ、手書きデータから変換された文字列、及び、ユーザーが操作するためのメニューなどをディスプレイに表示する。
データ記録部33は、電子黒板2に手書きされた手書きデータ、手書きデータが円や三角などに変換された図形、済などのスタンプ、PCの画面、ファイル等をオブジェクト情報記憶部3002に保存する。手書きデータ、文字列(図形も含む)、及び、PCの画面などの画像、ファイル等はオブジェクトして扱われる。手書きデータについては手書きの中断による時間的な区切り、手書き場所の違いによる距離的な区切りに応じて一まとまりのストロークデータが1つのオブジェクトとなる。
通信部36はWI-FiやLANに接続し、情報処理システム50と通信する。通信部36は、オブジェクト情報を情報処理システム50に送信したり、情報処理システム50に記憶されたオブジェクト情報を情報処理システム50から受信してディスプレイ480に表示させたりする。
コード生成部35は、会議参加情報を2次元のパターンに符号化して二次元コードを生成する。コード生成部35は会議参加情報をバーコードに符号化してもよい。なお、コード生成部35は、会議参加情報が含まれる二次元コード又はバーコードを出力する出力部でもある。
音声データ生成部37は、アルファベットと数字をそれぞれ一定時間継続する周波数に変換し、PCM変換と同様に一定間隔でサンプリングする手法で音声信号を生成する。音声データ生成部37は、例えば、アルファベットと数字をアスキーコードで表し、19kHzを二進数の0,20kHzを二進数の1に対応させる。音声信号はスピーカ450が有するD/Aコンバータでアナログに変換され、スピーカ450から出力される。なお、音声データ生成部37は会議参加情報が含まれる音声信号を出力する出力部でもある。
近距離無線通信部38(第二の近距離無線通信部の一例)は、データを変調して搬送波と合成し、ビーコンをアンテナから送信する。近距離無線通信部38は会議参加情報が含まれるビーコンを送信する出力部でもある。
調整部39は、端末装置10等からの要求に応じて、電子黒板2のマイク440又はスピーカ450の少なくとも一方の音量を調整する。調整部39は、マイク440又はスピーカ450を例えばミュートする。
また、電子黒板2は、図8に示されているSSD404等によって構築される記憶部3000を有している。記憶部3000には機器情報記憶部3001とオブジェクト情報記憶部3002が構築されている。
図14は、機器情報記憶部3001に記憶されている機器識別情報等を示す。
・機器識別情報は、電子黒板2の機器識別情報である。
・IPアドレスは、他の装置がネットワークを介して電子黒板2と接続するためのIPアドレスである。
・パスコードは電子黒板2に他の装置が接続する際の認証に使用される。
図15は、オブジェクト情報記憶部3002に保存されているオブジェクト情報を説明する図である。オブジェクト情報は、電子黒板2が表示するオブジェクトを管理する情報である。オブジェクト情報は情報処理システム50に送信され議事録として使用される。遠隔会議の開催時に他の拠点に電子黒板2が配置されている場合、オブジェクト情報が共有される。
・会議IDは、情報処理システム50から通知された会議の識別情報である。
・オブジェクトIDはオブジェクトを識別する識別情報である。
・種別はオブジェクトの種類であり、手書き、文字、図形、画像、等がある。手書きはストロークデータ(座標点列)である。文字は手書きデータから変換された文字列(文字コード)である。文字列をテキストデータという場合もある。図形は、三角や四角など手書きデータから変換された幾何学的な形状である。画像は、PCやインターネットなどから取り込まれたJpeg、Png、TIFFなどの画像データである。
・電子黒板2の1画面をページと称する。ページの項目はそのページ番号である。
・座標は、電子黒板2の所定の原点を基準とするオブジェクトの位置を示す。オブジェクトの位置は例えばオブジェクトの外接矩形の左上頂点である。座標は例えば、ディスプレイの画素単位で表される。
・サイズはオブジェクトの外接矩形の幅と高さである。
<ミュートの手順>
以下では、いくつかのミュートの手順を説明する。なお、ミーティングデバイス60と電子黒板2はいずれも電源が入っており、かつ、ネットワークに接続されていることを前提としている。
<<ミュートの手順1>>
図16は、会議への参加に応じて、電子黒板2が音声入出力をミュートする処理の流れを示すシーケンス図である。
S1:まず、ユーザーは端末装置10で動作する情報記録アプリ41に会議参加を指示する。情報記録アプリ41の操作受付部12が会議参加を受け付ける。会議参加とは、会議を指定してその旨を情報処理システム50に送信することをいう。会議の参加により、対応付け情報において、会議IDに、ミーティングデバイス60の機器識別情報が対応付けられる。また、図46で後述する録画開始の操作が会議参加を兼ねてもよい。会議への参加要求がミュート制御(二次元コードの検知)の開始となる場合がある。なお、遠隔会議サービスシステムへの会議は、ミュート制御における会議参加とは別に行われる。会議参加画面の一例を図17に示す。
S2:情報記録アプリ41の通信部11は、ユーザーが選択した会議IDを指定して参加要求(参加する旨)を情報処理システム50に送信する。通信部11は、ミーティングデバイス60の機器識別情報を送信する。情報処理システム50の通信部51が会議参加(会議ID、ミーティングデバイス60の機器識別情報)を受信する。機器管理部55は、ミーティングデバイス60の機器識別情報と会議IDを対応付けて保存する(端末装置10のIPアドレスも把握される)。
この会議IDは、会議管理システム9により管理される会議IDであるが、遠隔会議サービスシステム90が管理のために採番した会議IDでもよい。これにより、遠隔会議サービスシステム90に登録された会議と使用された機器とが紐付けられる。
なお、遠隔会議アプリ42は、別途、ユーザーの操作に応じて、遠隔会議サービスシステム90と通信して、画像及び音声の送受信を開始する。
S3:会議への参加が完了すると、端末装置10は、同じ会議室内に同じ会議に参加している機器が存在するかどうかを検知するための処理(機器検知処理)を開始する。ここでは、機器の検知はカメラによる撮像によって行う。デバイス通信部16は撮像開始をミーティングデバイス60に要求する。
S4:ミーティングデバイス60の端末通信部61は撮像開始を受信し、パノラマ画像作成部62がパノラマ画像の生成を繰り返し行う。
S5:次に、ユーザーは電子黒板2を操作して会議アプリを起動し、会議参加を指示する。電子黒板2の接触位置検出部31が会議参加を受け付ける。会議への参加要求がミュート制御(二次元コードの表示)の開始となる場合がある。会議参加指示の方法は端末装置10の場合と同様でよい。
S6:電子黒板2の通信部36は、ユーザーが選択した会議IDを指定して参加要求(参加する旨)を情報処理システム50に送信する。通信部36は、電子黒板2の機器識別情報を送信する。情報処理システム50の通信部51が会議参加(会議ID、電子黒板2の機器識別情報)を受信する。機器管理部55は、電子黒板2の機器識別情報と会議IDを対応付けて対応付け情報として保存する(電子黒板2のIPアドレスも把握される)。電子黒板2とミーティングデバイス60が対応付けられるので、電子黒板2が会議IDと共にオブジェクトデータを情報処理システム50に送信すると、同じ会議の議事録としてオブジェクトデータと結合画像動画を対応付けて保存できる。
S7:会議への参加が完了すると、電子黒板2のコード生成部35が、会議参加情報(会議で使用可能な機器であること、電子黒板2の機器識別情報、会議ID、電子黒板2のIPアドレス)を含む二次元コードを生成する。表示制御部34は、二次元コードを一定時間表示する。二次元コードの表示例を図18に示す。一定時間(例えば数秒から数分)とするのは、二次元コードが会議の邪魔にならないようにするためである。なお、会議参加情報には、端末装置10が電子黒板2と通信する経路に応じて、電子黒板2の機器識別情報、又は電子黒板2のIPアドレスのどちらかが含まれればよい。
S8:ミーティングデバイス60のパノラマ画像作成部62は、二次元コードが含まれるパノラマ画像を生成する。端末通信部61はパノラマ画像を端末装置10に送信する。
なお、二次元コードに、電子黒板が今ミュート状態なのか否かが含まれている場合、ミーティングデバイス60が自身のマイク又はスピーカをミュートしてもよい。ハウリングの防止には、ミーティングデバイス60の音声入力若しくは出力、又は、電子黒板の音声の入力若しくは出力がミュートされればよい。二次元コードによりミーティングデバイス60がミュート否(=音量有)状態の電子黒板の存在に気づいたのであれば、ミーティングデバイス60が自らをミュートにすればよい。
S9:端末装置10のデバイス通信部16がパノラマ画像を受信すると、コード解析部22がパノラマ画像を監視し、会議で使用される機器である旨を持った二次元コードが含まれるかどうか(会議参加情報の有無)を常に判断する。コード解析部22は、二次元コードが含まれていない場合には何もせず、二次元コードが含まれるまで監視状態で待ち受けを続ける。
会議で使用される機器である旨を含む二次元コードが含まれる場合、情報記録アプリ41が電子黒板2の存在を検知する。消音要求部23は、二次元コードに含まれる会議IDとステップS2で選択された会議IDを比較して、電子黒板2がミーティングデバイス60と同一の会議に参加しているかどうかを判断する。こうすることで、同じ会議室の複数の機器が異なる会議に対応付けられることを抑制できる。なお、ステップS9の判断はミーティングデバイス60によっても可能である。
S10:ミーティングデバイス60が電子黒板2と同一の会議に参加している場合には、消音要求部23は、通信部11を介して、電子黒板2のIPアドレスを宛先に、電子黒板2に対してマイク440又はスピーカ450の少なくとも一方にミュートを要求(調整要求の一例)する。端末装置10と電子黒板2が同じLAN(ネットワークアドレスが同じ、同じSSIDに接続)に接続している場合、電子黒板2のIPアドレスがあれば通信できる。なお、会議参加情報に認証用のパスコードが含まれていてもよく、この場合、消音要求部23はパスコードも電子黒板2に送信するとよい。ミュートの指示方法の好適な例として、電子黒板2が公開しているWebAPI(Application Programming Interface)を利用することが挙げられるが、方法はこれに限定されない。
ステップS10では、電子黒板2が端末装置10からミュート要求を受信しているが、ミーティングデバイス60から直接、ミュート要求を受信してもよい。
S11:電子黒板2の通信部36がミュート要求を受信し、調整部39がマイク440又はスピーカ450の少なくとも一方をミュート状態に変更する。また、ミュート状態に変更したので、表示制御部34は、二次元コードの表示を終了する。ミュート状態になった電子黒板2が表示する画面を図27に示す。
なお、ミーティングデバイス60と電子黒板2が互いに別の会議室に設置されていた場合や別の会議に参加していた場合など、電子黒板2がミュート要求を受信しない場合、電子黒板2は二次元コードを表示してから一定時間(例えば1分間など)が経過すると二次元コードの表示を終了する。この場合、ミュートも行われない。これにより、二次元コードが表示されたままになってしまうことを防ぐことができる。二次元コードの表示時間はユーザーが設定できてよい。
また、端末装置10の二次元コードの監視処理は、例えば、一定時間(10分間など)経過後に終了してもよいが、終了すると終了後に会議参加した機器を検知できないため、本実施形態では監視状態を続けるものとしている。
また、図16では、ユーザーが先に端末装置10を会議に参加させているが、電子黒板2を先に会議参加させたり、同時に参加させたりしてもよい。
図17は、端末装置10が表示する会議参加画面300の一例である。会議参加画面300は、会議情報を表示する画面であり、参加ボタン301を有している。ユーザーが参加ボタン301を押下すると、会議IDを指定した会議参加が情報処理システム50に送信される。
図18は、電子黒板2が表示する二次元コード8の一例である。図18では、大きな二次元コード8が1つ表示されている。ミーティングデバイス60が二次元コード8を検出しやすい。以下では、二次元コード8の表示方法を説明する。
図19は、電子黒板2が表示する二次元コード8の位置の一例である。上記のように、二次元コード8には機器識別情報と機器識別情報である旨が含まれる。ミーティングデバイス60が置かれた机には、ミーティングデバイス60と電子黒板2の間に障害物69がある。なお、二次元コード8の検出においてはミーティングデバイス60が全天球カメラでなくてもよい。電子黒板2は、機器識別情報を、上下方向における電子黒板2の表示画面の中心線320よりも上方に表示させる。こうすることで、ミーティングデバイス60と電子黒板2の間に障害物69があったとしても、ミーティングデバイス60が機器識別情報を撮像しやすくなる。
なお、図20に示すように、電子黒板2は、二次元コード8の中心を、上下方向における電子黒板2の表示画面の中心線320よりも上方に表示させてもよい。
また、図21に示すように、電子黒板2が時間に応じて二次元コード8を移動させてもよい。図21では、二次元コード8が左から右に移動している。電子黒板2は二次元コード8を表示させたまま移動してもよいし、表示→消去→場所を変えて再表示、してもよい。これにより、障害物69の位置が不確定でも、ミーティングデバイス60が機器識別情報を撮像しやすくなる。また、ユーザーへの圧迫感を低下させるために電子黒板2が二次元コード8を小さく表示した場合でも、ミーティングデバイス60が撮像しやすくなる。
更に、電子黒板2は二次元コード8を移動させながら二次元コード8のサイズを変更してもよい。
また、図22に示すように、電子黒板2が複数の二次元コード8を同時に表示させてもよい。これにより、一部の二次元コード8が障害物69で隠れたとしても、残りの二次元コード8をミーティングデバイス60が撮像しやすくなる。なお、複数の二次元コード8は、すべて同じ情報が格納されたものであっても良いし、互いに異なる情報が格納されてもよい。
また、図23に示すように、電子黒板2がメニュー71の隣(近接して)に二次元コード8を表示してもよい。メニュー71は右端の上下方向にわたって配置されており、上下方向における電子黒板2の表示画面の中心線よりも上方に表示させる点は図19と同様である。
二次元コード8がメニュー71の近くに表示されることで、ユーザーが違和感を生じにくい。ユーザーが画面を広く使用できる。
また、図24に示すように、電子黒板2がメニュー71内に二次元コード8を表示してもよい。図23と比較して、更に圧迫感を解消しやすく、ユーザーが画面を広く使用できる。
図25は、ミーティングデバイス60が有するカメラが半球カメラである場合を説明する図である。図19~図24の構成を、水平方向の視野が広い半球カメラで撮像することで、二次元コード8の発見をより容易にすることができる。
なお、二次元コード8でなくバーコードの場合も図19~図25と同様に表示できる。図26はバーコード7の一例である。
なお、バーコード7に関しては二次元コード8よりも傾き等に対するロバスト性が低い。このため、コード解析部22は、白黒のパターンを切り取り、スキュー角及びピッチ角を補正する。コード解析部22は、黒のバーのエッジ強調を行う。コード解析部22は、切り出した画像についてバーコード7のパターンとして登録されているスタートキャラクタから右端のストップキャラクタまでのパターンとパターンマッチングして、電子黒板2が表示しているバーコード7を検出する。
また、図19~図26では、二次元コード8又はバーコード7が表示される例を説明したが、機器識別情報(アルファベットや数字)を電子黒板2が表示し、情報記録アプリ41がOCR処理で機器識別情報を検出してもよい。
図27は、ミュート後に電子黒板2が表示する画面310の表示例を示す。図27にはミュートアイコン311が表示されている。ユーザーはミュートアイコン311により、現在、電子黒板2がミュート状態であることを把握できる。
<<ミュートの手順2>>
図28は、会議への参加に応じて、電子黒板2が音声入出力をミュートする処理の流れを示すシーケンス図である。ミュートの手順2では、ミーティングデバイス60が音声信号によって電子黒板2を検知する。図28の説明では、主に図16との相違点についてのみ説明する。まず、ステップS21,S22、S25,S26に示す、会議参加までの処理は図16のステップS1,2,5,6と同様である。
S23:会議への参加が完了すると、端末装置10は、同じ会議室内に同じ会議に参加している機器が存在するかどうかを検知するための処理を開始する。ここでは、機器の検知は音声信号によって行う。デバイス通信部16は集音開始をミーティングデバイス60に要求する。
S24:ミーティングデバイス60の端末通信部61は集音開始を受信し、集音部64が音声の集音を繰り返し行う。
S27:会議への参加が完了すると、電子黒板2の音声データ生成部37が、会議参加情報を含む音声信号を生成し、スピーカ450から出力する。音声信号のフォーマットを図29に示す。図29に示すように、音声信号は、音声信号の先頭を示すプリアンブル、電子黒板2の機器識別情報、IPアドレス及び参加中の会議IDを含む。機器識別情報とIPアドレスはいずれか一方があればよい。
S28:ミーティングデバイス60の集音部64は音声信号が含まれる音声データを生成する。端末通信部61は音声データを端末装置10に送信する。
S29:端末装置10のデバイス通信部16が音声データを受信すると、音声データ解析部24が音声データを解析し、会議で使用される機器である旨が含まれるかどうかを常に判断する。なお、ステップS29の処理はミーティングデバイス60において行ってもよい。
会議で使用される機器である旨が含まれる場合、情報記録アプリ41が電子黒板2の存在を検知する。消音要求部23は、音声信号に含まれる会議IDをもとに電子黒板2がミーティングデバイス60と同一の会議に参加しているかどうかを判断する。以降の処理は図16と同様でよい。
なお、音声による検知ではディスプレイによる表示やカメラによる撮像が不要となるため、電子黒板2がミーティングデバイス60を検知し、ミーティングデバイス60及び端末装置10をミュートすることも可能である。この場合、ミーティングデバイス60と電子黒板2の役割が逆になる。また、電子黒板2がミーティングデバイス60を検知した後に、電子黒板2自身をミュートすることも可能である。
<<ミュートの手順3>>
図30は、会議への参加に応じて、電子黒板2が音声入出力をミュートする処理の流れを示すシーケンス図である。ミュートの手順3では、ミーティングデバイス60が近距離無線通信によって電子黒板2を検知する。図30の説明では、主に図16との相違点についてのみ説明する。まず、ステップS41,S42、S45,S46に示す、会議参加までの処理は図16のステップS1,2,5,6と同様である。
S43:会議への参加が完了すると、端末装置10は、同じ会議室内に同じ会議に参加している機器が存在するかどうかを検知するための処理を開始する。ここでは、機器の検知は近距離無線通信によって行う。デバイス通信部16はビーコン検知開始をミーティングデバイス60に要求する。
S44:ミーティングデバイス60の端末通信部61はビーコン検知開始を受信し、近距離無線通信部66がビーコンの受信を繰り返し行う。
S47:会議への参加が完了すると、電子黒板2の近距離無線通信部38が、会議参加情報を含むビーコンを生成し、アンテナから出力する。ビーコンに含まれる信号のフォーマットは図29と同様でよい。ビーコンとは、所定の情報を繰り返し送信する無線の電波又は送信することをいう。ビーコンで使用される周波数や通信プロトコルはどのようなものでもよい。例えばBluetooth Low Energy(登録商標)のアドバタイズパケットが知られている。
S48:ミーティングデバイス60の近距離無線通信部66はビーコンを復調してビーコンデータを生成する。端末通信部61はビーコンデータを端末装置10に送信する。
S49:端末装置10のデバイス通信部16がビーコンデータを受信すると、ビーコンデータ解析部25がビーコンデータを解析し、会議で使用される機器である旨が含まれるかどうかを常に判断する。なお、ステップS49の処理はミーティングデバイス60において行ってもよい。
会議で使用される機器である旨が含まれる場合、情報記録アプリ41が電子黒板2の存在を検知する。消音要求部23は、会議参加情報に含まれる会議IDをもとに電子黒板2がミーティングデバイス60と同一の会議に参加しているかどうかを判断する。以降の処理は図16と同様でよい。
<<ミュートの手順4>>
図31は、会議への参加に応じて、電子黒板2が音声入出力をミュートする処理の流れを示すシーケンス図である。ミュートの手順4は、機器検知の開始をユーザーからの指示によって開始する。図31の説明では、主に図16との相違点についてのみ説明する。まず、ステップS61~S64に示す、会議参加までの処理は図16のステップS1,2,5,6と同様である。ただし、端末装置10及び電子黒板2のいずれも会議参加を受けると会議参加のみを行い、会議参加完了時点で自動的にミュート制御(二次元コードの検知、表示)を行うことはしない。
S65:ユーザーは情報記録アプリ41を操作し、機器検知処理の開始を指示する。操作受付部12が指示を受け付ける。機器検知開始画面の一例を図32に示す。
S66:情報記録アプリ41の通信部11は、会議ID又はミーティングデバイス60の機器識別情報を指定して情報処理システム50に対して機器検知開始要求を送信する。
S67、S68:情報処理システム50の通信部51が、機器検知開始要求を受信する。これにより、機器管理部55が、対応付け情報において会議ID又はミーティングデバイス60の機器識別情報により特定される、会議参加中のミーティングデバイス60(端末装置10)と電子黒板2に対して、通信部51を介して、機器検知開始要求を送信する。なお、情報処理システム50は電子黒板2からのポーリングへの応答で機器検知開始要求を送信してもよいし、Webソケットなどの双方向通信を利用して送信してもよい。
これにより、電子黒板2が二次元コードを表示し、ミーティングデバイス60が撮像する。以降のステップS69~S75の処理は、図16のステップS3,4、7~11と同様になる。
なお、図31の処理において、二次元コードでなく、ミュートの手順2,3のように音声信号又はビーコンにより機器検知が行われてよい。
図32は、端末装置10が表示する機器検知開始画面330の一例を示す。機器検知開始画面330は、「ハウリング防止のため、同一の会議室に設置されている端末を検知し、検知した端末をミュートします」というメッセージ331、及び、開始ボタン332を有する。ユーザーは開始ボタン332を押下することで、機器検知処理の開始を指示する。
ミュートの手順4では、ユーザーの指示によって参加中のミーティングデバイス60と電子黒板2が一斉に機器検知処理を開始するため、各機器の会議参加のタイミングが大きく異なっていても端末検知による自動ミュートが可能になる。例えば、ユーザーが電子黒板2を先に会議参加させ、その数分後にミーティングデバイス60を会議参加させるような場合でも電子黒板2のミュートが可能である。また、端末検知が不要な場合にはユーザーが開始指示を実施しなければ無駄に機器検知が実施されることもない。
<<ミュートの手順5>>
図33は、会議への参加に応じて、電子黒板2が音声入出力をミュートする処理の流れを示すシーケンス図である。ミュートの手順5は、機器検知開始を電子黒板2が会議参加したことを起点に開始する。図33の説明では、主に図16との相違点についてのみ説明する。まず、ステップS81~S84に示す、会議参加までの処理は図16のステップS1,2,5,6と同様である。ただし、端末装置10は会議参加を受けると会議参加のみを行い、会議参加完了時点でミュート制御(二次元コードの検知)を行うことはしない。
S85:電子黒板2は会議参加指示を受け、会議参加が完了すると、表示制御部34が会議参加情報を含む二次元コードを表示する。
S86:また、情報処理システム50の機器管理部55は、ミーティングデバイス60と電子黒板2の会議参加が完了すると、通信部51を介して、端末装置10に対し二次元コードの取得開始(機器検知開始要求)を送信する。
S87:情報記録アプリ41の通信部11が機器検知開始要求を受信することで、デバイス通信部16がパノラマ画像の撮像開始をミーティングデバイス60に要求する。電子黒板2は二次元コードを表示中であるため、端末装置10は電子黒板2を検知する。以降のステップS88~S92の処理は図16のS4,8~11と同様でよい。
なお、図33において、二次元コードでなく、ミュートの手順2,3のように音声信号又はビーコンにより機器検知が行われてよい。
また、図33では先にミーティングデバイス60が会議参加しているが、電子黒板2が先に会議に参加した場合も同様に適用可能である。この場合、電子黒板2が情報処理システム50からミーティングデバイス60の会議参加通知を受信後に二次元コードを表示する。
また、ミュートの手順5では、2つめの機器が会議参加する度に適宜、機器検知処理を実行するため、機器の参加のタイミングの影響を受けることなく、かつ、ユーザーからの指示も不要で端末検知による自動ミュートが可能になる。
<<ミュートの手順6>>
図34は、会議への参加に応じて、電子黒板2が音声入出力をミュートする処理の流れを示すシーケンス図である。ミュートの手順6は、端末装置10から電子黒板2に対して直接ミュート指示を送信するのではなく、情報処理システム50を経由して電子黒板2をミュートする。図34の説明では、主に図16との相違点についてのみ説明する。まず、ステップS101~S109の処理は図16のS1~S9と同様である。
S110:情報記録アプリ41のコード解析部22が電子黒板2を検知すると、消音要求部23が通信部11を介して、情報処理システム50に対して電子黒板2のミュートを要求する。ミュート要求には、情報処理システム50が電子黒板2と通信するために、電子黒板2の機器識別情報が添付される。
S111:情報処理システム50の通信部51はミュート要求を受信すると、機器識別情報で特定される電子黒板2に対してミュート要求を送信する。例えば、電子黒板2が会議参加後、機器識別情報を指定したポーリングを繰り返しており、情報処理システム50がポーリングへの応答としてミュート要求を送信する。あるいは、例えば、電子黒板2が会議参加後、電子黒板2と情報処理システム50がWebソケットなどの双方向通信で通信しておき(機器識別情報が送信される)、情報処理システム50が機器識別情報で特定される電子黒板2にミュート要求を送信する。
S112:電子黒板2の通信部36はミュート要求を受信すると、調整部39がマイク440又はスピーカ450の少なくとも一方をミュートする。
なお、図34において二次元コードでなく、ミュートの手順2,3のように音声信号又はビーコンにより機器検知が行われてよい。
ミュートの手順6では、端末装置10が情報処理システム50経由でミュートを行うため、端末装置10と電子黒板2が直接通信できない環境であっても、電子黒板2に対してミュート要求を送信することができる。
<<ミュートの手順7>>
図35は、会議への参加に応じて、電子黒板2が音声入出力をミュートする処理の流れを示すシーケンス図である。ミュートの手順7は、電子黒板2のマイク440又はスピーカ450の少なくとも一方をミュートするのではなく、遠隔会議サービスシステム90が電子黒板2に対する音声送受信を停止する。図35の説明では、主に図16との相違点についてのみ説明する。まず、ステップS121~S129の処理は図16のS1~S9と同様である。
S130:情報記録アプリ41のコード解析部22が電子黒板2を検知すると、消音要求部23が通信部11を介して、情報処理システム50に対して電子黒板2のミュートを要求する。ミュート要求には電子黒板2の機器識別情報又はIPアドレスが添付される。
S131:情報処理システム50の通信部51はミュート要求を受信すると、電子黒板2の機器識別情報又はIPアドレスを指定して、ミュート要求を遠隔会議サービスシステム90に送信する。
S132:遠隔会議サービスシステム90は、他の拠点から、電子黒板2の機器識別情報又はIPアドレスで特定される電子黒板2に対する音声を送信せず、また、電子黒板2が送信した音声を他の拠点に送信しない。これにより、電子黒板2がミュートしているのと同じ状態となる。
なお、図35において二次元コードでなく、ミュートの手順2,3のように音声信号又はビーコンにより機器検知が行われてよい。
ミュートの手順7では、遠隔会議サービスシステム90側でミュート状態にするため、電子黒板2のデバイス自体の設定を変更する必要がない。
<<ミュートの手順8>>
図36は、会議への参加に応じて、電子黒板2が音声入出力をミュートする処理の流れを示すシーケンス図である。ミュートの手順8は、会議開始時に電子黒板2が既にミュート状態であった場合、機器検知のための処理を実施しない。図36の説明では、主に図16との相違点についてのみ説明する。まず、ステップS1~S6の処理は図16のS1~S6と同様である。
S170:電子黒板2の通信部36が会議参加を情報処理システム50に送信すると、調整部39が、自身がミュート状態(調整状態)かどうか判断する。
既に調整状態となっていた場合、表示制御部34は、二次元コードの表示は実施せず、調整状態ではなかった場合にのみ二次元コードを表示して、ミュートの手順1と同様の処理を行う。なお、端末装置10は二次元コード以外に参加者を撮像するため、ミーティングデバイス60の撮像を継続してよい。あるいは、端末装置10は会議参加後、一定時間で、ミーティングデバイス60の撮像を終了してよい。
なお、二次元コードでなく、ミュートの手順2,3のように音声信号又はビーコンにより機器検知が行われてよい。
ミュートの手順8により、電子黒板2が会議参加時に既にミュート状態である場合、無駄な処理が実行されることを防ぐことができる。
<ミュートの解除>
続いて、いくつかのミュートの解除方法を説明する。
<<ミュートの解除1>>
図37は、電子黒板2が会議の退出時にミュートを解除する処理の流れを示すシーケンス図である。会議の退出により、電子黒板2が表示すオブジェクトデータは他の拠点と共有されず、記録されない。図37の説明では、電子黒板2が会議参加時にマイク440又はスピーカ450の少なくとも一方をミュート状態にしている。
S141:ユーザーが電子黒板2に対して会議退出指示を行う。操作受付部12が指示を受け付ける。会議退出指示画面の一例を図38に示す。
S142:電子黒板2の通信部36はユーザーの指示に応じて、会議IDを指定し会議の終了(退室)を情報処理システム50に送信する。情報処理システム50の通信部51は会議終了を受信し、機器管理部55が会議IDで特定される対応付け情報を削除する。
S143:電子黒板2の調整部39は、会議終了というユーザーの指示に応じて、ミュート状態を解除し、会議参加前の音量設定に戻す。
なお、端末装置10に関しては、ユーザーが別途、会議終了の操作を行う。これにより、機器管理部55がミーティングデバイス60の機器識別情報を対応付け情報から削除する。端末装置10に関して、ミュートに関する処理は発生しない。
図38は、電子黒板2が表示する会議退出指示画面340の一例を示す。会議退出指示画面340は、「会議から退出しますか?」というメッセージ341、退出ボタン342、及び、キャンセルボタン343を有している。ユーザーが退出ボタン342を押下することで、ユーザーが電子黒板2に対して会議退出指示を行う。
ミュートの解除1により、会議参加時にミュートされた電子黒板2がユーザーの意図に反してミュートされたままになってしまうことを防ぐことができる。なお、ミュートの解除1はミュートの手順7を除いてどの方法でミュートされていても適用できる。
<<ミュートの解除2>>
図39は、端末装置10が会議を退出時に電子黒板2のミュートを解除する処理の流れを示すシーケンス図である。図39の説明では、端末装置10が会議参加時に電子黒板2に対してミュート状態にした。
S151:ユーザーが情報記録アプリ41に対して会議退出指示を行う。操作受付部12が指示を受け付ける。
S152:情報記録アプリ41の通信部11は、IPアドレスを宛先に電子黒板2に対してミュート解除要求を送信する。
S153:電子黒板2の通信部36はミュート解除要求を受信すると、調整部39がミュート状態を解除し、会議参加前の音量設定に戻す。
S154:情報記録アプリ41の通信部11は、会議IDを指定して会議の終了(退室)を情報処理システム50に送信する。情報処理システム50の通信部51は、会議IDで特定される対応付け情報(ミーティングデバイス60と電子黒板2の機器識別情報)を削除する。
なお、図39では、端末装置10が電子黒板2に直接ミュート解除指示を送信しているが、端末装置10が情報処理システム50を介して電子黒板2をミュートした場合、端末装置10が情報処理システム50を介して電子黒板2にミュート解除要求を送信してもよい。
図39によれば、端末装置10が電子黒板2より先に会議を退出した場合に、電子黒板2がミュートされたままになって会議が継続できなくなってしまうことを防ぐことができる。また、ユーザーは端末装置10のみに会議退出の操作を行えばよい。なお、ミュートの解除2はどの方法でミュートされていても適用できる。
<<ミュートの解除3>>
図40は、端末装置10と情報処理システム50との通信が切断された場合に電子黒板2のミュートを解除する処理の流れを示すシーケンス図である。図40の説明では、端末装置10が会議参加時に電子黒板2に対してミュート状態にした。
S161、S162:会議の開催中、情報処理システム50の通信部51は端末装置10との通信を監視しており(例えばPingコマンドを送信する)、ネットワーク接続不良などによって切断されると、情報処理システム50は端末装置10との通信切断を検知する。なお、通信切断には、端末装置10がシャットダウンしたりフリーズしたりすることも含まれる。
S163:通信切断を検知すると、機器管理部55は、端末装置10からの指示によってミュート状態となっている電子黒板2に対してミュート解除指示を送信する。ミュートが解除される電子黒板2は、会議開始を通知した電子黒板2であり、情報処理システム50が機器識別情報やIPアドレス等を保持している。
S164:電子黒板2の通信部36はミュート解除指示を受信すると、調整部39がミュート状態を解除し、会議参加前の音量設定に戻す。
図40の処理では、端末装置10との通信が切断された場合、電子黒板2がミュート状態のままになって会議が継続できなくなってしまうことを防ぐことができる。なお、ミュートの解除1はどの方法でミュートされていても適用できる。
<電子黒板2における機器検知の終了>
ミュートの手順1等では、電子黒板2に対してミュート要求が送信されなくても、電子黒板2は二次元コードを表示してから一定時間経過後に二次元コードの表示を終了する。したがって、電子黒板2がミュート要求を受信しない場合、一定時間内は二次元コードが表示されたままとなるおそれがある。そこで、時間経過ではなくユーザーが電子黒板2を利用開始した時点で、電子黒板2が二次元コードの表示を終了する。
図41は、電子黒板2が起動してからミュート要求を受信せずに二次元コードの表示を終了する処理を示すシーケンス図である。ステップS181~S183の処理は図16のステップS5~7と同様でよい。
S184:ユーザーが電子黒板2を利用する。利用開始の判断方法として、ユーザーが電子黒板2の画面に手や電子ペンでタッチした場合がある。
S185:また、利用開始の判断方法として、端末装置10が電子黒板2に画面を表示する場合がある。利用開始の判断方法は、これらに限定されるものではない。
S186:端末装置10はHDMI(登録商標)ケーブル等を介して画面を電子黒板2に送信する。
S187:電子黒板2の表示制御部34は、一定時間が経過する前でも、利用開始を検知すると、二次元コードの表示を終了する。この場合、ミーティングデバイス60と電子黒板2の対応付けが行われない。しかし、図31のように、端末装置10が会議参加することで、情報処理システム50が機器検知の開始を行う場合には、電子黒板2が再度、二次元コードを表示するので、ミーティングデバイス60と電子黒板2の対応付けが行われる。
なお、図41において、二次元コードでなく、ミュートの手順2,3のように音声信号又はビーコンにより機器検知が行われた場合も、同様に機器検知を終了できる。
図41の処理では、ユーザーが電子黒板2を利用開始したタイミングで機器検知処理が終了するため、例えば二次元コードが会議の妨げになってしまうことを防止できる。
<会議中の録画>
続いて、図42~図45を参照して、端末装置10が遠隔会議中に表示するいくつかの画面について説明する。図42は、端末装置10で動作する情報記録アプリ41が表示するログイン後の初期画面200である。端末装置10のユーザーが情報記録アプリ41を情報処理システム50に接続させる。ユーザーが認証情報を入力してログインに成功すると、図42の初期画面200が表示される。
初期画面200は、固定表示ボタン201、正面変更ボタン202、パノラマ画像203、1つ以上の話者画像204a~204c(以下、区別しない場合、話者画像204という)、及び、記録開始ボタン205を有している。ログイン時にすでにミーティングデバイス60が起動して、周囲を撮像している場合、初期画面200にミーティングデバイス60が作成するパノラマ画像203、及び話者画像204が表示される。したがって、ユーザーはこれらを見ながら、記録開始するかどうか決めることができる。ミーティングデバイス60が起動していない(撮像していない)場合、パノラマ画像203と話者画像204は表示されない。
なお、情報記録アプリ41は、パノラマ画像203から検出された全ての顔に基づく全ての参加者の話者画像204を表示してもよいし、直近に発言したN人の話者画像204のみを表示してもよい。図42では、最大3人まで話者画像204が表示される例を示す。参加者が発言するまでの間、話者画像204がなくてもよいし(発言に応じて一人ずつ増える)、所定の方向の参加者の3人の話者画像204が表示されてもよい(発言に応じて入れ替わる)。
なお、ミーティングデバイス60が起動した直後など、誰も発言していない場合、水平360°のうちの予め決められた方向( 0°、120°、240°など)を話者画像204として作成する。後述する固定表示が設定されている場合は、固定表示の設定が優先される。
固定表示ボタン201は、パノラマ画像203のある領域を話者画像204として固定でクローズアップする操作をユーザーが行うためのボタンである。
正面変更ボタン202は、パノラマ画像203の正面を変更する操作をユーザーが行うためのボタンである(パノラマ画像は水平方向に360°写っているので、右端と左端の方向が一致する)。ユーザーはポインティングデバイスでパノラマ画像203を左右にスライドさせて、正面に写る参加者を決定できる。ユーザーの操作はミーティングデバイス60に送信され、ミーティングデバイス60は、水平方向360°のうち正面にする角度を変更してパノラマ画像を作成し、端末装置10に送信する。
ユーザーが記録開始ボタン205を押下すると情報記録アプリ41が図43の録画設定画面210を表示する。
図43は、情報記録アプリ41が表示する録画設定画面210の一例である。録画設定画面210では、ミーティングデバイス60が作成したパノラマ画像及び話者画像、並びに、端末装置10のデスクトップ画面又は動作するアプリの画面、を録画するかをユーザーが(録画に含めるか)設定できる。パノラマ画像及び話者画像、及び、デスクトップ画面又は動作するアプリの画面のどちらも、情報記録アプリ41が録画しない場合は音声(端末装置10が出力する音声+ミーティングデバイス60が集音した音声)のみ記録される。
カメラトグルボタン211は、ミーティングデバイス60が作成したパノラマ画像及び話者画像の録画のオンとオフを切り替えるボタンである。カメラトグルボタン211は、パノラマ画像と話者画像を個別に録画する設定が可能でもよい。
PC画面トグルボタン212は、端末装置10のデスクトップ画面、端末装置10で動作するアプリの画面の、録画のオンとオフを切り替えるボタンである。PC画面トグルボタン212がオンの状態で、デスクトップ画面が録画される。
ユーザーがアプリの画面を録画したい場合、更に、アプリ選択欄213で、アプリを選択する。アプリ選択欄213には端末装置10が実行中のアプリ名がプルダウン形式で表示される。ユーザーは録画するアプリを選択できる。このアプリ名は、情報記録アプリ41がOSから取得する。情報記録アプリ41は実行中のアプリのうち、UI(画面)を持つアプリのみを表示することができる。選択されるアプリの中に、遠隔会議アプリ42が含まれてよい。このため、情報記録アプリ41は、遠隔会議アプリ42で表示した資料や各拠点の参加者なども動画で記録できる。この他、プルダウンで表示されるアプリは、プレゼンテーション用アプリ、ワープロアプリ、表計算アプリ、文書等の資料作成編集アプリ、クラウド電子黒板アプリ、Webブラウザアプリ、など端末装置で実行中の様々なアプリである。したがって、ユーザーは結合画像動画に含めるアプリの画面を柔軟に選択できる。
また、アプリ単位で録画する場合、ユーザーは複数のアプリを選択できる。情報記録アプリ41は、選択された全てのアプリの画面を録画できる。
カメラトグルボタン211とPC画面トグルボタン212が双方ともオフの場合、録画内容確認ウィンドウ214に「音声のみ記録されます」と表示される。この音声は、端末装置10が出力する音声(遠隔会議アプリ42が他の拠点101から受信する音声)と、ミーティングデバイス60が集音する音声である。つまり、遠隔会議が実施されていれば、遠隔会議アプリ42の音声とミーティングデバイス60の音声は、画像の記録に関係なく保存される。ただし、ユーザーは、ユーザーの設定で遠隔会議アプリ42の音声、ミーティングデバイス60の音声の保存を選択的に停止できてよい。
カメラトグルボタン211とPC画面トグルボタン212のオンとオフの組み合わせに応じて、以下のように結合画像動画が録画される。また、録画内容確認ウィンドウ214にはリアルタイムに結合画像動画が表示される。
・カメラトグルボタン211がオン、PC画面トグルボタン212がオフの場合は、録画内容確認ウィンドウ214に、ミーティングデバイス60が撮像したパノラマ画像と話者画像が表示される。
・カメラトグルボタン211がオフ、PC画面トグルボタン212がオン(画面も選択済)の場合、録画内容確認ウィンドウ214に、デスクトップ画面や選択されたアプリの画面が表示される。
・カメラトグルボタン211がオン、PC画面トグルボタン212がオンの場合、録画内容確認ウィンドウ214に、ミーティングデバイス60が撮像したパノラマ画像と話者画像、及び、デスクトップ画面や選択されたアプリの画面が横に並んだ状態で表示される。
したがって、パノラマ画像、話者画像、及びアプリの画面が録画されない場合や、パノラマ画像、話者画像、及びアプリの画面が一切録画されない場合があるが、本実施形態では、便宜上、情報記録アプリ41が作成する画像を結合画像動画という。
更に、録画設定画面210は、「記録をアップロード後に自動で文字おこしする」というメッセージと共にチェックボックス215を有する。また、録画設定画面210は今すぐ記録開始ボタン216を有する。ユーザーがチェックボックス215にチェックを入れると、記録動画に、遠隔会議中の発言が変換されたテキストデータが添付される。この場合、録画終了後に情報記録アプリ41がテキストデータへの変換要求と共に音声を情報処理システム50にアップロードする。また、ユーザーが今すぐ記録開始ボタン216を押下すると、図44の録画中画面220が表示される。
図44は、情報記録アプリ41が録画中に表示する録画中画面220の一例である。なお、図44の説明では主に図42との相違を説明する。録画中画面220は、録画設定画面210でユーザーが設定した条件で、録画される結合画像動画をリアルタイムに表示する。図44の録画中画面220は、カメラトグルボタン211がオン、PC画面トグルボタン212がオフの場合であり、ミーティングデバイス60が作成したパノラマ画像203と話者画像204(いずれも動画)を表示する。録画中画面220は、録画中アイコン225、一時停止ボタン226、及び、録画終了ボタン227を表示する。
一時停止ボタン226は録画を停止するためのボタンで、停止後は録画再開も受け付ける。録画終了ボタン227は録画を終了するボタンである。一時停止ボタン226では録画IDが切り替わらず、録画終了ボタン227で録画IDが切り替わる。一時停止して、録画再開時にユーザーは録画設定画面210で設定した録画条件を再度設定することもできる。その場合、情報記録アプリ41は、録画停止ごとに複数の録画ファイルを作成してもよいし(例えば、録画終了ボタン227が押下)、1つの動画として連続するように複数ファイルを結合してもよい(例えば、一時停止ボタン226が押下)。また、情報記録アプリ41が結合画像動画を再生する場合、複数の録画ファイルを、1つの動画として連続して再生してもよい。
また、録画中画面220は、カレンダから情報取得ボタン221、会議名称欄222、時間欄223、場所欄224を有している。カレンダから情報取得ボタン221は、ユーザーが会議管理システム9から会議情報を取得するためのボタンである。カレンダから情報取得ボタン221が押下されると、情報記録アプリ41が情報処理システム50から該ユーザーに閲覧権限がある会議一覧を取得し、表示する。ユーザーは会議一覧から、これから行う遠隔会議を選択する。これにより、会議名称欄222、時間欄223、場所欄224に会議情報が反映される。会議名称欄222には会議情報のタイトルが、時間欄223には開始時刻と終了時刻が、場所欄224に場所が反映される。また、会議管理システムにおける会議情報と記録情報が会議IDで対応付けられる。
遠隔会議が終了し、ユーザーが録画を終了すると、音声付きの結合画像動画が作成される。
図45は、情報記録アプリ41が表示する会議一覧画面230の一例である。会議一覧画面230は、会議の一覧であるが、遠隔会議において録画された記録情報のリストを表示できる。また、遠隔の会議に関わらず、ある会議室内のみで行われた会議も含まれる。会議一覧画面230には、会議情報記憶部5001においてログインユーザーが閲覧権限のある会議情報が表示される。情報記憶部1001に保存された動画記録情報の情報が更に統合されてもよい。
会議一覧画面230は、図42の初期画面200においてユーザーが会議一覧タブ231を選択すると表示される。会議一覧画面230は、このユーザーに閲覧権限がある記録情報のリスト236を表示する。会議作成者(議事録作成者)は参加者に閲覧権限を設定できる。なお会議一覧は、記憶した記録情報の一覧であっても、会議予定や会議データの一覧であってもよい。
会議一覧画面230はチェックボックス232、更新日時233、タイトル234、及びステータス235の各項目を有する。
・チェックボックス232は録画ファイルの選択を受け付ける。チェックボックス232は、ユーザーがまとめて録画ファイルを削除したい場合に使用される。
・更新日時233は、結合画像動画の録画の開始時と終了時を示す。編集された場合は編集日時でよい。
・タイトル234は、会議のタイトル(議題等)である。会議情報から転記されてもよいし、ユーザーが設定してもよい。
・ステータス235は、結合画像動画が情報処理システム50にアップロード済みか否かを示す。アップロード済みでない場合、「ローカルPC」が表示され、アップロード済みの場合「アップロード済み」が表示される。アップロード済みでない場合、アップロードボタンが表示される。未アップロードの結合画像動画がある場合、ユーザーが情報処理システム50にログイン時に、情報記録アプリ41が自動アップロードするとよい。
ユーザーが結合画像動画のリスト236から任意のタイトル等をポインティングデバイスで選択すると、情報記録アプリ41が録画再生画面を表示するが本実施形態では省略する。録画再生画面では、結合画像動画の再生などが可能である。
なお、ユーザーは、更新日時や、タイトル、キーワードなどから会議を絞り込むことができることが望ましい。また、表示される会議の数が多く、該当の会議を見つけにくい場合は、検索機能として、ユーザーが語句を入力することで、会議の発言やタイトルなどに含まれる語句から記録情報を絞り込むことができることが望ましい。検索機能により、ユーザーは記録情報が多くなった場合でも短時間で所望の記録情報を見つけることが可能である。また、会議一覧画面では、ユーザーが更新日時やタイトル順で会議をソートできてもよい。
<<録画の動作又は処理>>
図46は、情報記録アプリ41がパノラマ画像、話者画像及びアプリの画面を録画する手順を示すシーケンス図の一例である。すでに、会議参加やミュート制御は終了している。
S201:ユーザーは遠隔会議アプリ42を操作して遠隔会議を開始する。ここでは、自拠点102と他の拠点101の遠隔会議アプリ42が遠隔会議を開始したものとする。自拠点102の遠隔会議アプリ42は、ミーティングデバイス60が有するカメラが撮像する画像、マイクが集音する音声を他の拠点101の遠隔会議アプリ42に送信する。他の拠点101の遠隔会議アプリ42は、受信した画像をディスプレイに表示し、受信した音声をスピーカから出力する。同様に、他の拠点101の遠隔会議アプリ42は、ミーティングデバイス60が有するカメラが撮像する画像、マイクが集音する音声を自拠点102の遠隔会議アプリ42に送信する。自拠点102の遠隔会議アプリ42は、受信した画像をディスプレイに表示し、受信した音声をスピーカから出力する。各遠隔会議アプリ42はこれを繰り返して、遠隔会議を実現する。
S202:ユーザーは図43に示した情報記録アプリ41の録画設定画面210に対し、録画に関する設定を行う。情報記録アプリ41の操作受付部12が設定を受け付ける。ここでは、カメラトグルボタン211、及び、PC画面トグルボタン212が共にオンであるとする。
S203:ユーザーが録画開始を操作すると、情報記録アプリ41の録画制御部17が録画を開始する。
S204:情報記録アプリ41のアプリ画面取得部14は、ユーザーが選択したアプリの画面をアプリに対し要求する(アプリ画面取得部14は、より詳細にはOSを介して、アプリの画面を取得する)。図46では、ユーザーが選択したアプリを遠隔会議アプリ42とする。
S205:情報記録アプリ41の録画制御部17は、デバイス通信部16を介して、ミーティングデバイス60に録画開始を通知する。通知の際、録画制御部17は、カメラトグルボタン211がオンである旨(パノラマ画像と話者画像の要求)も通知するとよい。要求の有無に関係なくミーティングデバイス60はパノラマ画像と話者画像を情報記録アプリ41に送信している。
S206:ミーティングデバイス60の端末通信部61が録画開始を受信すると、重複しない録画IDを採番し、録画IDを情報記録アプリ41に返す。なお、録画IDは情報記録アプリ41が採番してもよいし、情報処理システム50から取得してもよい。
S207:情報記録アプリ41の音声取得部15は端末装置10が出力する音声データ(遠隔会議アプリ42が受信した音声データ)を取得する。
S208:デバイス通信部16が、音声取得部15が取得した音声データと合成要求をミーティングデバイス60に送信する。
S209:ミーティングデバイス60の端末通信部61は音声データと合成要求を受信し、音声合成部65が、集音部64が集音した周囲の音声データと、受信した音声データを合成する。例えば、音声合成部65は、2つの音声データを足し合わせる。ミーティングデバイス60の周辺の鮮明な音声が記録されるので、特にミーティングデバイス60周辺(会議室側)の音声のテキスト化精度が向上する。
この音声の合成は、端末装置10でも可能である。録画機能がミーティングデバイス60に、音声処理が端末装置10に分散して配置されてもよい。この場合、ミーティングデバイス60の負荷を低減できる。
S210:また、ミーティングデバイス60のパノラマ画像作成部62はパノラマ画像を作成し、話者画像作成部63は話者画像を作成する。
S211:情報記録アプリ41のデバイス通信部16は、パノラマ画像と話者画像を繰り返しミーティングデバイス60から取得する。また、デバイス通信部16は、合成後の音声データを繰り返しミーティングデバイス60から取得する。これらの取得は、デバイス通信部16がミーティングデバイス60に要求することで行われてもよい。あるいは、カメラトグルボタン211がオンである旨を受け取ったミーティングデバイス60が自動的にパノラマ画像と話者画像を送信してもよい。音声データの合成要求を受け取ったミーティングデバイス60が自動的に合成後の音声データを情報記録アプリ41に送信してもよい。
S212:情報記録アプリ41の録画制御部17は、遠隔会議アプリ42から取得したアプリの画面と、パノラマ画像と、話者画像を並べて配置することで結合画像を作成する。録画制御部17は、繰り返し結合画像を作成し、動画を構成するフレームに各結合画像を指定することで結合画像動画を作成する。また、録画制御部17はミーティングデバイス60から受信した音声データを保存しておく。
情報記録アプリ41は以上のステップS207~S212を繰り返す。
S213:遠隔会議が終わり、録画の必要がなくなると、ユーザーが録画終了(例えば、録画終了ボタン227)を情報記録アプリ41に指示する。情報記録アプリ41の操作受付部12が指示を受け付ける。
S214:情報記録アプリ41のデバイス通信部16は、ミーティングデバイス60に録画終了を通知する。ミーティングデバイス60は、引き続きパノラマ画像と話者画像の作成や音声の合成を継続する。ただし、ミーティングデバイス60は録画中かどうかで解像度やfpsを変えるなど処理の負荷を変更してもよい。
S215:情報記録アプリ41の録画制御部17は、結合画像動画に音声データを結合して音声付きの結合画像動画を作成する。
S216:また、ユーザーが録画設定画面210で「記録をアップロード後に自動で文字おこしする」に対応付けられたチェックボックス215をチェックした場合、音声データ処理部18が、音声データのテキストデータへの変換を情報処理システム50に要求する。詳細には、音声データ処理部18は、通信部11を介して、保存先のURLを指定し、会議ID及び録画IDと共に、結合画像動画に結合された音声データの変換要求を情報処理システム50に送信する。
S217:情報処理システム50の通信部51は音声データの変換要求を受信し、テキスト変換部56が音声認識サービスシステム80を利用して音声データをテキストデータに変換する。通信部51はテキストデータを、結合画像動画の保存先と同じ保存先(ストレージサービスシステム70のURL)に保存する。なお、録画情報記憶部5002においてテキストデータは会議ID及び録画IDにより結合画像動画と対応付けられている。なおテキストデータは、情報処理システム50のコミュニケーション管理部54で管理し、記憶部5000に記憶してもよい。また、端末装置10が音声認識サービスシステム80に音声認識を要求し、音声認識サービスシステム80から取得したテキストデータを保存先に保存してもよい。なお、音声認識サービスシステム80は、変換したテキストデータを情報処理システム50に返すが、直接保存先のURLに送信してもよい。音声認識サービスシステム80は、情報処理システム50にユーザーが設定した設定情報に応じて、複数のサービスから選択したり切り替えたりしてもよい。
S218:また、情報記録アプリ41のアップロード部20は、通信部11を介して、結合画像動画の保存先に結合画像動画を保存する。録画情報記憶部5002において結合画像動画は会議ID及び録画IDと対応付けられている。結合画像動画にはアップロード済みが記録される。
S219:ユーザーが会議終了を電子黒板2に入力する。ユーザーが端末装置10に会議終了を入力し、端末装置10から電子黒板2に会議終了が送信されてもよい。この場合、会議終了は情報処理システム50を経由して電子黒板2に送信されてよい。
S220:電子黒板2の通信部36は、会議IDを指定して、会議中に表示した(例えば手書きされた)オブジェクトデータを情報処理システム50に送信する。通信部36は電子黒板2の機器識別情報を情報処理システム50に送信してもよい。この場合、対応付け情報により会議IDが特定される。
S221:情報処理システム50は会議IDに基づいて結合画像動画等と同じ保存先にオブジェクトデータを保存する。
保存先はユーザーに通知されているので、ユーザーはメールなどで保存先を知らせることで結合画像動画を参加者と共有できる。結合画像動画、音声データ、テキストデータ、オブジェクトデータを作成する装置がそれぞれ異なっても、1つの格納場所に集めて格納でき、後でユーザー等が容易に閲覧できる。
なお、ステップS207~S212の処理は、図46に示すとおりの順番でなくてもよく、音声データの合成と結合画像の作成が前後してもよい。
<主な効果>
このように、本実施形態のミーティングデバイス60は、二次元コードを表示した電子黒板2をミュートするので、機器を誤らずに適切な機器をミュートできる。また、ユーザーは、会議の参加者の中心にあるミーティングデバイス60で音声を出力し、電子黒板2が集音するマイク440をミュートにしたいが、従来技術ではそのような制御はできなかった。本実施形態では上記のように機器を誤ることがない。
<その他の適用例>
以上、本発明を実施するための最良の形態について実施例を用いて説明したが、本発明はこうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
例えば、端末装置10とミーティングデバイス60が一体でもよい。端末装置10にミーティングデバイス60が外付けされてもよい。また、ミーティングデバイス60は、全天球カメラとマイクとスピーカがケーブルで接続されたものでもよい。
また、他の拠点101においてもミーティングデバイス60が配置されてよい。他の拠点101は別途、ミーティングデバイス60を使用して結合画像動画とテキストデータを作成する。また、1つの拠点に複数のミーティングデバイス60が配置されてもよい。この場合、ミーティングデバイス60ごとに複数の記録情報が作成される。
また、本実施形態で使用した、結合画像動画における、パノラマ画像203,話者画像204、及び、アプリの画面の配置は一例に過ぎない。パノラマ画像203が下で話者画像204が上でもよいし、ユーザーが配置を変更したり、再生時にはパノラマ画像203と話者画像204の表示と非表示を個別に切り替えたりしてもよい。
また、図9などの構成例は、端末装置10、ミーティングデバイス60、及び、情報処理システム50による処理の理解を容易にするために、主な機能に応じて分割したものである。処理単位の分割の仕方や名称によって本願発明が制限されることはない。端末装置10、ミーティングデバイス60、及び、情報処理システム50の処理は、処理内容に応じて更に多くの処理単位に分割することもできる。また、1つの処理単位が更に多くの処理を含むように分割することもできる。
また、実施例に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。ある実施形態では、情報処理システム50は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。
更に、情報処理システム50は、開示された処理ステップ、例えば図16等を様々な組み合わせで共有するように構成できる。例えば、所定のユニットによって実行されるプロセスは、情報処理システム50が有する複数の情報処理装置によって実行され得る。また、情報処理システム50は、1つのサーバー装置にまとめられていても良いし、複数の装置に分けられていても良い。
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」は、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、及び、従来の回路モジュール等のデバイスを含む。