JP6897451B2 - 端末、プログラム、通信方法及び通信システム - Google Patents

端末、プログラム、通信方法及び通信システム Download PDF

Info

Publication number
JP6897451B2
JP6897451B2 JP2017182211A JP2017182211A JP6897451B2 JP 6897451 B2 JP6897451 B2 JP 6897451B2 JP 2017182211 A JP2017182211 A JP 2017182211A JP 2017182211 A JP2017182211 A JP 2017182211A JP 6897451 B2 JP6897451 B2 JP 6897451B2
Authority
JP
Japan
Prior art keywords
terminal
connection
command
voice
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017182211A
Other languages
English (en)
Other versions
JP2019057876A (ja
Inventor
鳥越 真
真 鳥越
大 藤枝
大 藤枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2017182211A priority Critical patent/JP6897451B2/ja
Publication of JP2019057876A publication Critical patent/JP2019057876A/ja
Application granted granted Critical
Publication of JP6897451B2 publication Critical patent/JP6897451B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、端末、プログラム、通信方法及び通信システムに関する。
近年、ネットワーク及びマルチメディア伝送技術の発達により、遠隔地のサテライトオフィス同士、または地方のサテライトオフィスと本社を結ぶテレワークの導入が容易となっている。このため、経営改革の一環として、テレワークの導入を推進している企業が増加している。
同一空間で一緒に作業を行っているメンバー間の会話は、あるメンバーが他のメンバーに声をかけ、他のメンバーも自分への声かけを認知することにより開始される。テレワークにおいては、遠隔地のメンバー間の会話が電話で行われる。この電話での会話も、各メンバーが同一空間に存在する感覚で行われることが望ましい。
この点に関し、特許文献1には、発呼元ユーザが相手ユーザの名前を声に出すと、音声認識により相手ユーザを特定し、相手ユーザに発呼する電話機が開示されている。特許文献2には、呼びかけモードを有する電話機であって、呼びかけモードに設定された電話機に発呼元ユーザが例えば「おはよう」と呼びかけると、相手ユーザの電話機に「おはよう」という音声を送信する電話機が開示されている。相手ユーザの電話機に送信された音声は、相手ユーザの電話機から着信音として出力される。
特開2002−33820号公報 特許第5978825号公報
しかし、特許文献1に記載の電話機では、相手ユーザが発呼元ユーザからの呼びかけを聞くことできない。また、特許文献2に記載の電話機では、発呼元ユーザが相手ユーザを電話帳から探して発呼操作を行う必要がある。このため、いずれの電話機でも、2人のユーザが同一空間で一緒に作業を行っているかのような感覚を得ることは難しい。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、複数のユーザが同一空間に存在するかのような感覚でユーザ間の会話が開始されることを支援する、新規かつ改良された端末、プログラム、通信方法及び通信システムを提供することにある。
上記課題を解決するために、本発明のある観点によれば、入力音声を記憶する音声バッファと、入力音声から、対象の呼び名と前記対象への呼出確認とを含む接続コマンドを検出し、前記呼び名を検出する呼び名検出部、及び前記呼出確認を検出する呼出検出部を含む接続コマンド検出部と、前記呼出検出部により前記呼出確認が検出される前に、前記呼び名検出部により検出された呼び名の表示を制御する表示制御部と、接続コマンドに含まれる呼び名に対応する他の端末との接続を制御する接続制御部と、他の端末が接続された後に、音声バッファに記憶された前記接続コマンドを含む入力音声を他の端末に送信する送信部と、を備える、端末が提供される。
接続コマンド検出部は、タイマーを備え、前記表示制御部は、所定時間経過までに呼出確認が検出されない場合は、前記候補表示を消去してもよい。
送信部は、音声バッファに記憶された入力音声の末尾から遡った箇所を起点にして入力音声の送信を開始してもよい。
送信部は、音声バッファに記憶された入力音声の末尾から、接続コマンド検出部により検出された接続コマンドに応じた時間分遡った箇所を起点にして、入力音声の送信を開始してもよい。
端末は、入力音声から切断コマンドを検出する切断コマンド検出部をさらに備え、接続制御部は、切断コマンド検出部により切断コマンドが検出されたことに基づいて、他の端末との接続を切断してもよい。
切断コマンド検出部は、事前に設定された第1の切断コマンド辞書または第2の切断コマンド辞書に含まれるコマンドを切断コマンドとして検出し、他の端末との接続から所定時間が経過する以前は第1の切断コマンド辞書を用いて、他の端末との接続から所定時間が経過した後は第2の切断コマンド辞書を用いて切断コマンドを検出してもよい。
端末は撮像部をさらに備え、送信部は、他の端末が接続された後に、撮像部により得られた撮像画像を他の端末に送信してもよい。
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを、入力音声から、対象の呼び名と前記対象への呼出確認とを含む接続コマンドを検出し、前記呼び名を検出する呼び名検出部、及び前記呼出確認を検出する呼出検出部を含む接続コマンド検出部と、前記呼出検出部により前記呼出確認が検出される前に、前記呼び名検出部により検出された呼び名の表示を制御する表示制御部と、接続コマンドに含まれる呼び名に対応する他の端末との接続を制御する接続制御部と、他の端末が接続された後に、音声バッファに記憶された接続コマンドを含む入力音声を他の端末に送信する送信部と、として機能させるための、プログラムが提供される。
また、上記課題を解決するために、本発明の別の観点によれば、入力音声を記憶する音声バッファに記憶することと、入力音声から、対象の呼び名と前記対象への呼出確認とを含む接続コマンドを検出することと、前記呼出確認が検出される前に、検出された前記呼び名の表示を制御することと、接続コマンドに含まれる呼び名に対応する他の端末との接続を制御することと、他の端末が接続された後に、音声バッファに記憶された接続コマンドを含む入力音声を他の端末に送信することと、を含む、通信方法が提供される。
また、上記課題を解決するために、さらに本発明の別の観点によれば、複数の端末を有する通信システムであって、複数の端末のうちの第1の端末は、入力音声を記憶する音声バッファ、入力音声から、対象の呼び名と前記対象への呼出確認とを含む接続コマンドを検出し、前記呼び名を検出する呼び名検出部、及び前記呼出確認を検出する呼出検出部を含む接続コマンド検出部、前記呼出検出部により前記呼出確認が検出される前に、前記呼び名検出部により検出された呼び名の表示を制御する表示制御部、接続コマンドに含まれる呼び名に対応する第2の端末との接続を制御する接続制御部、及び第2の端末が接続された後に、音声バッファに記憶された接続コマンドを含む入力音声を第2の端末に送信する送信部、を有し、第2の端末は、第1の端末から送信される入力音声を出力する、通信システムが提供される。
以上説明したように本発明によれば、複数のユーザが同一空間に存在するかのような感覚でユーザ間の会話が開始されることを支援することが可能である。
本実施形態に係る遠隔コミュニケーションシステムの構成の一例を示す説明図である。 同実施形態に係る端末20の構成の一例を示す説明図である。 同実施形態に係る撮像装置10の構成の一例を示す説明図である。 同実施形態に係る端末管理サーバ11の構成の一例を示す説明図である。 同実施形態に係る端末20の構成の一例を示す説明図である。 同実施形態に係る接続コマンドC1の検出に用いられる辞書の一例を示す説明図である。 同実施形態に係る切断コマンドC2の検出に用いられる辞書の一例を示す説明図である。 同実施形態に係る第1の端末20により他の拠点のメンバーと通信を接続する様子の一例を示す説明図である。 対話状態が確立された第2の端末20の一例を示す説明図である。 同実施形態に係る端末20の動作の流れの一例を示すフローチャートである。 同実施形態に係る動作の流れの一例を示すシーケンス図である。 同実施形態に係る動作の流れの一例を示すシーケンス図である。 同実施形態に係る音声バッファ長をフレーズごとに割り当てた一例を示す説明図である。 端末20のハードウェア構成を示したブロック図である。
以下に添付図面を参照しながら、本発明の実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。例えば、実質的に同一の機能構成または論理的意義を有する複数の構成を、必要に応じて端末20A及び20Bのように区別する。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、複数の構成要素の各々に同一符号のみを付する。例えば、端末20A及び20Bを特に区別する必要が無い場合には、各端末を単に端末20と称する。
<<1.遠隔コミュニケーションシステムの構成>>
本発明の実施形態は、遠隔する拠点間でのコミュニケーションを実現する遠隔コミュニケーションシステムに関する。以下、図1及び図2を参照し、遠隔コミュニケーションシステムの概要を説明する。
図1は、本発明の実施形態による遠隔コミュニケーションシステムの構成の一例を示す説明図である。また、図2は、端末20の構成の一例を示す説明図である。本発明の実施形態による遠隔コミュニケーションシステムは、撮像装置10と、端末20と、端末管理サーバ11と、ネットワーク12とを有する。図1は、2か所の拠点間でのコミュニケーションを例示しており、ネットワーク12は、拠点Aに設けられる撮像装置10A及び端末20Aと、拠点Bに設けられる撮像装置10B及び端末20Bと、端末20の利用者に関する情報を管理する端末管理サーバ11とを接続している。また、端末20は、図2に示すように、映像を取得する撮像部220と、音声を取得する音声入力部230と、表示部240と、音声出力部250とを備えることができる。
<撮像装置10の構成>
撮像装置10は、拠点の俯瞰映像を撮像する機能と、拠点の環境音を収音する機能と、かかる俯瞰映像と環境音とを送信する機能を有する。図3は、撮像装置10の構成の一例を示す説明図である。撮像装置10は、俯瞰映像入力部102と、環境音入力部103と、通信部104を有することができる。俯瞰映像入力部102は、拠点の映像を撮影する機能を有する。環境音入力部103は、拠点の音声を収音する機能を有する。通信部104は、俯瞰映像入力部102により撮影された俯瞰映像と、環境音入力部103で集音された環境音とを、ネットワーク12を介して他の拠点に送信する機能を有する。かかる撮像装置10により、拠点Aに設けられる撮像装置10Aは、拠点Aの俯瞰映像及び環境音を、ネットワーク12を介して拠点Bに送信し、同様に、拠点Bに設けられる撮像装置10Bは、拠点Bの俯瞰映像及び環境音を、ネットワーク12を介して拠点Aに送信することができる。ここで、撮像装置10は、俯瞰映像入力部102と環境音入力部103の双方を必ずしも備えなくてもよく、俯瞰映像入力部102を備えなくてもよいし、環境音入力部103を備えなくてもよい。また、一方の拠点で撮影した俯瞰映像と、集音した環境音とは、他方の拠点に必ずしも送信されなくてもよい。さらに、環境音入力部103は、オフィスの中央等に設置して必要な音声を収音できるように、俯瞰映像入力部102と分離されてもよい。
<端末管理サーバ11の構成>
端末管理サーバ11は、利用者の名称等の情報と端末情報とが紐づけられた情報を管理する機能を有する。端末情報は、端末20の識別子および俯瞰映像内における端末20の座標データを含む。また、端末20が複数人による共同利用のために設置される場合、端末情報は、俯瞰映像内における利用者の座席の座標を含む。図4に示したように、端末管理サーバ11は、端末情報記憶部112と、端末情報検索部113と、通信部114とを備えることができる。
端末情報記憶部112は、利用者の名称等の情報と端末情報とが紐づけられた情報を記憶する機能を有する。端末情報検索部113は、端末情報記憶部112に記憶された情報を検索する機能を有する。通信部114は、ネットワーク12を介した通信を行う機能を有し、ネットワーク12を介して受信した端末情報検索指示を端末情報検索部113へ送信する。また、通信部114は、検索された端末情報を、ネットワーク12を介して、端末20へ送信する機能を有する。
このような端末管理サーバ11は、例えば、XMPP(eXtensible Messaging and Presence Protocol)を用いて独立した管理サーバを構築してもよいし、複数備えられる端末20のいずれか1つへ組み込んでもよいし、複数の端末20へ分散して配置するように構成されてもよい。
<ネットワーク12>
ネットワーク12は、複数の拠点と、端末管理サーバ11とを接続する。ネットワーク12は、電話回線網、インターネット、衛星通信網などの公衆回線網や、LAN(Local Aera Network)、WAN(Wide Area Network)などを含んでもよい。また、ネットワーク12は、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網を含んでもよい。
<端末20の構成>
端末20は、複数の拠点間でのコミュニケーションを支援するための装置であり、例えば、端末20は、拠点Aに居る対話要求送信側のメンバーが発する音声から、拠点Bに居る対話要求受信側のメンバーに関する名称等の音声情報を認識すると、対話要求送信側のメンバーと、対話要求受信側のメンバーとが対話できるような状態を確立する。
端末20の構成について、図5を参照しながら詳細に説明する。図5は、端末20の構成の一例を示す説明図である。端末20は、音声バッファ231と、接続コマンド検出部234と、接続制御部236と、送信部としての機能を有する通信部260を備えており、また、撮像部220と、音声入力部230と、表示部240と、音声出力部250と、出力制御部237を備えることができる。
(撮像部220)
撮像部220は、端末20を利用するメンバーを撮像する機能を有する。例えば、対話要求送信側メンバーの端末20Aの撮像部220は、当該メンバーの映像を撮像により取得する。拠点Aの端末20Aと拠点Bの端末20Bとの接続が確立された場合、端末20Aは、撮像部220により取得された映像を、ネットワーク12を介して拠点Bの端末20Bに送信することができる。同様に、拠点Aの端末20Aと拠点Bの端末20Bとの接続が確立された場合、端末20Bは、撮像部220により取得された映像を、ネットワーク12を介して拠点Aの端末20Aに送信することができる。
(音声入力部230)
音声入力部230は、音声の入力機能を有し、利用者の発話等の音声が取得される。例えば、拠点Aに居る対話要求送信側メンバーの端末20Aの音声入力部230は、当該メンバーの音声を収音する。音声入力部230により収音された音声は、ネットワーク12を介して、対話要求受信側メンバーが利用する端末20Bに送信される。同様に、拠点Bに居る対話要求受信側メンバーの端末20Bの音声入力部230は、当該メンバーの音声を収音する。音声入力部230により収音された音声は、ネットワーク12を介して、対話要求送信側端末20Aに送信されてもよい。
(表示部240)
表示部240は、映像を表示する機能を有する。例えば、対話要求送信側の拠点Aに配置される端末20Aの表示部240Aは、図2に示したように、対話要求受信側の拠点Bの撮像装置10Bから送信された拠点Bの俯瞰映像を表示することができる。また、表示部240Aは、対話要求受信側メンバーが利用する端末20Bの撮像部220Bで撮影された映像を表示することができる。さらに、表示部240Aは対話要求送信側の俯瞰映像を表示することもできるし、対話要求送信側端末20Aの撮像部220Aで取得された映像を表示することもできる。
(音声出力部250)
音声出力部250は、音声を出力する機能を有し、スピーカーで構成され得る。例えば、拠点Aに位置する端末20Aの音声出力部250は、拠点Bの撮像装置10Bから送信された拠点Bの環境音を出力する。
なお、図2で示した、撮像部220、音声入力部230、表示部240、及び音声出力部250は、端末20に一体的に実装される例を示したが、端末20に実装されずに別途構成されてもよい。
ここで、対話要求送信側メンバーが利用する端末20を第1の端末20とし、対話要求受信側メンバーが利用する端末20を第2の端末20とする。第1の端末20は上記のように、音声バッファ231と、接続コマンド検出部234と、接続制御部236と、送信部としての機能を有する通信部260を備えており、また、撮像部220と、音声入力部230と、表示部240と、音声出力部250と、出力制御部237と、端末情報保持部239を備えることができる。また、かかる第2の端末20は、第1の端末20から送信される入力音声を出力することができ、第1の端末20と同様の構成を備えることもできる。
(音声バッファ231)
音声バッファ231は、音声入力部230で取得された入力音声を記憶する機能を有する。さらに音声バッファ231は、対話要求送信側の端末20である第1の端末20と、対話要求受信側の端末20である第2の端末20とが接続されたときに、記憶したデータを、通信部260を介して第2の端末20に対して送信する。
(音声認識部232)
音声認識部232は、音声入力部230で取得された入力音声を受信し、認識する機能を有する。入力音声の認識は、単語及びまとまりを有するフレーズのような、後述するコマンド検出に使用する辞書に登録した言葉の単位ですることができる。また、音声認識部232は、認識した入力音声を接続コマンド検出部234、及び切断コマンド検出部235に送信する。
(接続コマンド検出部234)
接続コマンド検出部234は、接続コマンドC1を検出し接続判定する機能を有する。接続コマンド検出部234は、接続コマンドC1を検出するための辞書を備えることができる。ここで、図6を参照しながら接続コマンドC1の検出方法について説明する。図6は、接続コマンドC1の検出に用いられる辞書の一例を示す説明図である。具体的には、接続コマンド検出部234は、第1の端末20が接続状態でない場合に、受信した入力音声の中から接続コマンドC1を検出し、検出結果に基づいて、他の端末20から接続すべき第2の端末20を判定する。かかる接続コマンドC1は、名称C12と、敬称C14と、呼出確認C16とを含む。
詳細には、接続コマンド検出部234は、名称C12及び敬称C14等を検出する呼び名検出部2342と、呼出確認C16を検出する呼出検出部2344とを備えることができる。接続コマンド検出部234で検出される呼び名は、単なる氏名だけでなく、あだ名及び通称等の対話したい相手を特定するために通常用いることができるようなものを含む。
接続コマンド辞書J1は、名称検出用辞書J12と、敬称検出用辞書J14と、呼出検出用辞書J16とを有することができる。また、接続コマンド辞書J1は、対話要求送信側メンバーが呼びかける際に使用する文言、単語等のフレーズをコマンド候補として予め登録しておくことができる。例えば、名称検出用辞書J12に含まれる名称には、「佐藤」、「鈴木」、「高橋」等が例示でき、敬称検出用辞書J14に登録されるフレーズには、「さん」、「くん」、「ちゃん」、「部長」等が例示でき、呼出確認検出用辞書J16に登録されるフレーズには、「ちょっといい?」、「ちょっといいですか?」、「いま時間ある?」等が例示できる。そして、接続コマンド検出部234は、入力音声と、接続コマンド辞書J1に予め登録されたコマンド候補とを比較して接続コマンドC1を検出する。このように、接続コマンド検出部234は、名称C12、敬称C14、に加えて呼出確認C16のフレーズを接続コマンドC1として検出した場合に、接続動作を行う。これにより、端末20付近で行われる会話の中に出てくる名称と敬称を検出し、意図しない接続がされるのを防止することができる。
また、接続コマンド検出部234は、呼出検出部2344により呼出確認が検出される前に、表示制御部240において呼出検出部2344により検出可能な候補を表示することができるように構成してもよい。これにより、対話要求送信側メンバーが呼びかける際に使用可能なフレーズの候補を事前に確認することができ、候補の中から適切なフレーズを選択して発話することにより、検出漏れを軽減することが可能となる。この場合、接続コマンド検出部234はタイマーを備え、所定時間経過までに呼出確認が検出されない場合は前記候補表示を消去するように構成するとよい。
(切断コマンド検出部235)
切断コマンド検出部235は、第1の端末20と、第2の端末20とが接続状態である場合に、切断判定を行う機能を有し、入力音声から切断コマンドを検出する機能を有する。具体的には、入力音声の中から切断コマンドが検出された場合は、第1の端末20と第2の端末20との間の接続が切断され、切断コマンドが検出されない場合は、上記接続は維持される。
ここで、図7を参照しながら、切断コマンドの検出方法について説明する。図7は、切断コマンドの検出に用いられる辞書の一例を示す説明図である。切断コマンド検出部235は、例えば、図7に示すような切断コマンド辞書J2を記憶することができる。切断コマンド辞書J2は、入力音声に含まれる切断コマンドC2の検出に用いられる。切断判定は、受信した入力音声と、切断コマンド辞書J2に予め登録されたコマンド候補とを比較し、切断コマンドC2が検出された場合は、接続を切断し、切断コマンドC2が検出されない場合は、接続を維持する。切断コマンド候補として、対話中に使用する文言、単語等のフレーズが、予め切断コマンド辞書J2に登録される。さらに、切断コマンド辞書J2は、拒否コマンド候補を含む辞書である第1の切断コマンド辞書J22と、終了コマンド候補を含む辞書である第2の切断コマンド辞書J24とに大別することができる。第1の切断コマンド辞書J22と、第2の切断コマンド辞書J24は、いずれも切断コマンド検出のために利用されるものであるが、第1の切断コマンド辞書J22は、第1の端末20と第2の端末20とが接続された直後から所定の時間の間にのみ、切断コマンドC2の検出に利用される。一方、第2の切断コマンド辞書J24は、上記所定の時間が経過した後から、第1の切断コマンド辞書J22に替わって、切断コマンドC2の検出に利用される。このとき、切断コマンド検出部235は、タイマーを有する、拒否コマンド検出部もしくは終了コマンド検出部を実装することもでき、例えば、かかるタイマーを用いて、上記のような、利用する辞書の切り替えを行うタイミングを設定することができる。切り替え時間の設定をする方法は、特段制限されず、所定の時間経過した時に、切断コマンド検出に用いる辞書を、第1の切断コマンド辞書J22から、第2の切断コマンド辞書J24に切り替えられればよい。このように切断コマンド辞書J2を、第1の切断コマンド辞書J22と、第1の切断コマンド辞書J24に大別することで、対話中の誤認識、あるいは不意の認識による切断が軽減される。
(接続制御部236)
接続制御部236は、制御内容を通信部260に送信する機能を有する。具体的には、接続コマンド検出部234及び切断コマンド検出部235で判定された結果に基づき、制御内容を通信部260に送信する。
(端末情報保持部239)
端末情報保持部239は、端末20の識別子や利用者の情報を保持する機能を有する。端末情報保持部239が保持する情報は、端末管理サーバ11で管理されており、通信接続の際の接続すべき端末20の検索に使用される。
(通信部260)
通信部260は、映像及び音声を通信する機能を有する。例えば、通信部260は、対話要求受信側の拠点に設けられた撮像装置10により取得された俯瞰映像及び環境音を受信する受信部としての機能を有する。また、通信部260は、対話状態において、第2の端末20の撮像部220により取得された映像と、音声入力部230により取得された音声とを受信することができる。また、通信部260は、対話状態において、第1の端末20の撮像部220により取得された映像と、音声入力部230により取得された音声を、第2の端末20に送信する送信部として機能を有する。さらに、通信部260は、接続制御部236から送信された制御内容に基づいて、第2の端末20に対話要求を送信することも可能であるし、他の拠点の端末20から対話要求を受信し、出力制御部237へ制御指示を送信する機能を有する。
(出力制御部237)
出力制御部237は、通信部260から送信された制御指示に基づき、表示部240及び音声出力部250を制御する機能を有する。例えば、出力制御部237は、対話要求受信側の拠点に設けられた撮像装置10により取得された俯瞰映像、及び第2の端末20の撮像部220により取得された映像を、表示部240で表示するように制御することができる。また、出力制御部237は、対話要求受信側の拠点に設けられた撮像装置10により取得された環境音、もしくは第2の端末20の音声入力部230により取得された音声を、音声出力部250で出力するように制御することができる。さらに、出力制御部237は、接続コマンド検出部234において検出された呼び名や接続コマンドC1のフレーズ候補を、表示部240で表示するように制御する表示制御部としての機能を備えることも可能である。
ここで、図8及び図9を参照しながら、端末20を利用して他の拠点のメンバーと通信を接続する様子の一例について説明する。図8は、第1の端末20として拠点Aに設けられた端末20Aと、第2の端末20として他の拠点である拠点Bに設けられた端末20Bとの通信を接続する様子の一例を示す説明図である。図9は、接続が確立されたときの第2の端末20(すなわち端末20B)の様子の一例を示す説明図である。
図8において、端末20Aの表示部240Aは、端末20Bを利用する対話要求受信側の拠点Bの俯瞰映像を表示し、音声出力部250Aは拠点Bの環境音を出力している。かかる状態で、対話要求送信側メンバーM10が、表示部240Aに表示された対話要求受信側の拠点の俯瞰映像を確認し、対話要求の呼びかけV10を行う。図8における呼びかけV10は、「佐藤さん ちょっといいですか?」というフレーズである。この呼びかけV10は、音声入力部230Aで取得されるとともに、入力音声中の呼び名である「佐藤さん」が呼び名検出部2342で検出され、表示部240Aに表示されている佐藤さんの座席付近に「佐藤さん」という呼び名が表示される。さらに呼出確認C14が呼出検出部2344で検出され、端末20Aと端末20Bとは、通信が接続される。
一方、端末20Bでは、図9に示すように、対話要求送信側メンバーM10の映像M10´、すなわち撮像部220Aで撮影された映像が、表示部240Bに表示される。さらに、対話要求送信側メンバーM10による対話要求の呼びかけV10´が音声出力部250Bから出力される。このとき、表示部240Bに俯瞰映像が表示されている場合は、表示部240Bは、接続のタイミングで、撮像部220Aで出力された対話要求送信側メンバーM10の映像M10´を出力することができる。また、端末20Aは、撮像部220Bで取得された映像を表示部240Aに表示することができ、音声入力部230Bで取得された音声を音声出力部250Aで出力することができる。
以上のように、利用する第1の端末20に向かって、対話したい相手の呼び名と、呼出確認のフレーズを発話するだけで、第2の端末20と接続し、発話時のフレーズをそのまま対話要求受信側メンバーに伝えることが可能となる。
上記のような構成により、各拠点の俯瞰映像及び環境音が恒常的に交換され、各メンバーは、異なる拠点の雰囲気、状況を、あたかも同一空間に存在するかのように感じることが可能である。
ここまで、遠隔コミュニケーションシステムの構成について詳細に説明した。
<<2.端末20の動作の流れ>>
続いて、図10を参照し、端末20の動作について説明する。図10は、端末20の動作の流れを示すフローチャートである。ここでは、動作の特徴を明確にするため、端末20の動作を中心に説明し、接続コマンド検出部234における呼出フレーズ候補の表示、異常発生時及びエラー発生時の処理フローは省略する。
一連の処理は、端末20が他の拠点の俯瞰映像と環境音を取得している場合は、俯瞰映像を表示部240で表示し、環境音を音声出力部250で出力した状態で、利用者が利用開始するところから始められる(ステップS101)。
端末20の利用は、端末20が音声入力待機状態の場合は、対話要求送信側メンバーが端末20に向かって発話することで開始される。端末20が音声入力待機状態でない場合は、映像をトリガーとして、端末20の状態が音声入力待機状態にされる。かかるトリガーは、例えば、撮像部220による利用者の顔検出、近接センサー(図示せず)等の検出結果を起動トリガーとして利用することができる。また、端末20が稼働している間、常に音声入力待機状態が維持されるようにしてもよい。
次に、入力音声が音声バッファ231に記憶されつつ(ステップS103)、音声認識部232で音声認識が行われる(ステップS105)。次に、第1の端末20と、第2の端末20とが接続状態であるか否かが判定される(ステップS107)。既に第1の端末20と第2の端末20とが接続状態であると判断された場合、後述する切断判定(ステップS133)が行われる。一方、第1の端末20と第2の端末20との接続が完了していないと判定された場合、接続コマンド検出部234にて、入力音声中の名称C12の有無が判定される(ステップS109)。
ステップS109において、名称C12が検出された場合、その名称C12と、名称フラグが接続制御部236にセットされ(ステップS111)、表示部240に名称C12、すなわち対話要求受信側メンバーの名称C12が表示される(ステップS113)。表示部240が名称C12を表示した後、再びステップS103から処理が繰り返される。
ステップS109において、名称C12が検出されない場合、入力音声中の敬称C14の有無が判定される(ステップS115)。
ステップS115において、入力音声から敬称C14が検出された場合、表示部240に敬称C14が、表示部240に出力された名称C12の後部に続けて表示され(ステップS117)、その後再びステップS103から処理が繰り返される。
ステップS115において、敬称C14が検出されない場合、接続制御部236に名称フラグがセットされているかどうかが判定される(ステップS119)。名称フラグがセットされていない場合は、ステップS103から一連の処理が繰り返される。名称フラグがセットされている場合は、接続コマンド検出部234にて、入力音声中の呼出確認C16の有無が判定される(ステップS121)。
ステップS121において、呼出確認C16が検出された場合、接続コマンド検出は完了する。なお、利用者が発生した音声に敬称C14が付されない場合、ステップS115で敬称C14は検出されない。このような場合、敬称C14は省略され、名称C12と呼出確認C16の2つのみを検出することで、接続コマンド検出は完了する。
ステップS121において、呼出確認C16が検出されない場合、ステップS103からの一連の処理が繰り返される。
ステップS121に次いで、呼び名に紐づけられた接続すべき第2の端末20の端末情報が取得される(ステップS123)。端末情報の取得は、例えば、端末管理サーバ11に問い合わせることで実行され、端末20のIDやIPアドレス等の識別子等の端末情報が取得される。
続いて、接続すべき第2の端末20が接続可能かどうかが判定される(ステップS125)。接続確認方法は、例えば、端末20の接続状態を管理する端末管理サーバ11に問い合わせてもよいし、第2の端末20に直接問い合わせる方法でもよい。
ステップS125において、第2の端末20が接続可能であると判定された場合は、対話要求送信側メンバーの第1の端末20は、第2の端末20と接続され(ステップS127)、音声バッファ231に記憶された入力音声が第2の端末20に送信される(ステップS129)。第1の端末20と第2の端末20とが接続される際、既に説明したように、表示部240に表示されている俯瞰映像を、撮像部220で取得された映像に切り替えることができてもよい。そして、ステップS129の後、ステップS103へ戻り、一連の処理が繰り返される。
ステップS125において、接続不可と判定された場合は、第1の端末20の表示部240に接続不可能である旨の表示を行い(ステップS131)、一連の処理が終了する。接続不可能であると判定される場合とは、例えば、既に接続対象の端末20が他の端末20と接続しているような場合(すなわち、ビジー状態)が挙げられる。
ところで、接続状態の切断には、ステップS107の接続判定において第2の端末20と接続状態であると判定された場合に、切断コマンド検出部235にて切断判定(ステップS133)がなされる。詳細には、入力音声から、切断コマンドC2が検出された場合、第1の端末20と第2の端末20との接続を終了する(ステップS135)。一方で、切断コマンドC2が検出されない場合、上記接続は維持され、ステップS103から一連の処理が接続を切断するまで繰り返される。
ここまで、端末20の動作の流れについて詳細に説明した。続いて、対話要求送信側メンバーの操作及びかかる操作に伴う端末20の動作の流れについて、図11及び図12を参照しながら詳細に説明する。
<<3.対話要求送信側メンバーの操作及びかかる操作に伴う端末20の動作の流れ>>
図11は、対話要求送信側メンバーの操作と端末20の動作の流れの一例を示すシーケンス図である。図11は、対話要求送信側メンバーM10(単に「メンバーM10」と記載する)、音声バッファ231、音声認識部232、並びに接続制御部236、表示部240及び通信部260のオブジェクトから構成されており、図11の上から下に延びる実線は各オブジェクトのライフラインを示している。
まず、メンバーM10が第1の端末20に向かって「佐藤さん」と発話すると(ステップS201)、音声バッファ231は、入力音声「佐藤さん」を記憶する(ステップS203)とともに、音声認識部232は、入力音声「佐藤さん」を認識する(ステップS205)。入力音声から、接続コマンド検出部234にて名称C12が検出されると、表示部240は「佐藤さん」というフレーズを表示する(ステップS207)。
続いて、メンバーM10は、表示部240に表示された認識結果が「佐藤さん」であることを目視確認(ステップS209)し、次いで「ちょっといいですか?」と発話する(ステップS211)。すると、音声バッファ231は入力音声「ちょっといいですか?」を記憶する(ステップS213)とともに、音声認識部232は、「ちょっといいですか?」という入力音声を認識する(ステップS215)。ここで、「ちょっといいですか?」というフレーズは、接続コマンド辞書J1に登録されているフレーズであるとする。
音声認識部232で認識された「ちょっといいですか?」という入力音声中の呼出確認C16が接続コマンド検出部234で検出され、接続コマンドC1が成立したことにより(ステップS217)、接続制御部236は通信部260へ制御指示を送信し、第1の端末20と、第2の端末20とが接続される(ステップS219)。そして、第2の端末20へ音声バッファ231に記憶された入力音声が送信される(ステップS221)。
ステップS221において、送信される入力音声は、音声バッファ231に記憶された入力音声の末尾から一定の長さまで遡った箇所を参照起点として、音声バッファ231を参照し、入力音声が送信開始される。その結果、第2の端末20に対して「佐藤さん ちょっといいですか?」という音声が出力され、対話相手である佐藤さんは、かかる音声を聞くことができる。
<誤認識が発生した場合>
次に、上記の例において、音声認識部232で入力音声が誤認識された場合の例について説明する。図12は、対話要求送信側メンバーM10の操作と端末20の動作の流れの一例を示すシーケンス図であり、音声認識部232にて誤認識が発生した場合を例示する。図12は、メンバーM10、音声バッファ231、音声認識部232、並びに接続制御部236、表示部240及び通信部260のオブジェクトから構成されており、上から下に延びる実線は各オブジェクトのライフラインを示している。
まず、メンバーM10が第1の端末20に向かって「佐藤さん」と発話する(ステップS301)。すると、音声バッファ231は、「佐藤さん」という入力音声を記憶する(ステップS303)一方、音声認識部232は、入力音声を「佐竹さん」と誤って認識している(ステップS305)。上記のような誤認識により、表示部240は誤った認識結果である「佐竹さん」というフレーズを表示する(ステップS307)。
メンバーM10は、表示部240に表示された認識結果が「佐竹さん」であることを目視確認(ステップS309)し、改めて「佐藤さん」と発話し直す(ステップS311)。そして、音声バッファ231は、このときの「佐藤さん」という入力音声を、既に記憶された「佐竹さん」という入力音声の後に記憶する(ステップS313)とともに、音声認識部232は、「佐藤さん」という正しい入力音声を認識する(ステップS315)。
このとき、表示部240に既に表示されている「佐竹さん」の表示は、「佐藤さん」というフレーズに上書きされて表示される(ステップS317)。メンバーM10は、表示部240に正しく表示された内容を目視で確認(ステップS319)する。ステップS319以降は、図11に示すシーケンス図と同様の処理が行われる。つまり、メンバーM10は「ちょっといいですか?」と発話し(ステップS321)、音声バッファ231が入力音声を記憶する(ステップS323)とともに、音声認識部232は、「ちょっといいですか?」という入力音声を認識する(ステップS325)。次いで、接続コマンド検出部234にて接続コマンドC1が成立した後(ステップS327)、接続制御部236から通信部260へ制御指示が送信され、第1の端末20と、第2の端末20とが接続される(ステップS329)。そして、第2の端末20へ音声バッファ231に記憶された入力音声が送信される(ステップS331)。
ステップS331において、送信される入力音声は、音声バッファ231に記憶された入力音声の末尾から一定の長さまで遡った箇所を参照起点として、音声バッファ231を参照し、入力音声が送信開始される。その結果、第2の端末20に対して「佐藤さん ちょっといいですか?」という音声が出力され、対話相手である佐藤さんは、かかる音声を聞くことができる。
上記のように、音声認識部232で入力音声の誤認識が発生した場合でも、対話要求送信側のメンバーが、表示部240に表示された呼び名を確認して、呼びかけ直すことができる。その結果、音声認識率が100%でなくとも、誤接続が抑制したり、正しい接続先を選択するためのタッチ操作が不要になり、接続精度が向上する。
<音声バッファ231の参照時間>
ここで、第2の端末20に入力音声を出力する際の、音声バッファ231の参照方法について説明する。音声バッファ231を参照する時間は、固定された長さでもよいし、図13に示すように、名称C12、敬称C14、呼出確認C16のそれぞれのフレーズに対して、必要な時間を割り当てておき、認識結果に基づいて、参照する時間を定めてもよい。図13は、音声バッファ長をフレーズごとに割り当てた一例を示す説明図である。図13では、例えば、「佐藤」、「鈴木」、「高橋」等の名称C12にそれぞれ1.5秒の音声バッファ長が割り当てられている。「さん」、「くん」の敬称C14に対しては音声バッファ長は0.5秒割り当てられ、「部長」、「課長」という敬称C14に対しては0.7秒が割り当てられている。同様に、呼出確認C16について、例えば、「ちょっといい?」というフレーズに対しては2秒の音声バッファ長が割り当てられ、「ちょっといいですか?」というフレーズに対しては3秒の音声バッファ長が割り当てられている。そして、これらの割り当てられた音声バッファ長を基に、音声バッファ231に記憶された入力音声のフレーズに対応する音声バッファ長の合計を、音声バッファ231を参照する時間として定めることができる。例えば、音声バッファ231に記憶された入力音声が「佐藤さん ちょっといいですか?」である場合、音声バッファ231の参照時間は5秒となり、音声バッファ231に記憶された入力音声の末尾から5秒遡った箇所を参照起点として、音声バッファ231を参照する。その結果、第2の端末20に「佐藤さん ちょっといいですか?」という入力音声が出力される。かかるバッファ長の割り当て情報は、音声認識部232に記憶されていてもよい。なお、音声バッファ231のサイズは、入力音声を記憶するのに十分な長さを確保しておく必要がある。
また、かかる音声バッファ231は、通常リングバッファの形態をとることが多く、リングバッファの場合、記憶するデータが記憶可能な大きさを超えるときは、先頭からデータが上書きされながら記憶される。例えば、図12に示す処理シーケンス図では、ステップS311で名称の呼び直しがされており、引き続くステップS313では、呼び直されて生じた入力音声が既に記憶された入力音声の後に記憶されている。さらに、ステップS321で生じた入力音声は、ステップS323で音声バッファ231に記憶されるが、合計の発話長がバッファサイズを超えるため、入力音声が音声バッファ231の先頭から上書きされる。そして、ステップS331における音声バッファ231内容の送信時は、記憶データを末尾からさかのぼることで、入力音声の先頭、すなわち名称から入力音声を参照して送信することができる。
以上説明したように、本実施形態によれば、対話したい相手に対して、その相手があたかも複数のユーザが同一空間に存在するかのような感覚でユーザ間の会話を開始することが可能となる。
<<4.変形例>>
以上、本発明の実施形態を説明した。以下では、本発明の実施形態の変形例を説明する。なお、以下に説明する変形例は、また、変形例は、本発明の実施形態で説明した構成に代えて適用されてもよいし、本発明の実施形態で説明した構成に対して追加的に適用されてもよい。
(第1の変形例)
本発明の実施形態では、2つの拠点間で、対話を開始できるような構成について説明したが、拠点数は2つに限られない。このとき、俯瞰映像及び環境音は、取得するデバイスを複数備えて切り替えられるようにすることで、相手の様子を伺うことができるようになる。また、俯瞰映像及び環境音は、いずれか一つのみ、あるいは両方がなくても構わない。
(第2の変形例)
本発明の実施形態では、対話要求送信側のメンバーと、対話要求受信側メンバーが、それぞれ一人のとき、つまり、第1の端末20と第2の端末20がそれぞれ1台の場合について説明した。しかし、接続する第1の端末20及び第2の端末20は、それぞれ一台だけでなく、複数の端末20とすることができる。そのときの接続コマンド検出に利用される名称C12は、必要なグループ名等を登録しておき、その名称C12が認識された場合に、そのグループに属する端末情報が取得され、複数の端末20が接続されるようにすることができる。
(第3の変形例)
本発明の実施形態では、対話相手に直接話しかけることができるような構成としたが、対話要求受信側のメンバーが目上の人等であり、直接話しかけることが適切でないような場合は、エージェントを介する構成にし、対話要求送信側メンバーと、対話要求受信側メンバーとを自動判別して動作するように構成することも可能である。
<<5.ハードウェア構成>>
以上、本発明の実施形態について説明した。上述した映像処理及び音声処理などの情報処理は、ソフトウェアと、以下に説明する端末20のハードウェアとの協働により実現される。
図14は、端末20のハードウェア構成を示したブロック図である。端末20は、CPU(Central Processing Unit)271と、ROM(Read Only Memory)272と、RAM(Random Access Memory)273と、ホストバス274と、を備える。また、端末20は、ブリッジ275と、外部バス276と、インタフェース277と、入力装置278と、表示装置279と、音声出力装置280と、ストレージ装置(HDD)281と、ドライブ282と、ネットワークインタフェース283とを備えることができる。
CPU271は、演算処理装置及び制御装置として機能し、各種プログラムに従って端末20内の動作全般を制御する。また、CPU271は、マイクロプロセッサであってもよい。ROM272は、CPU271が使用するプログラムや演算パラメータ等を記憶する。RAM273は、CPU271の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバスなどから構成されるホストバス274により相互に接続されている。CPU271、ROM272及びRAM273とソフトウェアとの協働により、音声バッファ231、音声認識部232及び接続コマンド検出部234などの機能が実現され得る。
ホストバス274は、ブリッジ275を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス276に接続されている。なお、必ずしもホストバス274、ブリッジ275及び外部バス276を分離構成する必要はなく、1つのバスにこれらの機能を実装してもよい。
入力装置278は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、センサー、スイッチ及びレバーなどメンバーが情報を入力するための入力手段と、メンバーによる入力に基づいて入力信号を生成し、CPU271に出力する入力制御回路などから構成され得る。端末20の操作は、通常は、音声による操作を行うが、該入力装置278を操作することにより、端末20に対して各種のデータを入力したり処理動作を指示することもできる。
表示装置279は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、プロジェクター装置、OLED(Organic Light Emitting Diode)装置及びランプなどの表示装置を含む。表示装置279は、例えば表示部240に対応する。また、音声出力装置280は、スピーカー及びヘッドホンなどの音声出力装置を含む。音声出力装置280は、例えば、音声出力部250に対応する。
ストレージ装置281は、本実施形態にかかる端末20の記憶部の一例として構成されたデータ記憶用の装置である。ストレージ装置281は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置及び記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置281は、例えば、HDD(Hard Disk Drive)やSSD(Solid Strage Drive)、あるいは同等の機能を有するメモリ等で構成される。このストレージ装置281は、ストレージを駆動し、CPU271が実行するプログラムや各種データを記憶する。
ドライブ282は、記憶媒体用リーダライタであり、端末20に内蔵、あるいは外付けされる。ドライブ282は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体24に記録されている情報を読み出して、RAM273またはストレージ装置281に出力する。また、ドライブ282は、リムーバブル記憶媒体24に情報を書き込むこともできる。
ネットワークインタフェース283は、例えば、ネットワーク12に接続するための通信デバイス等で構成された通信インタフェースである。また、ネットワークインタフェース283は、無線LAN(Local Area Network)対応端末であっても、有線による通信を行うワイヤー端末であってもよい。
<<6.むすび>>
以上説明したように、本発明の実施形態によれば、複数のユーザが同一空間に存在するかのような感覚でユーザ間の会話が開始されることを支援することが可能である。
なお、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
例えば、本明細書の端末20の処理における各ステップは、必ずしもシーケンス図またはフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、端末20の処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
また、本発明の実施形態は、オフィス間におけるテレワークシステムの端末20として利用でき、さらに、オフィスとオフィス外の業務空間との間、及びオフィス外の業務空間どうしを結ぶシステムにおいても利用可能である。オフィス外の業務空間とは、例えば、在宅勤務者が業務を行う自宅の業務スペース等が挙げられる。
さらに、端末20に内蔵されるCPU、ROM及びRAMなどのハードウェアに、上述した端末20の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供される。
10 撮像装置
11 端末管理サーバ
12 ネットワーク
20 端末
220 撮像部
230 音声入力部
231 音声バッファ
232 音声認識部
234 接続コマンド検出部
235 切断コマンド検出部
236 接続制御部
237 出力制御部
239 端末情報保持部
240 表示部
250 音声出力部
260 通信部

Claims (10)

  1. 入力音声を記憶する音声バッファと、
    前記入力音声から、対象の呼び名と前記対象への呼出確認とを含む接続コマンドを検出し、前記呼び名を検出する呼び名検出部、及び前記呼出確認を検出する呼出検出部を含む接続コマンド検出部と、
    前記呼出検出部により前記呼出確認が検出される前に、前記呼び名検出部により検出された呼び名の表示を制御する表示制御部と、
    前記接続コマンドに含まれる呼び名に対応する他の端末との接続を制御する接続制御部と、
    前記他の端末が接続された後に、前記音声バッファに記憶された前記接続コマンドを含む入力音声を前記他の端末に送信する送信部と、
    を備える、端末。
  2. 前記接続コマンド検出部は、タイマーを含み、
    前記表示制御部は、
    前記呼出検出部により前記呼出確認が検出される前に、呼出確認が検出可能なフレーズの候補の表示を制御する請求項1に記載の端末。
  3. 前記送信部は、前記音声バッファに記憶された入力音声の末尾から遡った箇所を起点にして前記入力音声の送信を開始する、請求項1又は2に記載の端末。
  4. 前記送信部は、前記音声バッファに記憶された入力音声の末尾から、前記接続コマンド検出部により検出された前記接続コマンドに応じた時間分遡った箇所を起点にして、前記入力音声の送信を開始する、請求項3に記載の端末。
  5. 前記端末は、前記入力音声から切断コマンドを検出する切断コマンド検出部をさらに備え、
    前記接続制御部は、前記切断コマンド検出部により前記切断コマンドが検出されたことに基づいて、前記他の端末との接続を切断する、請求項1〜4のいずれか一項に記載の端末。
  6. 前記切断コマンド検出部は、事前に設定された第1の切断コマンド辞書または第2の切断コマンド辞書に含まれるコマンドを前記切断コマンドとして検出し、
    前記他の端末との接続から所定時間が経過する以前は前記第1の切断コマンド辞書を用いて、前記他の端末との接続から前記所定時間が経過した後は前記第2の切断コマンド辞書を用いて前記切断コマンドを検出する、請求項5に記載の端末。
  7. 前記端末は撮像部をさらに備え、
    前記送信部は、前記他の端末が接続された後に、前記撮像部により得られた撮像画像を前記他の端末に送信する、請求項1〜6のいずれか一項に記載の端末。
  8. コンピュータを、
    入力音声から、対象の呼び名と前記対象への呼出確認とを含む接続コマンドを検出し、前記呼び名を検出する呼び名検出部、及び前記呼出確認を検出する呼出検出部を含む接続コマンド検出部と、
    前記呼出検出部により前記呼出確認が検出される前に、前記呼び名検出部により検出された呼び名の表示を制御する表示制御部と、
    前記接続コマンドに含まれる呼び名に対応する他の端末との接続を制御する接続制御部と、
    前記他の端末が接続された後に、音声バッファに記憶された前記接続コマンドを含む入力音声を前記他の端末に送信する送信部と、
    として機能させるための、プログラム。
  9. 入力音声を記憶する音声バッファに記憶することと、
    前記入力音声から、対象の呼び名と前記対象への呼出確認とを含む接続コマンドを検出することと、
    前記呼出確認が検出される前に、検出された前記呼び名の表示を制御することと、
    前記接続コマンドに含まれる呼び名に対応する他の端末との接続を制御することと、
    前記他の端末が接続された後に、前記音声バッファに記憶された前記接続コマンドを含む入力音声を前記他の端末に送信することと、
    を含む、通信方法。
  10. 複数の端末を有する通信システムであって、
    前記複数の端末のうちの第1の端末は、
    入力音声を記憶する音声バッファ、
    前記入力音声から、対象の呼び名と前記対象への呼出確認とを含む接続コマンドを検出し、前記呼び名を検出する呼び名検出部、及び前記呼出確認を検出する呼出検出部を含む接続コマンド検出部、
    前記呼出検出部により前記呼出確認が検出される前に、前記呼び名検出部により検出された呼び名の表示を制御する表示制御部、
    前記接続コマンドに含まれる呼び名に対応する第2の端末との接続を制御する接続制御部、及び
    前記第2の端末が接続された後に、前記音声バッファに記憶された前記接続コマンドを含む前記入力音声を前記第2の端末に送信する送信部、
    を有し、
    前記第2の端末は、前記第1の端末から送信される前記入力音声を出力する、通信システム。
JP2017182211A 2017-09-22 2017-09-22 端末、プログラム、通信方法及び通信システム Active JP6897451B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017182211A JP6897451B2 (ja) 2017-09-22 2017-09-22 端末、プログラム、通信方法及び通信システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017182211A JP6897451B2 (ja) 2017-09-22 2017-09-22 端末、プログラム、通信方法及び通信システム

Publications (2)

Publication Number Publication Date
JP2019057876A JP2019057876A (ja) 2019-04-11
JP6897451B2 true JP6897451B2 (ja) 2021-06-30

Family

ID=66107796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017182211A Active JP6897451B2 (ja) 2017-09-22 2017-09-22 端末、プログラム、通信方法及び通信システム

Country Status (1)

Country Link
JP (1) JP6897451B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL87377A (en) * 1987-10-02 1992-01-15 Motorola Inc Device and method for terminating a telephone call by voice command
KR100617711B1 (ko) * 2004-06-25 2006-08-28 삼성전자주식회사 휴대단말기에서 음성인식구동 방법
JP2009021923A (ja) * 2007-07-13 2009-01-29 Yamaha Corp 音声通信装置
JP2010183205A (ja) * 2009-02-03 2010-08-19 Panasonic Electric Works Co Ltd 通話システム
JP2012029066A (ja) * 2010-07-23 2012-02-09 Advanced Telecommunication Research Institute International 携帯電話機
KR101664080B1 (ko) * 2015-07-28 2016-10-10 현대자동차 주식회사 음성 다이얼링 시스템 및 방법

Also Published As

Publication number Publication date
JP2019057876A (ja) 2019-04-11

Similar Documents

Publication Publication Date Title
JP7668309B2 (ja) 共有された音声対応デバイスにおける電話の処理
EP2210214B1 (en) Automatic identifying
US9106447B2 (en) Systems, methods and apparatus for providing unread message alerts
WO2018147687A1 (en) Method and apparatus for managing voice-based interaction in internet of things network system
CN109274831B (zh) 一种语音通话方法、装置、设备及可读存储介质
US10403272B1 (en) Facilitating participation in a virtual meeting using an intelligent assistant
US20100178903A1 (en) Systems and Methods to Provide Personal Information Assistance
CN113380275B (zh) 语音处理方法、装置、智能设备及存储介质
CN107464557A (zh) 通话录音方法、装置、移动终端及存储介质
US11700325B1 (en) Telephone system for the hearing impaired
CN102655544A (zh) 一种发起通信的方法及通信终端
JP6842227B1 (ja) グループ通話システム、グループ通話方法及びプログラム
CN109257498B (zh) 一种声音处理方法及移动终端
WO2023029299A1 (zh) 耳机通信方法、耳机设备及计算机可读存储介质
JP5005103B1 (ja) 通話システム
JP2009239466A (ja) 電話受付システム、電話受付方法、プログラム、及び記録媒体
JP2008242837A (ja) コミュニケーションの状況を管理する装置、方法およびプログラム
JP7553645B2 (ja) 音声処理装置、会議システム、及び音声処理方法
JP6897451B2 (ja) 端末、プログラム、通信方法及び通信システム
JP2020113938A (ja) 情報処理装置、情報処理方法、情報処理システムおよびプログラム
JP6933163B2 (ja) 通信装置、通信システム、通信方法およびプログラム
JP3916387B2 (ja) 電話応答コンピュータシステム,該システムの機能を実現するためのボード及び記録媒体
CN102984360B (zh) 一种移动终端的通话方法及系统
JP4230982B2 (ja) 通話補助装置、通話補助方法、通話補助プログラムおよび通話補助システム
CN113194021B (zh) 电子装置、消息播放控制系统以及消息播放控制方法

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190327

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210511

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210524

R150 Certificate of patent or registration of utility model

Ref document number: 6897451

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150