JP6710037B2 - 通信装置 - Google Patents

通信装置 Download PDF

Info

Publication number
JP6710037B2
JP6710037B2 JP2015208939A JP2015208939A JP6710037B2 JP 6710037 B2 JP6710037 B2 JP 6710037B2 JP 2015208939 A JP2015208939 A JP 2015208939A JP 2015208939 A JP2015208939 A JP 2015208939A JP 6710037 B2 JP6710037 B2 JP 6710037B2
Authority
JP
Japan
Prior art keywords
user
communication device
voice
command
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015208939A
Other languages
English (en)
Other versions
JP2017083526A (ja
Inventor
和永 加藤
和永 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2015208939A priority Critical patent/JP6710037B2/ja
Priority to PCT/IB2016/057805 priority patent/WO2017068560A1/ja
Priority to US15/766,791 priority patent/US10650825B2/en
Priority to CN201680062048.2A priority patent/CN108475504A/zh
Publication of JP2017083526A publication Critical patent/JP2017083526A/ja
Application granted granted Critical
Publication of JP6710037B2 publication Critical patent/JP6710037B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/083Recognition networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Selective Calling Equipment (AREA)

Description

本開示は、複数のデバイスが通信することで、これらデバイスが連携して動作するシステムに関し、これらデバイス間の連携の信頼性を向上させる技術に関する。
従来より、例えば家屋などの施設において、複数のデバイスが通信するシステムが利用されている。例えば、情報家電が家庭内のネットワークにより接続され、ユーザの携帯端末から、これら情報家電に対して指令を送信することで、ユーザが情報家電を制御することを可能としている。こうすることでユーザの利便性が高まるため、様々な技術が検討されている。例えば、特開2012−37783号公報(特許文献1)は、利便性を低下させることなく、操作性を向上させた情報家電システムについて記載している。特許文献1の技術によると、音声認識手段による音声認識の結果を、認識結果情報として情報家電に送信する。これにより、ネットワークにより接続される情報家電からなるシステムにおいて、ユーザが携帯端末に対して音声入力をすることにより、音声認識サーバを経由して情報家電を制御することができる。
特開2012−37783号公報 特開2006−17936号公報
セキュリティ対策等の観点から、情報家電の動作を制御することができるユーザを限定したいことがある。例えば、施設内に設置されるテレビ、エアコンその他の情報家電の動作を制御することができるユーザを、施設に居住するユーザ、または、施設を管理するユーザその他のユーザに限定したいことがある。しかし、特許文献1の技術によると、音声により情報家電に指令を行うユーザが誰であるかにかかわらず、音声認識により示される指令内容に基づいて各情報家電を制御している。また、個人を識別するための情報をユーザが音声入力する等によりユーザを特定するための情報を音声認識サーバへ送信する場合、セキュリティの観点から、これら個人を識別するための情報を秘匿化する等の処理を要する。
したがって、複数のデバイスが通信するシステムにおいて、情報家電の制御にかかるセキュリティを一定水準以上に発揮させつつ情報家電の動作を容易に制御することができる技術が必要とされている。本開示は、これら複数のデバイスが通信するシステムにおいて、デバイス間の連携の信頼性を向上させる技術を提供することを目的としている。
一実施形態に従う通信装置は、1以上の通信機器と通信可能に構成されている。通信装置は、音声の入力を受け付けて、受け付けた音声に基づく音声信号を出力するように構成された音声処理部と、通信装置の動作を制御するように構成された制御部とを備える。制御部は、受け付けた音声信号と、ユーザを識別するために記憶部に蓄積される音声データとに基づいて、ユーザを認証する処理を行うユーザ識別部と、受け付けた音声信号に音声認識処理を行うことにより、受け付けた音声に示されるユーザの指示内容を判別する指示判別部と、ユーザ識別部によりユーザが認証され、指示判別部によりユーザの指示内容が判別された場合に、判別されたユーザの指示内容に関連する通信機器に対して指示内容にかかる指令を送信する連携機器処理部とを含む。
一実施形態に従う通信装置は、サーバ装置と通信可能なものである。サーバ装置は、ユーザを識別するための音声データを記憶するように構成されている。通信装置は、1以上の通信機器と通信可能に構成されている。通信装置は、音声の入力を受け付けて、受け付けた音声に基づく音声信号を出力するように構成された音声処理部と、通信装置の動作を制御するように構成された制御部とを備える。制御部は、音声信号をサーバ装置に送信することにより、音声信号に基づくユーザを認証する処理、および、音声信号に示されるユーザの指示内容を判別する処理をサーバ装置に行わせ、処理結果をサーバ装置から受信し、サーバ装置によりユーザが認証され、ユーザの指示内容が判別された場合に、判別されたユーザの指示内容に関連する通信機器に対して指示内容にかかる指令を送信する連携機器処理部を含む。
一実施形態によると、ユーザが認証され、ユーザの指示内容が音声認識処理により判別した場合に通信機器に対して通信装置が指令を送信するため、情報家電などの通信機器を制御することができるユーザを限定しつつ、音声認識により情報家電をユーザが容易に制御することができる。そのため、デバイス間の連携の信頼性を向上させることができる。
この発明の上記および他の目的、特徴、局面および利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。
本実施形態の情報家電システムの概要を示す図である。 通信装置10の構成とサーバ20の構成とを示すブロック図である。 装着型通信機器30の構成の概略を示す図である。 通信装置10がユーザの音声の入力を受け付けて、受け付けた音声に基づきユーザを認証する処理およびユーザの指示内容を判別し、処理結果に応じて情報家電40に指令を送信する処理を示すフローチャートである。
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
<実施の形態>
本実施形態では、スマートフォンなどの通信装置と、テレビ、エアコンなどの情報家電(通信機器)とによって構成される情報家電システムについて説明する。
図1は、本実施形態の情報家電システムの概要を示す図である。図1に示すように、情報家電システムは、スマートフォンなどの通信装置10Aと、情報家電40A(テレビ)、情報家電40B(エアコン)などの通信機器(以下、情報家電40A、情報家電40Bなどの情報家電を「情報家電40」と総称することもある)とが通信可能に構成されている。例えば、通信装置10Aは、施設内に設置されるブロードバンドルータ91を介して情報家電40と通信する。装着型通信機器30は、ユーザが装着するウェアラブルデバイスである。装着型通信機器30は、例えばBluetooth(登録商標)などの近距離無線規格に従って通信装置10Aと通信する。例えば、装着型通信機器30は、ユーザの音声入力を受け付けるマイクを備えており、マイクで受け付けた音声を音声信号に変換して通信装置10Aへ送信する。
通信装置10Aは、ブロードバンドルータ91を介してネットワーク90と接続する。通信装置10Bは、無線基地局92を介してネットワーク90と接続する。通信装置10Aと通信装置10Bとは、ネットワーク90を介してサーバ20と通信する。通信装置10Bは、ネットワーク90を介して情報家電40の動作を制御するための指令を送信することができる。以下、通信装置10Aと通信装置10Bとを「通信装置10」と総称することもある。
サーバ20は、通信装置10A等から音声信号を受け付けて、音声認識処理を行う。サーバ20は、音声認識処理を行うことにより、音声入力を行ったユーザの意図を特定して、音声認識処理の結果を通信装置10A等へ応答する。
通信装置10Aおよび通信装置10Bは、例えばスマートフォンであるが、これに限られない。通信装置10Aおよび通信装置10Bは、3G、LTE(Long Term Evolution)、高速無線LAN(Local Area Network)規格、Bluetooth(登録商標)などの複数の無線通信規格に対応している。図1に示すように、通信装置10Aのユーザは、家に滞在している。家には様々な情報家電40(例えば、テレビ40Aおよびエアコン40B)が設置されている。情報家電40は、通信機能を有しており、ブロードバンドルータ91と通信することにより、ネットワーク90を介してサーバ20と通信することができる。情報家電40に含まれる各家電機器は、逐次、動作状況をサーバ20へ送信する。サーバ20は、情報家電40に含まれる各家電機器の動作状況を、ネットワーク90を介して受信し、受信した動作状況の情報を蓄積する。
<構成>
図2を参照して、本実施形態にかかる各装置を詳細に説明する。
図2は、通信装置10の構成とサーバ20の構成とを示すブロック図である。通信装置10と装着型通信機器30とは互いに通信可能である。
図2に示すように、通信装置10は、アンテナ101と、無線通信部111と、物理操作キー131と、操作受付部(タッチパネル)141と、ディスプレイ142と、電源制御部143と、カメラ145と、音声処理部146と、マイク147と、スピーカ148と、記憶部150と、制御部160とを含む。
アンテナ101は、通信装置10が発する信号を電波として放射する。また、アンテナ101は、空間から電波を受信して受信信号を無線通信部111へ与える。本実施形態では、通信装置10は、複数の無線通信規格に対応している。
無線通信部111は、通信装置10が他の無線機器と通信するため、アンテナ101等を介して信号を送受信するための変復調処理などを行う。無線通信部111は、チューナー、RSSI(Received Signal Strength Indicator)算出回路、CRC(Cyclic Redundancy Check)算出回路、高周波回路などを含む通信モジュールである。無線通信部111は、通信装置10が送受信する無線信号の変復調や周波数変換を行い、受信信号を制御部160へ与える。
物理操作キー131は、物理的な入力装置であり、ユーザによる押下操作を受け付ける。物理操作キー131は、ユーザの押下操作に応じて、操作内容を示す信号を制御部160へ出力する。
操作受付部141は、ユーザの入力操作を受け付ける。操作受付部141は、例えば静電容量方式のタッチパネルを用いることによって、ユーザの接触位置を検出する。操作受付部141は、検出したユーザの接触位置を示す信号を入力操作として制御部160へ出力する。
ディスプレイ142は、制御部160の制御に応じて、画像、動画、テキストなどのデータを表示する。ディスプレイ142は、例えばLCD(Liquid Crystal Display)や有機EL(Electro-Luminescence)ディスプレイによって実現される。
電源制御部143は、通信装置10の各回路に対する電力の供給を制御する。電源制御部143は、例えば電源制御用IC(Integrated Circuit)である。バッテリ144は、通信装置10の各回路を動作させるための電力を供給する供給源である。バッテリ144に充電される電力は、電源制御部143の制御に従って各回路へ供給される。
音声処理部146は、音声信号の変復調を行う。音声処理部146は、マイク147から与えられる信号を変調して、変調後の信号を制御部160へ与える。また、音声処理部146は、音声信号をスピーカ148へ与える。音声処理部146は、例えば音声処理用のプロセッサによって実現される。マイク147は、音声入力を受け付けて、当該音声入力に対応する音声信号を音声処理部146へ与える。スピーカ148は、音声処理部146から与えられる音声信号を音声に変換して当該音声を通信装置10の外部へ出力する。
記憶部150は、例えばフラッシュメモリ等により構成され、通信装置10が使用するデータおよびプログラムを記憶する。ある局面において、記憶部150は、ユーザ音声情報151と、機器管理情報152とを記憶する。また、記憶部150は、ユーザが複数である場合に、複数のユーザそれぞれについて、指令を送信可能な情報家電40および送信可能な指令内容の情報を管理して記憶する。
ユーザ音声情報151は、音声によりユーザを識別するために記憶部150に記憶される、ユーザのサンプルの音声データである。例えば、通信装置10は、ユーザが通話等を行う都度、ユーザの音声をサンプリングしてユーザ音声情報151として記憶する。
機器管理情報152は、通信装置10が通信する情報家電40を管理するための情報である。情報家電40を管理するための情報とは、例えば、通信装置10が情報家電40と通信するためのアドレス(MAC(media access control)アドレスなど)などである。例えば、通信装置10は、ビーコン信号を送出すること等により、通信装置10と通信中の情報家電40のリストを機器管理情報152として記憶部150に記憶する。
制御部160は、記憶部150に記憶されるプログラムを読み込んで、プログラムに含まれる命令を実行することにより、通信装置10の動作を制御する。制御部160は、例えばアプリケーションプロセッサである。制御部160は、プログラムに従って動作することにより、音声入力受付部161と、ユーザ識別部162と、指示判別部163と、連携機器処理部164としての機能を発揮する。
音声入力受付部161は、マイク147によりユーザの音声の入力を受け付けて、音声信号を生成する。
ユーザ識別部162は、音声入力受付部161により生成された音声信号と、ユーザを識別するために記憶部150に蓄積されるユーザ音声情報151とに基づいて、ユーザを認証する処理を行う。ユーザ識別部162は、ユーザが複数である場合に、複数のユーザのうちいずれのユーザが音声を通信装置10に入力したかを認証する。
指示判別部163は、音声入力受付部161により生成された音声信号に音声認識処理を行うことにより、音声に示されるユーザの指示内容を判別する。
連携機器処理部164は、ユーザ識別部162によりユーザが認証され、指示判別部163によりユーザの指示内容が判別された場合に、判別されたユーザの指示内容に関連する情報家電40に対して、指示内容にかかる指令を送信する。連携機器処理部164は、指示判別部163によるユーザの指示内容の判別結果が、通信装置10と通信可能な1以上の情報家電40に対する指示である場合に、その指令を、指令の送信対象となる情報家電40へ送信する。連携機器処理部164は、ユーザの指示内容に関連する情報家電40が複数ある場合に、いずれの情報家電40に対して指令を送信するかの選択操作をユーザから受け付けて、選択結果に基づいて、各情報家電の優先度を設定し、設定された優先度に基づいて、選択対象となる情報家電の候補をユーザに報知する。連携機器処理部164は、ユーザ識別部162によるユーザの認証と、指示判別部163によるユーザの指示内容の判別とのうち少なくともいずれかに失敗した場合に、情報家電40に対する指令の送信を停止する。連携機器処理部164は、ユーザ識別部162により認証されたユーザについて、指令を送信可能な情報家電40および送信可能な指令内容の情報の管理内容に従って、指令を情報家電40に送信する。
図2を参照して、サーバ20は、通信部202と、記憶部206と、制御部207とを含む。記憶部206は、フラッシュメモリ、HDD(Hard Disk Drive)、RAM(Random Access Memory)等により構成され、サーバ20が使用するプログラムを記憶し、サーバ20が使用する各種のデータを蓄積する。通信部202は、サーバ20が他の通信機器と通信するための変復調処理などを行う通信インタフェースである。
ある局面において、記憶部206は、ユーザ音声情報261と、機器管理情報262とを記憶する。ユーザ音声情報261は、音声によりユーザを識別するための、ユーザのサンプルの音声データである。予めメモリに記憶されるユーザのサンプルの音声と、マイク147等により入力される音声とを比較することによるユーザの認証処理は、通信装置10が行うが、この他に、サーバ20が通信装置10からマイク147等により入力される音声を受信して、受信した音声と、ユーザ音声情報261とを比較することで行うこととしてもよい。
機器管理情報262は、通信装置10が通信する情報家電40を管理するための情報である。機器管理情報262は、例えば、施設内に配置される情報家電40のアドレス、情報家電40の消費電力の情報その他の情報を含む。
制御部207は、記憶部206に記憶されるプログラムを読み込んで実行することにより、サーバ20の動作を制御する。制御部207は、例えば複数のプロセッサによって実現される。制御部207は、プログラムに従って動作することにより、通話処理部271と、ユーザ識別部272と、指示判別部273と、連携機器処理部274として機能する。
通話処理部271は、通信装置10Aと通信装置10Bとが、例えば通話アプリケーションを使用して通話処理を行う際に、これら通信装置間の通信接続の確立および音声データの送受信を行う。
ユーザ識別部272は、通信装置10の音声入力受付部161により生成された音声信号を受信して、受信した音声信号と、ユーザを識別するために記憶部206に蓄積されるユーザ音声情報261とに基づいて、ユーザを認証する処理を行う。ユーザ識別部272は、ユーザが複数である場合に、複数のユーザのうちいずれのユーザが音声を通信装置10に入力したかを認証する。
指示判別部273は、通信装置10の音声入力受付部161により生成された音声信号に音声認識処理を行うことにより、音声に示されるユーザの指示内容を判別する。
連携機器処理部274は、ユーザ識別部162によりユーザが認証され、指示判別部163によりユーザの指示内容が判別された場合に、判別されたユーザの指示内容に関連する情報家電40に対して、指示内容にかかる指令を送信する。
このように、ユーザの音声のサンプルデータに基づき、通信装置10に対して音声入力をしたユーザを認証する処理と、音声信号に対して音声認識処理を行うことによりユーザの指示内容を判別する処理と、判別されたユーザの指示内容に関連する情報家電40に対して指令を送信する処理とを、通信装置10の他にサーバ20が行うこととしてもよい。
図3は、装着型通信機器30の構成の概略を示す図である。装着型通信機器30は、人体に装着される装置であり、例えば、腕時計型のデバイス、メガネ型のデバイス、腕輪型のデバイスなど様々な形態により実現される。装着型通信機器30は、Bluetooth(登録商標)等の近距離無線通信規格により通信装置10と接続され、通信装置10と連携して様々な処理を行う。例えば、装着型通信機器30は、様々な通知(メッセージングアプリケーションの新着メッセージなど)を通信装置10から受信して、音声等によりユーザに通知を報知する。
図3に示すように、装着型通信機器30は、アンテナ301と、無線通信部311と、物理操作キー331と、操作受付部(タッチパネル)341と、ディスプレイ342と、音声処理部346と、マイク347と、スピーカ348と、記憶部350と、制御部360とを含む。
アンテナ301は、装着型通信機器30が発する信号を電波として放射する。また、アンテナ301は、空間から電波を受信して受信信号を無線通信部311へ与える。本実施形態では、装着型通信機器30は、複数の無線通信規格に対応している。
無線通信部311は、アンテナ301等を介して信号を送受信するための変復調処理などを行う。無線通信部311は、チューナー、RSSI算出回路、CRC算出回路、高周波回路などを含む通信モジュールである。無線通信部311は、装着型通信機器30が送受信する無線信号の変復調や周波数変換を行い、受信信号を制御部360へ与える。
物理操作キー331は、物理的な入力装置であり、ユーザによる押下操作を受け付ける。物理操作キー331は、ユーザの押下操作に応じて、操作内容を示す信号を制御部360へ出力する。例えば、装着型通信機器30が腕時計型のウェアラブルデバイスである場合、物理操作キー331は、腕時計に備わる竜頭などである。
操作受付部341は、ユーザの入力操作を受け付ける。操作受付部341は、例えば静電容量方式のタッチパネルを用いることによって、ユーザの接触位置を検出する。操作受付部341は、検出したユーザの接触位置を示す信号を入力操作として制御部360へ出力する。
ディスプレイ342は、制御部360の制御に応じて、画像、動画、テキストその他の情報を表示する。ディスプレイ342は、例えばLCDや有機ELディスプレイによって実現される。
音声処理部346は、音声信号の変復調を行う。音声処理部346は、マイク347から与えられる信号を変調して、変調後の信号を制御部360へ与える。また、音声処理部346は、音声信号をスピーカ348へ与える。音声処理部346は、例えば音声処理用のプロセッサによって実現される。
マイク347は、音声入力を受け付けて、当該音声入力に対応する音声信号を音声処理部346へ与える。スピーカ348は、音声処理部346から与えられる音声信号を音声に変換して当該音声を装着型通信機器30の外部へ出力する。
記憶部350は、例えばフラッシュメモリ等により構成され、装着型通信機器30が使用するデータおよびプログラムを記憶する。ある局面において、記憶部350は、ユーザ音声データ352を記憶する。ユーザ音声データ352は、装着型通信機器30がマイク347を介して入力を受け付けた音声に対してデジタル変換処理を行うことで生成される音声信号を示すデータである。
制御部360は、記憶部350に記憶されるプログラムを読み込んで、プログラムに含まれる命令を実行することにより、装着型通信機器30の動作を制御する。制御部360は、例えばアプリケーションプロセッサである。制御部360は、プログラムに従って動作することにより、通信処理部361と、音声入力受付部362としての機能を発揮する。
通信処理部361は、装着型通信機器30が通信装置10等の外部の装置と通信接続を確立し、外部の装置とデータを送受信する処理を行う。例えば、装着型通信機器30は、通信装置10とBluetooth(登録商標)、無線LAN規格等により通信接続する。
音声入力受付部362は、装着型通信機器30がマイク347を介して音声の入力を受け付けて、受け付けた音声に対してデジタル変換処理を行った音声信号を生成する処理を行う。
<動作>
図4を参照して、本実施形態の情報家電システムを構成する通信装置10の動作を説明する。
図4は、通信装置10がユーザの音声の入力を受け付けて、受け付けた音声に基づきユーザを認証する処理およびユーザの指示内容を判別し、処理結果に応じて情報家電40に指令を送信する処理を示すフローチャートである。
ステップS101において、通信装置10は、マイク147を介して、ユーザの音声入力を受け付ける。ユーザは、情報家電40に対する指令を含む音声をマイク147に入力する。
ステップS102において、通信装置10は、通話処理時等においてユーザの音声をサンプルデータとして蓄積したユーザ音声情報151と、ステップS101において入力を受け付けた音声による音声信号とを比較することにより声紋判別処理を行う。これにより、通信装置10は、ユーザの認証を行う。通信装置10は、声紋判別処理によりユーザを認証した場合(ステップS102においてYES)、ステップS103の処理を行い、声紋判別処理の結果、ユーザを認証することに失敗した場合(ステップS102においてNO)、ステップS104の処理を行う。
ステップS103において、通信装置10は、ステップS101において入力を受け付けた音声による音声信号に対して音声認識処理を行うことで、ユーザによる情報家電40への指令を含むユーザの意図を解釈する。
ステップS104において、通信装置10は、音声によるユーザの認証に失敗したことを、ディスプレイ142への表示、スピーカ148による音声出力によってユーザに通知する。
ステップS105において、通信装置10は、ステップS103の処理によるユーザの意図の解釈の結果、通信装置10が通信処理により連携している情報家電40が処理する内容か否かを判別する。例えば、通信装置10は、ステップS103の処理によるユーザの意図の解釈の結果において、情報家電40を識別する情報(例えば、ユーザの音声信号において、機器「エアコン」、機器「テレビ」など)を抽出する。通信装置10は、ユーザが指定した情報家電40と通信装置10とが通信可能であるか否かを、機器管理情報152を参照することで判定する。また、通信装置10は、ステップS103の処理によるユーザの意図の解釈の結果において、ユーザが情報家電40に対して指令する内容が、ユーザが指定した情報家電40において実行可能であるか判定する。通信装置10は、例えば、機器「エアコン」に対して、設定温度を変更する指令内容であれば、機器「エアコン」が実行可能である処理であると判定する。このように、通信装置10は、ユーザの意図の解釈の結果において、ユーザが指定する機器と、通信装置10とが通信処理により連携しているか否か、また、ユーザが指定した機器に対して、ユーザの指令内容が実行可能であるか否かを判定する。例えば、機器管理情報152において、通信装置10が通信により連携している機器の識別情報と、これら機器に対して送信することができる指令とが対応付けられている。ステップS103の処理によるユーザの意図の解釈の結果、通信装置10が通信処理により連携している情報家電40が処理する内容である場合(ステップS105においてYES)、通信装置10は、ステップS106の処理を行い、そうでない場合(ステップS105においてNO)、通信装置10は、ステップS107の処理を行う。
ステップS106において、通信装置10は、ステップS103の処理によるユーザの意図の解釈の結果、ユーザが指定する情報家電40が複数存在するか否かを判定する。通信装置10は、ユーザの意図の解釈の結果において、情報家電40を識別する情報を抽出し、抽出結果に基づいて、複数の機器に対する指令を含むか否かを判定する。例えば、ユーザの音声信号において、機器「エアコン」、機器「テレビ」のように、機器を識別する情報が複数含まれる場合に、通信装置10は、ユーザが指定する情報家電40が複数存在すると判定する。通信装置10は、ユーザの意図の解釈の結果において、複数の機器に対する指令を含むと判定した場合(ステップS106においてYES)、ステップS108の処理を行い、そうでない場合(ステップS106においてNO)、ステップS110の処理を行う。
ステップS107において、通信装置10は、ユーザの音声による指令を送信すべき情報家電40がないことを示すエラーの通知を、ディスプレイ142への表示、スピーカ148による音声出力によってユーザに通知する。
ステップS108において、通信装置10は、複数の情報家電40のうち、どの機器に対してユーザの指令を送信すべきかの指定をユーザに選択させるため、ディスプレイ142に選択対象となる機器の候補を表示する、またはスピーカ148で選択対象となる機器の候補を音声出力し、マイク147でユーザから音声入力により機器の指定を受け付ける等により、ユーザによる機器の選択を受け付ける。
ステップS109において、通信装置10は、ステップS108でユーザから選択を受け付けた機器を記憶する。通信装置10は、ユーザが選択した機器の情報を履歴として記憶することで、次回、複数の機器に対する指令をユーザが行った場合に、ユーザから機器の選択を受け付ける際、ユーザが選択した機器の履歴に応じて、例えばユーザの選択回数が多い機器を優先して選択候補としてユーザに通知する。例えば、通信装置10は、ユーザが指定する情報家電40が複数ある場合に、ユーザが機器を選択した回数の履歴に基づき、選択回数が多い機器を優先してディスプレイ142に表示する。
ステップS110において、通信装置10は、ユーザの指令に関連する情報家電40(ユーザの意図の解釈の結果において、ユーザが指定する情報家電40が複数存在する場合は、ユーザによって選択された情報家電40)に対し、ステップS103で解釈したユーザの意図に従う指令を通知する。例えば、通信装置10は、ユーザからの入力音声に対する音声認識処理により、機器「エアコン」に対して、指令内容「電源オフ」等の指令を送信する。
ステップS111において、通信装置10からユーザの指令を受信した情報家電40は、通信装置10から受信した指令に応じた処理を行う。
<まとめ>
従来、ユーザによって入力された音声に対し、音声認識処理を行うことにより、情報家電に対して動作指示を行う通信装置がある。しかし、ユーザの認証を行わないで音声認識処理によって情報家電への動作指示を行うことは、第三者による情報家電に対する操作を可能とすることとなり、セキュリティの観点から課題がある。そのため、セキュリティ対策を行うために、別途、ユーザを識別するための情報などをユーザが音声入力し、入力された音声に基づく音声信号を音声認識サーバ等に送信するなどの対応が必要となる。特に、ユーザの認証において、秘匿することが望ましい情報(ID情報など)を音声入力すること、また、音声認識サーバ等へ送信することについて、セキュリティの観点から別途対策が必要となる。
これに対し、本実施形態によると、ユーザの音声を、例えば通話処理時等においてサンプルデータとして保持し、通信装置10に蓄積させることで、ユーザの音声の認識精度を向上させる通信装置10を使用している。このようにして通信装置10に蓄積されたユーザのサンプルの音声データに基づいて、通信装置10に入力された音声と比較してユーザの認証を行うため、ユーザの認証を容易に行うことができる。
さらに、ユーザが通信装置10に入力した音声に基づく音声信号に対して通信装置10が音声認識処理を行うことで、通信装置10が連携する情報家電40と、M2M(Machine to Machine)技術により、ユーザの音声の音声認識処理結果を共有することができる。
通信装置10は、音声認識処理により、ユーザの意図を解釈し、解釈結果に応じて、適切な情報家電40に対し、音声認識処理の結果に基づく処理を指示することができる。これにより、セキュリティの高い音声認識処理、および、適切なデバイスへの処理実施が可能となる。さらに、通信装置10が、複数のユーザによる操作に対応している場合、複数のユーザのそれぞれについて、ユーザの認証および音声認識処理に基づく情報家電40への指令を行うことができる。例えば、通信装置10が管理する情報家電40について、ユーザごとに管理することができる。
このような情報家電システムは、例えば、ユーザの音声に基づくユーザの認証により通信装置10のロックを解除するとともに、情報家電40に対する様々な処理を行うことを可能とする。例えば、本実施形態に従う家電システムを利用することで、ユーザは、通信装置10に対する音声入力を、ホームセキュリティ関連の機能を起動するためのトリガとして用いることができる。また、音声認識可能な端末において、セキュリティ対策として本実施形態の情報家電システムの技術を使用することができる。また、情報家電システムをユーザが利用することにより、通信装置10からの音声入力による情報家電40の遠隔操作を行うことができる。
なお、図4の説明において、通信装置10は、マイク147に入力された音声(ステップS101)に基づき声紋判別処理および音声認識処理を行う(ステップS102、ステップS103)こととして説明している。通信装置10は、マイク147から入力された音声に限らず、装着型通信機器30など、通信機器10と通信接続するデバイスによって音声入力を受け付けて、装着型通信機器30から音声信号を受信することで、声紋判別処理等を行うこととしてもよい。
本実施の形態に係るシステムを構成する各装置は、プロセッサと、その上で実行されるプログラムにより実現される。本実施の形態を実現するプログラムは、通信インタフェースを介してネットワークを利用した送受信等により提供される。
今回開示された実施の形態はすべての点で例示であって制限的なものでないと考えられるべきである。この発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
101 アンテナ、111 無線通信部、131 物理操作キー、141 操作受付部、142 ディスプレイ、143 電源制御部、145 カメラ、146 音声処理部、147 マイク、148 スピーカ、150 記憶部、151 ユーザ音声情報、152 機器管理情報、160 制御部、161 音声入力受付部、162 ユーザ識別部、163 指示判別部、164 連携機器処理部、202 通信部、206 記憶部、207 制御部、261 ユーザ音声情報、262 危機管理情報、271 通話処理部、272 ユーザ識別部、273 指示判別部、274 連携機器処理部、301 アンテナ、311 無線通信部、341 操作受付部、342 ディスプレイ、346 音声処理部、347 マイク、348 スピーカ、350 記憶部、352 ユーザ音声データ、360 制御部、361 通信処理部、362 音声入力受付部、10 通信装置、20 サーバ、30 装着型通信機器、40 情報家電、90 ネットワーク、91 ブロードバンドルータ、92 無線基地局。

Claims (5)

  1. 通信装置であって、
    1以上の通信機器と通信可能に構成されており、
    音声の入力を受け付けて、受け付けた音声に基づく音声信号を出力するように構成された音声処理部と、
    前記通信装置の動作を制御するように構成された制御部とを備え、
    前記制御部は、
    前記音声信号と、ユーザを識別するために記憶部に蓄積される音声データとに基づいて、ユーザを認証する処理を行うユーザ識別部と、
    前記音声信号に音声認識処理を行うことにより、前記受け付けた音声に示されるユーザの指示内容を判別する指示判別部と、
    前記ユーザ識別部によりユーザが認証され、前記指示判別部により前記ユーザの指示内容が判別された場合に、前記判別された前記ユーザの指示内容に関連する前記通信機器に対して前記指示内容にかかる指令を送信する連携機器処理部とを含
    前記制御部の前記連携機器処理部が前記指令を送信することには、前記ユーザの指示内容に関連する前記通信機器が複数ある場合に、いずれの通信機器に対して指令を送信するかの選択操作をユーザから受け付けて、選択結果に基づいて各通信機器の優先度を設定し、前記設定された優先度に基づいて選択対象となる通信機器の候補をユーザに報知することが含まれる、通信装置。
  2. 前記制御部の前記連携機器処理部が前記指令を送信することには、前記ユーザの指示内容の判別結果が、前記通信装置と通信可能な前記1以上の通信機器に対する指示である場合に、前記指令を前記通信機器へ送信することが含まれる、請求項1に記載の通信装置。
  3. 前記制御部の前記連携機器処理部が前記指令を送信することには、前記ユーザ識別部による前記ユーザの認証と、前記指示判別部による前記ユーザの指示内容の判別とのうち少なくともいずれかに失敗した場合に、前記通信機器に対する前記指令の送信を停止することが含まれる、請求項1または2に記載の通信装置。
  4. 前記制御部の前記ユーザ識別部が行う処理には、複数のユーザのうちいずれのユーザが前記音声を前記通信装置に入力したかを認証することが含まれ、
    前記通信装置は、前記複数のユーザそれぞれについて、指令を送信可能な前記通信機器および送信可能な指令内容の情報を記憶するように構成されており、
    前記連携機器処理部が前記指令を送信することには、前記認証されたユーザについて、前記指令を送信可能な前記通信機器および送信可能な指令内容の情報に従って前記指令を前記通信機器に送信することが含まれる、請求項1からのいずれか1項に記載の通信装置。
  5. サーバ装置と通信可能な通信装置であって、
    前記サーバ装置は、ユーザを識別するための音声データを記憶するように構成されており、
    前記通信装置は、
    1以上の通信機器と通信可能に構成されており、
    音声の入力を受け付けて、受け付けた音声に基づく音声信号を出力するように構成された音声処理部と、
    前記通信装置の動作を制御するように構成された制御部とを備え、
    前記制御部は、
    前記音声信号を前記サーバ装置に送信することにより、前記音声信号に基づくユーザを認証する処理、および、前記音声信号に示されるユーザの指示内容を判別する処理を前記サーバ装置に行わせ、処理結果を前記サーバ装置から受信し、前記サーバ装置によりユーザが認証され、前記ユーザの指示内容が判別された場合に、前記判別された前記ユーザの指示内容に関連する前記通信機器に対して前記指示内容にかかる指令を送信する連携機器処理部を含
    前記制御部の前記連携機器処理部が前記指令を送信することには、前記ユーザの指示内容に関連する前記通信機器が複数ある場合に、いずれの通信機器に対して指令を送信するかの選択操作をユーザから受け付けて、選択結果に基づいて各通信機器の優先度を設定し、前記設定された優先度に基づいて選択対象となる通信機器の候補をユーザに報知することが含まれる、通信装置。
JP2015208939A 2015-10-23 2015-10-23 通信装置 Active JP6710037B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015208939A JP6710037B2 (ja) 2015-10-23 2015-10-23 通信装置
PCT/IB2016/057805 WO2017068560A1 (ja) 2015-10-23 2016-12-20 通信装置
US15/766,791 US10650825B2 (en) 2015-10-23 2016-12-20 Communication device
CN201680062048.2A CN108475504A (zh) 2015-10-23 2016-12-20 通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015208939A JP6710037B2 (ja) 2015-10-23 2015-10-23 通信装置

Publications (2)

Publication Number Publication Date
JP2017083526A JP2017083526A (ja) 2017-05-18
JP6710037B2 true JP6710037B2 (ja) 2020-06-17

Family

ID=58558185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015208939A Active JP6710037B2 (ja) 2015-10-23 2015-10-23 通信装置

Country Status (4)

Country Link
US (1) US10650825B2 (ja)
JP (1) JP6710037B2 (ja)
CN (1) CN108475504A (ja)
WO (1) WO2017068560A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102428148B1 (ko) * 2017-08-31 2022-08-02 삼성전자주식회사 가전 기기의 음성 인식을 위한 시스템과 서버, 방법
CN107479400A (zh) * 2017-09-28 2017-12-15 广东美的制冷设备有限公司 家电设备的控制方法、装置、家电设备及可读存储介质
JP7245999B2 (ja) * 2018-02-14 2023-03-27 パナソニックIpマネジメント株式会社 制御情報取得システム、及び、制御情報取得方法
KR20190102509A (ko) * 2018-02-26 2019-09-04 삼성전자주식회사 음성 명령을 수행하는 방법 및 시스템
CN108962244A (zh) * 2018-06-29 2018-12-07 百度在线网络技术(北京)有限公司 用于发送信息的方法和装置
JP7182969B2 (ja) * 2018-09-20 2022-12-05 ヤフー株式会社 コミュニケーション支援装置、ユーザデバイス、コミュニケーション支援方法、およびプログラム
CN109065058B (zh) * 2018-09-30 2024-03-15 合肥鑫晟光电科技有限公司 语音通信方法、装置及系统
JP7364923B2 (ja) * 2019-01-29 2023-10-19 ダイキン工業株式会社 空気調和システム、サーバ、空気調和システムの制御方法、プログラム及び記録媒体
WO2020175802A1 (en) * 2019-02-27 2020-09-03 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
JP7133512B2 (ja) * 2019-06-11 2022-09-08 株式会社日立製作所 自動点検システム
JP7269812B2 (ja) * 2019-07-18 2023-05-09 東芝ライフスタイル株式会社 家電機器
JP7349659B2 (ja) * 2019-08-08 2023-09-25 パナソニックIpマネジメント株式会社 制御システム、及び、制御方法
JP7680883B2 (ja) * 2021-05-26 2025-05-21 シャープ株式会社 音声処理システム及び音声処理方法
CN117811862A (zh) * 2023-12-25 2024-04-02 深圳铂润智能集成有限公司 一种基于语音识别的智能家电控制方法、系统及存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0911808B1 (en) * 1997-10-23 2002-05-08 Sony International (Europe) GmbH Speech interface in a home network environment
US7831930B2 (en) * 2001-11-20 2010-11-09 Universal Electronics Inc. System and method for displaying a user interface for a remote control application
JP2003502701A (ja) * 1999-06-21 2003-01-21 パルックス アクチエンゲゼルシャフト 自動機械を制御する制御装置
CN1700304A (zh) * 2000-07-10 2005-11-23 松下电器产业株式会社 优先级决定装置和优先级决定方法
JP2006017936A (ja) 2004-06-30 2006-01-19 Sharp Corp 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体
JP4405370B2 (ja) * 2004-11-15 2010-01-27 本田技研工業株式会社 車両用機器制御装置
JP4466572B2 (ja) * 2006-01-16 2010-05-26 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置、音声コマンド実行プログラムおよび音声コマンド実行方法
JP2009145755A (ja) * 2007-12-17 2009-07-02 Toyota Motor Corp 音声認識装置
JP4331233B2 (ja) * 2007-12-26 2009-09-16 株式会社東芝 無線通信装置
JP2009265567A (ja) * 2008-04-30 2009-11-12 Sony Corp 音声認識装置と音声認識方法とコンピュータ・プログラムおよびコマンド認識装置
KR101678395B1 (ko) * 2009-09-22 2016-11-22 삼성전자 주식회사 외부 디바이스를 이용한 전자기기 제어 방법 및 그의 시스템
US8655344B2 (en) * 2010-05-03 2014-02-18 Interdigital Patent Holdings, Inc. Addressing wireless nodes
JP5351855B2 (ja) 2010-08-10 2013-11-27 ヤフー株式会社 情報家電システム、情報取得方法及びプログラム
US10209680B2 (en) * 2010-09-24 2019-02-19 Xped Holdings Pty Ltd Remote control and remote control systems
US8825020B2 (en) * 2012-01-12 2014-09-02 Sensory, Incorporated Information access and device control using mobile phones and audio in the home environment
US9042867B2 (en) * 2012-02-24 2015-05-26 Agnitio S.L. System and method for speaker recognition on mobile devices
KR20130133629A (ko) * 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
US9230560B2 (en) * 2012-10-08 2016-01-05 Nant Holdings Ip, Llc Smart home automation systems and methods
US20140156281A1 (en) * 2012-12-03 2014-06-05 Qualcomm Incorporated Voice-controlled configuration of an automation system
US9384751B2 (en) * 2013-05-06 2016-07-05 Honeywell International Inc. User authentication of voice controlled devices
JP6522503B2 (ja) * 2013-08-29 2019-05-29 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器制御方法、表示制御方法及び購入決済方法
WO2015033523A1 (ja) * 2013-09-03 2015-03-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声対話制御方法
US9900177B2 (en) * 2013-12-11 2018-02-20 Echostar Technologies International Corporation Maintaining up-to-date home automation models
KR102146462B1 (ko) * 2014-03-31 2020-08-20 삼성전자주식회사 음성 인식 시스템 및 방법
US9946857B2 (en) * 2015-05-12 2018-04-17 Echostar Technologies International Corporation Restricted access for home automation system

Also Published As

Publication number Publication date
US10650825B2 (en) 2020-05-12
WO2017068560A1 (ja) 2017-04-27
JP2017083526A (ja) 2017-05-18
US20180286407A1 (en) 2018-10-04
CN108475504A (zh) 2018-08-31

Similar Documents

Publication Publication Date Title
JP6710037B2 (ja) 通信装置
US11540245B2 (en) Home appliance and mobile terminal having application for registering the home appliance to server
EP3291539B1 (en) Device control method and apparatus
JP6834058B2 (ja) Wi−fiホットスポット接続方法および端末
KR102061913B1 (ko) 전자 장치의 동작을 제어하기 위한 방법 및 장치
RU2533679C2 (ru) Устройство и способ беспроводной связи
EP3151507B1 (en) Methods and apparatuses for controlling device
CN105517103A (zh) 基于智能终端设备的网络接入的方法和装置
CN104460365A (zh) 设备控制方法和装置
US20170251093A1 (en) Home appliance and control method thereof
US20150264139A1 (en) Method and electronic devices for performing functions
US10135816B2 (en) Electronic device and method of transceiving data
CN104703295A (zh) 网络接入方法及装置
WO2017185711A1 (zh) 控制智能设备的方法、装置、系统和存储介质
EP3076632B1 (en) Method and apparatus for accessing a network
JP2017528928A (ja) 使用権限取得方法及び装置
EP3389332B1 (en) Commissioning of a plurality of devices
US20200015140A1 (en) Method and electronic device for performing wireless communication by using channel list
CN115665657A (zh) 无线配对方法、装置、设备及存储介质
WO2014143761A2 (en) Systems and methods for configuration of wireless camera
KR101766248B1 (ko) 디스플레이시스템, 디스플레이장치 및 그 제어방법
CN107148011B (zh) 一种执行目标业务的方法、装置和系统
KR102132264B1 (ko) eMBMS 서비스를 제공하는 방법 및 이를 위한 전자 장치
EP2672663B1 (en) Apparatus and method of storing user information in home network
JP6301712B2 (ja) 認証システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200512

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200526

R150 Certificate of patent or registration of utility model

Ref document number: 6710037

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150