JP2017152948A - 情報提供方法、情報提供プログラム、および情報提供システム - Google Patents
情報提供方法、情報提供プログラム、および情報提供システム Download PDFInfo
- Publication number
- JP2017152948A JP2017152948A JP2016033952A JP2016033952A JP2017152948A JP 2017152948 A JP2017152948 A JP 2017152948A JP 2016033952 A JP2016033952 A JP 2016033952A JP 2016033952 A JP2016033952 A JP 2016033952A JP 2017152948 A JP2017152948 A JP 2017152948A
- Authority
- JP
- Japan
- Prior art keywords
- information
- user
- communication terminal
- server
- message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title abstract description 55
- 238000004891 communication Methods 0.000 claims abstract description 242
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 40
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 40
- 230000004044 response Effects 0.000 claims description 29
- 230000005540 biological transmission Effects 0.000 claims description 8
- 230000003993 interaction Effects 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 27
- 230000008569 process Effects 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 238000012790 confirmation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 235000021269 warm food Nutrition 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 235000015927 pasta Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Telephonic Communication Services (AREA)
Abstract
【課題】通信ネットワークを通じて事業者とユーザとの新たな接点を創出し、事業者のサービスに関する最適な情報をユーザに提供する方法を創成する。
【解決手段】ユーザの通信端末に仮想オペレータを表示し、ユーザと仮想オペレータの対話を通じて、ユーザの要求に対応する複数の回答の中から最適な回答を選択してユーザに提供することを含む、事業者からユーザへの情報提供方法である。対話は、通信端末を通してユーザが音声情報を入力し、音声情報を音声認識サーバにネットワークを経由して送信し、音声認識サーバが音声情報を認識し、認識された音声情報の意図を対話サーバが理解し、対話サーバによって理解された意図に対応する回答メッセージをデータベースから選択し、回答メッセージを音声合成サーバによって出力し、出力された回答メッセージを、通信端末に表示される仮想オペレータの音声として出力することで実行される。
【選択図】図3
【解決手段】ユーザの通信端末に仮想オペレータを表示し、ユーザと仮想オペレータの対話を通じて、ユーザの要求に対応する複数の回答の中から最適な回答を選択してユーザに提供することを含む、事業者からユーザへの情報提供方法である。対話は、通信端末を通してユーザが音声情報を入力し、音声情報を音声認識サーバにネットワークを経由して送信し、音声認識サーバが音声情報を認識し、認識された音声情報の意図を対話サーバが理解し、対話サーバによって理解された意図に対応する回答メッセージをデータベースから選択し、回答メッセージを音声合成サーバによって出力し、出力された回答メッセージを、通信端末に表示される仮想オペレータの音声として出力することで実行される。
【選択図】図3
Description
本発明は、事業者から顧客あるいはユーザへの情報提供方法、および当該情報提供方法を実現するためのプログラムとシステムに関する。
コンピュータや携帯電話などの通信端末の大幅な普及と、通信ネットワークの飛躍的な発展に伴い、各種サービスを提供する事業者と顧客あるいはユーザ(以下、本明細書、特許請求の範囲において、ユーザとユーザを総じてユーザと記す)との間のビジネス形態も大きく変化している。例えば金融商品をサービスとして提供する銀行や証券会社では、従来ユーザは店舗に足を運ぶ、あるいは電話などによって事業者と直接口頭で通話することにより、事業者が提供するサービスを購入したり、サービスに係る種々の問題を解決していた。現在では、通信ネットワークの発展により、ユーザは通信ネットワークを経由してサービスの提供を受けたり、問題解決に至ることができるようになってきた。典型的な例としてインターネットバンキングが挙げられ、ユーザは通信端末を操作することにより、時間と場所を選ばずに、各種商取引が可能となっている。このような商取引の変化は金融業界のみならず、様々な事業形態でも同様である。
また最近では人工知能を備えた音声認識技術が発展し、ユーザからの要望に対する対応や苦情の処理など、従来事業者あるいはそのオペレータが直接対処してきた業務に対する支援システムも開発されている。例えば特許文献1には、ユーザが通信端末に対して音声情報を入力し、入力された音声情報の解析結果に基づいてユーザの要求や質問、苦情の意図を抽出することで、ユーザに対するより適切かつ迅速な対応を支援するシステムが開示されている。
本発明の課題の一つは、通信ネットワークを通じて事業者とユーザとの新たな接点を創出し、これを利用することで、事業者のサービスに関する最適な情報をユーザに提供する方法を創成することである。あるいは本発明の課題の一つは、携帯端末を介した自然な通話という手段を通じて、ユーザと事業者との距離感を低減させてより親密なユーザ−事業者関係を構築し、ユーザに新しいユーザ体験を享受する機会を与えることである。あるいは本発明の課題の一つは、ユーザ対応による人的資源の消耗を回避することで事業者の業務負担を軽減するとともに、豊富な情報を、事業者の知識や経験、能力に制限されることなく、ユーザに提供することで、ユーザに対して高品質で高付加価値を有するサービスを適時に提供する方法を創成することである。あるいは本発明の課題の一つは、上記方法を実現するためのプログラム、およびシステムを提供することである。
本発明の実施形態の一つは、情報提供システムである。該情報提供システムは、通信端末から送信されたユーザの音声情報を認識する音声認識部と、音声情報に対する回答メッセージを、複数のメッセージが格納されたデータベースから選択する対話部と、選択された回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして通信端末に送信する送信部を有し、対話部は、回答メッセージを一つに絞り切れない場合、ユーザに質問するための問合せメッセージをデータベースから選択し、選択された問合せメッセージを通信端末に送信する。
上記情報提供システムはさらに通信端末を含むことができる。通信端末は、仮想オペレータを表示するように構成することができる。また上記情報提供システムはさらに、回答メッセージ、問合せメッセージを通信端末で再生する際、回答メッセージ、問合せメッセージを再生しない時と比較し、仮想オペレータの一部が大きな動作を行うように構成することができる。
上記情報提供システムはさらに、ユーザの標準生体情報が格納される第1のサーバを有し、通信端末はユーザの生体情報を取り込む画像取込装置を有し、生体情報と標準生体情報に基づいてユーザが承認された場合に、ユーザに音声情報の入力を許容するように構成することができる。
上記情報提供システムはさらに、ユーザと事業者との通話のための第2のサーバをさらに有することができる。
上記情報提供システムはさらに、音声認識部によって認識された音声情報、選択された回答メッセージ、および問合せメッセージを第2のサーバが格納するように構成することができる。
上記情報提供システムはさらに地図情報が格納される第3のサーバを有し、事業者の複数の店舗に関する情報を格納するように第1のサーバを構成し、表示部に通信端末の位置と複数の店舗の情報を表示するように通信端末を構成することができる。
音声情報に基づいて複数の店舗から少なくとも一つの店舗を選択するように対話部を構成し、選択された店舗への道順を通信端末へ送信するように第3のサーバを構成することができる。
本発明の実施形態の一つは、ユーザによって音声入力された質問に対応する回答メッセージを複数のメッセージから絞り込み、回答メッセージを一つに絞り切れない場合には、ユーザに質問するための問合せメッセージを複数のメッセージから選択するように構成されるサーバである。
サーバは、ユーザが入力した音声情報を認識する音声認識サーバから質問が伝達されるように構成することができる。
サーバは、回答メッセージと問合せメッセージが音声合成サーバへ伝達されるように構成することができる。
サーバは、ユーザの生体情報を格納するように構成される第1のサーバと接続されてもよい。
第1のサーバは、事業者の店舗情報を格納するように構成することができる。
第1のサーバは、ユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを格納するように構成される第2のサーバと接続することができる。
本発明の実施形態の一つは、通信端末から送信される、ユーザの質問を含む音声情報を認識し、認識されたユーザの質問に対応する回答メッセージを複数の回答メッセージから選択し、選択された回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして通信端末に送信し、回答メッセージが一つに絞り切れない場合、ユーザに質問するための問合せメッセージを複数の回答メッセージから選択し、選択された問合せメッセージを通信端末に送信することを実行させるプログラムである。
上記プログラムは、通信端末が取り込むユーザの生体情報を受信し、生体情報を用いてユーザの認証を行うことを実行させるように構成することができる。
上記プログラムは、ユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを格納することをさらに実行させるように構成することができる。
上記プログラムは、格納されたユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを参照し、通信端末と事業者の電話端末とを接続することをさらに実行させるように構成することができる。
上記プログラムは、格納されたユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを参照し、通信端末に事業者の店舗情報を表示することをさらに実行させるように構成することができる。
上記プログラムは、通信端末から質問を文字情報として受信し、回答メッセージを通信端末に文字情報として送信することをさらに実行させるように構成することができる。
上記プログラムは、音声情報内に含まれる質問が検出できないとき、通信端末から質問を文字情報として受信し、回答メッセージを通信端末に文字情報として送信することをさらに実行させるように構成することができる。
上記プログラムは、通信端末から通信端末周囲の音量データを受信し、音量データに応じて通信端末から質問を文字情報として受信することを実行させるように構成することができる。
本発明の実施形態の一つは、音声認識サーバ、対話サーバ、音声合成サーバが含まれるシステムに音声情報を送信し、音声情報に含まれるユーザの質問に対する回答メッセージ、質問に対する問合せメッセージの少なくとも一つを受信し、回答メッセージと問合せメッセージを、少なくとも音声情報および文字情報のいずれか一つとして出力することを通信端末に実行させるプログラムである。
上記プログラムは、通信端末に記憶されるように構成することができる。
上記プログラムは、通信ネットワークから取得されるように構成することができる。
上記プログラムは、仮想オペレータを表示するように構成することができる。また上記プログラムは、前記回答メッセージ、前記問合せメッセージを前記通信端末で再生する際、前記回答メッセージ、前記問合せメッセージを再生しない時と比較し、前記仮想オペレータの一部が大きな動作を行うように構成することができる。
上記プログラムは、ユーザの生体情報を取得するように構成することができる。
上記プログラムは、通信端末と事業者の電話端末とを接続するように構成することができる。
上記プログラムは、通信端末の位置情報を取得し、通信端末に地図を表示し、事業者の店舗情報を通信端末に表示するように構成することができる。
上記プログラムは、通信端末の位置から事業者の店舗までの経路を表示するように構成することができる。
上記プログラムは、質問を文字情報として送信することをさらに実行させるように構成することができる。
上記プログラムは、通信端末周囲の音量を測定し、音量のデータを音声認識サーバ、対話サーバ、音声合成サーバのうち少なくとも一つに送信することを実行させるように構成することができる。
上記プログラムは、音量に応じて、質問を文字情報として送信することをさらに実行させるように構成することができる。
本発明の実施形態の一つは、通信端末にユーザが入力した音声情報を送信し、送信された音声情報を認識し、認識された音声情報に含まれるユーザの質問に対応する回答メッセージを複数の回答メッセージから選択し、選択された回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして通信端末に送信し、回答メッセージが一つに絞り切れない場合、ユーザに質問するための問合せメッセージを複数の回答メッセージから選択し、選択された問合せメッセージを通信端末に送信する情報提供方法である。
上記情報提供方法は、通信端末に仮想オペレータを表示させることをさらに含むことができる。また、前記回答メッセージ、前記問合せメッセージを前記通信端末で再生する際、前記回答メッセージ、前記問合せメッセージを再生しない時と比較し、前記仮想オペレータの一部を大きく動かすことを含むことができる。
上記情報提供方法は、通信端末が取り込むユーザの生体情報を送信し、送信された生体情報を用いてユーザの認証を行うことをさらに含むことができる。
上記情報提供方法は、ユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを格納することをさらに含むことができる。
上記情報提供方法は、格納されたユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを参照し、通信端末と事業者の電話端末とを接続することをさらに含むことができる。
上記情報提供方法は、格納されたユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを参照し、通信端末に事業者の店舗情報を表示することを含むことができる。
上記情報提供方法は、質問を文字情報(テキスト)として通信端末に入力し、質問を送信し、回答メッセージを通信端末に文字情報として送信し、回答メッセージを前記通信端末に表示することを含むことができる。
上記情報提供方法は、通信端末を用いて周囲の音量を測定することを含むことができる。また音量に応じて、質問を文字情報として通信端末に入力し、質問を送信し、回答メッセージを通信端末に文字情報として送信し、回答メッセージを通信端末に表示することを含むことができる。
ユーザと仮想オペレータの対話を行うことで、親密なユーザ―事業者関係を構築することができる。また、ユーザと仮想オペレータの対話を通じて、ユーザが要望する情報を、事業者が提供しえる数多くの情報の中から見つけ出すことが可能となる。すなわち、事業者が提供する多くの情報の中から「選択する」という煩雑な作業をユーザに強制することなく、対話を通じ、必要とする情報へユーザを「案内、誘導する」ことができ、新しいユーザ体験を提供することができる。また、ユーザ対応における人的資源の消耗を回避することで事業者の業務の効率化と生産性の向上を達成し、均一かつ豊富な情報を、事業者やそのオペレータの知識や経験、能力に制限されることなく、ユーザに提供することで、高品質で高付加価値を有するサービスを適時に提供することができる。さらにユーザは、事業者が管理する資源量とその変動を容易に把握することができる。
以下、本発明の一実施形態における情報提供方法、ならびにそれを実現するためのプログラムとシステムについて、図面を参照しながら詳細に説明する。以下に示す実施形態は本発明の実施形態の一例であって、本発明はこれらの実施形態に限定されるものではない。
<第1実施形態>
本発明の第1実施形態における情報提供方法について、図面を参照しながら説明する。本実施形態では、ユーザが通信端末を用いて通信端末上に表示される、事業者のオペレータを模した画像(本明細書および請求項において、仮想オペレータと記す)との自然な対話を行い、これによって事業者がユーザに適した回答や情報を提供するための情報提供方法、ならびにそれを実行するためのプログラムについて説明する。
本発明の第1実施形態における情報提供方法について、図面を参照しながら説明する。本実施形態では、ユーザが通信端末を用いて通信端末上に表示される、事業者のオペレータを模した画像(本明細書および請求項において、仮想オペレータと記す)との自然な対話を行い、これによって事業者がユーザに適した回答や情報を提供するための情報提供方法、ならびにそれを実行するためのプログラムについて説明する。
[1.準備]
図1に本実施形態の情報提供方法で使用可能な通信端末100のシステム図、図2に本実施形態の情報提供方法のフローチャートを示す。最初にユーザは、事業者が提供するプログラムを含むアプリケーションがインストールされた通信端末100を用意する。アプリケーションは媒体に格納された状態で提供されてもよく、通信ネットワークを介して配布され、ユーザが取得できる状態であってもよい。
図1に本実施形態の情報提供方法で使用可能な通信端末100のシステム図、図2に本実施形態の情報提供方法のフローチャートを示す。最初にユーザは、事業者が提供するプログラムを含むアプリケーションがインストールされた通信端末100を用意する。アプリケーションは媒体に格納された状態で提供されてもよく、通信ネットワークを介して配布され、ユーザが取得できる状態であってもよい。
通信端末100はユーザが操作可能な端末であり、据え付け型(デスクトップ型)コンピュータ、ノート型コンピュータ、あるいは携帯電話やタブレット、スマートフォンなどの携帯通信端末などが挙げられる。通信端末100の構成例を図2に示す。図2に示すように、通信端末100にはCPU(中央演算ユニット)102、メモリ104、表示部106、入力部108、音声入力部110、音声出力部112、通信部114、画像取込装置116などが含まれる。
CPU102は通信端末100に格納された種々のプログラムを解釈、実行する機能を有する。メモリ104はプログラムやデータなどの情報を格納する機能を有し、フラッシュメモリなどの不揮発性メモリ素子を含有する。表示部106は液晶表示装置やEL有機装置などを有しており、ユーザのインターフェースとして機能する。入力部108は、ユーザが物理的接触を通じて情報を通信端末に入力するインターフェースとしての機能を有し、典型的にはタッチパネルやキーボード、入力ボタンなどが挙げられる。音声入力部110は音声を取り込み、入力された音声情報を通信部114へ伝達する機能を有する。音声出力部112はサーバから送信される音声情報や、電話回線などの通信ネットワークを通じて他の通信端末から送信される音声情報を再生する機能を有する。通信部114は通信ネットワークを通してサーバや他の通信端末との間で音声情報や文字情報などを送受信する機能を有する。
ここで本明細書、特許請求の範囲におけるサーバとは、事業者自身が維持、管理して利用するサーバでもよく、事業者とは異なる情報処理サービス提供者などが維持、管理、提供するサーバであってもよい。以下に示すように、本実施形態の情報提供方法を実現するためのシステムの多くは情報処理サービス提供者が管理、提供するサーバを利用することができる。事業者が公開できない情報、例えばユーザの個人情報に係る情報などは、事業者自らが維持、管理するサーバ内に格納して使用することが好ましい。
[2.起動]
図2を参照すると、ユーザがアプリケーションを起動すると(ステップ200)、プログラムは通信端末の表示部106に仮想オペレータを表示する(ステップ202)。図3は仮想オペレータの一例であり、通信端末100の表示部106に表示した状態を例示したものである。仮想オペレータはユーザ対応を行う従業員(以下、オペレータと記す)などを模したものでよい。また、仮想オペレータが人間の自然な動作(例えば表情の変化、頭や手の動きなど)を行うように設定し、ユーザに親近感を抱かせるようにプログラムを構成してもよい。
図2を参照すると、ユーザがアプリケーションを起動すると(ステップ200)、プログラムは通信端末の表示部106に仮想オペレータを表示する(ステップ202)。図3は仮想オペレータの一例であり、通信端末100の表示部106に表示した状態を例示したものである。仮想オペレータはユーザ対応を行う従業員(以下、オペレータと記す)などを模したものでよい。また、仮想オペレータが人間の自然な動作(例えば表情の変化、頭や手の動きなど)を行うように設定し、ユーザに親近感を抱かせるようにプログラムを構成してもよい。
上述したように、図3ではオペレータを模した仮想オペレータを示しているが、仮想オペレータの形態に制約はない。仮想オペレータの性別や容貌、服装、あるいは仮想オペレータの背景などをユーザが任意に選択、設定できるようにプログラムを構成してもよい(ステップ204)。これにより、ユーザが単に個人的嗜好に基づいて仮想オペレータを選択できるのみならず、ユーザ専任の仮想オペレータを固定することもできる。このような機能を付与することで、ユーザに所謂「お得意様」意識を抱かせることができ、より親密なユーザ―事業者関係の構築に寄与することができる。
ここでプログラムは、必要に応じてユーザに対する認証プロセスを実行するように構成されていてもよい。例えばユーザの要求や問い合わせ、質問(以下、本明細書、特許請求の範囲において、総じて質問と記す)に係る内容が高いレベルの機密性を要する場合には、認証プロセス(ステップ206)を実行することが好ましい。
認証プロセス(ステップ206)は、例えば通信端末100に備えられた画像取込装置116を用いてユーザの顔の画像、指紋や静脈のパターンなどの生体情報を取り込み、あらかじめサーバに格納されたユーザの標準データ(標準生体情報)と比較し、その結果に基づいて行うことができる。あるいはユーザにパスワードの入力を要請し、サーバに格納されたユーザのパスワードとの比較を行うことで認証プロセスを行ってもよい。あるいはユーザに音声入力を要請し、入力された音声(声紋)を利用してユーザ認証を行ってもよい。認証プロセスにおいて、通信端末100がユーザ以外の者によって操作されていると判断された場合、事業者に自動的に通知するようプログラムを構成してもよい。
ユーザ認証が正常に終了し、通信端末がユーザ自身によって操作されていると判断された場合には、アプリケーションにおいて事業者が提供するサービス内容をユーザごとに変更してもよい。あるいは、そのユーザに対して通知するべき回答メッセージを音声として出力する、あるいは文字として表示部106に表示してもよい(ステップ208)。
[3.基本動作]
本実施形態に係る情報提供方法、およびそのプログラムでは、図3に例示されたように、仮想オペレータ以外に、例えばアイコン300を表示するように構成される。このアイコン300は音声入力部110をアクティブにするアイコンであり、ユーザはこのアイコン300を操作することで音声入力を開始することができる。また、事業者の店舗情報を表示するモードに移行するためのアイコン302を表示するようにプログラムが構成されていてもよい。後述するように、このアイコン302を用いることで、例えば事業者の各店舗が提供するサービス内容、店舗の混雑状況や位置、店舗までの道順などを表示するようにプログラムを構成してもよい。
ユーザはまずアイコン300を操作して音声入力部110をアクティブにする。この後ユーザは、事業者に対する質問を口頭で述べる(ステップ210)。プログラムの命令に従い、音声入力部110はユーザの質問を音声情報として通信部114へ伝達し、通信部114は通信ネットワークを経由し、音声認識サーバのインターフェースとなるAPI(アプリケーションプログラミングインターフェース)へ音声情報を送信する(ステップ212)。送信された音声情報は、音声認識サーバにおいて解析され、文字データ(テキストデータ)へ変換される(ステップ214)。
質問の入力は音声による入力に限られず、通信端末100の入力部108を用いて文字情報を入力することで行っても構わない。例えば発声が禁じられている場合や、喧噪な環境下でアプリケーションを使用したい場合には文字入力(テキスト入力)が有効である。このような場合、後述するような文字入力、出力のみによる操作モード(ウェブチャットモード)へ移行することも可能である。
テキストデータへ変換された音声情報は対話サーバで解析され、ユーザの質問の意図が理解、把握される(ステップ216)。必要に応じて対話サーバは、当該意図が正しく理解されているかを確認するためのメッセージ(確認メッセージ)を、種々のメッセージが蓄積されたサーバあるいはサーバ内のデータベースから選択する(ステップ218)。その後、音声合成サーバへ確認メッセージの文字情報が伝達され、音声合成サーバは当該文字情報を音声情報へ変換し、音声合成サーバのAPIを通してユーザの通信端末100へ音声情報を送信する(ステップ218)。その後プログラムの命令に従い、通信端末100が受信した音声情報を音声出力部112が音声として再生する(ステップ220)。確認メッセージは文字情報として表示部106上に表示してもよく、それと同時に音声として再生してもよい。音声合成サーバによって音声情報が生成されるため、実際の人間が発するような声を実現することができる。
ユーザは、対話サーバが意図を正しく理解していると認識すれば、アイコン300に触れて音声入力部110をアクティブにし、その旨を音声情報として音声入力部110に入力する、あるいは入力部108を用いてテキスト入力することができる(ステップ222)。一方、対話サーバが意図を正しく理解していないと認識した場合、アイコン300に触れて音声入力部110をアクティブにし、質問を再度音声入力部110に入力する、あるいは入力部108を操作してテキスト形式で質問を再度入力すればよい(ステップ222)。
ユーザの質問の意図を理解した後、対話サーバは絞り込みエンジン(検索エンジン)などを用いて回答メッセージの絞り込みを行う(ステップ224)。そして対話サーバ内のデータベースに蓄積された種々の回答メッセージから適合する回答メッセージを選択する(ステップ226)。選択された回答メッセージの文字情報は音声合成サーバで音声情報に変換され、音声合成サーバのAPIを通してユーザの通信端末100へ送信される(ステップ226)。この時、音声情報とともに文字情報として回答メッセージを通信端末100へ送信してもよい。プログラムの命令に従い、通信端末100が受信した音声情報を音声出力部112が再生する(ステップ228)。また同時に、回答メッセージを表示部106上にテキストとして表示してもよい。
データベースには事業者が作成した定型のメッセージを回答メッセージとして蓄積してもよく、対話サーバは蓄積されたメッセージから回答メッセージを選択することができる。ただし本実施形態の情報提供方法はこれに限られず、回答メッセージを選択するだけでなく、人工知能としての機能を対話サーバに搭載し、ユーザとの対話を通じた学習によって新たな回答メッセージを作成し、これを音声合成サーバで音声情報に変換した後に通信端末100へ送信してもよい。すなわち、ユーザとの対話から新たに結論を獲得する機能、およびユーザとの対話履歴から学習する機能を対話サーバに付与し、これらの機能を利用して回答メッセージを作成するようにしてもよい。
例えば、ユーザと仮想オペレータの対話を通じ、ユーザが満足する最終的な回答メッセージが得られた場合、この時の一連の対話を一つのコンポーネントとして格納する。このコンポーネントに含まれるユーザの音声情報を形態素解析し、最終的な回答メッセージが誘導されるに至ったキーワードを抽出する。同時にキーワードに対して重みづけを行うとともにキーワード同士の関連性(文法的関連性や位置的関連性)をパラメータ化し、これらの情報を最終的に選択された回答メッセージに割り付ける。このようなプロセスを蓄積することにより、それぞれの回答メッセージを最終的に必要とするユーザが与えるであろうキーワードとその関連性を学習する。したがって、新たな対話が開始されたとき、ユーザの音声情報から抽出されるキーワードとその関連性を解析し、その解析結果に基づいて過去に選択された回答メッセージから最も適合するものを選択することができる。その結果、同様の、あるいは類似する質問に対して、常に同じ最適な回答を選択することができる。また、必要に応じて複数の回答メッセージを音声合成サーバで融合して新たなメッセージを生成し、ユーザに提供することも可能となる。
ユーザは、再生された音声情報あるいは表示された文字情報によって質問に対する満足な回答が得られたと判断した場合にはアプリケーションを終了することができる(ステップ230)。一方、ユーザが十分な回答が得られなかったと判断した場合には、再度ユーザは音声入力、あるいはテキスト入力を行って同じ質問、あるいは類似する質問を入力し、回答を求めることができる(ステップ232)。この後のプロセスは上述したプロセスと同じである。
ステップ224において、ユーザの質問に対する回答メッセージが絞り込めない場合、あるいは数多くの回答メッセージを選択せざるを得ない場合、ユーザに対する質問(問合せメッセージ)を生成あるいは選択して通信端末100に送信し、ユーザに対してさらなる情報提供を要請してもよい(ステップ234)。問合せメッセージは音声として、あるいはテキストとして、あるいはその両方として通信端末100で再生、表示される。ユーザは問合せメッセージに対して音声、あるいは文字で回答することができる(ステップ222)。問合せメッセージの送信とその回答というステップを繰り返すことにより、ユーザと仮想オペレータの対話を通じて、ユーザが要望する回答や情報を事業者が提供しえる数多くの情報の中から見つけ出すことが可能となる。したがって、本発明の本実施形態に係る情報提供方法により、事業者が提供する多くの情報の中から「選択する」という煩雑な作業をユーザに強要することなく、対話を通じ、必要とする回答や情報へユーザをリアルタイムに「案内、誘導する」ことができ、新しいユーザ体験を提供することができる。
なお図2には示していないが、対話サーバのデータベースにはユーザと雑談を行うためのメッセージが格納されていてもよく、ユーザは仮想オペレータと雑談を行うようにプログラムが構成されていてもよい。これにより、ユーザの緊張感を解きほぐすことができ、より親密なユーザ―事業者関係を構築することができる。さらに、通信ネットワーク上でのリアルタイムコミュニケーション(チャット)が可能なサイトに移行するためのアイコンを表示するようにプログラムが構成されていてもよい。これにより、例えば事業者から提供された有益な情報を第三者と速やかに共有することも可能となり、ユーザに対するサービス向上が図れるのみならず、事業者も効果的な宣伝効果を獲得することができる。
また、上述した種々のメッセージを音声出力部112で再生する際、仮想オペレータが実際に喋っているように見せるため、仮想オペレータの口や目を動かすようにしてもよい。あるいは手を動かすなど、説明を行うジェスチャーをするようにしてもよい。すなわち、メッセージが再生されていない時と比較し、仮想オペレータの一部がより大きな動作を行うようにプログラムを構成してもよい。
上述したように本実施形態では、仮想オペレータとユーザとの対話を通し、ユーザは様々な質問を事業者に伝えることができる。このため、使用環境が許容する限り、ユーザはキーボードやタッチパネルを用いる文字入力操作から解放され、より簡便に種々の質問を事業者に伝達することが可能となる。また、音声合成技術を活用して仮想オペレータと対話するため、ユーザは無機質な対話を強制されることなく、自然な対話を行うことができる。一方ユーザは、事業者あるいはそのオペレータとの対話ではなく、あくまで仮想オペレータとの対話によって回答を得るため、ユーザは必要以上に気を遣うことなく様々な質問を投げかけることができ、新しいユーザ体験を享受することができる。
また上述したステップでは、事業者のオペレータはユーザとの対話に直接関与しない。したがってユーザは、オペレータの知識や経験、能力に左右されることなく、均一かつ豊富な情報をリアルタイムで獲得することができる。また事業者はこの段階では人的資源が不要であるため、ユーザ対応における人的資源の消耗を避けることができ、業務の効率化と生産性の向上を実現することができる。
[4.通話モードへの移行]
多くのユーザが頻繁に行う質問(FAQ)に対しては、あらかじめ回答メッセージを周到に準備することができ、高いユーザ満足度を得ることが可能である。しかしながらユーザの質問の意図に対し、対話サーバ内のデータベースに蓄積されたメッセージデータだけでは対応できない場合がある。例えばFAQ以外の質問や、複雑な相談内容、あるいは機密性の高い情報が質問に含まれる場合、上述した方法では対応できない場合がある。そのような場合、電話回線を利用して直接口頭で事業者あるいはそのオペレータと通話するモードに切り替えることができる。
多くのユーザが頻繁に行う質問(FAQ)に対しては、あらかじめ回答メッセージを周到に準備することができ、高いユーザ満足度を得ることが可能である。しかしながらユーザの質問の意図に対し、対話サーバ内のデータベースに蓄積されたメッセージデータだけでは対応できない場合がある。例えばFAQ以外の質問や、複雑な相談内容、あるいは機密性の高い情報が質問に含まれる場合、上述した方法では対応できない場合がある。そのような場合、電話回線を利用して直接口頭で事業者あるいはそのオペレータと通話するモードに切り替えることができる。
例えば図4に示すように、サーバからの回答メッセージを音声情報として再生した後(ステップ224、226)、通話モードへ切り替えるためのアイコン(電話アイコン、図3では図示せず)を通信端末100の表示部106に表示するようにプログラムを構成してもよい(ステップ404)。プログラムの命令に従い、ユーザが電話アイコンを操作することで、通信端末100はAPIを介して通信サービス連携サーバに接続される。通信サービス連携サーバは通信ネットワークにユーザからの電話を接続させ、事業者、あるいはそのオペレータとの電話回線による通話を可能にする(ステップ406)。
通話モードへ切り替えるための電話アイコンは、アプリケーション起動の段階から表示部106に表示するようにしてもよい。しかし事業者の人的資源によっては、ユーザによる通話モードへの移行をある程度制約する必要がある。この場合には、電話アイコンはアプリケーションの起動時には表示せず、対話サーバが回答メッセージを選択、送信し(ステップ224)、通信端末100が少なくとも一度回答を再生、表示(ステップ226)した後に電話アイコンを表示するよう、プログラムを構成してもよい。これにより、オペレータの負担が低減され、業務の効率化が図れる。
あるいは、ユーザが通話モードへの切り替えを自ら行わなくても、対話サーバ内の回答メッセージではユーザの質問に対応できないと対話サーバが判断した後に電話アイコンを表示するよう、プログラムを構成してもよい。この場合、対話サーバはユーザに通話モードに切り替える旨を通知する(ステップ400)と同時に通信サービス連携サーバにアクセスし、ユーザと事業者、あるいはそのオペレータとの電話回線を接続してもよい(ステップ402)。
あるいは、ユーザの質問の解析の結果、ユーザと事業者との対話が必須であると対話サーバが判断した後に電話アイコンを表示部106に表示し、ユーザに通話モードへの移行を促してもよい。
通話モードへ移行する際、ユーザとサーバ間との対話内容や履歴(ログ)を格納し、その情報を担当するオペレータに表示してもよい(ステップ406)。これにより、オペレータはより効率よくユーザの質問に対する回答を検討することができる。また、ユーザもすでに行った会話を再度繰り返す必要性が低くなる。このため、事業者はより高品質で手厚いサービスを迅速にユーザに提供することができる。
通信サービス連携サーバが通信ネットワークにユーザからの電話を接続させる際、対話内容を解析し(ステップ408)、その結果に基づいて最も適切なオペレータを選択し(ステップ410)、ユーザと選択されたオペレータと間の電話通信を確立してもよい(ステップ412)。これにより、ユーザは質問に対して最も適切なオペレータと通話することが可能となる。
[5.地図モードへの移行]
上述したように、ユーザの通信端末100の表示部106上に、事業者の店舗にアクセスするためのアイコン302を表示するようにプログラムを構成してもよい(図3参照)。ユーザがこのアイコン302を操作することにより、地図モードへの移行が可能となる。具体的なフローを図5に示す。なお図5に示す各ステップは一例であり、例えばこれらのステップの順番を適宜入れ替えてもよい。
上述したように、ユーザの通信端末100の表示部106上に、事業者の店舗にアクセスするためのアイコン302を表示するようにプログラムを構成してもよい(図3参照)。ユーザがこのアイコン302を操作することにより、地図モードへの移行が可能となる。具体的なフローを図5に示す。なお図5に示す各ステップは一例であり、例えばこれらのステップの順番を適宜入れ替えてもよい。
ユーザによる操作(ステップ500)によって地図モードが起動されると(ステップ502)、プログラムの命令に従い、通信端末100は内蔵されたGPS(全地球測位システム)機能を利用して位置座標を取り込む。あるいは、ユーザ自身が住所や付近のランドマーク情報を、音声情報として音声入力部110に入力することで、あるいは文字情報として入力部108を用いて入力することで、通信端末100の位置座標を取り込むようにプログラムが構成されていてもよい。これより、通信端末の位置が特定される(ステップ504)。通信端末100がGPS機能を搭載していない場合、あるいはGPS機能が利用できないような環境下では、通信端末100は付近の通信サービス事業者の基地局と通信を行って通信端末100が位置するエリアの特定が行われるよう、プログラムが構成されていてもよい。この場合、位置情報特定サーバやCTI(Computer Telephony Integration)サーバなどを利用して通信端末100の位置の特定が行われる。位置特定サーバやCTIサーバは、情報処理サービス提供者や通信サービス事業者が管理、提供するサーバ内に構築されてもよい。
通信端末100の位置が特定された後、プログラムの命令に従って通信端末100は、地図情報を提供する事業者などが運営する情報配信サーバにアクセスして地図データを取得し、表示部106上に表示する(ステップ506)。プログラムはさらに、サーバ内に格納された店舗の位置情報や、店舗が提供するサービス内容を通信端末100に取得させ(ステップ508)、この情報に基づき、表示部106上に店舗を表示させる(ステップ510)。例えば図6に示すように、通信端末100付近の地図を表示部106上に表示し、かつ店舗を表すアイコン602、604を表示する。
店舗の位置や、店舗が提供する具体的なサービス内容、機能、営業時間などのステーショナリーな情報だけでなく、混雑状況や資源量(商品の在庫やユーザに割り当て可能な人的資源量など)といった時間とともに逐次変動するパラメータなどを事業者がサーバ内のデータベースに逐次格納し、これらの情報やパラメータを通信端末100が取得して表示部106上に表示するよう、プログラムを構成してもよい(ステップ508、510)。この場合、店舗のアイコンを操作することで、各店舗に関する上記情報やパラメータを表示するようにしてもよい。これによりユーザは、事業者が管理する資源量とその変動を容易に把握することができる。
さらに本実施形態の情報提供方法では、ユーザの現時点の位置からユーザがアクセスを希望する店舗までの道順を表示してもよい。例えば通信端末100が、ユーザの位置座標と目的とする店舗の位置情報を情報配信サーバへ送信し、適切な経路の探索を要求し(ステップ512)、情報配信サーバ内で探索された経路を受信し、その経路を表示部106上に表示する(ステップ514)ようにしてもよい。経路の表示は、例えば図7に示したように、ユーザの現在地と目的とする店舗までの経路をアイコンを用いて行うことができる。ここでは複数の円形のアイコンを用いて経路を示している。また、目的地までの距離や所要時間などを表示するようにしてもよい。
ここではユーザがアイコン302を操作することで(ステップ500)地図モードへ切り替わる例を述べたが、地図モードへの切り替えはユーザと仮想オペレータの対話に基づいて行ってもよい。例えば、ユーザと仮想オペレータ間の対話を解析し、ユーザの質問に対する最終的な回答が店舗への案内を含むと対話サーバが判断した場合(ステップ516)、対話サーバはユーザの質問に対応できる適切な店舗を選択し、その店舗への案内を通知するとともに(ステップ518)地図モードを起動し(ステップ502)、表示部106上にユーザの現在地と該当する店舗の位置情報、ならびに店舗への経路などを表示してもよい。
上述したように本実施形態の情報提供方法では、ユーザと仮想オペレータの対話を通じ、ユーザの求めるサービスに適合した店舗を絞り込むことができ、ユーザに対して質の高いサービスを提供することができる。つまり、ユーザの質問に対して複数の回答を提供してユーザに選択させるのではなく、ユーザと仮想オペレータの対話を通じ、ユーザに適した回答へユーザを導くことができる。
[6.ウェブチャットモードへの移行]
ユーザの周囲の環境や通信端末の使用状況、あるいはユーザ自身の希望により、音声入力や音声出力を行わず、テキスト入力、出力のみで対話を行い、これを通じてユーザの求める情報を提供するモード(以下、ウェブチャットモードと記す)へ移行できるようにしてもよい。例えばユーザ自身が発声を禁止されている場合、通信端末からの音声発信が禁じられている場合、喧噪な環境に起因してユーザの音声と周囲の雑音が区別できない場合、ユーザが通信端末の音声出力部112を他の用途(音楽や映像の視聴など)に用いている場合などには、自動的に、あるいはユーザが自主的にウェブチャットモードへ移行できるようにプログラムを構成してもよい。ウェブチャットモードでは、ユーザが入力した質問、および回答メッセージの両者が時間順に表示部106に表示される。この時のフローの一例を図8に示す。
ユーザの周囲の環境や通信端末の使用状況、あるいはユーザ自身の希望により、音声入力や音声出力を行わず、テキスト入力、出力のみで対話を行い、これを通じてユーザの求める情報を提供するモード(以下、ウェブチャットモードと記す)へ移行できるようにしてもよい。例えばユーザ自身が発声を禁止されている場合、通信端末からの音声発信が禁じられている場合、喧噪な環境に起因してユーザの音声と周囲の雑音が区別できない場合、ユーザが通信端末の音声出力部112を他の用途(音楽や映像の視聴など)に用いている場合などには、自動的に、あるいはユーザが自主的にウェブチャットモードへ移行できるようにプログラムを構成してもよい。ウェブチャットモードでは、ユーザが入力した質問、および回答メッセージの両者が時間順に表示部106に表示される。この時のフローの一例を図8に示す。
例えば通信端末100の起動後(ステップ200)、仮想オペレータが表示された画面(図3参照)上にウェブチャットモードへ移行するためのアイコンを表示し(ステップ700)、ユーザが任意に操作できるようにプログラムを構成してもよい。このアイコンをユーザが操作することで(ステップ702)仮想オペレータが表示されていた画面が切り替わり、対話形式のテキストが表示される画面(ウェブチャット画面)に移行するようにすればよい(ステップ704)。この後、ユーザはテキスト入力することで(ステップ706)で対話を開始することができる。
この場合、音声合成サーバから音声情報を送らない、あるいは音声情報を受信した通信端末100は音声情報を再生せず、表示部106に音声情報のテキストのみを表示すればよい。あるいは対話サーバで選択、あるいは生成された回答メッセージを文字情報のまま通信端末100へ送信してもよい。
あるいはアプリケーションの起動後(ステップ200)、音声出力部112の使用状況を確認するようプログラムが命令し(ステップ710)、音声出力部112が他の用途で使用されていると判断された場合、ウェブチャットモードへの移行の可否を表示部106に表示し(ステップ712)、ユーザによるモード移行を選択させてもよい。
あるいは何らかの物理量、例えば通信端末100の周囲の環境パラメータの変化に応じてウェブチャットモードへ切り替えるようにプログラムを構成してもよい。例えば通信端末100周辺の音量を測定し、その音量データを対話サーバなどに送信し(ステップ720)、ある一定レベル以上であればウェブチャットモードへ移行する旨を表示部106に表示し(ステップ722)、ウェブチャットモードへ自動的に移行する(ステップ704)ようにしてもよい。周囲の音量測定は、例えばアプリケーションを起動した後、ユーザが声入力部110をアクティブにする前に行うことができる。ウェブチャットモードへ移行する閾値としては、例えば90デシベル以上、あるいは110デシベル以上とすればよい。また、ウェブチャットモードへの移行の判断は、通信端末100側で行ってもよく、対話サーバ側で行ってもよい。
図示しないが、通信端末100の周囲の雑音とユーザが入力した音声情報が区別できない場合、ウェブチャットモードへ移行するようにプログラムを構成してもよい。例えば音声認識サーバが音声情報の解析を行う際に音声区間検出を行ってもユーザの音声情報が含まれる区間を検出できない場合、あるいは検出区間が一定の時間に満たない場合、あるいは入力された音声情報から雑音を十分に除去できずユーザの音声(質問)を検出、解析できない場合、ウェブチャットモードへの移行を案内すると同時に、ウェブチャットモードへ移行するためのアイコンを表示部106に表示してもよい。あるいは雑音の少ない環境への移動をユーザに要請する回答メッセージを通信端末100に送信し、併せてアイコンを表示してもよい。
また、対話内容に基づいてウェブチャットモードへ移行するようにプログラムを構成してもよい。たとえばユーザの音声情報に機密性の高い個人情報が含まれていると対話サーバが判断した場合、あるいは対話サーバが選択、生成する回答メッセージ内にそのような個人情報を含ませる必要がある場合、ウェブチャットモードへの移行を案内するようにしてもよい。
[7.他のモードへの移行]
モードの移行は、上述した通話モードや地図モード、ウェブチャットモードへの移行に限られない。例えばユーザと仮想オペレータ間の対話の解析に基づき、あるいはユーザの判断に基づき、事業者が通信ネットワークを経由して提供する種々のサービス(以下、ネットワークサービスと記す)へアクセスするように、プログラムが構成されていてもよい。ユーザ自らの判断でネットワークサービスへのアクセスを許容する場合、例えば図3で示した表示上に適当なアイコンを表示させ、これをユーザが操作することでネットワークサービスへ能動的にアクセスできるようにしてもよい。ネットワークサービスとしては、例えば金融業界の場合、各銀行が提供するインターネットバンキングサービスなどが挙げられる。
[7.他のモードへの移行]
モードの移行は、上述した通話モードや地図モード、ウェブチャットモードへの移行に限られない。例えばユーザと仮想オペレータ間の対話の解析に基づき、あるいはユーザの判断に基づき、事業者が通信ネットワークを経由して提供する種々のサービス(以下、ネットワークサービスと記す)へアクセスするように、プログラムが構成されていてもよい。ユーザ自らの判断でネットワークサービスへのアクセスを許容する場合、例えば図3で示した表示上に適当なアイコンを表示させ、これをユーザが操作することでネットワークサービスへ能動的にアクセスできるようにしてもよい。ネットワークサービスとしては、例えば金融業界の場合、各銀行が提供するインターネットバンキングサービスなどが挙げられる。
逆に、対話サーバが選択した最適の回答が、ユーザによるネットワークサービスの利用である場合、対話サーバからの回答メッセージを通信端末100へ送信するとともにネットワークサービスへリンクするアイコンを表示部106上に表示してもよい。
上述したように、本実施形態の情報提供方法では、ある条件が満たされた場合、あるいは何らかの物理量、例えば通信端末100の周囲の騒音レベルや雑音の周波数などが変化した場合、あるいはユーザが希望した場合、様々なモードへ移行することができる。モードの移行はユーザが自主的に行うこともでき、自動的に行うことも可能である。あるいは対話を通じてユーザにモードの意向を促すこともできる。このように、起動時に仮想オペレータが表示される最上位レイヤー(アプリケーションレイヤー)から、種々の下位レイヤーへユーザインタフェースが切り替わり、ユーザの質問に適合する情報や回答メッセージを提供することができる。
<第2実施形態>
本実施形態では、第1実施形態で述べた情報提供方法を実現するためのシステム構成に関し、図面を参照して説明する。通信端末100のシステム構成は第1実施形態で述べたため(図1参照)、ここでは割愛する。
本実施形態では、第1実施形態で述べた情報提供方法を実現するためのシステム構成に関し、図面を参照して説明する。通信端末100のシステム構成は第1実施形態で述べたため(図1参照)、ここでは割愛する。
なお、本実施形態で述べるシステム構成は一つの例であり、本発明は以下に示す実施形態に限定されるものではない。以下で説明する各種サーバの機能や要素は、他のサーバと重複していてもよく、例えばデータベースなどは複数のサーバによって管理、使用されることもある。また、各サーバを制御するユニット(コントローラなど)は、複数のサーバによって共有され、これら複数のサーバを制御するように構成されてもよい。さらに、一つのサーバは別のサーバの構成要素である場合もあり、この場合、上記一つのサーバは別のサーバの一部分と認識することができる。例えばある機能を有するサーバAがサーバBの構成要素の一つである場合、サーバAは、サーバBを含むシステムにおける一つの機能部と認識、記述することができる。
[1.音声認識]
ユーザが入力する音声は通信端末100の音声入力部110で取り込まれ、音声情報として通信部114へ伝達される(図1参照)。通信部114は通信ネットワークを経由し、図9に示す音声認識サーバ800のインターフェースとなるAPI810へ音声情報を送信する。送信された音声情報は、音声認識サーバ800内の音声認識エンジン820において解析される。
ユーザが入力する音声は通信端末100の音声入力部110で取り込まれ、音声情報として通信部114へ伝達される(図1参照)。通信部114は通信ネットワークを経由し、図9に示す音声認識サーバ800のインターフェースとなるAPI810へ音声情報を送信する。送信された音声情報は、音声認識サーバ800内の音声認識エンジン820において解析される。
図9に例示したように、音声認識エンジン820は例えば特徴量抽出部830、デコーダ840、テキスト出力部850を有している。特徴量抽出部830は送信された音声情報を分析し、特徴量パラメータを抽出する。デコーダ840は、言語モデル842、音響モデル844、語彙辞書846などのデータベースを参照しながら特徴量パラメータから最も優れた候補を計算し、認識結果として出力する。出力された認識結果はテキスト出力部850によってテキストデータへ変換、出力される。
このような音声認識システムを利用することで、ユーザが仮想オペレータに対して口語(話し言葉)で語り掛けた質問がテキストに変換される。
[2.音声合成]
ユーザの通信端末100で再生される音声は、音声合成サーバ900のインターフェースとなるAPI910から通信ネットワークを経由して通信端末100に送信される(図10参照)。音声合成サーバ900は音声合成エンジン920を有しており、図10に例示したように、音声合成エンジン920は例えばテキスト入力部930、言語解析部940、波形生成部950、送信部960を有している。
ユーザの通信端末100で再生される音声は、音声合成サーバ900のインターフェースとなるAPI910から通信ネットワークを経由して通信端末100に送信される(図10参照)。音声合成サーバ900は音声合成エンジン920を有しており、図10に例示したように、音声合成エンジン920は例えばテキスト入力部930、言語解析部940、波形生成部950、送信部960を有している。
テキスト入力部930では、後述する対話サーバで選択されたメッセージの文字情報が入力される。この文字情報は言語解析部940において言語解析され、データベースである言語辞書942を参照しながらアクセントの位置や読み情報などが解析される。波形生成部950では、実際に収録された音声から得られた波形データを用いて作成された音声合成データベース944を参照し、音声の波形を生成する。波形生成部950で生成された音声データは送信部960によって、AIP910を介して通信端末100へ送信される。なお、送信部960は音声データだけでなく、入力される文字情報を文字(テキスト)として送信することもできる。
このような音声合成システムを利用することで、仮想オペレータは人が話すのと同様の声でユーザと対話することができ、ユーザに対して親近感を抱かせることで事業者に対する距離感を減少させることができる。
[3.対話]
ユーザから送信された音声メッセージが音声認識サーバ800によって解析されて文字情報に変換された後、対話サーバ1000によって適切な回答が生成、選択される(図11参照)。対話サーバ1000はAPI1010の他、対話エンジン1020、事業者管理サーバ1040、管理サーバ1050、情報データベース1060などを有する(図11参照)。
ユーザから送信された音声メッセージが音声認識サーバ800によって解析されて文字情報に変換された後、対話サーバ1000によって適切な回答が生成、選択される(図11参照)。対話サーバ1000はAPI1010の他、対話エンジン1020、事業者管理サーバ1040、管理サーバ1050、情報データベース1060などを有する(図11参照)。
対話エンジン1020は対話コントローラ1022、セレクタ1024、応答生成部1026などを含有することができる。対話コントローラ1022は対話エンジン1020を制御するものであり、ユーザの意図を把握したり、セレクタ1024に適切なメッセージを選択させる機能を有する。セレクタ1024は対話コントローラ1022が理解したユーザの意図に対して適切な回答メッセージあるいは問合せメッセージ(1032、1034、1036、1038)を絞り込み、選択する機能を有する。セレクタ1024は絞り込みエンジンとも呼ばれる。応答生成部1026は、選択されたメッセージに基づいてユーザに対する回答を作成する機能を有する。応答生成部1026は、複数のメッセージを融合して一つのメッセージを作成してもよい。
情報データベース1060は事業者のビジネスに関連する用語や知識などを格納することができ、対話エンジン1020によって参照される。事業者管理サーバ1040は、例えば店舗の機能や位置情報、提供できるサービスの内容などの情報や、店舗の混雑状況や商品の在庫状況といった時間とともに変動するパラメータを格納できるデータベース1042を含むことができる。データベース1042に、ユーザの生体情報の標準データなどの個人情報を格納してもよい。応答生成部1026は、選択した応答メッセージにデータベース1042に格納された個人情報を適宜融合して回答メッセージを生成してもよい。データベース1042にユーザ情報を格納する場合、事業者管理サーバは事業者によって管理されることが好ましい。
なお対話サーバは、ユーザと対話サーバ間の対話内容や履歴を格納する通信サービス連携サーバ1100(後述)と接続されてもよい。あるいは、データベース1042内に上述した対話内容や履歴を格納するようシステムを構成してもよい。
メッセージ(1032、1034、1036、1038)は、ユーザからの様々な質問に対応する回答メッセージあるいは問合せメッセージであり、文字情報として準備、管理することができる。例えばメッセージ1032は、FAQに対応する定型的な回答メッセージとすることができる。メッセージ1034は、例えば回答メッセージを絞り込めないとき、ユーザに対して質問するための問合せメッセージとすることができる。メッセージ1036は、ユーザと事業者との雑談に対応するためのメッセージとすることができる。メッセージ1032、1034、1036は、事業者管理サーバ1040上で編集することができる。メッセージ1038は、音声認識サーバ800や対話サーバ1000を管理、維持する事業者によって管理される管理サーバ1050によって編集することができ、ユーザの事業者の事業とは直接的関連性の低い対話のために用意される。
問合せメッセージ1034を準備することで、多くの回答から選択させるという負担をユーザに課すことなく、ユーザが望む回答へユーザを導くことができる。
雑談に対応するためのメッセージ1036を事業者が準備、編集することで、事業者の事業内容と関連性の薄い対話であっても、ユーザは種々の会話を仮想オペレータと行うことがでる。これによって事業者とより親近感のあるコミュニケーションを行うことが可能となる。
[4.通話モード]
ユーザと仮想オペレータの間の対話から通話モードに移行する際には、通信端末100はインターフェースであるAPI1110を介して、通信サービス連携サーバ1100と接続される(図12参照)。通信サービス連携サーバ1100には、通信ステータス管理データベース1130、窓口データベース1140などが含まれる。
ユーザと仮想オペレータの間の対話から通話モードに移行する際には、通信端末100はインターフェースであるAPI1110を介して、通信サービス連携サーバ1100と接続される(図12参照)。通信サービス連携サーバ1100には、通信ステータス管理データベース1130、窓口データベース1140などが含まれる。
通信ステータス管理データベース1130にはユーザと仮想オペレータの間の対話履歴や対話内容を格納することができ、この内容は事業者管理サーバ1040上で事業者またはそのオペレータが閲覧することができる。窓口データベース1140は、オペレータに関する情報、たとえばオペレータの所属する部署や業務範囲、知識や経験などの情報を格納することができる。ユーザと仮想オペレータの間の対話ログや対話内容をコントローラ1120が解析し、その結果に基づいてコントローラ1120は窓口データベース1140を参照し、最適なオペレータを選択することができる。なお、通信ステータス管理データベース1130や窓口データベース1140を通信サービス連携サーバ1100内に設置せず、これらのサーバに格納される情報を事業者管理サーバ1040で管理してもよい。
通話モードへ移行する際には、API1110を介し、電話通信サービスを提供する事業者の通信ネットワーク1150へ電話接続の要求を送信し、同時に接続先の電話番号を伝える。これにより、ユーザと事業者あるいはオペレータとの通話が可能となる。
[5.地図モード]
地図モードへ移行する際のシステムは、図13に示すように、例えば地図情報を提供する事業者などが運営する情報配信サーバ1200、対話サーバ1000、事業者管理サーバ1040などで構成することができる。
地図モードへ移行する際のシステムは、図13に示すように、例えば地図情報を提供する事業者などが運営する情報配信サーバ1200、対話サーバ1000、事業者管理サーバ1040などで構成することができる。
情報配信サーバ1200には地図情報データベース1230が含まれている。API1210を介して通信端末100は位置情報を情報配信サーバ1200に送信し、情報配信サーバ1200から地図情報を受け取ることができる。事業者管理サーバ1040は、店舗の機能や位置情報、提供できるサービスの内容などの情報や、混雑状況や商品の在庫状況といった時間とともに変動するパラメータを格納できるデータベース1042を含むことができる。対話サーバ1000はユーザからの質問を解析し、その結果に基づいてデータベース1042を参照しつつ、最適な店舗を選択することができる。通信端末100はAPI1010を介して対話サーバ1000と接続され、対話サーバ1000によって選択された店舗とそれに係る情報とパラメータを取得する。プログラムの命令に従い、情報配信サーバ1200から受け取った地図情報と、選択された店舗の位置情報が表示部106上に表示される。
情報配信サーバ1200は経路探索手段1220を有しており、経路探索手段1220には地図情報データベース1230に加え、例えば経路探索手段1220、探索用データベース1240、道路交通情報データベース1250などが含まれる。経路探索手段1220は、地図情報データベース1230、探索用データベース1240、道路交通情報データベース1250に格納されている情報を参照しつつ、ユーザと店舗までの最良の経路を探索、決定する機能を有する。
本実施例では、事業者として銀行を例に挙げ、ユーザが日本円を米国ドルに両替するケースを想定し、図14を参照しつつ説明を行う。
最初にユーザは、通信端末100にインストールされた第1実施形態で示したプログラムを含むアプリケーションを起動する。その後アイコン300(図3参照)を操作して音声入力部110をアクティブにし、仮想オペレータに対話する要領で質問を口頭で述べる。例えば、「日本円を両替したい」と述べればよい。発声が困難な状況であれば、テキスト入力によって質問を入力してもよい。プログラムの命令に従って通信端末100の通信部114は、ユーザの音声情報を音声認識システムへ送信する(S1)。音声認識サーバ800は音声情報を文字情報へ変換し、対話サーバ1000へ伝達する(S2)。
対話サーバ1000は対話エンジン1020を用いて質問の意図を理解するが、例示した音声情報には、外貨の種類や両替額といった情報が含まれていないため、事業者はユーザに対して最善の情報を提供することができない。そこで対話サーバはさらなる情報をユーザから得るため、準備された問合せメッセージから最適な問合せメッセージを選択する、あるいは新たに作成し、これを音声合成サーバ900へ伝達する(S3)。例えば、「外貨の種類を教えてください」、「両替する日本円の金額を教えてください」などといった問合せメッセージを選択もしくは作成する。
音声合成サーバ900は上記問合せメッセージを言語解析して波形を生成し、音声情報として通信端末100へ送信する(S4)。なお、音声情報と同時に問合せメッセージの文字情報を音声合成サーバ900あるいは対話サーバ1000から通信端末100に送信してもよい。通信端末100は音声出力部112を用いて音声情報を再生するとともに、表示部106上に問合せメッセージを表示する。
ユーザは問合せメッセージに対する回答を、S1のステップと同様に行う。回答としては、例えば「米国ドルに両替したい」、「日本円は10万円程度」などの回答が考えられる。通信端末100はこの回答を音声認識サーバ800に送信し(S5)、音声認識サーバ800はユーザの音声を文字情報に変換して対話サーバ1000に伝達する(S6)。
対話サーバ1000はユーザからの回答を解析する。本実施例では日本円からUSドルへの両替であるため、ユーザは店舗へ直接アクセスする必要がある。このため対話サーバ1000は、ユーザを店舗へ案内することが必須であると判断し、ユーザを店舗へ案内するための回答メッセージを生成、あるいは選択する。回答メッセージの例として、「お近くの当行支店にご案内いたします」のようなメッセージが挙げられる。その後回答メッセージの音声情報を音声合成サーバ900へ伝達する(S7)。
この時、対話サーバ1000は事業者管理サーバ1040にアクセスし(S8)、ユーザの要求を満たす店舗の候補、ならびに店舗の混雑状況や商品の在庫状況などのパラメータを取得する(S9)。これは、店舗によっては保管する外貨の種類や量が異なり、また、取引状況によっては在庫量が大幅に変動している可能性があるためである。これらの情報に基づいてユーザの要求に対して最適な店舗を決定し、その位置情報を通信端末100に送信する。同時に、対話サーバ1000は通信端末100に対して地図モードへの移行要求を送信する(S10)。
音声合成サーバ900は回答メッセージから音声情報を生成し、この音声情報と回答メッセージの文字情報を通信端末100に送信する(S11)。
通信端末100は内蔵されたGPS機能を利用して位置座標を取得し、通信端末100の位置情報と受信した店舗の位置情報を情報配信サーバ1200に送信し、付近の地図情報とともに経路探索を要求する(S12)。情報配信サーバ1200は通信端末100の要求に応え、必要な地図情報と経路の探索結果を通信端末100に送信する(S13)。
その後通信端末100は、プログラムの命令に従い、表示部106上に付近の地図、目的とする店舗の位置、ならびに店舗までの経路を表示する。
このように、ユーザの質問に対して対話を通して対応することで、最適な回答をユーザに提供することができる。この時ユーザは、複数の回答から最適な回答を選択するという労力を払う必要がないため、最適な回答に速やかにたどり着くことができる。
また、このような対話によるサービスはユーザが操作する通信端末100を用いて達成できるため、ユーザは店舗に訪れて質問をする労力を払う必要もなく、また、店舗の営業時間や店舗での待ち時間などを考慮する必要もない。このように、本実施形態の情報提供方法やそれを実行するためのプログラムを用いることによって、ユーザは時間や場所を選ばずに種々の問題を解決することができる。
またユーザは、事業者やそのオペレータの知識や経験、能力に制約されることなく、均一かつ豊富な情報を獲得することができる。例えば本実施例の事例では、各店舗における米国ドルの現金の在庫状況は刻一刻と変化するため、従来、ユーザと直接対応するオペレータによってはその変動を把握することができず、在庫が不十分な店舗を案内する可能性があった。しかしながら本実施形態の情報提供方法を実施することにより、全てのユーザに対して正確な情報を提供することができる。同時に事業者は、ユーザ対応における人的資源の消耗を回避することで業務の効率化と生産性の向上が達成できる。
本実施例では、実施例1と異なるケースを想定して説明を行う。具体的には、ユーザが銀行口座のキャッシュカードを紛失した例を、図15を参照しつつ説明する。
実施例1と同様に、最初にユーザは、通信端末100にインストールされた第1実施形態で示したプログラムを含むアプリケーションを起動する。その後アイコン300を操作して音声入力部110をアクティブにし、仮想オペレータに対話する要領で質問を口頭で述べる。例えば、「キャッシュカードをなくしたのだが」と述べることができる。発声が困難な状況であれば、テキスト入力によって質問を入力してもよい。プログラムの命令に従って通信端末100の通信部114は、ユーザの音声情報を音声認識システムへ送信する(図15、S1)。音声認識サーバ800は音声情報を文字情報へ変換し、対話サーバ1000へ伝達する(S2)。
対話サーバ1000は対話エンジン1020を用いて質問の意図を理解する。対話サーバ1000は質問に対する回答メッセージを選択し、その文字情報を音声合成サーバ900に伝達する(S3)。音声合成サーバ900は上記問合せメッセージを言語解析して波形を生成し、音声情報、および文字情報として通信端末100へ送信する(S4)。通信端末100は音声出力部112を用いて音声情報を再生するとともに、表示部106上に問合せメッセージを表示する。
本実施例で想定したケースでは、事業者はユーザに対して速やかに所定の部署、例えば喪失受付センターなどへ通知するよう要求する必要がある。したがって対話サーバは回答メッセージを選択すると同時に、事業者管理サーバ1040に対して該当部署の電話番号の送信を要求する(S5)。事業者管理サーバ1040は対話サーバ1000の要求に従って必要な情報を送信する(S6)。
本実施例のケースにおける回答メッセージは、例えば「キャッシュカードでのお取引ができないよう設定しますので、喪失受付センターへお繋ぎします」のようなメッセージが挙げられる。これによりユーザは通話モードへ切り替わることを予測することができる。
対話サーバ1000は通信端末100に対して通話モードへの切り替えを要求する(S7)。同時に対話サーバ1000は通信サービス連携サーバ1100に対して回線の接続を要求し、該当部署の電話番号を通知する(S8)。通信サービス連携サーバ1100は対話サーバ1000からの要求に応えてユーザの通信端末100と所定の部署とを電話回線で接続し(S9)、ユーザとオペレータとの通話が開始される。
なお、ここではユーザの意向にかかわらず、通話モードへ切り替わる例を示したが、通話モードへの切り替えの要否をユーザの判断に委ねてもよい。例えば通話モードへの切り替え要求を通信端末100が対話サーバ1000から受信した際(S7)、電話アイコンを表示部106上に表示し、電話アイコンの操作によって通話が開始されるようにしてもよい。
本実施例で想定した質問はFAQの一種であり、例えば事業者が提供するサイト上でも回答を得ることも可能な場合が多い。しかしながら本実施例のケースはユーザにとっては一種の緊急事態であり、一刻でも早い問題解決を要望しているため、通信端末100から事業者のサイトへアクセスする精神的余裕を持たない場合が多い。
これに対して本実施形態では、スマートフォンなどの常時携帯可能な通信端末100にインストールされたアプリケーションを起動し、口頭で質問を述べるだけで自動的に所定の部署への通話を開始することが可能である。したがって本発明の実施形態により、ユーザに対してより簡便、かつ迅速なサービスを提供することができる。
上述した実施形態や実施例では、主に金融事業に関連する例を取り上げて説明を行ったが、本発明の実施は金融業界に限られない。例えば食品業界、外食業界、物流業界、建設業界、空港・海運業界など、あらゆる業界、業種において実施、適用が可能である。その一例として本実施例では、ユーザが飲食店を利用する際のケースを想定し、図16を参照しつつ説明を行う。なおここでの事業者とは、飲食店に関する情報を収集し、それをユーザに提供する個人あるいは団体であり、各飲食店はこの事業者に対して必要な情報を提供する。
実施例1、2と同様にユーザはまず、通信端末100にインストールされた第1実施形態で示したプログラムを含むアプリケーションを起動する。その後アイコン300を操作して音声入力部110をアクティブにし、仮想オペレータに対話する要領で質問を口頭で述べる。例えば、「お腹すいた」とか、「ご飯が食べたい」と述べることができる。発声が困難な状況であれば、テキスト入力によって質問を入力してもよい。プログラムの命令に従って通信端末100の通信部114は、ユーザの音声情報を音声認識システムへ送信する(S1)。音声認識サーバ800は音声情報を文字情報へ変換し、対話サーバ1000へ伝達する(S2)。
対話サーバ1000は対話エンジン1020を用いて質問の意図を理解するが、上記の音声情報には、具体的な情報が全く含まれていない。例えばユーザが何を食べたいのか、どの程度の量を食べたいのか、アルコールを飲みたいのか、人数はどの程度か、喫煙者であるのかどうか、などといった情報は全く含まれていない。したがって事業者はユーザに対して最善の情報を提供することができない。そこで対話サーバはさらなる情報をユーザから得るため、準備された問合せメッセージから最適なメッセージを選択する、あるいは新たに作成し、これを音声合成サーバ900へ伝達する(S3)。問合せメッセージとしては、例えば「どのようなものを召し上がりますか?」などといった自由回答形式のメッセージでもよく、あるいは「和食、中華、洋食のうちいずれが良いでしょうか?」といった選択形式のメッセージでもよい。
音声合成サーバ900は上記問合せメッセージを言語解析して波形を生成し、音声情報として通信端末100へ送信する(S4)。実施例1、2と同様に、音声情報と同時に文字情報を音声合成サーバ900あるいは対話サーバ1000から通信端末100に送信してもよい。通信端末100は音声出力部112を用いて音声情報を再生するとともに、表示部106上に問合せメッセージを表示する。
同時に対話サーバ1000は通信端末100に対して位置情報の提供を要求する(S5)。この要求に応えて通信端末100は、内蔵するGPS機能を利用して位置座標を獲得し、その情報を対話サーバ1000に送信する(S6)。
この間、ユーザは問合せメッセージに対する回答を、S1のステップと同様に行う。回答としては、例えば「パスタが食べたい」といった具体的な回答でもよく、「温かいものが良い」といった抽象的な回答でもよい。通信端末100はこの回答を音声認識サーバ800に送信し(S7)、音声認識サーバ800はユーザの音声を文字情報に変換して対話サーバ1000に伝達する(S8)。
対話サーバ1000はユーザからの回答を解析する。ユーザからの回答では最終的な飲食店にまで絞り込むことは困難であると対話サーバ1000が判断した場合、再度問合せメッセージを選択、作成し、音声合成サーバ900を介して通信端末100へ送信する。そしてユーザはそれに対する回答を口頭で述べる。このステップを繰り返すことで、例えば「温かいものが食べたい」、「和食が良い」、「お酒も出してくれるところ」、「人数は3名」、「喫煙できるところがいい」といったように、より具体的な情報をユーザから取得することができる。
対話サーバ1000は事業者管理サーバ1040に対し、ユーザの位置座標付近に登録された飲食店の情報を要求する(S9)。事業者管理サーバ1040はこの要求に応え、データベース1042から要求された情報を対話サーバ1000に送信する(S10)。
対話サーバ1000はユーザから得られた情報を解析し、セレクタ1024が有する絞り込み機能を用いてデータベース1042から取得した情報の中からユーザの希望に最もよく適合する回答を選択する。
次に対話サーバ1000は回答が得られた旨をユーザに伝えるための回答メッセージを選択し、これを音声合成サーバ900へ伝達する(S11)。この時の回答メッセージとしては例えば、「お客様のご希望に最適なお店をご紹介します」というようなメッセージでよい。同時に対話サーバ1000は情報配信サーバ1200に対し、選択された回答、すなわち選択された飲食店の位置情報を要求する(S12)。情報配信サーバ1200は対話サーバ1000からの要求された情報を対話サーバ1000、あるいは直接通信端末100へ送信する(S13)。
音声合成サーバ900は対話サーバ1000から送られた回答メッセージを音声情報に変換し、通信端末100へ送信する(S14)。
さらに対話サーバ1000は通信端末100に対して地図モードへの意向を要求する(S15)。これに応えて通信端末100は情報配信サーバ1200に対して通信端末100の位置情報と選択された飲食店の位置情報とともに経路探索を要求する(S16)。情報配信サーバ1200は通信端末100の要求に応え、必要な地図情報と経路の探索結果を通信端末100に送信する(S17)。
その後通信端末100は、表示部106上に付近の地図、目的とする飲食店の位置、ならびに飲食店までの経路を表示する。
このように、ユーザの質問に対して対話を通じて対応することで、最適な回答をユーザに提供することができる。この時ユーザは、複数の回答から最適な回答を選択するという労力を払う必要がないため、最適な回答に速やかにたどり着くことができる。
上述した各実施形態は、相互に矛盾しない限りにおいて、適宜組み合わせて実施することができる。また、各実施形態を基にして、当業者が適宜構成要素やプロセスの追加、削除もしくは設計変更を行ったものも、本発明の要旨を備えている限り、本発明の範囲に含まれる。
また、上述した各実施形態の態様によりもたらされる作用効果とは異なる他の作用効果であっても、本明細書の記載から明らかなもの、又は、当業者において容易に予測し得るものについては、当然に本発明によりもたらされるものと解される。
100:通信端末、102:中央演算ユニット、104:メモリ、106:表示部、108:入力部、110:音声入力部、112:音声出力部、114:通信部、116:画像取込装置、200:ステップ、202:ステップ、204:ステップ、206:ステップ、208:ステップ、210:ステップ、212:ステップ、214:ステップ、216:ステップ、218:ステップ、220:ステップ、222:ステップ、224:ステップ、226:ステップ、228:ステップ、230:ステップ、232:ステップ、234:ステップ、300:アイコン、302:アイコン、400:ステップ、402:ステップ、404:ステップ、406:ステップ、408:ステップ、410:ステップ、412:ステップ、602:アイコン、604:アイコン、700:ステップ、702:ステップ、704:ステップ、706:ステップ、710:ステップ、712:ステップ、720:ステップ、722:ステップ、800:音声認識サーバ、810:API、820:音声認識エンジン、830:特徴量抽出部、840:デコーダ、842:言語モデル、844:音響モデル、846:語彙辞書、850:テキスト出力部、900:音声合成サーバ、910:API、920:音声合成エンジン、930:テキスト入力部、940:言語解析部、942:言語辞書、944:音声合成データベース、950:波形生成部、960:送信部、1000:対話サーバ、1010:API、1020:対話エンジン、1022:対話コントローラ、1024:セレクタ、1026:応答生成部、1032:メッセージ、1034:メッセージ、1036:メッセージ、1038:メッセージ、1040:事業者管理サーバ、1042:データベース、1050:管理サーバ、1060:情報データベース、1100:通信サービス連携サーバ、1110:API、1120:コントローラ、1130:通信ステータス管理データベース、1140:窓口データベース、1150:通信ネットワーク、1200:情報配信サーバ、1210:API、1220:経路探索手段、1230:地図情報データベース、1240:探索用データベース、1250:道路交通情報データベース
Claims (33)
- 通信端末から送信されたユーザの音声情報を認識する音声認識部と、
前記音声情報に対する回答メッセージを、複数のメッセージが格納されたデータベースから選択する対話部と、
選択された前記回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして前記通信端末に送信する送信部を有し、
前記対話部は、前記回答メッセージを一つに絞り切れない場合、前記ユーザに質問するための問合せメッセージを前記データベースから選択し、選択された前記問合せメッセージを前記通信端末に送信する情報提供システム。 - 前記通信端末をさらに含む、請求項1に記載の情報提供システム。
- 前記通信端末は仮想オペレータを表示するように構成され、
前記回答メッセージ、前記問合せメッセージを前記通信端末で再生する際、前記回答メッセージ、前記問合せメッセージを再生しない時と比較し、前記仮想オペレータの一部が大きな動作を行うように構成される、請求項1に記載の情報提供システム。 - 前記ユーザの標準生体情報が格納される第1のサーバをさらに有し、
前記通信端末は、前記ユーザの生体情報を取り込む画像取込装置を有し、
前記生体情報と前記標準生体情報に基づいて前記ユーザが承認された場合に、前記ユーザに前記音声情報の入力を許容するように構成される、請求項1に記載の情報提供システム。 - 前記ユーザと事業者との通話のための第2のサーバをさらに有する、請求項1に記載の情報提供システム。
- 前記第2のサーバは、音声認識部によって認識された前記音声情報と、選択された前記回答メッセージと前記問合せメッセージを格納するように構成される、請求項5に記載の情報提供システム。
- 地図情報が格納される第3のサーバをさらに有し、
前記第1のサーバは事業者の複数の店舗に関する情報を格納するように構成され、
前記通信端末は、表示部に前記通信端末の位置と前記複数の店舗の情報を表示するように構成される、請求項4に記載の情報提供システム。 - 前記対話部は、前記音声情報に基づき、前記複数の店舗から少なくとも一つの店舗を選択するように構成され、
前記第3のサーバは、前記選択された店舗への道順を前記通信端末へ送信するように構成される、請求項7に記載の情報提供システム。 - ユーザによって音声入力された質問に対応する回答メッセージを複数のメッセージから絞り込み、前記回答メッセージを一つに絞り切れない場合には、ユーザに質問するための問合せメッセージを前記複数のメッセージから選択するように構成されるサーバ。
- ユーザが入力した音声情報を認識する音声認識サーバから前記質問が伝達されるように構成される、請求項9に記載のサーバ。
- 前記回答メッセージと前記問合せメッセージが音声合成サーバへ伝達されるように構成される、請求項9に記載のサーバ。
- 前記ユーザの生体情報を格納するように構成される第1のサーバと接続される、請求項9に記載のサーバ。
- 前記第1のサーバが事業者の店舗情報を格納するように構成される、請求項12に記載のサーバ。
- 前記ユーザの前記質問、選択された前記回答メッセージ、選択された前記問合せメッセージの少なくとも一つを格納するように構成される第2のサーバが、前記第1のサーバと接続される、請求項13に記載のサーバ。
- 通信端末から送信される、ユーザの質問を含む音声情報を認識し、
認識された前記ユーザの前記質問に対応する回答メッセージを複数の回答メッセージから選択し、
選択された前記回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして前記通信端末に送信し、
前記回答メッセージが一つに絞り切れない場合、前記ユーザに質問するための問合せメッセージを前記複数の回答メッセージから選択し、
選択された前記問合せメッセージを前記通信端末に送信することをコンピュータに実行させるためのプログラム。 - 前記通信端末が取り込む前記ユーザの生体情報を受信し、前記生体情報を用いて前記ユーザの認証を行うことを実行させる、請求項15に記載のプログラム。
- 前記ユーザの前記質問、選択された前記回答メッセージ、選択された前記問合せメッセージの少なくとも一つを格納することをさらに実行させる、請求項15に記載のプログラム。
- 格納された前記ユーザの前記質問、選択された前記回答メッセージ、選択された前記問合せメッセージの少なくとも一つを参照し、
前記通信端末と事業者の電話端末とを接続することをさらに実行させる、請求項15に記載のプログラム。 - 格納された前記ユーザの前記質問、選択された前記回答メッセージ、選択された前記問合せメッセージの少なくとも一つを参照し、
前記通信端末に事業者の店舗情報を表示することをさらに実行させる、請求項15に記載のプログラム。 - 前記通信端末から前記質問を文字情報として受信し、
前記回答メッセージを前記通信端末に文字情報として送信することをさらに実行させる、請求項15に記載のプログラム。 - 前記音声情報内に含まれる前記質問が検出できないとき、前記通信端末から前記質問を文字情報として受信し、
前記回答メッセージを前記通信端末に文字情報として送信することをさらに実行させる、請求項15に記載のプログラム。 - 前記通信端末から前記通信端末周囲の音量データを受信し、
前記音量データに応じて前記通信端末から前記質問を文字情報として受信することを実行させる、請求項21に記載のプログラム。 - 音声認識サーバ、対話サーバ、音声合成サーバが含まれるシステムに音声情報を送信し、
前記音声情報に含まれるユーザの質問に対する回答メッセージ、前記質問に対する問合せメッセージの少なくとも一つを受信し、
前記回答メッセージと前記問合せメッセージを少なくとも音声情報および文字情報のいずれか一つとして出力することを通信端末に実行させるためのプログラム。 - 前記プログラムが前記通信端末に記憶されるように構成される、請求項23に記載のプログラム。
- 前記プログラムが通信ネットワークから取得されるように構成される、請求項23に記載のプログラム。
- 前記プログラムが仮想オペレータを表示し、前記回答メッセージ、前記問合せメッセージを前記通信端末で再生する際、前記回答メッセージ、前記問合せメッセージを再生しない時と比較し、前記仮想オペレータの一部が大きな動作を行うように構成される、請求項23に記載のプログラム。
- 前記プログラムがユーザの生体情報を取得するように構成される、請求項23に記載のプログラム。
- 前記プログラムが前記通信端末と事業者の電話端末とを接続するように構成される、請求項23に記載のプログラム。
- 前記プログラムが前記通信端末の位置情報を取得し、
前記通信端末に地図を表示し、
事業者の店舗情報を前記通信端末に表示するように構成される、請求項23に記載のプログラム。 - 前記プログラムがさらに、前記通信端末の位置から前記事業者の店舗までの経路を表示させる、請求項29に記載のプログラム。
- 前記質問を文字情報として送信することをさらに実行させる、請求項23に記載のプログラム。
- 前記通信端末周囲の音量を測定し、前記音量のデータを前記音声認識サーバ、前記対話サーバ、前記音声合成サーバのうち少なくとも一つに送信することを実行させる、請求項23に記載のプログラム。
- 前記音量に応じて、前記質問を文字情報として送信することをさらに実行させる、請求項32に記載のプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016033952A JP2017152948A (ja) | 2016-02-25 | 2016-02-25 | 情報提供方法、情報提供プログラム、および情報提供システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016033952A JP2017152948A (ja) | 2016-02-25 | 2016-02-25 | 情報提供方法、情報提供プログラム、および情報提供システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2017152948A true JP2017152948A (ja) | 2017-08-31 |
Family
ID=59739234
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016033952A Pending JP2017152948A (ja) | 2016-02-25 | 2016-02-25 | 情報提供方法、情報提供プログラム、および情報提供システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2017152948A (ja) |
Cited By (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110019725A (zh) * | 2017-12-22 | 2019-07-16 | 科沃斯商用机器人有限公司 | 人机交互方法、系统及其电子设备 |
| JP2019185203A (ja) * | 2018-04-04 | 2019-10-24 | 株式会社サテライトオフィス | ボットシステム、ボットシステムのプログラム |
| JP2019197977A (ja) * | 2018-05-08 | 2019-11-14 | シャープ株式会社 | 問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム |
| JP2020021215A (ja) * | 2018-07-31 | 2020-02-06 | 株式会社彩いろり | 酒類の情報管理システム及び管理方法 |
| JP2020096373A (ja) * | 2020-03-05 | 2020-06-18 | 株式会社オープンエイト | サーバおよびプログラム、動画配信システム |
| JP2020113938A (ja) * | 2019-01-16 | 2020-07-27 | 沖電気工業株式会社 | 情報処理装置、情報処理方法、情報処理システムおよびプログラム |
| JPWO2019220518A1 (ja) * | 2018-05-14 | 2021-02-25 | 富士通株式会社 | 回答プログラム、回答方法および回答装置 |
| JP2022065521A (ja) * | 2020-10-15 | 2022-04-27 | 清水建設株式会社 | クレーン操作確認支援システム及びクレーン操作確認支援支援方法 |
| CN115860823A (zh) * | 2023-03-03 | 2023-03-28 | 深圳市人马互动科技有限公司 | 人机互动问卷答题场景中的数据处理方法及相关产品 |
| KR20230081409A (ko) * | 2021-11-30 | 2023-06-07 | 주식회사 코리아세븐 | 챗봇 서비스 방법, 챗봇 서비스 시스템 및 상기 방법을 실행시키기 위하여 기록매체에 저장된 컴퓨터 프로그램 |
| CN116884393A (zh) * | 2023-08-03 | 2023-10-13 | 北京中科深智科技有限公司 | 一种压弹式多级缓冲生成式ai通信方法 |
| JP7382686B1 (ja) | 2023-09-28 | 2023-11-17 | 株式会社イデア・レコード | 情報処理装置、情報処理プログラム、及び情報処理方法 |
| JP2024016466A (ja) * | 2022-07-26 | 2024-02-07 | 清水建設株式会社 | 鋼材情報提供システム及び鋼材情報提供方法 |
| JP7671554B1 (ja) * | 2025-03-07 | 2025-05-02 | 株式会社ネクストエデュケーション | 発注期待度算出機能付きオンライン営業システム |
Citations (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11242546A (ja) * | 1997-12-26 | 1999-09-07 | Bandai Digital Entertaiment:Kk | サーバシステム、クライアント及び情報提供システム並びにそれらの処理プログラムを記録した媒体 |
| JP2004355108A (ja) * | 2003-05-27 | 2004-12-16 | Fujitsu Ltd | オペレータ支援プログラム |
| JP2005286672A (ja) * | 2004-03-30 | 2005-10-13 | Vodafone Kk | 自動音声応答方法並びに自動音声応答システム及びこのシステムを構成する電話機 |
| JP2005293195A (ja) * | 2004-03-31 | 2005-10-20 | Fujitsu Ten Ltd | コンテンツ選択装置 |
| JP2006337480A (ja) * | 2005-05-31 | 2006-12-14 | Kubo Kogyo Kk | 業務支援システムおよび業務支援方法 |
| JP2009077132A (ja) * | 2007-09-20 | 2009-04-09 | Ntt Comware Corp | 情報通信システム、中継装置、中継プログラム、および情報通信方法 |
| JP2010153956A (ja) * | 2008-12-24 | 2010-07-08 | Brother Ind Ltd | 来訪者受付装置、来訪者受付方法、及び来訪者受付プログラム |
| JP2011004143A (ja) * | 2009-06-18 | 2011-01-06 | Ntt Docomo Inc | 情報提供システム、情報提供装置、情報提供方法 |
| JP2012049756A (ja) * | 2010-08-26 | 2012-03-08 | Oki Electric Ind Co Ltd | 在宅コールセンタシステム及び在宅コール応答方法 |
| JP2014086088A (ja) * | 2012-10-19 | 2014-05-12 | Samsung Electronics Co Ltd | ディスプレイ装置、ディスプレイ装置制御方法及びディスプレイ装置の制御のための情報処理装置 |
| JP2015028566A (ja) * | 2013-07-30 | 2015-02-12 | 株式会社デンソー | 応答制御システム、車載器、およびセンター |
| JP2015050471A (ja) * | 2013-08-29 | 2015-03-16 | 京セラ株式会社 | 電話装置および発信方法 |
| JP2016024765A (ja) * | 2014-07-24 | 2016-02-08 | ソフトバンク株式会社 | 情報検索装置及び情報検索プログラム |
-
2016
- 2016-02-25 JP JP2016033952A patent/JP2017152948A/ja active Pending
Patent Citations (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11242546A (ja) * | 1997-12-26 | 1999-09-07 | Bandai Digital Entertaiment:Kk | サーバシステム、クライアント及び情報提供システム並びにそれらの処理プログラムを記録した媒体 |
| JP2004355108A (ja) * | 2003-05-27 | 2004-12-16 | Fujitsu Ltd | オペレータ支援プログラム |
| JP2005286672A (ja) * | 2004-03-30 | 2005-10-13 | Vodafone Kk | 自動音声応答方法並びに自動音声応答システム及びこのシステムを構成する電話機 |
| JP2005293195A (ja) * | 2004-03-31 | 2005-10-20 | Fujitsu Ten Ltd | コンテンツ選択装置 |
| JP2006337480A (ja) * | 2005-05-31 | 2006-12-14 | Kubo Kogyo Kk | 業務支援システムおよび業務支援方法 |
| JP2009077132A (ja) * | 2007-09-20 | 2009-04-09 | Ntt Comware Corp | 情報通信システム、中継装置、中継プログラム、および情報通信方法 |
| JP2010153956A (ja) * | 2008-12-24 | 2010-07-08 | Brother Ind Ltd | 来訪者受付装置、来訪者受付方法、及び来訪者受付プログラム |
| JP2011004143A (ja) * | 2009-06-18 | 2011-01-06 | Ntt Docomo Inc | 情報提供システム、情報提供装置、情報提供方法 |
| JP2012049756A (ja) * | 2010-08-26 | 2012-03-08 | Oki Electric Ind Co Ltd | 在宅コールセンタシステム及び在宅コール応答方法 |
| JP2014086088A (ja) * | 2012-10-19 | 2014-05-12 | Samsung Electronics Co Ltd | ディスプレイ装置、ディスプレイ装置制御方法及びディスプレイ装置の制御のための情報処理装置 |
| JP2015028566A (ja) * | 2013-07-30 | 2015-02-12 | 株式会社デンソー | 応答制御システム、車載器、およびセンター |
| JP2015050471A (ja) * | 2013-08-29 | 2015-03-16 | 京セラ株式会社 | 電話装置および発信方法 |
| JP2016024765A (ja) * | 2014-07-24 | 2016-02-08 | ソフトバンク株式会社 | 情報検索装置及び情報検索プログラム |
Cited By (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110019725A (zh) * | 2017-12-22 | 2019-07-16 | 科沃斯商用机器人有限公司 | 人机交互方法、系统及其电子设备 |
| JP2019185203A (ja) * | 2018-04-04 | 2019-10-24 | 株式会社サテライトオフィス | ボットシステム、ボットシステムのプログラム |
| JP7128462B2 (ja) | 2018-04-04 | 2022-08-31 | 株式会社サテライトオフィス | ボットシステム、ボットシステムのプログラム |
| JP2019197977A (ja) * | 2018-05-08 | 2019-11-14 | シャープ株式会社 | 問い合わせ処理方法、システム、端末、自動音声対話装置、表示処理方法、通話制御方法、及び、プログラム |
| JPWO2019220518A1 (ja) * | 2018-05-14 | 2021-02-25 | 富士通株式会社 | 回答プログラム、回答方法および回答装置 |
| JP2023179656A (ja) * | 2018-07-31 | 2023-12-19 | 株式会社彩いろり | 酒類の情報管理システム及び管理方法 |
| JP2020021215A (ja) * | 2018-07-31 | 2020-02-06 | 株式会社彩いろり | 酒類の情報管理システム及び管理方法 |
| JP7616708B2 (ja) | 2018-07-31 | 2025-01-17 | 株式会社彩いろり | 酒類の情報管理システム及び管理方法 |
| JP2020113938A (ja) * | 2019-01-16 | 2020-07-27 | 沖電気工業株式会社 | 情報処理装置、情報処理方法、情報処理システムおよびプログラム |
| JP2020096373A (ja) * | 2020-03-05 | 2020-06-18 | 株式会社オープンエイト | サーバおよびプログラム、動画配信システム |
| JP2022065521A (ja) * | 2020-10-15 | 2022-04-27 | 清水建設株式会社 | クレーン操作確認支援システム及びクレーン操作確認支援支援方法 |
| JP7560316B2 (ja) | 2020-10-15 | 2024-10-02 | 清水建設株式会社 | クレーン操作確認支援システム及びクレーン操作確認支援支援方法 |
| KR20230081409A (ko) * | 2021-11-30 | 2023-06-07 | 주식회사 코리아세븐 | 챗봇 서비스 방법, 챗봇 서비스 시스템 및 상기 방법을 실행시키기 위하여 기록매체에 저장된 컴퓨터 프로그램 |
| KR102597695B1 (ko) * | 2021-11-30 | 2023-11-02 | 주식회사 코리아세븐 | 챗봇 서비스 방법, 챗봇 서비스 시스템 및 상기 방법을 실행시키기 위하여 기록매체에 저장된 컴퓨터 프로그램 |
| JP2024016466A (ja) * | 2022-07-26 | 2024-02-07 | 清水建設株式会社 | 鋼材情報提供システム及び鋼材情報提供方法 |
| CN115860823A (zh) * | 2023-03-03 | 2023-03-28 | 深圳市人马互动科技有限公司 | 人机互动问卷答题场景中的数据处理方法及相关产品 |
| CN116884393A (zh) * | 2023-08-03 | 2023-10-13 | 北京中科深智科技有限公司 | 一种压弹式多级缓冲生成式ai通信方法 |
| JP7382686B1 (ja) | 2023-09-28 | 2023-11-17 | 株式会社イデア・レコード | 情報処理装置、情報処理プログラム、及び情報処理方法 |
| JP2025056999A (ja) * | 2023-09-28 | 2025-04-09 | 株式会社イデア・レコード | 情報処理装置、情報処理プログラム、及び情報処理方法 |
| JP7671554B1 (ja) * | 2025-03-07 | 2025-05-02 | 株式会社ネクストエデュケーション | 発注期待度算出機能付きオンライン営業システム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2017152948A (ja) | 情報提供方法、情報提供プログラム、および情報提供システム | |
| JP6891337B2 (ja) | 画像および/または他のセンサデータに基づいている自動アシスタント要求の解決 | |
| JP6351562B2 (ja) | 情報処理システム、受付サーバ、情報処理方法及びプログラム | |
| US12381961B1 (en) | Methods and systems for virtual assistant routing | |
| KR102624148B1 (ko) | 인간 사용자를 대신하여 대화형 음성 응답(ivr) 트리 자동 탐색 | |
| US20210201359A1 (en) | Systems and methods relating to automation for personalizing the customer experience | |
| US8054952B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
| CN111933134A (zh) | 人机交互的方法及装置、电子设备、存储介质 | |
| US20180285595A1 (en) | Virtual agent for the retrieval and analysis of information | |
| US20140039893A1 (en) | Personalized Voice-Driven User Interfaces for Remote Multi-User Services | |
| WO2017175363A1 (ja) | 情報処理システム、受付サーバ、情報処理方法及びプログラム | |
| CN109684455A (zh) | 智能客服系统的实现方法及装置、设备、可读存储介质 | |
| CN108876662A (zh) | 智能餐饮服务方法、系统、智能服务中心以及智能终端 | |
| JP6141483B1 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
| KR20200139599A (ko) | 상담 서비스 제공 방법 및 장치 | |
| CN117061487A (zh) | 语音响应系统的图形用户界面 | |
| US8867708B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
| US12524447B2 (en) | Intelligent assistant system for conversational job search | |
| CN117424960A (zh) | 智能语音服务方法、装置、终端设备以及存储介质 | |
| JP6748510B2 (ja) | 情報提供システム、情報提供方法、および情報提供プログラム | |
| US20240321267A1 (en) | A system and method for delivering domain or use-case switch suggestion for an ongoing conversation | |
| JP2023076430A (ja) | プログラム、情報処理システム及び情報処理方法 | |
| JP7623763B1 (ja) | 情報処理システムおよび情報処理方法 | |
| KR20190094080A (ko) | 사용자간 대화 세션에 대한 모니터링에 기초하여 능동적으로 주문 또는 예약 서비스를 제공하는 대화형 ai 에이전트 시스템, 방법 및 컴퓨터 판독가능 기록 매체 | |
| TWI723988B (zh) | 資訊處理系統、受理伺服器、資訊處理方法及程式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170613 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170725 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20170731 |
|
| A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20170818 |