JP2017152948A

JP2017152948A - 情報提供方法、情報提供プログラム、および情報提供システム

Info

Publication number: JP2017152948A
Application number: JP2016033952A
Authority: JP
Inventors: 藤戸　初夫; Hatsuo Fujito; 初夫藤戸; 山田　和範; Kazunori Yamada; 山田　　和範
Original assignee: Bank of Tokyo Mitsubishi UFJ Trust Co
Current assignee: MUFG Bank Ltd
Priority date: 2016-02-25
Filing date: 2016-02-25
Publication date: 2017-08-31

Abstract

【課題】通信ネットワークを通じて事業者とユーザとの新たな接点を創出し、事業者のサービスに関する最適な情報をユーザに提供する方法を創成する。
【解決手段】ユーザの通信端末に仮想オペレータを表示し、ユーザと仮想オペレータの対話を通じて、ユーザの要求に対応する複数の回答の中から最適な回答を選択してユーザに提供することを含む、事業者からユーザへの情報提供方法である。対話は、通信端末を通してユーザが音声情報を入力し、音声情報を音声認識サーバにネットワークを経由して送信し、音声認識サーバが音声情報を認識し、認識された音声情報の意図を対話サーバが理解し、対話サーバによって理解された意図に対応する回答メッセージをデータベースから選択し、回答メッセージを音声合成サーバによって出力し、出力された回答メッセージを、通信端末に表示される仮想オペレータの音声として出力することで実行される。
【選択図】図３

Description

本発明は、事業者から顧客あるいはユーザへの情報提供方法、および当該情報提供方法を実現するためのプログラムとシステムに関する。

コンピュータや携帯電話などの通信端末の大幅な普及と、通信ネットワークの飛躍的な発展に伴い、各種サービスを提供する事業者と顧客あるいはユーザ（以下、本明細書、特許請求の範囲において、ユーザとユーザを総じてユーザと記す）との間のビジネス形態も大きく変化している。例えば金融商品をサービスとして提供する銀行や証券会社では、従来ユーザは店舗に足を運ぶ、あるいは電話などによって事業者と直接口頭で通話することにより、事業者が提供するサービスを購入したり、サービスに係る種々の問題を解決していた。現在では、通信ネットワークの発展により、ユーザは通信ネットワークを経由してサービスの提供を受けたり、問題解決に至ることができるようになってきた。典型的な例としてインターネットバンキングが挙げられ、ユーザは通信端末を操作することにより、時間と場所を選ばずに、各種商取引が可能となっている。このような商取引の変化は金融業界のみならず、様々な事業形態でも同様である。

また最近では人工知能を備えた音声認識技術が発展し、ユーザからの要望に対する対応や苦情の処理など、従来事業者あるいはそのオペレータが直接対処してきた業務に対する支援システムも開発されている。例えば特許文献１には、ユーザが通信端末に対して音声情報を入力し、入力された音声情報の解析結果に基づいてユーザの要求や質問、苦情の意図を抽出することで、ユーザに対するより適切かつ迅速な対応を支援するシステムが開示されている。

特開平０５−２１６４９３号公報

本発明の課題の一つは、通信ネットワークを通じて事業者とユーザとの新たな接点を創出し、これを利用することで、事業者のサービスに関する最適な情報をユーザに提供する方法を創成することである。あるいは本発明の課題の一つは、携帯端末を介した自然な通話という手段を通じて、ユーザと事業者との距離感を低減させてより親密なユーザ−事業者関係を構築し、ユーザに新しいユーザ体験を享受する機会を与えることである。あるいは本発明の課題の一つは、ユーザ対応による人的資源の消耗を回避することで事業者の業務負担を軽減するとともに、豊富な情報を、事業者の知識や経験、能力に制限されることなく、ユーザに提供することで、ユーザに対して高品質で高付加価値を有するサービスを適時に提供する方法を創成することである。あるいは本発明の課題の一つは、上記方法を実現するためのプログラム、およびシステムを提供することである。

本発明の実施形態の一つは、情報提供システムである。該情報提供システムは、通信端末から送信されたユーザの音声情報を認識する音声認識部と、音声情報に対する回答メッセージを、複数のメッセージが格納されたデータベースから選択する対話部と、選択された回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして通信端末に送信する送信部を有し、対話部は、回答メッセージを一つに絞り切れない場合、ユーザに質問するための問合せメッセージをデータベースから選択し、選択された問合せメッセージを通信端末に送信する。

上記情報提供システムはさらに通信端末を含むことができる。通信端末は、仮想オペレータを表示するように構成することができる。また上記情報提供システムはさらに、回答メッセージ、問合せメッセージを通信端末で再生する際、回答メッセージ、問合せメッセージを再生しない時と比較し、仮想オペレータの一部が大きな動作を行うように構成することができる。

上記情報提供システムはさらに、ユーザの標準生体情報が格納される第１のサーバを有し、通信端末はユーザの生体情報を取り込む画像取込装置を有し、生体情報と標準生体情報に基づいてユーザが承認された場合に、ユーザに音声情報の入力を許容するように構成することができる。

上記情報提供システムはさらに、ユーザと事業者との通話のための第２のサーバをさらに有することができる。

上記情報提供システムはさらに、音声認識部によって認識された音声情報、選択された回答メッセージ、および問合せメッセージを第２のサーバが格納するように構成することができる。

上記情報提供システムはさらに地図情報が格納される第３のサーバを有し、事業者の複数の店舗に関する情報を格納するように第１のサーバを構成し、表示部に通信端末の位置と複数の店舗の情報を表示するように通信端末を構成することができる。

音声情報に基づいて複数の店舗から少なくとも一つの店舗を選択するように対話部を構成し、選択された店舗への道順を通信端末へ送信するように第３のサーバを構成することができる。

本発明の実施形態の一つは、ユーザによって音声入力された質問に対応する回答メッセージを複数のメッセージから絞り込み、回答メッセージを一つに絞り切れない場合には、ユーザに質問するための問合せメッセージを複数のメッセージから選択するように構成されるサーバである。

サーバは、ユーザが入力した音声情報を認識する音声認識サーバから質問が伝達されるように構成することができる。

サーバは、回答メッセージと問合せメッセージが音声合成サーバへ伝達されるように構成することができる。

サーバは、ユーザの生体情報を格納するように構成される第１のサーバと接続されてもよい。

第１のサーバは、事業者の店舗情報を格納するように構成することができる。

第１のサーバは、ユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを格納するように構成される第２のサーバと接続することができる。

本発明の実施形態の一つは、通信端末から送信される、ユーザの質問を含む音声情報を認識し、認識されたユーザの質問に対応する回答メッセージを複数の回答メッセージから選択し、選択された回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして通信端末に送信し、回答メッセージが一つに絞り切れない場合、ユーザに質問するための問合せメッセージを複数の回答メッセージから選択し、選択された問合せメッセージを通信端末に送信することを実行させるプログラムである。

上記プログラムは、通信端末が取り込むユーザの生体情報を受信し、生体情報を用いてユーザの認証を行うことを実行させるように構成することができる。

上記プログラムは、ユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを格納することをさらに実行させるように構成することができる。

上記プログラムは、格納されたユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを参照し、通信端末と事業者の電話端末とを接続することをさらに実行させるように構成することができる。

上記プログラムは、格納されたユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを参照し、通信端末に事業者の店舗情報を表示することをさらに実行させるように構成することができる。

上記プログラムは、通信端末から質問を文字情報として受信し、回答メッセージを通信端末に文字情報として送信することをさらに実行させるように構成することができる。

上記プログラムは、音声情報内に含まれる質問が検出できないとき、通信端末から質問を文字情報として受信し、回答メッセージを通信端末に文字情報として送信することをさらに実行させるように構成することができる。

上記プログラムは、通信端末から通信端末周囲の音量データを受信し、音量データに応じて通信端末から質問を文字情報として受信することを実行させるように構成することができる。

本発明の実施形態の一つは、音声認識サーバ、対話サーバ、音声合成サーバが含まれるシステムに音声情報を送信し、音声情報に含まれるユーザの質問に対する回答メッセージ、質問に対する問合せメッセージの少なくとも一つを受信し、回答メッセージと問合せメッセージを、少なくとも音声情報および文字情報のいずれか一つとして出力することを通信端末に実行させるプログラムである。

上記プログラムは、通信端末に記憶されるように構成することができる。

上記プログラムは、通信ネットワークから取得されるように構成することができる。

上記プログラムは、仮想オペレータを表示するように構成することができる。また上記プログラムは、前記回答メッセージ、前記問合せメッセージを前記通信端末で再生する際、前記回答メッセージ、前記問合せメッセージを再生しない時と比較し、前記仮想オペレータの一部が大きな動作を行うように構成することができる。

上記プログラムは、ユーザの生体情報を取得するように構成することができる。

上記プログラムは、通信端末と事業者の電話端末とを接続するように構成することができる。

上記プログラムは、通信端末の位置情報を取得し、通信端末に地図を表示し、事業者の店舗情報を通信端末に表示するように構成することができる。

上記プログラムは、通信端末の位置から事業者の店舗までの経路を表示するように構成することができる。

上記プログラムは、質問を文字情報として送信することをさらに実行させるように構成することができる。

上記プログラムは、通信端末周囲の音量を測定し、音量のデータを音声認識サーバ、対話サーバ、音声合成サーバのうち少なくとも一つに送信することを実行させるように構成することができる。

上記プログラムは、音量に応じて、質問を文字情報として送信することをさらに実行させるように構成することができる。

本発明の実施形態の一つは、通信端末にユーザが入力した音声情報を送信し、送信された音声情報を認識し、認識された音声情報に含まれるユーザの質問に対応する回答メッセージを複数の回答メッセージから選択し、選択された回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして通信端末に送信し、回答メッセージが一つに絞り切れない場合、ユーザに質問するための問合せメッセージを複数の回答メッセージから選択し、選択された問合せメッセージを通信端末に送信する情報提供方法である。

上記情報提供方法は、通信端末に仮想オペレータを表示させることをさらに含むことができる。また、前記回答メッセージ、前記問合せメッセージを前記通信端末で再生する際、前記回答メッセージ、前記問合せメッセージを再生しない時と比較し、前記仮想オペレータの一部を大きく動かすことを含むことができる。

上記情報提供方法は、通信端末が取り込むユーザの生体情報を送信し、送信された生体情報を用いてユーザの認証を行うことをさらに含むことができる。

上記情報提供方法は、ユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを格納することをさらに含むことができる。

上記情報提供方法は、格納されたユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを参照し、通信端末と事業者の電話端末とを接続することをさらに含むことができる。

上記情報提供方法は、格納されたユーザの質問、選択された回答メッセージ、選択された問合せメッセージの少なくとも一つを参照し、通信端末に事業者の店舗情報を表示することを含むことができる。

上記情報提供方法は、質問を文字情報（テキスト）として通信端末に入力し、質問を送信し、回答メッセージを通信端末に文字情報として送信し、回答メッセージを前記通信端末に表示することを含むことができる。

上記情報提供方法は、通信端末を用いて周囲の音量を測定することを含むことができる。また音量に応じて、質問を文字情報として通信端末に入力し、質問を送信し、回答メッセージを通信端末に文字情報として送信し、回答メッセージを通信端末に表示することを含むことができる。

ユーザと仮想オペレータの対話を行うことで、親密なユーザ―事業者関係を構築することができる。また、ユーザと仮想オペレータの対話を通じて、ユーザが要望する情報を、事業者が提供しえる数多くの情報の中から見つけ出すことが可能となる。すなわち、事業者が提供する多くの情報の中から「選択する」という煩雑な作業をユーザに強制することなく、対話を通じ、必要とする情報へユーザを「案内、誘導する」ことができ、新しいユーザ体験を提供することができる。また、ユーザ対応における人的資源の消耗を回避することで事業者の業務の効率化と生産性の向上を達成し、均一かつ豊富な情報を、事業者やそのオペレータの知識や経験、能力に制限されることなく、ユーザに提供することで、高品質で高付加価値を有するサービスを適時に提供することができる。さらにユーザは、事業者が管理する資源量とその変動を容易に把握することができる。

本発明の実施形態の情報提供方法に適用される通信端末の構成図。本発明の実施形態の情報提供方法を説明するフローチャート。本発明の実施形態の情報提供方法において表示される画像の一例。本発明の実施形態の情報提供方法を説明するフローチャート。本発明の実施形態の情報提供方法を説明するフローチャート。本発明の実施形態の情報提供方法において表示される画像の一例。本発明の実施形態の情報提供方法において表示される画像の一例。本発明の実施形態の情報提供方法を説明するフローチャート。本発明の実施形態の情報提供システムの構成例。本発明の実施形態の情報提供方法において表示される画像の一例。本発明の実施形態の情報提供方法において表示される画像の一例。本発明の実施形態の情報提供方法において表示される画像の一例。本発明の実施形態の情報提供方法において表示される画像の一例。本発明の実施形態の情報提供方法を説明するフローチャート。本発明の実施形態の情報提供方法を説明するフローチャート。本発明の実施形態の情報提供方法を説明するフローチャート。

以下、本発明の一実施形態における情報提供方法、ならびにそれを実現するためのプログラムとシステムについて、図面を参照しながら詳細に説明する。以下に示す実施形態は本発明の実施形態の一例であって、本発明はこれらの実施形態に限定されるものではない。

＜第１実施形態＞
本発明の第１実施形態における情報提供方法について、図面を参照しながら説明する。本実施形態では、ユーザが通信端末を用いて通信端末上に表示される、事業者のオペレータを模した画像（本明細書および請求項において、仮想オペレータと記す）との自然な対話を行い、これによって事業者がユーザに適した回答や情報を提供するための情報提供方法、ならびにそれを実行するためのプログラムについて説明する。

［１．準備］
図１に本実施形態の情報提供方法で使用可能な通信端末１００のシステム図、図２に本実施形態の情報提供方法のフローチャートを示す。最初にユーザは、事業者が提供するプログラムを含むアプリケーションがインストールされた通信端末１００を用意する。アプリケーションは媒体に格納された状態で提供されてもよく、通信ネットワークを介して配布され、ユーザが取得できる状態であってもよい。

通信端末１００はユーザが操作可能な端末であり、据え付け型（デスクトップ型）コンピュータ、ノート型コンピュータ、あるいは携帯電話やタブレット、スマートフォンなどの携帯通信端末などが挙げられる。通信端末１００の構成例を図２に示す。図２に示すように、通信端末１００にはＣＰＵ（中央演算ユニット）１０２、メモリ１０４、表示部１０６、入力部１０８、音声入力部１１０、音声出力部１１２、通信部１１４、画像取込装置１１６などが含まれる。

ＣＰＵ１０２は通信端末１００に格納された種々のプログラムを解釈、実行する機能を有する。メモリ１０４はプログラムやデータなどの情報を格納する機能を有し、フラッシュメモリなどの不揮発性メモリ素子を含有する。表示部１０６は液晶表示装置やＥＬ有機装置などを有しており、ユーザのインターフェースとして機能する。入力部１０８は、ユーザが物理的接触を通じて情報を通信端末に入力するインターフェースとしての機能を有し、典型的にはタッチパネルやキーボード、入力ボタンなどが挙げられる。音声入力部１１０は音声を取り込み、入力された音声情報を通信部１１４へ伝達する機能を有する。音声出力部１１２はサーバから送信される音声情報や、電話回線などの通信ネットワークを通じて他の通信端末から送信される音声情報を再生する機能を有する。通信部１１４は通信ネットワークを通してサーバや他の通信端末との間で音声情報や文字情報などを送受信する機能を有する。

ここで本明細書、特許請求の範囲におけるサーバとは、事業者自身が維持、管理して利用するサーバでもよく、事業者とは異なる情報処理サービス提供者などが維持、管理、提供するサーバであってもよい。以下に示すように、本実施形態の情報提供方法を実現するためのシステムの多くは情報処理サービス提供者が管理、提供するサーバを利用することができる。事業者が公開できない情報、例えばユーザの個人情報に係る情報などは、事業者自らが維持、管理するサーバ内に格納して使用することが好ましい。

［２．起動］
図２を参照すると、ユーザがアプリケーションを起動すると（ステップ２００）、プログラムは通信端末の表示部１０６に仮想オペレータを表示する（ステップ２０２）。図３は仮想オペレータの一例であり、通信端末１００の表示部１０６に表示した状態を例示したものである。仮想オペレータはユーザ対応を行う従業員（以下、オペレータと記す）などを模したものでよい。また、仮想オペレータが人間の自然な動作（例えば表情の変化、頭や手の動きなど）を行うように設定し、ユーザに親近感を抱かせるようにプログラムを構成してもよい。

上述したように、図３ではオペレータを模した仮想オペレータを示しているが、仮想オペレータの形態に制約はない。仮想オペレータの性別や容貌、服装、あるいは仮想オペレータの背景などをユーザが任意に選択、設定できるようにプログラムを構成してもよい（ステップ２０４）。これにより、ユーザが単に個人的嗜好に基づいて仮想オペレータを選択できるのみならず、ユーザ専任の仮想オペレータを固定することもできる。このような機能を付与することで、ユーザに所謂「お得意様」意識を抱かせることができ、より親密なユーザ―事業者関係の構築に寄与することができる。

ここでプログラムは、必要に応じてユーザに対する認証プロセスを実行するように構成されていてもよい。例えばユーザの要求や問い合わせ、質問（以下、本明細書、特許請求の範囲において、総じて質問と記す）に係る内容が高いレベルの機密性を要する場合には、認証プロセス（ステップ２０６）を実行することが好ましい。

認証プロセス（ステップ２０６）は、例えば通信端末１００に備えられた画像取込装置１１６を用いてユーザの顔の画像、指紋や静脈のパターンなどの生体情報を取り込み、あらかじめサーバに格納されたユーザの標準データ（標準生体情報）と比較し、その結果に基づいて行うことができる。あるいはユーザにパスワードの入力を要請し、サーバに格納されたユーザのパスワードとの比較を行うことで認証プロセスを行ってもよい。あるいはユーザに音声入力を要請し、入力された音声（声紋）を利用してユーザ認証を行ってもよい。認証プロセスにおいて、通信端末１００がユーザ以外の者によって操作されていると判断された場合、事業者に自動的に通知するようプログラムを構成してもよい。

ユーザ認証が正常に終了し、通信端末がユーザ自身によって操作されていると判断された場合には、アプリケーションにおいて事業者が提供するサービス内容をユーザごとに変更してもよい。あるいは、そのユーザに対して通知するべき回答メッセージを音声として出力する、あるいは文字として表示部１０６に表示してもよい（ステップ２０８）。

［３．基本動作］

本実施形態に係る情報提供方法、およびそのプログラムでは、図３に例示されたように、仮想オペレータ以外に、例えばアイコン３００を表示するように構成される。このアイコン３００は音声入力部１１０をアクティブにするアイコンであり、ユーザはこのアイコン３００を操作することで音声入力を開始することができる。また、事業者の店舗情報を表示するモードに移行するためのアイコン３０２を表示するようにプログラムが構成されていてもよい。後述するように、このアイコン３０２を用いることで、例えば事業者の各店舗が提供するサービス内容、店舗の混雑状況や位置、店舗までの道順などを表示するようにプログラムを構成してもよい。

ユーザはまずアイコン３００を操作して音声入力部１１０をアクティブにする。この後ユーザは、事業者に対する質問を口頭で述べる（ステップ２１０）。プログラムの命令に従い、音声入力部１１０はユーザの質問を音声情報として通信部１１４へ伝達し、通信部１１４は通信ネットワークを経由し、音声認識サーバのインターフェースとなるＡＰＩ（アプリケーションプログラミングインターフェース）へ音声情報を送信する（ステップ２１２）。送信された音声情報は、音声認識サーバにおいて解析され、文字データ（テキストデータ）へ変換される（ステップ２１４）。

質問の入力は音声による入力に限られず、通信端末１００の入力部１０８を用いて文字情報を入力することで行っても構わない。例えば発声が禁じられている場合や、喧噪な環境下でアプリケーションを使用したい場合には文字入力（テキスト入力）が有効である。このような場合、後述するような文字入力、出力のみによる操作モード（ウェブチャットモード）へ移行することも可能である。

テキストデータへ変換された音声情報は対話サーバで解析され、ユーザの質問の意図が理解、把握される（ステップ２１６）。必要に応じて対話サーバは、当該意図が正しく理解されているかを確認するためのメッセージ（確認メッセージ）を、種々のメッセージが蓄積されたサーバあるいはサーバ内のデータベースから選択する（ステップ２１８）。その後、音声合成サーバへ確認メッセージの文字情報が伝達され、音声合成サーバは当該文字情報を音声情報へ変換し、音声合成サーバのＡＰＩを通してユーザの通信端末１００へ音声情報を送信する（ステップ２１８）。その後プログラムの命令に従い、通信端末１００が受信した音声情報を音声出力部１１２が音声として再生する（ステップ２２０）。確認メッセージは文字情報として表示部１０６上に表示してもよく、それと同時に音声として再生してもよい。音声合成サーバによって音声情報が生成されるため、実際の人間が発するような声を実現することができる。

ユーザは、対話サーバが意図を正しく理解していると認識すれば、アイコン３００に触れて音声入力部１１０をアクティブにし、その旨を音声情報として音声入力部１１０に入力する、あるいは入力部１０８を用いてテキスト入力することができる（ステップ２２２）。一方、対話サーバが意図を正しく理解していないと認識した場合、アイコン３００に触れて音声入力部１１０をアクティブにし、質問を再度音声入力部１１０に入力する、あるいは入力部１０８を操作してテキスト形式で質問を再度入力すればよい（ステップ２２２）。

ユーザの質問の意図を理解した後、対話サーバは絞り込みエンジン（検索エンジン）などを用いて回答メッセージの絞り込みを行う（ステップ２２４）。そして対話サーバ内のデータベースに蓄積された種々の回答メッセージから適合する回答メッセージを選択する（ステップ２２６）。選択された回答メッセージの文字情報は音声合成サーバで音声情報に変換され、音声合成サーバのＡＰＩを通してユーザの通信端末１００へ送信される（ステップ２２６）。この時、音声情報とともに文字情報として回答メッセージを通信端末１００へ送信してもよい。プログラムの命令に従い、通信端末１００が受信した音声情報を音声出力部１１２が再生する（ステップ２２８）。また同時に、回答メッセージを表示部１０６上にテキストとして表示してもよい。

データベースには事業者が作成した定型のメッセージを回答メッセージとして蓄積してもよく、対話サーバは蓄積されたメッセージから回答メッセージを選択することができる。ただし本実施形態の情報提供方法はこれに限られず、回答メッセージを選択するだけでなく、人工知能としての機能を対話サーバに搭載し、ユーザとの対話を通じた学習によって新たな回答メッセージを作成し、これを音声合成サーバで音声情報に変換した後に通信端末１００へ送信してもよい。すなわち、ユーザとの対話から新たに結論を獲得する機能、およびユーザとの対話履歴から学習する機能を対話サーバに付与し、これらの機能を利用して回答メッセージを作成するようにしてもよい。

例えば、ユーザと仮想オペレータの対話を通じ、ユーザが満足する最終的な回答メッセージが得られた場合、この時の一連の対話を一つのコンポーネントとして格納する。このコンポーネントに含まれるユーザの音声情報を形態素解析し、最終的な回答メッセージが誘導されるに至ったキーワードを抽出する。同時にキーワードに対して重みづけを行うとともにキーワード同士の関連性（文法的関連性や位置的関連性）をパラメータ化し、これらの情報を最終的に選択された回答メッセージに割り付ける。このようなプロセスを蓄積することにより、それぞれの回答メッセージを最終的に必要とするユーザが与えるであろうキーワードとその関連性を学習する。したがって、新たな対話が開始されたとき、ユーザの音声情報から抽出されるキーワードとその関連性を解析し、その解析結果に基づいて過去に選択された回答メッセージから最も適合するものを選択することができる。その結果、同様の、あるいは類似する質問に対して、常に同じ最適な回答を選択することができる。また、必要に応じて複数の回答メッセージを音声合成サーバで融合して新たなメッセージを生成し、ユーザに提供することも可能となる。

ユーザは、再生された音声情報あるいは表示された文字情報によって質問に対する満足な回答が得られたと判断した場合にはアプリケーションを終了することができる（ステップ２３０）。一方、ユーザが十分な回答が得られなかったと判断した場合には、再度ユーザは音声入力、あるいはテキスト入力を行って同じ質問、あるいは類似する質問を入力し、回答を求めることができる（ステップ２３２）。この後のプロセスは上述したプロセスと同じである。

ステップ２２４において、ユーザの質問に対する回答メッセージが絞り込めない場合、あるいは数多くの回答メッセージを選択せざるを得ない場合、ユーザに対する質問（問合せメッセージ）を生成あるいは選択して通信端末１００に送信し、ユーザに対してさらなる情報提供を要請してもよい（ステップ２３４）。問合せメッセージは音声として、あるいはテキストとして、あるいはその両方として通信端末１００で再生、表示される。ユーザは問合せメッセージに対して音声、あるいは文字で回答することができる（ステップ２２２）。問合せメッセージの送信とその回答というステップを繰り返すことにより、ユーザと仮想オペレータの対話を通じて、ユーザが要望する回答や情報を事業者が提供しえる数多くの情報の中から見つけ出すことが可能となる。したがって、本発明の本実施形態に係る情報提供方法により、事業者が提供する多くの情報の中から「選択する」という煩雑な作業をユーザに強要することなく、対話を通じ、必要とする回答や情報へユーザをリアルタイムに「案内、誘導する」ことができ、新しいユーザ体験を提供することができる。

なお図２には示していないが、対話サーバのデータベースにはユーザと雑談を行うためのメッセージが格納されていてもよく、ユーザは仮想オペレータと雑談を行うようにプログラムが構成されていてもよい。これにより、ユーザの緊張感を解きほぐすことができ、より親密なユーザ―事業者関係を構築することができる。さらに、通信ネットワーク上でのリアルタイムコミュニケーション（チャット）が可能なサイトに移行するためのアイコンを表示するようにプログラムが構成されていてもよい。これにより、例えば事業者から提供された有益な情報を第三者と速やかに共有することも可能となり、ユーザに対するサービス向上が図れるのみならず、事業者も効果的な宣伝効果を獲得することができる。

また、上述した種々のメッセージを音声出力部１１２で再生する際、仮想オペレータが実際に喋っているように見せるため、仮想オペレータの口や目を動かすようにしてもよい。あるいは手を動かすなど、説明を行うジェスチャーをするようにしてもよい。すなわち、メッセージが再生されていない時と比較し、仮想オペレータの一部がより大きな動作を行うようにプログラムを構成してもよい。

上述したように本実施形態では、仮想オペレータとユーザとの対話を通し、ユーザは様々な質問を事業者に伝えることができる。このため、使用環境が許容する限り、ユーザはキーボードやタッチパネルを用いる文字入力操作から解放され、より簡便に種々の質問を事業者に伝達することが可能となる。また、音声合成技術を活用して仮想オペレータと対話するため、ユーザは無機質な対話を強制されることなく、自然な対話を行うことができる。一方ユーザは、事業者あるいはそのオペレータとの対話ではなく、あくまで仮想オペレータとの対話によって回答を得るため、ユーザは必要以上に気を遣うことなく様々な質問を投げかけることができ、新しいユーザ体験を享受することができる。

また上述したステップでは、事業者のオペレータはユーザとの対話に直接関与しない。したがってユーザは、オペレータの知識や経験、能力に左右されることなく、均一かつ豊富な情報をリアルタイムで獲得することができる。また事業者はこの段階では人的資源が不要であるため、ユーザ対応における人的資源の消耗を避けることができ、業務の効率化と生産性の向上を実現することができる。

［４．通話モードへの移行］
多くのユーザが頻繁に行う質問（ＦＡＱ）に対しては、あらかじめ回答メッセージを周到に準備することができ、高いユーザ満足度を得ることが可能である。しかしながらユーザの質問の意図に対し、対話サーバ内のデータベースに蓄積されたメッセージデータだけでは対応できない場合がある。例えばＦＡＱ以外の質問や、複雑な相談内容、あるいは機密性の高い情報が質問に含まれる場合、上述した方法では対応できない場合がある。そのような場合、電話回線を利用して直接口頭で事業者あるいはそのオペレータと通話するモードに切り替えることができる。

例えば図４に示すように、サーバからの回答メッセージを音声情報として再生した後（ステップ２２４、２２６）、通話モードへ切り替えるためのアイコン（電話アイコン、図３では図示せず）を通信端末１００の表示部１０６に表示するようにプログラムを構成してもよい（ステップ４０４）。プログラムの命令に従い、ユーザが電話アイコンを操作することで、通信端末１００はＡＰＩを介して通信サービス連携サーバに接続される。通信サービス連携サーバは通信ネットワークにユーザからの電話を接続させ、事業者、あるいはそのオペレータとの電話回線による通話を可能にする（ステップ４０６）。

通話モードへ切り替えるための電話アイコンは、アプリケーション起動の段階から表示部１０６に表示するようにしてもよい。しかし事業者の人的資源によっては、ユーザによる通話モードへの移行をある程度制約する必要がある。この場合には、電話アイコンはアプリケーションの起動時には表示せず、対話サーバが回答メッセージを選択、送信し（ステップ２２４）、通信端末１００が少なくとも一度回答を再生、表示（ステップ２２６）した後に電話アイコンを表示するよう、プログラムを構成してもよい。これにより、オペレータの負担が低減され、業務の効率化が図れる。

あるいは、ユーザが通話モードへの切り替えを自ら行わなくても、対話サーバ内の回答メッセージではユーザの質問に対応できないと対話サーバが判断した後に電話アイコンを表示するよう、プログラムを構成してもよい。この場合、対話サーバはユーザに通話モードに切り替える旨を通知する（ステップ４００）と同時に通信サービス連携サーバにアクセスし、ユーザと事業者、あるいはそのオペレータとの電話回線を接続してもよい（ステップ４０２）。

あるいは、ユーザの質問の解析の結果、ユーザと事業者との対話が必須であると対話サーバが判断した後に電話アイコンを表示部１０６に表示し、ユーザに通話モードへの移行を促してもよい。

通話モードへ移行する際、ユーザとサーバ間との対話内容や履歴（ログ）を格納し、その情報を担当するオペレータに表示してもよい（ステップ４０６）。これにより、オペレータはより効率よくユーザの質問に対する回答を検討することができる。また、ユーザもすでに行った会話を再度繰り返す必要性が低くなる。このため、事業者はより高品質で手厚いサービスを迅速にユーザに提供することができる。

通信サービス連携サーバが通信ネットワークにユーザからの電話を接続させる際、対話内容を解析し（ステップ４０８）、その結果に基づいて最も適切なオペレータを選択し（ステップ４１０）、ユーザと選択されたオペレータと間の電話通信を確立してもよい（ステップ４１２）。これにより、ユーザは質問に対して最も適切なオペレータと通話することが可能となる。

［５．地図モードへの移行］
上述したように、ユーザの通信端末１００の表示部１０６上に、事業者の店舗にアクセスするためのアイコン３０２を表示するようにプログラムを構成してもよい（図３参照）。ユーザがこのアイコン３０２を操作することにより、地図モードへの移行が可能となる。具体的なフローを図５に示す。なお図５に示す各ステップは一例であり、例えばこれらのステップの順番を適宜入れ替えてもよい。

ユーザによる操作（ステップ５００）によって地図モードが起動されると（ステップ５０２）、プログラムの命令に従い、通信端末１００は内蔵されたＧＰＳ（全地球測位システム）機能を利用して位置座標を取り込む。あるいは、ユーザ自身が住所や付近のランドマーク情報を、音声情報として音声入力部１１０に入力することで、あるいは文字情報として入力部１０８を用いて入力することで、通信端末１００の位置座標を取り込むようにプログラムが構成されていてもよい。これより、通信端末の位置が特定される（ステップ５０４）。通信端末１００がＧＰＳ機能を搭載していない場合、あるいはＧＰＳ機能が利用できないような環境下では、通信端末１００は付近の通信サービス事業者の基地局と通信を行って通信端末１００が位置するエリアの特定が行われるよう、プログラムが構成されていてもよい。この場合、位置情報特定サーバやＣＴＩ（ＣｏｍｐｕｔｅｒＴｅｌｅｐｈｏｎｙＩｎｔｅｇｒａｔｉｏｎ）サーバなどを利用して通信端末１００の位置の特定が行われる。位置特定サーバやＣＴＩサーバは、情報処理サービス提供者や通信サービス事業者が管理、提供するサーバ内に構築されてもよい。

通信端末１００の位置が特定された後、プログラムの命令に従って通信端末１００は、地図情報を提供する事業者などが運営する情報配信サーバにアクセスして地図データを取得し、表示部１０６上に表示する（ステップ５０６）。プログラムはさらに、サーバ内に格納された店舗の位置情報や、店舗が提供するサービス内容を通信端末１００に取得させ（ステップ５０８）、この情報に基づき、表示部１０６上に店舗を表示させる（ステップ５１０）。例えば図６に示すように、通信端末１００付近の地図を表示部１０６上に表示し、かつ店舗を表すアイコン６０２、６０４を表示する。

店舗の位置や、店舗が提供する具体的なサービス内容、機能、営業時間などのステーショナリーな情報だけでなく、混雑状況や資源量（商品の在庫やユーザに割り当て可能な人的資源量など）といった時間とともに逐次変動するパラメータなどを事業者がサーバ内のデータベースに逐次格納し、これらの情報やパラメータを通信端末１００が取得して表示部１０６上に表示するよう、プログラムを構成してもよい（ステップ５０８、５１０）。この場合、店舗のアイコンを操作することで、各店舗に関する上記情報やパラメータを表示するようにしてもよい。これによりユーザは、事業者が管理する資源量とその変動を容易に把握することができる。

さらに本実施形態の情報提供方法では、ユーザの現時点の位置からユーザがアクセスを希望する店舗までの道順を表示してもよい。例えば通信端末１００が、ユーザの位置座標と目的とする店舗の位置情報を情報配信サーバへ送信し、適切な経路の探索を要求し（ステップ５１２）、情報配信サーバ内で探索された経路を受信し、その経路を表示部１０６上に表示する（ステップ５１４）ようにしてもよい。経路の表示は、例えば図７に示したように、ユーザの現在地と目的とする店舗までの経路をアイコンを用いて行うことができる。ここでは複数の円形のアイコンを用いて経路を示している。また、目的地までの距離や所要時間などを表示するようにしてもよい。

ここではユーザがアイコン３０２を操作することで（ステップ５００）地図モードへ切り替わる例を述べたが、地図モードへの切り替えはユーザと仮想オペレータの対話に基づいて行ってもよい。例えば、ユーザと仮想オペレータ間の対話を解析し、ユーザの質問に対する最終的な回答が店舗への案内を含むと対話サーバが判断した場合（ステップ５１６）、対話サーバはユーザの質問に対応できる適切な店舗を選択し、その店舗への案内を通知するとともに（ステップ５１８）地図モードを起動し（ステップ５０２）、表示部１０６上にユーザの現在地と該当する店舗の位置情報、ならびに店舗への経路などを表示してもよい。

上述したように本実施形態の情報提供方法では、ユーザと仮想オペレータの対話を通じ、ユーザの求めるサービスに適合した店舗を絞り込むことができ、ユーザに対して質の高いサービスを提供することができる。つまり、ユーザの質問に対して複数の回答を提供してユーザに選択させるのではなく、ユーザと仮想オペレータの対話を通じ、ユーザに適した回答へユーザを導くことができる。

［６．ウェブチャットモードへの移行］
ユーザの周囲の環境や通信端末の使用状況、あるいはユーザ自身の希望により、音声入力や音声出力を行わず、テキスト入力、出力のみで対話を行い、これを通じてユーザの求める情報を提供するモード（以下、ウェブチャットモードと記す）へ移行できるようにしてもよい。例えばユーザ自身が発声を禁止されている場合、通信端末からの音声発信が禁じられている場合、喧噪な環境に起因してユーザの音声と周囲の雑音が区別できない場合、ユーザが通信端末の音声出力部１１２を他の用途（音楽や映像の視聴など）に用いている場合などには、自動的に、あるいはユーザが自主的にウェブチャットモードへ移行できるようにプログラムを構成してもよい。ウェブチャットモードでは、ユーザが入力した質問、および回答メッセージの両者が時間順に表示部１０６に表示される。この時のフローの一例を図８に示す。

例えば通信端末１００の起動後（ステップ２００）、仮想オペレータが表示された画面（図３参照）上にウェブチャットモードへ移行するためのアイコンを表示し（ステップ７００）、ユーザが任意に操作できるようにプログラムを構成してもよい。このアイコンをユーザが操作することで（ステップ７０２）仮想オペレータが表示されていた画面が切り替わり、対話形式のテキストが表示される画面（ウェブチャット画面）に移行するようにすればよい（ステップ７０４）。この後、ユーザはテキスト入力することで（ステップ７０６）で対話を開始することができる。

この場合、音声合成サーバから音声情報を送らない、あるいは音声情報を受信した通信端末１００は音声情報を再生せず、表示部１０６に音声情報のテキストのみを表示すればよい。あるいは対話サーバで選択、あるいは生成された回答メッセージを文字情報のまま通信端末１００へ送信してもよい。

あるいはアプリケーションの起動後（ステップ２００）、音声出力部１１２の使用状況を確認するようプログラムが命令し(ステップ７１０)、音声出力部１１２が他の用途で使用されていると判断された場合、ウェブチャットモードへの移行の可否を表示部１０６に表示し（ステップ７１２）、ユーザによるモード移行を選択させてもよい。

あるいは何らかの物理量、例えば通信端末１００の周囲の環境パラメータの変化に応じてウェブチャットモードへ切り替えるようにプログラムを構成してもよい。例えば通信端末１００周辺の音量を測定し、その音量データを対話サーバなどに送信し（ステップ７２０）、ある一定レベル以上であればウェブチャットモードへ移行する旨を表示部１０６に表示し（ステップ７２２）、ウェブチャットモードへ自動的に移行する（ステップ７０４）ようにしてもよい。周囲の音量測定は、例えばアプリケーションを起動した後、ユーザが声入力部１１０をアクティブにする前に行うことができる。ウェブチャットモードへ移行する閾値としては、例えば９０デシベル以上、あるいは１１０デシベル以上とすればよい。また、ウェブチャットモードへの移行の判断は、通信端末１００側で行ってもよく、対話サーバ側で行ってもよい。

図示しないが、通信端末１００の周囲の雑音とユーザが入力した音声情報が区別できない場合、ウェブチャットモードへ移行するようにプログラムを構成してもよい。例えば音声認識サーバが音声情報の解析を行う際に音声区間検出を行ってもユーザの音声情報が含まれる区間を検出できない場合、あるいは検出区間が一定の時間に満たない場合、あるいは入力された音声情報から雑音を十分に除去できずユーザの音声（質問）を検出、解析できない場合、ウェブチャットモードへの移行を案内すると同時に、ウェブチャットモードへ移行するためのアイコンを表示部１０６に表示してもよい。あるいは雑音の少ない環境への移動をユーザに要請する回答メッセージを通信端末１００に送信し、併せてアイコンを表示してもよい。

また、対話内容に基づいてウェブチャットモードへ移行するようにプログラムを構成してもよい。たとえばユーザの音声情報に機密性の高い個人情報が含まれていると対話サーバが判断した場合、あるいは対話サーバが選択、生成する回答メッセージ内にそのような個人情報を含ませる必要がある場合、ウェブチャットモードへの移行を案内するようにしてもよい。
［７．他のモードへの移行］
モードの移行は、上述した通話モードや地図モード、ウェブチャットモードへの移行に限られない。例えばユーザと仮想オペレータ間の対話の解析に基づき、あるいはユーザの判断に基づき、事業者が通信ネットワークを経由して提供する種々のサービス（以下、ネットワークサービスと記す）へアクセスするように、プログラムが構成されていてもよい。ユーザ自らの判断でネットワークサービスへのアクセスを許容する場合、例えば図３で示した表示上に適当なアイコンを表示させ、これをユーザが操作することでネットワークサービスへ能動的にアクセスできるようにしてもよい。ネットワークサービスとしては、例えば金融業界の場合、各銀行が提供するインターネットバンキングサービスなどが挙げられる。

逆に、対話サーバが選択した最適の回答が、ユーザによるネットワークサービスの利用である場合、対話サーバからの回答メッセージを通信端末１００へ送信するとともにネットワークサービスへリンクするアイコンを表示部１０６上に表示してもよい。

上述したように、本実施形態の情報提供方法では、ある条件が満たされた場合、あるいは何らかの物理量、例えば通信端末１００の周囲の騒音レベルや雑音の周波数などが変化した場合、あるいはユーザが希望した場合、様々なモードへ移行することができる。モードの移行はユーザが自主的に行うこともでき、自動的に行うことも可能である。あるいは対話を通じてユーザにモードの意向を促すこともできる。このように、起動時に仮想オペレータが表示される最上位レイヤー（アプリケーションレイヤー）から、種々の下位レイヤーへユーザインタフェースが切り替わり、ユーザの質問に適合する情報や回答メッセージを提供することができる。

＜第２実施形態＞
本実施形態では、第１実施形態で述べた情報提供方法を実現するためのシステム構成に関し、図面を参照して説明する。通信端末１００のシステム構成は第１実施形態で述べたため（図１参照）、ここでは割愛する。

なお、本実施形態で述べるシステム構成は一つの例であり、本発明は以下に示す実施形態に限定されるものではない。以下で説明する各種サーバの機能や要素は、他のサーバと重複していてもよく、例えばデータベースなどは複数のサーバによって管理、使用されることもある。また、各サーバを制御するユニット（コントローラなど）は、複数のサーバによって共有され、これら複数のサーバを制御するように構成されてもよい。さらに、一つのサーバは別のサーバの構成要素である場合もあり、この場合、上記一つのサーバは別のサーバの一部分と認識することができる。例えばある機能を有するサーバＡがサーバＢの構成要素の一つである場合、サーバＡは、サーバＢを含むシステムにおける一つの機能部と認識、記述することができる。

［１．音声認識］
ユーザが入力する音声は通信端末１００の音声入力部１１０で取り込まれ、音声情報として通信部１１４へ伝達される（図１参照）。通信部１１４は通信ネットワークを経由し、図９に示す音声認識サーバ８００のインターフェースとなるＡＰＩ８１０へ音声情報を送信する。送信された音声情報は、音声認識サーバ８００内の音声認識エンジン８２０において解析される。

図９に例示したように、音声認識エンジン８２０は例えば特徴量抽出部８３０、デコーダ８４０、テキスト出力部８５０を有している。特徴量抽出部８３０は送信された音声情報を分析し、特徴量パラメータを抽出する。デコーダ８４０は、言語モデル８４２、音響モデル８４４、語彙辞書８４６などのデータベースを参照しながら特徴量パラメータから最も優れた候補を計算し、認識結果として出力する。出力された認識結果はテキスト出力部８５０によってテキストデータへ変換、出力される。

このような音声認識システムを利用することで、ユーザが仮想オペレータに対して口語（話し言葉）で語り掛けた質問がテキストに変換される。

［２．音声合成］
ユーザの通信端末１００で再生される音声は、音声合成サーバ９００のインターフェースとなるＡＰＩ９１０から通信ネットワークを経由して通信端末１００に送信される（図１０参照）。音声合成サーバ９００は音声合成エンジン９２０を有しており、図１０に例示したように、音声合成エンジン９２０は例えばテキスト入力部９３０、言語解析部９４０、波形生成部９５０、送信部９６０を有している。

テキスト入力部９３０では、後述する対話サーバで選択されたメッセージの文字情報が入力される。この文字情報は言語解析部９４０において言語解析され、データベースである言語辞書９４２を参照しながらアクセントの位置や読み情報などが解析される。波形生成部９５０では、実際に収録された音声から得られた波形データを用いて作成された音声合成データベース９４４を参照し、音声の波形を生成する。波形生成部９５０で生成された音声データは送信部９６０によって、ＡＩＰ９１０を介して通信端末１００へ送信される。なお、送信部９６０は音声データだけでなく、入力される文字情報を文字（テキスト）として送信することもできる。

このような音声合成システムを利用することで、仮想オペレータは人が話すのと同様の声でユーザと対話することができ、ユーザに対して親近感を抱かせることで事業者に対する距離感を減少させることができる。

［３．対話］
ユーザから送信された音声メッセージが音声認識サーバ８００によって解析されて文字情報に変換された後、対話サーバ１０００によって適切な回答が生成、選択される（図１１参照）。対話サーバ１０００はＡＰＩ１０１０の他、対話エンジン１０２０、事業者管理サーバ１０４０、管理サーバ１０５０、情報データベース１０６０などを有する（図１１参照）。

対話エンジン１０２０は対話コントローラ１０２２、セレクタ１０２４、応答生成部１０２６などを含有することができる。対話コントローラ１０２２は対話エンジン１０２０を制御するものであり、ユーザの意図を把握したり、セレクタ１０２４に適切なメッセージを選択させる機能を有する。セレクタ１０２４は対話コントローラ１０２２が理解したユーザの意図に対して適切な回答メッセージあるいは問合せメッセージ（１０３２、１０３４、１０３６、１０３８）を絞り込み、選択する機能を有する。セレクタ１０２４は絞り込みエンジンとも呼ばれる。応答生成部１０２６は、選択されたメッセージに基づいてユーザに対する回答を作成する機能を有する。応答生成部１０２６は、複数のメッセージを融合して一つのメッセージを作成してもよい。

情報データベース１０６０は事業者のビジネスに関連する用語や知識などを格納することができ、対話エンジン１０２０によって参照される。事業者管理サーバ１０４０は、例えば店舗の機能や位置情報、提供できるサービスの内容などの情報や、店舗の混雑状況や商品の在庫状況といった時間とともに変動するパラメータを格納できるデータベース１０４２を含むことができる。データベース１０４２に、ユーザの生体情報の標準データなどの個人情報を格納してもよい。応答生成部１０２６は、選択した応答メッセージにデータベース１０４２に格納された個人情報を適宜融合して回答メッセージを生成してもよい。データベース１０４２にユーザ情報を格納する場合、事業者管理サーバは事業者によって管理されることが好ましい。

なお対話サーバは、ユーザと対話サーバ間の対話内容や履歴を格納する通信サービス連携サーバ１１００（後述）と接続されてもよい。あるいは、データベース１０４２内に上述した対話内容や履歴を格納するようシステムを構成してもよい。

メッセージ（１０３２、１０３４、１０３６、１０３８）は、ユーザからの様々な質問に対応する回答メッセージあるいは問合せメッセージであり、文字情報として準備、管理することができる。例えばメッセージ１０３２は、ＦＡＱに対応する定型的な回答メッセージとすることができる。メッセージ１０３４は、例えば回答メッセージを絞り込めないとき、ユーザに対して質問するための問合せメッセージとすることができる。メッセージ１０３６は、ユーザと事業者との雑談に対応するためのメッセージとすることができる。メッセージ１０３２、１０３４、１０３６は、事業者管理サーバ１０４０上で編集することができる。メッセージ１０３８は、音声認識サーバ８００や対話サーバ１０００を管理、維持する事業者によって管理される管理サーバ１０５０によって編集することができ、ユーザの事業者の事業とは直接的関連性の低い対話のために用意される。

問合せメッセージ１０３４を準備することで、多くの回答から選択させるという負担をユーザに課すことなく、ユーザが望む回答へユーザを導くことができる。

雑談に対応するためのメッセージ１０３６を事業者が準備、編集することで、事業者の事業内容と関連性の薄い対話であっても、ユーザは種々の会話を仮想オペレータと行うことがでる。これによって事業者とより親近感のあるコミュニケーションを行うことが可能となる。

［４．通話モード］
ユーザと仮想オペレータの間の対話から通話モードに移行する際には、通信端末１００はインターフェースであるＡＰＩ１１１０を介して、通信サービス連携サーバ１１００と接続される（図１２参照）。通信サービス連携サーバ１１００には、通信ステータス管理データベース１１３０、窓口データベース１１４０などが含まれる。

通信ステータス管理データベース１１３０にはユーザと仮想オペレータの間の対話履歴や対話内容を格納することができ、この内容は事業者管理サーバ１０４０上で事業者またはそのオペレータが閲覧することができる。窓口データベース１１４０は、オペレータに関する情報、たとえばオペレータの所属する部署や業務範囲、知識や経験などの情報を格納することができる。ユーザと仮想オペレータの間の対話ログや対話内容をコントローラ１１２０が解析し、その結果に基づいてコントローラ１１２０は窓口データベース１１４０を参照し、最適なオペレータを選択することができる。なお、通信ステータス管理データベース１１３０や窓口データベース１１４０を通信サービス連携サーバ１１００内に設置せず、これらのサーバに格納される情報を事業者管理サーバ１０４０で管理してもよい。

通話モードへ移行する際には、ＡＰＩ１１１０を介し、電話通信サービスを提供する事業者の通信ネットワーク１１５０へ電話接続の要求を送信し、同時に接続先の電話番号を伝える。これにより、ユーザと事業者あるいはオペレータとの通話が可能となる。

［５．地図モード］
地図モードへ移行する際のシステムは、図１３に示すように、例えば地図情報を提供する事業者などが運営する情報配信サーバ１２００、対話サーバ１０００、事業者管理サーバ１０４０などで構成することができる。

情報配信サーバ１２００には地図情報データベース１２３０が含まれている。ＡＰＩ１２１０を介して通信端末１００は位置情報を情報配信サーバ１２００に送信し、情報配信サーバ１２００から地図情報を受け取ることができる。事業者管理サーバ１０４０は、店舗の機能や位置情報、提供できるサービスの内容などの情報や、混雑状況や商品の在庫状況といった時間とともに変動するパラメータを格納できるデータベース１０４２を含むことができる。対話サーバ１０００はユーザからの質問を解析し、その結果に基づいてデータベース１０４２を参照しつつ、最適な店舗を選択することができる。通信端末１００はＡＰＩ１０１０を介して対話サーバ１０００と接続され、対話サーバ１０００によって選択された店舗とそれに係る情報とパラメータを取得する。プログラムの命令に従い、情報配信サーバ１２００から受け取った地図情報と、選択された店舗の位置情報が表示部１０６上に表示される。

情報配信サーバ１２００は経路探索手段１２２０を有しており、経路探索手段１２２０には地図情報データベース１２３０に加え、例えば経路探索手段１２２０、探索用データベース１２４０、道路交通情報データベース１２５０などが含まれる。経路探索手段１２２０は、地図情報データベース１２３０、探索用データベース１２４０、道路交通情報データベース１２５０に格納されている情報を参照しつつ、ユーザと店舗までの最良の経路を探索、決定する機能を有する。

本実施例では、事業者として銀行を例に挙げ、ユーザが日本円を米国ドルに両替するケースを想定し、図１４を参照しつつ説明を行う。

最初にユーザは、通信端末１００にインストールされた第１実施形態で示したプログラムを含むアプリケーションを起動する。その後アイコン３００（図３参照）を操作して音声入力部１１０をアクティブにし、仮想オペレータに対話する要領で質問を口頭で述べる。例えば、「日本円を両替したい」と述べればよい。発声が困難な状況であれば、テキスト入力によって質問を入力してもよい。プログラムの命令に従って通信端末１００の通信部１１４は、ユーザの音声情報を音声認識システムへ送信する（Ｓ１）。音声認識サーバ８００は音声情報を文字情報へ変換し、対話サーバ１０００へ伝達する（Ｓ２）。

対話サーバ１０００は対話エンジン１０２０を用いて質問の意図を理解するが、例示した音声情報には、外貨の種類や両替額といった情報が含まれていないため、事業者はユーザに対して最善の情報を提供することができない。そこで対話サーバはさらなる情報をユーザから得るため、準備された問合せメッセージから最適な問合せメッセージを選択する、あるいは新たに作成し、これを音声合成サーバ９００へ伝達する（Ｓ３）。例えば、「外貨の種類を教えてください」、「両替する日本円の金額を教えてください」などといった問合せメッセージを選択もしくは作成する。

音声合成サーバ９００は上記問合せメッセージを言語解析して波形を生成し、音声情報として通信端末１００へ送信する（Ｓ４）。なお、音声情報と同時に問合せメッセージの文字情報を音声合成サーバ９００あるいは対話サーバ１０００から通信端末１００に送信してもよい。通信端末１００は音声出力部１１２を用いて音声情報を再生するとともに、表示部１０６上に問合せメッセージを表示する。

ユーザは問合せメッセージに対する回答を、Ｓ１のステップと同様に行う。回答としては、例えば「米国ドルに両替したい」、「日本円は１０万円程度」などの回答が考えられる。通信端末１００はこの回答を音声認識サーバ８００に送信し（Ｓ５）、音声認識サーバ８００はユーザの音声を文字情報に変換して対話サーバ１０００に伝達する（Ｓ６）。

対話サーバ１０００はユーザからの回答を解析する。本実施例では日本円からＵＳドルへの両替であるため、ユーザは店舗へ直接アクセスする必要がある。このため対話サーバ１０００は、ユーザを店舗へ案内することが必須であると判断し、ユーザを店舗へ案内するための回答メッセージを生成、あるいは選択する。回答メッセージの例として、「お近くの当行支店にご案内いたします」のようなメッセージが挙げられる。その後回答メッセージの音声情報を音声合成サーバ９００へ伝達する（Ｓ７）。

この時、対話サーバ１０００は事業者管理サーバ１０４０にアクセスし（Ｓ８）、ユーザの要求を満たす店舗の候補、ならびに店舗の混雑状況や商品の在庫状況などのパラメータを取得する（Ｓ９）。これは、店舗によっては保管する外貨の種類や量が異なり、また、取引状況によっては在庫量が大幅に変動している可能性があるためである。これらの情報に基づいてユーザの要求に対して最適な店舗を決定し、その位置情報を通信端末１００に送信する。同時に、対話サーバ１０００は通信端末１００に対して地図モードへの移行要求を送信する（Ｓ１０）。

音声合成サーバ９００は回答メッセージから音声情報を生成し、この音声情報と回答メッセージの文字情報を通信端末１００に送信する（Ｓ１１）。

通信端末１００は内蔵されたＧＰＳ機能を利用して位置座標を取得し、通信端末１００の位置情報と受信した店舗の位置情報を情報配信サーバ１２００に送信し、付近の地図情報とともに経路探索を要求する（Ｓ１２）。情報配信サーバ１２００は通信端末１００の要求に応え、必要な地図情報と経路の探索結果を通信端末１００に送信する（Ｓ１３）。

その後通信端末１００は、プログラムの命令に従い、表示部１０６上に付近の地図、目的とする店舗の位置、ならびに店舗までの経路を表示する。

このように、ユーザの質問に対して対話を通して対応することで、最適な回答をユーザに提供することができる。この時ユーザは、複数の回答から最適な回答を選択するという労力を払う必要がないため、最適な回答に速やかにたどり着くことができる。

また、このような対話によるサービスはユーザが操作する通信端末１００を用いて達成できるため、ユーザは店舗に訪れて質問をする労力を払う必要もなく、また、店舗の営業時間や店舗での待ち時間などを考慮する必要もない。このように、本実施形態の情報提供方法やそれを実行するためのプログラムを用いることによって、ユーザは時間や場所を選ばずに種々の問題を解決することができる。

またユーザは、事業者やそのオペレータの知識や経験、能力に制約されることなく、均一かつ豊富な情報を獲得することができる。例えば本実施例の事例では、各店舗における米国ドルの現金の在庫状況は刻一刻と変化するため、従来、ユーザと直接対応するオペレータによってはその変動を把握することができず、在庫が不十分な店舗を案内する可能性があった。しかしながら本実施形態の情報提供方法を実施することにより、全てのユーザに対して正確な情報を提供することができる。同時に事業者は、ユーザ対応における人的資源の消耗を回避することで業務の効率化と生産性の向上が達成できる。

本実施例では、実施例１と異なるケースを想定して説明を行う。具体的には、ユーザが銀行口座のキャッシュカードを紛失した例を、図１５を参照しつつ説明する。

実施例１と同様に、最初にユーザは、通信端末１００にインストールされた第１実施形態で示したプログラムを含むアプリケーションを起動する。その後アイコン３００を操作して音声入力部１１０をアクティブにし、仮想オペレータに対話する要領で質問を口頭で述べる。例えば、「キャッシュカードをなくしたのだが」と述べることができる。発声が困難な状況であれば、テキスト入力によって質問を入力してもよい。プログラムの命令に従って通信端末１００の通信部１１４は、ユーザの音声情報を音声認識システムへ送信する（図１５、Ｓ１）。音声認識サーバ８００は音声情報を文字情報へ変換し、対話サーバ１０００へ伝達する（Ｓ２）。

対話サーバ１０００は対話エンジン１０２０を用いて質問の意図を理解する。対話サーバ１０００は質問に対する回答メッセージを選択し、その文字情報を音声合成サーバ９００に伝達する（Ｓ３）。音声合成サーバ９００は上記問合せメッセージを言語解析して波形を生成し、音声情報、および文字情報として通信端末１００へ送信する（Ｓ４）。通信端末１００は音声出力部１１２を用いて音声情報を再生するとともに、表示部１０６上に問合せメッセージを表示する。

本実施例で想定したケースでは、事業者はユーザに対して速やかに所定の部署、例えば喪失受付センターなどへ通知するよう要求する必要がある。したがって対話サーバは回答メッセージを選択すると同時に、事業者管理サーバ１０４０に対して該当部署の電話番号の送信を要求する（Ｓ５）。事業者管理サーバ１０４０は対話サーバ１０００の要求に従って必要な情報を送信する（Ｓ６）。

本実施例のケースにおける回答メッセージは、例えば「キャッシュカードでのお取引ができないよう設定しますので、喪失受付センターへお繋ぎします」のようなメッセージが挙げられる。これによりユーザは通話モードへ切り替わることを予測することができる。

対話サーバ１０００は通信端末１００に対して通話モードへの切り替えを要求する（Ｓ７）。同時に対話サーバ１０００は通信サービス連携サーバ１１００に対して回線の接続を要求し、該当部署の電話番号を通知する（Ｓ８）。通信サービス連携サーバ１１００は対話サーバ１０００からの要求に応えてユーザの通信端末１００と所定の部署とを電話回線で接続し（Ｓ９）、ユーザとオペレータとの通話が開始される。

なお、ここではユーザの意向にかかわらず、通話モードへ切り替わる例を示したが、通話モードへの切り替えの要否をユーザの判断に委ねてもよい。例えば通話モードへの切り替え要求を通信端末１００が対話サーバ１０００から受信した際（Ｓ７）、電話アイコンを表示部１０６上に表示し、電話アイコンの操作によって通話が開始されるようにしてもよい。

本実施例で想定した質問はＦＡＱの一種であり、例えば事業者が提供するサイト上でも回答を得ることも可能な場合が多い。しかしながら本実施例のケースはユーザにとっては一種の緊急事態であり、一刻でも早い問題解決を要望しているため、通信端末１００から事業者のサイトへアクセスする精神的余裕を持たない場合が多い。

これに対して本実施形態では、スマートフォンなどの常時携帯可能な通信端末１００にインストールされたアプリケーションを起動し、口頭で質問を述べるだけで自動的に所定の部署への通話を開始することが可能である。したがって本発明の実施形態により、ユーザに対してより簡便、かつ迅速なサービスを提供することができる。

上述した実施形態や実施例では、主に金融事業に関連する例を取り上げて説明を行ったが、本発明の実施は金融業界に限られない。例えば食品業界、外食業界、物流業界、建設業界、空港・海運業界など、あらゆる業界、業種において実施、適用が可能である。その一例として本実施例では、ユーザが飲食店を利用する際のケースを想定し、図１６を参照しつつ説明を行う。なおここでの事業者とは、飲食店に関する情報を収集し、それをユーザに提供する個人あるいは団体であり、各飲食店はこの事業者に対して必要な情報を提供する。

実施例１、２と同様にユーザはまず、通信端末１００にインストールされた第１実施形態で示したプログラムを含むアプリケーションを起動する。その後アイコン３００を操作して音声入力部１１０をアクティブにし、仮想オペレータに対話する要領で質問を口頭で述べる。例えば、「お腹すいた」とか、「ご飯が食べたい」と述べることができる。発声が困難な状況であれば、テキスト入力によって質問を入力してもよい。プログラムの命令に従って通信端末１００の通信部１１４は、ユーザの音声情報を音声認識システムへ送信する（Ｓ１）。音声認識サーバ８００は音声情報を文字情報へ変換し、対話サーバ１０００へ伝達する（Ｓ２）。

対話サーバ１０００は対話エンジン１０２０を用いて質問の意図を理解するが、上記の音声情報には、具体的な情報が全く含まれていない。例えばユーザが何を食べたいのか、どの程度の量を食べたいのか、アルコールを飲みたいのか、人数はどの程度か、喫煙者であるのかどうか、などといった情報は全く含まれていない。したがって事業者はユーザに対して最善の情報を提供することができない。そこで対話サーバはさらなる情報をユーザから得るため、準備された問合せメッセージから最適なメッセージを選択する、あるいは新たに作成し、これを音声合成サーバ９００へ伝達する（Ｓ３）。問合せメッセージとしては、例えば「どのようなものを召し上がりますか？」などといった自由回答形式のメッセージでもよく、あるいは「和食、中華、洋食のうちいずれが良いでしょうか？」といった選択形式のメッセージでもよい。

音声合成サーバ９００は上記問合せメッセージを言語解析して波形を生成し、音声情報として通信端末１００へ送信する（Ｓ４）。実施例１、２と同様に、音声情報と同時に文字情報を音声合成サーバ９００あるいは対話サーバ１０００から通信端末１００に送信してもよい。通信端末１００は音声出力部１１２を用いて音声情報を再生するとともに、表示部１０６上に問合せメッセージを表示する。

同時に対話サーバ１０００は通信端末１００に対して位置情報の提供を要求する（Ｓ５）。この要求に応えて通信端末１００は、内蔵するＧＰＳ機能を利用して位置座標を獲得し、その情報を対話サーバ１０００に送信する（Ｓ６）。

この間、ユーザは問合せメッセージに対する回答を、Ｓ１のステップと同様に行う。回答としては、例えば「パスタが食べたい」といった具体的な回答でもよく、「温かいものが良い」といった抽象的な回答でもよい。通信端末１００はこの回答を音声認識サーバ８００に送信し（Ｓ７）、音声認識サーバ８００はユーザの音声を文字情報に変換して対話サーバ１０００に伝達する（Ｓ８）。

対話サーバ１０００はユーザからの回答を解析する。ユーザからの回答では最終的な飲食店にまで絞り込むことは困難であると対話サーバ１０００が判断した場合、再度問合せメッセージを選択、作成し、音声合成サーバ９００を介して通信端末１００へ送信する。そしてユーザはそれに対する回答を口頭で述べる。このステップを繰り返すことで、例えば「温かいものが食べたい」、「和食が良い」、「お酒も出してくれるところ」、「人数は３名」、「喫煙できるところがいい」といったように、より具体的な情報をユーザから取得することができる。

対話サーバ１０００は事業者管理サーバ１０４０に対し、ユーザの位置座標付近に登録された飲食店の情報を要求する（Ｓ９）。事業者管理サーバ１０４０はこの要求に応え、データベース１０４２から要求された情報を対話サーバ１０００に送信する（Ｓ１０）。

対話サーバ１０００はユーザから得られた情報を解析し、セレクタ１０２４が有する絞り込み機能を用いてデータベース１０４２から取得した情報の中からユーザの希望に最もよく適合する回答を選択する。

次に対話サーバ１０００は回答が得られた旨をユーザに伝えるための回答メッセージを選択し、これを音声合成サーバ９００へ伝達する（Ｓ１１）。この時の回答メッセージとしては例えば、「お客様のご希望に最適なお店をご紹介します」というようなメッセージでよい。同時に対話サーバ１０００は情報配信サーバ１２００に対し、選択された回答、すなわち選択された飲食店の位置情報を要求する（Ｓ１２）。情報配信サーバ１２００は対話サーバ１０００からの要求された情報を対話サーバ１０００、あるいは直接通信端末１００へ送信する（Ｓ１３）。

音声合成サーバ９００は対話サーバ１０００から送られた回答メッセージを音声情報に変換し、通信端末１００へ送信する（Ｓ１４）。

さらに対話サーバ１０００は通信端末１００に対して地図モードへの意向を要求する（Ｓ１５）。これに応えて通信端末１００は情報配信サーバ１２００に対して通信端末１００の位置情報と選択された飲食店の位置情報とともに経路探索を要求する（Ｓ１６）。情報配信サーバ１２００は通信端末１００の要求に応え、必要な地図情報と経路の探索結果を通信端末１００に送信する（Ｓ１７）。

その後通信端末１００は、表示部１０６上に付近の地図、目的とする飲食店の位置、ならびに飲食店までの経路を表示する。

このように、ユーザの質問に対して対話を通じて対応することで、最適な回答をユーザに提供することができる。この時ユーザは、複数の回答から最適な回答を選択するという労力を払う必要がないため、最適な回答に速やかにたどり着くことができる。

上述した各実施形態は、相互に矛盾しない限りにおいて、適宜組み合わせて実施することができる。また、各実施形態を基にして、当業者が適宜構成要素やプロセスの追加、削除もしくは設計変更を行ったものも、本発明の要旨を備えている限り、本発明の範囲に含まれる。

また、上述した各実施形態の態様によりもたらされる作用効果とは異なる他の作用効果であっても、本明細書の記載から明らかなもの、又は、当業者において容易に予測し得るものについては、当然に本発明によりもたらされるものと解される。

１００：通信端末、１０２：中央演算ユニット、１０４：メモリ、１０６：表示部、１０８：入力部、１１０：音声入力部、１１２：音声出力部、１１４：通信部、１１６：画像取込装置、２００：ステップ、２０２：ステップ、２０４：ステップ、２０６：ステップ、２０８：ステップ、２１０：ステップ、２１２：ステップ、２１４：ステップ、２１６：ステップ、２１８：ステップ、２２０：ステップ、２２２：ステップ、２２４：ステップ、２２６：ステップ、２２８：ステップ、２３０：ステップ、２３２：ステップ、２３４：ステップ、３００：アイコン、３０２：アイコン、４００：ステップ、４０２：ステップ、４０４：ステップ、４０６：ステップ、４０８：ステップ、４１０：ステップ、４１２：ステップ、６０２：アイコン、６０４：アイコン、７００：ステップ、７０２：ステップ、７０４：ステップ、７０６：ステップ、７１０：ステップ、７１２：ステップ、７２０：ステップ、７２２：ステップ、８００：音声認識サーバ、８１０：ＡＰＩ、８２０：音声認識エンジン、８３０：特徴量抽出部、８４０：デコーダ、８４２：言語モデル、８４４：音響モデル、８４６：語彙辞書、８５０：テキスト出力部、９００：音声合成サーバ、９１０：ＡＰＩ、９２０：音声合成エンジン、９３０：テキスト入力部、９４０：言語解析部、９４２：言語辞書、９４４：音声合成データベース、９５０：波形生成部、９６０：送信部、１０００：対話サーバ、１０１０：ＡＰＩ、１０２０：対話エンジン、１０２２：対話コントローラ、１０２４：セレクタ、１０２６：応答生成部、１０３２：メッセージ、１０３４：メッセージ、１０３６：メッセージ、１０３８：メッセージ、１０４０：事業者管理サーバ、１０４２：データベース、１０５０：管理サーバ、１０６０：情報データベース、１１００：通信サービス連携サーバ、１１１０：ＡＰＩ、１１２０：コントローラ、１１３０：通信ステータス管理データベース、１１４０：窓口データベース、１１５０：通信ネットワーク、１２００：情報配信サーバ、１２１０：ＡＰＩ、１２２０：経路探索手段、１２３０：地図情報データベース、１２４０：探索用データベース、１２５０：道路交通情報データベース

Claims

通信端末から送信されたユーザの音声情報を認識する音声認識部と、
前記音声情報に対する回答メッセージを、複数のメッセージが格納されたデータベースから選択する対話部と、
選択された前記回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして前記通信端末に送信する送信部を有し、
前記対話部は、前記回答メッセージを一つに絞り切れない場合、前記ユーザに質問するための問合せメッセージを前記データベースから選択し、選択された前記問合せメッセージを前記通信端末に送信する情報提供システム。
前記通信端末をさらに含む、請求項１に記載の情報提供システム。
前記通信端末は仮想オペレータを表示するように構成され、
前記回答メッセージ、前記問合せメッセージを前記通信端末で再生する際、前記回答メッセージ、前記問合せメッセージを再生しない時と比較し、前記仮想オペレータの一部が大きな動作を行うように構成される、請求項１に記載の情報提供システム。
前記ユーザの標準生体情報が格納される第１のサーバをさらに有し、
前記通信端末は、前記ユーザの生体情報を取り込む画像取込装置を有し、
前記生体情報と前記標準生体情報に基づいて前記ユーザが承認された場合に、前記ユーザに前記音声情報の入力を許容するように構成される、請求項１に記載の情報提供システム。
前記ユーザと事業者との通話のための第２のサーバをさらに有する、請求項１に記載の情報提供システム。
前記第２のサーバは、音声認識部によって認識された前記音声情報と、選択された前記回答メッセージと前記問合せメッセージを格納するように構成される、請求項５に記載の情報提供システム。
地図情報が格納される第３のサーバをさらに有し、
前記第１のサーバは事業者の複数の店舗に関する情報を格納するように構成され、
前記通信端末は、表示部に前記通信端末の位置と前記複数の店舗の情報を表示するように構成される、請求項４に記載の情報提供システム。
前記対話部は、前記音声情報に基づき、前記複数の店舗から少なくとも一つの店舗を選択するように構成され、
前記第３のサーバは、前記選択された店舗への道順を前記通信端末へ送信するように構成される、請求項７に記載の情報提供システム。
ユーザによって音声入力された質問に対応する回答メッセージを複数のメッセージから絞り込み、前記回答メッセージを一つに絞り切れない場合には、ユーザに質問するための問合せメッセージを前記複数のメッセージから選択するように構成されるサーバ。
ユーザが入力した音声情報を認識する音声認識サーバから前記質問が伝達されるように構成される、請求項９に記載のサーバ。
前記回答メッセージと前記問合せメッセージが音声合成サーバへ伝達されるように構成される、請求項９に記載のサーバ。
前記ユーザの生体情報を格納するように構成される第１のサーバと接続される、請求項９に記載のサーバ。
前記第１のサーバが事業者の店舗情報を格納するように構成される、請求項１２に記載のサーバ。
前記ユーザの前記質問、選択された前記回答メッセージ、選択された前記問合せメッセージの少なくとも一つを格納するように構成される第２のサーバが、前記第１のサーバと接続される、請求項１３に記載のサーバ。
通信端末から送信される、ユーザの質問を含む音声情報を認識し、
認識された前記ユーザの前記質問に対応する回答メッセージを複数の回答メッセージから選択し、
選択された前記回答メッセージを、少なくとも音声情報および文字情報のいずれか一つとして前記通信端末に送信し、
前記回答メッセージが一つに絞り切れない場合、前記ユーザに質問するための問合せメッセージを前記複数の回答メッセージから選択し、
選択された前記問合せメッセージを前記通信端末に送信することをコンピュータに実行させるためのプログラム。
前記通信端末が取り込む前記ユーザの生体情報を受信し、前記生体情報を用いて前記ユーザの認証を行うことを実行させる、請求項１５に記載のプログラム。
前記ユーザの前記質問、選択された前記回答メッセージ、選択された前記問合せメッセージの少なくとも一つを格納することをさらに実行させる、請求項１５に記載のプログラム。
格納された前記ユーザの前記質問、選択された前記回答メッセージ、選択された前記問合せメッセージの少なくとも一つを参照し、
前記通信端末と事業者の電話端末とを接続することをさらに実行させる、請求項１５に記載のプログラム。
格納された前記ユーザの前記質問、選択された前記回答メッセージ、選択された前記問合せメッセージの少なくとも一つを参照し、
前記通信端末に事業者の店舗情報を表示することをさらに実行させる、請求項１５に記載のプログラム。
前記通信端末から前記質問を文字情報として受信し、
前記回答メッセージを前記通信端末に文字情報として送信することをさらに実行させる、請求項１５に記載のプログラム。
前記音声情報内に含まれる前記質問が検出できないとき、前記通信端末から前記質問を文字情報として受信し、
前記回答メッセージを前記通信端末に文字情報として送信することをさらに実行させる、請求項１５に記載のプログラム。
前記通信端末から前記通信端末周囲の音量データを受信し、
前記音量データに応じて前記通信端末から前記質問を文字情報として受信することを実行させる、請求項２１に記載のプログラム。
音声認識サーバ、対話サーバ、音声合成サーバが含まれるシステムに音声情報を送信し、
前記音声情報に含まれるユーザの質問に対する回答メッセージ、前記質問に対する問合せメッセージの少なくとも一つを受信し、
前記回答メッセージと前記問合せメッセージを少なくとも音声情報および文字情報のいずれか一つとして出力することを通信端末に実行させるためのプログラム。
前記プログラムが前記通信端末に記憶されるように構成される、請求項２３に記載のプログラム。
前記プログラムが通信ネットワークから取得されるように構成される、請求項２３に記載のプログラム。
前記プログラムが仮想オペレータを表示し、前記回答メッセージ、前記問合せメッセージを前記通信端末で再生する際、前記回答メッセージ、前記問合せメッセージを再生しない時と比較し、前記仮想オペレータの一部が大きな動作を行うように構成される、請求項２３に記載のプログラム。
前記プログラムがユーザの生体情報を取得するように構成される、請求項２３に記載のプログラム。
前記プログラムが前記通信端末と事業者の電話端末とを接続するように構成される、請求項２３に記載のプログラム。
前記プログラムが前記通信端末の位置情報を取得し、
前記通信端末に地図を表示し、
事業者の店舗情報を前記通信端末に表示するように構成される、請求項２３に記載のプログラム。
前記プログラムがさらに、前記通信端末の位置から前記事業者の店舗までの経路を表示させる、請求項２９に記載のプログラム。
前記質問を文字情報として送信することをさらに実行させる、請求項２３に記載のプログラム。
前記通信端末周囲の音量を測定し、前記音量のデータを前記音声認識サーバ、前記対話サーバ、前記音声合成サーバのうち少なくとも一つに送信することを実行させる、請求項２３に記載のプログラム。
前記音量に応じて、前記質問を文字情報として送信することをさらに実行させる、請求項３２に記載のプログラム。