JP2000267687A

JP2000267687A - 音声応答装置

Info

Publication number: JP2000267687A
Application number: JP11075541A
Authority: JP
Inventors: Mitsuru Ebihara; 充海老原; Yasushi Ishikawa; 泰石川
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1999-03-19
Filing date: 1999-03-19
Publication date: 2000-09-29

Abstract

(57)【要約】【課題】合成音声の再提示要求がなされたときに、要
求を受けた時点から逆時間方向に遡って意味的な文の切
れ目を検出し、そこを合成音声の再提示開始時点として
再提示を行う音声応答装置を得る。【解決手段】波形編集部３は、入力系列２に対応する
データを単語音声データベース４及びテンプレート５か
ら呼び出し、単語音声データベース４内の単語とテンプ
レート５内の文または句とを接続して文長または文章長
の合成音声８を生成する。ユーザが聞き直しをしたい場
合には、コマンド入力６を与える。コマンド入力６を受
信すると、韻律境界検出部７は、受信した時点から合成
音声８を逆時間方向に遡って韻律境界を検出し、そこか
ら合成音声８の再提示を開始する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は音声応答装置に関
し、特に、マン・マシン・インタフェース等のシステム
において音声による情報提供を行うための音声応答装置
に関するものである。

【０００２】

【従来の技術】音声合成技術は、マン・マシン・インタ
フェースの普及に伴い、情報提示手段として重要な技術
である。音声合成技術は、任意の文字列からなるテキス
トを音声に変換して提示する規則合成技術と、あらかじ
め断片的に蓄積された音声データを目的に応じて接続し
て固定の音声メッセージを生成する編集合成システムに
大別される。前者は電子メールの読み上げ、身障者向け
朗読器、新聞校閲、カーナビゲーションなどの用途に用
いられている。また後者は駅の構内アナウンスやハイウ
ェイラジオなどの大規模音声メッセージシステムへの適
用が活発に行われている。

【０００３】近年は電話回線を利用し、自動的に情報提
供や予約などの各種業務を機械が代行するＣＴＩシステ
ムが注目されており、それへの音声合成技術の適用が期
待されている。ＣＴＩシステムにおいては音声による情
報提供やガイダンスは中枢となる部分であり、ここに音
声合成技術を利用することでオペレータの削減、２４時
間業務化、及び、大量受け付けの可能など、低コストと
業務拡大の両面を目指すことができる。

【０００４】音声合成の利用で問題となるのが、情報の
揮発である。音声情報は一度聞き逃したら失われてしま
う為、聞き返す必要がある。人間が相手であればどこの
部分を聞き直したいかを早く理解することができ、又、
聞き手に応じて情報内容を変更して、よりわかり易い情
報提供に努めるなどの工夫を凝らすことができる。しか
し、現行のＣＴＩシステムではそこまでを対象とするも
のはあまりない。

【０００５】その中で、ユーザの発声により音声情報伝
達のやり直しを行う方法が検討されている。図１１は、
例えば特開昭６２−４０５７７号公報に示された従来の
音声応答装置の構成を示すブロック図である。図におい
て、５７は利用者からの音声入力信号を認識するための
音声認識部、５８はメッセージを語群毎に利用者に出力
するための音声応答部、５９は音声認識部５７及び音声
応答部５８の制御を行うための会話制御部、６０は会話
制御部５９よりコマンドを受け取り一定の仕事を行い、
それによって得られる情報を会話制御部５９に返すため
のタスクインターフェース部である。

【０００６】従来の音声応答装置は上記のように構成さ
れ、利用者から音声入力があると、音声認識部５７はそ
れを認識し、会話制御部５９へ割り込み信号を送出す
る。音声認識部５７には、特定語を認識するための回路
が設けられており、例えば「えっ」とか「なんですっ
て」といった特定の音声入力があった場合には、特定語
が入力されたという情報を、そうでなければ特定語では
ないという情報を会話制御部５９へ送信する。会話制御
部５９は、割り込み信号の入力があった時点が音声検出
の時点であれば、音声応答部５８へ割り込み信号を送出
し、音声を中断するコマンドを送る。また、音声入力が
特定語である場合は音声応答部５８へ再合成命令を出
し、認識された音声入力が特定語でなければ、音声応答
部５８へ中断解除命令を送る。音声応答部５８は割り込
み信号を受けたら、出力中の語群の出力が終った時点で
音声出力の中断を行う。再合成命令が入力されると、音
声入力があった時点の語群から再びメッセージを合成
し、中断解除命令があった場合には次のメッセージから
音声出力する。

【０００７】

【発明が解決しようとする課題】従来の音声応答装置で
は、上述したように、簡単な認識手法を用いることでユ
ーザからの再提示要求を口頭から受け付けることがで
き、迅速な聞き直しが可能となるが、しかしながら、こ
の手法では聞き直しが常に音声入力がされた単語から開
始されることになり、それ以前の単語を聞き直したかっ
た場合には不十分であり、また当該単語が文脈に依存す
る場合は当該単語だけの提示では利用者の要求に対し不
十分である可能性が高いという問題点があった。

【０００８】この発明は、かかる問題点を解決するため
になされたものであり、ユーザのコマンド指定による音
声提示の聞き直しの際には、意味的なまとまりの切れ目
を合成音声の再提示時点として再提示を行うことができ
る音声応答装置を提供することを目的としている。

【０００９】

【課題を解決するための手段】この発明は、入力データ
系列に対応する合成音声を生成して出力する音声合成手
段と、合成音声の再出力要求を外部から受信するコマン
ド受信手段と、コマンド受信手段が再出力要求を受信し
た時点から入力データ系列及び合成音声のいずれか一方
を逆時間方向に遡って意味的な文の切れ目を検出するた
めの再出力開始時点検出手段とを備え、意味的な文の切
れ目から合成音声を再出力する音声応答装置である。

【００１０】また、再出力開始時点検出手段が、韻律境
界を検出するための韻律境界検出部から構成されてい
る。

【００１１】また、再出力開始時点検出手段が、意味的
な言語境界を検出するための言語境界検出部から構成さ
れている。

【００１２】また、合成音声内の重要度の低い語群を削
除するための読み飛ばし手段をさらに備え、合成音声を
再出力する際には重要度の低い語群については省略して
再出力を行う。

【００１３】また、合成音声の話速を変更するための話
速変更手段をさらに備え、合成音声を再出力する際には
話速を変更して行う。

【００１４】また、合成音声のピッチを変更するための
ピッチ変更手段をさらに備え、合成音声を再出力する際
にはピッチを変更して行う。

【００１５】また、合成音声内の文節単位の語順の変更
を行うための語順変更手段をさらに備え、合成音声を再
出力する際には語順を変更して行う。

【００１６】また、類似語を記憶している類似語辞書手
段と、類似語辞書手段の類似語を参照して、合成音声内
の単語を他の類似語に変更するための類似語変更手段と
をさらに備え、合成音声を再出力する際には、合成音声
内の単語を他の類似語に変更して行う。

【００１７】また、単語に対応する説明文を記憶してい
る説明文用辞書手段と、説明文用辞書手段を参照して、
合成音声内の単語に対応する説明文を生成して、合成音
声内に挿入するための説明文生成手段をさらに備え、合
成音声を再出力する際には合成音声内の単語に対する説
明文を追加して行う。

【００１８】また、通常文のテンプレートを記憶してい
るテンプレート手段と、通常文をより詳細に説明した詳
細説明テンプレートを記憶している詳細説明テンプレー
ト手段と、通常文のテンプレートおよび詳細説明テンプ
レート内に挿入するための単語を記憶している単語音声
データベース手段とを備え、合成音声を最初に出力する
際には通常文のテンプレートで行い、再出力する際には
詳細説明テンプレートで行う。

【００１９】また、聞き間違い易い音節の組を記憶して
いる異聴マトリクス手段と、類義語音声データを記憶し
ている類義語音声データベース手段と、異聴マトリクス
手段を参照して、合成音声内の単語が上記異聴マトリク
スに存在する音声を含んでいる場合に、類義語音声デー
タベースから類義語を選択して、単語を他の類義語に変
換するための類義語変換部とを備えている。

【００２０】

【発明の実施の形態】実施の形態１．図１は、本発明の
実施の形態１における音声応答装置の構成を示したもの
である。図において、１は音声合成部であり、入力系列
２に対する合成音声８を編集合成に基づいた音声合成に
より生成し出力するものである。４は、単語単位の音片
データを保持している単語音声データベースである。５
は、文または句型の音片データを記憶しているテンプレ
ートである。３は、単語音声データベース４内の単語と
テンプレート５内の文または句を接続させて合成音声８
を生成するための波形編集部である。７は、コマンド入
力６により合成音声８の再提示要求を受けた時に、その
時点から合成音声８を逆時間方向に遡り、後述する韻律
境界を再提示時点として検出するための韻律境界検出部
である。

【００２１】次に動作について説明する。まず、一般的
な編集合成の動作を説明する。入力系列２は、接続する
音声データの番号の系列からなるものである。波形編集
部３は、入力系列２に対応するデータを単語音声データ
ベース４またはテンプレート５の中から呼び出す。単語
音声データベース４及びテンプレート５は同一話者から
収集された音声波形により構成される音片データを記憶
している。テンプレート５は文または句型の音片データ
であり、用途及び目的や情報提示の状況に応じて大量の
文型が用意されている。テンプレート５の幾つかは単語
の部分の入れ替えが可能となるように穴空き（以下、単
語スロットとする）となっており、それらの単語スロッ
トに、単語音声データベース４内の単語単位の音片デー
タを埋めるようになっている。あるいは、単語音声デー
タベース４内の単語同士を直接接続して文や文節を生成
する場合もある。このようにして、波形編集部３では、
単語音声データベース４内の単語とテンプレート５内の
文または句とを接続して合成音声８を得る。このとき、
接続音片データ間の不連続性を除く為に、ＰＳＯＬＡ手
法によりピッチを変更したり、または、音片間の補間を
行ったりするようにしてもよい。このようにして得られ
た文長または文章長の音声データを合成音声８として出
力する。

【００２２】次にユーザ（利用者）が音声を聞き逃した
り、不明瞭であったことから再度聞きたい場合を想定し
て説明する。その際にユーザは音声応答装置に対して聞
き直したいことを示すコマンド入力６を与える。コマン
ド入力６の例としては、電話を通じての音声応答の場合
のプッシュホンキー入力がある。韻律境界検出部７は、
コマンド入力６を受けた時点が出力中の合成音声８にお
けるいずれの時点であるかを特定するとともに、合成音
声８の出力を停止する。そしてその時点から合成音声８
を逆時間方向に遡り、韻律境界を検出し、そこを合成音
声８の再出力時点とする。韻律境界の例としては、呼気
段落の先頭であるポーズ(無音)が考えられる。ポーズは
コマンド入力６を受けた時点から逆時間方向へ見て、音
声波形の振幅が所定の閾値を下回った時点と考えられ
る。ただし、ポーズ（無音）には単なる促音中における
休止から、意味的な切れ目としての休止、息継ぎの為の
休止まで様々である。ここでは意味的な切れ目を韻律境
界と考えたいので、休止時間か否かの判定を行う必要が
ある。すなわち、音声振幅が閾値を連続して下回り、且
つ、その時間が一定尺度連続して存在すれば、呼気段落
の先頭と判定する。そして、この韻律境界から再度合成
音声８を提示する。

【００２３】ここで、本実施の形態においては、波形編
集部３、単語音声データベース４及びテンプレート５
が、合成音声を生成して外部に出力するための音声合成
手段を構成しており、韻律境界検出部７が、合成音声の
再出力要求を外部から受信するコマンド受信手段と、コ
マンド受信手段が再出力要求を受信した時点から逆時間
方向に遡って意味的な文の切れ目を検出するための再出
力開始時点検出手段とを構成している。

【００２４】本実施の形態によれば、このような構成を
とることにより、合成音声８の再提示要求を受けたら、
その時点から時間逆方向に合成音声８を遡り、韻律境界
を再提示時点として検出する韻律境界検出部７を備える
ようにしたので、合成音声８の再提示時点の自動検出を
行うことを可能とし、柔軟且つユーザにわかり易い再提
示が可能となる。

【００２５】なお、韻律境界の例として、ポーズ（無
音）の位置を検出する例を挙げたが、その場合に限ら
ず、ピッチ（声の高さ）のアクセントの強さが所定の閾
値を越えた箇所を求め、その位置を含む文節音声の先頭
を韻律境界としてもよい。また、韻律境界の他の例とし
ては、母音中心の振幅の大きさがある閾値を越えた箇所
を求め、その位置を含む文節音声の先頭を韻律境界とし
てもよく、さらには、ピッチの推定結果から得られる、
ピッチパターンにおけるフレーズ成分の立て直し位置を
韻律境界としてもよい。

【００２６】実施の形態２．図２は、本発明の実施の形
態２における音声応答装置の構成を示したものである。
１Ａは音声合成部であり、入力系列２Ａに対する合成音
声８を規則合成に基づいた音声合成により生成し出力す
るものである。９は、コマンド入力６を受けた時点から
入力系列２Ａの意味的な言語境界まで遡って、それを検
出するための巻き戻し地点検出部である。１０は再入力
系列であり、１１は音声合成用の素片を記憶している音
声素片データベースである。１２は、入力系列２Ａまた
は再入力系列１０に対応した音声素片を音声素片データ
ベース１１から読み出し、音声合成に用いるパラメータ
を出力するためのパラメータ生成部である。１３は、パ
ラメータ生成部１２により生成されたパラメータを基に
音声合成するための波形生成部である。

【００２７】次に動作について説明する。まずはじめ
に、一般的な規則合成の動作について説明する。入力系
列２Ａは、読み上げられるテキストの言語的情報からな
り、それはテキストの読み、品詞、係り受け、およびア
クセント型などの韻律情報からなる。音声素片データベ
ース１１内の音声素片は、ＶＣＶ(母音−子音−母音)、
または、ＣＶ(子音−母音)などの単位からなり、それぞ
れの音韻を示すパラメータに関する情報がフレーム毎に
記憶されている。パラメータの種類は、音声の声道特性
成分を圧縮した特徴量であるＬＳＰやメルケプストラム
などの音響パラメータか、音声波形そのものである。音
声素片の記述例としては、フレーム毎に音響パラメータ
を記憶する形式や、ベクトル量子化手法における代表コ
ードの番号をフレーム毎に記憶する形式などが挙げられ
る。パラメータ生成部１２は、入力系列２Ａにおける読
みに対する音声素片を音声素片データベース１１を参照
して音響パラメータを得る。そして入力系列２Ａにおけ
るアクセント型などの韻律情報からピッチや音韻継続時
間長などの合成音声の韻律パラメータを決定する。波形
生成部１３では、パラメータ生成部１２で得たパラメー
タを基に合成音声８を生成する。波形生成部１３での音
声合成手法は、音響パラメータから合成フィルタを構成
し、ピッチから駆動音源を求め、ボコーダ方式に基づき
合成音声８を生成する。

【００２８】次にユーザが音声を聞き逃したり、不明瞭
であったことから再度聞きたい場合を想定して説明す
る。その際に、ユーザは音声応答装置に対して聞き直し
たいことを示すコマンド入力６を与える。コマンド入力
６の方法としては実施の形態１と同様とする。巻き戻し
地点検出部９は、コマンド入力６を受けた時点の入力系
列２Ａを特定し、合成音声８の出力停止の命令をパラメ
ータ生成部１２へ送る。入力系列２Ａを逆時間方向に遡
り、入力系列２Ａにおける意味的な言語境界を検出す
る。意味的な言語境界としては、文の開始時点、及び、
文節の係り受け関係から判定される木構造における右枝
分かれ境界があり、その中でコマンドが入力された時点
に最も近いものを検出する。そしてその時点を巻き戻し
時点とし、入力系列２Ａを再入力系列１０として、そこ
から再びパラメータ生成部１２へ送信する。

【００２９】ここで、本実施の形態においては、パラメ
ータ生成部１２、音声素片データベース１１及び波形生
成部１３が、合成音声を生成して外部に出力するための
音声合成手段を構成しており、巻き戻し地点検出部９
が、合成音声の再出力要求を外部から受信するコマンド
受信手段と、コマンド受信手段が再出力要求を受信した
時点から逆時間方向に遡って意味的な文の切れ目を検出
するための再出力開始時点検出手段とを構成している。

【００３０】本実施の形態によれば、このような構成を
とることにより、規則合成方式に基づく音声応答装置に
おいて、合成音声８の再提示要求を受けたら、その時点
から意味的な言語境界まで遡り、そこを再提示時点とし
て検出する巻き戻し地点検出部９を備え、合成音声８の
再提示時点の自動検出を行うことを可能とし、柔軟且つ
ユーザにわかり易い再提示が可能となる。

【００３１】実施の形態３．図３は、本発明の実施の形
態３における音声応答装置の構成を示したものである。
なお、図において、上記実施の形態２と同様の構成要素
については、同じ符号を付けてここでは説明を省略す
る。この実施の形態においては、巻き戻し地点検出部９
とパラメータ生成部１２との間に読み飛ばし部１４が設
けられている点が上記実施の形態２と異なる点である。
この読み飛ばし部１４は、再入力系列１０の中で重要度
の低い語群のパラメータの読み込みを省略し、読み飛ば
しを実行して合成音声８を生成するものである。

【００３２】次に動作について説明する。音声合成部１
Ｂでは規則合成に基づいた音声合成を行う。入力系列２
Ａの形式、及び、入力系列２Ａから合成音声８を得るま
での動作は実施の形態２と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際にユーザは音声応答装
置に対して聞き直したいことを示すコマンド入力６を与
える。コマンド入力６の形式は実施の形態２と同様であ
る。巻き戻し地点検出部９は、コマンド入力６を受けた
入力系列２Ａにおける時点を特定し、合成音声８の出力
停止の命令をパラメータ生成部１２へ送る。そして入力
系列２Ａの遡りを行う。そして入力系列２Ａにおける意
味的な境界を検出し、そしてその時点を巻き戻し時点と
し、入力系列２Ａを再入力系列１０として、読み飛ばし
部１４へ送信する。

【００３３】読み飛ばし部１４は再入力系列１０の中で
重要度の低い語群の韻律情報の読み込みを省略し、読み
飛ばしを実行する。重要度の評価は、例えば、修飾語や
間投詞、助長語のスコアを下げ、自立語に高い得点を与
え、個々の単語毎に重要度を評価する方法が考えられ
る。パラメータ生成部１２は、読み飛ばし部１４で読み
飛ばし処理された再入力系列１０Ｂが入力されると、音
声素片データベース１１を参照し、音響パラメータを得
る。波形生成部１３では、その音響パラメータから合成
フィルタを構成し、ピッチから駆動音源を求め、ボコー
ダ方式に基づき合成音声８を生成する。

【００３４】本実施の形態によれば、このような構成を
とることにより、合成音声８の再提示要求を受けたら、
意味的な言語境界まで遡り、そこを再提示時点として合
成音声の再提示を行い、その間に読み飛ばし要求を受け
たら合成音の読み飛ばしを行い、ユーザにわかり易く且
つ効率的な再提示が可能となる。

【００３５】尚、読み飛ばし部１４に対するユーザの読
み飛ばし要求は、コマンド入力６と同様の方法で入力す
るようにしてもよく、また、特に入力を必要としない構
成にし再提示の際には自動的に読み飛ばしを行うように
してもよい。本実施の形態における読み飛ばし部１４
は、ユーザの質問からの回答等、その時点で最も話題の
中心となる単語のスコアを最上位とし、対話を進めるに
つれてスコアを下げていくなど、重要度にユーザとの対
話の履歴を利用するようにしてもよい。

【００３６】実施の形態４.図４は、本発明の実施の形
態４における音声応答装置の構成を示したものである。
なお、上記実施の形態２と同様の構成要素については、
同じ符号を付けて説明を省略する。１５は、話速が遅く
なるように再入力系列１０の韻律情報を変更して、パラ
メータ生成部１２へ送るための話速変更部である。

【００３７】次に動作について説明する。音声合成部１
Ｃでは規則合成に基づいた音声合成を行う。入力系列２
Ａの形式、及び、入力系列２Ａから合成音声８を得るま
での動作は実施の形態２と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際に、ユーザは音声応答
装置に対して聞き直したいことを示すコマンド入力６を
与える。コマンド入力６の形式は実施の形態２と同様で
ある。巻き戻し地点検出部９は、コマンド入力６を受け
た入力系列２Ａにおける時点を特定し、合成音声８の出
力停止の命令をパラメータ生成部１２へ送る。そして入
力系列２Ａを遡り、入力系列２Ａにおける意味的な境界
を検出し、そしてその時点を巻き戻し時点とし、入力系
列２Ａを再入力系列１０として、話速変更部１５へ送信
する。意味的な境界の検出は実施の形態２と同様とす
る。

【００３８】話速変更部１５は再入力系列１０の韻律情
報を前回提示時と異なるように変更する。ここでは再入
力系列１０の時間長を伸長し、話速を遅くする。時間長
変更例としては、再入力系列１０におけるモーラ速度を
０．８倍にする。これにより再入力系列区間においては
前回提示時より遅く音声提示ができ、よりユーザに判り
やすく提示することができる。パラメータ生成部１２
は、話速変更部１５で話速変更処理された再入力系列１
０Ｃが入力されると、音声素片データベース１１を参照
し、音響パラメータを得る。波形生成部１３では、それ
らの音響パラメータから合成フィルタを構成し、ピッチ
から駆動音源を求め、ボコーダ方式に基づき合成音声８
を生成する。

【００３９】本実施の形態によれば、このような構成を
とることにより、文または文節中の発話速度を変更する
話速変更部１５を備え、合成音声の再提示要求を受けた
ら、前記再提示時点まで遡り、発話速度が前提示時より
遅くなるように合成音声の提示を行うことを可能とし、
ユーザにわかり易い再提示が可能となる。

【００４０】なお、本実施の形態の話速変更部１５にお
いて、再入力系列の音声をより明確に提示させる為に、
合成音声８の振幅を大きくするようにしてもよい。

【００４１】また、本実施の形態の音声合成部１Ｃは、
パラメータ生成部１２、波形生成部１３、巻き戻し地点
検出部９、音声素片データベース１１を備える替りに、
実施の形態１の波形編集部３、韻律境界検出部７、単語
音声データベース４、テンプレート５を備え、コマンド
入力６が与えられたら、韻律境界検出部７で検出された
韻律境界からコマンド入力時点までの音声波形を、話速
変更部１５でＰＳＯＬＡ手法による波形の繰り返し処理
により時間長を伸長するように構成するようにしてもよ
い。

【００４２】実施の形態５．図５は、本発明の実施の形
態５における音声応答装置の構成を示したものである。
なお、上記実施の形態２と同様の構成要素については、
同じ符号を付けて説明を省略する。１６は、再入力系列
１０の韻律情報を、前回提示時と異なる高さの声での音
声提示ができるように変更して、パラメータ生成部１２
へ送るためのピッチ変更部である。

【００４３】次に動作について説明する。音声合成部１
Ｄでは規則合成に基づいた音声合成を行う。入力系列２
Ａの形式、及び、入力系列２Ａから合成音声８を得るま
での動作は実施の形態２と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際にユーザは音声応答装
置に対して聞き直したいことを示すコマンド入力６を与
える。コマンド入力６の形式は実施の形態２と同様であ
る。巻き戻し地点検出部９は、コマンド入力６を受けた
入力系列２Ａにおける時点を特定し、合成音声８の出力
停止の命令をパラメータ生成部１２へ送る。そして入力
系列２Ａを遡り、入力系列２Ａにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
２Ａを再入力系列１０として、ピッチ変更部１６へ送信
する。意味的な境界の検出は実施の形態２と同様とす
る。

【００４４】ピッチ変更部１６は再入力系列１０の韻律
情報を前回提示時と異なるように変更する。ここでは再
入力系列１０のピッチを変更する。変更手法としては、
例えば再入力系列１０のピッチを一律０．２５［ｏｃ
ｔ］上昇させる。これにより再入力系列区間においては
前回提示時と異なる高さの声の音声提示ができ、ユーザ
に再提示していることを明示できる。パラメータ生成部
１２は、ピッチ変更部１６でピッチ変更処理された再入
力系列１０Ｄが入力されると、音声素片データベース１
１を参照し、音響パラメータを得る。波形生成部１３で
は、音響パラメータから合成フィルタを構成し、ピッチ
から駆動音源を求め、ボコーダ方式に基づき合成音声８
を生成する。

【００４５】本実施の形態によれば、このような構成を
とることにより、文または文節中のピッチを変更するピ
ッチ変更部１６を備え、合成音声の再提示要求を受けた
ら、前記再提示時点まで遡り、合成音声の声の高さを前
提示時より高くなるようにして合成音声の提示を行うこ
とを可能とし、ユーザにわかり易い再提示が可能とな
る。

【００４６】なお、本実施の形態のピッチ変更部１６に
おいて、再入力系列の音声をより明確に提示させる為
に、合成音声８の振幅を大きくするようにしてもよい。

【００４７】また、本実施の形態の音声合成部１Ｄは、
パラメータ生成部１２、波形生成部１３、巻き戻し地点
検出部９、音声素片データベース１１を備える替りに、
実施の形態１の波形編集部３、韻律境界検出部７、単語
音声データベース４、テンプレート５を備え、コマンド
入力６が与えられたら、韻律境界検出部７で検出された
韻律境界からコマンド入力６時点までの音声波形を、ピ
ッチ変更部１６でＰＳＯＬＡ手法により高ピッチ音声に
変更するように構成するようにしてもよい。

【００４８】また、ピッチ変更部１６において、合成音
声が女声など通常ピッチが高い音声を提示している場合
には、低いピッチに変更するようにしてもよい。

【００４９】実施の形態６．図６は本発明の実施の形態
６における音声応答装置の構成を示した図である。な
お、上記実施の形態２と同様の構成要素については、同
じ符号を付けて説明を省略する。１７は、再入力系列１
０の文節毎の韻律情報の提示順序を変更するための語順
変更部である。

【００５０】次に動作について説明する。音声合成部１
Ｅでは規則合成に基づいた音声合成を行う。入力系列２
Ａの形式、及び、入力系列２Ａから合成音声８を得るま
での動作は実施の形態２と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際にユーザは音声応答装
置に対して聞き直したいことを示すコマンド入力６を与
える。コマンド入力６の形式は実施の形態２と同様であ
る。巻き戻し地点検出部９は、コマンド入力６を受けた
入力系列２Ａにおける時点を特定し、合成音声８の出力
停止の命令をパラメータ生成部１２へ送る。そして入力
系列２Ａを遡り、入力系列２Ａにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
２Ａを再入力系列１０として、語順変更部１７に送信す
る。意味的な境界の検出は実施の形態２と同様とする。

【００５１】語順変更部１７は再入力系列１０の文節単
位の語順変更を行う。例えば再入力系列１０の中で文脈
から判断して重要度の高い文節が先頭に来るように、文
節の系列内の配置順を変更する。例えば、再入力系列１
０が「そこには/円覚寺が/あります」である場合には、
「円覚寺が/そこには/あります」の様に語順を変更す
る。こうしてユーザが最も注目するであろうキーワード
を率先して提示することで、ユーザへの伝達を促進す
る。パラメータ生成部１２は、語順変更部１７で語順変
更処理された再入力系列１０Ｅが入力されると、音声素
片データベース１１を参照し、音響パラメータを得る。
波形生成部１３では、音響パラメータから合成フィルタ
を構成し、ピッチから駆動音源を求め、ボコーダ方式に
基づき合成音声８を生成する。

【００５２】本実施の形態によれば、このような構成を
とることにより、文または文節中の単語列の順番を、キ
ーワードとして判定される単語を先頭に置くように変更
する語順変更部１７を備え、合成音声の再提示要求を受
けたら、前記再提示時点まで遡り、前提示時と語順を変
更して音声合成を行うことを可能とし、ユーザに意図を
より明確に伝える再提示が可能となる。

【００５３】なお、本実施の形態の音声応答装置内に、
上記実施の形態３の読み飛ばし部１４をさらに備えるよ
うにして、冗長な語を省略した語順変更文を生成するよ
うにしてもよい。

【００５４】また、語順変更部１７は、語順変更の影響
でかえって文が複雑になるのを避ける為に、語順変更の
際に助詞などの付属語を変更するように構成してもよ
い。

【００５５】実施の形態７．図７は、本発明の実施の形
態７における音声応答装置の構成を示したものである。
なお、上記実施の形態２と同様の構成要素については、
同じ符号を付けて説明を省略する。１８は、再入力系列
１０中のある文節について、類似語を記憶している類似
語辞書１９を参照して別の文節に変更するためのキーワ
ード変更部である。

【００５６】次に動作について説明する。音声合成部１
Ｇでは規則合成に基づいた音声合成を行う。入力系列２
Ａの形式、及び入力系列２Ａから合成音声８を得るまで
の動作は実施の形態２と同様である。次にユーザが音声
を聞き逃したり、不明瞭であったことから再度聞きたい
場合について説明する。その際にユーザは音声応答装置
に対して聞き直したいことを示すコマンド入力６を与え
る。コマンド入力６の形式は実施の形態２と同様であ
る。巻き戻し地点検出部９は、コマンド入力６を受けた
入力系列２Ａにおける時点を特定し、合成音声８の出力
停止の命令をパラメータ生成部１２へ送る。そして入力
系列２Ａを遡り、入力系列２Ａにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
２Ａを再入力系列１０として、キーワード変更部１８へ
送信する。意味的な境界の検出は実施の形態２と同様と
する。

【００５７】キーワード変更部１８は再入力系列１０に
おける単語変更を行う。例えば再入力系列１０の中にお
けるキーワードが耳慣れない又は難解であればピックア
ップする。この難易度に関する尺度は、あらかじめ単語
毎にスコアを与えておき、その単語スコアが閾値を上回
ればピックアップする。そして当該キーワードについて
類似語辞書１９を参照して当該キーワードに対応する類
似語を検出する。そしてその類似語のスコアがキーワー
ドより低く、かつ、閾値を下回ればキーワードと交換す
る。パラメータ生成部１２は、キーワード変更部１８で
単語変更処理された再入力系列１０Ｆが入力されると、
音声素片データベース１１を参照し、音響パラメータを
得る。波形生成部１３では、音響パラメータから合成フ
ィルタを構成し、ピッチから駆動音源を求め、ボコーダ
方式に基づき合成音声８を生成する。

【００５８】本実施の形態によれば、このような構成を
とることにより、単語を類義語へ変更するキーワード変
更部１８を備え、合成音声の再提示要求を受けたら、前
記再提示時点まで遡り、再提示区間内のキーワードを別
の表現に変更して音声合成を行うことを可能とし、ユー
ザに意図をより明確に伝える再提示が可能となる。

【００５９】尚、キーワード変更部１８は、各単語に対
する難易度の尺度を、ユーザからのコマンド入力結果を
蓄積し、それに基づき更新するようにしてもよい。

【００６０】実施の形態８．図８は、本発明の実施の形
態８における音声応答装置の構成を示したものである。
なお、上記実施の形態２と同様の構成要素については、
同じ符号を付けて説明を省略する。２０は、再入力系列
１０中のある文節について、説明文用辞書２１を参照し
て、文節の単語に対応する説明文を生成して、再入力系
列１０内に挿入するための説明文生成部である。

【００６１】次に動作について説明する。音声合成部１
Ｇでは規則合成に基づいた音声合成を行う。入力系列２
Ａの形式、及び入力系列２Ａから合成音声８を得るまで
の動作は実施の形態２と同様である。次にユーザが音声
を聞き逃したり、不明瞭であったことから再度聞きたい
場合について説明する。その際にユーザは音声応答装置
に対して聞き直したいことを示すコマンド入力６を与え
る。コマンド入力６の形式は実施の形態２と同様であ
る。巻き戻し地点検出部９は、コマンド入力６を受けた
入力系列２Ａにおける時点を特定し、合成音声８の出力
停止の命令をパラメータ生成部１２へ送る。そして入力
系列２Ａを遡り、入力系列２Ａにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
２Ａを再入力系列１０として、説明文生成部２０に送信
する。意味的な境界の検出は実施の形態２と同様とす
る。

【００６２】説明文生成部２０は再入力系列１０におけ
るキーワードに相当する説明文を生成する。例えば再入
力系列１０の中のキーワードが耳慣れない又は難解であ
ればピックアップする。キーワードの難易度の尺度は実
施の形態７と同様のものとする。そして説明文用辞書２
１を参照してキーワードを見出し語とする説明文の箇所
を読み出す。そして説明文を判りやすく修正して当該単
語に対応する説明文を生成し、それを再入力系列１０内
に挿入させる。パラメータ生成部１２は、説明文生成部
２０で説明文追加処理された再入力系列１０Ｇが入力さ
れると、音声素片データベース１１を参照し、音響パラ
メータを得る。波形生成部１３では、音響パラメータか
ら合成フィルタを構成し、ピッチから駆動音源を求め、
ボコーダ方式に基づき合成音声８を生成する。

【００６３】本実施の形態によれば、このような構成を
とることにより、単語に対応する説明文が記述されてい
る説明文用辞書２１を備え、合成音声の再提示要求を受
けたら、前記再提示時点まで遡り、再提示区間内のキー
ワードに関し説明文用辞書２１を参照し、そこに記述さ
れる説明文を用いて音声合成を行うことを可能とし、ユ
ーザに意図をより明確に伝える再提示が可能となる。

【００６４】なお、本実施の形態の説明文生成部２０
は、各単語に対する難易度の尺度を、ユーザからのコマ
ンド入力結果を蓄積し、それに基づき更新するようにし
てもよい。

【００６５】なお、上記の実施の形態２〜８における意
味的な境界は、入力系列２Ａがテキストの言語分析結果
である場合には、句読点の位置としてもよく、または、
ポーズが挿入される位置としてもよい。

【００６６】また、上記の実施の形態２〜８における音
声素片データベース１１内の音声素片は、音響パラメー
タの替りにフレーム毎にフレーム代表する音声波形と
し、波形生成部１３は音声波形とピッチに基づきＰＳＯ
ＬＡ手法で合成を生成するようにしてもよい。

【００６７】実施の形態９．図９は本発明の実施の形態
９における音声応答装置の構成を示した図である。な
お、上記実施の形態１と同様の構成要素については、同
じ符号を付けて説明を省略する。２３は、テンプレート
５内の文または句の詳細説明が記憶されている詳細説明
テンプレートであり、２２は、テンプレート５内の通常
文の単語スロットに挿入された単語音声データベース４
の単語音声を抜きだし、当該通常文に対応した詳細説明
テンプレート２３内の詳細説明文を読みだし、詳細説明
文の単語スロットに先の単語音声データベース４の単語
音声を挿入して詳細説明文の合成音声８を生成するため
のテンプレート変更部である。

【００６８】次に動作について説明する。音声合成部１
Ｊでは編集合成に基づいた音声合成を行う。入力系列２
の形式、及び、入力系列２から合成音声８を得るまでの
動作は実施の形態１と同様である。次にユーザが音声を
聞き逃したり、不明瞭であったことから再度聞きたい場
合について説明する。その際にユーザは音声応答装置に
対して聞き直したいことを示すコマンド入力６を与え
る。コマンド入力６の形式は実施の形態１と同様であ
る。韻律境界検出部７は、コマンド入力６を受けた合成
音声８における時点を特定し、合成音声８の出力を停止
する。そしてその時点から合成音声８を逆時間方向に遡
り、韻律境界を検出し、そこを合成音声８の再出力時点
とする。検出される韻律境界は、実施の形態１と同様と
する。この韻律境界から再度合成音声８を提示する。

【００６９】この時、もしテンプレート５の文または句
の内容が判りにくかったり、簡潔すぎたりしてユーザに
判りにくい場合を想定して、通常のテンプレート５に対
応する詳細説明テンプレート２３が用意されている。詳
細説明テンプレート２３は、通常のテンプレート５と同
じ内容だが、より詳細な内容が記述されているため、音
声データとしては比較的大きな容量であり、予備的に用
意されているものとする。そして通常のテンプレート５
の単語スロットと対応ポイントが記録された単語スロッ
トを有している。テンプレート変更部２２は、通常文の
テンプレート５の単語スロットに挿入された単語音声デ
ータベース４内の単語音声を抜きだし、当該テンプレー
ト５に対応した詳細説明テンプレート２３を読みだし、
その単語スロットに先の単語音声データベース４の単語
音声を挿入して詳細説明文の合成音声８を生成する。こ
うして再提示音声をより詳細に提示することができる。

【００７０】なお、韻律境界の例として、ポーズ（無
音）の位置を例に挙げたが、その場合に限らず、ピッチ
（声の高さ）のアクセントの強さが所定の閾値を越えた
箇所を求め、その位置を含む文節音声の先頭を韻律境界
としてもよい。また、韻律境界の他の例としては、母音
中心の振幅の大きさがある閾値を越えた箇所を求め、そ
の位置を含む文節音声の先頭としてもよく、さらに、ピ
ッチの推定結果から得られる、ピッチパターンにおける
フレーズ成分の立て直し位置としてもよい。

【００７１】本実施の形態によれば、このような構成を
とることにより、通常文が記憶されているテンプレート
５と単語スロットの対応ポイントが記録されている詳細
説明文が記憶されている詳細説明テンプレート２２を備
え、合成音声の再提示要求を受けたら、前記再提示時点
まで遡り、前回の通常文テンプレートに埋め込まれた単
語を詳細説明テンプレートに埋め込んだ詳細説明文によ
る、より詳細な合成音声の提示を行うことを可能とし、
ユーザに意図をより明確に伝える再提示が可能となる。

【００７２】なお、テンプレート変更部２２は、特定の
テンプレートに対してのコマンド入力が所定の定数を越
える場合、あらかじめ記憶されている通常のテンプレー
ト５内の当該テンプレートと詳細説明テンプレート２３
内の詳細説明テンプレートとを変更するようにしてもよ
い。

【００７３】実施の形態１０.図１０は本発明の実施の
形態１０における音声応答装置の構成を示すものであ
る。なお、上記実施の形態１と同様の構成要素について
は、同じ符号を付けて説明を省略する。異聴マトリクス
２５は、聞き間違い易い音節の組みが記述されている。
また、類義語音声データ２６は、類義語辞書とその音声
データとを記憶している。類義語変換部２４は、再提示
される音声データ中の単語について、異聴マトリクス２
５を参照して、単語が異聴マトリクス２５に存在する音
声を含む場合、類義語音声データ２６から類義語候補を
選択してキーワードを別の単語に置き換えた合成音声８
を生成する。

【００７４】次に動作について説明する。音声合成部１
Ｊでは編集合成に基づいた音声合成を行う。入力系列２
の形式、及び入力系列２から合成音声８を得るまでの動
作は実施の形態１と同様である。次にユーザが音声を聞
き逃したり、不明瞭であったことから再度聞きたい場合
について説明する。その際にユーザは音声応答装置に対
して聞き直したいことを示すコマンド入力６を与える。
コマンド入力６の形式は実施の形態１と同様である。韻
律境界検出部７は、コマンド入力６を受けた合成音声８
における時点を特定し、合成音声８の出力を停止する。
そしてその時点から合成音声８を逆時間方向に遡り、韻
律境界を検出し、そこを合成音声８の再出力時点とす
る。検出される韻律境界は、実施の形態１と同様とす
る。この韻律境界から再度合成音声８を提示する。

【００７５】異聴マトリクス２５は聞き間違い易い音節
の組みが記述されている。例えば、／ｍｅｍ／と／ｎｅ
ｍ／、／ｓｈｉｓ／と／ｈｉｓ／など、２つの音節の組
みを列挙する形式で記述されている。類義語変換部２４
は再提示される音声データ中のキーワード、すなわち単
語スロットに挿入される単語音声データベース４内の単
語音声について、異聴マトリクス２５を参照する。この
時、各単語音声データベース４の単語音声に読みのデー
タが添付されており、それをキーとして異聴マトリクス
２５中に聞き間違い易い音節の組が存在するか否かを調
べる。異聴マトリクス２５に存在しない場合はそのまま
合成音声８を提示する。しかし、異聴マトリクス２５中
に存在する場合は、類義語音声データ２６を参照する。
類義語音声データ２６は類義語辞書と音声データからな
り、キーワードに対応する類義語候補を選択して類義語
音声を読み出す。そしてキーワードを類義語に置き換え
てテンプレート５に挿入した合成音声８を生成し、提示
する。

【００７６】本実施の形態によれば、このような構成を
とることにより、聞き間違い易い音節の組みを記述した
異聴マトリックスを備え、合成音の再提示要求を受けた
ら、前記再提示時点まで遡り、再提示区間のキーワード
が異聴マトリックスに記述される音声を含む場合、類義
語候補を選択してキーワードを別の単語あるいは単語列
に変更して合成音声を作成し、提示を行うことを可能と
し、ユーザに意図をより明確に伝える再提示が可能とな
る。

【００７７】なお、類義語変更部２４は、特定のキーワ
ードに対してのコマンド入力が一定数を越える場合、あ
らかじめ記憶されている単語音声データと類義語音声デ
ータとを変更するようにしてもよい。

【００７８】また、異聴マトリックス２５は、ユーザか
らの応答の基に、聞き間違いの累積頻度を統計的にまと
めて、更新するようにしてもよい。

【００７９】また、韻律境界の例として、本実施の形態
においては実施の形態１と同様に、ポーズ（無音）の位
置を例に挙げたが、その場合に限らず、ピッチ（声の高
さ）のアクセントの強さが所定の閾値を越えた箇所を求
め、その位置を含む文節音声の先頭を韻律境界としても
よい。また、韻律境界の他の例としては、母音中心の振
幅の大きさがある閾値を越えた箇所を求め、その位置を
含む文節音声の先頭としてもよく、さらに、ピッチの推
定結果から得られる、ピッチパターンにおけるフレーズ
成分の立て直し位置としてもよい。

【００８０】尚、上記の実施の形態１〜１０におけるコ
マンド入力６は、プッシュホンのキー入力で行う例につ
いて説明したが、その場合に限らず、音声認識技術を利
用してユーザからの特定語発話の認識結果を用いるよう
にしてもよい。

【００８１】

【発明の効果】この発明は、入力データ系列に対応する
合成音声を生成して出力する音声合成手段と、合成音声
の再出力要求を外部から受信するコマンド受信手段と、
コマンド受信手段が再出力要求を受信した時点から入力
データ系列及び合成音声のいずれか一方を逆時間方向に
遡って意味的な文の切れ目を検出するための再出力開始
時点検出手段とを備え、意味的な文の切れ目から合成音
声を再出力するようにしたので、ユーザが合成音声の聞
き直しを行う場合に、柔軟かつユーザにわかりやすい合
成音声の再提示が可能になるという効果を奏する。

【００８２】また、再出力開始時点検出手段が、韻律境
界を検出するための韻律境界検出部から構成されている
ので、呼気段落の先頭等の韻律境界から合成音声の再出
力を行うことができ、ユーザに対し必要かつ十分な合成
音声の再提示を行うことができる。

【００８３】また、再出力開始時点検出手段が、意味的
な言語境界を検出するための言語境界検出部から構成さ
れているので、テキスト上の意味的なまとまりを合成音
声の再出力開始時点とすることができ、ユーザに対し必
要かつ十分な合成音声の再提示を行うことができる。

【００８４】また、合成音声内の重要度の低い語群を削
除するための読み飛ばし手段をさらに備え、合成音声を
再出力する際には重要度の低い語群については読み飛ば
しを行って重要な語群のみを再出力するようにしたの
で、ユーザに対してわかり易く、かつ、効率的な再提示
が可能となる。

【００８５】また、合成音声の話速を変更するための話
速変更手段をさらに備え、合成音声を再出力する際には
発話速度を遅くして再提示を行うようにしたので、ユー
ザに対してわかりやすく聞き取り易い再提示を行うこと
ができる。

【００８６】また、合成音声のピッチを変更するための
ピッチ変更手段をさらに備え、合成音声を再出力する際
にはピッチを変更して聞き取りやすい声の高さにして再
提示を行うようにしたので、ユーザに対しわかりやすい
再提示を行うことができる。

【００８７】また、合成音声内の文節単位の語順の変更
を行うための語順変更手段をさらに備え、合成音声を再
出力する際には語順を変更して行うようにして、例え
ば、重要度の高い文節が先頭にくるように語順を変更し
て再提示を行うよにしたので、ユーザに対しわかりやす
く効率的な再提示を行うことができる。

【００８８】また、類似語を記憶している類似語辞書手
段と、類似語辞書手段の類似語を参照して、合成音声内
の単語を他の類似語に変更するための類似語変更手段と
をさらに備え、合成音声を再出力する際には、合成音声
内の単語を他の類似語に変更して行うようにしたので、
耳慣れないまたは難解な単語を他の類似語に変更して再
提示されるので、ユーザに対しわかりやすく、かつ、柔
軟な再提示を行うことができる。

【００８９】また、単語に対応する説明文を記憶してい
る説明文用辞書手段と、説明文用辞書手段を参照して、
合成音声内の単語に対応する説明文を生成して、合成音
声内に挿入するための説明文生成手段をさらに備え、合
成音声を再出力する際には合成音声内の耳慣れないまた
は難解な単語に対する説明文を追加して行うようにした
ので、ユーザに対しわかりやすく意図を明確に伝えるこ
とができる再提示を行うことができる。

【００９０】また、通常文のテンプレートを記憶してい
るテンプレート手段と、通常文をより詳細に説明した詳
細説明テンプレートを記憶している詳細説明テンプレー
ト手段と、通常文のテンプレートおよび詳細説明テンプ
レート内に挿入するための単語を記憶している単語音声
データベース手段とを備え、合成音声を最初に出力する
際には通常文のテンプレートで行い、再出力する際には
詳細説明テンプレートで行うようにしたので、ユーザに
意図を明確に伝える再提示が可能になる。

【００９１】また、聞き間違い易い音節の組を記憶して
いる異聴マトリクス手段と、類義語音声データを記憶し
ている類義語音声データベース手段と、異聴マトリクス
手段を参照して、合成音声内の単語が上記異聴マトリク
スに存在する音声を含んでいる場合に、類義語音声デー
タベースから類義語を選択して、単語を他の類義語に変
換するための類義語変換部とを備えているので、ユーザ
が聞き間違えることのないわかりやすい再提示を行うこ
とができる。

【図面の簡単な説明】

【図１】本発明の実施の形態１における音声応答装置
の構成を示すブロック図である。

【図２】本発明の実施の形態２における音声応答装置
の構成を示すブロック図である。

【図３】本発明の実施の形態３における音声応答装置
の構成を示すブロック図である。

【図４】本発明の実施の形態４における音声応答装置
の構成を示すブロック図である。

【図５】本発明の実施の形態５における音声応答装置
の構成を示すブロック図である。

【図６】本発明の実施の形態６における音声応答装置
の構成を示すブロック図である。

【図７】本発明の実施の形態７における音声応答装置
の構成を示すブロック図である。

【図８】本発明の実施の形態８における音声応答装置
の構成を示すブロック図である。

【図９】本発明の実施の形態９における音声応答装置
の構成を示すブロック図である。

【図１０】本発明の実施の形態１０における音声応答
装置の構成を示すブロック図である。

【図１１】従来の音声応答装置の構成を示すブロック
図である。

【符号の説明】

１，１Ａ，１Ｂ，１Ｃ，１Ｄ，１Ｅ，１Ｆ，１Ｇ，１
Ｈ，１Ｊ音声合成部、２，２Ａ入力系列、３波形
編集部、４単語音声データベース、５テンプレー
ト、６コマンド入力、７韻律境界検出部、８合成
音声、９巻き戻し地点検出部、１０再入力系列、１
１音声素片データベース、１２パラメータ生成部、
１３波形生成部、１４読み飛ばし部、１５話速変
更部、１６ピッチ変更部、１７語順変更部、１８キ
ーワード変更部、１９類似語辞書、２０説明文生成
部、２１説明文用辞書、２２テンプレート変更部、
２３詳細説明テンプレート、２４類義語変換部、２５
異聴マトリクス、２６類義語音声データ、５７音声
認識部、５８音声応答部、５９会話制御部、６０
タスクインターフェース部。

Claims

【特許請求の範囲】

【請求項１】入力データ系列に対応する合成音声を生
成して出力する音声合成手段と、上記合成音声の再出力要求を外部から受信するコマンド
受信手段と、上記コマンド受信手段が上記再出力要求を受信した時点
から上記入力データ系列及び上記合成音声のいずれか一
方を逆時間方向に遡って意味的な切れ目を検出するため
の再出力開始時点検出手段と、を備え、上記意味的な切れ目から上記合成音声を再出力すること
を特徴とする音声応答装置。
【請求項２】上記再出力開始時点検出手段が、韻律境
界を検出するための韻律境界検出部から構成されている
ことを特徴とする請求項１記載の音声応答装置。
【請求項３】上記再出力開始時点検出手段が、意味的
な言語境界を検出するための言語境界検出部から構成さ
れていることを特徴とする請求項１記載の音声応答装
置。
【請求項４】上記合成音声内の重要度の低い語群を削
除するための読み飛ばし手段をさらに備え、上記合成音声を再出力する際には重要度の低い語群につ
いては省略して再出力を行うことを特徴とする請求項１
ないし３のいずれかに記載の音声応答装置。
【請求項５】上記合成音声の話速を変更するための話
速変更手段をさらに備え、上記合成音声を再出力する際には話速を変更して行うこ
とを特徴とする請求項１ないし４のいずれかに記載の音
声応答装置。
【請求項６】上記合成音声のピッチを変更するための
ピッチ変更手段をさらに備え、上記合成音声を再出力する際にはピッチを変更して行う
ことを特徴とする請求項１ないし５のいずれかに記載の
音声応答装置。
【請求項７】上記合成音声内の文節単位の語順の変更
を行うための語順変更手段をさらに備え、上記合成音声を再出力する際には語順を変更して行うこ
とを特徴とする請求項１ないし６のいずれかに記載の音
声応答装置。
【請求項８】類似語を記憶している類似語辞書手段
と、上記類似語辞書手段の類似語を参照して、上記合成音声
内の単語を他の類似語に変更するための類似語変更手段
とをさらに備え、上記合成音声を再出力する際には、上記合成音声内の単
語を他の類似語に変更して行うことを特徴とする請求項
１ないし７のいずれかに記載の音声応答装置。
【請求項９】単語に対応する説明文を記憶している説
明文用辞書手段と、上記説明文用辞書手段を参照して、上記合成音声内の単
語に対応する説明文を生成して、上記合成音声内に挿入
するための説明文生成手段をさらに備え、上記合成音声を再出力する際には上記合成音声内の単語
に対する説明文を追加して行うことを特徴とする請求項
１ないし８のいずれかに記載の音声応答装置。
【請求項１０】通常文のテンプレートを記憶している
テンプレート手段と、上記通常文をより詳細に説明した詳細説明テンプレート
を記憶している詳細説明テンプレート手段と、上記通常文のテンプレートおよび上記詳細説明テンプレ
ート内に挿入するための単語を記憶している単語音声デ
ータベース手段とを備え、上記合成音声を最初に出力する際には上記通常文のテン
プレートで行い、再出力する際には上記詳細説明テンプ
レートで行うことを特徴とする請求項１ないし９のいず
れかに記載の音声応答装置。
【請求項１１】聞き間違い易い音節の組を記憶してい
る異聴マトリクス手段と、類義語音声データを記憶している類義語音声データベー
ス手段と、上記異聴マトリクス手段を参照して、上記合成音声内の
単語が上記異聴マトリクスに存在する音声を含んでいる
場合に、上記類義語音声データベースから類義語を選択
して、上記単語を他の類義語に変換するための類義語変
換部とを備えたことを特徴とする請求項１ないし１０の
いずれかに記載の音声応答装置。