JP2000267687A - 音声応答装置 - Google Patents
音声応答装置Info
- Publication number
- JP2000267687A JP2000267687A JP11075541A JP7554199A JP2000267687A JP 2000267687 A JP2000267687 A JP 2000267687A JP 11075541 A JP11075541 A JP 11075541A JP 7554199 A JP7554199 A JP 7554199A JP 2000267687 A JP2000267687 A JP 2000267687A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech
- word
- synthesized
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 合成音声の再提示要求がなされたときに、要
求を受けた時点から逆時間方向に遡って意味的な文の切
れ目を検出し、そこを合成音声の再提示開始時点として
再提示を行う音声応答装置を得る。 【解決手段】 波形編集部3は、入力系列2に対応する
データを単語音声データベース4及びテンプレート5か
ら呼び出し、単語音声データベース4内の単語とテンプ
レート5内の文または句とを接続して文長または文章長
の合成音声8を生成する。ユーザが聞き直しをしたい場
合には、コマンド入力6を与える。コマンド入力6を受
信すると、韻律境界検出部7は、受信した時点から合成
音声8を逆時間方向に遡って韻律境界を検出し、そこか
ら合成音声8の再提示を開始する。
求を受けた時点から逆時間方向に遡って意味的な文の切
れ目を検出し、そこを合成音声の再提示開始時点として
再提示を行う音声応答装置を得る。 【解決手段】 波形編集部3は、入力系列2に対応する
データを単語音声データベース4及びテンプレート5か
ら呼び出し、単語音声データベース4内の単語とテンプ
レート5内の文または句とを接続して文長または文章長
の合成音声8を生成する。ユーザが聞き直しをしたい場
合には、コマンド入力6を与える。コマンド入力6を受
信すると、韻律境界検出部7は、受信した時点から合成
音声8を逆時間方向に遡って韻律境界を検出し、そこか
ら合成音声8の再提示を開始する。
Description
【0001】
【発明の属する技術分野】この発明は音声応答装置に関
し、特に、マン・マシン・インタフェース等のシステム
において音声による情報提供を行うための音声応答装置
に関するものである。
し、特に、マン・マシン・インタフェース等のシステム
において音声による情報提供を行うための音声応答装置
に関するものである。
【0002】
【従来の技術】音声合成技術は、マン・マシン・インタ
フェースの普及に伴い、情報提示手段として重要な技術
である。音声合成技術は、任意の文字列からなるテキス
トを音声に変換して提示する規則合成技術と、あらかじ
め断片的に蓄積された音声データを目的に応じて接続し
て固定の音声メッセージを生成する編集合成システムに
大別される。前者は電子メールの読み上げ、身障者向け
朗読器、新聞校閲、カーナビゲーションなどの用途に用
いられている。また後者は駅の構内アナウンスやハイウ
ェイラジオなどの大規模音声メッセージシステムへの適
用が活発に行われている。
フェースの普及に伴い、情報提示手段として重要な技術
である。音声合成技術は、任意の文字列からなるテキス
トを音声に変換して提示する規則合成技術と、あらかじ
め断片的に蓄積された音声データを目的に応じて接続し
て固定の音声メッセージを生成する編集合成システムに
大別される。前者は電子メールの読み上げ、身障者向け
朗読器、新聞校閲、カーナビゲーションなどの用途に用
いられている。また後者は駅の構内アナウンスやハイウ
ェイラジオなどの大規模音声メッセージシステムへの適
用が活発に行われている。
【0003】近年は電話回線を利用し、自動的に情報提
供や予約などの各種業務を機械が代行するCTIシステ
ムが注目されており、それへの音声合成技術の適用が期
待されている。CTIシステムにおいては音声による情
報提供やガイダンスは中枢となる部分であり、ここに音
声合成技術を利用することでオペレータの削減、24時
間業務化、及び、大量受け付けの可能など、低コストと
業務拡大の両面を目指すことができる。
供や予約などの各種業務を機械が代行するCTIシステ
ムが注目されており、それへの音声合成技術の適用が期
待されている。CTIシステムにおいては音声による情
報提供やガイダンスは中枢となる部分であり、ここに音
声合成技術を利用することでオペレータの削減、24時
間業務化、及び、大量受け付けの可能など、低コストと
業務拡大の両面を目指すことができる。
【0004】音声合成の利用で問題となるのが、情報の
揮発である。音声情報は一度聞き逃したら失われてしま
う為、聞き返す必要がある。人間が相手であればどこの
部分を聞き直したいかを早く理解することができ、又、
聞き手に応じて情報内容を変更して、よりわかり易い情
報提供に努めるなどの工夫を凝らすことができる。しか
し、現行のCTIシステムではそこまでを対象とするも
のはあまりない。
揮発である。音声情報は一度聞き逃したら失われてしま
う為、聞き返す必要がある。人間が相手であればどこの
部分を聞き直したいかを早く理解することができ、又、
聞き手に応じて情報内容を変更して、よりわかり易い情
報提供に努めるなどの工夫を凝らすことができる。しか
し、現行のCTIシステムではそこまでを対象とするも
のはあまりない。
【0005】その中で、ユーザの発声により音声情報伝
達のやり直しを行う方法が検討されている。図11は、
例えば特開昭62−40577号公報に示された従来の
音声応答装置の構成を示すブロック図である。図におい
て、57は利用者からの音声入力信号を認識するための
音声認識部、58はメッセージを語群毎に利用者に出力
するための音声応答部、59は音声認識部57及び音声
応答部58の制御を行うための会話制御部、60は会話
制御部59よりコマンドを受け取り一定の仕事を行い、
それによって得られる情報を会話制御部59に返すため
のタスクインターフェース部である。
達のやり直しを行う方法が検討されている。図11は、
例えば特開昭62−40577号公報に示された従来の
音声応答装置の構成を示すブロック図である。図におい
て、57は利用者からの音声入力信号を認識するための
音声認識部、58はメッセージを語群毎に利用者に出力
するための音声応答部、59は音声認識部57及び音声
応答部58の制御を行うための会話制御部、60は会話
制御部59よりコマンドを受け取り一定の仕事を行い、
それによって得られる情報を会話制御部59に返すため
のタスクインターフェース部である。
【0006】従来の音声応答装置は上記のように構成さ
れ、利用者から音声入力があると、音声認識部57はそ
れを認識し、会話制御部59へ割り込み信号を送出す
る。音声認識部57には、特定語を認識するための回路
が設けられており、例えば「えっ」とか「なんですっ
て」といった特定の音声入力があった場合には、特定語
が入力されたという情報を、そうでなければ特定語では
ないという情報を会話制御部59へ送信する。会話制御
部59は、割り込み信号の入力があった時点が音声検出
の時点であれば、音声応答部58へ割り込み信号を送出
し、音声を中断するコマンドを送る。また、音声入力が
特定語である場合は音声応答部58へ再合成命令を出
し、認識された音声入力が特定語でなければ、音声応答
部58へ中断解除命令を送る。音声応答部58は割り込
み信号を受けたら、出力中の語群の出力が終った時点で
音声出力の中断を行う。再合成命令が入力されると、音
声入力があった時点の語群から再びメッセージを合成
し、中断解除命令があった場合には次のメッセージから
音声出力する。
れ、利用者から音声入力があると、音声認識部57はそ
れを認識し、会話制御部59へ割り込み信号を送出す
る。音声認識部57には、特定語を認識するための回路
が設けられており、例えば「えっ」とか「なんですっ
て」といった特定の音声入力があった場合には、特定語
が入力されたという情報を、そうでなければ特定語では
ないという情報を会話制御部59へ送信する。会話制御
部59は、割り込み信号の入力があった時点が音声検出
の時点であれば、音声応答部58へ割り込み信号を送出
し、音声を中断するコマンドを送る。また、音声入力が
特定語である場合は音声応答部58へ再合成命令を出
し、認識された音声入力が特定語でなければ、音声応答
部58へ中断解除命令を送る。音声応答部58は割り込
み信号を受けたら、出力中の語群の出力が終った時点で
音声出力の中断を行う。再合成命令が入力されると、音
声入力があった時点の語群から再びメッセージを合成
し、中断解除命令があった場合には次のメッセージから
音声出力する。
【0007】
【発明が解決しようとする課題】従来の音声応答装置で
は、上述したように、簡単な認識手法を用いることでユ
ーザからの再提示要求を口頭から受け付けることがで
き、迅速な聞き直しが可能となるが、しかしながら、こ
の手法では聞き直しが常に音声入力がされた単語から開
始されることになり、それ以前の単語を聞き直したかっ
た場合には不十分であり、また当該単語が文脈に依存す
る場合は当該単語だけの提示では利用者の要求に対し不
十分である可能性が高いという問題点があった。
は、上述したように、簡単な認識手法を用いることでユ
ーザからの再提示要求を口頭から受け付けることがで
き、迅速な聞き直しが可能となるが、しかしながら、こ
の手法では聞き直しが常に音声入力がされた単語から開
始されることになり、それ以前の単語を聞き直したかっ
た場合には不十分であり、また当該単語が文脈に依存す
る場合は当該単語だけの提示では利用者の要求に対し不
十分である可能性が高いという問題点があった。
【0008】この発明は、かかる問題点を解決するため
になされたものであり、ユーザのコマンド指定による音
声提示の聞き直しの際には、意味的なまとまりの切れ目
を合成音声の再提示時点として再提示を行うことができ
る音声応答装置を提供することを目的としている。
になされたものであり、ユーザのコマンド指定による音
声提示の聞き直しの際には、意味的なまとまりの切れ目
を合成音声の再提示時点として再提示を行うことができ
る音声応答装置を提供することを目的としている。
【0009】
【課題を解決するための手段】この発明は、入力データ
系列に対応する合成音声を生成して出力する音声合成手
段と、合成音声の再出力要求を外部から受信するコマン
ド受信手段と、コマンド受信手段が再出力要求を受信し
た時点から入力データ系列及び合成音声のいずれか一方
を逆時間方向に遡って意味的な文の切れ目を検出するた
めの再出力開始時点検出手段とを備え、意味的な文の切
れ目から合成音声を再出力する音声応答装置である。
系列に対応する合成音声を生成して出力する音声合成手
段と、合成音声の再出力要求を外部から受信するコマン
ド受信手段と、コマンド受信手段が再出力要求を受信し
た時点から入力データ系列及び合成音声のいずれか一方
を逆時間方向に遡って意味的な文の切れ目を検出するた
めの再出力開始時点検出手段とを備え、意味的な文の切
れ目から合成音声を再出力する音声応答装置である。
【0010】また、再出力開始時点検出手段が、韻律境
界を検出するための韻律境界検出部から構成されてい
る。
界を検出するための韻律境界検出部から構成されてい
る。
【0011】また、再出力開始時点検出手段が、意味的
な言語境界を検出するための言語境界検出部から構成さ
れている。
な言語境界を検出するための言語境界検出部から構成さ
れている。
【0012】また、合成音声内の重要度の低い語群を削
除するための読み飛ばし手段をさらに備え、合成音声を
再出力する際には重要度の低い語群については省略して
再出力を行う。
除するための読み飛ばし手段をさらに備え、合成音声を
再出力する際には重要度の低い語群については省略して
再出力を行う。
【0013】また、合成音声の話速を変更するための話
速変更手段をさらに備え、合成音声を再出力する際には
話速を変更して行う。
速変更手段をさらに備え、合成音声を再出力する際には
話速を変更して行う。
【0014】また、合成音声のピッチを変更するための
ピッチ変更手段をさらに備え、合成音声を再出力する際
にはピッチを変更して行う。
ピッチ変更手段をさらに備え、合成音声を再出力する際
にはピッチを変更して行う。
【0015】また、合成音声内の文節単位の語順の変更
を行うための語順変更手段をさらに備え、合成音声を再
出力する際には語順を変更して行う。
を行うための語順変更手段をさらに備え、合成音声を再
出力する際には語順を変更して行う。
【0016】また、類似語を記憶している類似語辞書手
段と、類似語辞書手段の類似語を参照して、合成音声内
の単語を他の類似語に変更するための類似語変更手段と
をさらに備え、合成音声を再出力する際には、合成音声
内の単語を他の類似語に変更して行う。
段と、類似語辞書手段の類似語を参照して、合成音声内
の単語を他の類似語に変更するための類似語変更手段と
をさらに備え、合成音声を再出力する際には、合成音声
内の単語を他の類似語に変更して行う。
【0017】また、単語に対応する説明文を記憶してい
る説明文用辞書手段と、説明文用辞書手段を参照して、
合成音声内の単語に対応する説明文を生成して、合成音
声内に挿入するための説明文生成手段をさらに備え、合
成音声を再出力する際には合成音声内の単語に対する説
明文を追加して行う。
る説明文用辞書手段と、説明文用辞書手段を参照して、
合成音声内の単語に対応する説明文を生成して、合成音
声内に挿入するための説明文生成手段をさらに備え、合
成音声を再出力する際には合成音声内の単語に対する説
明文を追加して行う。
【0018】また、通常文のテンプレートを記憶してい
るテンプレート手段と、通常文をより詳細に説明した詳
細説明テンプレートを記憶している詳細説明テンプレー
ト手段と、通常文のテンプレートおよび詳細説明テンプ
レート内に挿入するための単語を記憶している単語音声
データベース手段とを備え、合成音声を最初に出力する
際には通常文のテンプレートで行い、再出力する際には
詳細説明テンプレートで行う。
るテンプレート手段と、通常文をより詳細に説明した詳
細説明テンプレートを記憶している詳細説明テンプレー
ト手段と、通常文のテンプレートおよび詳細説明テンプ
レート内に挿入するための単語を記憶している単語音声
データベース手段とを備え、合成音声を最初に出力する
際には通常文のテンプレートで行い、再出力する際には
詳細説明テンプレートで行う。
【0019】また、聞き間違い易い音節の組を記憶して
いる異聴マトリクス手段と、類義語音声データを記憶し
ている類義語音声データベース手段と、異聴マトリクス
手段を参照して、合成音声内の単語が上記異聴マトリク
スに存在する音声を含んでいる場合に、類義語音声デー
タベースから類義語を選択して、単語を他の類義語に変
換するための類義語変換部とを備えている。
いる異聴マトリクス手段と、類義語音声データを記憶し
ている類義語音声データベース手段と、異聴マトリクス
手段を参照して、合成音声内の単語が上記異聴マトリク
スに存在する音声を含んでいる場合に、類義語音声デー
タベースから類義語を選択して、単語を他の類義語に変
換するための類義語変換部とを備えている。
【0020】
【発明の実施の形態】実施の形態1.図1は、本発明の
実施の形態1における音声応答装置の構成を示したもの
である。図において、1は音声合成部であり、入力系列
2に対する合成音声8を編集合成に基づいた音声合成に
より生成し出力するものである。4は、単語単位の音片
データを保持している単語音声データベースである。5
は、文または句型の音片データを記憶しているテンプレ
ートである。3は、単語音声データベース4内の単語と
テンプレート5内の文または句を接続させて合成音声8
を生成するための波形編集部である。7は、コマンド入
力6により合成音声8の再提示要求を受けた時に、その
時点から合成音声8を逆時間方向に遡り、後述する韻律
境界を再提示時点として検出するための韻律境界検出部
である。
実施の形態1における音声応答装置の構成を示したもの
である。図において、1は音声合成部であり、入力系列
2に対する合成音声8を編集合成に基づいた音声合成に
より生成し出力するものである。4は、単語単位の音片
データを保持している単語音声データベースである。5
は、文または句型の音片データを記憶しているテンプレ
ートである。3は、単語音声データベース4内の単語と
テンプレート5内の文または句を接続させて合成音声8
を生成するための波形編集部である。7は、コマンド入
力6により合成音声8の再提示要求を受けた時に、その
時点から合成音声8を逆時間方向に遡り、後述する韻律
境界を再提示時点として検出するための韻律境界検出部
である。
【0021】次に動作について説明する。まず、一般的
な編集合成の動作を説明する。入力系列2は、接続する
音声データの番号の系列からなるものである。波形編集
部3は、入力系列2に対応するデータを単語音声データ
ベース4またはテンプレート5の中から呼び出す。単語
音声データベース4及びテンプレート5は同一話者から
収集された音声波形により構成される音片データを記憶
している。テンプレート5は文または句型の音片データ
であり、用途及び目的や情報提示の状況に応じて大量の
文型が用意されている。テンプレート5の幾つかは単語
の部分の入れ替えが可能となるように穴空き(以下、単
語スロットとする)となっており、それらの単語スロッ
トに、単語音声データベース4内の単語単位の音片デー
タを埋めるようになっている。あるいは、単語音声デー
タベース4内の単語同士を直接接続して文や文節を生成
する場合もある。このようにして、波形編集部3では、
単語音声データベース4内の単語とテンプレート5内の
文または句とを接続して合成音声8を得る。このとき、
接続音片データ間の不連続性を除く為に、PSOLA手
法によりピッチを変更したり、または、音片間の補間を
行ったりするようにしてもよい。このようにして得られ
た文長または文章長の音声データを合成音声8として出
力する。
な編集合成の動作を説明する。入力系列2は、接続する
音声データの番号の系列からなるものである。波形編集
部3は、入力系列2に対応するデータを単語音声データ
ベース4またはテンプレート5の中から呼び出す。単語
音声データベース4及びテンプレート5は同一話者から
収集された音声波形により構成される音片データを記憶
している。テンプレート5は文または句型の音片データ
であり、用途及び目的や情報提示の状況に応じて大量の
文型が用意されている。テンプレート5の幾つかは単語
の部分の入れ替えが可能となるように穴空き(以下、単
語スロットとする)となっており、それらの単語スロッ
トに、単語音声データベース4内の単語単位の音片デー
タを埋めるようになっている。あるいは、単語音声デー
タベース4内の単語同士を直接接続して文や文節を生成
する場合もある。このようにして、波形編集部3では、
単語音声データベース4内の単語とテンプレート5内の
文または句とを接続して合成音声8を得る。このとき、
接続音片データ間の不連続性を除く為に、PSOLA手
法によりピッチを変更したり、または、音片間の補間を
行ったりするようにしてもよい。このようにして得られ
た文長または文章長の音声データを合成音声8として出
力する。
【0022】次にユーザ(利用者)が音声を聞き逃した
り、不明瞭であったことから再度聞きたい場合を想定し
て説明する。その際にユーザは音声応答装置に対して聞
き直したいことを示すコマンド入力6を与える。コマン
ド入力6の例としては、電話を通じての音声応答の場合
のプッシュホンキー入力がある。韻律境界検出部7は、
コマンド入力6を受けた時点が出力中の合成音声8にお
けるいずれの時点であるかを特定するとともに、合成音
声8の出力を停止する。そしてその時点から合成音声8
を逆時間方向に遡り、韻律境界を検出し、そこを合成音
声8の再出力時点とする。韻律境界の例としては、呼気
段落の先頭であるポーズ(無音)が考えられる。ポーズは
コマンド入力6を受けた時点から逆時間方向へ見て、音
声波形の振幅が所定の閾値を下回った時点と考えられ
る。ただし、ポーズ(無音)には単なる促音中における
休止から、意味的な切れ目としての休止、息継ぎの為の
休止まで様々である。ここでは意味的な切れ目を韻律境
界と考えたいので、休止時間か否かの判定を行う必要が
ある。すなわち、音声振幅が閾値を連続して下回り、且
つ、その時間が一定尺度連続して存在すれば、呼気段落
の先頭と判定する。そして、この韻律境界から再度合成
音声8を提示する。
り、不明瞭であったことから再度聞きたい場合を想定し
て説明する。その際にユーザは音声応答装置に対して聞
き直したいことを示すコマンド入力6を与える。コマン
ド入力6の例としては、電話を通じての音声応答の場合
のプッシュホンキー入力がある。韻律境界検出部7は、
コマンド入力6を受けた時点が出力中の合成音声8にお
けるいずれの時点であるかを特定するとともに、合成音
声8の出力を停止する。そしてその時点から合成音声8
を逆時間方向に遡り、韻律境界を検出し、そこを合成音
声8の再出力時点とする。韻律境界の例としては、呼気
段落の先頭であるポーズ(無音)が考えられる。ポーズは
コマンド入力6を受けた時点から逆時間方向へ見て、音
声波形の振幅が所定の閾値を下回った時点と考えられ
る。ただし、ポーズ(無音)には単なる促音中における
休止から、意味的な切れ目としての休止、息継ぎの為の
休止まで様々である。ここでは意味的な切れ目を韻律境
界と考えたいので、休止時間か否かの判定を行う必要が
ある。すなわち、音声振幅が閾値を連続して下回り、且
つ、その時間が一定尺度連続して存在すれば、呼気段落
の先頭と判定する。そして、この韻律境界から再度合成
音声8を提示する。
【0023】ここで、本実施の形態においては、波形編
集部3、単語音声データベース4及びテンプレート5
が、合成音声を生成して外部に出力するための音声合成
手段を構成しており、韻律境界検出部7が、合成音声の
再出力要求を外部から受信するコマンド受信手段と、コ
マンド受信手段が再出力要求を受信した時点から逆時間
方向に遡って意味的な文の切れ目を検出するための再出
力開始時点検出手段とを構成している。
集部3、単語音声データベース4及びテンプレート5
が、合成音声を生成して外部に出力するための音声合成
手段を構成しており、韻律境界検出部7が、合成音声の
再出力要求を外部から受信するコマンド受信手段と、コ
マンド受信手段が再出力要求を受信した時点から逆時間
方向に遡って意味的な文の切れ目を検出するための再出
力開始時点検出手段とを構成している。
【0024】本実施の形態によれば、このような構成を
とることにより、合成音声8の再提示要求を受けたら、
その時点から時間逆方向に合成音声8を遡り、韻律境界
を再提示時点として検出する韻律境界検出部7を備える
ようにしたので、合成音声8の再提示時点の自動検出を
行うことを可能とし、柔軟且つユーザにわかり易い再提
示が可能となる。
とることにより、合成音声8の再提示要求を受けたら、
その時点から時間逆方向に合成音声8を遡り、韻律境界
を再提示時点として検出する韻律境界検出部7を備える
ようにしたので、合成音声8の再提示時点の自動検出を
行うことを可能とし、柔軟且つユーザにわかり易い再提
示が可能となる。
【0025】なお、韻律境界の例として、ポーズ(無
音)の位置を検出する例を挙げたが、その場合に限ら
ず、ピッチ(声の高さ)のアクセントの強さが所定の閾
値を越えた箇所を求め、その位置を含む文節音声の先頭
を韻律境界としてもよい。また、韻律境界の他の例とし
ては、母音中心の振幅の大きさがある閾値を越えた箇所
を求め、その位置を含む文節音声の先頭を韻律境界とし
てもよく、さらには、ピッチの推定結果から得られる、
ピッチパターンにおけるフレーズ成分の立て直し位置を
韻律境界としてもよい。
音)の位置を検出する例を挙げたが、その場合に限ら
ず、ピッチ(声の高さ)のアクセントの強さが所定の閾
値を越えた箇所を求め、その位置を含む文節音声の先頭
を韻律境界としてもよい。また、韻律境界の他の例とし
ては、母音中心の振幅の大きさがある閾値を越えた箇所
を求め、その位置を含む文節音声の先頭を韻律境界とし
てもよく、さらには、ピッチの推定結果から得られる、
ピッチパターンにおけるフレーズ成分の立て直し位置を
韻律境界としてもよい。
【0026】実施の形態2.図2は、本発明の実施の形
態2における音声応答装置の構成を示したものである。
1Aは音声合成部であり、入力系列2Aに対する合成音
声8を規則合成に基づいた音声合成により生成し出力す
るものである。9は、コマンド入力6を受けた時点から
入力系列2Aの意味的な言語境界まで遡って、それを検
出するための巻き戻し地点検出部である。10は再入力
系列であり、11は音声合成用の素片を記憶している音
声素片データベースである。12は、入力系列2Aまた
は再入力系列10に対応した音声素片を音声素片データ
ベース11から読み出し、音声合成に用いるパラメータ
を出力するためのパラメータ生成部である。13は、パ
ラメータ生成部12により生成されたパラメータを基に
音声合成するための波形生成部である。
態2における音声応答装置の構成を示したものである。
1Aは音声合成部であり、入力系列2Aに対する合成音
声8を規則合成に基づいた音声合成により生成し出力す
るものである。9は、コマンド入力6を受けた時点から
入力系列2Aの意味的な言語境界まで遡って、それを検
出するための巻き戻し地点検出部である。10は再入力
系列であり、11は音声合成用の素片を記憶している音
声素片データベースである。12は、入力系列2Aまた
は再入力系列10に対応した音声素片を音声素片データ
ベース11から読み出し、音声合成に用いるパラメータ
を出力するためのパラメータ生成部である。13は、パ
ラメータ生成部12により生成されたパラメータを基に
音声合成するための波形生成部である。
【0027】次に動作について説明する。まずはじめ
に、一般的な規則合成の動作について説明する。入力系
列2Aは、読み上げられるテキストの言語的情報からな
り、それはテキストの読み、品詞、係り受け、およびア
クセント型などの韻律情報からなる。音声素片データベ
ース11内の音声素片は、VCV(母音−子音−母音)、
または、CV(子音−母音)などの単位からなり、それぞ
れの音韻を示すパラメータに関する情報がフレーム毎に
記憶されている。パラメータの種類は、音声の声道特性
成分を圧縮した特徴量であるLSPやメルケプストラム
などの音響パラメータか、音声波形そのものである。音
声素片の記述例としては、フレーム毎に音響パラメータ
を記憶する形式や、ベクトル量子化手法における代表コ
ードの番号をフレーム毎に記憶する形式などが挙げられ
る。パラメータ生成部12は、入力系列2Aにおける読
みに対する音声素片を音声素片データベース11を参照
して音響パラメータを得る。そして入力系列2Aにおけ
るアクセント型などの韻律情報からピッチや音韻継続時
間長などの合成音声の韻律パラメータを決定する。波形
生成部13では、パラメータ生成部12で得たパラメー
タを基に合成音声8を生成する。波形生成部13での音
声合成手法は、音響パラメータから合成フィルタを構成
し、ピッチから駆動音源を求め、ボコーダ方式に基づき
合成音声8を生成する。
に、一般的な規則合成の動作について説明する。入力系
列2Aは、読み上げられるテキストの言語的情報からな
り、それはテキストの読み、品詞、係り受け、およびア
クセント型などの韻律情報からなる。音声素片データベ
ース11内の音声素片は、VCV(母音−子音−母音)、
または、CV(子音−母音)などの単位からなり、それぞ
れの音韻を示すパラメータに関する情報がフレーム毎に
記憶されている。パラメータの種類は、音声の声道特性
成分を圧縮した特徴量であるLSPやメルケプストラム
などの音響パラメータか、音声波形そのものである。音
声素片の記述例としては、フレーム毎に音響パラメータ
を記憶する形式や、ベクトル量子化手法における代表コ
ードの番号をフレーム毎に記憶する形式などが挙げられ
る。パラメータ生成部12は、入力系列2Aにおける読
みに対する音声素片を音声素片データベース11を参照
して音響パラメータを得る。そして入力系列2Aにおけ
るアクセント型などの韻律情報からピッチや音韻継続時
間長などの合成音声の韻律パラメータを決定する。波形
生成部13では、パラメータ生成部12で得たパラメー
タを基に合成音声8を生成する。波形生成部13での音
声合成手法は、音響パラメータから合成フィルタを構成
し、ピッチから駆動音源を求め、ボコーダ方式に基づき
合成音声8を生成する。
【0028】次にユーザが音声を聞き逃したり、不明瞭
であったことから再度聞きたい場合を想定して説明す
る。その際に、ユーザは音声応答装置に対して聞き直し
たいことを示すコマンド入力6を与える。コマンド入力
6の方法としては実施の形態1と同様とする。巻き戻し
地点検出部9は、コマンド入力6を受けた時点の入力系
列2Aを特定し、合成音声8の出力停止の命令をパラメ
ータ生成部12へ送る。入力系列2Aを逆時間方向に遡
り、入力系列2Aにおける意味的な言語境界を検出す
る。意味的な言語境界としては、文の開始時点、及び、
文節の係り受け関係から判定される木構造における右枝
分かれ境界があり、その中でコマンドが入力された時点
に最も近いものを検出する。そしてその時点を巻き戻し
時点とし、入力系列2Aを再入力系列10として、そこ
から再びパラメータ生成部12へ送信する。
であったことから再度聞きたい場合を想定して説明す
る。その際に、ユーザは音声応答装置に対して聞き直し
たいことを示すコマンド入力6を与える。コマンド入力
6の方法としては実施の形態1と同様とする。巻き戻し
地点検出部9は、コマンド入力6を受けた時点の入力系
列2Aを特定し、合成音声8の出力停止の命令をパラメ
ータ生成部12へ送る。入力系列2Aを逆時間方向に遡
り、入力系列2Aにおける意味的な言語境界を検出す
る。意味的な言語境界としては、文の開始時点、及び、
文節の係り受け関係から判定される木構造における右枝
分かれ境界があり、その中でコマンドが入力された時点
に最も近いものを検出する。そしてその時点を巻き戻し
時点とし、入力系列2Aを再入力系列10として、そこ
から再びパラメータ生成部12へ送信する。
【0029】ここで、本実施の形態においては、パラメ
ータ生成部12、音声素片データベース11及び波形生
成部13が、合成音声を生成して外部に出力するための
音声合成手段を構成しており、巻き戻し地点検出部9
が、合成音声の再出力要求を外部から受信するコマンド
受信手段と、コマンド受信手段が再出力要求を受信した
時点から逆時間方向に遡って意味的な文の切れ目を検出
するための再出力開始時点検出手段とを構成している。
ータ生成部12、音声素片データベース11及び波形生
成部13が、合成音声を生成して外部に出力するための
音声合成手段を構成しており、巻き戻し地点検出部9
が、合成音声の再出力要求を外部から受信するコマンド
受信手段と、コマンド受信手段が再出力要求を受信した
時点から逆時間方向に遡って意味的な文の切れ目を検出
するための再出力開始時点検出手段とを構成している。
【0030】本実施の形態によれば、このような構成を
とることにより、規則合成方式に基づく音声応答装置に
おいて、合成音声8の再提示要求を受けたら、その時点
から意味的な言語境界まで遡り、そこを再提示時点とし
て検出する巻き戻し地点検出部9を備え、合成音声8の
再提示時点の自動検出を行うことを可能とし、柔軟且つ
ユーザにわかり易い再提示が可能となる。
とることにより、規則合成方式に基づく音声応答装置に
おいて、合成音声8の再提示要求を受けたら、その時点
から意味的な言語境界まで遡り、そこを再提示時点とし
て検出する巻き戻し地点検出部9を備え、合成音声8の
再提示時点の自動検出を行うことを可能とし、柔軟且つ
ユーザにわかり易い再提示が可能となる。
【0031】実施の形態3.図3は、本発明の実施の形
態3における音声応答装置の構成を示したものである。
なお、図において、上記実施の形態2と同様の構成要素
については、同じ符号を付けてここでは説明を省略す
る。この実施の形態においては、巻き戻し地点検出部9
とパラメータ生成部12との間に読み飛ばし部14が設
けられている点が上記実施の形態2と異なる点である。
この読み飛ばし部14は、再入力系列10の中で重要度
の低い語群のパラメータの読み込みを省略し、読み飛ば
しを実行して合成音声8を生成するものである。
態3における音声応答装置の構成を示したものである。
なお、図において、上記実施の形態2と同様の構成要素
については、同じ符号を付けてここでは説明を省略す
る。この実施の形態においては、巻き戻し地点検出部9
とパラメータ生成部12との間に読み飛ばし部14が設
けられている点が上記実施の形態2と異なる点である。
この読み飛ばし部14は、再入力系列10の中で重要度
の低い語群のパラメータの読み込みを省略し、読み飛ば
しを実行して合成音声8を生成するものである。
【0032】次に動作について説明する。音声合成部1
Bでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び、入力系列2Aから合成音声8を得るま
での動作は実施の形態2と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際にユーザは音声応答装
置に対して聞き直したいことを示すコマンド入力6を与
える。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aの遡りを行う。そして入力系列2Aにおける意
味的な境界を検出し、そしてその時点を巻き戻し時点と
し、入力系列2Aを再入力系列10として、読み飛ばし
部14へ送信する。
Bでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び、入力系列2Aから合成音声8を得るま
での動作は実施の形態2と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際にユーザは音声応答装
置に対して聞き直したいことを示すコマンド入力6を与
える。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aの遡りを行う。そして入力系列2Aにおける意
味的な境界を検出し、そしてその時点を巻き戻し時点と
し、入力系列2Aを再入力系列10として、読み飛ばし
部14へ送信する。
【0033】読み飛ばし部14は再入力系列10の中で
重要度の低い語群の韻律情報の読み込みを省略し、読み
飛ばしを実行する。重要度の評価は、例えば、修飾語や
間投詞、助長語のスコアを下げ、自立語に高い得点を与
え、個々の単語毎に重要度を評価する方法が考えられ
る。パラメータ生成部12は、読み飛ばし部14で読み
飛ばし処理された再入力系列10Bが入力されると、音
声素片データベース11を参照し、音響パラメータを得
る。波形生成部13では、その音響パラメータから合成
フィルタを構成し、ピッチから駆動音源を求め、ボコー
ダ方式に基づき合成音声8を生成する。
重要度の低い語群の韻律情報の読み込みを省略し、読み
飛ばしを実行する。重要度の評価は、例えば、修飾語や
間投詞、助長語のスコアを下げ、自立語に高い得点を与
え、個々の単語毎に重要度を評価する方法が考えられ
る。パラメータ生成部12は、読み飛ばし部14で読み
飛ばし処理された再入力系列10Bが入力されると、音
声素片データベース11を参照し、音響パラメータを得
る。波形生成部13では、その音響パラメータから合成
フィルタを構成し、ピッチから駆動音源を求め、ボコー
ダ方式に基づき合成音声8を生成する。
【0034】本実施の形態によれば、このような構成を
とることにより、合成音声8の再提示要求を受けたら、
意味的な言語境界まで遡り、そこを再提示時点として合
成音声の再提示を行い、その間に読み飛ばし要求を受け
たら合成音の読み飛ばしを行い、ユーザにわかり易く且
つ効率的な再提示が可能となる。
とることにより、合成音声8の再提示要求を受けたら、
意味的な言語境界まで遡り、そこを再提示時点として合
成音声の再提示を行い、その間に読み飛ばし要求を受け
たら合成音の読み飛ばしを行い、ユーザにわかり易く且
つ効率的な再提示が可能となる。
【0035】尚、読み飛ばし部14に対するユーザの読
み飛ばし要求は、コマンド入力6と同様の方法で入力す
るようにしてもよく、また、特に入力を必要としない構
成にし再提示の際には自動的に読み飛ばしを行うように
してもよい。本実施の形態における読み飛ばし部14
は、ユーザの質問からの回答等、その時点で最も話題の
中心となる単語のスコアを最上位とし、対話を進めるに
つれてスコアを下げていくなど、重要度にユーザとの対
話の履歴を利用するようにしてもよい。
み飛ばし要求は、コマンド入力6と同様の方法で入力す
るようにしてもよく、また、特に入力を必要としない構
成にし再提示の際には自動的に読み飛ばしを行うように
してもよい。本実施の形態における読み飛ばし部14
は、ユーザの質問からの回答等、その時点で最も話題の
中心となる単語のスコアを最上位とし、対話を進めるに
つれてスコアを下げていくなど、重要度にユーザとの対
話の履歴を利用するようにしてもよい。
【0036】実施の形態4.図4は、本発明の実施の形
態4における音声応答装置の構成を示したものである。
なお、上記実施の形態2と同様の構成要素については、
同じ符号を付けて説明を省略する。15は、話速が遅く
なるように再入力系列10の韻律情報を変更して、パラ
メータ生成部12へ送るための話速変更部である。
態4における音声応答装置の構成を示したものである。
なお、上記実施の形態2と同様の構成要素については、
同じ符号を付けて説明を省略する。15は、話速が遅く
なるように再入力系列10の韻律情報を変更して、パラ
メータ生成部12へ送るための話速変更部である。
【0037】次に動作について説明する。音声合成部1
Cでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び、入力系列2Aから合成音声8を得るま
での動作は実施の形態2と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際に、ユーザは音声応答
装置に対して聞き直したいことを示すコマンド入力6を
与える。コマンド入力6の形式は実施の形態2と同様で
ある。巻き戻し地点検出部9は、コマンド入力6を受け
た入力系列2Aにおける時点を特定し、合成音声8の出
力停止の命令をパラメータ生成部12へ送る。そして入
力系列2Aを遡り、入力系列2Aにおける意味的な境界
を検出し、そしてその時点を巻き戻し時点とし、入力系
列2Aを再入力系列10として、話速変更部15へ送信
する。意味的な境界の検出は実施の形態2と同様とす
る。
Cでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び、入力系列2Aから合成音声8を得るま
での動作は実施の形態2と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際に、ユーザは音声応答
装置に対して聞き直したいことを示すコマンド入力6を
与える。コマンド入力6の形式は実施の形態2と同様で
ある。巻き戻し地点検出部9は、コマンド入力6を受け
た入力系列2Aにおける時点を特定し、合成音声8の出
力停止の命令をパラメータ生成部12へ送る。そして入
力系列2Aを遡り、入力系列2Aにおける意味的な境界
を検出し、そしてその時点を巻き戻し時点とし、入力系
列2Aを再入力系列10として、話速変更部15へ送信
する。意味的な境界の検出は実施の形態2と同様とす
る。
【0038】話速変更部15は再入力系列10の韻律情
報を前回提示時と異なるように変更する。ここでは再入
力系列10の時間長を伸長し、話速を遅くする。時間長
変更例としては、再入力系列10におけるモーラ速度を
0.8倍にする。これにより再入力系列区間においては
前回提示時より遅く音声提示ができ、よりユーザに判り
やすく提示することができる。パラメータ生成部12
は、話速変更部15で話速変更処理された再入力系列1
0Cが入力されると、音声素片データベース11を参照
し、音響パラメータを得る。波形生成部13では、それ
らの音響パラメータから合成フィルタを構成し、ピッチ
から駆動音源を求め、ボコーダ方式に基づき合成音声8
を生成する。
報を前回提示時と異なるように変更する。ここでは再入
力系列10の時間長を伸長し、話速を遅くする。時間長
変更例としては、再入力系列10におけるモーラ速度を
0.8倍にする。これにより再入力系列区間においては
前回提示時より遅く音声提示ができ、よりユーザに判り
やすく提示することができる。パラメータ生成部12
は、話速変更部15で話速変更処理された再入力系列1
0Cが入力されると、音声素片データベース11を参照
し、音響パラメータを得る。波形生成部13では、それ
らの音響パラメータから合成フィルタを構成し、ピッチ
から駆動音源を求め、ボコーダ方式に基づき合成音声8
を生成する。
【0039】本実施の形態によれば、このような構成を
とることにより、文または文節中の発話速度を変更する
話速変更部15を備え、合成音声の再提示要求を受けた
ら、前記再提示時点まで遡り、発話速度が前提示時より
遅くなるように合成音声の提示を行うことを可能とし、
ユーザにわかり易い再提示が可能となる。
とることにより、文または文節中の発話速度を変更する
話速変更部15を備え、合成音声の再提示要求を受けた
ら、前記再提示時点まで遡り、発話速度が前提示時より
遅くなるように合成音声の提示を行うことを可能とし、
ユーザにわかり易い再提示が可能となる。
【0040】なお、本実施の形態の話速変更部15にお
いて、再入力系列の音声をより明確に提示させる為に、
合成音声8の振幅を大きくするようにしてもよい。
いて、再入力系列の音声をより明確に提示させる為に、
合成音声8の振幅を大きくするようにしてもよい。
【0041】また、本実施の形態の音声合成部1Cは、
パラメータ生成部12、波形生成部13、巻き戻し地点
検出部9、音声素片データベース11を備える替りに、
実施の形態1の波形編集部3、韻律境界検出部7、単語
音声データベース4、テンプレート5を備え、コマンド
入力6が与えられたら、韻律境界検出部7で検出された
韻律境界からコマンド入力時点までの音声波形を、話速
変更部15でPSOLA手法による波形の繰り返し処理
により時間長を伸長するように構成するようにしてもよ
い。
パラメータ生成部12、波形生成部13、巻き戻し地点
検出部9、音声素片データベース11を備える替りに、
実施の形態1の波形編集部3、韻律境界検出部7、単語
音声データベース4、テンプレート5を備え、コマンド
入力6が与えられたら、韻律境界検出部7で検出された
韻律境界からコマンド入力時点までの音声波形を、話速
変更部15でPSOLA手法による波形の繰り返し処理
により時間長を伸長するように構成するようにしてもよ
い。
【0042】実施の形態5.図5は、本発明の実施の形
態5における音声応答装置の構成を示したものである。
なお、上記実施の形態2と同様の構成要素については、
同じ符号を付けて説明を省略する。16は、再入力系列
10の韻律情報を、前回提示時と異なる高さの声での音
声提示ができるように変更して、パラメータ生成部12
へ送るためのピッチ変更部である。
態5における音声応答装置の構成を示したものである。
なお、上記実施の形態2と同様の構成要素については、
同じ符号を付けて説明を省略する。16は、再入力系列
10の韻律情報を、前回提示時と異なる高さの声での音
声提示ができるように変更して、パラメータ生成部12
へ送るためのピッチ変更部である。
【0043】次に動作について説明する。音声合成部1
Dでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び、入力系列2Aから合成音声8を得るま
での動作は実施の形態2と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際にユーザは音声応答装
置に対して聞き直したいことを示すコマンド入力6を与
える。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aを遡り、入力系列2Aにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
2Aを再入力系列10として、ピッチ変更部16へ送信
する。意味的な境界の検出は実施の形態2と同様とす
る。
Dでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び、入力系列2Aから合成音声8を得るま
での動作は実施の形態2と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際にユーザは音声応答装
置に対して聞き直したいことを示すコマンド入力6を与
える。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aを遡り、入力系列2Aにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
2Aを再入力系列10として、ピッチ変更部16へ送信
する。意味的な境界の検出は実施の形態2と同様とす
る。
【0044】ピッチ変更部16は再入力系列10の韻律
情報を前回提示時と異なるように変更する。ここでは再
入力系列10のピッチを変更する。変更手法としては、
例えば再入力系列10のピッチを一律0.25[oc
t]上昇させる。これにより再入力系列区間においては
前回提示時と異なる高さの声の音声提示ができ、ユーザ
に再提示していることを明示できる。パラメータ生成部
12は、ピッチ変更部16でピッチ変更処理された再入
力系列10Dが入力されると、音声素片データベース1
1を参照し、音響パラメータを得る。波形生成部13で
は、音響パラメータから合成フィルタを構成し、ピッチ
から駆動音源を求め、ボコーダ方式に基づき合成音声8
を生成する。
情報を前回提示時と異なるように変更する。ここでは再
入力系列10のピッチを変更する。変更手法としては、
例えば再入力系列10のピッチを一律0.25[oc
t]上昇させる。これにより再入力系列区間においては
前回提示時と異なる高さの声の音声提示ができ、ユーザ
に再提示していることを明示できる。パラメータ生成部
12は、ピッチ変更部16でピッチ変更処理された再入
力系列10Dが入力されると、音声素片データベース1
1を参照し、音響パラメータを得る。波形生成部13で
は、音響パラメータから合成フィルタを構成し、ピッチ
から駆動音源を求め、ボコーダ方式に基づき合成音声8
を生成する。
【0045】本実施の形態によれば、このような構成を
とることにより、文または文節中のピッチを変更するピ
ッチ変更部16を備え、合成音声の再提示要求を受けた
ら、前記再提示時点まで遡り、合成音声の声の高さを前
提示時より高くなるようにして合成音声の提示を行うこ
とを可能とし、ユーザにわかり易い再提示が可能とな
る。
とることにより、文または文節中のピッチを変更するピ
ッチ変更部16を備え、合成音声の再提示要求を受けた
ら、前記再提示時点まで遡り、合成音声の声の高さを前
提示時より高くなるようにして合成音声の提示を行うこ
とを可能とし、ユーザにわかり易い再提示が可能とな
る。
【0046】なお、本実施の形態のピッチ変更部16に
おいて、再入力系列の音声をより明確に提示させる為
に、合成音声8の振幅を大きくするようにしてもよい。
おいて、再入力系列の音声をより明確に提示させる為
に、合成音声8の振幅を大きくするようにしてもよい。
【0047】また、本実施の形態の音声合成部1Dは、
パラメータ生成部12、波形生成部13、巻き戻し地点
検出部9、音声素片データベース11を備える替りに、
実施の形態1の波形編集部3、韻律境界検出部7、単語
音声データベース4、テンプレート5を備え、コマンド
入力6が与えられたら、韻律境界検出部7で検出された
韻律境界からコマンド入力6時点までの音声波形を、ピ
ッチ変更部16でPSOLA手法により高ピッチ音声に
変更するように構成するようにしてもよい。
パラメータ生成部12、波形生成部13、巻き戻し地点
検出部9、音声素片データベース11を備える替りに、
実施の形態1の波形編集部3、韻律境界検出部7、単語
音声データベース4、テンプレート5を備え、コマンド
入力6が与えられたら、韻律境界検出部7で検出された
韻律境界からコマンド入力6時点までの音声波形を、ピ
ッチ変更部16でPSOLA手法により高ピッチ音声に
変更するように構成するようにしてもよい。
【0048】また、ピッチ変更部16において、合成音
声が女声など通常ピッチが高い音声を提示している場合
には、低いピッチに変更するようにしてもよい。
声が女声など通常ピッチが高い音声を提示している場合
には、低いピッチに変更するようにしてもよい。
【0049】実施の形態6.図6は本発明の実施の形態
6における音声応答装置の構成を示した図である。な
お、上記実施の形態2と同様の構成要素については、同
じ符号を付けて説明を省略する。17は、再入力系列1
0の文節毎の韻律情報の提示順序を変更するための語順
変更部である。
6における音声応答装置の構成を示した図である。な
お、上記実施の形態2と同様の構成要素については、同
じ符号を付けて説明を省略する。17は、再入力系列1
0の文節毎の韻律情報の提示順序を変更するための語順
変更部である。
【0050】次に動作について説明する。音声合成部1
Eでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び、入力系列2Aから合成音声8を得るま
での動作は実施の形態2と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際にユーザは音声応答装
置に対して聞き直したいことを示すコマンド入力6を与
える。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aを遡り、入力系列2Aにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
2Aを再入力系列10として、語順変更部17に送信す
る。意味的な境界の検出は実施の形態2と同様とする。
Eでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び、入力系列2Aから合成音声8を得るま
での動作は実施の形態2と同様である。次にユーザが音
声を聞き逃したり、不明瞭であったことから再度聞きた
い場合について説明する。その際にユーザは音声応答装
置に対して聞き直したいことを示すコマンド入力6を与
える。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aを遡り、入力系列2Aにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
2Aを再入力系列10として、語順変更部17に送信す
る。意味的な境界の検出は実施の形態2と同様とする。
【0051】語順変更部17は再入力系列10の文節単
位の語順変更を行う。例えば再入力系列10の中で文脈
から判断して重要度の高い文節が先頭に来るように、文
節の系列内の配置順を変更する。例えば、再入力系列1
0が「そこには/円覚寺が/あります」である場合には、
「円覚寺が/そこには/あります」の様に語順を変更す
る。こうしてユーザが最も注目するであろうキーワード
を率先して提示することで、ユーザへの伝達を促進す
る。パラメータ生成部12は、語順変更部17で語順変
更処理された再入力系列10Eが入力されると、音声素
片データベース11を参照し、音響パラメータを得る。
波形生成部13では、音響パラメータから合成フィルタ
を構成し、ピッチから駆動音源を求め、ボコーダ方式に
基づき合成音声8を生成する。
位の語順変更を行う。例えば再入力系列10の中で文脈
から判断して重要度の高い文節が先頭に来るように、文
節の系列内の配置順を変更する。例えば、再入力系列1
0が「そこには/円覚寺が/あります」である場合には、
「円覚寺が/そこには/あります」の様に語順を変更す
る。こうしてユーザが最も注目するであろうキーワード
を率先して提示することで、ユーザへの伝達を促進す
る。パラメータ生成部12は、語順変更部17で語順変
更処理された再入力系列10Eが入力されると、音声素
片データベース11を参照し、音響パラメータを得る。
波形生成部13では、音響パラメータから合成フィルタ
を構成し、ピッチから駆動音源を求め、ボコーダ方式に
基づき合成音声8を生成する。
【0052】本実施の形態によれば、このような構成を
とることにより、文または文節中の単語列の順番を、キ
ーワードとして判定される単語を先頭に置くように変更
する語順変更部17を備え、合成音声の再提示要求を受
けたら、前記再提示時点まで遡り、前提示時と語順を変
更して音声合成を行うことを可能とし、ユーザに意図を
より明確に伝える再提示が可能となる。
とることにより、文または文節中の単語列の順番を、キ
ーワードとして判定される単語を先頭に置くように変更
する語順変更部17を備え、合成音声の再提示要求を受
けたら、前記再提示時点まで遡り、前提示時と語順を変
更して音声合成を行うことを可能とし、ユーザに意図を
より明確に伝える再提示が可能となる。
【0053】なお、本実施の形態の音声応答装置内に、
上記実施の形態3の読み飛ばし部14をさらに備えるよ
うにして、冗長な語を省略した語順変更文を生成するよ
うにしてもよい。
上記実施の形態3の読み飛ばし部14をさらに備えるよ
うにして、冗長な語を省略した語順変更文を生成するよ
うにしてもよい。
【0054】また、語順変更部17は、語順変更の影響
でかえって文が複雑になるのを避ける為に、語順変更の
際に助詞などの付属語を変更するように構成してもよ
い。
でかえって文が複雑になるのを避ける為に、語順変更の
際に助詞などの付属語を変更するように構成してもよ
い。
【0055】実施の形態7.図7は、本発明の実施の形
態7における音声応答装置の構成を示したものである。
なお、上記実施の形態2と同様の構成要素については、
同じ符号を付けて説明を省略する。18は、再入力系列
10中のある文節について、類似語を記憶している類似
語辞書19を参照して別の文節に変更するためのキーワ
ード変更部である。
態7における音声応答装置の構成を示したものである。
なお、上記実施の形態2と同様の構成要素については、
同じ符号を付けて説明を省略する。18は、再入力系列
10中のある文節について、類似語を記憶している類似
語辞書19を参照して別の文節に変更するためのキーワ
ード変更部である。
【0056】次に動作について説明する。音声合成部1
Gでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び入力系列2Aから合成音声8を得るまで
の動作は実施の形態2と同様である。次にユーザが音声
を聞き逃したり、不明瞭であったことから再度聞きたい
場合について説明する。その際にユーザは音声応答装置
に対して聞き直したいことを示すコマンド入力6を与え
る。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aを遡り、入力系列2Aにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
2Aを再入力系列10として、キーワード変更部18へ
送信する。意味的な境界の検出は実施の形態2と同様と
する。
Gでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び入力系列2Aから合成音声8を得るまで
の動作は実施の形態2と同様である。次にユーザが音声
を聞き逃したり、不明瞭であったことから再度聞きたい
場合について説明する。その際にユーザは音声応答装置
に対して聞き直したいことを示すコマンド入力6を与え
る。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aを遡り、入力系列2Aにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
2Aを再入力系列10として、キーワード変更部18へ
送信する。意味的な境界の検出は実施の形態2と同様と
する。
【0057】キーワード変更部18は再入力系列10に
おける単語変更を行う。例えば再入力系列10の中にお
けるキーワードが耳慣れない又は難解であればピックア
ップする。この難易度に関する尺度は、あらかじめ単語
毎にスコアを与えておき、その単語スコアが閾値を上回
ればピックアップする。そして当該キーワードについて
類似語辞書19を参照して当該キーワードに対応する類
似語を検出する。そしてその類似語のスコアがキーワー
ドより低く、かつ、閾値を下回ればキーワードと交換す
る。パラメータ生成部12は、キーワード変更部18で
単語変更処理された再入力系列10Fが入力されると、
音声素片データベース11を参照し、音響パラメータを
得る。波形生成部13では、音響パラメータから合成フ
ィルタを構成し、ピッチから駆動音源を求め、ボコーダ
方式に基づき合成音声8を生成する。
おける単語変更を行う。例えば再入力系列10の中にお
けるキーワードが耳慣れない又は難解であればピックア
ップする。この難易度に関する尺度は、あらかじめ単語
毎にスコアを与えておき、その単語スコアが閾値を上回
ればピックアップする。そして当該キーワードについて
類似語辞書19を参照して当該キーワードに対応する類
似語を検出する。そしてその類似語のスコアがキーワー
ドより低く、かつ、閾値を下回ればキーワードと交換す
る。パラメータ生成部12は、キーワード変更部18で
単語変更処理された再入力系列10Fが入力されると、
音声素片データベース11を参照し、音響パラメータを
得る。波形生成部13では、音響パラメータから合成フ
ィルタを構成し、ピッチから駆動音源を求め、ボコーダ
方式に基づき合成音声8を生成する。
【0058】本実施の形態によれば、このような構成を
とることにより、単語を類義語へ変更するキーワード変
更部18を備え、合成音声の再提示要求を受けたら、前
記再提示時点まで遡り、再提示区間内のキーワードを別
の表現に変更して音声合成を行うことを可能とし、ユー
ザに意図をより明確に伝える再提示が可能となる。
とることにより、単語を類義語へ変更するキーワード変
更部18を備え、合成音声の再提示要求を受けたら、前
記再提示時点まで遡り、再提示区間内のキーワードを別
の表現に変更して音声合成を行うことを可能とし、ユー
ザに意図をより明確に伝える再提示が可能となる。
【0059】尚、キーワード変更部18は、各単語に対
する難易度の尺度を、ユーザからのコマンド入力結果を
蓄積し、それに基づき更新するようにしてもよい。
する難易度の尺度を、ユーザからのコマンド入力結果を
蓄積し、それに基づき更新するようにしてもよい。
【0060】実施の形態8.図8は、本発明の実施の形
態8における音声応答装置の構成を示したものである。
なお、上記実施の形態2と同様の構成要素については、
同じ符号を付けて説明を省略する。20は、再入力系列
10中のある文節について、説明文用辞書21を参照し
て、文節の単語に対応する説明文を生成して、再入力系
列10内に挿入するための説明文生成部である。
態8における音声応答装置の構成を示したものである。
なお、上記実施の形態2と同様の構成要素については、
同じ符号を付けて説明を省略する。20は、再入力系列
10中のある文節について、説明文用辞書21を参照し
て、文節の単語に対応する説明文を生成して、再入力系
列10内に挿入するための説明文生成部である。
【0061】次に動作について説明する。音声合成部1
Gでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び入力系列2Aから合成音声8を得るまで
の動作は実施の形態2と同様である。次にユーザが音声
を聞き逃したり、不明瞭であったことから再度聞きたい
場合について説明する。その際にユーザは音声応答装置
に対して聞き直したいことを示すコマンド入力6を与え
る。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aを遡り、入力系列2Aにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
2Aを再入力系列10として、説明文生成部20に送信
する。意味的な境界の検出は実施の形態2と同様とす
る。
Gでは規則合成に基づいた音声合成を行う。入力系列2
Aの形式、及び入力系列2Aから合成音声8を得るまで
の動作は実施の形態2と同様である。次にユーザが音声
を聞き逃したり、不明瞭であったことから再度聞きたい
場合について説明する。その際にユーザは音声応答装置
に対して聞き直したいことを示すコマンド入力6を与え
る。コマンド入力6の形式は実施の形態2と同様であ
る。巻き戻し地点検出部9は、コマンド入力6を受けた
入力系列2Aにおける時点を特定し、合成音声8の出力
停止の命令をパラメータ生成部12へ送る。そして入力
系列2Aを遡り、入力系列2Aにおける意味的な境界を
検出し、そしてその時点を巻き戻し時点とし、入力系列
2Aを再入力系列10として、説明文生成部20に送信
する。意味的な境界の検出は実施の形態2と同様とす
る。
【0062】説明文生成部20は再入力系列10におけ
るキーワードに相当する説明文を生成する。例えば再入
力系列10の中のキーワードが耳慣れない又は難解であ
ればピックアップする。キーワードの難易度の尺度は実
施の形態7と同様のものとする。そして説明文用辞書2
1を参照してキーワードを見出し語とする説明文の箇所
を読み出す。そして説明文を判りやすく修正して当該単
語に対応する説明文を生成し、それを再入力系列10内
に挿入させる。パラメータ生成部12は、説明文生成部
20で説明文追加処理された再入力系列10Gが入力さ
れると、音声素片データベース11を参照し、音響パラ
メータを得る。波形生成部13では、音響パラメータか
ら合成フィルタを構成し、ピッチから駆動音源を求め、
ボコーダ方式に基づき合成音声8を生成する。
るキーワードに相当する説明文を生成する。例えば再入
力系列10の中のキーワードが耳慣れない又は難解であ
ればピックアップする。キーワードの難易度の尺度は実
施の形態7と同様のものとする。そして説明文用辞書2
1を参照してキーワードを見出し語とする説明文の箇所
を読み出す。そして説明文を判りやすく修正して当該単
語に対応する説明文を生成し、それを再入力系列10内
に挿入させる。パラメータ生成部12は、説明文生成部
20で説明文追加処理された再入力系列10Gが入力さ
れると、音声素片データベース11を参照し、音響パラ
メータを得る。波形生成部13では、音響パラメータか
ら合成フィルタを構成し、ピッチから駆動音源を求め、
ボコーダ方式に基づき合成音声8を生成する。
【0063】本実施の形態によれば、このような構成を
とることにより、単語に対応する説明文が記述されてい
る説明文用辞書21を備え、合成音声の再提示要求を受
けたら、前記再提示時点まで遡り、再提示区間内のキー
ワードに関し説明文用辞書21を参照し、そこに記述さ
れる説明文を用いて音声合成を行うことを可能とし、ユ
ーザに意図をより明確に伝える再提示が可能となる。
とることにより、単語に対応する説明文が記述されてい
る説明文用辞書21を備え、合成音声の再提示要求を受
けたら、前記再提示時点まで遡り、再提示区間内のキー
ワードに関し説明文用辞書21を参照し、そこに記述さ
れる説明文を用いて音声合成を行うことを可能とし、ユ
ーザに意図をより明確に伝える再提示が可能となる。
【0064】なお、本実施の形態の説明文生成部20
は、各単語に対する難易度の尺度を、ユーザからのコマ
ンド入力結果を蓄積し、それに基づき更新するようにし
てもよい。
は、各単語に対する難易度の尺度を、ユーザからのコマ
ンド入力結果を蓄積し、それに基づき更新するようにし
てもよい。
【0065】なお、上記の実施の形態2〜8における意
味的な境界は、入力系列2Aがテキストの言語分析結果
である場合には、句読点の位置としてもよく、または、
ポーズが挿入される位置としてもよい。
味的な境界は、入力系列2Aがテキストの言語分析結果
である場合には、句読点の位置としてもよく、または、
ポーズが挿入される位置としてもよい。
【0066】また、上記の実施の形態2〜8における音
声素片データベース11内の音声素片は、音響パラメー
タの替りにフレーム毎にフレーム代表する音声波形と
し、波形生成部13は音声波形とピッチに基づきPSO
LA手法で合成を生成するようにしてもよい。
声素片データベース11内の音声素片は、音響パラメー
タの替りにフレーム毎にフレーム代表する音声波形と
し、波形生成部13は音声波形とピッチに基づきPSO
LA手法で合成を生成するようにしてもよい。
【0067】実施の形態9.図9は本発明の実施の形態
9における音声応答装置の構成を示した図である。な
お、上記実施の形態1と同様の構成要素については、同
じ符号を付けて説明を省略する。23は、テンプレート
5内の文または句の詳細説明が記憶されている詳細説明
テンプレートであり、22は、テンプレート5内の通常
文の単語スロットに挿入された単語音声データベース4
の単語音声を抜きだし、当該通常文に対応した詳細説明
テンプレート23内の詳細説明文を読みだし、詳細説明
文の単語スロットに先の単語音声データベース4の単語
音声を挿入して詳細説明文の合成音声8を生成するため
のテンプレート変更部である。
9における音声応答装置の構成を示した図である。な
お、上記実施の形態1と同様の構成要素については、同
じ符号を付けて説明を省略する。23は、テンプレート
5内の文または句の詳細説明が記憶されている詳細説明
テンプレートであり、22は、テンプレート5内の通常
文の単語スロットに挿入された単語音声データベース4
の単語音声を抜きだし、当該通常文に対応した詳細説明
テンプレート23内の詳細説明文を読みだし、詳細説明
文の単語スロットに先の単語音声データベース4の単語
音声を挿入して詳細説明文の合成音声8を生成するため
のテンプレート変更部である。
【0068】次に動作について説明する。音声合成部1
Jでは編集合成に基づいた音声合成を行う。入力系列2
の形式、及び、入力系列2から合成音声8を得るまでの
動作は実施の形態1と同様である。次にユーザが音声を
聞き逃したり、不明瞭であったことから再度聞きたい場
合について説明する。その際にユーザは音声応答装置に
対して聞き直したいことを示すコマンド入力6を与え
る。コマンド入力6の形式は実施の形態1と同様であ
る。韻律境界検出部7は、コマンド入力6を受けた合成
音声8における時点を特定し、合成音声8の出力を停止
する。そしてその時点から合成音声8を逆時間方向に遡
り、韻律境界を検出し、そこを合成音声8の再出力時点
とする。検出される韻律境界は、実施の形態1と同様と
する。この韻律境界から再度合成音声8を提示する。
Jでは編集合成に基づいた音声合成を行う。入力系列2
の形式、及び、入力系列2から合成音声8を得るまでの
動作は実施の形態1と同様である。次にユーザが音声を
聞き逃したり、不明瞭であったことから再度聞きたい場
合について説明する。その際にユーザは音声応答装置に
対して聞き直したいことを示すコマンド入力6を与え
る。コマンド入力6の形式は実施の形態1と同様であ
る。韻律境界検出部7は、コマンド入力6を受けた合成
音声8における時点を特定し、合成音声8の出力を停止
する。そしてその時点から合成音声8を逆時間方向に遡
り、韻律境界を検出し、そこを合成音声8の再出力時点
とする。検出される韻律境界は、実施の形態1と同様と
する。この韻律境界から再度合成音声8を提示する。
【0069】この時、もしテンプレート5の文または句
の内容が判りにくかったり、簡潔すぎたりしてユーザに
判りにくい場合を想定して、通常のテンプレート5に対
応する詳細説明テンプレート23が用意されている。詳
細説明テンプレート23は、通常のテンプレート5と同
じ内容だが、より詳細な内容が記述されているため、音
声データとしては比較的大きな容量であり、予備的に用
意されているものとする。そして通常のテンプレート5
の単語スロットと対応ポイントが記録された単語スロッ
トを有している。テンプレート変更部22は、通常文の
テンプレート5の単語スロットに挿入された単語音声デ
ータベース4内の単語音声を抜きだし、当該テンプレー
ト5に対応した詳細説明テンプレート23を読みだし、
その単語スロットに先の単語音声データベース4の単語
音声を挿入して詳細説明文の合成音声8を生成する。こ
うして再提示音声をより詳細に提示することができる。
の内容が判りにくかったり、簡潔すぎたりしてユーザに
判りにくい場合を想定して、通常のテンプレート5に対
応する詳細説明テンプレート23が用意されている。詳
細説明テンプレート23は、通常のテンプレート5と同
じ内容だが、より詳細な内容が記述されているため、音
声データとしては比較的大きな容量であり、予備的に用
意されているものとする。そして通常のテンプレート5
の単語スロットと対応ポイントが記録された単語スロッ
トを有している。テンプレート変更部22は、通常文の
テンプレート5の単語スロットに挿入された単語音声デ
ータベース4内の単語音声を抜きだし、当該テンプレー
ト5に対応した詳細説明テンプレート23を読みだし、
その単語スロットに先の単語音声データベース4の単語
音声を挿入して詳細説明文の合成音声8を生成する。こ
うして再提示音声をより詳細に提示することができる。
【0070】なお、韻律境界の例として、ポーズ(無
音)の位置を例に挙げたが、その場合に限らず、ピッチ
(声の高さ)のアクセントの強さが所定の閾値を越えた
箇所を求め、その位置を含む文節音声の先頭を韻律境界
としてもよい。また、韻律境界の他の例としては、母音
中心の振幅の大きさがある閾値を越えた箇所を求め、そ
の位置を含む文節音声の先頭としてもよく、さらに、ピ
ッチの推定結果から得られる、ピッチパターンにおける
フレーズ成分の立て直し位置としてもよい。
音)の位置を例に挙げたが、その場合に限らず、ピッチ
(声の高さ)のアクセントの強さが所定の閾値を越えた
箇所を求め、その位置を含む文節音声の先頭を韻律境界
としてもよい。また、韻律境界の他の例としては、母音
中心の振幅の大きさがある閾値を越えた箇所を求め、そ
の位置を含む文節音声の先頭としてもよく、さらに、ピ
ッチの推定結果から得られる、ピッチパターンにおける
フレーズ成分の立て直し位置としてもよい。
【0071】本実施の形態によれば、このような構成を
とることにより、通常文が記憶されているテンプレート
5と単語スロットの対応ポイントが記録されている詳細
説明文が記憶されている詳細説明テンプレート22を備
え、合成音声の再提示要求を受けたら、前記再提示時点
まで遡り、前回の通常文テンプレートに埋め込まれた単
語を詳細説明テンプレートに埋め込んだ詳細説明文によ
る、より詳細な合成音声の提示を行うことを可能とし、
ユーザに意図をより明確に伝える再提示が可能となる。
とることにより、通常文が記憶されているテンプレート
5と単語スロットの対応ポイントが記録されている詳細
説明文が記憶されている詳細説明テンプレート22を備
え、合成音声の再提示要求を受けたら、前記再提示時点
まで遡り、前回の通常文テンプレートに埋め込まれた単
語を詳細説明テンプレートに埋め込んだ詳細説明文によ
る、より詳細な合成音声の提示を行うことを可能とし、
ユーザに意図をより明確に伝える再提示が可能となる。
【0072】なお、テンプレート変更部22は、特定の
テンプレートに対してのコマンド入力が所定の定数を越
える場合、あらかじめ記憶されている通常のテンプレー
ト5内の当該テンプレートと詳細説明テンプレート23
内の詳細説明テンプレートとを変更するようにしてもよ
い。
テンプレートに対してのコマンド入力が所定の定数を越
える場合、あらかじめ記憶されている通常のテンプレー
ト5内の当該テンプレートと詳細説明テンプレート23
内の詳細説明テンプレートとを変更するようにしてもよ
い。
【0073】実施の形態10.図10は本発明の実施の
形態10における音声応答装置の構成を示すものであ
る。なお、上記実施の形態1と同様の構成要素について
は、同じ符号を付けて説明を省略する。異聴マトリクス
25は、聞き間違い易い音節の組みが記述されている。
また、類義語音声データ26は、類義語辞書とその音声
データとを記憶している。類義語変換部24は、再提示
される音声データ中の単語について、異聴マトリクス2
5を参照して、単語が異聴マトリクス25に存在する音
声を含む場合、類義語音声データ26から類義語候補を
選択してキーワードを別の単語に置き換えた合成音声8
を生成する。
形態10における音声応答装置の構成を示すものであ
る。なお、上記実施の形態1と同様の構成要素について
は、同じ符号を付けて説明を省略する。異聴マトリクス
25は、聞き間違い易い音節の組みが記述されている。
また、類義語音声データ26は、類義語辞書とその音声
データとを記憶している。類義語変換部24は、再提示
される音声データ中の単語について、異聴マトリクス2
5を参照して、単語が異聴マトリクス25に存在する音
声を含む場合、類義語音声データ26から類義語候補を
選択してキーワードを別の単語に置き換えた合成音声8
を生成する。
【0074】次に動作について説明する。音声合成部1
Jでは編集合成に基づいた音声合成を行う。入力系列2
の形式、及び入力系列2から合成音声8を得るまでの動
作は実施の形態1と同様である。次にユーザが音声を聞
き逃したり、不明瞭であったことから再度聞きたい場合
について説明する。その際にユーザは音声応答装置に対
して聞き直したいことを示すコマンド入力6を与える。
コマンド入力6の形式は実施の形態1と同様である。韻
律境界検出部7は、コマンド入力6を受けた合成音声8
における時点を特定し、合成音声8の出力を停止する。
そしてその時点から合成音声8を逆時間方向に遡り、韻
律境界を検出し、そこを合成音声8の再出力時点とす
る。検出される韻律境界は、実施の形態1と同様とす
る。この韻律境界から再度合成音声8を提示する。
Jでは編集合成に基づいた音声合成を行う。入力系列2
の形式、及び入力系列2から合成音声8を得るまでの動
作は実施の形態1と同様である。次にユーザが音声を聞
き逃したり、不明瞭であったことから再度聞きたい場合
について説明する。その際にユーザは音声応答装置に対
して聞き直したいことを示すコマンド入力6を与える。
コマンド入力6の形式は実施の形態1と同様である。韻
律境界検出部7は、コマンド入力6を受けた合成音声8
における時点を特定し、合成音声8の出力を停止する。
そしてその時点から合成音声8を逆時間方向に遡り、韻
律境界を検出し、そこを合成音声8の再出力時点とす
る。検出される韻律境界は、実施の形態1と同様とす
る。この韻律境界から再度合成音声8を提示する。
【0075】異聴マトリクス25は聞き間違い易い音節
の組みが記述されている。例えば、/mem/と/ne
m/、/shis/と/his/など、2つの音節の組
みを列挙する形式で記述されている。類義語変換部24
は再提示される音声データ中のキーワード、すなわち単
語スロットに挿入される単語音声データベース4内の単
語音声について、異聴マトリクス25を参照する。この
時、各単語音声データベース4の単語音声に読みのデー
タが添付されており、それをキーとして異聴マトリクス
25中に聞き間違い易い音節の組が存在するか否かを調
べる。異聴マトリクス25に存在しない場合はそのまま
合成音声8を提示する。しかし、異聴マトリクス25中
に存在する場合は、類義語音声データ26を参照する。
類義語音声データ26は類義語辞書と音声データからな
り、キーワードに対応する類義語候補を選択して類義語
音声を読み出す。そしてキーワードを類義語に置き換え
てテンプレート5に挿入した合成音声8を生成し、提示
する。
の組みが記述されている。例えば、/mem/と/ne
m/、/shis/と/his/など、2つの音節の組
みを列挙する形式で記述されている。類義語変換部24
は再提示される音声データ中のキーワード、すなわち単
語スロットに挿入される単語音声データベース4内の単
語音声について、異聴マトリクス25を参照する。この
時、各単語音声データベース4の単語音声に読みのデー
タが添付されており、それをキーとして異聴マトリクス
25中に聞き間違い易い音節の組が存在するか否かを調
べる。異聴マトリクス25に存在しない場合はそのまま
合成音声8を提示する。しかし、異聴マトリクス25中
に存在する場合は、類義語音声データ26を参照する。
類義語音声データ26は類義語辞書と音声データからな
り、キーワードに対応する類義語候補を選択して類義語
音声を読み出す。そしてキーワードを類義語に置き換え
てテンプレート5に挿入した合成音声8を生成し、提示
する。
【0076】本実施の形態によれば、このような構成を
とることにより、聞き間違い易い音節の組みを記述した
異聴マトリックスを備え、合成音の再提示要求を受けた
ら、前記再提示時点まで遡り、再提示区間のキーワード
が異聴マトリックスに記述される音声を含む場合、類義
語候補を選択してキーワードを別の単語あるいは単語列
に変更して合成音声を作成し、提示を行うことを可能と
し、ユーザに意図をより明確に伝える再提示が可能とな
る。
とることにより、聞き間違い易い音節の組みを記述した
異聴マトリックスを備え、合成音の再提示要求を受けた
ら、前記再提示時点まで遡り、再提示区間のキーワード
が異聴マトリックスに記述される音声を含む場合、類義
語候補を選択してキーワードを別の単語あるいは単語列
に変更して合成音声を作成し、提示を行うことを可能と
し、ユーザに意図をより明確に伝える再提示が可能とな
る。
【0077】なお、類義語変更部24は、特定のキーワ
ードに対してのコマンド入力が一定数を越える場合、あ
らかじめ記憶されている単語音声データと類義語音声デ
ータとを変更するようにしてもよい。
ードに対してのコマンド入力が一定数を越える場合、あ
らかじめ記憶されている単語音声データと類義語音声デ
ータとを変更するようにしてもよい。
【0078】また、異聴マトリックス25は、ユーザか
らの応答の基に、聞き間違いの累積頻度を統計的にまと
めて、更新するようにしてもよい。
らの応答の基に、聞き間違いの累積頻度を統計的にまと
めて、更新するようにしてもよい。
【0079】また、韻律境界の例として、本実施の形態
においては実施の形態1と同様に、ポーズ(無音)の位
置を例に挙げたが、その場合に限らず、ピッチ(声の高
さ)のアクセントの強さが所定の閾値を越えた箇所を求
め、その位置を含む文節音声の先頭を韻律境界としても
よい。また、韻律境界の他の例としては、母音中心の振
幅の大きさがある閾値を越えた箇所を求め、その位置を
含む文節音声の先頭としてもよく、さらに、ピッチの推
定結果から得られる、ピッチパターンにおけるフレーズ
成分の立て直し位置としてもよい。
においては実施の形態1と同様に、ポーズ(無音)の位
置を例に挙げたが、その場合に限らず、ピッチ(声の高
さ)のアクセントの強さが所定の閾値を越えた箇所を求
め、その位置を含む文節音声の先頭を韻律境界としても
よい。また、韻律境界の他の例としては、母音中心の振
幅の大きさがある閾値を越えた箇所を求め、その位置を
含む文節音声の先頭としてもよく、さらに、ピッチの推
定結果から得られる、ピッチパターンにおけるフレーズ
成分の立て直し位置としてもよい。
【0080】尚、上記の実施の形態1〜10におけるコ
マンド入力6は、プッシュホンのキー入力で行う例につ
いて説明したが、その場合に限らず、音声認識技術を利
用してユーザからの特定語発話の認識結果を用いるよう
にしてもよい。
マンド入力6は、プッシュホンのキー入力で行う例につ
いて説明したが、その場合に限らず、音声認識技術を利
用してユーザからの特定語発話の認識結果を用いるよう
にしてもよい。
【0081】
【発明の効果】この発明は、入力データ系列に対応する
合成音声を生成して出力する音声合成手段と、合成音声
の再出力要求を外部から受信するコマンド受信手段と、
コマンド受信手段が再出力要求を受信した時点から入力
データ系列及び合成音声のいずれか一方を逆時間方向に
遡って意味的な文の切れ目を検出するための再出力開始
時点検出手段とを備え、意味的な文の切れ目から合成音
声を再出力するようにしたので、ユーザが合成音声の聞
き直しを行う場合に、柔軟かつユーザにわかりやすい合
成音声の再提示が可能になるという効果を奏する。
合成音声を生成して出力する音声合成手段と、合成音声
の再出力要求を外部から受信するコマンド受信手段と、
コマンド受信手段が再出力要求を受信した時点から入力
データ系列及び合成音声のいずれか一方を逆時間方向に
遡って意味的な文の切れ目を検出するための再出力開始
時点検出手段とを備え、意味的な文の切れ目から合成音
声を再出力するようにしたので、ユーザが合成音声の聞
き直しを行う場合に、柔軟かつユーザにわかりやすい合
成音声の再提示が可能になるという効果を奏する。
【0082】また、再出力開始時点検出手段が、韻律境
界を検出するための韻律境界検出部から構成されている
ので、呼気段落の先頭等の韻律境界から合成音声の再出
力を行うことができ、ユーザに対し必要かつ十分な合成
音声の再提示を行うことができる。
界を検出するための韻律境界検出部から構成されている
ので、呼気段落の先頭等の韻律境界から合成音声の再出
力を行うことができ、ユーザに対し必要かつ十分な合成
音声の再提示を行うことができる。
【0083】また、再出力開始時点検出手段が、意味的
な言語境界を検出するための言語境界検出部から構成さ
れているので、テキスト上の意味的なまとまりを合成音
声の再出力開始時点とすることができ、ユーザに対し必
要かつ十分な合成音声の再提示を行うことができる。
な言語境界を検出するための言語境界検出部から構成さ
れているので、テキスト上の意味的なまとまりを合成音
声の再出力開始時点とすることができ、ユーザに対し必
要かつ十分な合成音声の再提示を行うことができる。
【0084】また、合成音声内の重要度の低い語群を削
除するための読み飛ばし手段をさらに備え、合成音声を
再出力する際には重要度の低い語群については読み飛ば
しを行って重要な語群のみを再出力するようにしたの
で、ユーザに対してわかり易く、かつ、効率的な再提示
が可能となる。
除するための読み飛ばし手段をさらに備え、合成音声を
再出力する際には重要度の低い語群については読み飛ば
しを行って重要な語群のみを再出力するようにしたの
で、ユーザに対してわかり易く、かつ、効率的な再提示
が可能となる。
【0085】また、合成音声の話速を変更するための話
速変更手段をさらに備え、合成音声を再出力する際には
発話速度を遅くして再提示を行うようにしたので、ユー
ザに対してわかりやすく聞き取り易い再提示を行うこと
ができる。
速変更手段をさらに備え、合成音声を再出力する際には
発話速度を遅くして再提示を行うようにしたので、ユー
ザに対してわかりやすく聞き取り易い再提示を行うこと
ができる。
【0086】また、合成音声のピッチを変更するための
ピッチ変更手段をさらに備え、合成音声を再出力する際
にはピッチを変更して聞き取りやすい声の高さにして再
提示を行うようにしたので、ユーザに対しわかりやすい
再提示を行うことができる。
ピッチ変更手段をさらに備え、合成音声を再出力する際
にはピッチを変更して聞き取りやすい声の高さにして再
提示を行うようにしたので、ユーザに対しわかりやすい
再提示を行うことができる。
【0087】また、合成音声内の文節単位の語順の変更
を行うための語順変更手段をさらに備え、合成音声を再
出力する際には語順を変更して行うようにして、例え
ば、重要度の高い文節が先頭にくるように語順を変更し
て再提示を行うよにしたので、ユーザに対しわかりやす
く効率的な再提示を行うことができる。
を行うための語順変更手段をさらに備え、合成音声を再
出力する際には語順を変更して行うようにして、例え
ば、重要度の高い文節が先頭にくるように語順を変更し
て再提示を行うよにしたので、ユーザに対しわかりやす
く効率的な再提示を行うことができる。
【0088】また、類似語を記憶している類似語辞書手
段と、類似語辞書手段の類似語を参照して、合成音声内
の単語を他の類似語に変更するための類似語変更手段と
をさらに備え、合成音声を再出力する際には、合成音声
内の単語を他の類似語に変更して行うようにしたので、
耳慣れないまたは難解な単語を他の類似語に変更して再
提示されるので、ユーザに対しわかりやすく、かつ、柔
軟な再提示を行うことができる。
段と、類似語辞書手段の類似語を参照して、合成音声内
の単語を他の類似語に変更するための類似語変更手段と
をさらに備え、合成音声を再出力する際には、合成音声
内の単語を他の類似語に変更して行うようにしたので、
耳慣れないまたは難解な単語を他の類似語に変更して再
提示されるので、ユーザに対しわかりやすく、かつ、柔
軟な再提示を行うことができる。
【0089】また、単語に対応する説明文を記憶してい
る説明文用辞書手段と、説明文用辞書手段を参照して、
合成音声内の単語に対応する説明文を生成して、合成音
声内に挿入するための説明文生成手段をさらに備え、合
成音声を再出力する際には合成音声内の耳慣れないまた
は難解な単語に対する説明文を追加して行うようにした
ので、ユーザに対しわかりやすく意図を明確に伝えるこ
とができる再提示を行うことができる。
る説明文用辞書手段と、説明文用辞書手段を参照して、
合成音声内の単語に対応する説明文を生成して、合成音
声内に挿入するための説明文生成手段をさらに備え、合
成音声を再出力する際には合成音声内の耳慣れないまた
は難解な単語に対する説明文を追加して行うようにした
ので、ユーザに対しわかりやすく意図を明確に伝えるこ
とができる再提示を行うことができる。
【0090】また、通常文のテンプレートを記憶してい
るテンプレート手段と、通常文をより詳細に説明した詳
細説明テンプレートを記憶している詳細説明テンプレー
ト手段と、通常文のテンプレートおよび詳細説明テンプ
レート内に挿入するための単語を記憶している単語音声
データベース手段とを備え、合成音声を最初に出力する
際には通常文のテンプレートで行い、再出力する際には
詳細説明テンプレートで行うようにしたので、ユーザに
意図を明確に伝える再提示が可能になる。
るテンプレート手段と、通常文をより詳細に説明した詳
細説明テンプレートを記憶している詳細説明テンプレー
ト手段と、通常文のテンプレートおよび詳細説明テンプ
レート内に挿入するための単語を記憶している単語音声
データベース手段とを備え、合成音声を最初に出力する
際には通常文のテンプレートで行い、再出力する際には
詳細説明テンプレートで行うようにしたので、ユーザに
意図を明確に伝える再提示が可能になる。
【0091】また、聞き間違い易い音節の組を記憶して
いる異聴マトリクス手段と、類義語音声データを記憶し
ている類義語音声データベース手段と、異聴マトリクス
手段を参照して、合成音声内の単語が上記異聴マトリク
スに存在する音声を含んでいる場合に、類義語音声デー
タベースから類義語を選択して、単語を他の類義語に変
換するための類義語変換部とを備えているので、ユーザ
が聞き間違えることのないわかりやすい再提示を行うこ
とができる。
いる異聴マトリクス手段と、類義語音声データを記憶し
ている類義語音声データベース手段と、異聴マトリクス
手段を参照して、合成音声内の単語が上記異聴マトリク
スに存在する音声を含んでいる場合に、類義語音声デー
タベースから類義語を選択して、単語を他の類義語に変
換するための類義語変換部とを備えているので、ユーザ
が聞き間違えることのないわかりやすい再提示を行うこ
とができる。
【図1】 本発明の実施の形態1における音声応答装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【図2】 本発明の実施の形態2における音声応答装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【図3】 本発明の実施の形態3における音声応答装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【図4】 本発明の実施の形態4における音声応答装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【図5】 本発明の実施の形態5における音声応答装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【図6】 本発明の実施の形態6における音声応答装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【図7】 本発明の実施の形態7における音声応答装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【図8】 本発明の実施の形態8における音声応答装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【図9】 本発明の実施の形態9における音声応答装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【図10】 本発明の実施の形態10における音声応答
装置の構成を示すブロック図である。
装置の構成を示すブロック図である。
【図11】 従来の音声応答装置の構成を示すブロック
図である。
図である。
1,1A,1B,1C,1D,1E,1F,1G,1
H,1J 音声合成部、2,2A 入力系列、3 波形
編集部、4 単語音声データベース、5 テンプレー
ト、6 コマンド入力、7 韻律境界検出部、8 合成
音声、9 巻き戻し地点検出部、10 再入力系列、1
1 音声素片データベース、12 パラメータ生成部、
13 波形生成部、14 読み飛ばし部、15 話速変
更部、16ピッチ変更部、17 語順変更部、18 キ
ーワード変更部、19 類似語辞書、20 説明文生成
部、21 説明文用辞書、22 テンプレート変更部、
23詳細説明テンプレート、24 類義語変換部、25
異聴マトリクス、26類義語音声データ、57 音声
認識部、58 音声応答部、59 会話制御部、60
タスクインターフェース部。
H,1J 音声合成部、2,2A 入力系列、3 波形
編集部、4 単語音声データベース、5 テンプレー
ト、6 コマンド入力、7 韻律境界検出部、8 合成
音声、9 巻き戻し地点検出部、10 再入力系列、1
1 音声素片データベース、12 パラメータ生成部、
13 波形生成部、14 読み飛ばし部、15 話速変
更部、16ピッチ変更部、17 語順変更部、18 キ
ーワード変更部、19 類似語辞書、20 説明文生成
部、21 説明文用辞書、22 テンプレート変更部、
23詳細説明テンプレート、24 類義語変換部、25
異聴マトリクス、26類義語音声データ、57 音声
認識部、58 音声応答部、59 会話制御部、60
タスクインターフェース部。
Claims (11)
- 【請求項1】 入力データ系列に対応する合成音声を生
成して出力する音声合成手段と、 上記合成音声の再出力要求を外部から受信するコマンド
受信手段と、 上記コマンド受信手段が上記再出力要求を受信した時点
から上記入力データ系列及び上記合成音声のいずれか一
方を逆時間方向に遡って意味的な切れ目を検出するため
の再出力開始時点検出手段と、 を備え、 上記意味的な切れ目から上記合成音声を再出力すること
を特徴とする音声応答装置。 - 【請求項2】 上記再出力開始時点検出手段が、韻律境
界を検出するための韻律境界検出部から構成されている
ことを特徴とする請求項1記載の音声応答装置。 - 【請求項3】 上記再出力開始時点検出手段が、意味的
な言語境界を検出するための言語境界検出部から構成さ
れていることを特徴とする請求項1記載の音声応答装
置。 - 【請求項4】 上記合成音声内の重要度の低い語群を削
除するための読み飛ばし手段をさらに備え、 上記合成音声を再出力する際には重要度の低い語群につ
いては省略して再出力を行うことを特徴とする請求項1
ないし3のいずれかに記載の音声応答装置。 - 【請求項5】 上記合成音声の話速を変更するための話
速変更手段をさらに備え、 上記合成音声を再出力する際には話速を変更して行うこ
とを特徴とする請求項1ないし4のいずれかに記載の音
声応答装置。 - 【請求項6】 上記合成音声のピッチを変更するための
ピッチ変更手段をさらに備え、 上記合成音声を再出力する際にはピッチを変更して行う
ことを特徴とする請求項1ないし5のいずれかに記載の
音声応答装置。 - 【請求項7】 上記合成音声内の文節単位の語順の変更
を行うための語順変更手段をさらに備え、 上記合成音声を再出力する際には語順を変更して行うこ
とを特徴とする請求項1ないし6のいずれかに記載の音
声応答装置。 - 【請求項8】 類似語を記憶している類似語辞書手段
と、 上記類似語辞書手段の類似語を参照して、上記合成音声
内の単語を他の類似語に変更するための類似語変更手段
とをさらに備え、 上記合成音声を再出力する際には、上記合成音声内の単
語を他の類似語に変更して行うことを特徴とする請求項
1ないし7のいずれかに記載の音声応答装置。 - 【請求項9】 単語に対応する説明文を記憶している説
明文用辞書手段と、 上記説明文用辞書手段を参照して、上記合成音声内の単
語に対応する説明文を生成して、上記合成音声内に挿入
するための説明文生成手段をさらに備え、 上記合成音声を再出力する際には上記合成音声内の単語
に対する説明文を追加して行うことを特徴とする請求項
1ないし8のいずれかに記載の音声応答装置。 - 【請求項10】 通常文のテンプレートを記憶している
テンプレート手段と、 上記通常文をより詳細に説明した詳細説明テンプレート
を記憶している詳細説明テンプレート手段と、 上記通常文のテンプレートおよび上記詳細説明テンプレ
ート内に挿入するための単語を記憶している単語音声デ
ータベース手段とを備え、 上記合成音声を最初に出力する際には上記通常文のテン
プレートで行い、再出力する際には上記詳細説明テンプ
レートで行うことを特徴とする請求項1ないし9のいず
れかに記載の音声応答装置。 - 【請求項11】 聞き間違い易い音節の組を記憶してい
る異聴マトリクス手段と、 類義語音声データを記憶している類義語音声データベー
ス手段と、 上記異聴マトリクス手段を参照して、上記合成音声内の
単語が上記異聴マトリクスに存在する音声を含んでいる
場合に、上記類義語音声データベースから類義語を選択
して、上記単語を他の類義語に変換するための類義語変
換部とを備えたことを特徴とする請求項1ないし10の
いずれかに記載の音声応答装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11075541A JP2000267687A (ja) | 1999-03-19 | 1999-03-19 | 音声応答装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11075541A JP2000267687A (ja) | 1999-03-19 | 1999-03-19 | 音声応答装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000267687A true JP2000267687A (ja) | 2000-09-29 |
Family
ID=13579175
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11075541A Pending JP2000267687A (ja) | 1999-03-19 | 1999-03-19 | 音声応答装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000267687A (ja) |
Cited By (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2002082423A1 (en) * | 2001-04-05 | 2002-10-17 | Sony Corporation | Word sequence output device |
| JP2003263184A (ja) * | 2002-03-07 | 2003-09-19 | Canon Inc | 音声合成装置及びその方法、プログラム |
| JP2006146720A (ja) * | 2004-11-22 | 2006-06-08 | Pioneer Electronic Corp | 情報送信装置、情報受信装置及び情報送受信システム |
| JP2006208793A (ja) * | 2005-01-28 | 2006-08-10 | Alpine Electronics Inc | 音声処理装置、音声処理方法およびプログラム |
| JP2006301446A (ja) * | 2005-04-22 | 2006-11-02 | Fujitsu Ltd | 読み生成装置、読み生成方法及びコンピュータプログラム |
| JP2008102310A (ja) * | 2006-10-19 | 2008-05-01 | Alpine Electronics Inc | 音声出力装置 |
| JP2008152356A (ja) * | 2006-12-14 | 2008-07-03 | Sharp Corp | 音声合成装置及び音声合成プログラム |
| JP2008185911A (ja) * | 2007-01-31 | 2008-08-14 | Arcadia:Kk | 音声合成装置 |
| WO2009025155A1 (ja) * | 2007-08-21 | 2009-02-26 | Voxmol Llc | 音声再生方法、音声再生装置およびコンピュータ・プログラム |
| JP2010072641A (ja) * | 2008-08-21 | 2010-04-02 | Yamaha Corp | 音声再生装置 |
| US8135592B2 (en) | 2006-03-31 | 2012-03-13 | Fujitsu Limited | Speech synthesizer |
| JP2012073519A (ja) * | 2010-09-29 | 2012-04-12 | Toshiba Corp | 読み上げ支援装置、方法、およびプログラム |
| KR20120056397A (ko) * | 2010-11-25 | 2012-06-04 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
| JP2013200423A (ja) * | 2012-03-23 | 2013-10-03 | Toshiba Corp | 音声対話支援装置、方法、およびプログラム |
| WO2016042815A1 (en) * | 2014-09-18 | 2016-03-24 | Kabushiki Kaisha Toshiba | Speech interaction apparatus and method |
| JP2019124815A (ja) * | 2018-01-16 | 2019-07-25 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | コミュニケーションシステム、コミュニケーション方法およびコミュニケーションプログラム |
| JP2024012978A (ja) * | 2022-07-19 | 2024-01-31 | トヨタ自動車株式会社 | 情報提供システム |
Citations (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01266598A (ja) * | 1988-04-18 | 1989-10-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声出力装置 |
| JPH0281099A (ja) * | 1988-09-19 | 1990-03-22 | Ricoh Co Ltd | テキスト音声合成装置 |
| JPH04177526A (ja) * | 1990-11-09 | 1992-06-24 | Hitachi Ltd | 文章読み上げ装置 |
| JPH05197384A (ja) * | 1992-01-23 | 1993-08-06 | Nippon Telegr & Teleph Corp <Ntt> | 音声読み上げ装置 |
| JPH06250815A (ja) * | 1993-02-23 | 1994-09-09 | Toshiba Corp | ボイスメール端末 |
| JPH06338946A (ja) * | 1993-05-27 | 1994-12-06 | Toshiba Corp | ボイスメール端末 |
| JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
| WO1997037344A1 (fr) * | 1996-03-29 | 1997-10-09 | Hitachi, Ltd. | Terminal possedant une fonction de synthese vocale et systeme dispensant des donnees caracteres utilisant ce terminal |
| JPH09325796A (ja) * | 1996-06-06 | 1997-12-16 | Oki Electric Ind Co Ltd | 文書朗読装置 |
| JPH10105192A (ja) * | 1996-10-03 | 1998-04-24 | Toyota Motor Corp | 車両用音声案内装置 |
| JPH10105370A (ja) * | 1996-09-25 | 1998-04-24 | Canon Inc | 文書読み上げ装置,文書読み上げ方法および記憶媒体 |
| JPH10260976A (ja) * | 1997-03-18 | 1998-09-29 | Ricoh Co Ltd | 音声対話方法 |
-
1999
- 1999-03-19 JP JP11075541A patent/JP2000267687A/ja active Pending
Patent Citations (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01266598A (ja) * | 1988-04-18 | 1989-10-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声出力装置 |
| JPH0281099A (ja) * | 1988-09-19 | 1990-03-22 | Ricoh Co Ltd | テキスト音声合成装置 |
| JPH04177526A (ja) * | 1990-11-09 | 1992-06-24 | Hitachi Ltd | 文章読み上げ装置 |
| JPH05197384A (ja) * | 1992-01-23 | 1993-08-06 | Nippon Telegr & Teleph Corp <Ntt> | 音声読み上げ装置 |
| JPH06250815A (ja) * | 1993-02-23 | 1994-09-09 | Toshiba Corp | ボイスメール端末 |
| JPH06338946A (ja) * | 1993-05-27 | 1994-12-06 | Toshiba Corp | ボイスメール端末 |
| JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
| WO1997037344A1 (fr) * | 1996-03-29 | 1997-10-09 | Hitachi, Ltd. | Terminal possedant une fonction de synthese vocale et systeme dispensant des donnees caracteres utilisant ce terminal |
| JPH09325796A (ja) * | 1996-06-06 | 1997-12-16 | Oki Electric Ind Co Ltd | 文書朗読装置 |
| JPH10105370A (ja) * | 1996-09-25 | 1998-04-24 | Canon Inc | 文書読み上げ装置,文書読み上げ方法および記憶媒体 |
| JPH10105192A (ja) * | 1996-10-03 | 1998-04-24 | Toyota Motor Corp | 車両用音声案内装置 |
| JPH10260976A (ja) * | 1997-03-18 | 1998-09-29 | Ricoh Co Ltd | 音声対話方法 |
Cited By (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7233900B2 (en) | 2001-04-05 | 2007-06-19 | Sony Corporation | Word sequence output device |
| WO2002082423A1 (en) * | 2001-04-05 | 2002-10-17 | Sony Corporation | Word sequence output device |
| JP2003263184A (ja) * | 2002-03-07 | 2003-09-19 | Canon Inc | 音声合成装置及びその方法、プログラム |
| US7353175B2 (en) | 2002-03-07 | 2008-04-01 | Canon Kabushiki Kaisha | Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user |
| JP2006146720A (ja) * | 2004-11-22 | 2006-06-08 | Pioneer Electronic Corp | 情報送信装置、情報受信装置及び情報送受信システム |
| JP2006208793A (ja) * | 2005-01-28 | 2006-08-10 | Alpine Electronics Inc | 音声処理装置、音声処理方法およびプログラム |
| JP2006301446A (ja) * | 2005-04-22 | 2006-11-02 | Fujitsu Ltd | 読み生成装置、読み生成方法及びコンピュータプログラム |
| US8135592B2 (en) | 2006-03-31 | 2012-03-13 | Fujitsu Limited | Speech synthesizer |
| JP2008102310A (ja) * | 2006-10-19 | 2008-05-01 | Alpine Electronics Inc | 音声出力装置 |
| JP2008152356A (ja) * | 2006-12-14 | 2008-07-03 | Sharp Corp | 音声合成装置及び音声合成プログラム |
| JP2008185911A (ja) * | 2007-01-31 | 2008-08-14 | Arcadia:Kk | 音声合成装置 |
| WO2009025155A1 (ja) * | 2007-08-21 | 2009-02-26 | Voxmol Llc | 音声再生方法、音声再生装置およびコンピュータ・プログラム |
| JP2010072641A (ja) * | 2008-08-21 | 2010-04-02 | Yamaha Corp | 音声再生装置 |
| JP2012073519A (ja) * | 2010-09-29 | 2012-04-12 | Toshiba Corp | 読み上げ支援装置、方法、およびプログラム |
| US9009051B2 (en) | 2010-09-29 | 2015-04-14 | Kabushiki Kaisha Toshiba | Apparatus, method, and program for reading aloud documents based upon a calculated word presentation order |
| KR20120056397A (ko) * | 2010-11-25 | 2012-06-04 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
| KR101715381B1 (ko) * | 2010-11-25 | 2017-03-10 | 삼성전자 주식회사 | 전자장치 및 그 제어방법 |
| JP2013200423A (ja) * | 2012-03-23 | 2013-10-03 | Toshiba Corp | 音声対話支援装置、方法、およびプログラム |
| WO2016042815A1 (en) * | 2014-09-18 | 2016-03-24 | Kabushiki Kaisha Toshiba | Speech interaction apparatus and method |
| JP2019124815A (ja) * | 2018-01-16 | 2019-07-25 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | コミュニケーションシステム、コミュニケーション方法およびコミュニケーションプログラム |
| JP7000171B2 (ja) | 2018-01-16 | 2022-01-19 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | コミュニケーションシステム、コミュニケーション方法およびコミュニケーションプログラム |
| JP2024012978A (ja) * | 2022-07-19 | 2024-01-31 | トヨタ自動車株式会社 | 情報提供システム |
| JP7726147B2 (ja) | 2022-07-19 | 2025-08-20 | トヨタ自動車株式会社 | 情報提供システム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3224000B2 (ja) | テキスト−音声変換システム | |
| US6161087A (en) | Speech-recognition-assisted selective suppression of silent and filled speech pauses during playback of an audio recording | |
| US7062440B2 (en) | Monitoring text to speech output to effect control of barge-in | |
| JP2000267687A (ja) | 音声応答装置 | |
| US20020184027A1 (en) | Speech synthesis apparatus and selection method | |
| US20020184029A1 (en) | Speech synthesis apparatus and method | |
| US7010489B1 (en) | Method for guiding text-to-speech output timing using speech recognition markers | |
| US20020184030A1 (en) | Speech synthesis apparatus and method | |
| JPH08512150A (ja) | ニューラル・ネットワークを利用してテキストを可聴信号に変換する方法および装置 | |
| JP2003186379A (ja) | 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム | |
| JP2007086316A (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体 | |
| JP3518898B2 (ja) | 音声合成装置 | |
| JP4409279B2 (ja) | 音声合成装置及び音声合成プログラム | |
| JPH08335096A (ja) | テキスト音声合成装置 | |
| JP3513232B2 (ja) | 情報処理装置及びその制御方法 | |
| JP3277579B2 (ja) | 音声認識方法および装置 | |
| Henton | Challenges and rewards in using parametric or concatenative speech synthesis | |
| JP3685648B2 (ja) | 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機 | |
| JPS6315294A (ja) | 音声分析装置 | |
| JP3292218B2 (ja) | 音声メッセージ作成装置 | |
| JP2006017819A (ja) | 音声合成方法、音声合成プログラム及び音声合成装置 | |
| JPH1063287A (ja) | 発音訓練装置 | |
| Ojala | Auditory quality evaluation of present Finnish text-to-speech systems | |
| JPH08248990A (ja) | 音声合成装置 | |
| JPH01266598A (ja) | 音声出力装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040917 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061114 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070112 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070206 |