JPH05232993A

JPH05232993A - アナウンス情報を発するための装置

Info

Publication number: JPH05232993A
Application number: JP4304257A
Authority: JP
Inventors: Hans-Wilhelm Dr Ruehl; リュールハンス−ヴィルヘルム; Peter Meyer; マイヤーペーター
Original assignee: Philips Gloeilampenfabrieken NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 1991-11-19
Filing date: 1992-11-16
Publication date: 1993-09-10
Also published as: EP1265225A1; DE69232964D1; DE69233622D1; EP1265226B1; US5621891A; EP0543459B1; EP1265226A1; DE69232964T2; DE69233622T2; EP0543459A2; DE4138016A1; EP0543459A3

Abstract

(57)【要約】【目的】本発明はアナウンス情報を発生するための装
置に関する。完全なアナウンス情報が自然スピーチ情報
によって発生される時には、大きな蓄積容量が必要とさ
れる。本装置は、大きな蓄積容量を必要としないで異な
る多数のアナウンス情報を発生することができることを
目的としている。【構成】この目的のため、アナウンス情報を発生する
ための装置は、入力ユニット（１）、自然スピーチ情報
（１１）を蓄積するための蓄積ユニット（２）、および
合成スピーチ情報（１４）を発生するためのスピーチジ
ェネレータ（３）を含み、ここには自然スピーチ情報
（１１）と合成スピーチ情報（１４）を結合させてアナ
ウンス情報（１５）を形成させるマルチプレクサ（４）
が備えられている。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はアナウンス情報を発生す
るための装置に関する。

【０００２】

【従来の技術】この種の装置は、例えば電話情報のため
に習慣的に用いられている情報装置、または運行スケジ
ュール情報装置に必要である。アナウンス情報は、例え
ば「こちらは……電話情報です、お待ち下さい。」のよ
うな基本センテンス、ドットで表わされている空の位置
において基本センテンスに挿入され得る、例えば別々の
市の名前で形成される別々のキーワードで構成される。
この基本センテンスおよび必要なキーワードは両方とも
蓄積ユニット内に自然なスピーチとして蓄積されてい
る。これは、例えば可能なキーワードの数が膨大である
ならば、多量の蓄積スペースを必要とする複雑な動作で
ある。さらに、不連続さなしで基本センテンス内にキー
ワードを挿入できるようにキーワードを発声することは
難しい。実際、特定のキーワードが異なる基本センテン
スと結び付くならば、あるいは単一の基本センテンス内
の異なる位置に結び付く時でさえ、異なる発声を必要と
するのである。

【０００３】

【発明が解決しようとする課題】大量の蓄積スペースを
必要としないで、発生されるべき異なるアナウンス情報
の多様性を許容する、アナウンス情報を発生するための
装置を提供することが本発明の目的である。

【０００４】

【課題を解決するための手段】この目的は、入力ユニッ
ト、自然スピーチ情報を蓄積するための蓄積ユニット、
および合成スピーチ情報を発生するためのスピーチジェ
ネレータを有する本発明によるアナウンス情報発生用装
置によって達成され、そこではアナウンス情報を形成す
るように自然および合成スピーチ情報を結合させるため
のマルチプレクサが備えられている。

【０００５】本発明は、頻発する基本センテンスは自然
スピーチ情報として蓄積ユニット内に蓄積されることが
でき、しばしば変更されるべきアナウンス情報はスピー
チジェネレータによって人工的に発生することができる
という事実の認識の上に成り立っている。スピーチジェ
ネレータによって発生される合成スピーチ情報は、継続
時間、リズム、アクセントおよび基本周波数変動に関し
て正確に処理され、そして自然スピーチ情報内に理想的
に挿入されることが可能である。これは、わずかな基本
センテンスが自然スピーチ情報として蓄積される必要が
あるが合成スピーチ情報は独立的に、そして即座に入力
ユニットによって入力されるので実質的に、必要とされ
る蓄積スペースを節減させる結果となる。別の長所は、
合成スピーチ情報から形成される語数の制約がないこと
である。

【０００６】例えば、電話アナウンスサービス他に用い
ることができるアナウンス装置は、その装置が、蓄積ユ
ニット内に自然スピーチ情報として蓄積されているスピ
ーチブロック、及び合成スピーチ情報から形成された、
そして個々のスピーチブロックの間に挿入されるキーワ
ードからなる少なくとも１つの基本センテンスを発生さ
せることを意図するようにして得られる。

【０００７】自然および合成スピーチ情報の単純な組合
せは、自然スピーチ情報が符号化された形式で蓄積ユニ
ット内に蓄積され、スピーチジェネレータにより発生さ
れた合成スピーチ情報は自然スピーチ情報のコードと適
合して符号化される。

【０００８】自然スピーチ情報の基本周波数変動の情報
が蓄積ユニット内に蓄積される時、この情報は自然スピ
ーチ情報内に挿入されるべき合成スピーチ情報を発生す
るためにスピーチジェネレータにより配慮される。結果
として、合成スピーチ情報の基本周波数変動は、自然お
よび合成スピーチ情報間の移行において何の不連続性も
生じないように意図される。

【０００９】アナウンス情報を出力するために必要とさ
れる装置は、出力メモリーとディジタル−アナログコン
バータを含む出力ユニットがアナウンス情報を出力する
ために設けられる時に制限される。

【００１０】簡単な出力制御は、出力ユニットが入力ユ
ニットによって制御される時に確保される。

【００１１】アナウンス情報の了解度と自然さは、自然
スピーチ情報が単一の話し手から発せられる時に実質的
に向上される。

【００１２】アナウンス情報の合成了解度と自然さと
は、スピーチジェネレータが自然スピーチ情報の話し手
のスピーチデータに基づいたスピーチモデルを含む時に
さらに改善される。

【００１３】本発明の別の特色と利点とは図面に示され
た実施例を参照しながら詳細に説明される。

【００１４】

【実施例】図１に示すようなアナウンス情報を発生する
ための装置は基本的に入力ユニット１、蓄積ユニット
２、スピーチジェネレータ３、およびマルチプレクサ４
を有している。例えばＰＣＭ符号化形式の、自然スピー
チ情報１１は蓄積ユニット２内に蓄積され、例えば入力
ユニット１に接続されることのできるマイクロホン１０
を通して自然スピーチ情報が話し手により入力される。
そのような自然スピーチを伝送するために、入力ユニッ
ト１は分割されて示されてはいないアナログオーディオ
チャンネル、アナログからＰＣＭへのコンバータおよび
作動用装置を有しており、それらはアナログ入力を変換
し、そして蓄積ユニット２内に蓄積する。さらに、自然
スピーチから組立てられたデータベースのためのデータ
マネージメントが一般的な方法で、すなわち蓄積されて
いる自然スピーチまたはメッセージが、検索を容易にす
るための適切な番号またはラベルを持つように、設けら
れる。

【００１５】別の実施例においては、自然スピーチはオ
フラインで記録されてもよく、入力ユニットはアナログ
からＰＣＭへの変換を持つ必要がなく、単に蓄積ユニッ
ト２のための検索制御装置だけを有している。

【００１６】前述に加えて、入力ユニット１はスピーチ
ジェネレータ３を制御するように動作し、そこでは入力
ユニットはスピーチジェネレータ３にワード情報を加え
るためのフルアルファニューメリカルキーボードおよび
組合せられた表示スクリーンを持ち、ワードはその構成
するキャラクターをキーイングすることによって形成さ
れる。ある場合には、ある程度の、または総ての挿入ワ
ードが既にキャラクタコード列として蓄積されており、
入力ユニット１からの選択のみが必要であるようにする
ことも可能である。キャラクタコードとしての蓄積はＰ
ＣＭコードのシーケンスとして蓄積するよりも少ないス
ペースを必要とする。その時、スピーチジェネレータ３
はワード情報１２から合成スピーチ情報１４を発生す
る。マルチプレクサ４を通して、前記合成スピーチ情報
は自然スピーチ情報１３と組合せられて、アナウンス情
報１５を形成する。アナウンス情報１５は、出力メモリ
ー９、アナログ−ディジタルコンバータ６、増幅器７お
よびスピーカー８を含む出力ユニット５を通して出力さ
れる。

【００１７】１つまたはそれ以上の基本センテンスは符
号化された形式で蓄積ユニット２内に蓄積される。その
ような基本センテンスはスピーチの個別のブロックから
なり、キーワードと呼ばれるものがスピーチの個別のブ
ロック間に挿入されることができる。挿入の場所は、例
えばフラグのような、適当なデータによって表現され
る。これもまたマルチプレクサ４に伝送される。これら
フラグは、蓄積ユニット２からの固有スピーチからスピ
ーチジェネレータ３へのマルチプレクサ４の切替えを制
御する。もし必要であれば、そのような切替えもまた、
オンスクリーンメッセージ（相互接続は示されていな
い）等によって操作者に信号返しすることができる。こ
のことは操作者に挿入ワードを明示するものとなる。挿
入ワードの終わりに、操作者は「リターン／エントリ
ー」キーを作動させる等によってマルチプレクサ４を蓄
積ユニット２に切替戻しすることができる。キーワード
は例えば市の名前、または数字であるかも知れない。例
えば「ＤｅｒＥｉｌｚｕｇｖｏｎＳ１ｎａｃｈ
Ｓ２ｈａｔｖｏｒａｕｓｓｉｃｈｔｌｉｃｈＳ
３ＭｉｎｕｔｅｎＶｅｒｓｐａｅｔｕｎｇ」（Ｓ１か
らＳ２への急行列車はＳ３分遅れる予定です）というメ
ッセージは個別スピーチブロックＢ１「ＤｅｒＥｉｌｚ
ｕｇｖｏｎ」，Ｂ２「ｎａｃｈ」，Ｂ３「ｈａｔｖ
ｏｒａｕｓｓｉｃｈｔｌｉｃｈ」，およびＢ４「Ｍｉｎ
ｕｔｅｎＶｅｒｓｐａｅｔｕｎｇ」を有し、キーワー
ドＳ１およびＳ２として異なる市の名前およびキーワー
ドＳ３として数字を有している。別々のキーワードＳ
１，Ｓ２，Ｓ３の入力は別々のアナウンス情報１５を発
生させる。

【００１８】アナウンス情報１５を発生させるための動
作は、後に説明される。例えば表示スクリーンを持つキ
ーボードである入力ユニット１を通して、蓄積ユニット
２内に蓄積されている基本センテンスから最初に１つの
望ましい基本センテンスが選択される。蓄積ユニット２
はまた、スピーチブロックＢ１，Ｂ２，Ｂ３，Ｂ４およ
びキーワードＳ１，Ｓ２，Ｓ３の間の境界における基本
周波数変動またはスロープに関する情報ＵＳ１，ＵＳ
２，ＵＳ３を蓄積している。入力ユニット１を通して、
キーワードＳ１，Ｓ２，Ｓ３が、例えば普通のテキスト
のような任意のコード化された形式で入力される。キー
ワードＳ１，Ｓ２，Ｓ３はワード情報１２としてスピー
チジェネレータ３に加えられ、ジェネレータはキーワー
ドＳ１，Ｓ２，Ｓ３から合成スピーチ情報１４を発生す
る。自然および合成スピーチの間の移行における不連続
性、つまり合成スピーチ情報１４の発生中に理解し難
い、および／または不自然なアナウンス情報１５にさせ
る不連続性、を避けるために、情報ＵＳ１，ＵＳ２，Ｕ
Ｓ３によってそれぞれのスピーチブロックＢ１，Ｂ２，
Ｂ３，Ｂ４の基本周波数変動に相応するパラメーターが
適応される。これは不自然なアクセントによるアナウン
ス情報への聴取者のいら立ちを防止するもので、またア
ナウンス情報を受入れやすくする。ピッチ変動に関する
情報ＵＳ１，ＵＳ２，ＵＳ３の制御の下で、スピーチジ
ェネレータ３はワード情報１２から符号化された形式の
合成スピーチ情報１４を発生する。自然スピーチ情報１
３と同様に、合成スピーチ情報１４は、スピーチブロッ
クＢ１，Ｂ２，Ｂ３，Ｂ４、すなわち自然スピーチ情報
からなる基本センテンス、を合成スピーチ情報１４から
なるキーワードＳ１，Ｓ２，Ｓ３と結合させるマルチプ
レクサ４に加えられてアナウンス情報１５を形成する
が、これは図２に詳細に示されている。合成スピーチは
適切なＰＣＭコードのシーケンスで表現されている。次
に、アナウンス情報１５は出力ユニット５の出力メモリ
ー９内に書き込まれる。出力メモリー９の出力信号１６
はＰＣＭ信号であり、これはディジタル−アナログコン
バータ６により最初にアナログ信号１７に変換される。
アナログ信号１７は増幅器７によって増幅されて、出力
信号１８としてスピーカー８に加えられる。

【００１９】図２はアナウンス情報の例を示す図であ
る。図２の上側部分はスピーチブロックＢ１，Ｂ２，Ｂ
３，Ｂ４で形成される、およびキーワードＳ１，Ｓ２，
Ｓ３で補足される、基本センテンスを示している。図２
の下側部分は時間ｔの関数としての基本周波数変動ｆを
示す図であり、この図ではセンテンス「ＤｅｒＥｉｌ
ｚｕｇｖｏｎＦｒａｎｋｆｕｒｔｎａｃｈＯｆ
ｆｅｎｂａｃｈｈａｔｖｏｒａｕｓｓｉｃｈｔｌｉｃ
ｈ１０ＭｉｎｕｔｅｎＶｅｒｓｐａｅｔｅｒｕｎ
ｇ」（フランクフルトからオッフェンバッハ行きの急行
列車は１０分遅れる予定です）が示されている。

【００２０】図２に示されている基本センテンス「Ｄｅ
ｒＥｉｌｚｕｇｖｏｎＳ１ｎａｃｈＳ２ｈａ
ｔｖｏｒａｕｓｓｉｃｈｔｌｉｃｈＳ３Ｍｉｎｕ
ｔｅｎＶｅｒｓｐａｅｔｕｎｇ」（Ｓ１からＳ２への
急行列車はＳ３分遅れる予定です）は、蓄積ユニット２
（図１）内に自然スピーチ情報１１として蓄積されてい
るスピーチブロックＢ１，Ｂ２，Ｂ３，Ｂ４を含んでい
る。キーワードＮｕｅｒｎｂｅｒｇ，Ｆｒａｎｋｆｕｒ
ｔ＝Ｓ１，Ｏｆｆｅｎｂａｃｈ＝Ｓ２および５，１０＝
Ｓ３は必要に応じて基本センテンスに挿入される。異な
るアナウンス情報もこうして発生できる。スピーチブロ
ックＢ１，Ｂ２，Ｂ３，Ｂ４とキーワードＳ１，Ｓ２，
Ｓ３との間の移行においては基本周波数変動に関する情
報ＵＳ１，ＵＳ２，ＵＳ３が各基本センテンスに関して
蓄積ユニット内に蓄積されている。このことは円によっ
て図２の中で強調されている。一方では、アナウンス情
報の不自然な印象が避けられ、そして同時にアナウンス
の明瞭度が、それが完全に合成的に発生される時よりも
実質的に向上する。

【００２１】本発明の利点は、一方では基本センテンス
を形成する自然スピーチ情報１１のみが蓄積される必要
があるため、必要とされる蓄積容量が減少するという点
にある。さらに、任意のキーワードが入力ユニット１に
よって「編集される」ことが可能であり、簡単な入力が
単にキーボードを介して可能である。こうして、キーワ
ードの数は制約されない。合成スピーチ情報１４は継続
時間、リズム、アクセント、および基本周波数変動に関
して正確に処理され、情報ＵＳ１，ＵＳ２，ＵＳ３によ
って理想的にそれぞれの基本センテンスに前記処理を適
用することが可能である。アナウンス情報１５の合成明
瞭度と自然さとは、スピーチジェネレータ３が自然スピ
ーチ情報１１の話し手のスピーチデータに基づいたスピ
ーチモデルを含む時に改善される。こうして話し手の変
化の表現も避けられる。

【００２２】

【発明の効果】大量の蓄積スペースを必要としない、多
数のアナウンス情報を許容する、アナウンス情報を発生
するための装置を提供することができる。

【図面の簡単な説明】

【図１】アナウンス情報を発生するための装置の実施例
を示す図である。

【図２】自然および合成スピーチ情報からのアナウンス
情報の合成例を示す図である。

【符号の説明】

１入力ユニット、２蓄積ユニット、３スピー
チジェネレータ、４マルチプレクサ、５出力ユニ
ット、６アナログ−ディジタルコンバータ、７
増幅器、８スピーカー、９出力メモリー、１
０マイクロホン、１１自然スピーチ情報、１２
ワード情報、１３自然スピーチ情報、１４合
成スピーチ情報、１５アナウンス情報、１６出
力信号、１７アナログ信号、１８出力信号

Claims

【特許請求の範囲】

【請求項１】アナウンス情報（１５）を発生するため
の装置において、第１及び第２制御信号を提供するため
の入力ユニット（１）と、前記第１制御信号の制御の下
でその選択的な出力のための自然スピーチ情報を蓄積す
るための蓄積ユニット（２）と、前記第２制御信号の制
御の下で合成スピーチ情報を発生するためのスピーチジ
ェネレータ（３）と、前記蓄積ユニットと前記スピーチ
ジェネレータにより当該信号の供給を受けてアナウンス
情報を組立てるため、自然スピーチ情報と合成スピーチ
情報の時間的な排他的ゲーティングするように構成され
たマルチプレクサ（４）と、を含むことを特徴とする装
置。
【請求項２】その装置が、蓄積ユニット（２）内に自
然スピーチ情報として蓄積されているスピーチブロック
（Ｂ１，Ｂ２，Ｂ３，Ｂ４）からなる少なくとも１つの
基本センテンスおよび、合成スピーチ情報（１４）から
形成される、そして個々のスピーチブロック（Ｂ１，Ｂ
２，Ｂ３，Ｂ４）の間に挿入されることのできる、キー
ワード（Ｓ１，Ｓ２，Ｓ３）を発生させるよう配置され
ているような、請求項１記載の装置。
【請求項３】蓄積ユニット（２）内に蓄積されている
自然スピーチ情報が符号化された形式であり、スピーチ
ジェネレータ（３）によって発生される合成スピーチ情
報（１４）は自然スピーチ情報のコードと調和して符号
化されるような、請求項１又は２記載の装置。
【請求項４】蓄積ユニット（２）が、自然スピーチ情
報の基本周波数変動に関する情報（ＵＳ１，ＵＳ２，Ｕ
Ｓ３）を蓄積しているような、請求項１から３までのい
ずれか１項記載の装置。
【請求項５】アナウンス情報（１５）の出力のため
に、出力メモリー（９）およびディジタル−アナログコ
ンバータ（６）を含む出力ユニット（５）が設けられて
いるような、請求項１から４までのいずれか１項記載の
装置。
【請求項６】出力ユニット（５）が入力ユニット
（１）によって制御可能であるような、請求項１から５
までのいずれか１項記載の装置。
【請求項７】自然スピーチ情報が一人の話し手だけか
ら得られるような、請求項１から６までのいずれか１項
記載の装置。
【請求項８】スピーチジェネレータ（３）が、自然ス
ピーチ情報の話し手のスピーチデータに基づくスピーチ
モデルを含むような、請求項１から７までのいずれか１
項記載の装置。
【請求項９】自然スピーチ情報が、入力ユニット
（１）に接続可能なマイクロホン（１０）を通して入力
可能であるような、請求項１から８までのいずれか１項
記載の装置。