JPH05232993A - アナウンス情報を発するための装置 - Google Patents
アナウンス情報を発するための装置Info
- Publication number
- JPH05232993A JPH05232993A JP4304257A JP30425792A JPH05232993A JP H05232993 A JPH05232993 A JP H05232993A JP 4304257 A JP4304257 A JP 4304257A JP 30425792 A JP30425792 A JP 30425792A JP H05232993 A JPH05232993 A JP H05232993A
- Authority
- JP
- Japan
- Prior art keywords
- information
- speech
- natural
- speech information
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 本発明はアナウンス情報を発生するための装
置に関する。完全なアナウンス情報が自然スピーチ情報
によって発生される時には、大きな蓄積容量が必要とさ
れる。本装置は、大きな蓄積容量を必要としないで異な
る多数のアナウンス情報を発生することができることを
目的としている。 【構成】 この目的のため、アナウンス情報を発生する
ための装置は、入力ユニット(1)、自然スピーチ情報
(11)を蓄積するための蓄積ユニット(2)、および
合成スピーチ情報(14)を発生するためのスピーチジ
ェネレータ(3)を含み、ここには自然スピーチ情報
(11)と合成スピーチ情報(14)を結合させてアナ
ウンス情報(15)を形成させるマルチプレクサ(4)
が備えられている。
置に関する。完全なアナウンス情報が自然スピーチ情報
によって発生される時には、大きな蓄積容量が必要とさ
れる。本装置は、大きな蓄積容量を必要としないで異な
る多数のアナウンス情報を発生することができることを
目的としている。 【構成】 この目的のため、アナウンス情報を発生する
ための装置は、入力ユニット(1)、自然スピーチ情報
(11)を蓄積するための蓄積ユニット(2)、および
合成スピーチ情報(14)を発生するためのスピーチジ
ェネレータ(3)を含み、ここには自然スピーチ情報
(11)と合成スピーチ情報(14)を結合させてアナ
ウンス情報(15)を形成させるマルチプレクサ(4)
が備えられている。
Description
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はアナウンス情報を発生す
るための装置に関する。
るための装置に関する。
【0002】
【従来の技術】この種の装置は、例えば電話情報のため
に習慣的に用いられている情報装置、または運行スケジ
ュール情報装置に必要である。アナウンス情報は、例え
ば「こちらは……電話情報です、お待ち下さい。」のよ
うな基本センテンス、ドットで表わされている空の位置
において基本センテンスに挿入され得る、例えば別々の
市の名前で形成される別々のキーワードで構成される。
この基本センテンスおよび必要なキーワードは両方とも
蓄積ユニット内に自然なスピーチとして蓄積されてい
る。これは、例えば可能なキーワードの数が膨大である
ならば、多量の蓄積スペースを必要とする複雑な動作で
ある。さらに、不連続さなしで基本センテンス内にキー
ワードを挿入できるようにキーワードを発声することは
難しい。実際、特定のキーワードが異なる基本センテン
スと結び付くならば、あるいは単一の基本センテンス内
の異なる位置に結び付く時でさえ、異なる発声を必要と
するのである。
に習慣的に用いられている情報装置、または運行スケジ
ュール情報装置に必要である。アナウンス情報は、例え
ば「こちらは……電話情報です、お待ち下さい。」のよ
うな基本センテンス、ドットで表わされている空の位置
において基本センテンスに挿入され得る、例えば別々の
市の名前で形成される別々のキーワードで構成される。
この基本センテンスおよび必要なキーワードは両方とも
蓄積ユニット内に自然なスピーチとして蓄積されてい
る。これは、例えば可能なキーワードの数が膨大である
ならば、多量の蓄積スペースを必要とする複雑な動作で
ある。さらに、不連続さなしで基本センテンス内にキー
ワードを挿入できるようにキーワードを発声することは
難しい。実際、特定のキーワードが異なる基本センテン
スと結び付くならば、あるいは単一の基本センテンス内
の異なる位置に結び付く時でさえ、異なる発声を必要と
するのである。
【0003】
【発明が解決しようとする課題】大量の蓄積スペースを
必要としないで、発生されるべき異なるアナウンス情報
の多様性を許容する、アナウンス情報を発生するための
装置を提供することが本発明の目的である。
必要としないで、発生されるべき異なるアナウンス情報
の多様性を許容する、アナウンス情報を発生するための
装置を提供することが本発明の目的である。
【0004】
【課題を解決するための手段】この目的は、入力ユニッ
ト、自然スピーチ情報を蓄積するための蓄積ユニット、
および合成スピーチ情報を発生するためのスピーチジェ
ネレータを有する本発明によるアナウンス情報発生用装
置によって達成され、そこではアナウンス情報を形成す
るように自然および合成スピーチ情報を結合させるため
のマルチプレクサが備えられている。
ト、自然スピーチ情報を蓄積するための蓄積ユニット、
および合成スピーチ情報を発生するためのスピーチジェ
ネレータを有する本発明によるアナウンス情報発生用装
置によって達成され、そこではアナウンス情報を形成す
るように自然および合成スピーチ情報を結合させるため
のマルチプレクサが備えられている。
【0005】本発明は、頻発する基本センテンスは自然
スピーチ情報として蓄積ユニット内に蓄積されることが
でき、しばしば変更されるべきアナウンス情報はスピー
チジェネレータによって人工的に発生することができる
という事実の認識の上に成り立っている。スピーチジェ
ネレータによって発生される合成スピーチ情報は、継続
時間、リズム、アクセントおよび基本周波数変動に関し
て正確に処理され、そして自然スピーチ情報内に理想的
に挿入されることが可能である。これは、わずかな基本
センテンスが自然スピーチ情報として蓄積される必要が
あるが合成スピーチ情報は独立的に、そして即座に入力
ユニットによって入力されるので実質的に、必要とされ
る蓄積スペースを節減させる結果となる。別の長所は、
合成スピーチ情報から形成される語数の制約がないこと
である。
スピーチ情報として蓄積ユニット内に蓄積されることが
でき、しばしば変更されるべきアナウンス情報はスピー
チジェネレータによって人工的に発生することができる
という事実の認識の上に成り立っている。スピーチジェ
ネレータによって発生される合成スピーチ情報は、継続
時間、リズム、アクセントおよび基本周波数変動に関し
て正確に処理され、そして自然スピーチ情報内に理想的
に挿入されることが可能である。これは、わずかな基本
センテンスが自然スピーチ情報として蓄積される必要が
あるが合成スピーチ情報は独立的に、そして即座に入力
ユニットによって入力されるので実質的に、必要とされ
る蓄積スペースを節減させる結果となる。別の長所は、
合成スピーチ情報から形成される語数の制約がないこと
である。
【0006】例えば、電話アナウンスサービス他に用い
ることができるアナウンス装置は、その装置が、蓄積ユ
ニット内に自然スピーチ情報として蓄積されているスピ
ーチブロック、及び合成スピーチ情報から形成された、
そして個々のスピーチブロックの間に挿入されるキーワ
ードからなる少なくとも1つの基本センテンスを発生さ
せることを意図するようにして得られる。
ることができるアナウンス装置は、その装置が、蓄積ユ
ニット内に自然スピーチ情報として蓄積されているスピ
ーチブロック、及び合成スピーチ情報から形成された、
そして個々のスピーチブロックの間に挿入されるキーワ
ードからなる少なくとも1つの基本センテンスを発生さ
せることを意図するようにして得られる。
【0007】自然および合成スピーチ情報の単純な組合
せは、自然スピーチ情報が符号化された形式で蓄積ユニ
ット内に蓄積され、スピーチジェネレータにより発生さ
れた合成スピーチ情報は自然スピーチ情報のコードと適
合して符号化される。
せは、自然スピーチ情報が符号化された形式で蓄積ユニ
ット内に蓄積され、スピーチジェネレータにより発生さ
れた合成スピーチ情報は自然スピーチ情報のコードと適
合して符号化される。
【0008】自然スピーチ情報の基本周波数変動の情報
が蓄積ユニット内に蓄積される時、この情報は自然スピ
ーチ情報内に挿入されるべき合成スピーチ情報を発生す
るためにスピーチジェネレータにより配慮される。結果
として、合成スピーチ情報の基本周波数変動は、自然お
よび合成スピーチ情報間の移行において何の不連続性も
生じないように意図される。
が蓄積ユニット内に蓄積される時、この情報は自然スピ
ーチ情報内に挿入されるべき合成スピーチ情報を発生す
るためにスピーチジェネレータにより配慮される。結果
として、合成スピーチ情報の基本周波数変動は、自然お
よび合成スピーチ情報間の移行において何の不連続性も
生じないように意図される。
【0009】アナウンス情報を出力するために必要とさ
れる装置は、出力メモリーとディジタル−アナログコン
バータを含む出力ユニットがアナウンス情報を出力する
ために設けられる時に制限される。
れる装置は、出力メモリーとディジタル−アナログコン
バータを含む出力ユニットがアナウンス情報を出力する
ために設けられる時に制限される。
【0010】簡単な出力制御は、出力ユニットが入力ユ
ニットによって制御される時に確保される。
ニットによって制御される時に確保される。
【0011】アナウンス情報の了解度と自然さは、自然
スピーチ情報が単一の話し手から発せられる時に実質的
に向上される。
スピーチ情報が単一の話し手から発せられる時に実質的
に向上される。
【0012】アナウンス情報の合成了解度と自然さと
は、スピーチジェネレータが自然スピーチ情報の話し手
のスピーチデータに基づいたスピーチモデルを含む時に
さらに改善される。
は、スピーチジェネレータが自然スピーチ情報の話し手
のスピーチデータに基づいたスピーチモデルを含む時に
さらに改善される。
【0013】本発明の別の特色と利点とは図面に示され
た実施例を参照しながら詳細に説明される。
た実施例を参照しながら詳細に説明される。
【0014】
【実施例】図1に示すようなアナウンス情報を発生する
ための装置は基本的に入力ユニット1、蓄積ユニット
2、スピーチジェネレータ3、およびマルチプレクサ4
を有している。例えばPCM符号化形式の、自然スピー
チ情報11は蓄積ユニット2内に蓄積され、例えば入力
ユニット1に接続されることのできるマイクロホン10
を通して自然スピーチ情報が話し手により入力される。
そのような自然スピーチを伝送するために、入力ユニッ
ト1は分割されて示されてはいないアナログオーディオ
チャンネル、アナログからPCMへのコンバータおよび
作動用装置を有しており、それらはアナログ入力を変換
し、そして蓄積ユニット2内に蓄積する。さらに、自然
スピーチから組立てられたデータベースのためのデータ
マネージメントが一般的な方法で、すなわち蓄積されて
いる自然スピーチまたはメッセージが、検索を容易にす
るための適切な番号またはラベルを持つように、設けら
れる。
ための装置は基本的に入力ユニット1、蓄積ユニット
2、スピーチジェネレータ3、およびマルチプレクサ4
を有している。例えばPCM符号化形式の、自然スピー
チ情報11は蓄積ユニット2内に蓄積され、例えば入力
ユニット1に接続されることのできるマイクロホン10
を通して自然スピーチ情報が話し手により入力される。
そのような自然スピーチを伝送するために、入力ユニッ
ト1は分割されて示されてはいないアナログオーディオ
チャンネル、アナログからPCMへのコンバータおよび
作動用装置を有しており、それらはアナログ入力を変換
し、そして蓄積ユニット2内に蓄積する。さらに、自然
スピーチから組立てられたデータベースのためのデータ
マネージメントが一般的な方法で、すなわち蓄積されて
いる自然スピーチまたはメッセージが、検索を容易にす
るための適切な番号またはラベルを持つように、設けら
れる。
【0015】別の実施例においては、自然スピーチはオ
フラインで記録されてもよく、入力ユニットはアナログ
からPCMへの変換を持つ必要がなく、単に蓄積ユニッ
ト2のための検索制御装置だけを有している。
フラインで記録されてもよく、入力ユニットはアナログ
からPCMへの変換を持つ必要がなく、単に蓄積ユニッ
ト2のための検索制御装置だけを有している。
【0016】前述に加えて、入力ユニット1はスピーチ
ジェネレータ3を制御するように動作し、そこでは入力
ユニットはスピーチジェネレータ3にワード情報を加え
るためのフルアルファニューメリカルキーボードおよび
組合せられた表示スクリーンを持ち、ワードはその構成
するキャラクターをキーイングすることによって形成さ
れる。ある場合には、ある程度の、または総ての挿入ワ
ードが既にキャラクタコード列として蓄積されており、
入力ユニット1からの選択のみが必要であるようにする
ことも可能である。キャラクタコードとしての蓄積はP
CMコードのシーケンスとして蓄積するよりも少ないス
ペースを必要とする。その時、スピーチジェネレータ3
はワード情報12から合成スピーチ情報14を発生す
る。マルチプレクサ4を通して、前記合成スピーチ情報
は自然スピーチ情報13と組合せられて、アナウンス情
報15を形成する。アナウンス情報15は、出力メモリ
ー9、アナログ−ディジタルコンバータ6、増幅器7お
よびスピーカー8を含む出力ユニット5を通して出力さ
れる。
ジェネレータ3を制御するように動作し、そこでは入力
ユニットはスピーチジェネレータ3にワード情報を加え
るためのフルアルファニューメリカルキーボードおよび
組合せられた表示スクリーンを持ち、ワードはその構成
するキャラクターをキーイングすることによって形成さ
れる。ある場合には、ある程度の、または総ての挿入ワ
ードが既にキャラクタコード列として蓄積されており、
入力ユニット1からの選択のみが必要であるようにする
ことも可能である。キャラクタコードとしての蓄積はP
CMコードのシーケンスとして蓄積するよりも少ないス
ペースを必要とする。その時、スピーチジェネレータ3
はワード情報12から合成スピーチ情報14を発生す
る。マルチプレクサ4を通して、前記合成スピーチ情報
は自然スピーチ情報13と組合せられて、アナウンス情
報15を形成する。アナウンス情報15は、出力メモリ
ー9、アナログ−ディジタルコンバータ6、増幅器7お
よびスピーカー8を含む出力ユニット5を通して出力さ
れる。
【0017】1つまたはそれ以上の基本センテンスは符
号化された形式で蓄積ユニット2内に蓄積される。その
ような基本センテンスはスピーチの個別のブロックから
なり、キーワードと呼ばれるものがスピーチの個別のブ
ロック間に挿入されることができる。挿入の場所は、例
えばフラグのような、適当なデータによって表現され
る。これもまたマルチプレクサ4に伝送される。これら
フラグは、蓄積ユニット2からの固有スピーチからスピ
ーチジェネレータ3へのマルチプレクサ4の切替えを制
御する。もし必要であれば、そのような切替えもまた、
オンスクリーンメッセージ(相互接続は示されていな
い)等によって操作者に信号返しすることができる。こ
のことは操作者に挿入ワードを明示するものとなる。挿
入ワードの終わりに、操作者は「リターン/エントリ
ー」キーを作動させる等によってマルチプレクサ4を蓄
積ユニット2に切替戻しすることができる。キーワード
は例えば市の名前、または数字であるかも知れない。例
えば「Der Eilzug von S1 nach
S2 hat voraussichtlich S
3Minuten Verspaetung」(S1か
らS2への急行列車はS3分遅れる予定です)というメ
ッセージは個別スピーチブロックB1「DerEilz
ug von」,B2「nach」,B3「hat v
oraussichtlich」,およびB4「Min
uten Verspaetung」を有し、キーワー
ドS1およびS2として異なる市の名前およびキーワー
ドS3として数字を有している。別々のキーワードS
1,S2,S3の入力は別々のアナウンス情報15を発
生させる。
号化された形式で蓄積ユニット2内に蓄積される。その
ような基本センテンスはスピーチの個別のブロックから
なり、キーワードと呼ばれるものがスピーチの個別のブ
ロック間に挿入されることができる。挿入の場所は、例
えばフラグのような、適当なデータによって表現され
る。これもまたマルチプレクサ4に伝送される。これら
フラグは、蓄積ユニット2からの固有スピーチからスピ
ーチジェネレータ3へのマルチプレクサ4の切替えを制
御する。もし必要であれば、そのような切替えもまた、
オンスクリーンメッセージ(相互接続は示されていな
い)等によって操作者に信号返しすることができる。こ
のことは操作者に挿入ワードを明示するものとなる。挿
入ワードの終わりに、操作者は「リターン/エントリ
ー」キーを作動させる等によってマルチプレクサ4を蓄
積ユニット2に切替戻しすることができる。キーワード
は例えば市の名前、または数字であるかも知れない。例
えば「Der Eilzug von S1 nach
S2 hat voraussichtlich S
3Minuten Verspaetung」(S1か
らS2への急行列車はS3分遅れる予定です)というメ
ッセージは個別スピーチブロックB1「DerEilz
ug von」,B2「nach」,B3「hat v
oraussichtlich」,およびB4「Min
uten Verspaetung」を有し、キーワー
ドS1およびS2として異なる市の名前およびキーワー
ドS3として数字を有している。別々のキーワードS
1,S2,S3の入力は別々のアナウンス情報15を発
生させる。
【0018】アナウンス情報15を発生させるための動
作は、後に説明される。例えば表示スクリーンを持つキ
ーボードである入力ユニット1を通して、蓄積ユニット
2内に蓄積されている基本センテンスから最初に1つの
望ましい基本センテンスが選択される。蓄積ユニット2
はまた、スピーチブロックB1,B2,B3,B4およ
びキーワードS1,S2,S3の間の境界における基本
周波数変動またはスロープに関する情報US1,US
2,US3を蓄積している。入力ユニット1を通して、
キーワードS1,S2,S3が、例えば普通のテキスト
のような任意のコード化された形式で入力される。キー
ワードS1,S2,S3はワード情報12としてスピー
チジェネレータ3に加えられ、ジェネレータはキーワー
ドS1,S2,S3から合成スピーチ情報14を発生す
る。自然および合成スピーチの間の移行における不連続
性、つまり合成スピーチ情報14の発生中に理解し難
い、および/または不自然なアナウンス情報15にさせ
る不連続性、を避けるために、情報US1,US2,U
S3によってそれぞれのスピーチブロックB1,B2,
B3,B4の基本周波数変動に相応するパラメーターが
適応される。これは不自然なアクセントによるアナウン
ス情報への聴取者のいら立ちを防止するもので、またア
ナウンス情報を受入れやすくする。ピッチ変動に関する
情報US1,US2,US3の制御の下で、スピーチジ
ェネレータ3はワード情報12から符号化された形式の
合成スピーチ情報14を発生する。自然スピーチ情報1
3と同様に、合成スピーチ情報14は、スピーチブロッ
クB1,B2,B3,B4、すなわち自然スピーチ情報
からなる基本センテンス、を合成スピーチ情報14から
なるキーワードS1,S2,S3と結合させるマルチプ
レクサ4に加えられてアナウンス情報15を形成する
が、これは図2に詳細に示されている。合成スピーチは
適切なPCMコードのシーケンスで表現されている。次
に、アナウンス情報15は出力ユニット5の出力メモリ
ー9内に書き込まれる。出力メモリー9の出力信号16
はPCM信号であり、これはディジタル−アナログコン
バータ6により最初にアナログ信号17に変換される。
アナログ信号17は増幅器7によって増幅されて、出力
信号18としてスピーカー8に加えられる。
作は、後に説明される。例えば表示スクリーンを持つキ
ーボードである入力ユニット1を通して、蓄積ユニット
2内に蓄積されている基本センテンスから最初に1つの
望ましい基本センテンスが選択される。蓄積ユニット2
はまた、スピーチブロックB1,B2,B3,B4およ
びキーワードS1,S2,S3の間の境界における基本
周波数変動またはスロープに関する情報US1,US
2,US3を蓄積している。入力ユニット1を通して、
キーワードS1,S2,S3が、例えば普通のテキスト
のような任意のコード化された形式で入力される。キー
ワードS1,S2,S3はワード情報12としてスピー
チジェネレータ3に加えられ、ジェネレータはキーワー
ドS1,S2,S3から合成スピーチ情報14を発生す
る。自然および合成スピーチの間の移行における不連続
性、つまり合成スピーチ情報14の発生中に理解し難
い、および/または不自然なアナウンス情報15にさせ
る不連続性、を避けるために、情報US1,US2,U
S3によってそれぞれのスピーチブロックB1,B2,
B3,B4の基本周波数変動に相応するパラメーターが
適応される。これは不自然なアクセントによるアナウン
ス情報への聴取者のいら立ちを防止するもので、またア
ナウンス情報を受入れやすくする。ピッチ変動に関する
情報US1,US2,US3の制御の下で、スピーチジ
ェネレータ3はワード情報12から符号化された形式の
合成スピーチ情報14を発生する。自然スピーチ情報1
3と同様に、合成スピーチ情報14は、スピーチブロッ
クB1,B2,B3,B4、すなわち自然スピーチ情報
からなる基本センテンス、を合成スピーチ情報14から
なるキーワードS1,S2,S3と結合させるマルチプ
レクサ4に加えられてアナウンス情報15を形成する
が、これは図2に詳細に示されている。合成スピーチは
適切なPCMコードのシーケンスで表現されている。次
に、アナウンス情報15は出力ユニット5の出力メモリ
ー9内に書き込まれる。出力メモリー9の出力信号16
はPCM信号であり、これはディジタル−アナログコン
バータ6により最初にアナログ信号17に変換される。
アナログ信号17は増幅器7によって増幅されて、出力
信号18としてスピーカー8に加えられる。
【0019】図2はアナウンス情報の例を示す図であ
る。図2の上側部分はスピーチブロックB1,B2,B
3,B4で形成される、およびキーワードS1,S2,
S3で補足される、基本センテンスを示している。図2
の下側部分は時間tの関数としての基本周波数変動fを
示す図であり、この図ではセンテンス「Der Eil
zug von Frankfurt nach Of
fenbach hatvoraussichtlic
h 10 Minuten Verspaeterun
g」(フランクフルトからオッフェンバッハ行きの急行
列車は10分遅れる予定です)が示されている。
る。図2の上側部分はスピーチブロックB1,B2,B
3,B4で形成される、およびキーワードS1,S2,
S3で補足される、基本センテンスを示している。図2
の下側部分は時間tの関数としての基本周波数変動fを
示す図であり、この図ではセンテンス「Der Eil
zug von Frankfurt nach Of
fenbach hatvoraussichtlic
h 10 Minuten Verspaeterun
g」(フランクフルトからオッフェンバッハ行きの急行
列車は10分遅れる予定です)が示されている。
【0020】図2に示されている基本センテンス「De
r Eilzug von S1nach S2 ha
t voraussichtlich S3 Minu
ten Verspaetung」(S1からS2への
急行列車はS3分遅れる予定です)は、蓄積ユニット2
(図1)内に自然スピーチ情報11として蓄積されてい
るスピーチブロックB1,B2,B3,B4を含んでい
る。キーワードNuernberg,Frankfur
t=S1,Offenbach=S2および5,10=
S3は必要に応じて基本センテンスに挿入される。異な
るアナウンス情報もこうして発生できる。スピーチブロ
ックB1,B2,B3,B4とキーワードS1,S2,
S3との間の移行においては基本周波数変動に関する情
報US1,US2,US3が各基本センテンスに関して
蓄積ユニット内に蓄積されている。このことは円によっ
て図2の中で強調されている。一方では、アナウンス情
報の不自然な印象が避けられ、そして同時にアナウンス
の明瞭度が、それが完全に合成的に発生される時よりも
実質的に向上する。
r Eilzug von S1nach S2 ha
t voraussichtlich S3 Minu
ten Verspaetung」(S1からS2への
急行列車はS3分遅れる予定です)は、蓄積ユニット2
(図1)内に自然スピーチ情報11として蓄積されてい
るスピーチブロックB1,B2,B3,B4を含んでい
る。キーワードNuernberg,Frankfur
t=S1,Offenbach=S2および5,10=
S3は必要に応じて基本センテンスに挿入される。異な
るアナウンス情報もこうして発生できる。スピーチブロ
ックB1,B2,B3,B4とキーワードS1,S2,
S3との間の移行においては基本周波数変動に関する情
報US1,US2,US3が各基本センテンスに関して
蓄積ユニット内に蓄積されている。このことは円によっ
て図2の中で強調されている。一方では、アナウンス情
報の不自然な印象が避けられ、そして同時にアナウンス
の明瞭度が、それが完全に合成的に発生される時よりも
実質的に向上する。
【0021】本発明の利点は、一方では基本センテンス
を形成する自然スピーチ情報11のみが蓄積される必要
があるため、必要とされる蓄積容量が減少するという点
にある。さらに、任意のキーワードが入力ユニット1に
よって「編集される」ことが可能であり、簡単な入力が
単にキーボードを介して可能である。こうして、キーワ
ードの数は制約されない。合成スピーチ情報14は継続
時間、リズム、アクセント、および基本周波数変動に関
して正確に処理され、情報US1,US2,US3によ
って理想的にそれぞれの基本センテンスに前記処理を適
用することが可能である。アナウンス情報15の合成明
瞭度と自然さとは、スピーチジェネレータ3が自然スピ
ーチ情報11の話し手のスピーチデータに基づいたスピ
ーチモデルを含む時に改善される。こうして話し手の変
化の表現も避けられる。
を形成する自然スピーチ情報11のみが蓄積される必要
があるため、必要とされる蓄積容量が減少するという点
にある。さらに、任意のキーワードが入力ユニット1に
よって「編集される」ことが可能であり、簡単な入力が
単にキーボードを介して可能である。こうして、キーワ
ードの数は制約されない。合成スピーチ情報14は継続
時間、リズム、アクセント、および基本周波数変動に関
して正確に処理され、情報US1,US2,US3によ
って理想的にそれぞれの基本センテンスに前記処理を適
用することが可能である。アナウンス情報15の合成明
瞭度と自然さとは、スピーチジェネレータ3が自然スピ
ーチ情報11の話し手のスピーチデータに基づいたスピ
ーチモデルを含む時に改善される。こうして話し手の変
化の表現も避けられる。
【0022】
【発明の効果】大量の蓄積スペースを必要としない、多
数のアナウンス情報を許容する、アナウンス情報を発生
するための装置を提供することができる。
数のアナウンス情報を許容する、アナウンス情報を発生
するための装置を提供することができる。
【図1】アナウンス情報を発生するための装置の実施例
を示す図である。
を示す図である。
【図2】自然および合成スピーチ情報からのアナウンス
情報の合成例を示す図である。
情報の合成例を示す図である。
1 入力ユニット、 2 蓄積ユニット、 3 スピー
チジェネレータ、 4マルチプレクサ、 5 出力ユニ
ット、 6 アナログ−ディジタルコンバータ、 7
増幅器、 8 スピーカー、 9 出力メモリー、 1
0 マイクロホン、 11 自然スピーチ情報、 12
ワード情報、 13 自然スピーチ情報、 14 合
成スピーチ情報、 15 アナウンス情報、 16 出
力信号、 17 アナログ信号、 18 出力信号
チジェネレータ、 4マルチプレクサ、 5 出力ユニ
ット、 6 アナログ−ディジタルコンバータ、 7
増幅器、 8 スピーカー、 9 出力メモリー、 1
0 マイクロホン、 11 自然スピーチ情報、 12
ワード情報、 13 自然スピーチ情報、 14 合
成スピーチ情報、 15 アナウンス情報、 16 出
力信号、 17 アナログ信号、 18 出力信号
Claims (9)
- 【請求項1】 アナウンス情報(15)を発生するため
の装置において、第1及び第2制御信号を提供するため
の入力ユニット(1)と、前記第1制御信号の制御の下
でその選択的な出力のための自然スピーチ情報を蓄積す
るための蓄積ユニット(2)と、前記第2制御信号の制
御の下で合成スピーチ情報を発生するためのスピーチジ
ェネレータ(3)と、前記蓄積ユニットと前記スピーチ
ジェネレータにより当該信号の供給を受けてアナウンス
情報を組立てるため、自然スピーチ情報と合成スピーチ
情報の時間的な排他的ゲーティングするように構成され
たマルチプレクサ(4)と、を含むことを特徴とする装
置。 - 【請求項2】 その装置が、蓄積ユニット(2)内に自
然スピーチ情報として蓄積されているスピーチブロック
(B1,B2,B3,B4)からなる少なくとも1つの
基本センテンスおよび、合成スピーチ情報(14)から
形成される、そして個々のスピーチブロック(B1,B
2,B3,B4)の間に挿入されることのできる、キー
ワード(S1,S2,S3)を発生させるよう配置され
ているような、請求項1記載の装置。 - 【請求項3】 蓄積ユニット(2)内に蓄積されている
自然スピーチ情報が符号化された形式であり、スピーチ
ジェネレータ(3)によって発生される合成スピーチ情
報(14)は自然スピーチ情報のコードと調和して符号
化されるような、請求項1又は2記載の装置。 - 【請求項4】 蓄積ユニット(2)が、自然スピーチ情
報の基本周波数変動に関する情報(US1,US2,U
S3)を蓄積しているような、請求項1から3までのい
ずれか1項記載の装置。 - 【請求項5】 アナウンス情報(15)の出力のため
に、出力メモリー(9)およびディジタル−アナログコ
ンバータ(6)を含む出力ユニット(5)が設けられて
いるような、請求項1から4までのいずれか1項記載の
装置。 - 【請求項6】 出力ユニット(5)が入力ユニット
(1)によって制御可能であるような、請求項1から5
までのいずれか1項記載の装置。 - 【請求項7】 自然スピーチ情報が一人の話し手だけか
ら得られるような、請求項1から6までのいずれか1項
記載の装置。 - 【請求項8】 スピーチジェネレータ(3)が、自然ス
ピーチ情報の話し手のスピーチデータに基づくスピーチ
モデルを含むような、請求項1から7までのいずれか1
項記載の装置。 - 【請求項9】 自然スピーチ情報が、入力ユニット
(1)に接続可能なマイクロホン(10)を通して入力
可能であるような、請求項1から8までのいずれか1項
記載の装置。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE4138016.9 | 1991-11-19 | ||
| DE4138016A DE4138016A1 (de) | 1991-11-19 | 1991-11-19 | Einrichtung zur erzeugung einer ansageinformation |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH05232993A true JPH05232993A (ja) | 1993-09-10 |
Family
ID=6445124
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4304257A Pending JPH05232993A (ja) | 1991-11-19 | 1992-11-16 | アナウンス情報を発するための装置 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5621891A (ja) |
| EP (3) | EP1265225A1 (ja) |
| JP (1) | JPH05232993A (ja) |
| DE (3) | DE4138016A1 (ja) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE69521783T2 (de) * | 1994-08-08 | 2002-04-25 | Siemens Ag | Navigationsvorrichtung für ein landfahrzeug mit mitteln zur erzeugung einer frühzeitigen sprachnachricht mit mehreren elementen, sowie fahrzeug damit |
| FR2733333A1 (fr) * | 1995-04-20 | 1996-10-25 | Philips Electronics Nv | Appareil d'information routiere muni d'une memoire de messages et d'un generateur de synthese vocale |
| ES2151658T3 (es) * | 1995-06-02 | 2001-01-01 | Koninkl Philips Electronics Nv | Dispositivo para la generacion de elementos de palabra codificados en un vehiculo. |
| EP0922279A3 (en) * | 1997-01-09 | 1999-09-01 | Koninklijke Philips Electronics N.V. | Method and apparatus for executing a human-machine dialogue in the form of two-sided speech as based on a modular dialogue structure |
| US6748056B1 (en) | 2000-08-11 | 2004-06-08 | Unisys Corporation | Coordination of a telephony handset session with an e-mail session in a universal messaging system |
| JP2003186490A (ja) * | 2001-12-21 | 2003-07-04 | Nissan Motor Co Ltd | テキスト音声読み上げ装置および情報提供システム |
| US7149287B1 (en) | 2002-01-17 | 2006-12-12 | Snowshore Networks, Inc. | Universal voice browser framework |
| FR2836260B1 (fr) * | 2002-02-21 | 2005-04-08 | Sanef Sa | Procede de diffusion de messages annoncant au moins un evenement |
| DE10220524B4 (de) | 2002-05-08 | 2006-08-10 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache |
| EP1363271A1 (de) | 2002-05-08 | 2003-11-19 | Sap Ag | Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs |
| US8229086B2 (en) | 2003-04-01 | 2012-07-24 | Silent Communication Ltd | Apparatus, system and method for providing silently selectable audible communication |
| EP1933300A1 (de) | 2006-12-13 | 2008-06-18 | F.Hoffmann-La Roche Ag | Sprachausgabegerät und Verfahren zur Sprechtextgenerierung |
| US8494490B2 (en) * | 2009-05-11 | 2013-07-23 | Silent Communicatin Ltd. | Method, circuit, system and application for providing messaging services |
| WO2008102365A2 (en) | 2007-02-22 | 2008-08-28 | Silent Communication Ltd. | System and method for telephone communication |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5057504A (ja) * | 1973-09-20 | 1975-05-20 | ||
| JPS6117199A (ja) * | 1984-07-04 | 1986-01-25 | 三菱電機株式会社 | 音声合成装置 |
| JPS62160495A (ja) * | 1986-01-09 | 1987-07-16 | 株式会社東芝 | 音声合成装置 |
| JPS63208098A (ja) * | 1987-02-24 | 1988-08-29 | 株式会社東芝 | 音声合成装置および方法 |
| JPH0232399A (ja) * | 1988-07-21 | 1990-02-02 | Sharp Corp | 音声合成装置 |
| JPH032799A (ja) * | 1989-05-30 | 1991-01-09 | Meidensha Corp | 音声合成装置のピッチパターン結合方式 |
| JPH0333796A (ja) * | 1989-06-29 | 1991-02-14 | Matsushita Electric Ind Co Ltd | 対話システム |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3928722A (en) * | 1973-07-16 | 1975-12-23 | Hitachi Ltd | Audio message generating apparatus used for query-reply system |
| JPS5140006A (ja) * | 1974-10-02 | 1976-04-03 | Hitachi Ltd | |
| US4117263A (en) * | 1977-11-17 | 1978-09-26 | Bell Telephone Laboratories, Incorporated | Announcement generating arrangement utilizing digitally stored speech representations |
| US4255618A (en) * | 1979-04-18 | 1981-03-10 | Gte Automatic Electric Laboratories, Incorporated | Digital intercept recorder/announcer system |
| GB2076616B (en) * | 1980-05-27 | 1984-03-07 | Suwa Seikosha Kk | Speech synthesizer |
| US4520499A (en) * | 1982-06-25 | 1985-05-28 | Milton Bradley Company | Combination speech synthesis and recognition apparatus |
| US5317671A (en) * | 1982-11-18 | 1994-05-31 | Baker Bruce R | System for method for producing synthetic plural word messages |
| US4825385A (en) * | 1983-08-22 | 1989-04-25 | Nartron Corporation | Speech processor method and apparatus |
| US4796216A (en) * | 1984-08-31 | 1989-01-03 | Texas Instruments Incorporated | Linear predictive coding technique with one multiplication step per stage |
| US5005204A (en) * | 1985-07-18 | 1991-04-02 | Raytheon Company | Digital sound synthesizer and method |
| US4856066A (en) * | 1986-11-06 | 1989-08-08 | Lemelson Jerome H | Speech communication system and method |
| DE3709523A1 (de) * | 1987-03-23 | 1988-10-13 | Bosch Gmbh Robert | Rundfunkempfaenger mit mindestens einem verkehrsfunkdecoder |
| US4979216A (en) * | 1989-02-17 | 1990-12-18 | Malsheen Bathsheba J | Text to speech synthesis system and method using context dependent vowel allophones |
-
1991
- 1991-11-19 DE DE4138016A patent/DE4138016A1/de not_active Withdrawn
-
1992
- 1992-11-16 JP JP4304257A patent/JPH05232993A/ja active Pending
- 1992-11-17 EP EP02102079A patent/EP1265225A1/en not_active Withdrawn
- 1992-11-17 EP EP92203515A patent/EP0543459B1/en not_active Expired - Lifetime
- 1992-11-17 DE DE69233622T patent/DE69233622T2/de not_active Expired - Lifetime
- 1992-11-17 DE DE69232964T patent/DE69232964T2/de not_active Expired - Lifetime
- 1992-11-17 EP EP02102080A patent/EP1265226B1/en not_active Expired - Lifetime
- 1992-11-19 US US07/978,097 patent/US5621891A/en not_active Expired - Lifetime
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5057504A (ja) * | 1973-09-20 | 1975-05-20 | ||
| JPS6117199A (ja) * | 1984-07-04 | 1986-01-25 | 三菱電機株式会社 | 音声合成装置 |
| JPS62160495A (ja) * | 1986-01-09 | 1987-07-16 | 株式会社東芝 | 音声合成装置 |
| JPS63208098A (ja) * | 1987-02-24 | 1988-08-29 | 株式会社東芝 | 音声合成装置および方法 |
| JPH0232399A (ja) * | 1988-07-21 | 1990-02-02 | Sharp Corp | 音声合成装置 |
| JPH032799A (ja) * | 1989-05-30 | 1991-01-09 | Meidensha Corp | 音声合成装置のピッチパターン結合方式 |
| JPH0333796A (ja) * | 1989-06-29 | 1991-02-14 | Matsushita Electric Ind Co Ltd | 対話システム |
Also Published As
| Publication number | Publication date |
|---|---|
| EP1265225A1 (en) | 2002-12-11 |
| DE69232964D1 (de) | 2003-04-24 |
| DE69233622D1 (de) | 2006-06-01 |
| EP1265226B1 (en) | 2006-04-26 |
| US5621891A (en) | 1997-04-15 |
| EP0543459B1 (en) | 2003-03-19 |
| EP1265226A1 (en) | 2002-12-11 |
| DE69232964T2 (de) | 2004-02-12 |
| DE69233622T2 (de) | 2007-03-01 |
| EP0543459A2 (en) | 1993-05-26 |
| DE4138016A1 (de) | 1993-05-27 |
| EP0543459A3 (en) | 1993-11-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6308086B1 (en) | Portable cellular phone with custom melody ring setting capability | |
| JPH05232993A (ja) | アナウンス情報を発するための装置 | |
| JPS6018080A (ja) | 音声情報を対応する画像情報と関連させて再生する方法および装置 | |
| JP2001358602A (ja) | 文字情報受信装置 | |
| US4461023A (en) | Registration method of registered words for use in a speech recognition system | |
| US4831653A (en) | System for registering speech information to make a voice dictionary | |
| KR0129964B1 (ko) | 악기선택 가능한 영상노래반주장치 | |
| GB2218602A (en) | Voice synthesizer | |
| BR7804104A (pt) | Sintetizador de fala | |
| JPH0549998B2 (ja) | ||
| JP2001051688A (ja) | 音声合成を用いた電子メール読み上げ装置 | |
| JPH07199992A (ja) | 情報提供装置 | |
| JP3073293B2 (ja) | 音声情報出力システム | |
| US5740319A (en) | Prosodic number string synthesis | |
| JPH03145698A (ja) | 音声合成装置 | |
| JPS5763467A (en) | Voice inputting/outputting watch | |
| JPH02149059A (ja) | データ送受信装置およびこれを用いたファクシミリ装置 | |
| JPS63169159A (ja) | 音声応答システム | |
| JPH0443297B2 (ja) | ||
| JPH0685704A (ja) | 音声受信表示装置 | |
| Green | Developments in synthetic speech | |
| JPH0627999A (ja) | 音声蓄積再生方式 | |
| JPH04316100A (ja) | 音声案内制御システム | |
| EP0615371A2 (en) | Audio output equipment for a portable telephone | |
| JPH11344997A (ja) | 音声合成方法 |