JPH10161690A - 音声通信システム及び音声合成装置及びデータ送信装置 - Google Patents

音声通信システム及び音声合成装置及びデータ送信装置

Info

Publication number
JPH10161690A
JPH10161690A JP8323151A JP32315196A JPH10161690A JP H10161690 A JPH10161690 A JP H10161690A JP 8323151 A JP8323151 A JP 8323151A JP 32315196 A JP32315196 A JP 32315196A JP H10161690 A JPH10161690 A JP H10161690A
Authority
JP
Japan
Prior art keywords
data
processing
paragraph
voice
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8323151A
Other languages
English (en)
Inventor
Hiroyuki Fujimoto
博之 藤本
Toshitaka Yamato
俊孝 大和
Masato Maruoka
正人 丸岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP8323151A priority Critical patent/JPH10161690A/ja
Publication of JPH10161690A publication Critical patent/JPH10161690A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】音声合成機能を有する電子機器の小型化や低価
格化を実現する。 【解決手段】データを送信するデータ送信装置と、送信
装置からのデータを音声に変換して音声再生するデータ
受信装置からなる音声通信システムに於いて、データ送
信装置は、文字データを文字データの発音で表現する表
音データに変換する表音データ変換手段と、表音データ
変換手段により変換された表音データを送信する送信手
段とを有し、データ受信装置は、送信手段により送信さ
れた表音データを受信する受信手段と、受信手段により
受信された表音データを音声信号に変換する音声信号変
換手段とを有することを特徴とする音声通信システム。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データを送信し、
該送信されたデータが受信側で音声合成され、音声とし
て出力される通信システムに関する。
【0002】
【従来の技術】近年、電子機器に音声合成技術を用いて
各種情報を音声出力することが多くなってきた。例え
ば、FM多重受信機では、多重通信にて送られてきた交
通情報等の文字データを表示器に表示するだけでなく、
その文字データを音声合成技術により音声化し、交通情
報等を音声として再生することが行われている。
【0003】音声合成を行う場合、文字データを文節等
に区切る処理や、再生音を機械ではなく人が喋ったよう
にするためにアクセントやイントネーションを付加する
処理等が行われる。そして、それらの処理はマイクロコ
ンピュータ(マイコン)を用いて行い、それら処理のた
めには言語解読やアクセント付加のためのデータ、所謂
辞書と言われている莫大なデータが必要となる。又、音
声合成処理は多くの処理を必要とするため、マイコンの
負担が大きく、高速処理可能なマイコンが必要であり、
又処理のための大容量のメモリも必要となる。
【0004】
【発明が解決しようとする課題】一方、電子機器は小型
化が望まれる傾向にあり、特に車載用機器や携帯用機器
では、取付場所や持ち運びの便利さから、その傾向が強
い。しかし、小型化を実現するためには、マイコンの負
担を小さくしたり、メモリの容量を小さくする必要があ
るので、小型化を図ると音声合成がうまくできなくなる
問題が発生する。
【0005】又、高速処理可能なマイコンや大容量のメ
モリを使用すると電子機器が高価格化する問題も発生す
る。本発明は、このような問題を解決するもので、音声
合成機能を有する電子機器の小型化や低価格化を実現す
ることを課題とする。
【0006】
【課題を解決するための手段】本発明は上記課題を解決
するために、データを送信するデータ送信装置と、該デ
ータ送信装置からのデータを音声に変換して音声再生す
るデータ受信装置からなる音声通信システムに於いて、
前記データ送信装置は、文字データを文字データの発音
で表現する表音データに変換する表音データ変換手段
と、該表音データ変換手段により変換された表音データ
を送信する送信手段とを有し、前記データ受信装置は、
前記送信手段により送信された表音データを受信する受
信手段と、該受信手段により受信された表音データを音
声信号に変換する音声信号変換手段とを有することを特
徴とする。
【0007】又、文字データの発音を表現する表音デー
タを送信する送信装置からの表音データを受信する音声
合成装置に於いて、前記送信手段により送信された表音
データを受信する受信手段と、該受信手段により受信さ
れた表音データを音声信号に変換する音声信号変換手段
とを有することを特徴とする。又、データを送信するデ
ータ送信装置に於いて、文字データの発音を表現する表
音データに変換する表音データ変換手段と、該表音デー
タ変換手段により変換された表音データを送信する送信
手段とを有することを特徴とする。
【0008】又、前記音声信号変換手段は、前記表音デ
ータの呼気段落の長さである段落長を検出する段落長検
出手段と、該段落長検出手段により検出された段落長に
応じて、音声合成処理単位を、呼気段落単位と、フレー
ズ単位で切り換える処理単位切換手段とを有することを
特徴とする。前記音声信号変換手段は、前記表音データ
の呼気段落の長さである段落長を検出する段落長検出手
段と、該段落長検出手段により検出された段落長が所定
値より長い場合に、呼気段落をフレーズで分割し、新た
な呼気段落とする呼気段落分割手段とを有することを特
徴とする。
【0009】前記音声信号処理手段により音声信号への
変換が実行できない時に、所定のメッセージを音声再生
するメッセージ再生手段を有することを特徴とする。表
音データを音声信号に変換する際に用いられる音素と波
形のデータの辞書であって、音声信号データのサンプリ
ング周波数の異なる複数の音素波形辞書と、処理に使用
する辞書を選択する第1の辞書選択手段とを有すること
を特徴とする。
【0010】前記第1の辞書選択手段は、前記段落長検
出手段により検出された段落長に応じて、処理に使用す
る辞書を選択することを特徴とする。表音データを音声
信号に変換する際に用いられる音素と波形のデータの辞
書であって、量子化ビット数の異なる複数の音素波形辞
書と、処理に使用する辞書を選択する第2の辞書選択手
段とを有することを特徴とする。
【0011】前記第2の辞書選択手段は、前記段落長検
出手段により検出された段落長に応じて、処理に使用す
る辞書を選択することを特徴とする。表音データを音声
信号に変換する際における、波形接続処理のデータ有効
ビット数を調整する波形接続処理調整手段を有すること
を特徴とする。前記波形接続処理調整手段は、前記段落
長検出手段により検出された段落長に応じて、データ有
効ビット数を調整することを特徴とする。
【0012】表音データを音声信号に変換する際におけ
る、ビッチ生成処理のビッチ生成間隔を調整するビッチ
生成処理調整手段を有することを特徴とする。前記ビッ
チ生成処理調整手段は、前記段落長検出手段により検出
された段落長に応じて、ピッチ生成間隔を調整すること
を特徴とする。表音データを受信する受信装置の種別を
認識する種別認識手段と、前記種別認識手段により認識
された受信装置の種別に応じて呼気段落長を設定する呼
気段落長設定手段とを有することを特徴とする。
【0013】
【実施例】以下、本発明の実施例に付いて図を用いて説
明する。図1は本発明の一実施例の音声通信システムを
示す機能構成図である。尚、図1には主として音声合成
処理に関連した部分のみを図示している。1は情報セン
ター等に設置された各種情報を送信するデータ送信装置
であり、又、 2はデータ送信装置1からのデータを受
信する自動車等に設置されたデータ受信装置であって、
これらデータ送信装置1とデータ受信装置2により音声
通信システムが構成される。
【0014】3は情報を記憶する情報記憶部で、ハード
(磁気)ディスクや光学ディスク等の大容量記憶装置に
より構成され、各種情報が記憶されている。4は情報記
憶装置に記憶された文字データを加工し、発音を示すデ
ータ(表音データ)に変換する言語処理部であり、マイ
クロコンピュータ(マイコン)により構成されている。
そして、言語処理部4は、文字データで表される文を読
みカナ(ア、イ・・・ン等)に分解し、そして句読点や
句読点間が長い場合に於ける適当な部分の文節間等の部
分に、文章発声中に於ける区切り(息継ぎ部分等)を示
す区切符号を付加して表音データを形成する。尚、通常
句読点により区切られる部分は呼気段落と称し、句読点
以外で区切られた部分はフレーズと称する。つまり、呼
気段落は主に句読点により区切られ、呼気段落はさらに
フレーズに分けられる。5は言語処理部4の言語処理に
用いられるデータが記憶された単語辞書部であり、磁気
ディスクやROMそしてRAM等の記憶装置により構成
されている。そして単語辞書部5には、単語の文字デー
タとそれに対応する読みデータが、またアクセントデー
タ等が記憶されており、言語処理部4はこれらのデータ
を用いて言語処理を行う。6は言語処理部4で形成され
た表音データを搬送波(電波)に載せて送信する送信部
で、発振回路、変調回路、増幅回路等により構成されて
いる。そして、これら情報記憶部3、言語処理部4、辞
書部5、送信部6等によりデータ送信装置1が形成され
ている。
【0015】7はデータ送信装置1の送信部6からの送
信信号を受信して復調し、表音データを出力する受信部
で、同調回路、検波回路等で構成されている。8は表音
データに於ける各音素の発音期間及び各音素間の無音期
間の長さに関するデータを付加する音素長生成部であ
る。つまり、表音データは各音素とその並びが規定され
ているだけであるが、音素長生成部8はこの表音データ
に於ける各音素の発音期間(音素長)及び各音素間の無
音期間を規定する。9は音素長生成部8の音素長処理に
用いられるデータが記憶された音素長テーブルであり、
ROM等の記憶装置により構成されている。そして、音
素長テーブル9には、例えば使用環境を考慮した各音素
が記憶されており、音素長生成部8は入力された表音デ
ータの音素配列パターンに応じて音素長辞書部9から音
素長データを読み出し、この音素長に基づき音素長処理
を行う。
【0016】10は音素長処理が行われた表音データに
イントネーション、アクセントを付加する処理を行うピ
ッチ生成部である。つまり、音素長処理が施された表音
データは、各音素の波形、音素長及び音素間の無音期間
の長さが規定されているが、ピッチ生成部10では、音
の高低を規定する。11は音の高低(抑揚)を付加する
ための処理に必要なデータが記憶されたイントネーショ
ンテーブルであり、ROM等の記憶装置により構成され
ている。そして、イントネーションテーブル11には、
複数のイントネーションパターンが記憶されており、ピ
ッチ生成部10は入力された文章の表音データの末の文
節境界の種類に応じてイントネーションパターンを決定
する処理を行う。又、12はアクセントを付加するため
の処理に必要なデータが記憶されたアクセントテーブル
でありROM等の記憶装置により構成されている。そし
て、アクセントテーブル12には、例えば当該単語のア
クセントのかた文章中の位置を考慮したアクセントパタ
ーンが記憶されており、ピッチ生成部10はアクセント
テーブル12からアクセントパターンを読み出し、音声
に当該アクセントパターンを付加する処理を行う。さら
に、ピッチ生成部10では、前記イントネーションパタ
ーンとアクセントパターンの重畳処理を行い、入力文章
のピッチパターンを決定する。
【0017】13は出力波形を生成する波形生成部で、
音素長データとピッチパターンから音声波形を合成す
る。14は各音素に対応する波形が記憶された音素辞書
で、ROM等の記憶装置により構成されている。そし
て、波形生成部13は各音素に対応する波形を音素辞書
14から読み出し、前記音素長データとピッチパターン
を基に波形をつなぎ合わせて音声波形を合成し出力す
る。そして、この波形生成部13から出力された音声合
成出力が、必要に応じて増幅器で増幅されてスピーカよ
り音として再生される。
【0018】図2はデータ受信装置2に於ける音声合成
処理を行う部分の具体的構成を示す構成図である。21
は受信部7からの表音データを入力するための緩衝動作
を行う入力インターフェイスである。22はマイクロコ
ンピュータ(マイコン)で、入力された表音データに演
算処理を施し、アクセント付加、イントネーション付
加、波形接続等を行う。23はROM(Read On
ly Memory)で、音素長データ、イントネーシ
ョンデータ、アクセントデータそしてマイコン22のプ
ログラム等が記憶されている。24はRAM(Rand
om Access Memory)で、マイコン24
の演算処理に於けるデータの一時記憶等に用いられる。
25はスイッチ等により構成された操作部で、データ受
信装置2の使用者がデータ種別の選択のために操作す
る。26はデジタル/アナログ変換器(D/A)で、マ
イコン22により音声合成処理されたデジタル信号をア
ナログ信号に変換する。そして、アナログ信号に変換さ
れた音声合成信号が必要に応じて増幅され、スピーカ2
7から音声として出力される。
【0019】つまり、本実施例においては、テータ送信
装置1側で言語処理を行って文章を音素と区切り符号と
からなる表音データを生成して送信する。そして、デー
タ受信装置2側では、データ送信装置1から送信された
表音データを合成音声に変換する処理を行う。従って、
データ受信装置2側では、比較的大規模な辞書(デー
タ)が必要で、また高速な処理速度が要求される言語処
理を行う必要がない。このため、データ受信装置2を比
較的小容量のメモリ及び低速のマイコンで実現でき、装
置を小型化、また低コスト化でき、特に小型化が要求さ
れる車載用装置においては有利である。
【0020】次にデータ受信装置2の小型化等に貢献す
るデータ処理方法、より具体的にはデータ処理演算に必
要なメモリの容量を低減するための処理方法について説
明する。尚、これらの処理はマイコン22により実行さ
れる。音声合成処理を行う場合、一度に処理する音素数
が多くなると、その処理に要するメモリ容量が大きくな
るという問題がある。図3に示す以下の処理(音声合成
処理1)はその問題を解決するものである。
【0021】この処理は表音データが入力された時点か
ら行われる。尚、表音データは一旦データそのものがバ
ッファメモリに総て記憶され、そしてマイコンによりバ
ッファメモリから順次読みだされて処理される。ステッ
プS1では、表音データの呼気段落内の音素数を計数
し、ステップS2に移る。ステップS2では計数した音
素数が所定値X(搭載されたメモリにより音声合成処理
できる最大の音素数)以下かどうか判断し、所定値X以
下であればステップS3に、所定値Xを越していればス
テップS4に移る。ステップS3では呼気段落を処理単
位として音声合成処理を行い処理を終える。ステップS
4では、呼気段落中のフレーズを処理単位として音声合
成処理を行い処理を終える。このような処理により、通
常は呼気段落を処理単位として音声合成処理が行われ、
呼気段落が長い場合にはフレーズを処理単位として音声
合成処理が行われる。従って、搭載されたメモリの容量
に見合った処理単位(音素数)で音声合成処理が行え、
メモリ容量の削減と音声合成処理の高速化及び出力音声
の高品位化(音声合成処理単位が大きいと、処理毎に音
声か区切られることが少なくなり、音声出力が滑らかに
なる)をバランスよく両立できる。
【0022】次の他の処理方法(音声合成処理2)につ
いて、図4を用いて説明する。この処理は表音データが
入力された時点から行われる。ステップS11では、表
音データの呼気段落内の音素数を計数し、ステップS1
2に移る。ステップS12では計数した音素数が所定値
X(搭載されたメモリにより音声合成処理できる最大の
音素数)以下かどうか判断し、所定値X以下であればス
テップS14に、所定値Xを越えていればステップS1
3に移る。ステップS13ではフレーズの区切りを呼気
段落の区切りに変更する。つまり、フレーズの区切りを
示す符号を呼気段落を示す符号に置き換えてステップS
14に移る。ステップS14では呼気段落を処理単位と
して音声合成処理を行い処理を終える。つまり、本処理
では呼気段落が長い場合、その呼気段落についてフレー
ズを呼気段落として分解し、長い呼気段落の短縮化を図
ったものである。このような処理により、上述の処理と
同様に通常は呼気段落を処理単位として音声合成処理が
行われ、呼気段落が長い場合にはフレーズを処理単位と
して音声合成処理が行われる。従って、搭載されたメモ
リの容量に見合った処理単位(音素数)で音声合成処理
が行え、メモリ容量の削減と音声合成処理の高速化及び
出力音声の高品位化(音声合成処理単位が大きいと、処
理毎に音声が区切られることが少なくなり、音声出力が
滑らかになる)をバランスよく両立できる。
【0023】次の他の処理方法(音声合成処理3)につ
いて、図5を用いて説明する。この処理は入力された文
字データが多く音声合成処理ができない場合にはその旨
を表示するもので、この処理は表音データが入力された
時点から行われる。ステップS21では、表音データの
呼気段落内の音素数を計数し、ステップS22に移る。
ステップS22では計数した音素数が所定値X(搭載さ
れたメモリにより音声合成処理できる最大の音素数)以
下かどうか判断し、所定値X以下であればステップS2
3に、所定値Xを越えていればステップS24に移る。
ステップS23では呼気段落を処理単位として音声合成
処理を行い処理を終える。ステップS24では入力され
た表音データに於けるフレーズ境界の検索を行いステッ
プS25に移る。ステップS25ではフレーズ境界があ
ったかどうか判断し、フレーズ境界があればステップS
26に移り、フレーズ境界がなければステップS27に
移る。つまり、呼気段落がフレーズ単位に分解できるか
どうかを判断し、フレーズ単位に分解できればステップ
S26に移り、分解できなければステップS27に移
る。ステップS26ではフレーズを処理単位として音声
合成処理を行い処理を終える。又、ステップS27では
音声合成処理ができない旨を表示・警告(『音声合成て
きません』等の表示・音声出力を行う)し、処理を終え
る。尚、音声合成処理ができない旨を音声出力する場合
には、その音声出力を音声合成により出力する方法や、
又その音声のデジタル或いはアナログデータを記録して
おき出力の際にそのデータを読みだして音声再生する方
法がある。
【0024】このように本処理は呼気段落が長い場合に
は、その呼気段落についてフレーズを呼気段落として分
解し、長い呼気段落の短縮化を図ったものである。この
ような処理により、上述の処理と同様に通常は呼気段落
を処理単位として音声合成処理が行われ、呼気段落が長
い場合にはフレーズ処理単位として音声合成処理が行わ
れる。又、呼気段落が長い場合に於いて、上手くフレー
ズに分解できない場合は、その旨を報知することによ
り、使用者にデータの受信があったことを報知すること
ができる。従って、搭載されたメモリの容量に見合った
処理単位(音素数)で音声合成処理が行え、メモリ容量
の削減と音声合成処理の高速化及び出力音声の高品位化
(音声合成処理単位が大きいと、処理毎に音声が区切ら
れることが少なくなり、音声出力が滑らかになる)をバ
ランスよく両立でき、又情報の出力漏れを防止すること
ができる。
【0025】次の他の処理方法(音声合成処理4)につ
いて、図6を用いて説明する。この処理は使用者の設定
した音質での音声合成を行うことにより、音声合成処理
に用いるメモリ容量を節約するものである。この処理は
表音データが入力された時点から行われる。ステップS
31では、使用者が操作部25により設定した音質レベ
ルを入力し、ステップS32に移る。例えば、使用者は
装置の使用状況や好みにより高音質、中音質、低音質か
ら選択する。ステップS32では設定された音質レベル
に応じて、各辞書部に於ける使用データを選択し、また
表音データを音声信号に変化する際の波形接続処理にお
ける波形接続処理のデータ有効ビット数(有効ビット数
が大きい程高音質となるが処理が煩雑となる)を設定さ
れた音質レベルに応じて設定し、さらに表音データを音
声信号に変化する際のピッチパターンの生成間隔(ピッ
チ生成をどのような時間間隔で行う:生成間隔な短い程
高音質となるが処理が煩雑となる)を設定された音質レ
ベルに応じて設定し、ステップS33に移る。そして、
各辞書には音質別のデータが記憶されており、高音質で
はデータの有効ビット数が多く、又サンプリング周波数
の高いデータ等が選択され、低音質ではデータの有効ビ
ット数が少なく、又サンプリング周波数の低いデータ等
が選択される。ステップS33では、各辞書部に於ける
選択されたデータにより音声合成処理を行い処理を終え
る。
【0026】このように本処理では、使用者の選択した
音質に応じて、データの有効ビット数やサンプリング周
波数を選択するので、必要な音質に応じた、できるだけ
小さい有効ビット数や低いサンプリング周波数を用いて
音声合成処理が行われることになる。つまり、音質に応
じた、できるだけ少ない容量のデータを用いて音声合成
処理を行うことになるので、処理に要するメモリ容量を
低減することかでき、又搭載されたメモリの容量に応じ
た、できるだけ長い文章単位での音声合成処理が可能と
なる。
【0027】次の他の処理方法(音声合成処理5)につ
いて、図7を用いて説明する。この処理は、入力した表
音データのデータ量に応じた音質での音声合成を行うこ
とにより、音声合成処理に用いるメモリ容量を節約する
ものである。この処理は表音データが入力された時点か
ら行われる。ステップS41では、入力した表音データ
の呼気段落内の音素数を計数し、ステップS42に移
る。ステップS42では入力した表音データの呼気段落
内の音素数に応じて、各辞書部に於ける使用データを選
択し、また表音データを音声信号に変化する際の波形接
続処理における波形接続処理のデータ有効ビット数(有
効ビット数が大きい程高音質となるが処理が煩雑とな
る)を設定された音質レベルに応じて設定し、さらに表
音データを音声信号に変化する際のピッチパターンの生
成間隔(ピッチ生成をどのような時間間隔で行う:生成
間隔な短い程高音質となるが処理が煩雑となる)を設定
された音質レベルに応じて設定し、ステップS43に移
る。具体的には音素数か多いほど低音質のデータを使用
し、音素数が少ないほど高音質のデータを使用する。そ
して、各辞書には音質別のデータが記憶されており、高
音質(音素数少)では、データの量子化ビット数が多
く、又サンプリング周波数の高いデータが選択され、低
音質(音素数多)ではデータの量子化ビット数が少な
く、又、サンプリング周波数の低いデータが選択され
る。ステップS43では、各辞書部に於ける選択された
データにより音声合成処理を行い処理を終える。
【0028】このように本処理では、音声合成処理する
データ量に応じて音声合成のための音声波形データの量
子化ビット数やサンプリング周波数が選択される。つま
り、搭載されたメモリ処理で、できるだけ高い音質で音
声合成処理を行うことになるので、高音質の音声合成音
が出力されることになる。次に他の実施例について図8
を用いて説明する。本実施例では、データ送信装置側で
呼気段落長を調整し、データ受信装置側では通常の呼気
段落単位での音声合成処理を行う。そして、此の処理
(言語処理)は言語処理部(マイコン)4がデータ受信
装置2からデータ送信要求があった場合に行われる。
【0029】ステップS51では、データ受信装置2か
らのデータ送信要求信号(使用者の操作により送信され
るように構成されている)に含まれるデータ受信装置2
の規格(処理できる呼気段落長に関するデータが含まれ
る)を入力し、ステップS52に移る。ステップS52
では、入力したデータ受信装置2の規格に応じて呼気段
落長の最大値(最大呼気段落長)を設定し、ステップS
53に移る。ステップS54では、ステップS53で設
定された最大呼気段落長に応じて言語処理し、表音デー
タ形成してデータ受信装置2に送信する。つまり、通常
の言語処理による呼気段落長が最大呼気段落長以上であ
れば、フレーズ単位で分割して呼気段落とする等の方法
により、呼気段落を分割し送信する。
【0030】従って、本実施例によれば、データ送信部
1が送信する表音データは、その呼気段落長の最大長が
データ受信装置2側で制限されて送信されるので、デー
タ受信装置2側では特別な処理を行うことなく、データ
受信装置2の性能(メモリ容量等)に応じた適切な音声
合成処理が行われることになる。
【0031】
【発明の効果】以上詳細に説明したように本発明におい
ては、音声通信システムに於けるデータ受信装置の処理
の負担を少なくできるので、比較的低性能のマイコンや
小容量のメモリでデータ受信装置を構成できる。従っ
て、データ受信装置の軽量且つ小型化を図ることがで
き、又、低価格化を図ることが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例に於ける機能構成図
【図2】データ受信装置2に於ける回路構成図
【図3】音声合成処理1を示すフローチャート
【図4】音声合成処理2を示すフローチャート
【図5】音声合成処理3を示すフローチャート
【図6】音声合成処理4を示すフローチャート
【図7】音声合成処理5を示すフローチャート
【図8】言語処理を示すフローチャート
【符号の説明】
1・・・・・・・データ送信装置 2・・・・・・・データ受信装置 3・・・・・・・記憶部 4・・・・・・・言語処理部 5・・・・・・・単語辞書部 6・・・・・・・送信部 7・・・・・・・受信部 8・・・・・・・音素長生成部 9・・・・・・・音素長テーブル 10・・・・・・ピッチ生成部 11・・・・・・イントネーションテーブル 12・・・・・・アクセントテーブル 13・・・・・・波形接続部

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 データを送信するデータ送信装置と、該
    データ送信装置からのデータを音声に変換して音声再生
    するデータ受信装置からなる音声通信システムに於い
    て、 前記データ送信装置は、文字データを文字データの発音
    で表現する表音データに変換する表音データ変換手段
    と、該表音データ変換手段により変換された表音データ
    を送信する送信手段とを有し、 前記データ受信装置は、前記送信手段により送信された
    表音データを受信する受信手段と、該受信手段により受
    信された表音データを音声信号に変換する音声信号変換
    手段とを有することを特徴とする音声通信システム。
  2. 【請求項2】 文字データの発音を表現する表音データ
    を送信する送信装置からの表音データを受信する音声合
    成装置に於いて、 前記送信手段により送信された表音データを受信する受
    信手段と、 該受信手段により受信された表音データを音声信号に変
    換する音声信号変換手段とを有することを特徴とする音
    声合成装置。
  3. 【請求項3】 データを送信するデータ送信装置に於い
    て、 文字データの発音を表現する表音データに変換する表音
    データ変換手段と、 該表音データ変換手段により変換された表音データを送
    信する送信手段とを有することを特徴とするデータ送信
    装置。
  4. 【請求項4】 前記音声信号変換手段は、 前記表音データの呼気段落の長さである段落長を検出す
    る段落長検出手段と、 該段落長検出手段により検出された段落長に応じて、音
    声合成処理単位を、呼気段落単位と、フレーズ単位で切
    り換える処理単位切換手段とを有することを特徴とする
    請求項2記載の音声合成装置。
  5. 【請求項5】 前記音声信号変換手段は、 前記表音データの呼気段落の長さである段落長を検出す
    る段落長検出手段と、 該段落長検出手段により検出された段落長が所定値より
    長い場合に、呼気段落をフレーズで分割し、新たな呼気
    段落とする呼気段落分割手段とを有することを特徴とす
    る請求項2記載の音声合成装置。
  6. 【請求項6】 前記音声信号処理手段により音声信号へ
    の変換が実行できない時に、所定のメッセージを音声再
    生するメッセージ再生手段を有することを特徴とする請
    求項2、請求項4又は請求項5記載の音声合成装置。
  7. 【請求項7】 表音データを音声信号に変換する際に用
    いられる音素と波形のデータの辞書であって、音声信号
    データのサンプリング周波数の異なる複数の音素波形辞
    書と、 処理に使用する辞書を選択する第1の辞書選択手段とを
    有することを特徴とする請求項2記載の音声合成装置。
  8. 【請求項8】 前記第1の辞書選択手段は、前記段落長
    検出手段により検出された段落長に応じて、処理に使用
    する辞書を選択することを特徴とする請求項7記載の音
    声合成装置。
  9. 【請求項9】 表音データを音声信号に変換する際に用
    いられる音素と波形のデータの辞書であって、量子化ビ
    ット数の異なる複数の音素波形辞書と、 処理に使用する辞書を選択する第2の辞書選択手段とを
    有することを特徴とする請求項2記載の音声合成装置。
  10. 【請求項10】 前記第2の辞書選択手段は、前記段落
    長検出手段により検出された段落長に応じて、処理に使
    用する辞書を選択することを特徴とする請求項7記載の
    音声合成装置。
  11. 【請求項11】 表音データを音声信号に変換する際に
    おける、波形接続処理のデータ有効ビット数を調整する
    波形接続処理調整手段を有することを特徴とする請求項
    2記載の音声合成装置。
  12. 【請求項12】 前記波形接続処理調整手段は、前記段
    落長検出手段により検出された段落長に応じて、データ
    有効ビット数を調整することを特徴とする請求項11記
    載の音声合成装置。
  13. 【請求項13】 表音データを音声信号に変換する際に
    おける、ビッチ生成処理のビッチ生成間隔を調整するビ
    ッチ生成処理調整手段を有することを特徴とする請求項
    2記載の音声合成装置。
  14. 【請求項14】 前記ビッチ生成処理調整手段は、前記
    段落長検出手段により検出された段落長に応じて、ピッ
    チ生成間隔を調整することを特徴とする請求項13記載
    の音声合成装置。
  15. 【請求項15】 表音データを受信する受信装置の種別
    を認識する種別認識手段と、 前記種別認識手段により認識された受信装置の種別に応
    じて呼気段落長を設定する呼気段落長設定手段とを有す
    ることを特徴とする請求項3記載のデータ送信装置。
JP8323151A 1996-12-03 1996-12-03 音声通信システム及び音声合成装置及びデータ送信装置 Pending JPH10161690A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8323151A JPH10161690A (ja) 1996-12-03 1996-12-03 音声通信システム及び音声合成装置及びデータ送信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8323151A JPH10161690A (ja) 1996-12-03 1996-12-03 音声通信システム及び音声合成装置及びデータ送信装置

Publications (1)

Publication Number Publication Date
JPH10161690A true JPH10161690A (ja) 1998-06-19

Family

ID=18151660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8323151A Pending JPH10161690A (ja) 1996-12-03 1996-12-03 音声通信システム及び音声合成装置及びデータ送信装置

Country Status (1)

Country Link
JP (1) JPH10161690A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999036905A1 (fr) * 1998-01-19 1999-07-22 Sony Corporation Appareils de distribution, emission et reception d'informations, et procede de distribution d'informations
US8165882B2 (en) 2005-09-06 2012-04-24 Nec Corporation Method, apparatus and program for speech synthesis
CN114171000A (zh) * 2021-11-30 2022-03-11 广东电力信息科技有限公司 一种基于声学模型和语言模型的音频识别方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999036905A1 (fr) * 1998-01-19 1999-07-22 Sony Corporation Appareils de distribution, emission et reception d'informations, et procede de distribution d'informations
US8165882B2 (en) 2005-09-06 2012-04-24 Nec Corporation Method, apparatus and program for speech synthesis
JP4992717B2 (ja) * 2005-09-06 2012-08-08 日本電気株式会社 音声合成装置及び方法とプログラム
CN114171000A (zh) * 2021-11-30 2022-03-11 广东电力信息科技有限公司 一种基于声学模型和语言模型的音频识别方法
CN114171000B (zh) * 2021-11-30 2026-01-30 南方电网数据平台与安全(广东)有限公司 一种基于声学模型和语言模型的音频识别方法

Similar Documents

Publication Publication Date Title
EP0140777B1 (en) Process for encoding speech and an apparatus for carrying out the process
US4975957A (en) Character voice communication system
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
RU2294565C2 (ru) Способ и система динамической адаптации синтезатора речи для повышения разборчивости синтезируемой им речи
JP5029167B2 (ja) 音声読み上げのための装置、プログラム及び方法
JPH10260692A (ja) 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム
US20080243511A1 (en) Speech synthesizer
US5848390A (en) Speech synthesis system and its method
US5995925A (en) Voice speed converter
JP2001272991A (ja) 音声対話方法及び音声対話装置
JPH0576040B2 (ja)
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
JPH10161690A (ja) 音声通信システム及び音声合成装置及びデータ送信装置
JP2000356995A (ja) 音声通信システム
JP3681111B2 (ja) 音声合成装置、音声合成方法および音声合成プログラム
JP3900892B2 (ja) 合成音声の音質調整方法と音声合成装置
JPH09198062A (ja) 楽音発生装置
JPH07200554A (ja) 文章読み上げ装置
JP2003029774A (ja) 音声波形辞書配信システム、音声波形辞書作成装置、及び音声合成端末装置
JP2003140678A5 (ja)
JP3685648B2 (ja) 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機
JPH10228294A (ja) 音声合成装置
JPH0950286A (ja) 音声合成装置及びこれに使用する記録媒体
JP2003066983A (ja) 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JP3805065B2 (ja) 車載用音声合成装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020716