JPH10161690A

JPH10161690A - 音声通信システム及び音声合成装置及びデータ送信装置

Info

Publication number: JPH10161690A
Application number: JP8323151A
Authority: JP
Inventors: Hiroyuki Fujimoto; 博之藤本; Toshitaka Yamato; 俊孝大和; Masato Maruoka; 正人丸岡
Original assignee: Denso Ten Ltd
Current assignee: Denso Ten Ltd
Priority date: 1996-12-03
Filing date: 1996-12-03
Publication date: 1998-06-19

Abstract

(57)【要約】【課題】音声合成機能を有する電子機器の小型化や低価
格化を実現する。【解決手段】データを送信するデータ送信装置と、送信
装置からのデータを音声に変換して音声再生するデータ
受信装置からなる音声通信システムに於いて、データ送
信装置は、文字データを文字データの発音で表現する表
音データに変換する表音データ変換手段と、表音データ
変換手段により変換された表音データを送信する送信手
段とを有し、データ受信装置は、送信手段により送信さ
れた表音データを受信する受信手段と、受信手段により
受信された表音データを音声信号に変換する音声信号変
換手段とを有することを特徴とする音声通信システム。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データを送信し、
該送信されたデータが受信側で音声合成され、音声とし
て出力される通信システムに関する。

【０００２】

【従来の技術】近年、電子機器に音声合成技術を用いて
各種情報を音声出力することが多くなってきた。例え
ば、ＦＭ多重受信機では、多重通信にて送られてきた交
通情報等の文字データを表示器に表示するだけでなく、
その文字データを音声合成技術により音声化し、交通情
報等を音声として再生することが行われている。

【０００３】音声合成を行う場合、文字データを文節等
に区切る処理や、再生音を機械ではなく人が喋ったよう
にするためにアクセントやイントネーションを付加する
処理等が行われる。そして、それらの処理はマイクロコ
ンピュータ（マイコン）を用いて行い、それら処理のた
めには言語解読やアクセント付加のためのデータ、所謂
辞書と言われている莫大なデータが必要となる。又、音
声合成処理は多くの処理を必要とするため、マイコンの
負担が大きく、高速処理可能なマイコンが必要であり、
又処理のための大容量のメモリも必要となる。

【０００４】

【発明が解決しようとする課題】一方、電子機器は小型
化が望まれる傾向にあり、特に車載用機器や携帯用機器
では、取付場所や持ち運びの便利さから、その傾向が強
い。しかし、小型化を実現するためには、マイコンの負
担を小さくしたり、メモリの容量を小さくする必要があ
るので、小型化を図ると音声合成がうまくできなくなる
問題が発生する。

【０００５】又、高速処理可能なマイコンや大容量のメ
モリを使用すると電子機器が高価格化する問題も発生す
る。本発明は、このような問題を解決するもので、音声
合成機能を有する電子機器の小型化や低価格化を実現す
ることを課題とする。

【０００６】

【課題を解決するための手段】本発明は上記課題を解決
するために、データを送信するデータ送信装置と、該デ
ータ送信装置からのデータを音声に変換して音声再生す
るデータ受信装置からなる音声通信システムに於いて、
前記データ送信装置は、文字データを文字データの発音
で表現する表音データに変換する表音データ変換手段
と、該表音データ変換手段により変換された表音データ
を送信する送信手段とを有し、前記データ受信装置は、
前記送信手段により送信された表音データを受信する受
信手段と、該受信手段により受信された表音データを音
声信号に変換する音声信号変換手段とを有することを特
徴とする。

【０００７】又、文字データの発音を表現する表音デー
タを送信する送信装置からの表音データを受信する音声
合成装置に於いて、前記送信手段により送信された表音
データを受信する受信手段と、該受信手段により受信さ
れた表音データを音声信号に変換する音声信号変換手段
とを有することを特徴とする。又、データを送信するデ
ータ送信装置に於いて、文字データの発音を表現する表
音データに変換する表音データ変換手段と、該表音デー
タ変換手段により変換された表音データを送信する送信
手段とを有することを特徴とする。

【０００８】又、前記音声信号変換手段は、前記表音デ
ータの呼気段落の長さである段落長を検出する段落長検
出手段と、該段落長検出手段により検出された段落長に
応じて、音声合成処理単位を、呼気段落単位と、フレー
ズ単位で切り換える処理単位切換手段とを有することを
特徴とする。前記音声信号変換手段は、前記表音データ
の呼気段落の長さである段落長を検出する段落長検出手
段と、該段落長検出手段により検出された段落長が所定
値より長い場合に、呼気段落をフレーズで分割し、新た
な呼気段落とする呼気段落分割手段とを有することを特
徴とする。

【０００９】前記音声信号処理手段により音声信号への
変換が実行できない時に、所定のメッセージを音声再生
するメッセージ再生手段を有することを特徴とする。表
音データを音声信号に変換する際に用いられる音素と波
形のデータの辞書であって、音声信号データのサンプリ
ング周波数の異なる複数の音素波形辞書と、処理に使用
する辞書を選択する第１の辞書選択手段とを有すること
を特徴とする。

【００１０】前記第１の辞書選択手段は、前記段落長検
出手段により検出された段落長に応じて、処理に使用す
る辞書を選択することを特徴とする。表音データを音声
信号に変換する際に用いられる音素と波形のデータの辞
書であって、量子化ビット数の異なる複数の音素波形辞
書と、処理に使用する辞書を選択する第２の辞書選択手
段とを有することを特徴とする。

【００１１】前記第２の辞書選択手段は、前記段落長検
出手段により検出された段落長に応じて、処理に使用す
る辞書を選択することを特徴とする。表音データを音声
信号に変換する際における、波形接続処理のデータ有効
ビット数を調整する波形接続処理調整手段を有すること
を特徴とする。前記波形接続処理調整手段は、前記段落
長検出手段により検出された段落長に応じて、データ有
効ビット数を調整することを特徴とする。

【００１２】表音データを音声信号に変換する際におけ
る、ビッチ生成処理のビッチ生成間隔を調整するビッチ
生成処理調整手段を有することを特徴とする。前記ビッ
チ生成処理調整手段は、前記段落長検出手段により検出
された段落長に応じて、ピッチ生成間隔を調整すること
を特徴とする。表音データを受信する受信装置の種別を
認識する種別認識手段と、前記種別認識手段により認識
された受信装置の種別に応じて呼気段落長を設定する呼
気段落長設定手段とを有することを特徴とする。

【００１３】

【実施例】以下、本発明の実施例に付いて図を用いて説
明する。図１は本発明の一実施例の音声通信システムを
示す機能構成図である。尚、図１には主として音声合成
処理に関連した部分のみを図示している。１は情報セン
ター等に設置された各種情報を送信するデータ送信装置
であり、又、２はデータ送信装置１からのデータを受
信する自動車等に設置されたデータ受信装置であって、
これらデータ送信装置１とデータ受信装置２により音声
通信システムが構成される。

【００１４】３は情報を記憶する情報記憶部で、ハード
（磁気）ディスクや光学ディスク等の大容量記憶装置に
より構成され、各種情報が記憶されている。４は情報記
憶装置に記憶された文字データを加工し、発音を示すデ
ータ（表音データ）に変換する言語処理部であり、マイ
クロコンピュータ（マイコン）により構成されている。
そして、言語処理部４は、文字データで表される文を読
みカナ（ア、イ・・・ン等）に分解し、そして句読点や
句読点間が長い場合に於ける適当な部分の文節間等の部
分に、文章発声中に於ける区切り（息継ぎ部分等）を示
す区切符号を付加して表音データを形成する。尚、通常
句読点により区切られる部分は呼気段落と称し、句読点
以外で区切られた部分はフレーズと称する。つまり、呼
気段落は主に句読点により区切られ、呼気段落はさらに
フレーズに分けられる。５は言語処理部４の言語処理に
用いられるデータが記憶された単語辞書部であり、磁気
ディスクやＲＯＭそしてＲＡＭ等の記憶装置により構成
されている。そして単語辞書部５には、単語の文字デー
タとそれに対応する読みデータが、またアクセントデー
タ等が記憶されており、言語処理部４はこれらのデータ
を用いて言語処理を行う。６は言語処理部４で形成され
た表音データを搬送波（電波）に載せて送信する送信部
で、発振回路、変調回路、増幅回路等により構成されて
いる。そして、これら情報記憶部３、言語処理部４、辞
書部５、送信部６等によりデータ送信装置１が形成され
ている。

【００１５】７はデータ送信装置１の送信部６からの送
信信号を受信して復調し、表音データを出力する受信部
で、同調回路、検波回路等で構成されている。８は表音
データに於ける各音素の発音期間及び各音素間の無音期
間の長さに関するデータを付加する音素長生成部であ
る。つまり、表音データは各音素とその並びが規定され
ているだけであるが、音素長生成部８はこの表音データ
に於ける各音素の発音期間（音素長）及び各音素間の無
音期間を規定する。９は音素長生成部８の音素長処理に
用いられるデータが記憶された音素長テーブルであり、
ＲＯＭ等の記憶装置により構成されている。そして、音
素長テーブル９には、例えば使用環境を考慮した各音素
が記憶されており、音素長生成部８は入力された表音デ
ータの音素配列パターンに応じて音素長辞書部９から音
素長データを読み出し、この音素長に基づき音素長処理
を行う。

【００１６】１０は音素長処理が行われた表音データに
イントネーション、アクセントを付加する処理を行うピ
ッチ生成部である。つまり、音素長処理が施された表音
データは、各音素の波形、音素長及び音素間の無音期間
の長さが規定されているが、ピッチ生成部１０では、音
の高低を規定する。１１は音の高低（抑揚）を付加する
ための処理に必要なデータが記憶されたイントネーショ
ンテーブルであり、ＲＯＭ等の記憶装置により構成され
ている。そして、イントネーションテーブル１１には、
複数のイントネーションパターンが記憶されており、ピ
ッチ生成部１０は入力された文章の表音データの末の文
節境界の種類に応じてイントネーションパターンを決定
する処理を行う。又、１２はアクセントを付加するため
の処理に必要なデータが記憶されたアクセントテーブル
でありＲＯＭ等の記憶装置により構成されている。そし
て、アクセントテーブル１２には、例えば当該単語のア
クセントのかた文章中の位置を考慮したアクセントパタ
ーンが記憶されており、ピッチ生成部１０はアクセント
テーブル１２からアクセントパターンを読み出し、音声
に当該アクセントパターンを付加する処理を行う。さら
に、ピッチ生成部１０では、前記イントネーションパタ
ーンとアクセントパターンの重畳処理を行い、入力文章
のピッチパターンを決定する。

【００１７】１３は出力波形を生成する波形生成部で、
音素長データとピッチパターンから音声波形を合成す
る。１４は各音素に対応する波形が記憶された音素辞書
で、ＲＯＭ等の記憶装置により構成されている。そし
て、波形生成部１３は各音素に対応する波形を音素辞書
１４から読み出し、前記音素長データとピッチパターン
を基に波形をつなぎ合わせて音声波形を合成し出力す
る。そして、この波形生成部１３から出力された音声合
成出力が、必要に応じて増幅器で増幅されてスピーカよ
り音として再生される。

【００１８】図２はデータ受信装置２に於ける音声合成
処理を行う部分の具体的構成を示す構成図である。２１
は受信部７からの表音データを入力するための緩衝動作
を行う入力インターフェイスである。２２はマイクロコ
ンピュータ（マイコン）で、入力された表音データに演
算処理を施し、アクセント付加、イントネーション付
加、波形接続等を行う。２３はＲＯＭ（ＲｅａｄＯｎ
ｌｙＭｅｍｏｒｙ）で、音素長データ、イントネーシ
ョンデータ、アクセントデータそしてマイコン２２のプ
ログラム等が記憶されている。２４はＲＡＭ（Ｒａｎｄ
ｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）で、マイコン２４
の演算処理に於けるデータの一時記憶等に用いられる。
２５はスイッチ等により構成された操作部で、データ受
信装置２の使用者がデータ種別の選択のために操作す
る。２６はデジタル／アナログ変換器（Ｄ／Ａ）で、マ
イコン２２により音声合成処理されたデジタル信号をア
ナログ信号に変換する。そして、アナログ信号に変換さ
れた音声合成信号が必要に応じて増幅され、スピーカ２
７から音声として出力される。

【００１９】つまり、本実施例においては、テータ送信
装置１側で言語処理を行って文章を音素と区切り符号と
からなる表音データを生成して送信する。そして、デー
タ受信装置２側では、データ送信装置１から送信された
表音データを合成音声に変換する処理を行う。従って、
データ受信装置２側では、比較的大規模な辞書（デー
タ）が必要で、また高速な処理速度が要求される言語処
理を行う必要がない。このため、データ受信装置２を比
較的小容量のメモリ及び低速のマイコンで実現でき、装
置を小型化、また低コスト化でき、特に小型化が要求さ
れる車載用装置においては有利である。

【００２０】次にデータ受信装置２の小型化等に貢献す
るデータ処理方法、より具体的にはデータ処理演算に必
要なメモリの容量を低減するための処理方法について説
明する。尚、これらの処理はマイコン２２により実行さ
れる。音声合成処理を行う場合、一度に処理する音素数
が多くなると、その処理に要するメモリ容量が大きくな
るという問題がある。図３に示す以下の処理（音声合成
処理１）はその問題を解決するものである。

【００２１】この処理は表音データが入力された時点か
ら行われる。尚、表音データは一旦データそのものがバ
ッファメモリに総て記憶され、そしてマイコンによりバ
ッファメモリから順次読みだされて処理される。ステッ
プＳ１では、表音データの呼気段落内の音素数を計数
し、ステップＳ２に移る。ステップＳ２では計数した音
素数が所定値Ｘ（搭載されたメモリにより音声合成処理
できる最大の音素数）以下かどうか判断し、所定値Ｘ以
下であればステップＳ３に、所定値Ｘを越していればス
テップＳ４に移る。ステップＳ３では呼気段落を処理単
位として音声合成処理を行い処理を終える。ステップＳ
４では、呼気段落中のフレーズを処理単位として音声合
成処理を行い処理を終える。このような処理により、通
常は呼気段落を処理単位として音声合成処理が行われ、
呼気段落が長い場合にはフレーズを処理単位として音声
合成処理が行われる。従って、搭載されたメモリの容量
に見合った処理単位（音素数）で音声合成処理が行え、
メモリ容量の削減と音声合成処理の高速化及び出力音声
の高品位化（音声合成処理単位が大きいと、処理毎に音
声か区切られることが少なくなり、音声出力が滑らかに
なる）をバランスよく両立できる。

【００２２】次の他の処理方法（音声合成処理２）につ
いて、図４を用いて説明する。この処理は表音データが
入力された時点から行われる。ステップＳ１１では、表
音データの呼気段落内の音素数を計数し、ステップＳ１
２に移る。ステップＳ１２では計数した音素数が所定値
Ｘ（搭載されたメモリにより音声合成処理できる最大の
音素数）以下かどうか判断し、所定値Ｘ以下であればス
テップＳ１４に、所定値Ｘを越えていればステップＳ１
３に移る。ステップＳ１３ではフレーズの区切りを呼気
段落の区切りに変更する。つまり、フレーズの区切りを
示す符号を呼気段落を示す符号に置き換えてステップＳ
１４に移る。ステップＳ１４では呼気段落を処理単位と
して音声合成処理を行い処理を終える。つまり、本処理
では呼気段落が長い場合、その呼気段落についてフレー
ズを呼気段落として分解し、長い呼気段落の短縮化を図
ったものである。このような処理により、上述の処理と
同様に通常は呼気段落を処理単位として音声合成処理が
行われ、呼気段落が長い場合にはフレーズを処理単位と
して音声合成処理が行われる。従って、搭載されたメモ
リの容量に見合った処理単位（音素数）で音声合成処理
が行え、メモリ容量の削減と音声合成処理の高速化及び
出力音声の高品位化（音声合成処理単位が大きいと、処
理毎に音声が区切られることが少なくなり、音声出力が
滑らかになる）をバランスよく両立できる。

【００２３】次の他の処理方法（音声合成処理３）につ
いて、図５を用いて説明する。この処理は入力された文
字データが多く音声合成処理ができない場合にはその旨
を表示するもので、この処理は表音データが入力された
時点から行われる。ステップＳ２１では、表音データの
呼気段落内の音素数を計数し、ステップＳ２２に移る。
ステップＳ２２では計数した音素数が所定値Ｘ（搭載さ
れたメモリにより音声合成処理できる最大の音素数）以
下かどうか判断し、所定値Ｘ以下であればステップＳ２
３に、所定値Ｘを越えていればステップＳ２４に移る。
ステップＳ２３では呼気段落を処理単位として音声合成
処理を行い処理を終える。ステップＳ２４では入力され
た表音データに於けるフレーズ境界の検索を行いステッ
プＳ２５に移る。ステップＳ２５ではフレーズ境界があ
ったかどうか判断し、フレーズ境界があればステップＳ
２６に移り、フレーズ境界がなければステップＳ２７に
移る。つまり、呼気段落がフレーズ単位に分解できるか
どうかを判断し、フレーズ単位に分解できればステップ
Ｓ２６に移り、分解できなければステップＳ２７に移
る。ステップＳ２６ではフレーズを処理単位として音声
合成処理を行い処理を終える。又、ステップＳ２７では
音声合成処理ができない旨を表示・警告（『音声合成て
きません』等の表示・音声出力を行う）し、処理を終え
る。尚、音声合成処理ができない旨を音声出力する場合
には、その音声出力を音声合成により出力する方法や、
又その音声のデジタル或いはアナログデータを記録して
おき出力の際にそのデータを読みだして音声再生する方
法がある。

【００２４】このように本処理は呼気段落が長い場合に
は、その呼気段落についてフレーズを呼気段落として分
解し、長い呼気段落の短縮化を図ったものである。この
ような処理により、上述の処理と同様に通常は呼気段落
を処理単位として音声合成処理が行われ、呼気段落が長
い場合にはフレーズ処理単位として音声合成処理が行わ
れる。又、呼気段落が長い場合に於いて、上手くフレー
ズに分解できない場合は、その旨を報知することによ
り、使用者にデータの受信があったことを報知すること
ができる。従って、搭載されたメモリの容量に見合った
処理単位（音素数）で音声合成処理が行え、メモリ容量
の削減と音声合成処理の高速化及び出力音声の高品位化
（音声合成処理単位が大きいと、処理毎に音声が区切ら
れることが少なくなり、音声出力が滑らかになる）をバ
ランスよく両立でき、又情報の出力漏れを防止すること
ができる。

【００２５】次の他の処理方法（音声合成処理４）につ
いて、図６を用いて説明する。この処理は使用者の設定
した音質での音声合成を行うことにより、音声合成処理
に用いるメモリ容量を節約するものである。この処理は
表音データが入力された時点から行われる。ステップＳ
３１では、使用者が操作部２５により設定した音質レベ
ルを入力し、ステップＳ３２に移る。例えば、使用者は
装置の使用状況や好みにより高音質、中音質、低音質か
ら選択する。ステップＳ３２では設定された音質レベル
に応じて、各辞書部に於ける使用データを選択し、また
表音データを音声信号に変化する際の波形接続処理にお
ける波形接続処理のデータ有効ビット数（有効ビット数
が大きい程高音質となるが処理が煩雑となる）を設定さ
れた音質レベルに応じて設定し、さらに表音データを音
声信号に変化する際のピッチパターンの生成間隔（ピッ
チ生成をどのような時間間隔で行う：生成間隔な短い程
高音質となるが処理が煩雑となる）を設定された音質レ
ベルに応じて設定し、ステップＳ３３に移る。そして、
各辞書には音質別のデータが記憶されており、高音質で
はデータの有効ビット数が多く、又サンプリング周波数
の高いデータ等が選択され、低音質ではデータの有効ビ
ット数が少なく、又サンプリング周波数の低いデータ等
が選択される。ステップＳ３３では、各辞書部に於ける
選択されたデータにより音声合成処理を行い処理を終え
る。

【００２６】このように本処理では、使用者の選択した
音質に応じて、データの有効ビット数やサンプリング周
波数を選択するので、必要な音質に応じた、できるだけ
小さい有効ビット数や低いサンプリング周波数を用いて
音声合成処理が行われることになる。つまり、音質に応
じた、できるだけ少ない容量のデータを用いて音声合成
処理を行うことになるので、処理に要するメモリ容量を
低減することかでき、又搭載されたメモリの容量に応じ
た、できるだけ長い文章単位での音声合成処理が可能と
なる。

【００２７】次の他の処理方法（音声合成処理５）につ
いて、図７を用いて説明する。この処理は、入力した表
音データのデータ量に応じた音質での音声合成を行うこ
とにより、音声合成処理に用いるメモリ容量を節約する
ものである。この処理は表音データが入力された時点か
ら行われる。ステップＳ４１では、入力した表音データ
の呼気段落内の音素数を計数し、ステップＳ４２に移
る。ステップＳ４２では入力した表音データの呼気段落
内の音素数に応じて、各辞書部に於ける使用データを選
択し、また表音データを音声信号に変化する際の波形接
続処理における波形接続処理のデータ有効ビット数（有
効ビット数が大きい程高音質となるが処理が煩雑とな
る）を設定された音質レベルに応じて設定し、さらに表
音データを音声信号に変化する際のピッチパターンの生
成間隔（ピッチ生成をどのような時間間隔で行う：生成
間隔な短い程高音質となるが処理が煩雑となる）を設定
された音質レベルに応じて設定し、ステップＳ４３に移
る。具体的には音素数か多いほど低音質のデータを使用
し、音素数が少ないほど高音質のデータを使用する。そ
して、各辞書には音質別のデータが記憶されており、高
音質（音素数少）では、データの量子化ビット数が多
く、又サンプリング周波数の高いデータが選択され、低
音質（音素数多）ではデータの量子化ビット数が少な
く、又、サンプリング周波数の低いデータが選択され
る。ステップＳ４３では、各辞書部に於ける選択された
データにより音声合成処理を行い処理を終える。

【００２８】このように本処理では、音声合成処理する
データ量に応じて音声合成のための音声波形データの量
子化ビット数やサンプリング周波数が選択される。つま
り、搭載されたメモリ処理で、できるだけ高い音質で音
声合成処理を行うことになるので、高音質の音声合成音
が出力されることになる。次に他の実施例について図８
を用いて説明する。本実施例では、データ送信装置側で
呼気段落長を調整し、データ受信装置側では通常の呼気
段落単位での音声合成処理を行う。そして、此の処理
（言語処理）は言語処理部（マイコン）４がデータ受信
装置２からデータ送信要求があった場合に行われる。

【００２９】ステップＳ５１では、データ受信装置２か
らのデータ送信要求信号（使用者の操作により送信され
るように構成されている）に含まれるデータ受信装置２
の規格（処理できる呼気段落長に関するデータが含まれ
る）を入力し、ステップＳ５２に移る。ステップＳ５２
では、入力したデータ受信装置２の規格に応じて呼気段
落長の最大値（最大呼気段落長）を設定し、ステップＳ
５３に移る。ステップＳ５４では、ステップＳ５３で設
定された最大呼気段落長に応じて言語処理し、表音デー
タ形成してデータ受信装置２に送信する。つまり、通常
の言語処理による呼気段落長が最大呼気段落長以上であ
れば、フレーズ単位で分割して呼気段落とする等の方法
により、呼気段落を分割し送信する。

【００３０】従って、本実施例によれば、データ送信部
１が送信する表音データは、その呼気段落長の最大長が
データ受信装置２側で制限されて送信されるので、デー
タ受信装置２側では特別な処理を行うことなく、データ
受信装置２の性能（メモリ容量等）に応じた適切な音声
合成処理が行われることになる。

【００３１】

【発明の効果】以上詳細に説明したように本発明におい
ては、音声通信システムに於けるデータ受信装置の処理
の負担を少なくできるので、比較的低性能のマイコンや
小容量のメモリでデータ受信装置を構成できる。従っ
て、データ受信装置の軽量且つ小型化を図ることがで
き、又、低価格化を図ることが可能となる。

【図面の簡単な説明】

【図１】本発明の一実施例に於ける機能構成図

【図２】データ受信装置２に於ける回路構成図

【図３】音声合成処理１を示すフローチャート

【図４】音声合成処理２を示すフローチャート

【図５】音声合成処理３を示すフローチャート

【図６】音声合成処理４を示すフローチャート

【図７】音声合成処理５を示すフローチャート

【図８】言語処理を示すフローチャート

【符号の説明】

１・・・・・・・データ送信装置２・・・・・・・データ受信装置３・・・・・・・記憶部４・・・・・・・言語処理部５・・・・・・・単語辞書部６・・・・・・・送信部７・・・・・・・受信部８・・・・・・・音素長生成部９・・・・・・・音素長テーブル１０・・・・・・ピッチ生成部１１・・・・・・イントネーションテーブル１２・・・・・・アクセントテーブル１３・・・・・・波形接続部

Claims

【特許請求の範囲】

【請求項１】データを送信するデータ送信装置と、該
データ送信装置からのデータを音声に変換して音声再生
するデータ受信装置からなる音声通信システムに於い
て、前記データ送信装置は、文字データを文字データの発音
で表現する表音データに変換する表音データ変換手段
と、該表音データ変換手段により変換された表音データ
を送信する送信手段とを有し、前記データ受信装置は、前記送信手段により送信された
表音データを受信する受信手段と、該受信手段により受
信された表音データを音声信号に変換する音声信号変換
手段とを有することを特徴とする音声通信システム。
【請求項２】文字データの発音を表現する表音データ
を送信する送信装置からの表音データを受信する音声合
成装置に於いて、前記送信手段により送信された表音データを受信する受
信手段と、該受信手段により受信された表音データを音声信号に変
換する音声信号変換手段とを有することを特徴とする音
声合成装置。
【請求項３】データを送信するデータ送信装置に於い
て、文字データの発音を表現する表音データに変換する表音
データ変換手段と、該表音データ変換手段により変換された表音データを送
信する送信手段とを有することを特徴とするデータ送信
装置。
【請求項４】前記音声信号変換手段は、前記表音データの呼気段落の長さである段落長を検出す
る段落長検出手段と、該段落長検出手段により検出された段落長に応じて、音
声合成処理単位を、呼気段落単位と、フレーズ単位で切
り換える処理単位切換手段とを有することを特徴とする
請求項２記載の音声合成装置。
【請求項５】前記音声信号変換手段は、前記表音データの呼気段落の長さである段落長を検出す
る段落長検出手段と、該段落長検出手段により検出された段落長が所定値より
長い場合に、呼気段落をフレーズで分割し、新たな呼気
段落とする呼気段落分割手段とを有することを特徴とす
る請求項２記載の音声合成装置。
【請求項６】前記音声信号処理手段により音声信号へ
の変換が実行できない時に、所定のメッセージを音声再
生するメッセージ再生手段を有することを特徴とする請
求項２、請求項４又は請求項５記載の音声合成装置。
【請求項７】表音データを音声信号に変換する際に用
いられる音素と波形のデータの辞書であって、音声信号
データのサンプリング周波数の異なる複数の音素波形辞
書と、処理に使用する辞書を選択する第１の辞書選択手段とを
有することを特徴とする請求項２記載の音声合成装置。
【請求項８】前記第１の辞書選択手段は、前記段落長
検出手段により検出された段落長に応じて、処理に使用
する辞書を選択することを特徴とする請求項７記載の音
声合成装置。
【請求項９】表音データを音声信号に変換する際に用
いられる音素と波形のデータの辞書であって、量子化ビ
ット数の異なる複数の音素波形辞書と、処理に使用する辞書を選択する第２の辞書選択手段とを
有することを特徴とする請求項２記載の音声合成装置。
【請求項１０】前記第２の辞書選択手段は、前記段落
長検出手段により検出された段落長に応じて、処理に使
用する辞書を選択することを特徴とする請求項７記載の
音声合成装置。
【請求項１１】表音データを音声信号に変換する際に
おける、波形接続処理のデータ有効ビット数を調整する
波形接続処理調整手段を有することを特徴とする請求項
２記載の音声合成装置。
【請求項１２】前記波形接続処理調整手段は、前記段
落長検出手段により検出された段落長に応じて、データ
有効ビット数を調整することを特徴とする請求項１１記
載の音声合成装置。
【請求項１３】表音データを音声信号に変換する際に
おける、ビッチ生成処理のビッチ生成間隔を調整するビ
ッチ生成処理調整手段を有することを特徴とする請求項
２記載の音声合成装置。
【請求項１４】前記ビッチ生成処理調整手段は、前記
段落長検出手段により検出された段落長に応じて、ピッ
チ生成間隔を調整することを特徴とする請求項１３記載
の音声合成装置。
【請求項１５】表音データを受信する受信装置の種別
を認識する種別認識手段と、前記種別認識手段により認識された受信装置の種別に応
じて呼気段落長を設定する呼気段落長設定手段とを有す
ることを特徴とする請求項３記載のデータ送信装置。