JPH09330098A

JPH09330098A - 音声合成装置

Info

Publication number: JPH09330098A
Application number: JP8147267A
Authority: JP
Inventors: Toshitaka Yamato; 俊孝大和; Hiroyuki Fujimoto; 博之藤本; Osamu Ishikawa; 修石川
Original assignee: Denso Ten Ltd
Current assignee: Denso Ten Ltd
Priority date: 1996-06-10
Filing date: 1996-06-10
Publication date: 1997-12-22

Abstract

(57)【要約】【課題】続々と現れる造語、略称に対して表音文字列
データへの誤変換を防止する。【解決手段】漢字かな混じり文を構成する単語の表記
データを表音文字列データに変換して音声に合成する音
声合成装置において、単語の表記データと表音文字列デ
ータと永久的に登録する標準単語辞書２と、漢字かな混
じる文の表記データの一部に表音文字列データにより付
与されたルビとこれに対応する表記データを抽出する解
析を行うルビデータ解析部５と、ルビデータ解析部によ
り抽出された表記データとルビデータとを暫定的に登録
する暫定単語辞書６と、漢字かな混じり文から単語を切
り出し、切り出された単語の表記データに対する表音文
字列データを、標準単語辞書を用いて検索する前に、暫
定単語辞書を優先的に用いて検索する言語解析部１とを
備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は漢字かな混じり文の
テキストデータを単語辞書を用いて表音文字列データに
変換して読み上げを行う音声合成装置に関し、特に、続
々と現れる新たな単語（造語、略称）に対して表音文字
列データへの誤変換を防止することに関する。

【０００２】

【従来の技術】近年、ＦＭ多重文字放送で送られてくる
一般情報や、ＶＩＣＳ（自動車情報通信システム）によ
る交通情報の漢字かな混じり文をテキストデータ（表記
データ）として読み上げるために音声合成が用いられて
いる。この表記データを、これを読み上げるための表音
文字列データに変換する言語解析処理では、大容量の単
語辞書が必要とされている。すなわち、単語辞書には、
単語の表記データと表音文字列データが１対になり、多
数格納されている。

【０００３】

【発明が解決しようとする課題】しかしながら、従来の
単語辞書では、如何にデータを充実させても、新設の道
路名称、商品名称等の造語や、さらに略称などの多数の
単語に対応させることが不可能なため、読み誤りが発生
するという問題がある。ところで、上記のような造語や
略称などは表示されたときに、読み誤りやすいため、こ
れらに、ＦＭ放送側、ＶＩＣＳの発信側では、一時的に
ルビを付与することが考えられている。このため、この
ルビを用いれば、音声合成においても読み誤りを無くす
ことができる。

【０００４】本発明は、造語、略称に対する一時的なル
ビ付与がなくなっても、読み誤りを防止できる音声合成
装置を提供することを目的とす。

【０００５】

【課題を解決するための手段】本発明は、前記問題点を
解決するために、漢字かな混じり文を構成する単語の表
記データを表音文字列データに変換して音声に合成する
音声合成装置において、前記単語の前記表記データと前
記表音文字列データと永久的に登録する標準単語辞書
と、前記漢字かな混じり文の表記データの一部に表音文
字列データにより付与されたルビとこれに対応する表記
データを抽出する解析を行うルビデータ解析部と、前記
ルビデータ解析部により抽出された表記データとルビデ
ータとを暫定的に登録する暫定単語辞書と、前記漢字か
な混じり文から前記単語を切り出し、切り出された単語
の表記データに対する前記表音文字列データを、前記標
準単語辞書を用いて検索する前に、前記暫定単語辞書を
優先的に用いて検索する言語解析部を備える。この手段
により、造語、略称のように、標準単語辞書に登録され
ていない単語であっても、暫定単語辞書を用いて検索す
ることが可能になり、読み誤りが防止できるようになっ
た。

【０００６】前記暫定単語辞書に一定量だけ登録された
単語を前記標準単語辞書に移す。この手段により、前記
標準単語辞書の再登録の頻度が少なくなり、且つ暫定単
語辞書の登録容量を大きくせずに済む。前記暫定単語辞
書に登録された単語の中で使用頻度の高いものを前記標
準単語辞書に移す。この手段により、さらに、前記標準
単語辞書の登録頻度と前記暫定単語辞書の登録量のバラ
ンスを取ることができる。

【０００７】前記暫定単語辞書に登録された単語の中で
使用頻度の低いものを削除する。この手段により、前記
暫定単語辞書が限定され、且つ標準単語辞書の再登録が
できない場合に有利である。前記暫定単語辞書に登録さ
れた単語の中で登録が古く現在の使用頻度の低いものを
削除する。この手段により、使用頻度が低い同志では古
いものを優先的に削除する。

【０００８】前記ルビデータ解析部は、前記ルビデータ
の位置を示すコードを用いて、前記漢字かな混じり文の
表記データからルビデータを抽出する。この手段によ
り、ルビデータを他の表記データから識別が容易にでき
る。

【０００９】

【発明の実施の形態】以下本発明の実施の形態について
図面を参照して説明する。図１は本発明に係る音声合成
装置の主要部の概略を示す図である。本図に示すよう
に、音声合成装置では、漢字かな混じり文とルビデータ
とを入力する言語解析部１は漢字かな混じり文の表記デ
ータについて文法的解釈を行って単語の切り出しを行
い、単語毎の表記データを単語毎の表音文字列データに
変換して、漢字かな混じり文の全体の表音文字列データ
を形成する。標準単語辞書２は、単語の表記データに対
して表記データを読み上げるべき表音文字列データを格
納し、言語解析部１からの単語表記データに対応する表
音文字列データを検索し、この結果の表音文字列データ
を言語解析部１に与える。この場合、ルビデータが付与
される単語の表記データに対しては、標準単語辞書４に
検索を行わせずに、ルビデータを表音文字列データとし
て用いる。音響処理部３は、言語解析部１で得られた漢
字かな混じり文の表音文字列データを基に音素をつなぎ
合わせて音声合成波形を形成する。音素辞書は、表音文
字列データに対して音素データを格納し、音響処理部３
からの表音文字列データに対応する音素データを検索
し、この結果の音素データを音響処理部３に与える。

【００１０】ルビデータ解析部５は入力される漢字かな
混じり部とルビデータからルビデータを分離し抽出す
る。暫定単語辞書６は、ＲＡＭで構成され、ルビデータ
解析部５で抽出されたルビーデータと、このルビデータ
に対応する表記データとを格納する。暫定単語辞書６
は、言語解析部１で切り出された単語について、標準単
語辞書に優先して検索を行い、その結果を言語解析部１
に与える。

【００１１】以下の具体的例を挙げて説明する。表記デ
ータとして次のような漢字かな混じり文とルビ文を受信
したとする。「京神高速（キョウシンコウソク）上り１０ｋｍ渋滞」ここに、「京神高速」は新設道路名称であるとし、（キ
ョウシンコウソク）がそのルビ文であり正しい読みであ
るとする。実際には、京神高速の上に小文字でルビが表
示される。このような位置表示コードは他の表記データ
のコードと相違する。この相違を利用して、ルビデータ
解析部５ではこのルビデータ（キョウシンコウソク）と
これに対応する表記データ「京神高速」を抽出して、暫
定単語辞書６に以下のように、単語（極一部のみ表示）
を格納する。

【００１２】表記データ表音文字列データ … … 京神高速キョウシンコウソク … … なお、標準単語辞書２には、次のように、単語（極一部
のみ表示）が格納される。

【００１３】表記データ表音文字列データ … … 上りノボリ１０ジュウｋｍキロメートル京キョウ〃ケイ神コウ〃シン高速コウソク … … もし、表記データ「京神高速」を標準単語辞書２で検索
すると、標準単語辞書２には「京神高速」がないので、
例えば「京」「神」「高速」の様に分割して言語解析処
理を行うので読み誤りの確立が高くなる。言語解析部１
では、一時的に付与されるルビが無くなっても、暫定単
語辞書６を用いて検索することができるので、読み誤り
が無くなる。

【００１４】図２は本発明の音声合成装置の一連の動作
を説明するフローチャートである。ステップＳ１におい
て、表記データを入力する。ステップＳ２において、表
記データを構成する漢字かな混じり文とルビ文からルビ
文を抽出する。ステップＳ３において、上記抽出処理に
おいて、ルビデータが有ったかの判断を行う。この判断
が「ＮＯ」の場合にはステップＳ６に進む。

【００１５】ステップＳ４において、上記判断が「ＹＥ
Ｓ」なら暫定単語辞書６に既に登録済かの判断を行う。
この判断が「ＹＥＳ」ならステップＳ６に進む。ステッ
プＳ５において、登録がまだの場合にはルビが一時的に
付与された造語、略称等に相当する表記データをルビに
より与えられた表音文字列データと共に暫定単語辞書６
に登録を行う。

【００１６】ステップＳ６において、上記単語は、まず
暫定単語辞書６を用いて、表音文字列データの検索が行
われる。ステップＳ７において、暫定単語辞書６で検索
された単語を除き、標準単語辞書２を用いて、表音文字
列データの検索が行われる。その結果、入力された前記
表示データは、「キョウシンコウソク」、「ノボリ」、
「ジュウ」、「キロメートル」、「ジュウタイ」と表音
文字列データに変換される。

【００１７】ステップＳ８において、音響処理が行われ
る。ステップＳ９において、音声合成波形データとして
出力される。したがって、本発明によれば、造語、略称
に一時的にルビが付与されその後に付与されなくなって
も、付与されている間に暫定単語辞書６に登録するの
で、読み誤りがなくなる。

【００１８】なお、暫定単語辞書６に登録された単語が
一定量になったら、標準単語辞書２にまとめて登録する
ようにしてもよい。単語毎に標準単語辞書２に登録する
のは煩雑であるが、まとめて行う分には煩雑さが小さく
なり、暫定単語辞書６の容量を小さくすることができ
る。また、暫定単語辞書６の登録された単語の中で使用
頻度が高いものを、標準単語辞書２に移す。暫定単語辞
書６と標準単語辞書２の格納容量のバランスを取るため
である。

【００１９】また、暫定単語辞書６の登録された単語の
中で使用頻度が低いものを単に削除し、使用頻度が高い
ものを残すようにしてもよい。暫定単語辞書６の格納容
量が限定されている場合に有利である。また、暫定単語
辞書６の登録された単語の中で登録が古く現在の使用頻
度が低いものを削除してもよい。前記と同様の理由によ
る。

【図面の簡単な説明】

【図１】本発明に係る音声合成装置の主要部の概略を示
す図である。

【図２】本発明の音声合成装置の一連の動作を説明する
フローチャートである。

【符号の説明】

１…言語解析部２…標準単語辞書５…ルビデータ解析部６…暫定単語辞書

Claims

【特許請求の範囲】

【請求項１】漢字かな混じり文を構成する単語の表記
データを表音文字列データに変換して音声に合成する音
声合成装置において、前記単語の前記表記データと前記表音文字列データと永
久的に登録する標準単語辞書と、前記漢字かな混じる文の表記データの一部に表音文字列
データにより付与されたルビとこれに対応する表記デー
タを抽出する解析を行うルビデータ解析部と、前記ルビデータ解析部により抽出された表記データとル
ビデータとを暫定的に登録する暫定単語辞書と、前記漢字かな混じり文から前記単語を切り出し、切り出
された単語の表記データに対する前記表音文字列データ
を、前記標準単語辞書を用いて検索する前に、前記暫定
単語辞書を優先的に用いて検索する言語解析部を備える
ことを特徴とする音声合成装置。
【請求項２】前記暫定単語辞書に一定量だけ登録され
た単語を前記標準単語辞書に移すことを特徴とする、請
求項１に記載の音声合成装置。
【請求項３】前記暫定単語辞書に登録された単語の中
で使用頻度の高いものを前記標準単語辞書に移すことを
特徴とする、請求項１に記載の音声合成装置。
【請求項４】前記暫定単語辞書に登録された単語の中
で使用頻度の低いものを削除することを特徴とする、請
求項１に記載の音声合成装置。
【請求項５】前記暫定単語辞書に登録された単語の中
で登録が古く現在の使用頻度の低いものを削除すること
を特徴とする、請求項１に記載の音声合成装置。
【請求項６】前記ルビデータ解析部は、前記ルビデー
タの位置を示すコードを用いて、前記漢字かな混じり文
の表記データからルビデータを抽出することを特徴とす
る、請求項１に記載の音声合成装置。