JPH09330098A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH09330098A
JPH09330098A JP8147267A JP14726796A JPH09330098A JP H09330098 A JPH09330098 A JP H09330098A JP 8147267 A JP8147267 A JP 8147267A JP 14726796 A JP14726796 A JP 14726796A JP H09330098 A JPH09330098 A JP H09330098A
Authority
JP
Japan
Prior art keywords
data
word dictionary
ruby
words
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8147267A
Other languages
English (en)
Inventor
Toshitaka Yamato
俊孝 大和
Hiroyuki Fujimoto
博之 藤本
Osamu Ishikawa
修 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP8147267A priority Critical patent/JPH09330098A/ja
Publication of JPH09330098A publication Critical patent/JPH09330098A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 続々と現れる造語、略称に対して表音文字列
データへの誤変換を防止する。 【解決手段】 漢字かな混じり文を構成する単語の表記
データを表音文字列データに変換して音声に合成する音
声合成装置において、単語の表記データと表音文字列デ
ータと永久的に登録する標準単語辞書2と、漢字かな混
じる文の表記データの一部に表音文字列データにより付
与されたルビとこれに対応する表記データを抽出する解
析を行うルビデータ解析部5と、ルビデータ解析部によ
り抽出された表記データとルビデータとを暫定的に登録
する暫定単語辞書6と、漢字かな混じり文から単語を切
り出し、切り出された単語の表記データに対する表音文
字列データを、標準単語辞書を用いて検索する前に、暫
定単語辞書を優先的に用いて検索する言語解析部1とを
備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は漢字かな混じり文の
テキストデータを単語辞書を用いて表音文字列データに
変換して読み上げを行う音声合成装置に関し、特に、続
々と現れる新たな単語(造語、略称)に対して表音文字
列データへの誤変換を防止することに関する。
【0002】
【従来の技術】近年、FM多重文字放送で送られてくる
一般情報や、VICS(自動車情報通信システム)によ
る交通情報の漢字かな混じり文をテキストデータ(表記
データ)として読み上げるために音声合成が用いられて
いる。この表記データを、これを読み上げるための表音
文字列データに変換する言語解析処理では、大容量の単
語辞書が必要とされている。すなわち、単語辞書には、
単語の表記データと表音文字列データが1対になり、多
数格納されている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
単語辞書では、如何にデータを充実させても、新設の道
路名称、商品名称等の造語や、さらに略称などの多数の
単語に対応させることが不可能なため、読み誤りが発生
するという問題がある。ところで、上記のような造語や
略称などは表示されたときに、読み誤りやすいため、こ
れらに、FM放送側、VICSの発信側では、一時的に
ルビを付与することが考えられている。このため、この
ルビを用いれば、音声合成においても読み誤りを無くす
ことができる。
【0004】本発明は、造語、略称に対する一時的なル
ビ付与がなくなっても、読み誤りを防止できる音声合成
装置を提供することを目的とす。
【0005】
【課題を解決するための手段】本発明は、前記問題点を
解決するために、漢字かな混じり文を構成する単語の表
記データを表音文字列データに変換して音声に合成する
音声合成装置において、前記単語の前記表記データと前
記表音文字列データと永久的に登録する標準単語辞書
と、前記漢字かな混じり文の表記データの一部に表音文
字列データにより付与されたルビとこれに対応する表記
データを抽出する解析を行うルビデータ解析部と、前記
ルビデータ解析部により抽出された表記データとルビデ
ータとを暫定的に登録する暫定単語辞書と、前記漢字か
な混じり文から前記単語を切り出し、切り出された単語
の表記データに対する前記表音文字列データを、前記標
準単語辞書を用いて検索する前に、前記暫定単語辞書を
優先的に用いて検索する言語解析部を備える。この手段
により、造語、略称のように、標準単語辞書に登録され
ていない単語であっても、暫定単語辞書を用いて検索す
ることが可能になり、読み誤りが防止できるようになっ
た。
【0006】前記暫定単語辞書に一定量だけ登録された
単語を前記標準単語辞書に移す。この手段により、前記
標準単語辞書の再登録の頻度が少なくなり、且つ暫定単
語辞書の登録容量を大きくせずに済む。前記暫定単語辞
書に登録された単語の中で使用頻度の高いものを前記標
準単語辞書に移す。この手段により、さらに、前記標準
単語辞書の登録頻度と前記暫定単語辞書の登録量のバラ
ンスを取ることができる。
【0007】前記暫定単語辞書に登録された単語の中で
使用頻度の低いものを削除する。この手段により、前記
暫定単語辞書が限定され、且つ標準単語辞書の再登録が
できない場合に有利である。前記暫定単語辞書に登録さ
れた単語の中で登録が古く現在の使用頻度の低いものを
削除する。この手段により、使用頻度が低い同志では古
いものを優先的に削除する。
【0008】前記ルビデータ解析部は、前記ルビデータ
の位置を示すコードを用いて、前記漢字かな混じり文の
表記データからルビデータを抽出する。この手段によ
り、ルビデータを他の表記データから識別が容易にでき
る。
【0009】
【発明の実施の形態】以下本発明の実施の形態について
図面を参照して説明する。図1は本発明に係る音声合成
装置の主要部の概略を示す図である。本図に示すよう
に、音声合成装置では、漢字かな混じり文とルビデータ
とを入力する言語解析部1は漢字かな混じり文の表記デ
ータについて文法的解釈を行って単語の切り出しを行
い、単語毎の表記データを単語毎の表音文字列データに
変換して、漢字かな混じり文の全体の表音文字列データ
を形成する。標準単語辞書2は、単語の表記データに対
して表記データを読み上げるべき表音文字列データを格
納し、言語解析部1からの単語表記データに対応する表
音文字列データを検索し、この結果の表音文字列データ
を言語解析部1に与える。この場合、ルビデータが付与
される単語の表記データに対しては、標準単語辞書4に
検索を行わせずに、ルビデータを表音文字列データとし
て用いる。音響処理部3は、言語解析部1で得られた漢
字かな混じり文の表音文字列データを基に音素をつなぎ
合わせて音声合成波形を形成する。音素辞書は、表音文
字列データに対して音素データを格納し、音響処理部3
からの表音文字列データに対応する音素データを検索
し、この結果の音素データを音響処理部3に与える。
【0010】ルビデータ解析部5は入力される漢字かな
混じり部とルビデータからルビデータを分離し抽出す
る。暫定単語辞書6は、RAMで構成され、ルビデータ
解析部5で抽出されたルビーデータと、このルビデータ
に対応する表記データとを格納する。暫定単語辞書6
は、言語解析部1で切り出された単語について、標準単
語辞書に優先して検索を行い、その結果を言語解析部1
に与える。
【0011】以下の具体的例を挙げて説明する。表記デ
ータとして次のような漢字かな混じり文とルビ文を受信
したとする。 「京神高速(キョウシンコウソク)上り10km渋滞」 ここに、「京神高速」は新設道路名称であるとし、(キ
ョウシンコウソク)がそのルビ文であり正しい読みであ
るとする。実際には、京神高速の上に小文字でルビが表
示される。このような位置表示コードは他の表記データ
のコードと相違する。この相違を利用して、ルビデータ
解析部5ではこのルビデータ(キョウシンコウソク)と
これに対応する表記データ「京神高速」を抽出して、暫
定単語辞書6に以下のように、単語(極一部のみ表示)
を格納する。
【0012】 表記データ 表音文字列データ … … 京神高速 キョウシンコウソク … … なお、標準単語辞書2には、次のように、単語(極一部
のみ表示)が格納される。
【0013】 表記データ 表音文字列データ … … 上り ノボリ 10 ジュウ km キロメートル 京 キョウ 〃 ケイ 神 コウ 〃 シン 高速 コウソク … … もし、表記データ「京神高速」を標準単語辞書2で検索
すると、標準単語辞書2には「京神高速」がないので、
例えば「京」「神」「高速」の様に分割して言語解析処
理を行うので読み誤りの確立が高くなる。言語解析部1
では、一時的に付与されるルビが無くなっても、暫定単
語辞書6を用いて検索することができるので、読み誤り
が無くなる。
【0014】図2は本発明の音声合成装置の一連の動作
を説明するフローチャートである。ステップS1におい
て、表記データを入力する。ステップS2において、表
記データを構成する漢字かな混じり文とルビ文からルビ
文を抽出する。ステップS3において、上記抽出処理に
おいて、ルビデータが有ったかの判断を行う。この判断
が「NO」の場合にはステップS6に進む。
【0015】ステップS4において、上記判断が「YE
S」なら暫定単語辞書6に既に登録済かの判断を行う。
この判断が「YES」ならステップS6に進む。ステッ
プS5において、登録がまだの場合にはルビが一時的に
付与された造語、略称等に相当する表記データをルビに
より与えられた表音文字列データと共に暫定単語辞書6
に登録を行う。
【0016】ステップS6において、上記単語は、まず
暫定単語辞書6を用いて、表音文字列データの検索が行
われる。ステップS7において、暫定単語辞書6で検索
された単語を除き、標準単語辞書2を用いて、表音文字
列データの検索が行われる。その結果、入力された前記
表示データは、「キョウシンコウソク」、「ノボリ」、
「ジュウ」、「キロメートル」、「ジュウタイ」と表音
文字列データに変換される。
【0017】ステップS8において、音響処理が行われ
る。ステップS9において、音声合成波形データとして
出力される。したがって、本発明によれば、造語、略称
に一時的にルビが付与されその後に付与されなくなって
も、付与されている間に暫定単語辞書6に登録するの
で、読み誤りがなくなる。
【0018】なお、暫定単語辞書6に登録された単語が
一定量になったら、標準単語辞書2にまとめて登録する
ようにしてもよい。単語毎に標準単語辞書2に登録する
のは煩雑であるが、まとめて行う分には煩雑さが小さく
なり、暫定単語辞書6の容量を小さくすることができ
る。また、暫定単語辞書6の登録された単語の中で使用
頻度が高いものを、標準単語辞書2に移す。暫定単語辞
書6と標準単語辞書2の格納容量のバランスを取るため
である。
【0019】また、暫定単語辞書6の登録された単語の
中で使用頻度が低いものを単に削除し、使用頻度が高い
ものを残すようにしてもよい。暫定単語辞書6の格納容
量が限定されている場合に有利である。また、暫定単語
辞書6の登録された単語の中で登録が古く現在の使用頻
度が低いものを削除してもよい。前記と同様の理由によ
る。
【図面の簡単な説明】
【図1】本発明に係る音声合成装置の主要部の概略を示
す図である。
【図2】本発明の音声合成装置の一連の動作を説明する
フローチャートである。
【符号の説明】
1…言語解析部 2…標準単語辞書 5…ルビデータ解析部 6…暫定単語辞書

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 漢字かな混じり文を構成する単語の表記
    データを表音文字列データに変換して音声に合成する音
    声合成装置において、 前記単語の前記表記データと前記表音文字列データと永
    久的に登録する標準単語辞書と、 前記漢字かな混じる文の表記データの一部に表音文字列
    データにより付与されたルビとこれに対応する表記デー
    タを抽出する解析を行うルビデータ解析部と、 前記ルビデータ解析部により抽出された表記データとル
    ビデータとを暫定的に登録する暫定単語辞書と、 前記漢字かな混じり文から前記単語を切り出し、切り出
    された単語の表記データに対する前記表音文字列データ
    を、前記標準単語辞書を用いて検索する前に、前記暫定
    単語辞書を優先的に用いて検索する言語解析部を備える
    ことを特徴とする音声合成装置。
  2. 【請求項2】 前記暫定単語辞書に一定量だけ登録され
    た単語を前記標準単語辞書に移すことを特徴とする、請
    求項1に記載の音声合成装置。
  3. 【請求項3】 前記暫定単語辞書に登録された単語の中
    で使用頻度の高いものを前記標準単語辞書に移すことを
    特徴とする、請求項1に記載の音声合成装置。
  4. 【請求項4】 前記暫定単語辞書に登録された単語の中
    で使用頻度の低いものを削除することを特徴とする、請
    求項1に記載の音声合成装置。
  5. 【請求項5】 前記暫定単語辞書に登録された単語の中
    で登録が古く現在の使用頻度の低いものを削除すること
    を特徴とする、請求項1に記載の音声合成装置。
  6. 【請求項6】 前記ルビデータ解析部は、前記ルビデー
    タの位置を示すコードを用いて、前記漢字かな混じり文
    の表記データからルビデータを抽出することを特徴とす
    る、請求項1に記載の音声合成装置。
JP8147267A 1996-06-10 1996-06-10 音声合成装置 Withdrawn JPH09330098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8147267A JPH09330098A (ja) 1996-06-10 1996-06-10 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8147267A JPH09330098A (ja) 1996-06-10 1996-06-10 音声合成装置

Publications (1)

Publication Number Publication Date
JPH09330098A true JPH09330098A (ja) 1997-12-22

Family

ID=15426366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8147267A Withdrawn JPH09330098A (ja) 1996-06-10 1996-06-10 音声合成装置

Country Status (1)

Country Link
JP (1) JPH09330098A (ja)

Similar Documents

Publication Publication Date Title
US8311804B2 (en) On demand TTS vocabulary for a telematics system
US6012028A (en) Text to speech conversion system and method that distinguishes geographical names based upon the present position
US20010037203A1 (en) Navigation system
US20080147380A1 (en) Method, Apparatus and Computer Program Product for Providing Flexible Text Based Language Identification
KR19980042248A (ko) 음성인식 시스템
US7555433B2 (en) Voice generator, method for generating voice, and navigation apparatus
KR19980024599A (ko) 특정 지역 및 초지역적인 도로나 영역 표기를 처리하는 무선 수신기
KR100436609B1 (ko) 트래픽정보장치,모듈및휴대가능카드
RU2320026C2 (ru) Преобразование буквы в звук для синтезированного произношения сегмента текста
US8521532B2 (en) Speech-conversion processing apparatus and method
JP2001141500A (ja) 車載エージェント処理装置
US5806035A (en) Traffic information apparatus synthesizing voice messages by interpreting spoken element code type identifiers and codes in message representation
JP3911178B2 (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
JPH09330098A (ja) 音声合成装置
WO2000011572A1 (en) Object data retrieving device, object data retrieving method, and computer-readable recording medium containing recorded data
KR100549757B1 (ko) 텍스트 음성화 장치 및 그 방법과 이를 이용한 정보 제공시스템
US20040015354A1 (en) Voice recognition system allowing different number-reading manners
JPH0420998A (ja) 音声合成装置
JPH10254470A (ja) テキスト音声合成装置
JPH09114807A (ja) 文音声合成装置
JP3983313B2 (ja) 音声合成装置及び音声合成方法
US11975729B2 (en) Method for generating a voice announcement as feedback to a handwritten user input, corresponding control device, and motor vehicle
JP2002023782A (ja) 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体
JP2004053979A (ja) 音声認識辞書の作成方法及び音声認識辞書作成システム
JPH11175094A (ja) 音声認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030902