JPS63189933A - 文章読み上げ装置 - Google Patents

文章読み上げ装置

Info

Publication number
JPS63189933A
JPS63189933A JP62022909A JP2290987A JPS63189933A JP S63189933 A JPS63189933 A JP S63189933A JP 62022909 A JP62022909 A JP 62022909A JP 2290987 A JP2290987 A JP 2290987A JP S63189933 A JPS63189933 A JP S63189933A
Authority
JP
Japan
Prior art keywords
reading
kanji
words
word
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62022909A
Other languages
English (en)
Inventor
Masahiko Uchiyama
昌彦 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62022909A priority Critical patent/JPS63189933A/ja
Publication of JPS63189933A publication Critical patent/JPS63189933A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 本発明は文章読み上げ装置に入力される文章データに文
章解析部に登録されていない単語があった場合、その単
語に与える読みに関するものであって、未知語読み変換
部と漢字辞書部とを設け、l漢字とかなで構成される単
語の漢字は訓読みにし、複数漢字は音読みにすることに
よって未登録単語に読みを付与して、読み上げができる
ようにする。
〔産業上の利用分野〕
本発明は文章読み上げ装置に関するものであって、特に
、入力される文章データに文章解析部に登録されていな
い単語があった場合、その単語に与える読みに関するも
のである。
文字コードで構成された文章データを合成音声によって
読み上げる文章読み上げ装置は、新聞社等における原稿
とその原稿から作成された文章データとの読み合わせ校
正に利用される。
即ち、文章読み上げ装置が文章データを電子的に合成さ
れた合成音声で読みあげ、校正者は原稿を見て校正する
この場合、文章データには文章解析部に登録されていな
い単語、例えば造語、新語等がしばしば含まれており、
その都度文章読み上げ装置がとまってしまうとその部分
の校正確認が煩わしく、校正作業工数が余分にかかるこ
とになる。
従って、未登録語はなんらかの読みを与えて読むことが
できるような文章読み上げ装置が要望されていた。
〔従来の技術〕
第4図は従来の文章読み上げ装置の構成ブロック図を示
す。
図において、文字コードで構成された文章データがファ
イル装置、あるいは回線伝送によって文章入力部lに入
力する。
文章解析部2は文章入力部lから出力された文章データ
を単語に区分し、内蔵する単語辞書と照合して、区分さ
れた単語に読み、アクセント、発声高低等の単語発音に
必要な要素、また文章として読み上げる場合の単語発音
の抑揚等を付加して音声合成部3に出力する。
音声合成部3は、これら発音要素のディジタル信号を音
声のアナログ信号に変換し、スピーカ4から出力される
このような文章読み上げ装置で文章解析部2の単語辞書
に登録されていない単語、即ち、未知語があって、発音
要素に解析できない場合は、音声合成ができず、文章の
読み上げはその部分で停止される。
そして、その場合は文字コードを印刷、あるいはディス
プレイ表示して、原稿との正誤を確がめる。
〔発明が解決しようとする問題点〕
この従来の方式では、例えば新聞社で使用されるような
文章では、新語、造語、略語等が頻繁に現れるため、未
知語は多くなり、文章の読み上げはその都度中断される
未知語によって文章の読み上げが中断され、その確認す
る手数によって、原稿校正作業は著しく阻害される。
本発明はこのような点に鑑みて創作されたものであって
、未知語に対してなんらかの読みを与え、文章読み上げ
を中断しない文章読み上げ装置を提供することを目的と
している。
〔問題点を解決するための手段〕
上記した目的を達成するために、文章読み上げ装置に未
知語読み変換部と漢字辞書部とを設け、文章解析部に接
続する。
そして、文章解析部に登録されていない未知語について
、1文字の漢字とかなとで構成される単語の漢字は、漢
字辞書部に照合して訓読みで読みを付与し、複数の漢字
で構成される未知語の漢字は、音読みで読みを付与する
ようにする。
〔作用〕
文章解析部で解析できない未知語は、未知語読み変換部
に出力され、未知語読み変換部は漢字辞書部に登録され
た漢字と照合して、未知語の単語構成に応じて漢字に訓
読み、あるいは音読みを与え、音声合成部に出力する。
この未知語の処理によって、文章読み上げ装置は未知語
によって中断されることがなくなる。
しかも、文章解析部における単語辞書にすべての単語の
登録を期待することなく、登録される単語を常用単語に
限り、未登録単語は未知語として未知語読み変換部の読
みに任せることができる。
こうすることによって、単語辞書の登録数を減らすと文
章解析文章の単語照合の平均時間が減少し、文章読み上
げが円滑に行い得ることになる。
〔実施例〕
第1図は本発明の文章読み上げ装置の一実施例の構成ブ
ロック図を示す。
なお、全図を通じて同一符号は同一対象物を示す。
文章解析部21は単語辞書に登録されていない単語を未
知語として弁別し、未知語読み変換部5に出力する機能
が付与される。
従って、入力された文章データの未知語は、文章解析部
を経て、未知語読み変換部5に出力される。
未知語読み変換部5は、漢字辞書部6に読みを照合して
未知語に読みをつけ、音声合成部3に出力する。
漢字辞書部6は、漢字読みの第1の登録方式として、1
つの漢字に音読みと訓読みとを1つずつをもっていて、
未知語が漢字とかなで構成されていると、その漢字に訓
読みを抽出し、未知語が複数の漢字で構成されている場
合は、その漢字に音読みを付与する。
この方式の場合、必ずしも正ししく未知語の読みを期待
することなく、ただ文章読み上げ時の読みが対応する1
つの漢字に特定されればよいとするものである。
第2図は本発明の文章読み上げ装置の他の実施例の構成
ブロック図、 第3図は漢字読みの第2の登録方式を説明する図を示す
文章解析部22は、未知語読み変換部5に未知語を出力
するとともに、漢字辞書部6の漢字の読みの標識種Cに
標識を付ける機能をを有する。
第2の登録方式として、漢字とが対応している文章解析
部22の漢字読みを第3図のように、漢字毎に、漢字a
に対する読み欄b、各読みに対する標識種Cを有する。
例えば「行」であれば、「オコナ(う)〔訓〕、ギョウ
〔音〕、コラ〔音〕等の読みを記憶し、「政」では、[
マッリゴト〔訓〕、セイ〔音〕」を記憶している。
そして、標識種Cは文章解析文章22が漢字に読みを付
与するたびに使用した音読みに標識をっけ換える。
未知語読み変換部5は、未知語の漢字読みには漢字辞書
部6の標識のある読みを使用する。
このようにすることによって、未知語には文章解析文章
22で使用された最新の使用読みが付与される。
未知語が例えば「行革審」と云う複数の漢字からなる単
語であれば、これら漢字が読みに複数の音読みをもつ場
合でも、文章データの始めに「行政改革審議会」という
単語があって「ギョウセイカイカクシンギカイ」と読ま
れているような場合に、「行革審」は未知語とされても
「ギョウカクシン」と読まれることになる。
なお、未知語の読みは文章解析部の単語辞書に登録して
、次の文章データの単語入力に対処するようすることも
容易に可能である。
〔発明の効果〕
以上述べてきたように、本発明によれば、文章読み上げ
装置の文章解析部に登録されていない未知語であっても
読みが付与され、中断することなく読み上げを続けるこ
とができ、実用的には極めて有用である。
【図面の簡単な説明】 第1図は、本発明の文章読み上げ装置の一実施例の構成
ブロック図、 第2図は、本発明の他の実施例の構成ブロック図、 第3図は、第2図の漢字辞書を説明する図、第4図は、
従来例の構成ブロック図である。 図において、 lは文章データ入力部、 2.21.22は文章解析部、 3は音声合成部、 4はスピーカ、 5は未知語読み変換部、 6は漢字辞書部である。 1mで9石す■t+−fJfJfJ4nA?D ・y7
M第1図 第2図 漢丁#丁を鼓四わm 第3図 従来f’J/1’j−fhf5Cフ・ロッ7m第4図

Claims (1)

  1. 【特許請求の範囲】 文章解析部(2)が入力される文章データを解析して、
    該文章データの単語を予め登録された単語の読みと照合
    してそれぞれの単語に読みを出力し、音声合成部(3)
    で音声合成して合成音で読み上げる装置において、 前記文章解析部(21、22)に接続された未知語読み
    変換部(5)と該未知語読み変換部(5)に接続された
    漢字辞書部(6)とを設け、前記前記文章解析部(21
    、22)に登録されていない前記文章データの単語は前
    記未知語読み変換部(5)に出力して処理され、前記登
    録されていない単語で、1文字の漢字とかなとで構成さ
    れる単語の漢字は訓読みで読みを出力し、複数の漢字で
    構成される単語の漢字は音読みで読みを出力して音声合
    成部(3)に入力されることを特徴とする文章読み上げ
    装置。
JP62022909A 1987-02-02 1987-02-02 文章読み上げ装置 Pending JPS63189933A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62022909A JPS63189933A (ja) 1987-02-02 1987-02-02 文章読み上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62022909A JPS63189933A (ja) 1987-02-02 1987-02-02 文章読み上げ装置

Publications (1)

Publication Number Publication Date
JPS63189933A true JPS63189933A (ja) 1988-08-05

Family

ID=12095766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62022909A Pending JPS63189933A (ja) 1987-02-02 1987-02-02 文章読み上げ装置

Country Status (1)

Country Link
JP (1) JPS63189933A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01321557A (ja) * 1988-06-23 1989-12-27 Ricoh Co Ltd テキスト音声合成装置
WO2004013763A3 (en) * 2002-07-31 2004-05-21 Koninkl Philips Electronics Nv Determining the reading of a kanji word

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01321557A (ja) * 1988-06-23 1989-12-27 Ricoh Co Ltd テキスト音声合成装置
WO2004013763A3 (en) * 2002-07-31 2004-05-21 Koninkl Philips Electronics Nv Determining the reading of a kanji word

Similar Documents

Publication Publication Date Title
US5164900A (en) Method and device for phonetically encoding Chinese textual data for data processing entry
EP0691023B1 (en) Text-to-waveform conversion
HK18495A (en) Method and apparatus for data processing and word processing in chinese using a phonetic chinese language
US20090150157A1 (en) Speech processing apparatus and program
GB2158776A (en) Method of computerised input of Chinese words in keyboards
JP6998017B2 (ja) 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム
RU2113726C1 (ru) Компьютерное устройство для чтения плоскопечатного текста
JPS63189933A (ja) 文章読み上げ装置
JPH0420998A (ja) 音声合成装置
JPH06282290A (ja) 自然言語処理装置およびその方法
Gakuru et al. Development of a Kiswahili text to speech system.
JP2006030384A (ja) テキスト音声合成装置及びテキスト音声合成方法
JPS634206B2 (ja)
JP2000352990A (ja) 外国語音声合成装置
JPH0210957B2 (ja)
JP2612030B2 (ja) 文章読み上げ装置
Olabe et al. Real time text-to-speech conversion system for spanish
JP2502101B2 (ja) 音声による文章校正装置
JPH03245192A (ja) 外国語単語の発音決定方法
JPS6288054A (ja) 文章読み上げ装置
Olaszi Analysis of Written and Spoken Form of Hungarian Numbers for TTS Applications
JP2801601B2 (ja) テキスト音声合成装置
JPH054676B2 (ja)
JPH02234198A (ja) テキスト音声合成システム
JP2614912B2 (ja) 文章読み上げ装置