JPS6326723A

JPS6326723A - 文章読み上げ装置

Info

Publication number: JPS6326723A
Application number: JP61169044A
Authority: JP
Inventors: Toshiro Shibanuma; 敏郎柴沼
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1986-07-19
Filing date: 1986-07-19
Publication date: 1988-02-04
Also published as: JPS6326409B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概　　要〕本発明は、表記された文章を辞書部の単語等とマツチン
グを取りながら単語等を同定し、読みに変換し、音声合
成部において文章を読み上げる文章読み上げ装置に関す
る。

本発明は、読み上げる文章に一部、あるいは全部がカタ
カナあるいはひらがな書きの単語等が現れた場合に、そ
のままの表記で辞書中に登録されていなければ、照合の
際にその単語等が同定されないという問題を解決するた
め、辞書中の表記と読みの両方を共に組合わせて、照合
することにより、単語等が必ず同定できるようにしてい
る。

このように、表記と読みを組合わせる方法を用いれば、
漢字のみの単語等さえ辞書に登録していれば、その単語
等の一部あるいは全部がカタカナあるいはひらがな書き
で文章中に現れても、正しく同定でき、辞書部の容量も
少なくて済むという効果がある。

〔産業上の利用分野〕

本発明は、日本語処理装置の構成に関し、特に単語、文
節、句等の単語等から構成される文章の各単語等を辞書
部の単語等とマツチングをとりながら、単語等を同定し
、音声合成部で文章を読み上げる文章読み上げ装置の構
成に関する。

特に、漢字で表記すべき単語でも、一部あるいは前部が
カタカナ書きされている場合でも、辞書中の表記と読み
を組合わせて照合することを可能とする文章読み上げ装
置の文章解析方式および辞書形式に関する。

〔従　来　技　術〕

集積化技術の発展に伴い、プロセッサ、メモリ素子ある
いは入出力装置等が高性能化され、低価格になるととも
に、計算機システムの性能が向上してきた。

そして、利用形態も個別使用のみでなく、ネットワーク
を介してシステムの多様化が進んできた。

さらに、入出力装置の面では、パターン認識や、音声認
識の技術の進歩に伴い、漢字の入出力、あるいは音声入
出力等、人間とのインターフェースの改善がなされ、日
本語処理を行う専用の処理装置もＯＡ機器として重用視
されてきた。

特に、ワードプロセッサは文章の構成を行う処理機能を
備え、文章の編集や保管、あるいは文章作成を自動的に
行う装置として普及され、日本語の文章が簡単に計算機
システムの外部入力装置に記憶されるようになった。

また、人間の音声を音節や単語等の単位で区切って発生
させ、個々の音節や単語を認識し、処理するいわゆる離
散型単語装置が実用化されている。

また、音声で日本語文章をシステムに入力することもで
きるようになってきた。このようなワードプロセッサや
音声入力装置を用いて、入力された日本語文章を正しく
入力されたかどうかを検査したり、あるいは既にシステ
ムに格納された新聞記事等を単に耳で聴く場合、機械に
格納された文章等を読み上げる文章読み上げ装置の重要
性も高まってきた。

この文章読み上げ装置は、文章の単語あるいは文節や句
等の単語等を辞書部の単語等とマツチングを取りながら
、同定し、各文章を音声合成部を介して読み上げる機能
を必要とする。

ところが、日本語の文章は新開記事等に見られるように
、カタカナ文字列の固有名詞や新語、強調のためのカタ
カナ書き、あるいは漢字の代わりに、ひらがな書きにし
ている文章が非常に多く存在している。

このような文章を読み上げ装置で解析する場合、文字列
（即ち、基本的には単語であるが、文節や句でもよくこ
れらを総称して単語等と呼ぶことにする）としての単語
等の同定が辞書部にその単語等が存在しないために失敗
することがある。

第４図は従来の文章読み上げ装置の構成を示す構成図で
ある。１は、文章を格納する文章ファイル部から文章を
入力または出力する文章入出力端子であり、２は、前記
文章ファイル部から前記入出力端子を介して読みだされ
た文章を小さな文字列の単位に分割し、各単位ごとに読
み上げ用辞書部３からの内容とマツチングし、同定する
文章解析部である。前記文章解析部２の出力である読み
を音声に変換するのが規則合成部４である。規則合成部
４の出力はスピーカ５に与えられ、音声となる。

読み上げ用辞書部３には、例えば第３図に示すように、
表記、読み、文法、アクセント等がひとつのまとまりと
して格納されている。例えば、表記の「初耳」という漢
字の読みはひらがなで「はつみみ」となっており、この
単語は名詞であってアクセントとしては読みの各文字の
どこにもアクセントがないことを示す「０」が示されて
いる。

次の「初詣」に関しては、アクセントは「３」となって
いるが、これは「も」という文字のところで、アクセン
トがあることを示している。

従来の文章読み上げ装置の文章解析部２においては、前
記読み上げ用辞書部３の表記の部分のみを比較の対象と
していたため、例えば文章中に「初もうで」となってい
た場合、即ち「初」が漢字で「もうで」がひらがなにな
っていた場合には、辞書中に同じ表記の単語がないため
に、正しく同定されないという問題があった。

〔発明が解決しようとする問題点〕

このように、従来の文章読み上げ装置の文章解析部では
、表記の一部がカタカナ書きになっていたり、ひらがな
書きになっている場合、辞書部に登録されていないので
、正しく同定されないという問題点がある。本発明は、
この問題点を解決するための文章解析方式および辞書形
式を提供することにある。

〔問題点を解決するための手段〕

本発明は、上記目的を達成するために、第４図に示す従
来の文章読み上げ装置の構成に第１図（ト））図に示す
ように、表記読み組合わせ生成部６を追加してできる文
章読み上げ装置を提供する。

即ち、文章ファイル部から文章を入力または出力する文
章入出力端子１に接続され、前記文章ファイル部から続
出された文章を小さな文字列の単位に分割し各単位ごと
に読み上げ用辞書部３の内容とマツチングし同定する文
章解析部２と、前記文章解析部２の出力である読みを音
声に変換する規則合成部４と、音声を発生するスピーカ
５に加えて、前記文章解析部２と前記読み上げ用辞書部
３との間に表記読み組合わせ生成部６を付加し、読み上
げ用辞書部３の中の表記と読みの情報の両方を組合わせ
て文章の照合を行う手段を有することを特徴とする文章
読み上げ装置を提供する。

〔作　　　用〕

本発明は、文章読み上げ装置において、読み上げる文章
に一部あるいは全部がカタカナあるいはひらがな書きの
単語等が現れた場合に、そのままの表記で辞書中に登録
されていなければ照合の際に、その単語等が同定されな
いという問題点を解決する。そのため、辞書中の表記と
読みの情報を組合わせて照合することにより、漢字のみ
の単語等さえ、辞書に登録されていれば、その単語等が
一部あるいは全部がカタカナあるいはひらがな書きで文
章中に現れても、正しく同定されるようにしたものであ
る。

〔実　　施　　例〕

次に、本発明の文章読み上げ装置を図面を参照して、説
明する。

本発明の文章読み上げ装置は、第１図（ｂ）に示すよう
に、単語あるいは文節あるいは句の読み方を格納した読
み上げ用辞書部３と、その辞書部の内容と照合しながら
文章の単語あるいは文節あるいは句を同定し文章に読み
を与える文章解析部２と、その読みから文章を合成する
規則合成部４を用いて、文章を音声に換える。

以下単語あるいは文節あるいは句を単語等と呼ぶことに
する。

文章ファイルから読出された各文章は文章解析部２にお
いて、読み上げ用辞書部３に格納された単語等とのマツ
チングによって、単語等の同定が実行され、単語等の単
位に区切られる。読み上げ用辞書部３は例えば漢字を入
力し、これをカナに変換する漢字カナ変換辞書である。

文章解析部２は各文章中の単語等のうち漢字等の単語が
読み上げ用辞書部３に格納されたものである場合には、
即座に読みに変換することができる。規則合成部４は前
記読みに対応する情報を音声信号の形でスピーカ５に与
え、スピーカ５から音声が発生される。規則合成部４で
合成される音声合成は音声出力の為のデータを予め分析
し記憶しておいて、読みに対応して、単語等の文字列を
音声で読み上げる部分である。

音声合成のためのデータ分析は、波形符号化や線形予測
分析等段に、種々の分析技術が用いられている。

１つの方法では、単語や文節等の自然音声に含まれる音
素間の調音結合の特徴や、アクセントあるいは抑揚等の
特徴がそのまま保持されるので、音質がよいが予め分析
しである単語や文節の組合わせ以外の音声出力は出力で
きないという欠点を有している。それに反し、他の方法
によれば、出力したい単語や文章を音素や音節記号の形
で入力することになるので、任意の文章に対して合成で
きることになる。しかし、音声の色々な特徴は人工的に
付加してやらなければならないという問題がある。

規則合成部４は特に音素あるいは音節による生成源処理
方法であり、音素や音節等の音声分析データを音声生成
モデルの制御信号に用いる形式に従っている。従って、
規則合成部４は合成音の倍電数には制限がなく、自然音
声に見られる調音結合や、韻律特性によって、音響的な
性質には、変形の仕方を規則化しているこの音Ｃ的性質
の変形を規則化し、これに基づいて制御信号を変形する
ことにより、合成音の性質が自然音声に非常に似たもの
となる。従って、この規則合成部４において、音素や音
節記号あるいは文字の系列だけを文章解析部２から読み
として入力すれば、それに対応する任意の合成音を出力
することができる。

この規則合成部４は、一般に波形処理系よりも、記憶容
量が減らせるが、回路構成が複雑になるので、ワンチッ
プのＬＳＩでディジタル演算的に実行することによって
、回路構成の複雑性を減じることが必要である。更に、
音声合成器の動作に必要な制御信号を前もって記憶され
た音声データと決められた規則によって生成する必要が
ある。そのため、ＬＳＩとしては、ホルマント型やＰＡ
ＩＩＣＯＲ型の２種類がある。

例えば、ＰＡＲＣＯＲ型ＬＳＩはそれぞれ２個ずつの除
算器と加算器とで構成された格子型ディジタルフィルタ
を１０段程度カスケードに接続して、音声を合成してい
るものである。また、韻律的特徴に関しては、前もって
記憶された音響の格納データを使って合成音声に対して
基本周波数、振幅あるいは音素の！！続待時間が決めら
れる。

文章ファイルから入力された各文章が読み上げ用辞書部
３の単語等とマツチングされ、単語単位、あるいは文節
単位等に分割され、同定される場合に、読み上げ用辞書
部３において、存在しないひらがなあるいはカタカナ等
の未知語が文章中に存在する場合がある。また、新聞記
事等においては、カタカナ文字の固有名詞や新語あるい
は強調の為のカタカナ書きや漢字の代わりに、ひらがな
にしである文章が多く存在し、このような文章を解析す
ると、単語の同定にかなりの高い確率で同定が失敗する
ことがある。特に、漢字で表記すべき単語でも、一部あ
るいは全部がカナ書きにされる場合があり、文章読み上
げ装置においては、これらについても、正しく読み上げ
ることが要求される。

しかし、これらの一部カナ書き等の単語を全て読み上げ
用辞書部３に登録することは記憶容量が膨大となり、実
用的でない。そこで、本発明は読み上げ用辞書部３に登
録されていなくても、一部カナ書きされた単語が、正し
く読み上げられるように、辞書中の表記と読みの情報の
両方を組合わせて照合する表記読み組合わせ生成部６を
追加している。即ち、本発明では、文章解析部２で読み
上げ用辞書部３の中にある単語等と文章中の単語等がマ
ツチングがとれなかった場合には、前記表記読み組合わ
せ生成部６を動作させ、第２図に示すようなフローチャ
ートに従って、照合を実行する。

第２図のフローチャートを説明するために、読み上げ用
辞書部３の内容は第１図（ａｌに示すような内容である
と、仮定する。即ち、読み上げ用辞書部３は表記、読み
、文法、アクセント等がひとつの単位として各表記ごと
に記憶されている。例えば、第１図（ａｌでは、表記と
して「初耳」、「初詣」、「初物」の３つの表記があり
、「初耳」に対しては読みは「はつ／みみ」となってい
る。「初詣」に関しては、その読みは「はつ／もうで」
となっている。「初物」に対しては読みは「はつ／もの
」となっている。即ち、本発明の読みの欄は辞書中の単
語あるいは文節あるいは句の漢字１文字づつに「／」で
区切られている。

文法の欄に関しては、従来と同じように「初耳」、「初
詣」、「初物」の各表記に対して、「名詞」となってい
る。

アクセントに関しても、従来と同じで、「初耳」に関し
ては、読みのアクセントはないため、「０」が格納され
ている。「初物」に関しても、読みのアクセントがない
からｒＯＪであるが、「初詣」に関しては、「も」にア
クセントがあるため、読みの欄のひらがなの第三番目を
強調する３が格納されている。

第２図のフローチャートにおいて、本発明の文章読み上
げ装置では文章解析の制御が始まると、５ＴＥＰ　１で
文章の先頭へポインタを移動する。次に、５ＴＥＰ　２
で文章中の単語と読み上げ用辞書部３の表記とを照合す
る。ここで、第１図（ａ）に示す表記と例えば文章中の
「初もうで」との照合を行う場合を想定する。このとき
、文章中の「初もうで」の「初」が漢字で「もうで」が
ひらがなである。

５ＴＥＰ　２においては、まず「初」という漢字で表記
との照合を行うと、辞書部には「初耳」、「初詣」、「
初物」と３つの表記で照合される。もし、文章中で「初
」という漢字の次が「詣」という漢字である場合には、
５ＴＥＰ　３の判断命令において、照合が　「有」とな
り、５ＴＥＰ　９に動作が移り、同定された単語の次の
文字へポインタが移動する。

しかし、今文章中の「初もうで」は「初」が漢字で「も
うで」がひらがなであるために、５ＴＥＰ　２において
、照合が一致しない。従って、５ＴＥＰ　３においては
、「無」の方向に移り、５ＴＥＰ４に行く。

５ＴＥＰ　４では、文章中の単語と辞書部の表記の一部
と読みの一部を組合わせたものを照合する。すなわち、
５ＴＥＰ４が表記読み組合わせ生成部６の機能である。

５ＴＥＰ　４では「初」という漢字でサーチし、各単語
の３文字目は読みを組合わせる。

第１図ｆａ）に示すように、読みの部分では、「はっ」
で始まる漢字の表記は３つあり、その読みの部分を見る
と「みみ」、「もうで」、「もの」となっている。従っ
て、いま文章中の「初もうで」は「初」が漢字で、「も
うで」がひらがなになっているため、表記の漢字だけで
は照合ができなかったが、「初」でサーチし、表記の部
分が「初」になっている単語の読みを照合する。即ち、
文章中の「初もうで」の後半の「もうで」というひらが
なは、辞書部の「みみ」、「もうで」、「もの」の３つ
と照合することになる。この場合、アドレスの順序に従
うと、「みみ」とは照合できず次の「もうで」で照合が
一致する。

このように、本発明では、辞書中においては表記が漢字
で登録されている単語あるいは文節あるいは句が文章中
では一部あるいは全部がカタカナ書きあるいはひらがな
書きで現れた場合でも、辞書中の表記と読みの情報を組
合わせて前記表記読み組合わせ生成部６で照合する。従
って照合の有無のほとんど全てが実行できる。

今の場合、「初」が漢字で「もうで」がひらがなとなっ
ている文章中の「初もうで」は辞書部の表記と読みの組
合わせとして存在するので、５ＴＥＰ５の判断において
は「有」の方向に移り、５ＴＥＰ　９に自動的に移る。

５ＴＥＰ　９では、全同定された単語即ち、「初もうで
」の次の文字へポインタを！＞　９）１する。

しかし、ここでもし、「初」という漢字で始まり、次に
「もうで」というひらがなの組合わせが辞書部の表記及
び読みにない場合は、５ＴＥＰ　６に移る。５ＴＥＰ　
６では、文章中の単語と辞書部の読みとを照合する。も
し、文章中の「ばつもうで」がすべてひらがなである場
合には、５ＴＥＰ　７の判断命令で「有」の方向へ行き
、同様に５ＴＥＰ　９に移動する。

しかし、５ＴＥＰ　６においても、照合する読みがひと
つもない場合には、５ＴＥＰ　７から５ＴＥＰ　８に移
り、ここで始めて未知語処理が行われる。未知語処理の
５ＴＥＰ　８では、例えば未知語の読みは表記から作成
され、−字づつ読み上げられる。

しかし、本発明では、未知語処理を行う確率は非常に低
く、単語等がすべてひらがなである場合や、あるいは単
語とひらがながまじりあっている場合であっても、５Ｔ
ＥＰ　４あるいは５ＴＥｐ　６で照合した場合に照合が
一敗する確率が高い。即ち、ＳＴＥＰ８の未知語処理が
実行されるケースは非常に小さい。

このように本発明では、いずれの場合でも、５ＴＥＰ　
９に制御が移ることが可能となり、文章の現在同定され
た単語の次の文字へポインタが移動する。そして、５Ｔ
ＥＰＩＯでは、文章の終わりを検出し、文章が終了して
いれば、終わりとなる。もし終わっていなければ、ふた
たび５ＴＥＰ　２に戻る。

本発明の、文章読み上げ装置において、読み上げる文章
の一部あるいは全部がカタカナあるいはひらがな書きの
単語等が現れた場合に、そのままの表記で辞書中に登録
されていなければ照合の際にその単語等が同定されてな
いという問題点を解決できる。即ち、本発明では、辞書
中の表記と読みの情報を組合わせて照合することにより
、漢字のみの単語等さえ辞書に登録されていれば、その
単語等が一部あるいは全部がカタカナあるいはひらがな
書きで文章中に現れても、正しく同定される。

〔発明の効果〕

本発明は、以上説明したように、辞書中において、表記
が漢字で登録されている単語あるいは文節あるいは句が
文章中では一部あるいは全部がカタカナ書きあるいはひ
らがな書きになっている場合でも、表記読み組合わせ生
成部を用いて、辞書中の表記と読みの情報を組合わせて
照合でき、すべての単語に対して同定することができる
。そのため、表記としては漢字だけで構成される単語等
を記憶するだけでよいので、読み上げ用辞書部の容量が
少なくてすむという効果がある。

【図面の簡単な説明】

第１図（ａ）は、本発明の辞書部の構成を示す実施例図
、第１図ｆｂｌは、本発明の文章読み上げ装置の構成図、第２図は、本発明の文章読み上げ装置の動作を示すフロ
ーチャート、第３図は、従来の文章読み上げ装置の辞書部の例を示す
説明図、第４図は、従来の文章読み上げ装置の構成図である。１・・・文章入出力端子、２・・・文章解析部、３・・・読み上げ用辞書部、４・・・規則合成部、５・・・スピーカ、６・・・表記読み組合わせ生成部。特許出願人　　　　富士通株式会社本ｉを日月の８！！−書音さの構へ？′プヘ１フ（万ヒ
イ列図（ａ）４−綺賞月の文章読みｈ１↑装實Ｊ木号ベス（ｂ）第　１　図

Claims

【特許請求の範囲】

（１）単語あるいは文節あるいは句の単語等の表記およ
び読みを少なくとも格納する読み上げ用辞書部と、入力された文章を各単語等ごとに前記読み上げ辞書部の
内容と照合しながら文章中の単語等を同定し文章に読み
を与える文章解析部と、前記読み上げ用辞書部と前記文章解析部とに接続され、
前記読み上げ辞書部の中に、表記が漢字で登録されてい
る単語等が文章中では、単語等の一部あるいは全部がカ
タカナ書きあるいはひらがな書きで現れている場合に、
前記読み上げ用辞書部内の各単語等の表記と読みの情報
の両方を組合わせて照合するための情報を生成する表記
読み組合わせ生成部と、前記文章解析部の出力である読みを音声に変換する音声
合成部を有し、単語等の一部あるいは全部がカタカナあるいはひらがな
書きで文章中に現れても正しく同定することを特徴とす
る文章読み上げ装置。
（２）前記読み上げ用辞書部内の単語等は漢字１文字づ
つに対応する読みが区切られて、前記読み上げ用辞書中
の読みの欄に登録されることを特徴とする特許請求の範
囲第１項記載の文章読み上げ装置。