JPS6326723A - 文章読み上げ装置 - Google Patents

文章読み上げ装置

Info

Publication number
JPS6326723A
JPS6326723A JP61169044A JP16904486A JPS6326723A JP S6326723 A JPS6326723 A JP S6326723A JP 61169044 A JP61169044 A JP 61169044A JP 16904486 A JP16904486 A JP 16904486A JP S6326723 A JPS6326723 A JP S6326723A
Authority
JP
Japan
Prior art keywords
reading
words
sentence
kanji
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61169044A
Other languages
English (en)
Other versions
JPS6326409B2 (ja
Inventor
Toshiro Shibanuma
敏郎 柴沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61169044A priority Critical patent/JPS6326723A/ja
Publication of JPS6326723A publication Critical patent/JPS6326723A/ja
Publication of JPS6326409B2 publication Critical patent/JPS6326409B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概  要〕 本発明は、表記された文章を辞書部の単語等とマツチン
グを取りながら単語等を同定し、読みに変換し、音声合
成部において文章を読み上げる文章読み上げ装置に関す
る。
本発明は、読み上げる文章に一部、あるいは全部がカタ
カナあるいはひらがな書きの単語等が現れた場合に、そ
のままの表記で辞書中に登録されていなければ、照合の
際にその単語等が同定されないという問題を解決するた
め、辞書中の表記と読みの両方を共に組合わせて、照合
することにより、単語等が必ず同定できるようにしてい
る。
このように、表記と読みを組合わせる方法を用いれば、
漢字のみの単語等さえ辞書に登録していれば、その単語
等の一部あるいは全部がカタカナあるいはひらがな書き
で文章中に現れても、正しく同定でき、辞書部の容量も
少なくて済むという効果がある。
〔産業上の利用分野〕
本発明は、日本語処理装置の構成に関し、特に単語、文
節、句等の単語等から構成される文章の各単語等を辞書
部の単語等とマツチングをとりながら、単語等を同定し
、音声合成部で文章を読み上げる文章読み上げ装置の構
成に関する。
特に、漢字で表記すべき単語でも、一部あるいは前部が
カタカナ書きされている場合でも、辞書中の表記と読み
を組合わせて照合することを可能とする文章読み上げ装
置の文章解析方式および辞書形式に関する。
〔従 来 技 術〕
集積化技術の発展に伴い、プロセッサ、メモリ素子ある
いは入出力装置等が高性能化され、低価格になるととも
に、計算機システムの性能が向上してきた。
そして、利用形態も個別使用のみでなく、ネットワーク
を介してシステムの多様化が進んできた。
さらに、入出力装置の面では、パターン認識や、音声認
識の技術の進歩に伴い、漢字の入出力、あるいは音声入
出力等、人間とのインターフェースの改善がなされ、日
本語処理を行う専用の処理装置もOA機器として重用視
されてきた。
特に、ワードプロセッサは文章の構成を行う処理機能を
備え、文章の編集や保管、あるいは文章作成を自動的に
行う装置として普及され、日本語の文章が簡単に計算機
システムの外部入力装置に記憶されるようになった。
また、人間の音声を音節や単語等の単位で区切って発生
させ、個々の音節や単語を認識し、処理するいわゆる離
散型単語装置が実用化されている。
また、音声で日本語文章をシステムに入力することもで
きるようになってきた。このようなワードプロセッサや
音声入力装置を用いて、入力された日本語文章を正しく
入力されたかどうかを検査したり、あるいは既にシステ
ムに格納された新聞記事等を単に耳で聴く場合、機械に
格納された文章等を読み上げる文章読み上げ装置の重要
性も高まってきた。
この文章読み上げ装置は、文章の単語あるいは文節や句
等の単語等を辞書部の単語等とマツチングを取りながら
、同定し、各文章を音声合成部を介して読み上げる機能
を必要とする。
ところが、日本語の文章は新開記事等に見られるように
、カタカナ文字列の固有名詞や新語、強調のためのカタ
カナ書き、あるいは漢字の代わりに、ひらがな書きにし
ている文章が非常に多く存在している。
このような文章を読み上げ装置で解析する場合、文字列
(即ち、基本的には単語であるが、文節や句でもよくこ
れらを総称して単語等と呼ぶことにする)としての単語
等の同定が辞書部にその単語等が存在しないために失敗
することがある。
第4図は従来の文章読み上げ装置の構成を示す構成図で
ある。1は、文章を格納する文章ファイル部から文章を
入力または出力する文章入出力端子であり、2は、前記
文章ファイル部から前記入出力端子を介して読みだされ
た文章を小さな文字列の単位に分割し、各単位ごとに読
み上げ用辞書部3からの内容とマツチングし、同定する
文章解析部である。前記文章解析部2の出力である読み
を音声に変換するのが規則合成部4である。規則合成部
4の出力はスピーカ5に与えられ、音声となる。
読み上げ用辞書部3には、例えば第3図に示すように、
表記、読み、文法、アクセント等がひとつのまとまりと
して格納されている。例えば、表記の「初耳」という漢
字の読みはひらがなで「はつみみ」となっており、この
単語は名詞であってアクセントとしては読みの各文字の
どこにもアクセントがないことを示す「0」が示されて
いる。
次の「初詣」に関しては、アクセントは「3」となって
いるが、これは「も」という文字のところで、アクセン
トがあることを示している。
従来の文章読み上げ装置の文章解析部2においては、前
記読み上げ用辞書部3の表記の部分のみを比較の対象と
していたため、例えば文章中に「初もうで」となってい
た場合、即ち「初」が漢字で「もうで」がひらがなにな
っていた場合には、辞書中に同じ表記の単語がないため
に、正しく同定されないという問題があった。
〔発明が解決しようとする問題点〕
このように、従来の文章読み上げ装置の文章解析部では
、表記の一部がカタカナ書きになっていたり、ひらがな
書きになっている場合、辞書部に登録されていないので
、正しく同定されないという問題点がある。本発明は、
この問題点を解決するための文章解析方式および辞書形
式を提供することにある。
〔問題点を解決するための手段〕
本発明は、上記目的を達成するために、第4図に示す従
来の文章読み上げ装置の構成に第1図(ト))図に示す
ように、表記読み組合わせ生成部6を追加してできる文
章読み上げ装置を提供する。
即ち、文章ファイル部から文章を入力または出力する文
章入出力端子1に接続され、前記文章ファイル部から続
出された文章を小さな文字列の単位に分割し各単位ごと
に読み上げ用辞書部3の内容とマツチングし同定する文
章解析部2と、前記文章解析部2の出力である読みを音
声に変換する規則合成部4と、音声を発生するスピーカ
5に加えて、前記文章解析部2と前記読み上げ用辞書部
3との間に表記読み組合わせ生成部6を付加し、読み上
げ用辞書部3の中の表記と読みの情報の両方を組合わせ
て文章の照合を行う手段を有することを特徴とする文章
読み上げ装置を提供する。
〔作   用〕
本発明は、文章読み上げ装置において、読み上げる文章
に一部あるいは全部がカタカナあるいはひらがな書きの
単語等が現れた場合に、そのままの表記で辞書中に登録
されていなければ照合の際に、その単語等が同定されな
いという問題点を解決する。そのため、辞書中の表記と
読みの情報を組合わせて照合することにより、漢字のみ
の単語等さえ、辞書に登録されていれば、その単語等が
一部あるいは全部がカタカナあるいはひらがな書きで文
章中に現れても、正しく同定されるようにしたものであ
る。
〔実  施  例〕
次に、本発明の文章読み上げ装置を図面を参照して、説
明する。
本発明の文章読み上げ装置は、第1図(b)に示すよう
に、単語あるいは文節あるいは句の読み方を格納した読
み上げ用辞書部3と、その辞書部の内容と照合しながら
文章の単語あるいは文節あるいは句を同定し文章に読み
を与える文章解析部2と、その読みから文章を合成する
規則合成部4を用いて、文章を音声に換える。
以下単語あるいは文節あるいは句を単語等と呼ぶことに
する。
文章ファイルから読出された各文章は文章解析部2にお
いて、読み上げ用辞書部3に格納された単語等とのマツ
チングによって、単語等の同定が実行され、単語等の単
位に区切られる。読み上げ用辞書部3は例えば漢字を入
力し、これをカナに変換する漢字カナ変換辞書である。
文章解析部2は各文章中の単語等のうち漢字等の単語が
読み上げ用辞書部3に格納されたものである場合には、
即座に読みに変換することができる。規則合成部4は前
記読みに対応する情報を音声信号の形でスピーカ5に与
え、スピーカ5から音声が発生される。規則合成部4で
合成される音声合成は音声出力の為のデータを予め分析
し記憶しておいて、読みに対応して、単語等の文字列を
音声で読み上げる部分である。
音声合成のためのデータ分析は、波形符号化や線形予測
分析等段に、種々の分析技術が用いられている。
1つの方法では、単語や文節等の自然音声に含まれる音
素間の調音結合の特徴や、アクセントあるいは抑揚等の
特徴がそのまま保持されるので、音質がよいが予め分析
しである単語や文節の組合わせ以外の音声出力は出力で
きないという欠点を有している。それに反し、他の方法
によれば、出力したい単語や文章を音素や音節記号の形
で入力することになるので、任意の文章に対して合成で
きることになる。しかし、音声の色々な特徴は人工的に
付加してやらなければならないという問題がある。
規則合成部4は特に音素あるいは音節による生成源処理
方法であり、音素や音節等の音声分析データを音声生成
モデルの制御信号に用いる形式に従っている。従って、
規則合成部4は合成音の倍電数には制限がなく、自然音
声に見られる調音結合や、韻律特性によって、音響的な
性質には、変形の仕方を規則化しているこの音C的性質
の変形を規則化し、これに基づいて制御信号を変形する
ことにより、合成音の性質が自然音声に非常に似たもの
となる。従って、この規則合成部4において、音素や音
節記号あるいは文字の系列だけを文章解析部2から読み
として入力すれば、それに対応する任意の合成音を出力
することができる。
この規則合成部4は、一般に波形処理系よりも、記憶容
量が減らせるが、回路構成が複雑になるので、ワンチッ
プのLSIでディジタル演算的に実行することによって
、回路構成の複雑性を減じることが必要である。更に、
音声合成器の動作に必要な制御信号を前もって記憶され
た音声データと決められた規則によって生成する必要が
ある。そのため、LSIとしては、ホルマント型やPA
IICOR型の2種類がある。
例えば、PARCOR型LSIはそれぞれ2個ずつの除
算器と加算器とで構成された格子型ディジタルフィルタ
を10段程度カスケードに接続して、音声を合成してい
るものである。また、韻律的特徴に関しては、前もって
記憶された音響の格納データを使って合成音声に対して
基本周波数、振幅あるいは音素の!!続待時間が決めら
れる。
文章ファイルから入力された各文章が読み上げ用辞書部
3の単語等とマツチングされ、単語単位、あるいは文節
単位等に分割され、同定される場合に、読み上げ用辞書
部3において、存在しないひらがなあるいはカタカナ等
の未知語が文章中に存在する場合がある。また、新聞記
事等においては、カタカナ文字の固有名詞や新語あるい
は強調の為のカタカナ書きや漢字の代わりに、ひらがな
にしである文章が多く存在し、このような文章を解析す
ると、単語の同定にかなりの高い確率で同定が失敗する
ことがある。特に、漢字で表記すべき単語でも、一部あ
るいは全部がカナ書きにされる場合があり、文章読み上
げ装置においては、これらについても、正しく読み上げ
ることが要求される。
しかし、これらの一部カナ書き等の単語を全て読み上げ
用辞書部3に登録することは記憶容量が膨大となり、実
用的でない。そこで、本発明は読み上げ用辞書部3に登
録されていなくても、一部カナ書きされた単語が、正し
く読み上げられるように、辞書中の表記と読みの情報の
両方を組合わせて照合する表記読み組合わせ生成部6を
追加している。即ち、本発明では、文章解析部2で読み
上げ用辞書部3の中にある単語等と文章中の単語等がマ
ツチングがとれなかった場合には、前記表記読み組合わ
せ生成部6を動作させ、第2図に示すようなフローチャ
ートに従って、照合を実行する。
第2図のフローチャートを説明するために、読み上げ用
辞書部3の内容は第1図(alに示すような内容である
と、仮定する。即ち、読み上げ用辞書部3は表記、読み
、文法、アクセント等がひとつの単位として各表記ごと
に記憶されている。例えば、第1図(alでは、表記と
して「初耳」、「初詣」、「初物」の3つの表記があり
、「初耳」に対しては読みは「はつ/みみ」となってい
る。「初詣」に関しては、その読みは「はつ/もうで」
となっている。「初物」に対しては読みは「はつ/もの
」となっている。即ち、本発明の読みの欄は辞書中の単
語あるいは文節あるいは句の漢字1文字づつに「/」で
区切られている。
文法の欄に関しては、従来と同じように「初耳」、「初
詣」、「初物」の各表記に対して、「名詞」となってい
る。
アクセントに関しても、従来と同じで、「初耳」に関し
ては、読みのアクセントはないため、「0」が格納され
ている。「初物」に関しても、読みのアクセントがない
からrOJであるが、「初詣」に関しては、「も」にア
クセントがあるため、読みの欄のひらがなの第三番目を
強調する3が格納されている。
第2図のフローチャートにおいて、本発明の文章読み上
げ装置では文章解析の制御が始まると、5TEP 1で
文章の先頭へポインタを移動する。次に、5TEP 2
で文章中の単語と読み上げ用辞書部3の表記とを照合す
る。ここで、第1図(a)に示す表記と例えば文章中の
「初もうで」との照合を行う場合を想定する。このとき
、文章中の「初もうで」の「初」が漢字で「もうで」が
ひらがなである。
5TEP 2においては、まず「初」という漢字で表記
との照合を行うと、辞書部には「初耳」、「初詣」、「
初物」と3つの表記で照合される。もし、文章中で「初
」という漢字の次が「詣」という漢字である場合には、
5TEP 3の判断命令において、照合が 「有」とな
り、5TEP 9に動作が移り、同定された単語の次の
文字へポインタが移動する。
しかし、今文章中の「初もうで」は「初」が漢字で「も
うで」がひらがなであるために、5TEP 2において
、照合が一致しない。従って、5TEP 3においては
、「無」の方向に移り、5TEP4に行く。
5TEP 4では、文章中の単語と辞書部の表記の一部
と読みの一部を組合わせたものを照合する。すなわち、
5TEP4が表記読み組合わせ生成部6の機能である。
5TEP 4では「初」という漢字でサーチし、各単語
の3文字目は読みを組合わせる。
第1図fa)に示すように、読みの部分では、「はっ」
で始まる漢字の表記は3つあり、その読みの部分を見る
と「みみ」、「もうで」、「もの」となっている。従っ
て、いま文章中の「初もうで」は「初」が漢字で、「も
うで」がひらがなになっているため、表記の漢字だけで
は照合ができなかったが、「初」でサーチし、表記の部
分が「初」になっている単語の読みを照合する。即ち、
文章中の「初もうで」の後半の「もうで」というひらが
なは、辞書部の「みみ」、「もうで」、「もの」の3つ
と照合することになる。この場合、アドレスの順序に従
うと、「みみ」とは照合できず次の「もうで」で照合が
一致する。
このように、本発明では、辞書中においては表記が漢字
で登録されている単語あるいは文節あるいは句が文章中
では一部あるいは全部がカタカナ書きあるいはひらがな
書きで現れた場合でも、辞書中の表記と読みの情報を組
合わせて前記表記読み組合わせ生成部6で照合する。従
って照合の有無のほとんど全てが実行できる。
今の場合、「初」が漢字で「もうで」がひらがなとなっ
ている文章中の「初もうで」は辞書部の表記と読みの組
合わせとして存在するので、5TEP5の判断において
は「有」の方向に移り、5TEP 9に自動的に移る。
5TEP 9では、全同定された単語即ち、「初もうで
」の次の文字へポインタを!> 9)1する。
しかし、ここでもし、「初」という漢字で始まり、次に
「もうで」というひらがなの組合わせが辞書部の表記及
び読みにない場合は、5TEP 6に移る。5TEP 
6では、文章中の単語と辞書部の読みとを照合する。も
し、文章中の「ばつもうで」がすべてひらがなである場
合には、5TEP 7の判断命令で「有」の方向へ行き
、同様に5TEP 9に移動する。
しかし、5TEP 6においても、照合する読みがひと
つもない場合には、5TEP 7から5TEP 8に移
り、ここで始めて未知語処理が行われる。未知語処理の
5TEP 8では、例えば未知語の読みは表記から作成
され、−字づつ読み上げられる。
しかし、本発明では、未知語処理を行う確率は非常に低
く、単語等がすべてひらがなである場合や、あるいは単
語とひらがながまじりあっている場合であっても、5T
EP 4あるいは5TEp 6で照合した場合に照合が
一敗する確率が高い。即ち、STEP8の未知語処理が
実行されるケースは非常に小さい。
このように本発明では、いずれの場合でも、5TEP 
9に制御が移ることが可能となり、文章の現在同定され
た単語の次の文字へポインタが移動する。そして、5T
EPIOでは、文章の終わりを検出し、文章が終了して
いれば、終わりとなる。もし終わっていなければ、ふた
たび5TEP 2に戻る。
本発明の、文章読み上げ装置において、読み上げる文章
の一部あるいは全部がカタカナあるいはひらがな書きの
単語等が現れた場合に、そのままの表記で辞書中に登録
されていなければ照合の際にその単語等が同定されてな
いという問題点を解決できる。即ち、本発明では、辞書
中の表記と読みの情報を組合わせて照合することにより
、漢字のみの単語等さえ辞書に登録されていれば、その
単語等が一部あるいは全部がカタカナあるいはひらがな
書きで文章中に現れても、正しく同定される。
〔発明の効果〕
本発明は、以上説明したように、辞書中において、表記
が漢字で登録されている単語あるいは文節あるいは句が
文章中では一部あるいは全部がカタカナ書きあるいはひ
らがな書きになっている場合でも、表記読み組合わせ生
成部を用いて、辞書中の表記と読みの情報を組合わせて
照合でき、すべての単語に対して同定することができる
。そのため、表記としては漢字だけで構成される単語等
を記憶するだけでよいので、読み上げ用辞書部の容量が
少なくてすむという効果がある。
【図面の簡単な説明】
第1図(a)は、本発明の辞書部の構成を示す実施例図
、 第1図fblは、本発明の文章読み上げ装置の構成図、 第2図は、本発明の文章読み上げ装置の動作を示すフロ
ーチャート、 第3図は、従来の文章読み上げ装置の辞書部の例を示す
説明図、 第4図は、従来の文章読み上げ装置の構成図である。 1・・・文章入出力端子、 2・・・文章解析部、 3・・・読み上げ用辞書部、 4・・・規則合成部、 5・・・スピーカ、 6・・・表記読み組合わせ生成部。 特許出願人    富士通株式会社 本iを日月の8!!−書音さの構へ?′プヘ1フ(万ヒ
イ列図(a) 4−綺賞月の文章読みh1↑装實J木号ベス(b) 第 1 図

Claims (2)

    【特許請求の範囲】
  1. (1)単語あるいは文節あるいは句の単語等の表記およ
    び読みを少なくとも格納する読み上げ用辞書部と、 入力された文章を各単語等ごとに前記読み上げ辞書部の
    内容と照合しながら文章中の単語等を同定し文章に読み
    を与える文章解析部と、 前記読み上げ用辞書部と前記文章解析部とに接続され、
    前記読み上げ辞書部の中に、表記が漢字で登録されてい
    る単語等が文章中では、単語等の一部あるいは全部がカ
    タカナ書きあるいはひらがな書きで現れている場合に、
    前記読み上げ用辞書部内の各単語等の表記と読みの情報
    の両方を組合わせて照合するための情報を生成する表記
    読み組合わせ生成部と、 前記文章解析部の出力である読みを音声に変換する音声
    合成部を有し、 単語等の一部あるいは全部がカタカナあるいはひらがな
    書きで文章中に現れても正しく同定することを特徴とす
    る文章読み上げ装置。
  2. (2)前記読み上げ用辞書部内の単語等は漢字1文字づ
    つに対応する読みが区切られて、前記読み上げ用辞書中
    の読みの欄に登録されることを特徴とする特許請求の範
    囲第1項記載の文章読み上げ装置。
JP61169044A 1986-07-19 1986-07-19 文章読み上げ装置 Granted JPS6326723A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61169044A JPS6326723A (ja) 1986-07-19 1986-07-19 文章読み上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61169044A JPS6326723A (ja) 1986-07-19 1986-07-19 文章読み上げ装置

Publications (2)

Publication Number Publication Date
JPS6326723A true JPS6326723A (ja) 1988-02-04
JPS6326409B2 JPS6326409B2 (ja) 1988-05-30

Family

ID=15879278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61169044A Granted JPS6326723A (ja) 1986-07-19 1986-07-19 文章読み上げ装置

Country Status (1)

Country Link
JP (1) JPS6326723A (ja)

Also Published As

Publication number Publication date
JPS6326409B2 (ja) 1988-05-30

Similar Documents

Publication Publication Date Title
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
Klatt The Klattalk text-to-speech conversion system
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JP2009139677A (ja) 音声処理装置及びそのプログラム
KR100669241B1 (ko) 화행 정보를 이용한 대화체 음성합성 시스템 및 방법
JPH0887297A (ja) 音声合成システム
JP3576066B2 (ja) 音声合成システム、および音声合成方法
JPH08335096A (ja) テキスト音声合成装置
JPS62119591A (ja) 文章読上げ装置
JPS6326723A (ja) 文章読み上げ装置
JP2002123281A (ja) 音声合成装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP2003005776A (ja) 音声合成装置
Jasir et al. A detailed study on the linguistic peculiarities of Malayalam in the context of text to speech synthesis
JP2001350490A (ja) テキスト音声変換装置及び方法
JPH0229797A (ja) テキスト音声変換装置
JPH07160685A (ja) 文章読み上げ装置
JPH08160983A (ja) 音声合成装置
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法
JP3402480B2 (ja) 文書朗読装置
JP2009098292A (ja) 音声記号列生成方法、音声合成方法及び音声合成装置
JPH037994A (ja) 歌音声合成データの作成装置
JPS63153596A (ja) 音声文章入力装置
JPS6362032A (ja) 文章読み上げ装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees