JPH03204698A

JPH03204698A - テキスト音声合成装置

Info

Publication number: JPH03204698A
Application number: JP2000299A
Authority: JP
Inventors: Naoki Mizutani; 直樹水谷
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1990-01-05
Filing date: 1990-01-05
Publication date: 1991-09-06

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野コ本発明は、文字列の入力に基づいて音声を合成出力する
テキスト音声合成装置に関する。

［従来の技術］テキスト音声合成においては、入力された任意の文字記
号列に読み、アクセント、及びイントネーション等を付
加して音声パラメータが生成され、この生成された音声
パラメータに基づいて音声が合成される。

入力された文字記号列は、辞書を用いることにより形態
素解析されて各単語の同定が行われ、さらに同定した単
語の品詞等の文法情報やアクセントが求められる。

この辞書には、単語辞書、漢字辞書、記号辞書等があり
、第９図に示すように、標準的な漢字かな混じり表記に
よる見出しが登録されている単語辞書でまず入力文字記
号列の単語の検索が行われる。この検索に失敗した場合
は、漢字辞書等を用いることによって未知語として処理
される。

［発明が解決しようとする課題］漢字かな混じり文は、正書法が確立していないため、同
一の単語に対して異なる表記が用いられることがある。

従って、このような漢字かな混じり文が入力された場合
、上述の従来技術によると、単語の検索失敗がしばしば
生じる。即ち、単語辞書の見出しが従来技術では標準的
な表記であるため、入力した表記と辞書の見出しとが一
致せず、単語が検索できないことがあり、このような場
合、誤った読みやアクセントで音声が合成されてしまう
という不都合がある。例えば、第９図に示す如く、単語
辞書の見出しが「愛きょう」、「曖昧」等となっている
場合、入力文字列中の単語が「愛嬌」と表記されていた
り、「あいまい」と表記されていると、検索失敗が起こ
る。

上述の如き問題点を解消するため、辞書中に多数の表記
を見出しとして登録しておくことも考えられるが、辞書
の容量が大幅に増大してしまうため実現が難しい。

従って本発明の目的は、いかなる表記法による入力文字
記号列についても単語検索が可能であり、正しい読み及
び正しいアクセントで合成音声を生成でき、しかも大容
量の辞書を必要としないテキスト音声合成装置を提供す
ることにある。

［課題を解決するための手段］上述の目的を達成する本発明の特徴は、入力された文字
列を解析して音声パラメータを生成し、生成した音声パ
ラメータに基づいて音声を合成するテキスト音声合成装
置であって、漢字表記の検索見出し情報及びその漢字１
文字毎のかな表記の検索見出し情報を有する辞書と、こ
の辞書の上述の漢字表記及びかな表記の検索見出し情報
を用いて入力された文字列の各単語の同定を行う形態素
解析部とを備えたことにある。

［作用コ文章を構成する文字記号列が入力されると、形態素解析
部において、辞書中の漢字表記の検索見出し情報及びそ
の漢字１文字毎のかな表記の検索見出し情報を選択して
漢字かな混じり表記が生成される。そしてこの漢字かな
混じり表記に照合する単語が文章中の単語候補として抽
出される。抽出された単語候補から構成単語が決定され
て音声パラメータが生成される。生成された音声パラメ
ータに基づいて音声合成が行われる。

従って、入力された漢字かな混じり文字記号列中の単語
の使い方が一定しておらず、漢字表記、かな表記、又は
漢字かな混じり表記のいずれが用いられたとしても単語
の検索が可能となる。

［実施例］以下図面を用いて本発明の実施例を詳細に説明する。

第２図は本発明の第１の実施例の構成を概略的に示すブ
ロック図である。

同図において、１０は音声合成すべき文字記号列の入力
される入力部、１１は制御部、１２は音声パラメータに
従って音声の合成を行いこれを出力する音声合成部、１
３は音声合成部１２からの合成音声信号を出力する出力
部、１４は単語辞書、漢字辞書、記号辞書、意味辞書、
及び品詞接続辞書用メモリ、１５は音声データ等のメモ
リをそれぞれ示している。

これら入力部１０、制御部１１、音声合成部１２、及び
メモ１月４、工５は、バスＩ６を介して互いに接続され
ている。

制御部１１は、プログラムされたコンピュータで主とし
て構成されており、後述する如く、入力部１０から与え
られる入力データからメモ１月４．１５を用いて音声パ
ラメータを生成する。

第３図は、本実施例の機能的構成を表すブロック図であ
る。

同図に示すように、漢字かな混じり文等の文字記号列が
文字記号列入力部２０に入力されて、文字記号列解析部
２１へ印加される。この文字記号列解析部２１は、本実
施例では、入力文字記号列の単語解析を行う形態素解析
部２１ａと、構文解析部２１ｂと、意味解析部２１ｃと
から構成されている。辞書２２は、単語辞書、漢字辞書
、記号辞書、意味辞書、及び品詞接続辞書等を備えてい
る。

形態素解析部２１ａは、このうちの単語辞書、漢字辞書
、及び記号辞書を用いて入力された文字記号列の形態素
解析を行い、各単語の候補を同定すると共に同定した単
語候補の品詞等の文法情報やアクセントを求める。本実
施例における単語辞書の構成及び形態素解析部２１ａの
機能等については、後述する。

構文解析部２１ｂは、形態素解析部２１ａによって同定
された単語候補のうち構文上止しいものを品詞接続辞書
等を用いて判定し選択する。意味解析部２１ｃは、構文
解析部２１ｂによって構文上止しいと判断された単語候
補のうち意味が正しいものを意味辞書等を用いて判定し
選択する。

合成音声パラメータ生成部２３は、文字記号列解析部２
１で同定された各単語のアクセントや構文構造に応じて
単語が連鎖した際の文節、呼気段落のアクセント及びポ
ーズの設定を行う。これは韻律を制御するために行われ
る。次いでこの合成音声パラメータ生成部２３では、発
生音声に対応した合成単位に対する継続時間、ピッチパ
ターン、パワーパターン、及び音韻特徴パラメータ（偏
自己相関関数、線スペクトル対、ホルマント等）のパラ
メータ時系列が生成される。

音声合成部２４は、合成音声パラメータ生成部２３で生
成されたパラメータ時系列に基づいて実際の合成音声波
形を生成し、合成音声出力部２５を介してこれを出力す
る。

本実施例において、単語辞書２２ａは第１図に示す如く
構成されている。即ち、この単語辞書２２ａは、表記見
出し部と辞書内容部とに大きく分けられ、表記見出し部
には漢字による表記と共にその漢字１字毎に対応するか
な表記が記されている。

例えば、漢字見出し「情報」の「情」に対応してかな見
出し「じょう」が記されており、「報」に対応してかな
見出し「はう」が記されている。

この単語辞書２２ａを用いて行われる入力文字記号列に
対する形態素解析処理は、第４図に示すプログラムに従
って実行される。ただしこの例は、２文字の漢字で表さ
れる単語の形態素解析処理を行うものである。

まずステップＳ１において、入力文字列の最初の文字が
漢字表記であるか否かを判別する。漢字表記である場合
はステップＳ２へ進み、単語辞書２２ｇの見出しを用い
てその漢字で始まる単語を単語辞書２２ａから検索する
。この場合、単語辞書２２ａの漢字表記の検索見出し情
報が参照される。次いで、ステップＳ３において、入力
文字列の次の文字が漢字であるか否かを判別する。

次の文字も漢字表記である場合はステップＳ４へ進み、
ステップＳ２で検索した漢字の次にその漢字がくる単語
の検索を、単語辞書２２ａの見出しを用いて行う。この
場合も、単語辞書２２ａの漢字表記の検索見出し情報が
参照される。次いで、ステップＳ５において、ステップ
Ｓ４の検索によってマツチングする単語が得られたかど
うか判別し、得られた場合はステップＳ１４に進み、そ
の単語を単語候補として記憶させる。

マツチングする単語候補が得られなかった場合は、ステ
ップＳ２へ戻り、最初の文字として当該漢字を有する単
語の検索を行う。

ステップＳ３において、入力文字列の次の文字が漢字表
記でないと判別された場合、即ちかな表記であると判別
された場合は、ステップＳ６へ進む。

ステップＳ６では、ステップＳ２で検索した漢字の次に
そのかな表記の文字がくる単語の検索を、単語辞書２２
ａのかな表記の見出しを用いて行う。この場合は、単語
辞書２２ａの１文字の漢字に対応するかな表記の検索見
出し情報が参照される。次いで、ステップＳ７において
、ステップＳ６の検索によってマツチングする単語が得
られたかどうか判別し、得られた場合はステップ３１４
に進み、その単語を単語候補として記憶させる。マツチ
ングする単語候補が得られなかった場合は、ステップＳ
２へ戻り、最初の文字として当該漢字を有する単語の検
索を行う。

ステップＳ１において、入力文字列の最初の文字が漢字
表記でないと判別された場合、即ちかな表記であると判
別された場合は、ステップＳ８へ進み、単語辞書２２ａ
のかな表記の見出しを用いて対応するかな表記で始まる
単語を検索する。このステップＳ８の処理内容は、ステ
ップＳ６の処理内容と同じである。

ステップＳ８の処理が終わると、ステップＳ９．５１０
１Ｓ１１、Ｓ１２、及びＳ１３の処理が行われる。これ
らステップ３９〜Ｓ１３の処理内容は、ステップ３３〜
Ｓ７の処理内容と同じである。

ステップ３１４において単語候補が記憶されると、ステ
ップＳ＋５へ進み、単語辞書２ｈの全ての見出しがチエ
ツクされたかどうか判別し、否の場合はステップＳ１へ
戻り以上の処理が繰り返される。このようにして形態素
解析処理では、単語辞書２２ａ中の全ての単語候補が抽
出される。

なお、第４図のプログラムは、２文字の漢字で表される
文字列の単語候補を形態素解析処理を行うものであるが
、３文字以上の文字列についても同様のステップを繰り
返すのみで容易に実現できることは明らかである。

漢字かな混じり文字列として「情はう」が入力された場
合について、第４図のプログラムの動作を説明する。

ステップＳｌにおいて、最初の文字「情」が漢字表記で
あると判別されるため、ステップＳ２へ進む。

ステップＳ２では、単語辞書２２ａの漢字表記の検索見
出し情報が参照されて「情」を最初の文字として有する
単語が検索される。次のステップＳ３では、次の文字「
は」がかな表記であると判別されるため、ステップＳ６
へ進む。ステップＳ６では、「情」の次に「はう」がく
る単語の検索を、単語辞書２２ａのかな表記の検索見出
し情報を参照して行われる。このように、漢字表記「情
」とかな表記「はう」を選択することにより、表記が「
情はう」である単語候補「情報」を検索することができ
る。

なお、「情」を最初の文字に有する単語であっても、「
情け」のような単語も存在している。このような場合は
、ステップＳ７において、マツチングする単語候補が得
られなかったと判別されてステップＳ２へ戻り、最初の
文字として当該漢字を有する単語の検索が行われる。

このように本実施例によれば、単語辞書２ｈ中の漢字表
記の検索見出し情報とかな表記の検索見出し情報とを取
捨選択して生成される文字列が、入力文字列の部分文字
列に一致するものを探し、単語候補として選択する。

このようにして同定された単語候補の中から、構文的及
び意味的に正しい単語が構文解析部２１ｂ及び意味解析
部２１ｃで選択されることは、前述した通りである。

なお、文字記号列解析部２１は、必ずしも形態素解析部
２１ａと、構文解析部２１ｂと、意味解析部２１Ｃとか
ら構成される必要はなく、少なくとも形態素解析部２１
ａが含まれていればよい。

第５図は、本発明の第２の実施例における辞書の単語辞
書１２２ａ及び漢字辞書１２２ｂの構成を示している。

同図に示すように、単語辞書１２２ａは、表記見出し部
と辞書内容部とに大きく分けられ、表記見出し部には漢
字による表記と共にその漢字１字毎に対応する漢字辞書
１２２ｂ内のかな表記のポインタが記されている。漢字
辞書１２２ｂ内には、各漢字のかな表記が記されており
、上述のポインタは対応するかな表記のアドレスを表し
ている。

例えば、単語辞書１２２ａには、漢字見出し「情報」の
「情」に対応するかな表記「じょう」の漢字辞書１２ハ
内のアドレスが記されており、「報」に対応するかな表
記「はう」の漢字辞書１２２ｂ内のアドレスが記されて
いる。漢字辞書１２２ｂ内には、「情」に対応するかな
表記として、「なさ」、「なさけ」「じよう」、「せい
」等が記されており、その「じよう」の部分のアドレス
がポインタとして単語辞書１２２ａの表記見出し部に記
されている。

単語辞書１２２ａの表記見出し部にかな表記を行わず、
漢字辞書１２２ｂ内の対応するかな表記のアドレスのみ
を記すことにより、単語辞書１２２ａの容量を大幅に減
らすことができる。

本実施例のその他の構成及び動作は、前述の第１の実施
例の場合と同じである。

第６図は、本発明の第３の実施例の機能的構成を表すブ
ロック図である。

同図に示すように、漢字かな混じり文等の文字記号列が
文字記号列入力部２２０に入力されて、文字記号列解析
部２２１へ印加される。この文字記号列解析部２２１は
、本実施例では、入力文字記号列の単語解析を行う形態
素解析部２２１ａと、構文解析部２２１ｂと、意味解析
部２２１ｃとから構成されている。

辞書２２２には、単語辞書、漢字辞書、記号辞書、意味
辞書、及び品詞接続辞書等を備えている。

形態素解析部２２１ａは、このうちの単語辞書、漢字辞
書、及び記号辞書を用いて、入力された文字記号列の形
態素解析を行い、各単語の候補を同定すると共に同定し
た単語候補の品詞等の文法情報やアクセントを求める。

漢字字種表部２２６は、字種制御を行うために難読漢字
を指定するものであり、本実施例では、ＪＩｓ第２水準
漢字を難読漢字に設定している。

構文解析部２２１ｂは、形態素解析部２２１ａによって
同定された単語候補のうち構文上正しいものを品詞接続
辞書等を用いて判定し選択する。意味解析部２２１Ｃは
、構文解析部２２１ｂによって構文上正しいと判断され
た単語候補のうち意味が正しいものを意味辞書等を用い
て判定し選択する。

合成音声パラメータ生成部２２３は、文字記号列解析部
２２１で同定された各単語のアクセントや構文構造に応
じて単語が連鎖した際の文節、呼気段落のアクセント及
びポーズの設定を行う。これは韻律を制御するために行
われる。次いでこの合成音声パラメータ生成部２２３で
は、発生音声に対応した合成単位に対する継続時間、ピ
ッチパターン、パワーパターン、及び音韻特徴パラメー
タ（偏自己相関関数、線スペクトル対、ホルマント等）
のパラメータ時系列が生成される。

音声合成部２２４は、合成音声パラメータ生成部２２３
で生成されたパラメータ時系列に基づいて実際の合成音
声波形を生成し、合成音声出力部２２５を介してこれを
出力する。

本実施例において、単語辞書２２２ａは第７図に示す如
く構成されている。即ち、第１図の場合と同様に単語辞
書２２２ａは、表記見出し部と辞書内容部とに大きく分
けられ、表記見出し部には漢字による表記と共にその漢
字１字毎に対応するかな表記が記されている。例えば、
漢字見出し「葡萄」の「葡」に対応してかな見出し「ぶ
」が記されており、「萄」に対応してかな見出し「どう
」が記されている。また、漢字見出し「武道」の「武」
に対応してかな見出し「ぶ」が記されており、「道」に
対応してかな見出し「どう」が記されている。

本実施例における単語辞書の構成及び形態素解析部２２
１ａの機能等については、基本的に前述した第１の実施
例の場合と同じである。しかしながら、本実施例におい
ては、検索された単語の中に、漢字かな混じり表記又は
かな表記でありかつそのかな表記に対応する漢字表記が
存在する場合、次の如く動作する。即ち、かな表記に対
応する漢字が漢字字種表部２２６で難読漢字に指定され
ている場合は、その検索された単語を単語候補として選
択する。逆に、かな表記に対応する漢字が漢字字種表部
２２６で難読漢字に指定されていない場合は、その検索
された単語を単語候補から取り除く。即ち、漢字で表記
するかかなで表記するか一定してない漢字は、特定の難
読漢字や当て字に多いため、人力されたかな表記が難読
漢字に指定されている場合にこれを単語候補として選ぶ
ようにしているのである。これによって、検索時間の短
縮化を図ることができる。

例えば、「ぶどう」なる文字列が入力された場合に、単
語「葡萄」及び「武道」が検索されたとする。ここで、
漢字「葡」及び「萄」は共にＪＩＳ第２水準漢字であっ
て難読漢字に設定されており、漢字「武」及び「道」は
共にＪＩＳ第２水準漢字ではな（難読漢字に設定されて
ない。従って、この場合、「武道」は単語候補から取り
除かれ、「葡萄」が単語候補として選択される。即ち、
単語「武道」については、難読漢字ではないため漢字表
記で入力されることが比較的多く、一方、単語「葡萄」
については、難読漢字であるためかな表記で入力される
ことが比較的多いから、この点を検索制御に利用してい
るのである。

なお、難読漢字としてＪＩＳ第２水準漢字の他に、例え
ば教育漢字の学年コード等の如き難易コードを設定する
と共にしきい値を設け、このしきい値以上の難易コード
の漢字を難読漢字としてもよい。この場合、教科書の読
み上げに用いて有効である。また、漢字字種表を用いて
、多くの単語候補から単語を決定する際に、かな表記に
対応する漢字の難易度が最も高い単語を選ぶように構成
することによって、かな表記の単語候補の絞り込みをよ
り一層効果的に行うことができる。

第８図は、本発明の第４の実施例における辞書の単語辞
書３２２ａの構成を示している。

同図に示すように、単語辞書３２２ａは、表記見出し部
と辞書内容部とに大きく分けられ、表記見出し部には漢
字による表記と共にその漢字１字毎に対応するかな表記
が記されている。さらにこの表記見出し部には、漢字見
出しの各漢字のうちかな表記することが多いものに対し
ては、かな表記検索指令情報が付加されている。

例えば、単語辞書３２２ａには、漢字見出し「箸」に対
応するかな表記が「はし」であることを示しており、こ
の単語「箸」にはかな表記検索指令情報３００が付加さ
れている。一方、漢字見出し「橋」に対応するかな表記
も「はし」であるが、この単語「橋」にはかな表記検索
指令情報３００が付加されていない。これは、単語「橋
」については、漢字表記で入力されることが比較的多く
、「箸」はかな表記で入力されることが比較的多いこと
を示している。

本実施例の基本的な構成及び動作は、前述の第１の実施
例の場合と同じである。しかしながら、本実施例におい
ては、検索された単語の中に、漢字かな混じり表記又は
かな表記でありかつそのかな表記に対応する漢字表記が
存在する場合、次の如く動作する。即ち、検索された単
語にかな表記検索指令情報が付加されている場合は、そ
の検索された単語を単語候補として選択する。逆に、か
な表記検索指令情報が付加されていない場合は、その検
索された単語を単語候補から取り除く。即ち、かな表記
で入力されることが比較的多い単語にかな表記検索指令
情報をあらかじめ付加しておき、このかな表記検索指令
情報がある場合は単語候補として選ぶようにしているの
である。これによって、検索時間の短縮化を図ることが
できる。

例えば、「はし」なる文字列が入力された場合に、単語
「箸」及び「橋」が検索されたとする。

単語「箸」にはかな表記検索指令情報３００が付加され
ているので単語候補として選択され、単語「橋」にはか
な表記検索指令情報３００が付加されていないので単語
候補から取り除かれる。

なお、かな表記検索指令情報の他に、例えば教育漢字の
学年コード等の如き難易コードを設定すると共にしきい
値を設け、しきい値以上の難易コードのもののみ選択す
るようにしてもよい。このしきい値を入力文字列の難易
度に合わせることにより、より効率のよい検索を行うこ
とができる。

以上述べた実施例において、漢字による表記と共にその
漢字１字毎に対応するかな表記が記されている単語辞書
、又は漢字による表記と共にその漢字１字毎に対応する
かな表記のポインタが記されている単語辞書が、漢字表
記とかな表記との組み合わせで表記見出しを自ら生成す
るように構成してもよい。さらにこの場合、上述の第３
又は第４の実施例において、漢字表記の単語が漢字字種
表での難易度の高い漢字であるとき又はかな表記検索指
令情報により難易度の高い漢字であるときは対応するか
な表記を選択して表記見出しを生成できるように構成し
てもよい。

［発明の効果］以上詳細に説明したように本発明によれば、漢字表記の
検索見出し情報及びその漢字１文字毎のかな表記の検索
見出し情報を有する辞書と、この辞書の上述の漢字表記
及びかな表記の検索見出し情報を用いて入力された文字
列の各単語の同定を行う形態素解析部とを備えているた
め、入力された漢字かな混じり文字記号列中の単語の使
い方が一定しておらず、漢字表記、かな表記、又は漢字
かな混じり表記のいずれが用いられたとしても単語の検
索が可能となる。即ち、いかなる表記法による入力文字
記号列についても単語検索が可能であり、正しい読み及
び正しいアクセントで合成音声を生成することができる
。しかもその場合に大容量の辞書を必要としない。

【図面の簡単な説明】

第１図は本発明の第１の実施例の単語辞書の構成を示す
図、第２図は第１の実施例の全体の構成を概略的に示す
ブロック図、第３図は第１の実施例の機能的構成を表す
ブロック図、第４図は第１の実施例の形態素解析処理プ
ログラムのフローチャート、第５図は本発明の第２の実
施例における単語辞書及び漢字辞書の構成を示す図、第
６図は本発明の第３の実施例の機能的構成を表すブロッ
ク図、第７図は第３の実施例における単語辞書の構成を
示す図、第８図は本発明の第４の実施例における単語辞
書の構成を示す図、第９図は従来の単語辞書の構成を示
す図である。ＩＯ・・・・・・入力部、１１・・・・・・制御部、１
２・・・・・・音声合成部、１３・・・・・・出力部、
１４．１５・・・・・・メモリ、１６・・・・・・バス
、２０．２２０・・・・・・文字記号列入力部、２１．
２２１・・・・・文字記号列解析部、２１ａ　、　２２
１ａ・・・・・・形態素解析部、２１ｂ　、　２２１ｂ
・・・・・・構文解析部、２１Ｃ２２１ｃ　％・・・・
・・意味解析部、２２．２２２・・・・・・辞書、２２
ａ　％　１２２ａ。２２２ａ、　３２２ａ・・・・・・単語辞書、２３．２
２３・・・・・・合成音声パラメータ生成部、２４．２
２４・・・・・・音声合成部、２５．２２５・・・・・
・合成音声出力部、１２２ｂ・・・・・・漢字辞書、２
２６・・・・・・漢字字種表部。を雫１（（５０４）シャープ株式会社文字盲ｅ号列第３図第１第２図文子だ号列第６図第９図

Claims

【特許請求の範囲】

　入力された文字列を解析して音声パラメータを生成し
、該生成した音声パラメータに基づいて音声を合成する
テキスト音声合成装置であって、漢字表記の検索見出し
情報及び該漢字１文字毎のかな表記の検索見出し情報を
有する辞書と、該辞書の前記漢字表記及びかな表記の検
索見出し情報を用いて入力された文字列の各単語の同定
を行う形態素解析部とを備えたことを特徴とするテキス
ト音声合成装置。