JPH03204698A - テキスト音声合成装置 - Google Patents
テキスト音声合成装置Info
- Publication number
- JPH03204698A JPH03204698A JP2000299A JP29990A JPH03204698A JP H03204698 A JPH03204698 A JP H03204698A JP 2000299 A JP2000299 A JP 2000299A JP 29990 A JP29990 A JP 29990A JP H03204698 A JPH03204698 A JP H03204698A
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- word
- dictionary
- kana
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野コ
本発明は、文字列の入力に基づいて音声を合成出力する
テキスト音声合成装置に関する。
テキスト音声合成装置に関する。
[従来の技術]
テキスト音声合成においては、入力された任意の文字記
号列に読み、アクセント、及びイントネーション等を付
加して音声パラメータが生成され、この生成された音声
パラメータに基づいて音声が合成される。
号列に読み、アクセント、及びイントネーション等を付
加して音声パラメータが生成され、この生成された音声
パラメータに基づいて音声が合成される。
入力された文字記号列は、辞書を用いることにより形態
素解析されて各単語の同定が行われ、さらに同定した単
語の品詞等の文法情報やアクセントが求められる。
素解析されて各単語の同定が行われ、さらに同定した単
語の品詞等の文法情報やアクセントが求められる。
この辞書には、単語辞書、漢字辞書、記号辞書等があり
、第9図に示すように、標準的な漢字かな混じり表記に
よる見出しが登録されている単語辞書でまず入力文字記
号列の単語の検索が行われる。この検索に失敗した場合
は、漢字辞書等を用いることによって未知語として処理
される。
、第9図に示すように、標準的な漢字かな混じり表記に
よる見出しが登録されている単語辞書でまず入力文字記
号列の単語の検索が行われる。この検索に失敗した場合
は、漢字辞書等を用いることによって未知語として処理
される。
[発明が解決しようとする課題]
漢字かな混じり文は、正書法が確立していないため、同
一の単語に対して異なる表記が用いられることがある。
一の単語に対して異なる表記が用いられることがある。
従って、このような漢字かな混じり文が入力された場合
、上述の従来技術によると、単語の検索失敗がしばしば
生じる。即ち、単語辞書の見出しが従来技術では標準的
な表記であるため、入力した表記と辞書の見出しとが一
致せず、単語が検索できないことがあり、このような場
合、誤った読みやアクセントで音声が合成されてしまう
という不都合がある。例えば、第9図に示す如く、単語
辞書の見出しが「愛きょう」、「曖昧」等となっている
場合、入力文字列中の単語が「愛嬌」と表記されていた
り、「あいまい」と表記されていると、検索失敗が起こ
る。
、上述の従来技術によると、単語の検索失敗がしばしば
生じる。即ち、単語辞書の見出しが従来技術では標準的
な表記であるため、入力した表記と辞書の見出しとが一
致せず、単語が検索できないことがあり、このような場
合、誤った読みやアクセントで音声が合成されてしまう
という不都合がある。例えば、第9図に示す如く、単語
辞書の見出しが「愛きょう」、「曖昧」等となっている
場合、入力文字列中の単語が「愛嬌」と表記されていた
り、「あいまい」と表記されていると、検索失敗が起こ
る。
上述の如き問題点を解消するため、辞書中に多数の表記
を見出しとして登録しておくことも考えられるが、辞書
の容量が大幅に増大してしまうため実現が難しい。
を見出しとして登録しておくことも考えられるが、辞書
の容量が大幅に増大してしまうため実現が難しい。
従って本発明の目的は、いかなる表記法による入力文字
記号列についても単語検索が可能であり、正しい読み及
び正しいアクセントで合成音声を生成でき、しかも大容
量の辞書を必要としないテキスト音声合成装置を提供す
ることにある。
記号列についても単語検索が可能であり、正しい読み及
び正しいアクセントで合成音声を生成でき、しかも大容
量の辞書を必要としないテキスト音声合成装置を提供す
ることにある。
[課題を解決するための手段]
上述の目的を達成する本発明の特徴は、入力された文字
列を解析して音声パラメータを生成し、生成した音声パ
ラメータに基づいて音声を合成するテキスト音声合成装
置であって、漢字表記の検索見出し情報及びその漢字1
文字毎のかな表記の検索見出し情報を有する辞書と、こ
の辞書の上述の漢字表記及びかな表記の検索見出し情報
を用いて入力された文字列の各単語の同定を行う形態素
解析部とを備えたことにある。
列を解析して音声パラメータを生成し、生成した音声パ
ラメータに基づいて音声を合成するテキスト音声合成装
置であって、漢字表記の検索見出し情報及びその漢字1
文字毎のかな表記の検索見出し情報を有する辞書と、こ
の辞書の上述の漢字表記及びかな表記の検索見出し情報
を用いて入力された文字列の各単語の同定を行う形態素
解析部とを備えたことにある。
[作用コ
文章を構成する文字記号列が入力されると、形態素解析
部において、辞書中の漢字表記の検索見出し情報及びそ
の漢字1文字毎のかな表記の検索見出し情報を選択して
漢字かな混じり表記が生成される。そしてこの漢字かな
混じり表記に照合する単語が文章中の単語候補として抽
出される。抽出された単語候補から構成単語が決定され
て音声パラメータが生成される。生成された音声パラメ
ータに基づいて音声合成が行われる。
部において、辞書中の漢字表記の検索見出し情報及びそ
の漢字1文字毎のかな表記の検索見出し情報を選択して
漢字かな混じり表記が生成される。そしてこの漢字かな
混じり表記に照合する単語が文章中の単語候補として抽
出される。抽出された単語候補から構成単語が決定され
て音声パラメータが生成される。生成された音声パラメ
ータに基づいて音声合成が行われる。
従って、入力された漢字かな混じり文字記号列中の単語
の使い方が一定しておらず、漢字表記、かな表記、又は
漢字かな混じり表記のいずれが用いられたとしても単語
の検索が可能となる。
の使い方が一定しておらず、漢字表記、かな表記、又は
漢字かな混じり表記のいずれが用いられたとしても単語
の検索が可能となる。
[実施例]
以下図面を用いて本発明の実施例を詳細に説明する。
第2図は本発明の第1の実施例の構成を概略的に示すブ
ロック図である。
ロック図である。
同図において、10は音声合成すべき文字記号列の入力
される入力部、11は制御部、12は音声パラメータに
従って音声の合成を行いこれを出力する音声合成部、1
3は音声合成部12からの合成音声信号を出力する出力
部、14は単語辞書、漢字辞書、記号辞書、意味辞書、
及び品詞接続辞書用メモリ、15は音声データ等のメモ
リをそれぞれ示している。
される入力部、11は制御部、12は音声パラメータに
従って音声の合成を行いこれを出力する音声合成部、1
3は音声合成部12からの合成音声信号を出力する出力
部、14は単語辞書、漢字辞書、記号辞書、意味辞書、
及び品詞接続辞書用メモリ、15は音声データ等のメモ
リをそれぞれ示している。
これら入力部10、制御部11、音声合成部12、及び
メモ1月4、工5は、バスI6を介して互いに接続され
ている。
メモ1月4、工5は、バスI6を介して互いに接続され
ている。
制御部11は、プログラムされたコンピュータで主とし
て構成されており、後述する如く、入力部10から与え
られる入力データからメモ1月4.15を用いて音声パ
ラメータを生成する。
て構成されており、後述する如く、入力部10から与え
られる入力データからメモ1月4.15を用いて音声パ
ラメータを生成する。
第3図は、本実施例の機能的構成を表すブロック図であ
る。
る。
同図に示すように、漢字かな混じり文等の文字記号列が
文字記号列入力部20に入力されて、文字記号列解析部
21へ印加される。この文字記号列解析部21は、本実
施例では、入力文字記号列の単語解析を行う形態素解析
部21aと、構文解析部21bと、意味解析部21cと
から構成されている。辞書22は、単語辞書、漢字辞書
、記号辞書、意味辞書、及び品詞接続辞書等を備えてい
る。
文字記号列入力部20に入力されて、文字記号列解析部
21へ印加される。この文字記号列解析部21は、本実
施例では、入力文字記号列の単語解析を行う形態素解析
部21aと、構文解析部21bと、意味解析部21cと
から構成されている。辞書22は、単語辞書、漢字辞書
、記号辞書、意味辞書、及び品詞接続辞書等を備えてい
る。
形態素解析部21aは、このうちの単語辞書、漢字辞書
、及び記号辞書を用いて入力された文字記号列の形態素
解析を行い、各単語の候補を同定すると共に同定した単
語候補の品詞等の文法情報やアクセントを求める。本実
施例における単語辞書の構成及び形態素解析部21aの
機能等については、後述する。
、及び記号辞書を用いて入力された文字記号列の形態素
解析を行い、各単語の候補を同定すると共に同定した単
語候補の品詞等の文法情報やアクセントを求める。本実
施例における単語辞書の構成及び形態素解析部21aの
機能等については、後述する。
構文解析部21bは、形態素解析部21aによって同定
された単語候補のうち構文上止しいものを品詞接続辞書
等を用いて判定し選択する。意味解析部21cは、構文
解析部21bによって構文上止しいと判断された単語候
補のうち意味が正しいものを意味辞書等を用いて判定し
選択する。
された単語候補のうち構文上止しいものを品詞接続辞書
等を用いて判定し選択する。意味解析部21cは、構文
解析部21bによって構文上止しいと判断された単語候
補のうち意味が正しいものを意味辞書等を用いて判定し
選択する。
合成音声パラメータ生成部23は、文字記号列解析部2
1で同定された各単語のアクセントや構文構造に応じて
単語が連鎖した際の文節、呼気段落のアクセント及びポ
ーズの設定を行う。これは韻律を制御するために行われ
る。次いでこの合成音声パラメータ生成部23では、発
生音声に対応した合成単位に対する継続時間、ピッチパ
ターン、パワーパターン、及び音韻特徴パラメータ(偏
自己相関関数、線スペクトル対、ホルマント等)のパラ
メータ時系列が生成される。
1で同定された各単語のアクセントや構文構造に応じて
単語が連鎖した際の文節、呼気段落のアクセント及びポ
ーズの設定を行う。これは韻律を制御するために行われ
る。次いでこの合成音声パラメータ生成部23では、発
生音声に対応した合成単位に対する継続時間、ピッチパ
ターン、パワーパターン、及び音韻特徴パラメータ(偏
自己相関関数、線スペクトル対、ホルマント等)のパラ
メータ時系列が生成される。
音声合成部24は、合成音声パラメータ生成部23で生
成されたパラメータ時系列に基づいて実際の合成音声波
形を生成し、合成音声出力部25を介してこれを出力す
る。
成されたパラメータ時系列に基づいて実際の合成音声波
形を生成し、合成音声出力部25を介してこれを出力す
る。
本実施例において、単語辞書22aは第1図に示す如く
構成されている。即ち、この単語辞書22aは、表記見
出し部と辞書内容部とに大きく分けられ、表記見出し部
には漢字による表記と共にその漢字1字毎に対応するか
な表記が記されている。
構成されている。即ち、この単語辞書22aは、表記見
出し部と辞書内容部とに大きく分けられ、表記見出し部
には漢字による表記と共にその漢字1字毎に対応するか
な表記が記されている。
例えば、漢字見出し「情報」の「情」に対応してかな見
出し「じょう」が記されており、「報」に対応してかな
見出し「はう」が記されている。
出し「じょう」が記されており、「報」に対応してかな
見出し「はう」が記されている。
この単語辞書22aを用いて行われる入力文字記号列に
対する形態素解析処理は、第4図に示すプログラムに従
って実行される。ただしこの例は、2文字の漢字で表さ
れる単語の形態素解析処理を行うものである。
対する形態素解析処理は、第4図に示すプログラムに従
って実行される。ただしこの例は、2文字の漢字で表さ
れる単語の形態素解析処理を行うものである。
まずステップS1において、入力文字列の最初の文字が
漢字表記であるか否かを判別する。漢字表記である場合
はステップS2へ進み、単語辞書22gの見出しを用い
てその漢字で始まる単語を単語辞書22aから検索する
。この場合、単語辞書22aの漢字表記の検索見出し情
報が参照される。次いで、ステップS3において、入力
文字列の次の文字が漢字であるか否かを判別する。
漢字表記であるか否かを判別する。漢字表記である場合
はステップS2へ進み、単語辞書22gの見出しを用い
てその漢字で始まる単語を単語辞書22aから検索する
。この場合、単語辞書22aの漢字表記の検索見出し情
報が参照される。次いで、ステップS3において、入力
文字列の次の文字が漢字であるか否かを判別する。
次の文字も漢字表記である場合はステップS4へ進み、
ステップS2で検索した漢字の次にその漢字がくる単語
の検索を、単語辞書22aの見出しを用いて行う。この
場合も、単語辞書22aの漢字表記の検索見出し情報が
参照される。次いで、ステップS5において、ステップ
S4の検索によってマツチングする単語が得られたかど
うか判別し、得られた場合はステップS14に進み、そ
の単語を単語候補として記憶させる。
ステップS2で検索した漢字の次にその漢字がくる単語
の検索を、単語辞書22aの見出しを用いて行う。この
場合も、単語辞書22aの漢字表記の検索見出し情報が
参照される。次いで、ステップS5において、ステップ
S4の検索によってマツチングする単語が得られたかど
うか判別し、得られた場合はステップS14に進み、そ
の単語を単語候補として記憶させる。
マツチングする単語候補が得られなかった場合は、ステ
ップS2へ戻り、最初の文字として当該漢字を有する単
語の検索を行う。
ップS2へ戻り、最初の文字として当該漢字を有する単
語の検索を行う。
ステップS3において、入力文字列の次の文字が漢字表
記でないと判別された場合、即ちかな表記であると判別
された場合は、ステップS6へ進む。
記でないと判別された場合、即ちかな表記であると判別
された場合は、ステップS6へ進む。
ステップS6では、ステップS2で検索した漢字の次に
そのかな表記の文字がくる単語の検索を、単語辞書22
aのかな表記の見出しを用いて行う。この場合は、単語
辞書22aの1文字の漢字に対応するかな表記の検索見
出し情報が参照される。次いで、ステップS7において
、ステップS6の検索によってマツチングする単語が得
られたかどうか判別し、得られた場合はステップ314
に進み、その単語を単語候補として記憶させる。マツチ
ングする単語候補が得られなかった場合は、ステップS
2へ戻り、最初の文字として当該漢字を有する単語の検
索を行う。
そのかな表記の文字がくる単語の検索を、単語辞書22
aのかな表記の見出しを用いて行う。この場合は、単語
辞書22aの1文字の漢字に対応するかな表記の検索見
出し情報が参照される。次いで、ステップS7において
、ステップS6の検索によってマツチングする単語が得
られたかどうか判別し、得られた場合はステップ314
に進み、その単語を単語候補として記憶させる。マツチ
ングする単語候補が得られなかった場合は、ステップS
2へ戻り、最初の文字として当該漢字を有する単語の検
索を行う。
ステップS1において、入力文字列の最初の文字が漢字
表記でないと判別された場合、即ちかな表記であると判
別された場合は、ステップS8へ進み、単語辞書22a
のかな表記の見出しを用いて対応するかな表記で始まる
単語を検索する。このステップS8の処理内容は、ステ
ップS6の処理内容と同じである。
表記でないと判別された場合、即ちかな表記であると判
別された場合は、ステップS8へ進み、単語辞書22a
のかな表記の見出しを用いて対応するかな表記で始まる
単語を検索する。このステップS8の処理内容は、ステ
ップS6の処理内容と同じである。
ステップS8の処理が終わると、ステップS9.510
1S11、S12、及びS13の処理が行われる。これ
らステップ39〜S13の処理内容は、ステップ33〜
S7の処理内容と同じである。
1S11、S12、及びS13の処理が行われる。これ
らステップ39〜S13の処理内容は、ステップ33〜
S7の処理内容と同じである。
ステップ314において単語候補が記憶されると、ステ
ップS+5へ進み、単語辞書2hの全ての見出しがチエ
ツクされたかどうか判別し、否の場合はステップS1へ
戻り以上の処理が繰り返される。このようにして形態素
解析処理では、単語辞書22a中の全ての単語候補が抽
出される。
ップS+5へ進み、単語辞書2hの全ての見出しがチエ
ツクされたかどうか判別し、否の場合はステップS1へ
戻り以上の処理が繰り返される。このようにして形態素
解析処理では、単語辞書22a中の全ての単語候補が抽
出される。
なお、第4図のプログラムは、2文字の漢字で表される
文字列の単語候補を形態素解析処理を行うものであるが
、3文字以上の文字列についても同様のステップを繰り
返すのみで容易に実現できることは明らかである。
文字列の単語候補を形態素解析処理を行うものであるが
、3文字以上の文字列についても同様のステップを繰り
返すのみで容易に実現できることは明らかである。
漢字かな混じり文字列として「情はう」が入力された場
合について、第4図のプログラムの動作を説明する。
合について、第4図のプログラムの動作を説明する。
ステップSlにおいて、最初の文字「情」が漢字表記で
あると判別されるため、ステップS2へ進む。
あると判別されるため、ステップS2へ進む。
ステップS2では、単語辞書22aの漢字表記の検索見
出し情報が参照されて「情」を最初の文字として有する
単語が検索される。次のステップS3では、次の文字「
は」がかな表記であると判別されるため、ステップS6
へ進む。ステップS6では、「情」の次に「はう」がく
る単語の検索を、単語辞書22aのかな表記の検索見出
し情報を参照して行われる。このように、漢字表記「情
」とかな表記「はう」を選択することにより、表記が「
情はう」である単語候補「情報」を検索することができ
る。
出し情報が参照されて「情」を最初の文字として有する
単語が検索される。次のステップS3では、次の文字「
は」がかな表記であると判別されるため、ステップS6
へ進む。ステップS6では、「情」の次に「はう」がく
る単語の検索を、単語辞書22aのかな表記の検索見出
し情報を参照して行われる。このように、漢字表記「情
」とかな表記「はう」を選択することにより、表記が「
情はう」である単語候補「情報」を検索することができ
る。
なお、「情」を最初の文字に有する単語であっても、「
情け」のような単語も存在している。このような場合は
、ステップS7において、マツチングする単語候補が得
られなかったと判別されてステップS2へ戻り、最初の
文字として当該漢字を有する単語の検索が行われる。
情け」のような単語も存在している。このような場合は
、ステップS7において、マツチングする単語候補が得
られなかったと判別されてステップS2へ戻り、最初の
文字として当該漢字を有する単語の検索が行われる。
このように本実施例によれば、単語辞書2h中の漢字表
記の検索見出し情報とかな表記の検索見出し情報とを取
捨選択して生成される文字列が、入力文字列の部分文字
列に一致するものを探し、単語候補として選択する。
記の検索見出し情報とかな表記の検索見出し情報とを取
捨選択して生成される文字列が、入力文字列の部分文字
列に一致するものを探し、単語候補として選択する。
このようにして同定された単語候補の中から、構文的及
び意味的に正しい単語が構文解析部21b及び意味解析
部21cで選択されることは、前述した通りである。
び意味的に正しい単語が構文解析部21b及び意味解析
部21cで選択されることは、前述した通りである。
なお、文字記号列解析部21は、必ずしも形態素解析部
21aと、構文解析部21bと、意味解析部21Cとか
ら構成される必要はなく、少なくとも形態素解析部21
aが含まれていればよい。
21aと、構文解析部21bと、意味解析部21Cとか
ら構成される必要はなく、少なくとも形態素解析部21
aが含まれていればよい。
第5図は、本発明の第2の実施例における辞書の単語辞
書122a及び漢字辞書122bの構成を示している。
書122a及び漢字辞書122bの構成を示している。
同図に示すように、単語辞書122aは、表記見出し部
と辞書内容部とに大きく分けられ、表記見出し部には漢
字による表記と共にその漢字1字毎に対応する漢字辞書
122b内のかな表記のポインタが記されている。漢字
辞書122b内には、各漢字のかな表記が記されており
、上述のポインタは対応するかな表記のアドレスを表し
ている。
と辞書内容部とに大きく分けられ、表記見出し部には漢
字による表記と共にその漢字1字毎に対応する漢字辞書
122b内のかな表記のポインタが記されている。漢字
辞書122b内には、各漢字のかな表記が記されており
、上述のポインタは対応するかな表記のアドレスを表し
ている。
例えば、単語辞書122aには、漢字見出し「情報」の
「情」に対応するかな表記「じょう」の漢字辞書12ハ
内のアドレスが記されており、「報」に対応するかな表
記「はう」の漢字辞書122b内のアドレスが記されて
いる。漢字辞書122b内には、「情」に対応するかな
表記として、「なさ」、「なさけ」「じよう」、「せい
」等が記されており、その「じよう」の部分のアドレス
がポインタとして単語辞書122aの表記見出し部に記
されている。
「情」に対応するかな表記「じょう」の漢字辞書12ハ
内のアドレスが記されており、「報」に対応するかな表
記「はう」の漢字辞書122b内のアドレスが記されて
いる。漢字辞書122b内には、「情」に対応するかな
表記として、「なさ」、「なさけ」「じよう」、「せい
」等が記されており、その「じよう」の部分のアドレス
がポインタとして単語辞書122aの表記見出し部に記
されている。
単語辞書122aの表記見出し部にかな表記を行わず、
漢字辞書122b内の対応するかな表記のアドレスのみ
を記すことにより、単語辞書122aの容量を大幅に減
らすことができる。
漢字辞書122b内の対応するかな表記のアドレスのみ
を記すことにより、単語辞書122aの容量を大幅に減
らすことができる。
本実施例のその他の構成及び動作は、前述の第1の実施
例の場合と同じである。
例の場合と同じである。
第6図は、本発明の第3の実施例の機能的構成を表すブ
ロック図である。
ロック図である。
同図に示すように、漢字かな混じり文等の文字記号列が
文字記号列入力部220に入力されて、文字記号列解析
部221へ印加される。この文字記号列解析部221は
、本実施例では、入力文字記号列の単語解析を行う形態
素解析部221aと、構文解析部221bと、意味解析
部221cとから構成されている。
文字記号列入力部220に入力されて、文字記号列解析
部221へ印加される。この文字記号列解析部221は
、本実施例では、入力文字記号列の単語解析を行う形態
素解析部221aと、構文解析部221bと、意味解析
部221cとから構成されている。
辞書222には、単語辞書、漢字辞書、記号辞書、意味
辞書、及び品詞接続辞書等を備えている。
辞書、及び品詞接続辞書等を備えている。
形態素解析部221aは、このうちの単語辞書、漢字辞
書、及び記号辞書を用いて、入力された文字記号列の形
態素解析を行い、各単語の候補を同定すると共に同定し
た単語候補の品詞等の文法情報やアクセントを求める。
書、及び記号辞書を用いて、入力された文字記号列の形
態素解析を行い、各単語の候補を同定すると共に同定し
た単語候補の品詞等の文法情報やアクセントを求める。
漢字字種表部226は、字種制御を行うために難読漢字
を指定するものであり、本実施例では、JIs第2水準
漢字を難読漢字に設定している。
を指定するものであり、本実施例では、JIs第2水準
漢字を難読漢字に設定している。
構文解析部221bは、形態素解析部221aによって
同定された単語候補のうち構文上正しいものを品詞接続
辞書等を用いて判定し選択する。意味解析部221Cは
、構文解析部221bによって構文上正しいと判断され
た単語候補のうち意味が正しいものを意味辞書等を用い
て判定し選択する。
同定された単語候補のうち構文上正しいものを品詞接続
辞書等を用いて判定し選択する。意味解析部221Cは
、構文解析部221bによって構文上正しいと判断され
た単語候補のうち意味が正しいものを意味辞書等を用い
て判定し選択する。
合成音声パラメータ生成部223は、文字記号列解析部
221で同定された各単語のアクセントや構文構造に応
じて単語が連鎖した際の文節、呼気段落のアクセント及
びポーズの設定を行う。これは韻律を制御するために行
われる。次いでこの合成音声パラメータ生成部223で
は、発生音声に対応した合成単位に対する継続時間、ピ
ッチパターン、パワーパターン、及び音韻特徴パラメー
タ(偏自己相関関数、線スペクトル対、ホルマント等)
のパラメータ時系列が生成される。
221で同定された各単語のアクセントや構文構造に応
じて単語が連鎖した際の文節、呼気段落のアクセント及
びポーズの設定を行う。これは韻律を制御するために行
われる。次いでこの合成音声パラメータ生成部223で
は、発生音声に対応した合成単位に対する継続時間、ピ
ッチパターン、パワーパターン、及び音韻特徴パラメー
タ(偏自己相関関数、線スペクトル対、ホルマント等)
のパラメータ時系列が生成される。
音声合成部224は、合成音声パラメータ生成部223
で生成されたパラメータ時系列に基づいて実際の合成音
声波形を生成し、合成音声出力部225を介してこれを
出力する。
で生成されたパラメータ時系列に基づいて実際の合成音
声波形を生成し、合成音声出力部225を介してこれを
出力する。
本実施例において、単語辞書222aは第7図に示す如
く構成されている。即ち、第1図の場合と同様に単語辞
書222aは、表記見出し部と辞書内容部とに大きく分
けられ、表記見出し部には漢字による表記と共にその漢
字1字毎に対応するかな表記が記されている。例えば、
漢字見出し「葡萄」の「葡」に対応してかな見出し「ぶ
」が記されており、「萄」に対応してかな見出し「どう
」が記されている。また、漢字見出し「武道」の「武」
に対応してかな見出し「ぶ」が記されており、「道」に
対応してかな見出し「どう」が記されている。
く構成されている。即ち、第1図の場合と同様に単語辞
書222aは、表記見出し部と辞書内容部とに大きく分
けられ、表記見出し部には漢字による表記と共にその漢
字1字毎に対応するかな表記が記されている。例えば、
漢字見出し「葡萄」の「葡」に対応してかな見出し「ぶ
」が記されており、「萄」に対応してかな見出し「どう
」が記されている。また、漢字見出し「武道」の「武」
に対応してかな見出し「ぶ」が記されており、「道」に
対応してかな見出し「どう」が記されている。
本実施例における単語辞書の構成及び形態素解析部22
1aの機能等については、基本的に前述した第1の実施
例の場合と同じである。しかしながら、本実施例におい
ては、検索された単語の中に、漢字かな混じり表記又は
かな表記でありかつそのかな表記に対応する漢字表記が
存在する場合、次の如く動作する。即ち、かな表記に対
応する漢字が漢字字種表部226で難読漢字に指定され
ている場合は、その検索された単語を単語候補として選
択する。逆に、かな表記に対応する漢字が漢字字種表部
226で難読漢字に指定されていない場合は、その検索
された単語を単語候補から取り除く。即ち、漢字で表記
するかかなで表記するか一定してない漢字は、特定の難
読漢字や当て字に多いため、人力されたかな表記が難読
漢字に指定されている場合にこれを単語候補として選ぶ
ようにしているのである。これによって、検索時間の短
縮化を図ることができる。
1aの機能等については、基本的に前述した第1の実施
例の場合と同じである。しかしながら、本実施例におい
ては、検索された単語の中に、漢字かな混じり表記又は
かな表記でありかつそのかな表記に対応する漢字表記が
存在する場合、次の如く動作する。即ち、かな表記に対
応する漢字が漢字字種表部226で難読漢字に指定され
ている場合は、その検索された単語を単語候補として選
択する。逆に、かな表記に対応する漢字が漢字字種表部
226で難読漢字に指定されていない場合は、その検索
された単語を単語候補から取り除く。即ち、漢字で表記
するかかなで表記するか一定してない漢字は、特定の難
読漢字や当て字に多いため、人力されたかな表記が難読
漢字に指定されている場合にこれを単語候補として選ぶ
ようにしているのである。これによって、検索時間の短
縮化を図ることができる。
例えば、「ぶどう」なる文字列が入力された場合に、単
語「葡萄」及び「武道」が検索されたとする。ここで、
漢字「葡」及び「萄」は共にJIS第2水準漢字であっ
て難読漢字に設定されており、漢字「武」及び「道」は
共にJIS第2水準漢字ではな(難読漢字に設定されて
ない。従って、この場合、「武道」は単語候補から取り
除かれ、「葡萄」が単語候補として選択される。即ち、
単語「武道」については、難読漢字ではないため漢字表
記で入力されることが比較的多く、一方、単語「葡萄」
については、難読漢字であるためかな表記で入力される
ことが比較的多いから、この点を検索制御に利用してい
るのである。
語「葡萄」及び「武道」が検索されたとする。ここで、
漢字「葡」及び「萄」は共にJIS第2水準漢字であっ
て難読漢字に設定されており、漢字「武」及び「道」は
共にJIS第2水準漢字ではな(難読漢字に設定されて
ない。従って、この場合、「武道」は単語候補から取り
除かれ、「葡萄」が単語候補として選択される。即ち、
単語「武道」については、難読漢字ではないため漢字表
記で入力されることが比較的多く、一方、単語「葡萄」
については、難読漢字であるためかな表記で入力される
ことが比較的多いから、この点を検索制御に利用してい
るのである。
なお、難読漢字としてJIS第2水準漢字の他に、例え
ば教育漢字の学年コード等の如き難易コードを設定する
と共にしきい値を設け、このしきい値以上の難易コード
の漢字を難読漢字としてもよい。この場合、教科書の読
み上げに用いて有効である。また、漢字字種表を用いて
、多くの単語候補から単語を決定する際に、かな表記に
対応する漢字の難易度が最も高い単語を選ぶように構成
することによって、かな表記の単語候補の絞り込みをよ
り一層効果的に行うことができる。
ば教育漢字の学年コード等の如き難易コードを設定する
と共にしきい値を設け、このしきい値以上の難易コード
の漢字を難読漢字としてもよい。この場合、教科書の読
み上げに用いて有効である。また、漢字字種表を用いて
、多くの単語候補から単語を決定する際に、かな表記に
対応する漢字の難易度が最も高い単語を選ぶように構成
することによって、かな表記の単語候補の絞り込みをよ
り一層効果的に行うことができる。
第8図は、本発明の第4の実施例における辞書の単語辞
書322aの構成を示している。
書322aの構成を示している。
同図に示すように、単語辞書322aは、表記見出し部
と辞書内容部とに大きく分けられ、表記見出し部には漢
字による表記と共にその漢字1字毎に対応するかな表記
が記されている。さらにこの表記見出し部には、漢字見
出しの各漢字のうちかな表記することが多いものに対し
ては、かな表記検索指令情報が付加されている。
と辞書内容部とに大きく分けられ、表記見出し部には漢
字による表記と共にその漢字1字毎に対応するかな表記
が記されている。さらにこの表記見出し部には、漢字見
出しの各漢字のうちかな表記することが多いものに対し
ては、かな表記検索指令情報が付加されている。
例えば、単語辞書322aには、漢字見出し「箸」に対
応するかな表記が「はし」であることを示しており、こ
の単語「箸」にはかな表記検索指令情報300が付加さ
れている。一方、漢字見出し「橋」に対応するかな表記
も「はし」であるが、この単語「橋」にはかな表記検索
指令情報300が付加されていない。これは、単語「橋
」については、漢字表記で入力されることが比較的多く
、「箸」はかな表記で入力されることが比較的多いこと
を示している。
応するかな表記が「はし」であることを示しており、こ
の単語「箸」にはかな表記検索指令情報300が付加さ
れている。一方、漢字見出し「橋」に対応するかな表記
も「はし」であるが、この単語「橋」にはかな表記検索
指令情報300が付加されていない。これは、単語「橋
」については、漢字表記で入力されることが比較的多く
、「箸」はかな表記で入力されることが比較的多いこと
を示している。
本実施例の基本的な構成及び動作は、前述の第1の実施
例の場合と同じである。しかしながら、本実施例におい
ては、検索された単語の中に、漢字かな混じり表記又は
かな表記でありかつそのかな表記に対応する漢字表記が
存在する場合、次の如く動作する。即ち、検索された単
語にかな表記検索指令情報が付加されている場合は、そ
の検索された単語を単語候補として選択する。逆に、か
な表記検索指令情報が付加されていない場合は、その検
索された単語を単語候補から取り除く。即ち、かな表記
で入力されることが比較的多い単語にかな表記検索指令
情報をあらかじめ付加しておき、このかな表記検索指令
情報がある場合は単語候補として選ぶようにしているの
である。これによって、検索時間の短縮化を図ることが
できる。
例の場合と同じである。しかしながら、本実施例におい
ては、検索された単語の中に、漢字かな混じり表記又は
かな表記でありかつそのかな表記に対応する漢字表記が
存在する場合、次の如く動作する。即ち、検索された単
語にかな表記検索指令情報が付加されている場合は、そ
の検索された単語を単語候補として選択する。逆に、か
な表記検索指令情報が付加されていない場合は、その検
索された単語を単語候補から取り除く。即ち、かな表記
で入力されることが比較的多い単語にかな表記検索指令
情報をあらかじめ付加しておき、このかな表記検索指令
情報がある場合は単語候補として選ぶようにしているの
である。これによって、検索時間の短縮化を図ることが
できる。
例えば、「はし」なる文字列が入力された場合に、単語
「箸」及び「橋」が検索されたとする。
「箸」及び「橋」が検索されたとする。
単語「箸」にはかな表記検索指令情報300が付加され
ているので単語候補として選択され、単語「橋」にはか
な表記検索指令情報300が付加されていないので単語
候補から取り除かれる。
ているので単語候補として選択され、単語「橋」にはか
な表記検索指令情報300が付加されていないので単語
候補から取り除かれる。
なお、かな表記検索指令情報の他に、例えば教育漢字の
学年コード等の如き難易コードを設定すると共にしきい
値を設け、しきい値以上の難易コードのもののみ選択す
るようにしてもよい。このしきい値を入力文字列の難易
度に合わせることにより、より効率のよい検索を行うこ
とができる。
学年コード等の如き難易コードを設定すると共にしきい
値を設け、しきい値以上の難易コードのもののみ選択す
るようにしてもよい。このしきい値を入力文字列の難易
度に合わせることにより、より効率のよい検索を行うこ
とができる。
以上述べた実施例において、漢字による表記と共にその
漢字1字毎に対応するかな表記が記されている単語辞書
、又は漢字による表記と共にその漢字1字毎に対応する
かな表記のポインタが記されている単語辞書が、漢字表
記とかな表記との組み合わせで表記見出しを自ら生成す
るように構成してもよい。さらにこの場合、上述の第3
又は第4の実施例において、漢字表記の単語が漢字字種
表での難易度の高い漢字であるとき又はかな表記検索指
令情報により難易度の高い漢字であるときは対応するか
な表記を選択して表記見出しを生成できるように構成し
てもよい。
漢字1字毎に対応するかな表記が記されている単語辞書
、又は漢字による表記と共にその漢字1字毎に対応する
かな表記のポインタが記されている単語辞書が、漢字表
記とかな表記との組み合わせで表記見出しを自ら生成す
るように構成してもよい。さらにこの場合、上述の第3
又は第4の実施例において、漢字表記の単語が漢字字種
表での難易度の高い漢字であるとき又はかな表記検索指
令情報により難易度の高い漢字であるときは対応するか
な表記を選択して表記見出しを生成できるように構成し
てもよい。
[発明の効果]
以上詳細に説明したように本発明によれば、漢字表記の
検索見出し情報及びその漢字1文字毎のかな表記の検索
見出し情報を有する辞書と、この辞書の上述の漢字表記
及びかな表記の検索見出し情報を用いて入力された文字
列の各単語の同定を行う形態素解析部とを備えているた
め、入力された漢字かな混じり文字記号列中の単語の使
い方が一定しておらず、漢字表記、かな表記、又は漢字
かな混じり表記のいずれが用いられたとしても単語の検
索が可能となる。即ち、いかなる表記法による入力文字
記号列についても単語検索が可能であり、正しい読み及
び正しいアクセントで合成音声を生成することができる
。しかもその場合に大容量の辞書を必要としない。
検索見出し情報及びその漢字1文字毎のかな表記の検索
見出し情報を有する辞書と、この辞書の上述の漢字表記
及びかな表記の検索見出し情報を用いて入力された文字
列の各単語の同定を行う形態素解析部とを備えているた
め、入力された漢字かな混じり文字記号列中の単語の使
い方が一定しておらず、漢字表記、かな表記、又は漢字
かな混じり表記のいずれが用いられたとしても単語の検
索が可能となる。即ち、いかなる表記法による入力文字
記号列についても単語検索が可能であり、正しい読み及
び正しいアクセントで合成音声を生成することができる
。しかもその場合に大容量の辞書を必要としない。
第1図は本発明の第1の実施例の単語辞書の構成を示す
図、第2図は第1の実施例の全体の構成を概略的に示す
ブロック図、第3図は第1の実施例の機能的構成を表す
ブロック図、第4図は第1の実施例の形態素解析処理プ
ログラムのフローチャート、第5図は本発明の第2の実
施例における単語辞書及び漢字辞書の構成を示す図、第
6図は本発明の第3の実施例の機能的構成を表すブロッ
ク図、第7図は第3の実施例における単語辞書の構成を
示す図、第8図は本発明の第4の実施例における単語辞
書の構成を示す図、第9図は従来の単語辞書の構成を示
す図である。 IO・・・・・・入力部、11・・・・・・制御部、1
2・・・・・・音声合成部、13・・・・・・出力部、
14.15・・・・・・メモリ、16・・・・・・バス
、20.220・・・・・・文字記号列入力部、21.
221・・・・・文字記号列解析部、21a 、 22
1a・・・・・・形態素解析部、21b 、 221b
・・・・・・構文解析部、21C221c %・・・・
・・意味解析部、22.222・・・・・・辞書、22
a % 122a。 222a、 322a・・・・・・単語辞書、23.2
23・・・・・・合成音声パラメータ生成部、24.2
24・・・・・・音声合成部、25.225・・・・・
・合成音声出力部、122b・・・・・・漢字辞書、2
26・・・・・・漢字字種表部。 を雫1( (504)シャープ株式会社 文字盲e号列 第3図 第1 第2図 文子だ号列 第6図 第9 図
図、第2図は第1の実施例の全体の構成を概略的に示す
ブロック図、第3図は第1の実施例の機能的構成を表す
ブロック図、第4図は第1の実施例の形態素解析処理プ
ログラムのフローチャート、第5図は本発明の第2の実
施例における単語辞書及び漢字辞書の構成を示す図、第
6図は本発明の第3の実施例の機能的構成を表すブロッ
ク図、第7図は第3の実施例における単語辞書の構成を
示す図、第8図は本発明の第4の実施例における単語辞
書の構成を示す図、第9図は従来の単語辞書の構成を示
す図である。 IO・・・・・・入力部、11・・・・・・制御部、1
2・・・・・・音声合成部、13・・・・・・出力部、
14.15・・・・・・メモリ、16・・・・・・バス
、20.220・・・・・・文字記号列入力部、21.
221・・・・・文字記号列解析部、21a 、 22
1a・・・・・・形態素解析部、21b 、 221b
・・・・・・構文解析部、21C221c %・・・・
・・意味解析部、22.222・・・・・・辞書、22
a % 122a。 222a、 322a・・・・・・単語辞書、23.2
23・・・・・・合成音声パラメータ生成部、24.2
24・・・・・・音声合成部、25.225・・・・・
・合成音声出力部、122b・・・・・・漢字辞書、2
26・・・・・・漢字字種表部。 を雫1( (504)シャープ株式会社 文字盲e号列 第3図 第1 第2図 文子だ号列 第6図 第9 図
Claims (1)
- 入力された文字列を解析して音声パラメータを生成し
、該生成した音声パラメータに基づいて音声を合成する
テキスト音声合成装置であって、漢字表記の検索見出し
情報及び該漢字1文字毎のかな表記の検索見出し情報を
有する辞書と、該辞書の前記漢字表記及びかな表記の検
索見出し情報を用いて入力された文字列の各単語の同定
を行う形態素解析部とを備えたことを特徴とするテキス
ト音声合成装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000299A JPH03204698A (ja) | 1990-01-05 | 1990-01-05 | テキスト音声合成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000299A JPH03204698A (ja) | 1990-01-05 | 1990-01-05 | テキスト音声合成装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03204698A true JPH03204698A (ja) | 1991-09-06 |
Family
ID=11470025
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000299A Pending JPH03204698A (ja) | 1990-01-05 | 1990-01-05 | テキスト音声合成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03204698A (ja) |
-
1990
- 1990-01-05 JP JP2000299A patent/JPH03204698A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100769033B1 (ko) | 스피치 합성 방법 | |
| KR900005899B1 (ko) | 문장작성장치 | |
| US6275789B1 (en) | Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language | |
| JPS59144978A (ja) | ポ−タブル翻訳装置 | |
| JP5231698B2 (ja) | 日本語の表意文字の読み方を予測する方法 | |
| KR100369507B1 (ko) | 표준 발음법 분석에 기반한 음성 인식/합성 시스템 및 방법 | |
| Umeda et al. | The parsing program for automatic text-to-speech synthesis developed at the Electrotechnical Laboratory in 1968 | |
| KR19980047177A (ko) | 한국어 문서 음성 변환 시스템을 위한 문서 분석기 | |
| JPH06282290A (ja) | 自然言語処理装置およびその方法 | |
| Sen et al. | Indian accent text-to-speech system for web browsing | |
| Akinwonm | Development of a prosodic read speech syllabic corpus of the yoruba language | |
| JPH03204698A (ja) | テキスト音声合成装置 | |
| JPS58123129A (ja) | 仮名漢字変換装置 | |
| Akinwonmi | Rule-induced misanalysis of nasal syllables in yoruba declarative syllabification algorithm | |
| JPH11338498A (ja) | 音声合成装置 | |
| JP2004206659A (ja) | 読み情報決定方法及び装置及びプログラム | |
| JPH03245192A (ja) | 外国語単語の発音決定方法 | |
| KR0136423B1 (ko) | 발음 제어 기호의 유효성 판정을 이용한 음운 변동 처리 방법 | |
| Gafni | A Universal System for Automatic Text-to-Phonetics Conversion | |
| Lyras et al. | A large greek-English dictionary with incorporated speech and language processing tools. | |
| JPH09288494A (ja) | 音声認識装置および音声認識方法 | |
| Strunk | Information retrieval for languages that lack a fixed orthography | |
| JP2000330998A (ja) | 発音電子辞書 | |
| JPH07129596A (ja) | 自然言語処理装置 | |
| JPS6126096A (ja) | 音声認識単語の事前評価システム |