JP2000207395A - 日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体 - Google Patents

日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体

Info

Publication number
JP2000207395A
JP2000207395A JP11010150A JP1015099A JP2000207395A JP 2000207395 A JP2000207395 A JP 2000207395A JP 11010150 A JP11010150 A JP 11010150A JP 1015099 A JP1015099 A JP 1015099A JP 2000207395 A JP2000207395 A JP 2000207395A
Authority
JP
Japan
Prior art keywords
kana
kanji
information
japanese
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11010150A
Other languages
English (en)
Inventor
Keizo Sato
圭三 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11010150A priority Critical patent/JP2000207395A/ja
Publication of JP2000207395A publication Critical patent/JP2000207395A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 辞書記憶領域の削減、処理効率の向上を図る
ことのできる日本語解析装置および日本語解析方法なら
びに日本語解析プログラムを記録した記録媒体を提供す
ること。 【解決手段】 仮名漢字変換用と日本語解析用の2つの
辞書を有する日本語解析装置において、仮名漢字変換辞
書部2の仮名漢字変換インデックス記憶部3と、日本語
解析辞書部6の日本語解析辞書インデックス記憶部7と
をインデックス情報マージ部10により統合すること
で、該2つの辞書のインデックス情報をが共有化し、メ
モリ使用量を大幅に削減する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、日本語から他の言
語への翻訳を行う機械翻訳装置や、入力した日本語に対
して入力ミスを指摘・修正する日本語校正支援装置など
に組み込まれる日本語解析装置および日本語解析方法な
らびに日本語解析プログラムを記録した記録媒体に関す
るものである。
【0002】
【従来の技術】近年、パーソナルコンピュータの普及や
情報通信ネットワークの発達に伴い、日本語から他国語
へ翻訳する機械翻訳装置や、日本語の入力ミスを修正・
指摘したりする日本語校正支援装置などに代表される日
本語処理装置が急速に普及している。日本語処理装置で
は、処理対象とする日本語文の構文・意味構造を把握す
る、いわゆる日本語解析を行う必要があり、全ての日本
語処理装置では日本語解析装置を組み込んだ形で実現さ
れている。
【0003】日本語解析装置は、文字列として与えられ
た日本語文を、(1)単語辞書を参照しながら単語単位
に分割する形態素解析処理、(2)分割された単語か
ら、単語間の係り受け解析、意味解析を行い、一意な構
文・意味構造を決定する構文・意味解析処理、を順次適
用することにより実現されている。
【0004】形態素解析処理では、単語辞書から入力文
中の任意の位置から始る単語を全て検索し、構文・意味
解析処理に渡す。そして、構文・意味解析処理では、こ
の単語候補から品詞などの文法的制約、意味的な制約を
満たす構文・意味構造、すなわち用言を中心としてその
他の語が用言に対してどのような意味的役割を果たして
いるかを木構造として示した図9のような構造を出力す
ることになる。
【0005】この際、構文・意味解析処理では、単語の
品詞や語義(単語の意味)を決定することを行う。そし
て、日本語解析では、各単語の係り受け関係が木構造の
上位下位関係に表され、各単語の意味関係をノードのリ
ンクに示す図9のような構文・意味構造を出力すること
を最終の目的とする。
【0006】しかし、全く同じ構文であっても、文の構
成単語により異なった構文・意味構造を持つことがあ
る。例えば、次に示す文などである。
【0007】(1)彼は目が黒い。
【0008】(2)彼は彼女が好きだ。
【0009】上記2つの文は、「〜は〜が述部」という
全く等価な構文であるにもかかわらず、その構文・意味
構造は図9、図10に示すように全く異なった構造をし
ている。これは文の構成単語の意味が異なっていること
に起因する。逆に言うと、単語の意味、すなわち語義が
明確に定まらなければ、構文・意味解析の最終目標であ
る構文・意味構造を出力することはできないということ
になる。すなわち、この語義決定が日本語解析処理の重
要課題となっており、その解析精度に大きな影響を与え
ている。
【0010】ここで、従来の日本語解析における語義決
定に関して説明する。
【0011】従来、日本語解析装置では単語の品詞や語
義を決定するために、枝刈りという手法を用いて可能性
の低いものを捨て去り、残されたものの中から最も可能
性の高いものを選択して最終的な解とする。
【0012】例えば、「彼の頭はすばらしい」という入
力文において、「頭」という単語には、名詞と接尾語と
いう解釈が存在する。構文・意味解析処理では、まず
『接尾語は、自立語の直後に接続する』という文法的制
約に基づき接尾語の解釈を捨て去る。次に、名詞の語義
を決定するのだが、「頭」には「体の部分」「物の先
端」「頭脳」「職人の頭領」など種々の語義が存在す
る。この語義から最終的に一意の語義を決定するため
に、現在の日本語解析処理では用言「すばらしい」の意
味制約に適合するか否かにより行っている。通常、用言
に関する辞書情報としては用言が取り得る格の意味制約
が記述されている。例では、用言「すばらしい」に関し
て『ガ格に対する制約として「人」や「頭脳」がき得
る』という意味制約が記述されており、構文・意味解析
処理ではこの意味制約に対して入力文のガ格である
「頭」の複数の語義から上記制約条件に適合する意味、
つまり語義を選び出す。例では、用言「すばらしい」に
記述された意味制約に適合する「頭脳」「職人の頭領」
などが選び出されることになる。以上の様な制約条件を
繰り返し適用し、最終的に全ての単語の語義が唯一に決
められるまで行われる。
【0013】以上のように、日本語解析では単語の語義
決定を行う必要があるが、上記例にも示したように、単
語の語義を決定する場合、辞書を検索した結果得られ
る、単語の品詞、語義全てを対象として行われる。とこ
ろが、辞書検索時には、入力文中に含まれる文字列、つ
まり単語の字面のみを対象として辞書検索し、辞書に登
録された単語全てを取り出すため、単語の語義決定候補
を無作為に増大させる可能性がある。語義決定処理にお
いては、この語義決定候補に対して可能な限りの組み合
わせを試しながら語義決定を行う必要があるため、結果
として、語義毛決定処理の効率・精度の低下を招くとい
う問題が発生する。この問題を解決するために、情報端
末機器に付随されたキーボードや音声入力装置などの重
力手段を通して入力された、かな情報を用いて日本語解
析の前段階で予め不必要な解釈(語義)を捨去り、語義
決定候補の数を削減する方法がある。例えば、先の例に
おいてはキーボードを通じて「かれはあたまがすばらし
い」が入力され、仮名漢字変換装置を通して日本語解析
対象文「彼は頭がすばらしい」変換されたものとし、
「頭」に対する読みが「あたま」として記憶部されてい
るものとする。この場合、日本語解析時における辞書検
索に際して、「頭」に対する辞書検索を行う場合、その
読みも同時に参照しながあら検索することにより、「頭
(読み:かしら)」、「頭(読み:とう)」といった単
語を辞書検索結果から除外することが可能となる。結果
的に、語義決定における対象候補の搾り込みが行え、解
析精度、並びに解析効率の向上が行える。つまり、仮名
漢字変換装置と日本語解析装置とを組み合わせることに
より、解析精度・効率の向上が行える。
【0014】
【課題を解決しようとする課題】現在、多くの情報機器
に搭載されている仮名漢字変換装置も、いわゆる日本語
処理装置の範疇に属し、内部に構文解析部、構文解析用
の辞書を併せ持っている。ところが、情報機器に新たな
日本語処理装置、例えば機械翻訳装置を組み込む場合、
処理対象こそ、仮名漢字変換装置は仮名文字列、機械翻
訳装置は仮名漢字混じり文字列と異なるが、単語の語彙
情報としては同一のもの(例えば、語彙に情報として)
が存在する。にもかかわらず、仮名漢字変換用の辞書、
機械翻訳用の辞書が存在するため、辞書の記憶領域の無
駄が発生している。
【0015】これは、現在の辞書検索方式が、辞書デー
タへのアドレス情報であるインデックス情報をメモリ上
に記憶しておき、このインデックスから必要に応じて
(辞書検索要求がなされる都度)辞書データをメモリ上
に取り出すという手法により実現されているため、辞書
が複数存在する場合、このインデックスの記憶領域を多
く必要とするばかりか、個々のアプリケーションプログ
ラムにおいて、それぞれメモリ上に取り出されたデータ
には情報の重複が存在する可能性があるためである。
【0016】さらに、現在の仮名漢字変換、日本語解析
を行うために、それぞれ辞書検索、構文解析を行う必要
があり処理効率の低下を招く。
【0017】本発明は、仮名漢字変換装置への入力であ
る仮名情報を日本語解析の語義決定処理に利用する場合
に、仮名漢字変換、日本語解析を行う際に必要となる辞
書の語彙データへのインデックスとして使用するメモリ
の使用量を削減でき、情報機器における貴重なリソース
を節約可能な日本語解析装置および日本語解析方法なら
びに日本語解析プログラムを記録した記録媒体を提供す
ることを目的とする。
【0018】
【課題を解決するための手段】この課題を解決するため
に本発明は、仮名文字の入力、仮名漢字変換および日本
語構文解析の開始指示を行う入力部と、仮名文字に対応
する漢字とその品詞や構文情報を記憶した仮名漢字変換
辞書部と、仮名漢字変換辞書部に記憶された単語の語彙
情報の記憶位置を格納した仮名漢字変換辞書インデック
ス記憶部と、仮名漢字変換辞書インデックス記憶部を介
して、取得要求のあった単語の語彙情報を、仮名漢字変
換辞書部から取り出す仮名漢字情報取得部と、仮名漢字
情報取得部より得られた単語語彙情報を基に、入力され
た仮名文字を漢字コードへ変換する仮名漢字変換部と、
単語に対する読みや発音、品詞や文法情報、意味情報を
記憶した日本語解析辞書部と、日本語解析辞書部に記憶
された単語の語彙情報の記憶位置を格納した日本語解析
辞書インデックス記憶部と、日本語解析辞書インデック
ス記憶部を介して、取得要求のあった単語の語彙情報
を、日本語解析辞書部から取り出す日本語解析情報取得
部と、仮名漢字情報取得部より得られた単語語彙情報を
基に、仮名漢字変換部より得られた仮名漢字混じり文を
日本語形態素解析、構文・意味解析を行う日本語解析部
と、仮名漢字変換辞書インデックス記憶部と、日本語解
析辞書インデックス記憶部におけるインデックス情報を
統合するインデックス情報統合部と、仮名漢字変換辞書
部のインデックス、日本語解析辞書部のインデックス
や、仮名漢字変換、及び日本語解析時における解析を記
憶した解析情報記憶部と、日本語解析結果を表示する表
示部と、を有する構成としたものである。
【0019】これにより、仮名漢字変換装置への入力で
ある仮名情報を日本語解析の語義決定処理に利用する場
合に、仮名漢字変換、日本語解析を行う際に必要となる
辞書の語彙データへのインデックスとして使用するメモ
リの使用量を削減でき、情報機器における貴重なリソー
スを節約可能な日本語解析装置が実現できる。
【0020】
【発明の実施の形態】本発明の請求項1に記載の発明
は、仮名文字の入力、仮名漢字変換および日本語構文解
析の開始指示を行う入力部と、仮名文字に対応する漢字
とその品詞や構文情報を記憶した仮名漢字変換辞書部
と、仮名漢字変換辞書部に記憶された単語の語彙情報の
記憶位置を格納した仮名漢字変換辞書インデックス記憶
部と、仮名漢字変換辞書インデックス記憶部を介して、
取得要求のあった単語の語彙情報を、仮名漢字変換辞書
部から取り出す仮名漢字情報取得部と、仮名漢字情報取
得部より得られた単語語彙情報を基に、入力された仮名
文字を漢字コードへ変換する仮名漢字変換部と、単語に
対する読みや発音、品詞や文法情報、意味情報を記憶し
た日本語解析辞書部と、日本語解析辞書部に記憶された
単語の語彙情報の記憶位置を格納した日本語解析辞書イ
ンデックス記憶部と、日本語解析辞書インデックス記憶
部を介して、取得要求のあった単語の語彙情報を、日本
語解析辞書部から取り出す日本語解析情報取得部と、仮
名漢字情報取得部より得られた単語語彙情報を基に、仮
名漢字変換部より得られた仮名漢字混じり文を日本語形
態素解析、構文・意味解析を行う日本語解析部と、仮名
漢字変換辞書インデックス記憶部と、日本語解析辞書イ
ンデックス記憶部におけるインデックス情報を統合する
インデックス情報統合部と、仮名漢字変換辞書部のイン
デックス、日本語解析辞書部のインデックスや、仮名漢
字変換、及び日本語解析時における解析を記憶した解析
情報記憶部と、日本語解析結果を表示する表示部と、を
有する構成としたものであり、仮名漢字変換装置が既に
組み込まれた情報機器装置に、新に日本語解析装置を組
み込んで、仮名漢字変換装置への入力である仮名情報を
日本語解析の語義決定処理に利用する場合の、メモリ使
用量の削減を図ることができるという作用を有する。
【0021】本発明の請求項2に記載の発明は、請求項
1に記載の発明において、入力部により仮名文字が入力
され、仮名漢字変換部が仮名文字を漢字へ変換した仮名
漢字文字列を日本語解析部へ渡す際に、仮名漢字情報取
得部が仮名漢字辞書部から取得した語彙情報も同時に渡
し、日本語解析部が日本語解析辞書部を検索する際に、
仮名漢字変換部から渡された単語の語彙情報との間に重
複する情報が存在するか否かを判断し、重複が存在する
場合には、日本語解析情報取得部は日本語解析辞書部か
ら取得する情報から重複を取り除いて語彙情報の差分情
報だけを取得する構成としたものであり、仮名漢字変換
装置が既に組み込まれた情報機器装置に、新に日本語解
析装置を組み込んで、仮名漢字変換装置への入力である
仮名情報を日本語解析の語義決定処理に利用する場合
に、辞書データをメモリ上に取り出す際のメモリ使用量
の増加を抑制するとともに、辞書データ取得時間を短縮
できるという作用を有する。
【0022】本発明の請求項3に記載の発明は、請求項
1に記載の発明において、入力部により仮名文字が入力
され、仮名漢字変換部が仮名文字を漢字へ変換した仮名
漢字文字列を日本語解析部へ渡す際に、仮名漢字変換部
が仮名文字列を漢字に変換する場合行った解析結果をも
同時に渡し、日本語解析部はこの解析情報を用いて、仮
名漢字変換部が出力した仮名漢字混じり文を構文・意味
解析する構成としたものであり、日本語解析装置が仮名
漢字変換から渡された構文解析結果を再利用して、余分
な構文解析・意味解析を行わないため、日本語解析装置
における処理時間の短縮を図ることができるという作用
を有する。
【0023】以下、本発明の各実施の形態について、図
面を参照しながら説明する。
【0024】(実施の形態1)以下、本発明の第1の実
施の形態について説明する。
【0025】図1は本発明の第1の実施の形態における
日本語解析装置の機能ブロック図であり、機能手段によ
る構成を示したものである。
【0026】図1において、1は仮名文字の入力や、仮
名漢字変換および日本語構文解析の開始指示などを行う
入力部である。2は仮名文字に対応する漢字とその品詞
や構文情報を記憶した仮名漢字変換辞書部である。3は
仮名漢字変換辞書部2に記憶された単語の語彙情報の記
憶位置を格納した仮名漢字変換辞書インデックス記憶部
である。4は仮名漢字変換辞書インデックス記憶部3を
介して、取得要求のあった単語を、仮名漢字変換辞書部
2から取り出す仮名漢字情報取得部である。5は仮名漢
字情報取得部4より得られた単語語彙情報を基に、入力
された仮名文字を漢字コードへ変換する仮名漢字変換部
である。
【0027】6は単語に対する読みや発音、品詞や文法
情報、意味情報などを記憶した日本語解析辞書部であ
る。7は日本語解析辞書部6に記憶された単語の語彙情
報の記憶位置を格納した日本語解析辞書インデックス記
憶部である。8は日本語解析辞書インデックス記憶部7
を介して、取得要求のあった単語を、日本語解析辞書部
6から取り出す日本語解析情報取得部である。9は日本
語解析情報取得部8より得られた単語語彙情報を基に、
仮名漢字変換部5より得られた仮名漢字混じり文を日本
語形態素解析、構文・意味解析を行う日本語解析部であ
る。
【0028】10は仮名漢字変換辞書インデックス記憶
部3と、日本語解析辞書インデックス記憶部7における
インデックス情報をマージするインデックス情報マージ
部である。11は仮名漢字変換辞書部2のインデック
ス、日本語解析部9のインデックスや、仮名漢字変換お
よび日本語解析時における解析情報を記憶した解析情報
記憶部である。12は日本語解析結果を表示する表示部
であり、13は前述の各手段の動作を制御する制御部で
ある。
【0029】図2は本発明の第1の実施の形態における
登録装置及び翻訳装置の回路ブロック図であり、ハード
ウェアによる構成を示したものである。
【0030】図2において、14はキーボードやポイン
ティング・デバイスなどの入力装置である。15は陰極
線管ディスプレイ(CRT)などの表示装置である。1
6は各種のプログラムを実行することにより装置を制御
する中央処理装置(CPU)である。17はデータを書
き込み可能なメモリであるランダム・アクセス・メモリ
(RAM)である。18はデータの読み出し専用メモリ
であるリード・オンリー・メモリ(ROM)である。
【0031】19はCD−ROMなど、データを記録す
る記録媒体であり、20はCD−ROMドライブなど、
記録媒体19からデータを読み取る読取装置、21はデ
ータ・バスである。
【0032】ここで、図1の機能手段と図2のハードウ
ェアとの対応関係を説明する。
【0033】図1および図2において、入力部1は入力
装置14により、表示部12、表示装置15により、解
析情報記憶部11はRAM18によりそれぞれ実現され
る。
【0034】仮名漢字変換辞書部2、仮名漢字変換辞書
インデックス記憶部3、日本語解析辞書部6、日本語解
析辞書インデックス記憶部7は、RAM17、ROM1
8の何れかに記憶されることにより実現される。
【0035】仮名漢字情報取得部4、仮名漢字変換部
5、日本語解析情報取得部8、日本語解析部9、インデ
ックス情報マージ部10、制御部13は、CPU16
が、RAM17およびROM18とデータのやりとりを
行いながら、ROM18に記憶された各種のプログラム
を実行することにより実現される。
【0036】なお、本実施の形態では、CPU16はR
OM17に記憶されている各種のプログラムを実行する
形態を示しているが、プログラムは記録媒体19に記録
されているものでも良い。
【0037】この場合、CPU16は、読取装置20を
介して記録媒体19から読み込んだプログラムデータを
RAM17に展開し、実行する形態となる。このような
形態とすることにより、本発明を汎用コンピュータで容
易に実現することが可能となる。
【0038】以上のように構成される日本語解析装置に
ついて、以下にその動作をフローチャートを用いて説明
する。なお、以下に用いる動作フローチャートは、CP
U16がROM18に記憶された各種のプログラムを実
行し、装置を制御する様子を示したものである。
【0039】図3は本発明の第1の実施の形態における
日本語解析装置の動作フローチャートであり、入力され
る文字列について、仮名漢字変換を行い、日本語解析す
るまでの動作を示している。
【0040】本実施の形態では、「かれはあたまがすば
らしい」という仮名文字を、仮名漢字変換を行って日本
語解析する場合を考える。
【0041】図3に示すように、まず、操作者により入
力部1から日本語解析装置の起動が指示されると、制御
部13は、仮名漢字変換部5、日本語解析辞書部6を起
動する(ステップ1)。この際、制御部13は、既に仮
名漢字変換装置が起動されているかどうかを判断し、起
動されていれば、仮名漢字変換辞書部2を辞書検索する
ためのインデックス情報をRAM17からクリアするの
と同時に、制御部13が仮名漢字変換辞書インデックス
記憶部3を、日本語解析辞書インデックス記憶部7のイ
ンデックス情報を解析情報記憶部11上に記憶させる。
【0042】ここで、インデックス情報マージ部10
は、制御部13が、仮名漢字変換辞書インデックス記憶
部3を、日本語解析辞書インデックス記憶部7のインデ
ックス情報を解析情報記憶部11上に記憶する際、ここ
のインデックス情報に、一致する文字列が存在するかい
なかを判断し、一致する場合、インデックスをマージし
て一致部分を取り除いた形で、解析情報記憶部11上に
記憶する(S2、インデックス情報マージステップ)。
例えば、仮名漢字変換辞書インデックス記憶部3には、
仮名文字である単語に対して、その該当する単語の漢字
表記や品詞等文法情報が記載された仮名漢字変換辞書部
2へのインデックスが記憶されている(図4)。
【0043】一方、日本語解析辞書インデックス記憶部
7には、単語に対して、その該当する単語の品詞等の文
法情報や、翻訳に必要な訳語情報が記載された日本語解
析辞書部6へのインデックスが記憶されている(図
5)。インデックス情報マージ部10は、上記2つのイ
ンデックス情報から、一致部分を取り去り、すなわちイ
ンデックスキーとなる日本語文字列の部分を共有するこ
とにより、図6に示すようなインデックスを作成し、解
析情報記憶部11へ記憶する。
【0044】ここで、仮名漢字変換辞書部2には、仮名
漢字変換辞書インデックス記憶部3に記憶された位置情
報と対応して、図7に示す仮名漢字変換辞書部2のよう
に、また、日本語解析辞書部6には、日本語解析辞書イ
ンデックス記憶部7に記憶された位置情報と対応して、
図8に示す日本語解析辞書部6のように記憶されてい
る。
【0045】次に、ユーザが入力部1により仮名文字列
を入力する(S3、入力ステップ)。入力された文字列
は、仮名漢字変換部5を介して、また文節ごとに変換す
る場合は、ユーザの介在を経て(S4)、漢字へ変換さ
れる。この際、入力された文字列に対する仮名漢字変換
辞書部2の検索を行い(S5)、インデックス情報マー
ジステップによりマージされた、仮名漢字変換辞書部2
へのインデックスに基づいて、仮名漢字変換辞書部2か
ら、検索に成功した語彙情報を随時取り出しながら(S
6、仮名漢字情報取得ステップ)、仮名漢字変換部5が
入力された仮名文字列を漢字へと変換することを行う
(S7、仮名漢字変換ステップ)。
【0046】次に、ユーザが入力部1により日本語解析
指示を行うと(S8)、入力された文字列に対する日本
語解析辞書部6の検索を行い(S9)、インデックス情
報マージステップによりマージされた、日本語解析辞書
へのインデックスに基づいて、日本語解析辞書部6か
ら、検索に成功した語彙情報を随時取り出しながら(S
10、日本語解析情報取得ステップ)、日本語解析部9
が仮名漢字変換部5より得られるを仮名漢字混じり文字
列の構文・意味解析を行う(S11、日本語解析ステッ
プ)。
【0047】最終的に図7のような構造を表示部12に
表示することにより日本語解析処理を終了する。
【0048】以上のように、本実施の形態によれば、仮
名漢字変換辞書部2、日本語解析辞書部6に対するイン
デックスキーである日本語文字列を共有することができ
るため、本発明の日本語解析装置の動作時におけるメモ
リ使用量を大幅に削減することがでる。
【0049】(実施の形態2)上記第一の実施の形態に
おいて、仮名漢字変換辞書部2から取得した語彙情報
を、日本語解析部9において利用することにより、日本
語解析時におけるメモリ使用量の削減、およびデータ取
得時間の短縮が可能であり、この動作を図3のフローチ
ャートを用いて説明する。
【0050】第二の実施の形態では、第一の実施の形態
で示したようにS1からS7を介して、仮名文字列の入
力から仮名漢字変換までが行われた状態であるとする。
【0051】ここで、仮名漢字変換部5は、変換後の仮
名漢字混じり文字列と共に、仮名漢字変換に際して、使
用した語彙情報も同時に、日本語解析辞書部6へ渡す。
日本語解析部9では日本語辞書検索に際して、渡された
語彙情報が解析に必要な情報を含んでいるか否かを、渡
された語彙情報の内の、品詞などの文法的情報から判断
し(S8)、含んでいない単語に対してだけ、日本語解
析辞書検索を行い(S9)、日本語解析辞書部6から語
彙データを取り出す(S10)。そして、日本語解析部
9はこの語彙情報を使い、構文・意味解析を行い(S1
1)、結果を表示する。
【0052】以上のように、本実施の形態によれば、日
本語解析の辞書検索において、仮名漢字変換時に取得し
た語彙情報を利用することにより、辞書検索回数の削
減、すなわち日本語解析の勝利効率の向上と、日本語解
析辞書部6より取り出す語彙情報の重複を防ぐ、すなわ
ちメモリ使用量の削減が可能となる。
【0053】(実施の形態3)上記第一の実施の形態に
おいて、仮名漢字変換部5が仮名漢字変換に際して行っ
た解析処理を、日本語解析部9において利用することに
より、日本語解析時における処理効率の向上が可能であ
り、この動作を図3のフローチャートを用いて説明す
る。
【0054】第三の実施の形態では、第一の実施の形態
で示したようにS1からS7を介して、仮名文字列の入
力から仮名漢字変換までが行われた状態であるとする。
ここで、仮名漢字変換部5は、変換後の仮名漢字混じり
文字列と共に、仮名漢字変換に際して、使用した構文解
析結果も同時に、日本語解析部9に渡す。この際、ユー
ザが文節ごとの仮名漢字変換を行ったのであれば、文節
毎に変換した結果を、一文を入力したのであればその結
果を日本語解析部9に渡す。
【0055】次に日本語解析部9は、仮名漢字変換部5
より渡された仮名漢字文字列に対して、日本語解析辞書
部6を辞書検索し、検索に成功した単語の語彙情報を日
本語解析辞書部6から取り出す。取り出された語彙情報
を基に、仮名漢字変換部5から渡された解析情報を、日
本語解析の過渡状態において利用する。例えば、仮名漢
字変換部5より渡された解析結果が次のような形で文節
毎に渡されたものとする。
【0056】名詞句→名詞(彼)+助詞(は) 名詞句→名詞(頭)+助詞(が) 述部→形容詞(すばらしい) ここで、A→Bという表記は、右辺に示された語がまと
まって、左辺に示す文法的なまとまりとなる句を構成す
るという意味である。
【0057】日本語解析部9は、上記の結果を文節とし
てより上位の文としてのまとめ上げを行い、さらに意味
解析を行う。
【0058】また、仮名漢字変換部5より渡された解析
結果が次のような形で文として渡されたとる。
【0059】文→名詞句(彼は)+名詞句(頭が)+述
部(すばらしい) 日本語解析部9は、この結果を基に述部に対する意味解
析を行う。
【0060】以上のように、本実施の形態によれば、仮
名漢字変換部5が仮名漢字変換処理を行った際の構文解
析結果を、日本語解析部9が再利用することにより、日
本語解析における、解析の処理フェーズをスキップする
ことができるため、解析処理速度の向上が望める。
【0061】
【発明の効果】以上のように本願発明は、仮名文字の入
力、仮名漢字変換および日本語構文解析の開始指示を行
う入力部と、仮名文字に対応する漢字とその品詞や構文
情報を記憶した仮名漢字変換辞書部と、仮名漢字変換辞
書部に記憶された単語の語彙情報の記憶位置を格納した
仮名漢字変換辞書インデックス記憶部と、仮名漢字変換
辞書インデックス記憶部を介して、取得要求のあった単
語の語彙情報を、仮名漢字変換辞書部から取り出す仮名
漢字情報取得部と、仮名漢字情報取得部より得られた単
語語彙情報を基に、入力された仮名文字を漢字コードへ
変換する仮名漢字変換部と、単語に対する読みや発音、
品詞や文法情報、意味情報を記憶した日本語解析辞書部
と、日本語解析辞書部に記憶された単語の語彙情報の記
憶位置を格納した日本語解析辞書インデックス記憶部
と、日本語解析辞書インデックス記憶部を介して、取得
要求のあった単語の語彙情報を、日本語解析辞書部から
取り出す日本語解析情報取得部と、仮名漢字情報取得部
より得られた単語語彙情報を基に、仮名漢字変換部より
得られた仮名漢字混じり文を日本語形態素解析、構文・
意味解析を行う日本語解析部と、仮名漢字変換辞書イン
デックス記憶部と、日本語解析辞書インデックス記憶部
におけるインデックス情報を統合するインデックス情報
統合部と、仮名漢字変換辞書部のインデックス、日本語
解析辞書部のインデックスや、仮名漢字変換、及び日本
語解析時における解析を記憶した解析情報記憶部と、日
本語解析結果を表示する表示部と、を有する構成とした
ものであり、仮名漢字変換装置が既に組み込まれた情報
機器装置に、新に日本語解析装置を組み込んで、仮名漢
字変換装置への入力である仮名情報を日本語解析の語義
決定処理に利用する場合の、メモリ使用量の削減を図る
ことができる。
【0062】また、入力部により仮名文字が入力され、
仮名漢字変換部が仮名文字を漢字へ変換した仮名漢字文
字列を日本語解析部へ渡す際に、仮名漢字情報取得部が
仮名漢字辞書部から取得した語彙情報も同時に渡し、日
本語解析部が日本語解析辞書を検索する際に、仮名漢字
変換部から渡された単語の語彙情報との間に重複する情
報が存在するか否かを判断し、重複が存在する場合に
は、日本語解析情報取得部は日本語解析辞書から取得す
る情報から重複を取り除いて語彙情報の差分情報だけを
取得する構成としたものであり、仮名漢字変換装置が既
に組み込まれた情報機器装置に、新に日本語解析装置を
組み込んで、仮名漢字変換装置への入力である仮名情報
を日本語解析の語義決定処理に利用する場合に、辞書デ
ータをメモリ上に取り出す際のメモリ使用量の増加を抑
制するとともに、辞書データ取得時間を短縮できる。
【0063】さらに、入力部により仮名文字が入力さ
れ、仮名漢字変換部が仮名文字を漢字へ変換した仮名漢
字文字列を日本語解析部へ渡す際に、仮名漢字変換部が
仮名文字列を漢字に変換する場合行った解析結果をも同
時に渡し、日本語解析部はこの解析情報を用いて、仮名
漢字変換部が出力した仮名漢字混じり文を構文・意味解
析する構成としたものであり、日本語解析装置が仮名漢
字変換から渡された構文解析結果を再利用して、余分な
構文解析・意味解析を行わないため、日本語解析装置に
おける処理時間の短縮を図ることができる
【図面の簡単な説明】
【図1】本発明の第1の実施の形態におけるデータ登録
装置及び翻訳装置の機能ブロック図
【図2】同実施の形態におけるデータ登録装置及び翻訳
装置の回路ブロック図
【図3】同実施の形態における日本語解析装置の動作を
示すフローチャート
【図4】同実施の形態における仮名漢字変換辞書インデ
ックス記憶部の様子を示した図
【図5】同実施の形態における日本語解析辞書インデッ
クス記憶部の様子を示した図
【図6】同実施の形態における解析情報記憶部の様子を
示した図
【図7】同実施の形態における仮名漢字変換辞書部の様
子を示した図
【図8】同実施の形態における日本語解析辞書部の様子
を示した図
【図9】日本語解析結果の構文・意味構造を示した図
【図10】日本語解析結果の構文・意味構造を示した図
【符号の説明】
1 入力部 2 仮名漢字変換辞書部 3 仮名漢字変換辞書インデックス記憶部 4 仮名漢字情報取得部 5 仮名漢字変換部 6 日本語解析辞書部 7 日本語解析辞書インデックス記憶部 8 日本語解析情報取得部 9 日本語解析部 10 インデックス情報マージ部 11 解析情報記憶部 12 表示部 13 制御部 14 キーボード 15 CRT 16 CPU 17 RAM 18 ROM

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】仮名文字の入力、仮名漢字変換および日本
    語構文解析の開始指示を行う入力部と、仮名文字に対応
    する漢字とその品詞や構文情報を記憶した仮名漢字変換
    辞書部と、前記仮名漢字変換辞書部に記憶された単語の
    語彙情報の記憶位置を格納した仮名漢字変換辞書インデ
    ックス記憶部と、前記仮名漢字変換辞書インデックス記
    憶部を介して、取得要求のあった単語の語彙情報を、前
    記仮名漢字変換辞書部から取り出す仮名漢字情報取得部
    と、前記仮名漢字情報取得部より得られた単語語彙情報
    を基に、入力された仮名文字を漢字コードへ変換する仮
    名漢字変換部と、単語に対する読みや発音、品詞や文法
    情報、意味情報を記憶した日本語解析辞書部と、前記日
    本語解析辞書部に記憶された単語の語彙情報の記憶位置
    を格納した日本語解析辞書インデックス記憶部と、前記
    日本語解析辞書インデックス記憶部を介して、取得要求
    のあった単語の語彙情報を、前記日本語解析辞書部から
    取り出す日本語解析情報取得部と、前記仮名漢字情報取
    得部より得られた単語語彙情報を基に、前記仮名漢字変
    換部より得られた仮名漢字混じり文を日本語形態素解
    析、構文・意味解析を行う日本語解析部と、前記仮名漢
    字変換辞書インデックス記憶部と、前記日本語解析辞書
    インデックス記憶部におけるインデックス情報を統合す
    るインデックス情報統合部と、前記仮名漢字変換辞書部
    のインデックス、前記日本語解析辞書部のインデックス
    や、仮名漢字変換、及び日本語解析時における解析を記
    憶した解析情報記憶部と、日本語解析結果を表示する表
    示部と、を有することを特徴とする日本語解析装置。
  2. 【請求項2】入力部により仮名文字が入力され、仮名漢
    字変換部が仮名文字を漢字へ変換した仮名漢字文字列を
    日本語解析部へ渡す際に、仮名漢字情報取得部が仮名漢
    字辞書部から取得した語彙情報も同時に渡し、日本語解
    析部が日本語解析辞書部を検索する際に、仮名漢字変換
    部から渡された単語の語彙情報との間に重複する情報が
    存在するか否かを判断し、重複が存在する場合には、日
    本語解析情報取得部は日本語解析辞書部から取得する情
    報から重複を取り除いて語彙情報の差分情報だけを取得
    することを特徴とする請求項1記載の日本語解析装置。
  3. 【請求項3】入力部により仮名文字が入力され、仮名漢
    字変換部が仮名文字を漢字へ変換した仮名漢字文字列を
    日本語解析部へ渡す際に、仮名漢字変換部が仮名文字列
    を漢字に変換する場合行った解析結果をも同時に渡し、
    日本語解析部はこの解析情報を用いて、仮名漢字変換部
    が出力した仮名漢字混じり文を構文・意味解析すること
    を特徴とする請求項1記載の日本語解析装置。
  4. 【請求項4】仮名文字の入力、仮名漢字変換および日本
    語構文解析の開始指示を行う入力ステップ、前記入力ス
    テップにより入力された仮名文字を、仮名漢字変換辞書
    インデックス記憶部を介して、取得要求のあった単語の
    語彙情報を、前記仮名漢字変換辞書部から取り出す仮名
    漢字情報取得ステップ、前記仮名漢字情報取得ステップ
    より得られた単語語彙情報を基に、入力ステップより入
    力された仮名文字を漢字コードへ変換する仮名漢字変換
    ステップと、前記仮名漢字変換ステップにより変換され
    た仮名漢字混じり文字列を、日本語解析辞書インデック
    ス記憶部を介して、取得要求のあった単語の語彙情報
    を、前記日本語解析辞書部から取り出す日本語解析情報
    取得ステップ、前記日本語解析情報取得ステップにより
    得られた単語の語彙情報を基に、仮名漢字変換ステップ
    により変換された仮名漢字混じり文字列を構文・意味解
    析する日本語解析ステップ、前記仮名漢字変換辞書イン
    デックス記憶部と、前記日本語解析辞書インデックス記
    憶部におけるインデックス情報を統合するインデックス
    情報統合ステップと、を有することを特徴とする日本語
    解析方法。
  5. 【請求項5】入力ステップにより仮名文字が入力され、
    仮名漢字変換ステップが変換した仮名漢字文字列を日本
    語解析ステップへ渡す際に、仮名漢字情報取得ステップ
    が仮名漢字辞書部から取得した語彙情報も同時に渡し、
    日本語解析ステップが日本語解析辞書部を検索する際
    に、仮名漢字変換ステップから渡された単語の語彙情報
    との間に重複する情報が存在するか否かを判断し、重複
    が存在する場合には、日本語解析辞書部から取得する情
    報から重複を取り除いて語彙情報の差分情報だけを取得
    する日本語解析情報取得ステップと、を有することを特
    徴とする請求項4記載の日本語解析方法。
  6. 【請求項6】入力ステップにより仮名文字が入力され、
    仮名漢字変換ステップが変換した仮名漢字文字列を日本
    語解析ステップへ渡す際に、仮名漢字変換ステップが仮
    名文字列を漢字に変換する場合行った解析結果をも同時
    に渡し、日本語解析ステップはこの解析情報を用いて、
    仮名漢字変換ステップが出力した仮名漢字混じり文を構
    文・意味解析する日本語解析ステップと、を有すること
    を特徴とする請求項4記載の日本語解析方法。
  7. 【請求項7】仮名文字の入力、仮名漢字変換および日本
    語構文解析の開始指示を行う入力ステップ、前記入力ス
    テップにより入力された仮名文字を、仮名漢字変換辞書
    インデックス記憶部を介して、取得要求のあった単語の
    語彙情報を、前記仮名漢字変換辞書部から取り出す仮名
    漢字情報取得ステップ、前記仮名漢字情報取得ステップ
    より得られた単語語彙情報を基に、入力ステップより入
    力された仮名文字を漢字コードへ変換する仮名漢字変換
    ステップと、前記仮名漢字変換ステップにより変換され
    た仮名漢字混じり文字列を、日本語解析辞書インデック
    ス記憶部を介して、取得要求のあった単語の語彙情報
    を、前記日本語解析辞書部から取り出す日本語解析情報
    取得ステップ、前記日本語解析情報取得ステップにより
    得られた単語の語彙情報を基に、仮名漢字変換ステップ
    により変換された仮名漢字混じり文字列を構文・意味解
    析する日本語解析ステップ、前記仮名漢字変換辞書イン
    デックス記憶部と、前記日本語解析辞書インデックス記
    憶部におけるインデックス情報を統合するインデックス
    情報統合ステップと、を有することを特徴とする日本語
    解析プログラムを記録した記録媒体。
  8. 【請求項8】入力ステップにより仮名文字が入力され、
    仮名漢字変換ステップが変換した仮名漢字文字列を日本
    語解析ステップへ渡す際に、仮名漢字情報取得ステップ
    が仮名漢字辞書部から取得した語彙情報も同時に渡し、
    日本語解析ステップが日本語解析辞書部を検索する際
    に、仮名漢字変換ステップから渡された単語の語彙情報
    との間に重複する情報が存在するか否かを判断し、重複
    が存在する場合には、日本語解析辞書部から取得する情
    報から重複を取り除いて語彙情報の差分情報だけを取得
    する日本語解析情報取得ステップと、を有することを特
    徴とする請求項4記載の日本語解析プログラムを記録し
    た記録媒体。
  9. 【請求項9】入力ステップにより仮名文字が入力され、
    仮名漢字変換ステップが変換した仮名漢字文字列を日本
    語解析ステップへ渡す際に、仮名漢字変換ステップが仮
    名文字列を漢字に変換する場合行った解析結果をも同時
    に渡し、日本語解析ステップはこの解析情報を用いて、
    仮名漢字変換ステップが出力した仮名漢字混じり文を構
    文・意味解析する日本語解析ステップと、を有すること
    を特徴とする請求項4記載の日本語解析プログラムを記
    録した記録媒体。
JP11010150A 1999-01-19 1999-01-19 日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体 Withdrawn JP2000207395A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11010150A JP2000207395A (ja) 1999-01-19 1999-01-19 日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11010150A JP2000207395A (ja) 1999-01-19 1999-01-19 日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000207395A true JP2000207395A (ja) 2000-07-28

Family

ID=11742259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11010150A Withdrawn JP2000207395A (ja) 1999-01-19 1999-01-19 日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2000207395A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005182795A (ja) * 2003-12-19 2005-07-07 Xerox Corp 語彙と文法を有する言語の上のストリングの内部構造の各レベルにインデックス付けを行うためのシステム及び方法
EP3094071A1 (en) 2015-05-12 2016-11-16 Konica Minolta, Inc. Interaction between a translation application and an (other) add-on application in an image forming apparatus
US10129418B2 (en) 2015-05-12 2018-11-13 Konica Minolta, Inc. Image forming apparatus having translation data application and non-transitory computer-readable recording medium storing translation data application

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005182795A (ja) * 2003-12-19 2005-07-07 Xerox Corp 語彙と文法を有する言語の上のストリングの内部構造の各レベルにインデックス付けを行うためのシステム及び方法
EP3094071A1 (en) 2015-05-12 2016-11-16 Konica Minolta, Inc. Interaction between a translation application and an (other) add-on application in an image forming apparatus
US9942433B2 (en) 2015-05-12 2018-04-10 Konica Minolta, Inc. Image forming apparatus and recording medium
US10129418B2 (en) 2015-05-12 2018-11-13 Konica Minolta, Inc. Image forming apparatus having translation data application and non-transitory computer-readable recording medium storing translation data application

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPH05120324A (ja) 言語処理方式
JP2000207395A (ja) 日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体
JP2632806B2 (ja) 言語解析装置
JP2719453B2 (ja) 機械翻訳装置
JPH0561902A (ja) 機械翻訳システム
JPH1031676A (ja) 対訳例文検索装置
JPH05225232A (ja) テキスト自動前編集装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH09160920A (ja) 機械翻訳装置
JPH0816910B2 (ja) 言語解析装置
JPH0687239B2 (ja) 文字処理装置
JPH0320866A (ja) テキストベース検索方式
JP3353873B2 (ja) 機械翻訳装置
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH0612449A (ja) 機械翻訳装置及びその方法
JPH11259475A (ja) 日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体
JPH05233686A (ja) 日本語処理装置
JPS6180358A (ja) 翻訳装置
JPH09190440A (ja) 機械翻訳装置
JP2000242643A (ja) 英文作成支援装置及び方法並びに記憶媒体
JPH08137886A (ja) 翻訳装置および翻訳方法
JPH1063664A (ja) 自然言語の翻訳方法及び装置
JPH04205057A (ja) 機械翻訳装置
JPH086950A (ja) キーワード翻訳機能付き機械翻訳装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051209

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060112

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070730