JP2000207395A

JP2000207395A - 日本語解析装置および日本語解析方法ならびに日本語解析プログラムを記録した記録媒体

Info

Publication number: JP2000207395A
Application number: JP11010150A
Authority: JP
Inventors: Keizo Sato; 圭三佐藤
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1999-01-19
Filing date: 1999-01-19
Publication date: 2000-07-28

Abstract

(57)【要約】【課題】辞書記憶領域の削減、処理効率の向上を図る
ことのできる日本語解析装置および日本語解析方法なら
びに日本語解析プログラムを記録した記録媒体を提供す
ること。【解決手段】仮名漢字変換用と日本語解析用の２つの
辞書を有する日本語解析装置において、仮名漢字変換辞
書部２の仮名漢字変換インデックス記憶部３と、日本語
解析辞書部６の日本語解析辞書インデックス記憶部７と
をインデックス情報マージ部１０により統合すること
で、該２つの辞書のインデックス情報をが共有化し、メ
モリ使用量を大幅に削減する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、日本語から他の言
語への翻訳を行う機械翻訳装置や、入力した日本語に対
して入力ミスを指摘・修正する日本語校正支援装置など
に組み込まれる日本語解析装置および日本語解析方法な
らびに日本語解析プログラムを記録した記録媒体に関す
るものである。

【０００２】

【従来の技術】近年、パーソナルコンピュータの普及や
情報通信ネットワークの発達に伴い、日本語から他国語
へ翻訳する機械翻訳装置や、日本語の入力ミスを修正・
指摘したりする日本語校正支援装置などに代表される日
本語処理装置が急速に普及している。日本語処理装置で
は、処理対象とする日本語文の構文・意味構造を把握す
る、いわゆる日本語解析を行う必要があり、全ての日本
語処理装置では日本語解析装置を組み込んだ形で実現さ
れている。

【０００３】日本語解析装置は、文字列として与えられ
た日本語文を、（１）単語辞書を参照しながら単語単位
に分割する形態素解析処理、（２）分割された単語か
ら、単語間の係り受け解析、意味解析を行い、一意な構
文・意味構造を決定する構文・意味解析処理、を順次適
用することにより実現されている。

【０００４】形態素解析処理では、単語辞書から入力文
中の任意の位置から始る単語を全て検索し、構文・意味
解析処理に渡す。そして、構文・意味解析処理では、こ
の単語候補から品詞などの文法的制約、意味的な制約を
満たす構文・意味構造、すなわち用言を中心としてその
他の語が用言に対してどのような意味的役割を果たして
いるかを木構造として示した図９のような構造を出力す
ることになる。

【０００５】この際、構文・意味解析処理では、単語の
品詞や語義（単語の意味）を決定することを行う。そし
て、日本語解析では、各単語の係り受け関係が木構造の
上位下位関係に表され、各単語の意味関係をノードのリ
ンクに示す図９のような構文・意味構造を出力すること
を最終の目的とする。

【０００６】しかし、全く同じ構文であっても、文の構
成単語により異なった構文・意味構造を持つことがあ
る。例えば、次に示す文などである。

【０００７】（１）彼は目が黒い。

【０００８】（２）彼は彼女が好きだ。

【０００９】上記２つの文は、「〜は〜が述部」という
全く等価な構文であるにもかかわらず、その構文・意味
構造は図９、図１０に示すように全く異なった構造をし
ている。これは文の構成単語の意味が異なっていること
に起因する。逆に言うと、単語の意味、すなわち語義が
明確に定まらなければ、構文・意味解析の最終目標であ
る構文・意味構造を出力することはできないということ
になる。すなわち、この語義決定が日本語解析処理の重
要課題となっており、その解析精度に大きな影響を与え
ている。

【００１０】ここで、従来の日本語解析における語義決
定に関して説明する。

【００１１】従来、日本語解析装置では単語の品詞や語
義を決定するために、枝刈りという手法を用いて可能性
の低いものを捨て去り、残されたものの中から最も可能
性の高いものを選択して最終的な解とする。

【００１２】例えば、「彼の頭はすばらしい」という入
力文において、「頭」という単語には、名詞と接尾語と
いう解釈が存在する。構文・意味解析処理では、まず
『接尾語は、自立語の直後に接続する』という文法的制
約に基づき接尾語の解釈を捨て去る。次に、名詞の語義
を決定するのだが、「頭」には「体の部分」「物の先
端」「頭脳」「職人の頭領」など種々の語義が存在す
る。この語義から最終的に一意の語義を決定するため
に、現在の日本語解析処理では用言「すばらしい」の意
味制約に適合するか否かにより行っている。通常、用言
に関する辞書情報としては用言が取り得る格の意味制約
が記述されている。例では、用言「すばらしい」に関し
て『ガ格に対する制約として「人」や「頭脳」がき得
る』という意味制約が記述されており、構文・意味解析
処理ではこの意味制約に対して入力文のガ格である
「頭」の複数の語義から上記制約条件に適合する意味、
つまり語義を選び出す。例では、用言「すばらしい」に
記述された意味制約に適合する「頭脳」「職人の頭領」
などが選び出されることになる。以上の様な制約条件を
繰り返し適用し、最終的に全ての単語の語義が唯一に決
められるまで行われる。

【００１３】以上のように、日本語解析では単語の語義
決定を行う必要があるが、上記例にも示したように、単
語の語義を決定する場合、辞書を検索した結果得られ
る、単語の品詞、語義全てを対象として行われる。とこ
ろが、辞書検索時には、入力文中に含まれる文字列、つ
まり単語の字面のみを対象として辞書検索し、辞書に登
録された単語全てを取り出すため、単語の語義決定候補
を無作為に増大させる可能性がある。語義決定処理にお
いては、この語義決定候補に対して可能な限りの組み合
わせを試しながら語義決定を行う必要があるため、結果
として、語義毛決定処理の効率・精度の低下を招くとい
う問題が発生する。この問題を解決するために、情報端
末機器に付随されたキーボードや音声入力装置などの重
力手段を通して入力された、かな情報を用いて日本語解
析の前段階で予め不必要な解釈（語義）を捨去り、語義
決定候補の数を削減する方法がある。例えば、先の例に
おいてはキーボードを通じて「かれはあたまがすばらし
い」が入力され、仮名漢字変換装置を通して日本語解析
対象文「彼は頭がすばらしい」変換されたものとし、
「頭」に対する読みが「あたま」として記憶部されてい
るものとする。この場合、日本語解析時における辞書検
索に際して、「頭」に対する辞書検索を行う場合、その
読みも同時に参照しながあら検索することにより、「頭
（読み：かしら）」、「頭（読み：とう）」といった単
語を辞書検索結果から除外することが可能となる。結果
的に、語義決定における対象候補の搾り込みが行え、解
析精度、並びに解析効率の向上が行える。つまり、仮名
漢字変換装置と日本語解析装置とを組み合わせることに
より、解析精度・効率の向上が行える。

【００１４】

【課題を解決しようとする課題】現在、多くの情報機器
に搭載されている仮名漢字変換装置も、いわゆる日本語
処理装置の範疇に属し、内部に構文解析部、構文解析用
の辞書を併せ持っている。ところが、情報機器に新たな
日本語処理装置、例えば機械翻訳装置を組み込む場合、
処理対象こそ、仮名漢字変換装置は仮名文字列、機械翻
訳装置は仮名漢字混じり文字列と異なるが、単語の語彙
情報としては同一のもの（例えば、語彙に情報として）
が存在する。にもかかわらず、仮名漢字変換用の辞書、
機械翻訳用の辞書が存在するため、辞書の記憶領域の無
駄が発生している。

【００１５】これは、現在の辞書検索方式が、辞書デー
タへのアドレス情報であるインデックス情報をメモリ上
に記憶しておき、このインデックスから必要に応じて
（辞書検索要求がなされる都度）辞書データをメモリ上
に取り出すという手法により実現されているため、辞書
が複数存在する場合、このインデックスの記憶領域を多
く必要とするばかりか、個々のアプリケーションプログ
ラムにおいて、それぞれメモリ上に取り出されたデータ
には情報の重複が存在する可能性があるためである。

【００１６】さらに、現在の仮名漢字変換、日本語解析
を行うために、それぞれ辞書検索、構文解析を行う必要
があり処理効率の低下を招く。

【００１７】本発明は、仮名漢字変換装置への入力であ
る仮名情報を日本語解析の語義決定処理に利用する場合
に、仮名漢字変換、日本語解析を行う際に必要となる辞
書の語彙データへのインデックスとして使用するメモリ
の使用量を削減でき、情報機器における貴重なリソース
を節約可能な日本語解析装置および日本語解析方法なら
びに日本語解析プログラムを記録した記録媒体を提供す
ることを目的とする。

【００１８】

【課題を解決するための手段】この課題を解決するため
に本発明は、仮名文字の入力、仮名漢字変換および日本
語構文解析の開始指示を行う入力部と、仮名文字に対応
する漢字とその品詞や構文情報を記憶した仮名漢字変換
辞書部と、仮名漢字変換辞書部に記憶された単語の語彙
情報の記憶位置を格納した仮名漢字変換辞書インデック
ス記憶部と、仮名漢字変換辞書インデックス記憶部を介
して、取得要求のあった単語の語彙情報を、仮名漢字変
換辞書部から取り出す仮名漢字情報取得部と、仮名漢字
情報取得部より得られた単語語彙情報を基に、入力され
た仮名文字を漢字コードへ変換する仮名漢字変換部と、
単語に対する読みや発音、品詞や文法情報、意味情報を
記憶した日本語解析辞書部と、日本語解析辞書部に記憶
された単語の語彙情報の記憶位置を格納した日本語解析
辞書インデックス記憶部と、日本語解析辞書インデック
ス記憶部を介して、取得要求のあった単語の語彙情報
を、日本語解析辞書部から取り出す日本語解析情報取得
部と、仮名漢字情報取得部より得られた単語語彙情報を
基に、仮名漢字変換部より得られた仮名漢字混じり文を
日本語形態素解析、構文・意味解析を行う日本語解析部
と、仮名漢字変換辞書インデックス記憶部と、日本語解
析辞書インデックス記憶部におけるインデックス情報を
統合するインデックス情報統合部と、仮名漢字変換辞書
部のインデックス、日本語解析辞書部のインデックス
や、仮名漢字変換、及び日本語解析時における解析を記
憶した解析情報記憶部と、日本語解析結果を表示する表
示部と、を有する構成としたものである。

【００１９】これにより、仮名漢字変換装置への入力で
ある仮名情報を日本語解析の語義決定処理に利用する場
合に、仮名漢字変換、日本語解析を行う際に必要となる
辞書の語彙データへのインデックスとして使用するメモ
リの使用量を削減でき、情報機器における貴重なリソー
スを節約可能な日本語解析装置が実現できる。

【００２０】

【発明の実施の形態】本発明の請求項１に記載の発明
は、仮名文字の入力、仮名漢字変換および日本語構文解
析の開始指示を行う入力部と、仮名文字に対応する漢字
とその品詞や構文情報を記憶した仮名漢字変換辞書部
と、仮名漢字変換辞書部に記憶された単語の語彙情報の
記憶位置を格納した仮名漢字変換辞書インデックス記憶
部と、仮名漢字変換辞書インデックス記憶部を介して、
取得要求のあった単語の語彙情報を、仮名漢字変換辞書
部から取り出す仮名漢字情報取得部と、仮名漢字情報取
得部より得られた単語語彙情報を基に、入力された仮名
文字を漢字コードへ変換する仮名漢字変換部と、単語に
対する読みや発音、品詞や文法情報、意味情報を記憶し
た日本語解析辞書部と、日本語解析辞書部に記憶された
単語の語彙情報の記憶位置を格納した日本語解析辞書イ
ンデックス記憶部と、日本語解析辞書インデックス記憶
部を介して、取得要求のあった単語の語彙情報を、日本
語解析辞書部から取り出す日本語解析情報取得部と、仮
名漢字情報取得部より得られた単語語彙情報を基に、仮
名漢字変換部より得られた仮名漢字混じり文を日本語形
態素解析、構文・意味解析を行う日本語解析部と、仮名
漢字変換辞書インデックス記憶部と、日本語解析辞書イ
ンデックス記憶部におけるインデックス情報を統合する
インデックス情報統合部と、仮名漢字変換辞書部のイン
デックス、日本語解析辞書部のインデックスや、仮名漢
字変換、及び日本語解析時における解析を記憶した解析
情報記憶部と、日本語解析結果を表示する表示部と、を
有する構成としたものであり、仮名漢字変換装置が既に
組み込まれた情報機器装置に、新に日本語解析装置を組
み込んで、仮名漢字変換装置への入力である仮名情報を
日本語解析の語義決定処理に利用する場合の、メモリ使
用量の削減を図ることができるという作用を有する。

【００２１】本発明の請求項２に記載の発明は、請求項
１に記載の発明において、入力部により仮名文字が入力
され、仮名漢字変換部が仮名文字を漢字へ変換した仮名
漢字文字列を日本語解析部へ渡す際に、仮名漢字情報取
得部が仮名漢字辞書部から取得した語彙情報も同時に渡
し、日本語解析部が日本語解析辞書部を検索する際に、
仮名漢字変換部から渡された単語の語彙情報との間に重
複する情報が存在するか否かを判断し、重複が存在する
場合には、日本語解析情報取得部は日本語解析辞書部か
ら取得する情報から重複を取り除いて語彙情報の差分情
報だけを取得する構成としたものであり、仮名漢字変換
装置が既に組み込まれた情報機器装置に、新に日本語解
析装置を組み込んで、仮名漢字変換装置への入力である
仮名情報を日本語解析の語義決定処理に利用する場合
に、辞書データをメモリ上に取り出す際のメモリ使用量
の増加を抑制するとともに、辞書データ取得時間を短縮
できるという作用を有する。

【００２２】本発明の請求項３に記載の発明は、請求項
１に記載の発明において、入力部により仮名文字が入力
され、仮名漢字変換部が仮名文字を漢字へ変換した仮名
漢字文字列を日本語解析部へ渡す際に、仮名漢字変換部
が仮名文字列を漢字に変換する場合行った解析結果をも
同時に渡し、日本語解析部はこの解析情報を用いて、仮
名漢字変換部が出力した仮名漢字混じり文を構文・意味
解析する構成としたものであり、日本語解析装置が仮名
漢字変換から渡された構文解析結果を再利用して、余分
な構文解析・意味解析を行わないため、日本語解析装置
における処理時間の短縮を図ることができるという作用
を有する。

【００２３】以下、本発明の各実施の形態について、図
面を参照しながら説明する。

【００２４】（実施の形態１）以下、本発明の第１の実
施の形態について説明する。

【００２５】図１は本発明の第１の実施の形態における
日本語解析装置の機能ブロック図であり、機能手段によ
る構成を示したものである。

【００２６】図１において、１は仮名文字の入力や、仮
名漢字変換および日本語構文解析の開始指示などを行う
入力部である。２は仮名文字に対応する漢字とその品詞
や構文情報を記憶した仮名漢字変換辞書部である。３は
仮名漢字変換辞書部２に記憶された単語の語彙情報の記
憶位置を格納した仮名漢字変換辞書インデックス記憶部
である。４は仮名漢字変換辞書インデックス記憶部３を
介して、取得要求のあった単語を、仮名漢字変換辞書部
２から取り出す仮名漢字情報取得部である。５は仮名漢
字情報取得部４より得られた単語語彙情報を基に、入力
された仮名文字を漢字コードへ変換する仮名漢字変換部
である。

【００２７】６は単語に対する読みや発音、品詞や文法
情報、意味情報などを記憶した日本語解析辞書部であ
る。７は日本語解析辞書部６に記憶された単語の語彙情
報の記憶位置を格納した日本語解析辞書インデックス記
憶部である。８は日本語解析辞書インデックス記憶部７
を介して、取得要求のあった単語を、日本語解析辞書部
６から取り出す日本語解析情報取得部である。９は日本
語解析情報取得部８より得られた単語語彙情報を基に、
仮名漢字変換部５より得られた仮名漢字混じり文を日本
語形態素解析、構文・意味解析を行う日本語解析部であ
る。

【００２８】１０は仮名漢字変換辞書インデックス記憶
部３と、日本語解析辞書インデックス記憶部７における
インデックス情報をマージするインデックス情報マージ
部である。１１は仮名漢字変換辞書部２のインデック
ス、日本語解析部９のインデックスや、仮名漢字変換お
よび日本語解析時における解析情報を記憶した解析情報
記憶部である。１２は日本語解析結果を表示する表示部
であり、１３は前述の各手段の動作を制御する制御部で
ある。

【００２９】図２は本発明の第１の実施の形態における
登録装置及び翻訳装置の回路ブロック図であり、ハード
ウェアによる構成を示したものである。

【００３０】図２において、１４はキーボードやポイン
ティング・デバイスなどの入力装置である。１５は陰極
線管ディスプレイ（ＣＲＴ）などの表示装置である。１
６は各種のプログラムを実行することにより装置を制御
する中央処理装置（ＣＰＵ）である。１７はデータを書
き込み可能なメモリであるランダム・アクセス・メモリ
（ＲＡＭ）である。１８はデータの読み出し専用メモリ
であるリード・オンリー・メモリ（ＲＯＭ）である。

【００３１】１９はＣＤ−ＲＯＭなど、データを記録す
る記録媒体であり、２０はＣＤ−ＲＯＭドライブなど、
記録媒体１９からデータを読み取る読取装置、２１はデ
ータ・バスである。

【００３２】ここで、図１の機能手段と図２のハードウ
ェアとの対応関係を説明する。

【００３３】図１および図２において、入力部１は入力
装置１４により、表示部１２、表示装置１５により、解
析情報記憶部１１はＲＡＭ１８によりそれぞれ実現され
る。

【００３４】仮名漢字変換辞書部２、仮名漢字変換辞書
インデックス記憶部３、日本語解析辞書部６、日本語解
析辞書インデックス記憶部７は、ＲＡＭ１７、ＲＯＭ１
８の何れかに記憶されることにより実現される。

【００３５】仮名漢字情報取得部４、仮名漢字変換部
５、日本語解析情報取得部８、日本語解析部９、インデ
ックス情報マージ部１０、制御部１３は、ＣＰＵ１６
が、ＲＡＭ１７およびＲＯＭ１８とデータのやりとりを
行いながら、ＲＯＭ１８に記憶された各種のプログラム
を実行することにより実現される。

【００３６】なお、本実施の形態では、ＣＰＵ１６はＲ
ＯＭ１７に記憶されている各種のプログラムを実行する
形態を示しているが、プログラムは記録媒体１９に記録
されているものでも良い。

【００３７】この場合、ＣＰＵ１６は、読取装置２０を
介して記録媒体１９から読み込んだプログラムデータを
ＲＡＭ１７に展開し、実行する形態となる。このような
形態とすることにより、本発明を汎用コンピュータで容
易に実現することが可能となる。

【００３８】以上のように構成される日本語解析装置に
ついて、以下にその動作をフローチャートを用いて説明
する。なお、以下に用いる動作フローチャートは、ＣＰ
Ｕ１６がＲＯＭ１８に記憶された各種のプログラムを実
行し、装置を制御する様子を示したものである。

【００３９】図３は本発明の第１の実施の形態における
日本語解析装置の動作フローチャートであり、入力され
る文字列について、仮名漢字変換を行い、日本語解析す
るまでの動作を示している。

【００４０】本実施の形態では、「かれはあたまがすば
らしい」という仮名文字を、仮名漢字変換を行って日本
語解析する場合を考える。

【００４１】図３に示すように、まず、操作者により入
力部１から日本語解析装置の起動が指示されると、制御
部１３は、仮名漢字変換部５、日本語解析辞書部６を起
動する（ステップ１）。この際、制御部１３は、既に仮
名漢字変換装置が起動されているかどうかを判断し、起
動されていれば、仮名漢字変換辞書部２を辞書検索する
ためのインデックス情報をＲＡＭ１７からクリアするの
と同時に、制御部１３が仮名漢字変換辞書インデックス
記憶部３を、日本語解析辞書インデックス記憶部７のイ
ンデックス情報を解析情報記憶部１１上に記憶させる。

【００４２】ここで、インデックス情報マージ部１０
は、制御部１３が、仮名漢字変換辞書インデックス記憶
部３を、日本語解析辞書インデックス記憶部７のインデ
ックス情報を解析情報記憶部１１上に記憶する際、ここ
のインデックス情報に、一致する文字列が存在するかい
なかを判断し、一致する場合、インデックスをマージし
て一致部分を取り除いた形で、解析情報記憶部１１上に
記憶する（Ｓ２、インデックス情報マージステップ）。
例えば、仮名漢字変換辞書インデックス記憶部３には、
仮名文字である単語に対して、その該当する単語の漢字
表記や品詞等文法情報が記載された仮名漢字変換辞書部
２へのインデックスが記憶されている（図４）。

【００４３】一方、日本語解析辞書インデックス記憶部
７には、単語に対して、その該当する単語の品詞等の文
法情報や、翻訳に必要な訳語情報が記載された日本語解
析辞書部６へのインデックスが記憶されている（図
５）。インデックス情報マージ部１０は、上記２つのイ
ンデックス情報から、一致部分を取り去り、すなわちイ
ンデックスキーとなる日本語文字列の部分を共有するこ
とにより、図６に示すようなインデックスを作成し、解
析情報記憶部１１へ記憶する。

【００４４】ここで、仮名漢字変換辞書部２には、仮名
漢字変換辞書インデックス記憶部３に記憶された位置情
報と対応して、図７に示す仮名漢字変換辞書部２のよう
に、また、日本語解析辞書部６には、日本語解析辞書イ
ンデックス記憶部７に記憶された位置情報と対応して、
図８に示す日本語解析辞書部６のように記憶されてい
る。

【００４５】次に、ユーザが入力部１により仮名文字列
を入力する（Ｓ３、入力ステップ）。入力された文字列
は、仮名漢字変換部５を介して、また文節ごとに変換す
る場合は、ユーザの介在を経て（Ｓ４）、漢字へ変換さ
れる。この際、入力された文字列に対する仮名漢字変換
辞書部２の検索を行い（Ｓ５）、インデックス情報マー
ジステップによりマージされた、仮名漢字変換辞書部２
へのインデックスに基づいて、仮名漢字変換辞書部２か
ら、検索に成功した語彙情報を随時取り出しながら（Ｓ
６、仮名漢字情報取得ステップ）、仮名漢字変換部５が
入力された仮名文字列を漢字へと変換することを行う
（Ｓ７、仮名漢字変換ステップ）。

【００４６】次に、ユーザが入力部１により日本語解析
指示を行うと（Ｓ８）、入力された文字列に対する日本
語解析辞書部６の検索を行い（Ｓ９）、インデックス情
報マージステップによりマージされた、日本語解析辞書
へのインデックスに基づいて、日本語解析辞書部６か
ら、検索に成功した語彙情報を随時取り出しながら（Ｓ
１０、日本語解析情報取得ステップ）、日本語解析部９
が仮名漢字変換部５より得られるを仮名漢字混じり文字
列の構文・意味解析を行う（Ｓ１１、日本語解析ステッ
プ）。

【００４７】最終的に図７のような構造を表示部１２に
表示することにより日本語解析処理を終了する。

【００４８】以上のように、本実施の形態によれば、仮
名漢字変換辞書部２、日本語解析辞書部６に対するイン
デックスキーである日本語文字列を共有することができ
るため、本発明の日本語解析装置の動作時におけるメモ
リ使用量を大幅に削減することがでる。

【００４９】（実施の形態２）上記第一の実施の形態に
おいて、仮名漢字変換辞書部２から取得した語彙情報
を、日本語解析部９において利用することにより、日本
語解析時におけるメモリ使用量の削減、およびデータ取
得時間の短縮が可能であり、この動作を図３のフローチ
ャートを用いて説明する。

【００５０】第二の実施の形態では、第一の実施の形態
で示したようにＳ１からＳ７を介して、仮名文字列の入
力から仮名漢字変換までが行われた状態であるとする。

【００５１】ここで、仮名漢字変換部５は、変換後の仮
名漢字混じり文字列と共に、仮名漢字変換に際して、使
用した語彙情報も同時に、日本語解析辞書部６へ渡す。
日本語解析部９では日本語辞書検索に際して、渡された
語彙情報が解析に必要な情報を含んでいるか否かを、渡
された語彙情報の内の、品詞などの文法的情報から判断
し（Ｓ８）、含んでいない単語に対してだけ、日本語解
析辞書検索を行い（Ｓ９）、日本語解析辞書部６から語
彙データを取り出す（Ｓ１０）。そして、日本語解析部
９はこの語彙情報を使い、構文・意味解析を行い（Ｓ１
１）、結果を表示する。

【００５２】以上のように、本実施の形態によれば、日
本語解析の辞書検索において、仮名漢字変換時に取得し
た語彙情報を利用することにより、辞書検索回数の削
減、すなわち日本語解析の勝利効率の向上と、日本語解
析辞書部６より取り出す語彙情報の重複を防ぐ、すなわ
ちメモリ使用量の削減が可能となる。

【００５３】（実施の形態３）上記第一の実施の形態に
おいて、仮名漢字変換部５が仮名漢字変換に際して行っ
た解析処理を、日本語解析部９において利用することに
より、日本語解析時における処理効率の向上が可能であ
り、この動作を図３のフローチャートを用いて説明す
る。

【００５４】第三の実施の形態では、第一の実施の形態
で示したようにＳ１からＳ７を介して、仮名文字列の入
力から仮名漢字変換までが行われた状態であるとする。
ここで、仮名漢字変換部５は、変換後の仮名漢字混じり
文字列と共に、仮名漢字変換に際して、使用した構文解
析結果も同時に、日本語解析部９に渡す。この際、ユー
ザが文節ごとの仮名漢字変換を行ったのであれば、文節
毎に変換した結果を、一文を入力したのであればその結
果を日本語解析部９に渡す。

【００５５】次に日本語解析部９は、仮名漢字変換部５
より渡された仮名漢字文字列に対して、日本語解析辞書
部６を辞書検索し、検索に成功した単語の語彙情報を日
本語解析辞書部６から取り出す。取り出された語彙情報
を基に、仮名漢字変換部５から渡された解析情報を、日
本語解析の過渡状態において利用する。例えば、仮名漢
字変換部５より渡された解析結果が次のような形で文節
毎に渡されたものとする。

【００５６】名詞句→名詞（彼）＋助詞（は）名詞句→名詞（頭）＋助詞（が）述部→形容詞（すばらしい）ここで、Ａ→Ｂという表記は、右辺に示された語がまと
まって、左辺に示す文法的なまとまりとなる句を構成す
るという意味である。

【００５７】日本語解析部９は、上記の結果を文節とし
てより上位の文としてのまとめ上げを行い、さらに意味
解析を行う。

【００５８】また、仮名漢字変換部５より渡された解析
結果が次のような形で文として渡されたとる。

【００５９】文→名詞句（彼は）＋名詞句（頭が）＋述
部（すばらしい）日本語解析部９は、この結果を基に述部に対する意味解
析を行う。

【００６０】以上のように、本実施の形態によれば、仮
名漢字変換部５が仮名漢字変換処理を行った際の構文解
析結果を、日本語解析部９が再利用することにより、日
本語解析における、解析の処理フェーズをスキップする
ことができるため、解析処理速度の向上が望める。

【００６１】

【発明の効果】以上のように本願発明は、仮名文字の入
力、仮名漢字変換および日本語構文解析の開始指示を行
う入力部と、仮名文字に対応する漢字とその品詞や構文
情報を記憶した仮名漢字変換辞書部と、仮名漢字変換辞
書部に記憶された単語の語彙情報の記憶位置を格納した
仮名漢字変換辞書インデックス記憶部と、仮名漢字変換
辞書インデックス記憶部を介して、取得要求のあった単
語の語彙情報を、仮名漢字変換辞書部から取り出す仮名
漢字情報取得部と、仮名漢字情報取得部より得られた単
語語彙情報を基に、入力された仮名文字を漢字コードへ
変換する仮名漢字変換部と、単語に対する読みや発音、
品詞や文法情報、意味情報を記憶した日本語解析辞書部
と、日本語解析辞書部に記憶された単語の語彙情報の記
憶位置を格納した日本語解析辞書インデックス記憶部
と、日本語解析辞書インデックス記憶部を介して、取得
要求のあった単語の語彙情報を、日本語解析辞書部から
取り出す日本語解析情報取得部と、仮名漢字情報取得部
より得られた単語語彙情報を基に、仮名漢字変換部より
得られた仮名漢字混じり文を日本語形態素解析、構文・
意味解析を行う日本語解析部と、仮名漢字変換辞書イン
デックス記憶部と、日本語解析辞書インデックス記憶部
におけるインデックス情報を統合するインデックス情報
統合部と、仮名漢字変換辞書部のインデックス、日本語
解析辞書部のインデックスや、仮名漢字変換、及び日本
語解析時における解析を記憶した解析情報記憶部と、日
本語解析結果を表示する表示部と、を有する構成とした
ものであり、仮名漢字変換装置が既に組み込まれた情報
機器装置に、新に日本語解析装置を組み込んで、仮名漢
字変換装置への入力である仮名情報を日本語解析の語義
決定処理に利用する場合の、メモリ使用量の削減を図る
ことができる。

【００６２】また、入力部により仮名文字が入力され、
仮名漢字変換部が仮名文字を漢字へ変換した仮名漢字文
字列を日本語解析部へ渡す際に、仮名漢字情報取得部が
仮名漢字辞書部から取得した語彙情報も同時に渡し、日
本語解析部が日本語解析辞書を検索する際に、仮名漢字
変換部から渡された単語の語彙情報との間に重複する情
報が存在するか否かを判断し、重複が存在する場合に
は、日本語解析情報取得部は日本語解析辞書から取得す
る情報から重複を取り除いて語彙情報の差分情報だけを
取得する構成としたものであり、仮名漢字変換装置が既
に組み込まれた情報機器装置に、新に日本語解析装置を
組み込んで、仮名漢字変換装置への入力である仮名情報
を日本語解析の語義決定処理に利用する場合に、辞書デ
ータをメモリ上に取り出す際のメモリ使用量の増加を抑
制するとともに、辞書データ取得時間を短縮できる。

【００６３】さらに、入力部により仮名文字が入力さ
れ、仮名漢字変換部が仮名文字を漢字へ変換した仮名漢
字文字列を日本語解析部へ渡す際に、仮名漢字変換部が
仮名文字列を漢字に変換する場合行った解析結果をも同
時に渡し、日本語解析部はこの解析情報を用いて、仮名
漢字変換部が出力した仮名漢字混じり文を構文・意味解
析する構成としたものであり、日本語解析装置が仮名漢
字変換から渡された構文解析結果を再利用して、余分な
構文解析・意味解析を行わないため、日本語解析装置に
おける処理時間の短縮を図ることができる

【図面の簡単な説明】

【図１】本発明の第１の実施の形態におけるデータ登録
装置及び翻訳装置の機能ブロック図

【図２】同実施の形態におけるデータ登録装置及び翻訳
装置の回路ブロック図

【図３】同実施の形態における日本語解析装置の動作を
示すフローチャート

【図４】同実施の形態における仮名漢字変換辞書インデ
ックス記憶部の様子を示した図

【図５】同実施の形態における日本語解析辞書インデッ
クス記憶部の様子を示した図

【図６】同実施の形態における解析情報記憶部の様子を
示した図

【図７】同実施の形態における仮名漢字変換辞書部の様
子を示した図

【図８】同実施の形態における日本語解析辞書部の様子
を示した図

【図９】日本語解析結果の構文・意味構造を示した図

【図１０】日本語解析結果の構文・意味構造を示した図

【符号の説明】

１入力部２仮名漢字変換辞書部３仮名漢字変換辞書インデックス記憶部４仮名漢字情報取得部５仮名漢字変換部６日本語解析辞書部７日本語解析辞書インデックス記憶部８日本語解析情報取得部９日本語解析部１０インデックス情報マージ部１１解析情報記憶部１２表示部１３制御部１４キーボード１５ＣＲＴ１６ＣＰＵ１７ＲＡＭ１８ＲＯＭ

Claims

【特許請求の範囲】

【請求項１】仮名文字の入力、仮名漢字変換および日本
語構文解析の開始指示を行う入力部と、仮名文字に対応
する漢字とその品詞や構文情報を記憶した仮名漢字変換
辞書部と、前記仮名漢字変換辞書部に記憶された単語の
語彙情報の記憶位置を格納した仮名漢字変換辞書インデ
ックス記憶部と、前記仮名漢字変換辞書インデックス記
憶部を介して、取得要求のあった単語の語彙情報を、前
記仮名漢字変換辞書部から取り出す仮名漢字情報取得部
と、前記仮名漢字情報取得部より得られた単語語彙情報
を基に、入力された仮名文字を漢字コードへ変換する仮
名漢字変換部と、単語に対する読みや発音、品詞や文法
情報、意味情報を記憶した日本語解析辞書部と、前記日
本語解析辞書部に記憶された単語の語彙情報の記憶位置
を格納した日本語解析辞書インデックス記憶部と、前記
日本語解析辞書インデックス記憶部を介して、取得要求
のあった単語の語彙情報を、前記日本語解析辞書部から
取り出す日本語解析情報取得部と、前記仮名漢字情報取
得部より得られた単語語彙情報を基に、前記仮名漢字変
換部より得られた仮名漢字混じり文を日本語形態素解
析、構文・意味解析を行う日本語解析部と、前記仮名漢
字変換辞書インデックス記憶部と、前記日本語解析辞書
インデックス記憶部におけるインデックス情報を統合す
るインデックス情報統合部と、前記仮名漢字変換辞書部
のインデックス、前記日本語解析辞書部のインデックス
や、仮名漢字変換、及び日本語解析時における解析を記
憶した解析情報記憶部と、日本語解析結果を表示する表
示部と、を有することを特徴とする日本語解析装置。
【請求項２】入力部により仮名文字が入力され、仮名漢
字変換部が仮名文字を漢字へ変換した仮名漢字文字列を
日本語解析部へ渡す際に、仮名漢字情報取得部が仮名漢
字辞書部から取得した語彙情報も同時に渡し、日本語解
析部が日本語解析辞書部を検索する際に、仮名漢字変換
部から渡された単語の語彙情報との間に重複する情報が
存在するか否かを判断し、重複が存在する場合には、日
本語解析情報取得部は日本語解析辞書部から取得する情
報から重複を取り除いて語彙情報の差分情報だけを取得
することを特徴とする請求項１記載の日本語解析装置。
【請求項３】入力部により仮名文字が入力され、仮名漢
字変換部が仮名文字を漢字へ変換した仮名漢字文字列を
日本語解析部へ渡す際に、仮名漢字変換部が仮名文字列
を漢字に変換する場合行った解析結果をも同時に渡し、
日本語解析部はこの解析情報を用いて、仮名漢字変換部
が出力した仮名漢字混じり文を構文・意味解析すること
を特徴とする請求項１記載の日本語解析装置。
【請求項４】仮名文字の入力、仮名漢字変換および日本
語構文解析の開始指示を行う入力ステップ、前記入力ス
テップにより入力された仮名文字を、仮名漢字変換辞書
インデックス記憶部を介して、取得要求のあった単語の
語彙情報を、前記仮名漢字変換辞書部から取り出す仮名
漢字情報取得ステップ、前記仮名漢字情報取得ステップ
より得られた単語語彙情報を基に、入力ステップより入
力された仮名文字を漢字コードへ変換する仮名漢字変換
ステップと、前記仮名漢字変換ステップにより変換され
た仮名漢字混じり文字列を、日本語解析辞書インデック
ス記憶部を介して、取得要求のあった単語の語彙情報
を、前記日本語解析辞書部から取り出す日本語解析情報
取得ステップ、前記日本語解析情報取得ステップにより
得られた単語の語彙情報を基に、仮名漢字変換ステップ
により変換された仮名漢字混じり文字列を構文・意味解
析する日本語解析ステップ、前記仮名漢字変換辞書イン
デックス記憶部と、前記日本語解析辞書インデックス記
憶部におけるインデックス情報を統合するインデックス
情報統合ステップと、を有することを特徴とする日本語
解析方法。
【請求項５】入力ステップにより仮名文字が入力され、
仮名漢字変換ステップが変換した仮名漢字文字列を日本
語解析ステップへ渡す際に、仮名漢字情報取得ステップ
が仮名漢字辞書部から取得した語彙情報も同時に渡し、
日本語解析ステップが日本語解析辞書部を検索する際
に、仮名漢字変換ステップから渡された単語の語彙情報
との間に重複する情報が存在するか否かを判断し、重複
が存在する場合には、日本語解析辞書部から取得する情
報から重複を取り除いて語彙情報の差分情報だけを取得
する日本語解析情報取得ステップと、を有することを特
徴とする請求項４記載の日本語解析方法。
【請求項６】入力ステップにより仮名文字が入力され、
仮名漢字変換ステップが変換した仮名漢字文字列を日本
語解析ステップへ渡す際に、仮名漢字変換ステップが仮
名文字列を漢字に変換する場合行った解析結果をも同時
に渡し、日本語解析ステップはこの解析情報を用いて、
仮名漢字変換ステップが出力した仮名漢字混じり文を構
文・意味解析する日本語解析ステップと、を有すること
を特徴とする請求項４記載の日本語解析方法。
【請求項７】仮名文字の入力、仮名漢字変換および日本
語構文解析の開始指示を行う入力ステップ、前記入力ス
テップにより入力された仮名文字を、仮名漢字変換辞書
インデックス記憶部を介して、取得要求のあった単語の
語彙情報を、前記仮名漢字変換辞書部から取り出す仮名
漢字情報取得ステップ、前記仮名漢字情報取得ステップ
より得られた単語語彙情報を基に、入力ステップより入
力された仮名文字を漢字コードへ変換する仮名漢字変換
ステップと、前記仮名漢字変換ステップにより変換され
た仮名漢字混じり文字列を、日本語解析辞書インデック
ス記憶部を介して、取得要求のあった単語の語彙情報
を、前記日本語解析辞書部から取り出す日本語解析情報
取得ステップ、前記日本語解析情報取得ステップにより
得られた単語の語彙情報を基に、仮名漢字変換ステップ
により変換された仮名漢字混じり文字列を構文・意味解
析する日本語解析ステップ、前記仮名漢字変換辞書イン
デックス記憶部と、前記日本語解析辞書インデックス記
憶部におけるインデックス情報を統合するインデックス
情報統合ステップと、を有することを特徴とする日本語
解析プログラムを記録した記録媒体。
【請求項８】入力ステップにより仮名文字が入力され、
仮名漢字変換ステップが変換した仮名漢字文字列を日本
語解析ステップへ渡す際に、仮名漢字情報取得ステップ
が仮名漢字辞書部から取得した語彙情報も同時に渡し、
日本語解析ステップが日本語解析辞書部を検索する際
に、仮名漢字変換ステップから渡された単語の語彙情報
との間に重複する情報が存在するか否かを判断し、重複
が存在する場合には、日本語解析辞書部から取得する情
報から重複を取り除いて語彙情報の差分情報だけを取得
する日本語解析情報取得ステップと、を有することを特
徴とする請求項４記載の日本語解析プログラムを記録し
た記録媒体。
【請求項９】入力ステップにより仮名文字が入力され、
仮名漢字変換ステップが変換した仮名漢字文字列を日本
語解析ステップへ渡す際に、仮名漢字変換ステップが仮
名文字列を漢字に変換する場合行った解析結果をも同時
に渡し、日本語解析ステップはこの解析情報を用いて、
仮名漢字変換ステップが出力した仮名漢字混じり文を構
文・意味解析する日本語解析ステップと、を有すること
を特徴とする請求項４記載の日本語解析プログラムを記
録した記録媒体。