JPH04211867A - 日本語構文解析システム - Google Patents
日本語構文解析システムInfo
- Publication number
- JPH04211867A JPH04211867A JP2315228A JP31522890A JPH04211867A JP H04211867 A JPH04211867 A JP H04211867A JP 2315228 A JP2315228 A JP 2315228A JP 31522890 A JP31522890 A JP 31522890A JP H04211867 A JPH04211867 A JP H04211867A
- Authority
- JP
- Japan
- Prior art keywords
- particle
- japanese
- conjunctive
- sentence
- nominative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
め要約のデータは記録されません。
Description
造を機械的に解析する日本語構文解析システムに関する
。
等の文法情報や他の語からの係りの可能性を制御する為
の意味制約情報等を手がかりに、句構造の係り受け関係
が抽出されている。その際、一般に名詞、形容詞、動詞
、副詞などの品詞に属する単語は互いの係りに対する強
い意味制約をもつため、それぞれの単語辞書項目内に、
自分への係りが可能な相手方の単語の意味の範囲を定義
しておくことができる。従ってこれらの品詞に属する単
語間の係り受け関係の判定は、上記方法で行える場合が
多い。
語との間の係りに対して意味的な制約をもたず、品詞的
に許される任意の語からの係りを許し、又、自分も任意
の語に係ってゆくことができる。従って、助詞に関する
係り受け関係の判定や句構造の抽出は助詞そのものでは
なく、助詞をはさんで存在する名詞と名詞(連体助詞の
場合)、名詞と動詞(格助詞の場合)の間の意味制約関
係に注目して行われる。
場合には、それをはさんで存在する述語と述語の間の意
味制約関係を意味素性のような簡便な意味データで記述
することは不可能であり、単語辞書内にそうした意味制
約情報を記載しておくことができない。この為、現在の
解析技術では、例えば文中に接続詞で連結された複数の
文や連体修飾節を含む複文においては、有効な解析手段
がなく、正しい解析を行うことができない(ここで、連
体修飾節とは述語の後に名詞句が位置し、該名詞句を修
飾するような節をいう)。従って、予め複文を人手を介
して短く分解したり、接続助詞の係りを人手で指定する
等の処理を行う必要があり、この点が日本語の自動解析
の妨げとなっている。こうしたことから現在、知識ベー
スを利用して、述語間(言いかえると、節間、命題間)
の可能な論理関係を知識として蓄えておき、これを述語
句の係り受け関係の判定に利用しようとする方法が検討
されている。しかしながら、こうした知識ベースは通常
極めて大規模なものとなり、又、知識の抽出も容易では
ない為、実用化されるまでには、多くの困難が予想され
る。
は、複文になると接続助詞の正確な係り受け制御ができ
ず、この為人手を介して複文を短く切ったり、接続助詞
の係りを人が指定する等の処理が必要であるという問題
点があった。
方法でも、知識ベースが極めて大規模となることから実
用的でないという欠点があった。
を介することなく効率的に自動解析することのできる日
本語構文解析システムを提供することを目的とする。
日本語複文に対して形態素解析処理を行い、該日本語複
文の係り受け構造を解析する日本語構文解析システムに
おいて、上記形態素解析により得られた各単語の文法情
報及び意味情報を利用し解析規則に従って単語相互の係
り受け関係を判定し、単語間の係り受け関係を表す解析
木を作成する局所的構文解析部と、上記局所的構文解析
部によって作成された係り受け関係を表わす解析木を分
析し、所定の解析規則に従って上記日本語複文における
接続助詞及び主格助詞の係り先を判定し、上記解析木を
修正する大域的構文解析部とを備えたことを特徴とする
。
部によって作成された係り受け関係を表す解析木により
示される日本語複文が予め定められた所定パターンの日
本語複文に該当する場合に、該日本語複文の各接続助詞
及び主格助詞の係り先を判定し、上記解析木を修正する
ことを特徴とする。
係り受け関係を表す解析木により示される日本語複文が
、■接続助詞で連結された3つ以上の文を有する複文、
■接続助詞の後に連体修飾節を含む複文、■主格助詞の
後に接続助詞で連結された複数の文を有する複文、■主
格助詞の後に連体修飾節を有する複文の4つのパターン
のうち何れかに該当する場合に、大域的構文解析部が上
記日本語複文の構造的特徴に基づいて上記日本語複文中
の各接続助詞及び主格助詞の係り先を判定し、上記解析
木を修正することを特徴とする。
れた3つ以上の文を有する日本語複文に対し、接続助詞
の種類、又は各述語に対する主語の共通性に基づいて上
記日本語複文における接続助詞の係り先を判定すること
を特徴とする。
む日本語複文に対し、接続助詞の種類、連体修飾節の種
類、注目する述語に係る格助詞の種類、先行詞の共通性
、又は各述語に対する主語の共通性に基づいて上記日本
語複文における接続助詞の係り先を判定することを特徴
とする。
れた3つ以上の文を有する日本語複文に対し、接続助詞
の種類、又は各述語に対する主語の共通性に基づいて上
記日本語複文における接続助詞の係り先を判定し、連体
修飾節を含む日本語複文に対し、接続助詞の種類、連体
修飾節の種類、注目する述語に係る格助詞の種類、先行
詞の共通性、又は各述語に対する主語の共通性に基づい
て上記日本語複文における接続助詞の係り先を判定する
ことを特徴とする。
続助詞で連結された複数の文を有する日本語複文に対し
、上記主格助詞の種類、上記接続助詞の種類、又は各述
語に対する主語の共通性に基づいて上記日本語複文にお
ける上記主格助詞の係り先を判定することを特徴とする
。
れた3つ以上の文を有する日本語複文に対し、接続助詞
の種類、又は各述語に対する主語の共通性に基づいて上
記日本語複文における接続助詞の係り先を判定し、主格
助詞の後に接続助詞で連結された複数の文を有する日本
語複文に対し、上記主格助詞の種類、上記接続助詞の種
類、又は各述語に対する主語の共通性に基づいて上記日
本語複文における上記主格助詞の係り先を判定すること
を特徴とする。
日本語複文に対し、接続助詞の種類、連体修飾節の種類
、注目する述語に係る格助詞の種類、先行詞の共通性、
又は各述語に対する主語の共通性に基づいて上記日本語
複文における接続助詞の係り先を判定し、主格助詞の後
に接続助詞で連結された複数の文を有する日本語複文に
対し、上記主格助詞の種類、上記接続助詞の種類、又は
各述語に対する主語の共通性に基づいて上記日本語複文
における上記主格助詞の係り先を判定することを特徴と
する。
された3つ以上の文を有する日本語複文に対し、接続助
詞の種類、又は各述語に対する主語の共通性に基づいて
上記日本語複文における接続助詞の係り先を判定し、連
体修飾節を含む日本語複文に対し、接続助詞の種類、連
体修飾節の種類、注目する述語に係る格助詞の種類、先
行詞の共通性、又は各述語に対する主語の共通性に基づ
いて上記日本語複文における接続助詞の係り先を判定し
、主格助詞の後に接続助詞で連結された複数の文を有す
る日本語複文に対し、上記主格助詞の種類、上記接続助
詞の種類、又は各述語に対する主語の共通性に基づいて
上記日本語複文における上記主格助詞の係り先を判定す
ることを特徴とする。
連体修飾節を有する日本語複文に対し、上記主格助詞の
種類、上記連体修飾節の種類、又は各述語に対する主語
の共通性に基づいて上記日本語複文における上記主格助
詞の係り先を判定することを特徴とする。
明する。
ロック図を示す。
、データ格納部として品詞間連接テーブル11と品詞マ
トリックステーブル12及び日本語辞書部21とを有し
てなる。
析部3と、大域的構文解析部4からなる。
割し、該単語に単語の持つ文法情報及び意味情報を付加
する形態素解析処理を行う。
各単語の文法情報及び意味情報を利用し解析規則に従っ
て単語相互の係り受け関係を判定し、単語間の係り受け
関係を表す解析木を作成する構文解析処理を行う。
する場合に上記解析木を解析し、日本語複文の構造的特
徴に基づく所定の解析規則に従って上記日本語複文の接
続助詞及び主格助詞の係り先を判定し、上記解析木を修
正する。
析規則には、各述語が係る接続助詞相互の意味関係に基
づく規則、各述語が作る埋め込み文と接続助詞との間に
存在する係り受け関係に関する規則、主格助詞と埋め込
み文との間に存在する係り受け関係に関する規則、各述
語の主語共通性に関する規則がある。
れた3つ以上の文を有する複文、■接続助詞の後に連体
修飾節を含む複文、■主格助詞の後に接続助詞で連結さ
れた複数の文を有する複文、■主格助詞の後に連体修飾
節を有する複文の4つのパターンに分類する。そして、
局所的構文解析部3により作成された部分解析木により
示される日本語文が上記4つのパターンのいずれかに該
当する場合に、大域的構文解析部4が、各パターンの複
文ごとに特定された解析処理により上記部分解析木の分
析、修正を行う。以下に上記日本語複文の4つのパター
ンを模式的に示す。
述語]…… ■…[述語][接続助詞]…… …[述語][名詞][格助詞]…[述語]……[述語]
…… …[述語]…… 次に、具体的な解析処理例を数例挙げて各処理内容を詳
しく説明する。
事が出されると、ペロッと食べてしまった。”という日
本語複文を解析処理する場合について説明する。本例文
は、上述した日本語複文のパターンのうち第1パターン
に該当する。
記例文を次のように単語に分解する。
/出される/と/ペロッと/食べてしまった。/ なお、本実施例において、形態素解析部2による形態素
解析処理は、最長一致法等の従来用いられている方法が
用いられる。
単語の品詞、意味素性、格等の文法情報及び意味情報が
登録されている。分割された各単語には、上記日本語辞
書部21からその単語の文法情報及び意味情報が付加さ
れ、次の局所的構文解析部3の構文解析処理に移される
。
分割して得た単語を2語づつ取り出して係り受けの判別
を行う。この係り受けの判別は、係られる語と係る語の
品詞の組み合わせに応じて解析規則を記述した第3図に
示すような品詞マトリックステーブル12に基づいて行
う。
る規則を品詞マトリックステーブル12から取り出し係
り受けが成立するかどうかを判別する。上記品詞マトリ
ックステーブル12には、係りが可能な品詞の組合せご
とに、各品詞に対応する単語間の係り受けの可否を判定
するための規則が規定されている。なお、2つの単語は
、文頭から順に選択するものとする。これは、日本語に
おいては、原則として文の後方にある語が前方にある語
に係ることはないことによる。
語について第4図(a)に示すような部分解析木を作成
する。以上の処理はバッファ41内にて行う。
1に格納していく。例えば、上記“彼”と“は”では、
係り受けが成立して、“彼−は”という部分解析木が作
られたので、第4図(b)のようにスタック31に入れ
る。次に、“は”と“丈夫な”に着目すると、係り受け
が成立しないので、“丈夫な”は第4図(c)のように
スタック31に格納される。このスタック31には、後
入れ先出し型のスタックが用いられている。以下同様に
して係り受けが成立する単語の組ごとに部分解析木を作
成して第4図(d)乃至第5図(m)に示すようにスタ
ック31に入れる。
は”の係り受け関係は、局所的構文解析部3による解析
の後、大域的構文解析部4による解析を経て最終的な判
断がなされる。例えば、第4図(h)において格助詞“
は”と動詞“持っている”とに着目すると、係り受け関
係が成立する。そこで第4図(i)のような部分解析木
を作成してスタック31に格納する。また、第5図(g
)においても、接続助詞“て”と動詞“出される”との
間では係り受け関係が成立し、第5図(h)のような部
分解析木を作成する。
分解析木とバッファ41に格納されている部分解析木の
組合せは、上述した日本語複文のパターンのうち第3の
パターンに該当し、大域的構文解析部4による解析処理
がなされる。
る”でよいのかどうかを判定する為に、“は”と接続助
詞“て”との係り受けに関する性質と、“て”の後にあ
る動詞“出される”と“彼は”との意味制約関係とに着
目して係り受け関係が判断される。すなわち、“は”は
“て”の前の述語には係れないという性質をもつが、“
出される”の主語は“食事”が既に占めており“彼は”
はそこには係って行けないこと、又、もともと“彼は”
は“出される”の主語にはなれないこと、等の判断が順
次行われ、結果として部分解析木は第5図(h)のまま
でよいと判定される。
べてしまった”とに着目して解析を行う場合、この部分
は上述した日本語複文のパターンのうち第1のパターン
に該当し、大域的構文解析部4による解析処理がなされ
る。
た”とに着目して係り受け関係が判断される。この場合
、接続助詞“て”と“と”の間の、係り受けに関する性
質により、“て”の係り先は動詞“持っている”“出さ
れる”“食べてしまった”の主語の共通性に依存するこ
とがわかる。そこで、動詞“持っている”、“出される
”、“食べてしまった”の各々の主語を比較すると、“
持っている”と“食べてしまった”では共に“彼”が主
語となる。そこで、動詞“持っている”が係る接続助詞
“て”と動詞“出される”の係りを切断し、“て”以下
の部分解析木をスタック31に入れる。
に着目すると、この部分は上述の第3のパターンの日本
語複文に該当し、さらに大域的構文解析部4による解析
処理がなされる。
べてしまった”の主語“彼”と一致しないので“食事が
”は“出される”に係ったままにしておく。
局所的構文解析部3に処理がもどり、“と”を“食べて
しまった”にかける。この結果第6図(a)のような部
分解析木が作成される。
着目すると両動詞の主語は共に“彼”をとることができ
る。又、主格助詞“は”と接続助詞“て”の間の係り受
けに関する関係に注目すると、“て”の前の述語には“
は”は係れない、という性質があるため、“彼は”を“
持っている”から“食べてしまった”にかけ変える。但
し“彼は”が“持っている”に係っていたことは記憶し
ておく。
った”にかけて第6図(b)のような解析木を作成する
。以上で本例文についての解析処理を終了する。
のものに限るものではなく、日本語文を単語に分解して
文法情報や意味情報等を付加するものであれば何でもよ
い。
げると、それをすぐに売ってしまった。”という日本語
複文を解析処理する場合について説明する。本例文も第
1解析処理例と同様に第1のパターンの日本語複文に該
当する。
が単語ごとに分解され、各単語について局所的構文解析
部3により係り受け関係の判定及び部分解析木の作成が
行われる。以上の処理動作は第1解析処理例と同様なの
で、説明を省略し、ここでは部分解析木が第7図(a)
のように作成された後の処理について説明する。
パターンのうち第1のパターンに該当し、大域的構文解
析部4による解析処理がなされる。
た”とに着目して係り受け関係が判断される。この場合
、接続助詞“て”と“と”の間の係り受けに関する性質
により“て”の係り先は動詞における主語の共通性に依
存する。そこで、動詞“買われる”、“上げる”、“売
ってしまった”の各々の主語を比較すると、“買われる
”と“上げる”の主語は共に“自社株”をとることがで
きる。これに対して“売ってしまった”は自社株”を主
語にとることができない。そこで“て”の係り先は“上
げる”でよいと判定し、係りをそのままにしておく。
着目すると、この部分は上述の第3パターンの日本語複
文に該当し、さらに大域的構文解析部4による処理がな
される。
較すると、“自社株”は“売ってしまった”に係れない
ことがわかるので“自社株”の係りもそのままにしてお
く。以上で大域的構文解析部4の処理を終え、局所的構
文解析部3にもどり、“と”が“売ってしまった”にか
けられて、第7図(b)のような部分解析木を作成する
。
(c)のような解析木を作成し、本例文についての解析
処理を終了する。
て”の係り先に着目して比較すると、各例文は同一の文
型を有しながら、接続助詞“て”の係る動詞の位置が異
なっている。このような場合でも本実施例の日本語構文
解析システムによれば節又は句の係り受け構造を正しく
判断することができる。
受け取った。”という日本語複文を解析処理する場合に
ついて説明する。本例文は上述した日本語複文のパター
ンのうち第2のパターンに該当する。
が単語ごとに分解され、各単語について局所的構文解析
部3により係り受け関係の判定及び部分解析木の作成が
行われる。以上の処理動作は第1解析処理例と同様なの
で説明を省略し、ここでは部分解析木が第8図(a)の
ように作成された後の処理について説明する。
パターンのうち第2のパターンに該当し、大域的構文解
析部4による解析処理がなされる。ここでは格助詞“を
”を動詞“受け取った”にかけた際、接続助詞“て”が
“注文した”と“受け取った”の何れに係るかを判断す
る。
、ここでは目的格関係節となっている。
るか否か検査する。ここでは“は”が係っているため、
接続助詞“て”は目的格関係節“注文した本”に係るこ
とができないという結論を得る。これに基づいて格助詞
“を”に係る部分解析木のうち“て”と“行く”とを切
離し、“て”に係る部分解析木をスタック31に入れる
。そして“を”を動詞“受け取った”にかけて第8図(
b)に示すような部分解析木を作成する。
は“受け取った”に係ることができる。ここで、“て”
には格助詞“は”が係っていることから、この文章が上
述した日本語複文のパターンのうち第3のパターンに該
当することがわかり、大域的構文解析部4による解析処
理がなされる。
動詞“行く”と“受け取った”との主語の共通性に基づ
いて係り受け関係が判断されるが、“は”は“て”の前
の述語には係れないという性質を有すること、及び“行
く”と“受け取った”の主語は“彼”で共通することか
ら“彼は”を“行く”から切離して“受け取った”にか
け変える。但し、“彼は”が“行く”に係っていたこと
は記憶しておく。
、本例文についての解析処理を終了する。
が失くした。”という日本語複文を解析処理する場合に
ついて説明する。本例文は第3処理例と同様に第2のパ
ターンの日本語複文に該当する。
が単語ごとに分解され、各単語について局所的構文解析
部3により係り受け関係の判定及び部分解析木の作成が
行われる。以上の処理動作は第1解析処理例と同様なの
で説明を省略し、ここでは部分解析木が第9図(a)の
ように作成された後の処理について説明する。
パターンのうち第2のパターンに該当し、大域的構文解
析部4による解析処理がなされる。ここでは格助詞“を
”を動詞“失くした”にかけた際、接続助詞“て”が動
詞“買った”と“失くした”の何れに係るかを判断する
。
ここでは目的格関係節となっている。
か否かを検査する。ここではこれらの何れも“行く”に
係っていないため、“て”が“買った”と“失くした”
の何れに係るか判定できない。そのため、さらに先行詞
の共通性、各動詞“行く”“買った”“失くした”の主
語の共通性を順次検査する。ここでは先行詞が共通でな
い(即ち“彼が丸善に行く本”という文は成立たない)
ため、“て”の係り先の判断は各動詞の主語の共通性に
依存する。
“買う”の主語は“彼が”で共通し、“失くした”には
既に“私が”が主語として係っていることから“彼が”
は係ることができず一致しない。これより、“て”は“
買う”に係り、“失くした”には係らないことがわかる
ので、“て”を“買う”にかけたままにしておく。
の文章が上述した日本語複文のパターンのうち第3のパ
ターンに該当することがわかり、大域的構文解析部4に
よる解析処理がなされる。
動詞“行く”と“買った”との主語の共通性に基づいて
係り受け関係が判断されるが、“が”は、“て”の前の
述語と、“て”が係っていく先の述語との間の主語の共
通性によって、どちらの述語に係るかが決まるという性
質を有すること、及び“行く”と“買った”の主語は“
彼”で共通することから“彼が”を“行く”から切離し
て“買った”にかけ変える。但し、“彼が”が“行く”
に係っていたことは記憶しておく。
、本例文についての解析処理を終了する。
て”に着目して比較すると、各例文は同一の文型を有し
ながら、接続助詞“て”の係る動詞の位置が異なってい
る。このような場合でも本実施例の日本語構文解析シス
テムによれば節又は句の係り受け構造を正しく判断する
ことができる。
。”という日本語複文を解析処理する場合について説明
する。本例文は上述した日本語複文のパターンのうち第
3のパターンに該当する。
が単語ごとに分解され、各単語について局所的構文解析
部3により係り受け関係の判定及び部分解析木の作成が
行われる。以上の処理動作は第1解析処理例と同様なの
で説明を省略し、ここでは部分解析木が第10図(a)
のように作成された後の処理について説明する。
語複文に該当し、大域的構文解析部4による解析処理が
なされる。ここでは接続助詞“が”を動詞“落ちた”に
かけた際、主格助詞“は”が“尽くした”と“落ちた”
の何れに係るかを判断する。
接続助詞“が”の組合せ、動詞“尽くした”と“落ちた
”の主語の共通性を順次検査する。この場合、“は”と
“が”の組合せのみでは、“は”が“が”の前の動詞に
係るのかあるいは“が”を越えてその後ろの動詞に係る
のか決定することができないので、“は”の係り先の判
断は各動詞の主語の共通性に依存する。
”も“落ちた”も共に“彼”を主語とすることがわかり
、この結果から、“彼は”を“落ちた”にかけ変える。
しておく。
析部3の処理にもどり、“が”を“落ちた”にかけて第
10図(b)のような解析木を作成し、本例文について
の解析処理を終了する。
った。”という日本語複文を解析処理する場合について
説明する。本例文は第5処理例と同様に第3のパターン
の日本語複文に該当する。
が単語ごとに分解され、各単語について局所的構文解析
部3により係り受け関係の判定及び部分解析木の作成が
行われる。以上の処理動作は第1解析処理例と同様なの
で説明を省略し、ここでは部分解析木が第11図(a)
のように作成された後の処理について説明する。
語複文に該当し、大域的構文解析部4による解析処理が
なされる。ここでは“尽くしたが”における接続助詞“
が”を動詞“悪かった”にかけた際、主格助詞“は”が
“尽くした”と“悪かった”の何れに係るかを判断する
。
接続助詞“が”の組合せ、動詞“尽くした”と“悪かっ
た”の主語の共通性を順次検査する。この場合、“は”
と“が”の組合せのみでは、“は”が“が”の前の動詞
に係るのかあるいは“が”を越えてその後ろの動詞に係
るのか決定することができないので、“は”の係り先の
判断は各動詞の主語の共通性に依存する。
”の主語が“彼”であるのに対し、“悪かった”には既
に“運”が主語として係っているため“彼”は主語とな
ることができず、各動詞の主語が一致しない。そこで“
彼は”は“尽くした”にかけたままにして大域的構文解
析部4の処理を終える。
る“が”を“悪かった”にかけて第11図(b)のよう
な解析木を作成し、本例文についての解析処理を終了す
る。
が”に着目して比較すると、各例文は同一の文型を有し
ながら、主格助詞“は”の係る動詞の位置が異なってい
る。このような場合でも本実施例の日本語構文解析シス
テムによれば節又は句の係り受け構造を正しく判断する
ことができる。
今日再び更新した。”という日本語複文を解析処理する
場合について説明する。本例文は上述した日本語複文の
パターンのうち第4パターンに該当する。
が単語ごとに分解され、各単語について局所的構文解析
部3により係り受け関係の判定及び部分解析木の作成が
行われる。以上の処理動作は第1解析処理例と同様なの
で説明を省略し、ここでは部分解析木が第12図(a)
のように作成された後の処理について説明する。
語複文に該当し、大域的構文解析部4による解析処理が
なされる。ここでは格助詞“を”を動詞“更新した”に
かけた際、主格助詞“が”が“付けた”と“更新した”
の何れに係るかを判断する。
連体修飾節との係り受け関係に関する性質(連体修飾節
を越えて、その後の動詞に係るか否か等)、動詞“付け
た”と“更新した”の主語の共通性を順次検査する。こ
こでは、連体修飾節が“が”の係れない主格関係節でな
いことから、“が”の係り先の判断は各動詞の主語の共
通性に依存する。
も“更新した”も共に“A社株”を主語とすることがわ
かり、この結果から、“A社株が”を“更新した”にか
け変える。但し、“A社株が”が“付けた”に係ってい
たことは記憶しておく。
析部3の処理にもどり、“を”を“更新した”にかけて
第12図(b)のような解析木を作成し、本例文につい
ての解析処理を終了する。
が抜いた。”という日本語複文を解析処理する場合につ
いて説明する。本例文は第5処理例と同様に第4のパタ
ーンの日本語複文に該当する。
が単語ごとに分解され、各単語について局所的構文解析
部3により係り受け関係の判定及び部分解析木の作成が
行われる。以上の処理動作は第1解析処理例と同様なの
で説明を省略し、ここでは部分解析木が第13図(a)
のように作成された後の処理について説明する。
語複文に該当し、大域的構文解析部4による解析処理が
なされる。ここでは格助詞“を”を動詞“抜いた”にか
けた際、“A社株が”における主格助詞“が”が“付け
た”と“抜いた”の何れに係るかを判断する。
連体修飾節の係り受け関係に関する性質(連体修飾節を
越えて、その後の動詞に係るか否か等)、動詞“付けた
”と“抜いた”の主語の共通性を順次検査する。ここで
は、連体修飾節が“が”の係れない主格関係節でないこ
とから、“A社株が”における“が”の係り先の判断は
各動詞の主語の共通性に依存する。
の主語が“A社株”であるのに対し、“抜いた”には既
に“B社株”が主語として係っているため“A社株”は
主語となることができず、各動詞の主語が一致しない。
域的構文解析部4の処理を終える。
”にかけて第13図(b)のような解析木を作成し、本
例文についての解析処理を終了する。
が”に着目して比較すると、各例文は同一の文型を有し
ながら、主格助詞“は”の係る動詞の位置が異なってい
る。このような場合でも本実施例の日本語構文解析シス
テムによれば節又は句の係り受け構造を正しく判断する
ことができる。
よれば、係り受け関係を表わす解析木を分析し、所定の
解析規則に従って上記接続助詞及び主格助詞の係り先を
判定し、上記解析木を修正する大域的構文解析部を備え
たことにより、複数の述語を含む日本語複文の係り受け
構造を自動的に解析することができる。また、これによ
り、これまでのように人手を介して複文を単文に分解す
るといった処理が不要となる。
係を表す解析木により示される日本語文が予め定められ
た所定のパターンの日本語複文に該当する場合に、大域
的構文解析部が上記日本語複文の各接続助詞及び主格助
詞の係り先を判定し、上記解析木を修正することにより
、係り受け関係が自明な日本語複文等に対しては大域的
構文解析部が起動せず、効率よく日本語文の解析処理を
行うことができる。
詞で連結された3つ以上の文を有する複文、■接続助詞
の後に連体修飾節を含む複文、■主格助詞の後に接続助
詞で連結された複数の文を有する複文、■主格助詞の後
に連体修飾節を有する複文、の4つのパターンに分類し
、該日本語文の構造的特徴に基づいて各接続助詞及び主
格助詞の係り先を判定することにより、更に効率よく、
かつ正確に日本語文の解析処理を行うことができるとい
う効果がある。
示す機能ブロック図、 第2図は日本語辞書部の内容を示す図、第3図は品詞マ
トリックステーブルの内容を示す図、 第4図乃至第13図は本実施例による日本語文の解析処
理を示す図である。 1:解析処理部 2:形態素解析部 3:局所的構文解析部 4:大域的構文解析部 11:品詞間連接テーブル 12:品詞マトリックステーブル 21:日本語辞書部 出願人 株式会社 シーエスケイ
Claims (11)
- 【請求項1】複数の述語を含む日本語複文に対して形態
素 解析処理を行い、該日本語複文の係り受け構造を解析す
る日本語構文解析システムにおいて、上記形態素解析に
より得られた各単語の文法情報及び意味情報を利用し解
析規則に従って単語相互の係り受け関係を判定し、単語
間の係り受け関係を表す解析木を作成する局所的構文解
析部と、上記局所的構文解析部によって作成された係り
受け関係を表わす解析木を分析し、所定の解析規則に従
って上記日本語複文における接続助詞及び主格助詞の係
り先を判定し、上記解析木を修正する大域的構文解析部
とを備えたことを特徴とする日本語構文解析システム。 - 【請求項2】大域的構文解析部が、局所的構文解析部に
よって作成された係り受け関係を表す解析木により示さ
れる日本語複文が予め定められた所定のパターンの日本
語複文に該当する場合に、該日本語複文の各接続助詞及
び主格助詞の係り先を判定し、上記解析木を修正するこ
とを特徴とする請求項第1項に記載の日本語構文解析シ
ステム。 - 【請求項3】局所的構文解析部によって作成された係り
受け関係を表す解析木により示される日本語複文が、■
接続助詞で連結された3つ以上の文を有する複文、■接
続助詞の後に連体修飾節を含む複文、■主格助詞の後に
接続助詞で連結された複数の文を有する複文、■主格助
詞の後に連体修飾節を有する複文の4つのパターンのう
ち何れかに該当する場合に、 大域的構文解析部が上記日本語複文の構造的特徴に基づ
いて上記日本語複文中の各接続助詞及び主格助詞の係り
先を判定し、上記解析木を修正することを特徴とする請
求項第2項に記載の日本語構文解析システム。 - 【請求項4】大域的構文解析部が、接続助詞で連結され
た 3つ以上の文を有する日本語複文に対し、接続助詞の種
類、又は各述語に対する主語の共通性に基づいて上記日
本語複文における接続助詞の係り先を判定することを特
徴とする請求項第3項に記載の日本語構文解析システム
。 - 【請求項5】大域的構文解析部が、連体修飾節を含む日
本 語複文に対し、接続助詞の種類、連体修飾節の種類、注
目する述語に係る格助詞の種類、先行詞の共通性、又は
各述語に対する主語の共通性に基づいて上記日本語複文
における接続助詞の係り先を判定することを特徴とする
請求項第3項に記載の日本語構文解析システム。 - 【請求項6】大域的構文解析用が、接続助詞で連結され
た 3つ以上の文を有する日本語複文に対し、接続助詞の種
類、又は各述語に対する主語の共通性に基づいて上記日
本語複文における接続助詞の係り先を判定し、 連体修飾節を含む日本語複文に対し、接続助詞の種類、
連体修飾節の種類、注目する述語に係る格助詞の種類、
先行詞の共通性、又は各述語に対する主語の共通性に基
づいて上記日本語複文における接続助詞の係り先を判定
することを特徴とする請求項第3項に記載の日本語構文
解析システム。 - 【請求項7】大域的構文解析部が、主格助詞の後に接続
助 詞で連結された複数の文を有する日本語複文に対し、上
記主格助詞の種類、上記接続助詞の種類、又は各述語に
対する主語の共通性に基づいて上記日本語複文における
上記主格助詞の係り先を判定することを特徴とする請求
項第3項に記載の日本語構文解析システム。 - 【請求項8】大域的構文解析部が、接続助詞で連結され
た 3つ以上の文を有する日本語複文に対し、接続助詞の種
類、又は各述語に対する主語の共通性に基づいて上記日
本語複文における接続助詞の係り先を判定し、 主格助詞の後に接続助詞で連結された複数の文を有する
日本語複文に対し、上記主格助詞の種類、上記接続助詞
の種類、又は各述語に対する主語の共通性に基づいて上
記日本語複文における上記主格助詞の係り先を判定する
ことを特徴とする請求項第3項に記載の日本語構文解析
システム。 - 【請求項9】大域的構文解析部が、連体修飾節を含む日
本 語複文に対し、接続助詞の種類、連休修飾節の種類、注
目する述語に係る格助詞の種類、先行詞の共通性、又は
各述語に対する主語の共通性に基づいて上記日本語複文
における接続助詞の係り先を判定し、 主格助詞の後に接続助詞で連結された複数の文を有する
日本語複文に対し、上記主格助詞の種類、上記接続助詞
の種類、又は各述語に対する主語の共通性に基づいて上
記日本語複文における上記主格助詞の係り先を判定する
ことを特徴とする請求項第3項に記載の日本語構文解析
システム。 - 【請求項10】大域的構文解析部が、接続助詞で連結さ
れた 3つ以上の文を有する日本語複文に対し、接続助詞の種
類、又は各述語に対する主語の共通性に基づいて上記日
本語複文における接続助詞の係り先を判定し、 連体修飾節を含む日本語複文に対し、接続助詞の種類、
連体修飾節の種類、注目する述語に係る格助詞の種類、
先行詞の共通性、又は各述語に対する主語の共通性に基
づいて上記日本語複文における接続助詞の係り先を判定
し、主格助詞の後ろに接続助詞で連結された複数の文を
有する日本語複文に対し、上記主格助詞の種類、上記接
続助詞の種類、又は各述語に対する主語の共通性に基づ
いて上記日本語複文における上記主格助詞の係り先を判
定することを特徴とする請求項第3項に記載の日本語構
文解析システム。 - 【請求項11】大域的構文解析部が、主格助詞の後に連
体修飾節を有する日本語複文に対し、上記主格助詞の種
類、上記連体修飾節の種類、又は各述語に対する主語の
共通性に基づいて上記日本語複文における上記主格助詞
の係り先を判定することを特徴とする請求項第3項乃至
第9項の何れかに記載の日本語構文解析システム。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP31522890A JP3293619B2 (ja) | 1990-08-20 | 1990-11-20 | 日本語構文解析システム |
| EP91914616A EP0547222A1 (en) | 1990-08-20 | 1991-08-20 | System for syntax analysis of japanese language |
| PCT/JP1991/001108 WO1992003796A1 (en) | 1990-08-20 | 1991-08-20 | System for syntax analysis of japanese language |
| CA 2070406 CA2070406A1 (en) | 1990-08-20 | 1991-08-20 | System for syntax analysis of japanese language |
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP21856190 | 1990-08-20 | ||
| JP2-218561 | 1990-08-20 | ||
| JP2-249395 | 1990-09-19 | ||
| JP24939590 | 1990-09-19 | ||
| JP2-275770 | 1990-10-15 | ||
| JP27577090 | 1990-10-15 | ||
| JP31522890A JP3293619B2 (ja) | 1990-08-20 | 1990-11-20 | 日本語構文解析システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH04211867A true JPH04211867A (ja) | 1992-08-03 |
| JP3293619B2 JP3293619B2 (ja) | 2002-06-17 |
Family
ID=27476869
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP31522890A Expired - Lifetime JP3293619B2 (ja) | 1990-08-20 | 1990-11-20 | 日本語構文解析システム |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP0547222A1 (ja) |
| JP (1) | JP3293619B2 (ja) |
| WO (1) | WO1992003796A1 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1998039711A1 (en) * | 1997-03-04 | 1998-09-11 | Hiroshi Ishikura | Language analysis system and method |
| US7672829B2 (en) | 1997-03-04 | 2010-03-02 | Hiroshi Ishikura | Pivot translation method and system |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5963893A (en) * | 1996-06-28 | 1999-10-05 | Microsoft Corporation | Identification of words in Japanese text by a computer system |
| WO1998008169A1 (en) * | 1996-08-22 | 1998-02-26 | Lernout & Hauspie Speech Products N.V. | Method and apparatus for breaking words in a stream of text |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS584479A (ja) * | 1981-06-30 | 1983-01-11 | Fujitsu Ltd | 日本語文解析システム |
| JPS58169290A (ja) * | 1982-03-31 | 1983-10-05 | Fujitsu Ltd | 自然言語解析方式 |
| JPS60157659A (ja) * | 1984-01-27 | 1985-08-17 | Hitachi Ltd | 日本語解析方式 |
| JPS60193074A (ja) * | 1984-03-14 | 1985-10-01 | Ricoh Co Ltd | 日本語解析装置 |
| JP2960936B2 (ja) * | 1987-07-13 | 1999-10-12 | 日本電信電話株式会社 | 係り受け解析装置 |
| JPS6466777A (en) * | 1987-09-08 | 1989-03-13 | Sharp Kk | Mechanical translation device |
| JPH02165378A (ja) * | 1988-12-20 | 1990-06-26 | Csk Corp | 機械翻訳システム |
-
1990
- 1990-11-20 JP JP31522890A patent/JP3293619B2/ja not_active Expired - Lifetime
-
1991
- 1991-08-20 WO PCT/JP1991/001108 patent/WO1992003796A1/ja not_active Ceased
- 1991-08-20 EP EP91914616A patent/EP0547222A1/en not_active Withdrawn
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1998039711A1 (en) * | 1997-03-04 | 1998-09-11 | Hiroshi Ishikura | Language analysis system and method |
| AU746577B2 (en) * | 1997-03-04 | 2002-05-02 | Hiroshi Ishikura | Language analysis system and method |
| US7672829B2 (en) | 1997-03-04 | 2010-03-02 | Hiroshi Ishikura | Pivot translation method and system |
Also Published As
| Publication number | Publication date |
|---|---|
| EP0547222A4 (en) | 1993-04-26 |
| JP3293619B2 (ja) | 2002-06-17 |
| EP0547222A1 (en) | 1993-06-23 |
| WO1992003796A1 (en) | 1992-03-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6965857B1 (en) | Method and apparatus for deriving information from written text | |
| Gaizauskas et al. | University of Sheffield: Description of the LaSIE system as used for MUC-6 | |
| US5541838A (en) | Translation machine having capability of registering idioms | |
| EP0886226A1 (en) | Linguistic search system | |
| US20120303358A1 (en) | Semantic textual analysis | |
| JP2001523019A (ja) | テキストの本文の談話構造の自動認識 | |
| Witt et al. | On the lossless transformation of single-file, multi-layer annotations into multi-rooted trees | |
| US20020129066A1 (en) | Computer implemented method for reformatting logically complex clauses in an electronic text-based document | |
| JPH04211867A (ja) | 日本語構文解析システム | |
| Foufi | Multilingual parsing and MWE | |
| KR101052004B1 (ko) | 번역서비스 제공방법 및 그 시스템 | |
| JP3136973B2 (ja) | 言語解析システムおよび方法 | |
| WO1999021106A1 (en) | Automatically recognizing the discourse structure of a body of text | |
| Babarczy et al. | Hunpars: a rule-based sentence parser for Hungarian | |
| JPH07175808A (ja) | 自然言語処理装置 | |
| JPS60215282A (ja) | 自然言語解析構文方式及び装置 | |
| JPS61187077A (ja) | 日本語解析装置 | |
| JPH0561902A (ja) | 機械翻訳システム | |
| JP3358100B2 (ja) | 日本語質問メッセージ解析方法及び装置 | |
| Friburger et al. | Finite-state transducer cascade to extract proper names in texts | |
| JP3055690B2 (ja) | 日本語同格名詞句翻訳方式 | |
| Humphreys | Description of the LaSIE system as used for MUC-6 | |
| JPH0512753B2 (ja) | ||
| JP2752025B2 (ja) | 機械翻訳装置 | |
| KR20010026991A (ko) | 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080405 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090405 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100405 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100405 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110405 Year of fee payment: 9 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110405 Year of fee payment: 9 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110405 Year of fee payment: 9 |
|
| R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110405 Year of fee payment: 9 |