JPH0581314A - 係り受け関係判定方式 - Google Patents
係り受け関係判定方式Info
- Publication number
- JPH0581314A JPH0581314A JP3237791A JP23779191A JPH0581314A JP H0581314 A JPH0581314 A JP H0581314A JP 3237791 A JP3237791 A JP 3237791A JP 23779191 A JP23779191 A JP 23779191A JP H0581314 A JPH0581314 A JP H0581314A
- Authority
- JP
- Japan
- Prior art keywords
- dependency
- property
- receiving
- clause
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 係り受け関係が成立している可能を有する文
節の対の判定を迅速に行なう。 【構成】 入力文の各文節は、その文節の種類によっ
て、その文節が有する係り受け関係における係り性質及
び受け性質を規定できる。文節種類に応じて定まる係り
性質及び受け性質を予め係り受け規則2に格納してお
く。係り性質・受け性質性質決定手段1は入力文が与え
られると、入力文の全ての文節の係り性質及び受け性質
を係り受け規則2の格納内容に応じて決定して、係り性
質データ及び受け性質データを係り受け可能性判定手段
2に出力する。係り受け可能性判定手段2は、各文節の
係り性質データと各文節の受け性質データとを照合し
て、係り受け関係が成立している可能性を有する文節の
対を抽出する。
節の対の判定を迅速に行なう。 【構成】 入力文の各文節は、その文節の種類によっ
て、その文節が有する係り受け関係における係り性質及
び受け性質を規定できる。文節種類に応じて定まる係り
性質及び受け性質を予め係り受け規則2に格納してお
く。係り性質・受け性質性質決定手段1は入力文が与え
られると、入力文の全ての文節の係り性質及び受け性質
を係り受け規則2の格納内容に応じて決定して、係り性
質データ及び受け性質データを係り受け可能性判定手段
2に出力する。係り受け可能性判定手段2は、各文節の
係り性質データと各文節の受け性質データとを照合し
て、係り受け関係が成立している可能性を有する文節の
対を抽出する。
Description
【0001】
【産業上の利用分野】本発明は、文節間の係り受け関係
の可能性を判定する係り受け関係判定方式に関し、特
に、文節の係り受け関係基づいて入力文の構文を解析す
る構文解析方式に適用し得るものである。
の可能性を判定する係り受け関係判定方式に関し、特
に、文節の係り受け関係基づいて入力文の構文を解析す
る構文解析方式に適用し得るものである。
【0002】
【従来の技術】自然言語処理システムにおいて、入力さ
れた自然言語文の構文構造を正しく捕らえることも重要
なことであり、従来、各種の構文解析方式が提案されて
いる。ところで、日本語文は、周知のように、文節と呼
ばれる文の構成単位の有限長列で表され、文中の各文節
は同一文中の他の適当な文節と係り受けと呼ばれる関係
を持っている。そのため、処理対象の自然言語文が、日
本語文の場合には、各文節について他文節との係り受け
の可能性を判断し、それをもとにして文の係り受け構造
(構文)を決定する方式があった。例えば、文献1〜文
献3に開示されている。
れた自然言語文の構文構造を正しく捕らえることも重要
なことであり、従来、各種の構文解析方式が提案されて
いる。ところで、日本語文は、周知のように、文節と呼
ばれる文の構成単位の有限長列で表され、文中の各文節
は同一文中の他の適当な文節と係り受けと呼ばれる関係
を持っている。そのため、処理対象の自然言語文が、日
本語文の場合には、各文節について他文節との係り受け
の可能性を判断し、それをもとにして文の係り受け構造
(構文)を決定する方式があった。例えば、文献1〜文
献3に開示されている。
【0003】文献1『吉田将、「二文節間の係り受けを
基礎とした日本語文の構文解析」、電子情報通信学会論
文誌Vol.55-D 1972/4 』 文献2『特開昭63-219073 号公報』 文献3『特開昭63-219074 号公報』 このような従来の構文解析方式においては、係り受け可
能な文節の対を配列等の形式で表現して予め格納してお
き、入力された文の文節をこの配列と演算照合してして
係り受け判断を行なっていた。なお、係り受け可能文節
の判定を、文全体を解析する過程で一体となって処理し
ていたものもある。
基礎とした日本語文の構文解析」、電子情報通信学会論
文誌Vol.55-D 1972/4 』 文献2『特開昭63-219073 号公報』 文献3『特開昭63-219074 号公報』 このような従来の構文解析方式においては、係り受け可
能な文節の対を配列等の形式で表現して予め格納してお
き、入力された文の文節をこの配列と演算照合してして
係り受け判断を行なっていた。なお、係り受け可能文節
の判定を、文全体を解析する過程で一体となって処理し
ていたものもある。
【0004】
【発明が解決しようとする課題】しかしながら、従来方
式の場合、文中の各文節を係り受け可能な文節の対を記
述した配列と照合する際の演算量が膨大であるという問
題がある。
式の場合、文中の各文節を係り受け可能な文節の対を記
述した配列と照合する際の演算量が膨大であるという問
題がある。
【0005】特に、係り受け可能文節の判定を解析過程
と一体となって行なうものの場合、この判定の複雑化の
ために全体として処理手順も複雑になっていた。
と一体となって行なうものの場合、この判定の複雑化の
ために全体として処理手順も複雑になっていた。
【0006】本発明は、以上の点を考慮してなされたも
のであり、係り受け可能文節の判定を迅速に行なうこと
ができる、解析処理本体からこの判定処理を独立させる
ことも可能な係り受け関係判定方式を提供しようとする
ものである。
のであり、係り受け可能文節の判定を迅速に行なうこと
ができる、解析処理本体からこの判定処理を独立させる
ことも可能な係り受け関係判定方式を提供しようとする
ものである。
【0007】
【課題を解決するための手段】かかる課題を解決するた
め、本発明の係り受け関係判定方式においては、文節種
類に応じて定まる係り受け関係における係り性質及び受
け性質を格納している係り受け規則格納手段と、入力文
の全ての文節の係り性質及び受け性質を、上記係り受け
規則格納手段の格納内容に応じて決定して、係り性質デ
ータ及び受け性質データを出力する文節性質決定手段
と、各文節の係り性質データと、各文節の受け性質デー
タとを照合して、係り受け関係が成立している可能性を
有する文節の対を抽出する係り受け可能性判定手段とを
備えた。
め、本発明の係り受け関係判定方式においては、文節種
類に応じて定まる係り受け関係における係り性質及び受
け性質を格納している係り受け規則格納手段と、入力文
の全ての文節の係り性質及び受け性質を、上記係り受け
規則格納手段の格納内容に応じて決定して、係り性質デ
ータ及び受け性質データを出力する文節性質決定手段
と、各文節の係り性質データと、各文節の受け性質デー
タとを照合して、係り受け関係が成立している可能性を
有する文節の対を抽出する係り受け可能性判定手段とを
備えた。
【0008】ここで、係り性質データ及び受け性質デー
タを、対応位置のそれぞれのビットが係り受け関係上の
意味を有するものとし、上記係り受け可能性判定手段
が、係り性質データと受け性質データとをビット乗算し
て照合することが好ましい。
タを、対応位置のそれぞれのビットが係り受け関係上の
意味を有するものとし、上記係り受け可能性判定手段
が、係り性質データと受け性質データとをビット乗算し
て照合することが好ましい。
【0009】
【作用】入力文の各文節は、他の文節を考慮することな
く、その文節の種類によって、その文節が有する係り受
け関係における係り性質及び受け性質を規定することが
できる。本発明は、このような点に着目してなされたも
のである。
く、その文節の種類によって、その文節が有する係り受
け関係における係り性質及び受け性質を規定することが
できる。本発明は、このような点に着目してなされたも
のである。
【0010】本発明においては、文節種類に応じて定ま
る係り受け関係における係り性質及び受け性質を、予め
係り受け規則格納手段に格納している。文節性質決定手
段は、入力文が与えられると、入力文の全ての文節の係
り性質及び受け性質を、係り受け規則格納手段の格納内
容に応じて決定して、係り性質データ及び受け性質デー
タを係り受け可能性判定手段に出力する。係り受け可能
性判定手段は、各文節の係り性質データと、各文節の受
け性質データとを照合して、係り受け関係が成立してい
る可能性を有する文節の対を抽出する。
る係り受け関係における係り性質及び受け性質を、予め
係り受け規則格納手段に格納している。文節性質決定手
段は、入力文が与えられると、入力文の全ての文節の係
り性質及び受け性質を、係り受け規則格納手段の格納内
容に応じて決定して、係り性質データ及び受け性質デー
タを係り受け可能性判定手段に出力する。係り受け可能
性判定手段は、各文節の係り性質データと、各文節の受
け性質データとを照合して、係り受け関係が成立してい
る可能性を有する文節の対を抽出する。
【0011】ここで、係り性質データ及び受け性質デー
タを、対応位置のそれぞれのビットが係り受け関係上の
意味を有するものとし、上記係り受け可能性判定手段
が、係り性質データと受け性質データとをビット乗算し
て照合することが、判定の高速性の面から好ましい。
タを、対応位置のそれぞれのビットが係り受け関係上の
意味を有するものとし、上記係り受け可能性判定手段
が、係り性質データと受け性質データとをビット乗算し
て照合することが、判定の高速性の面から好ましい。
【0012】
【実施例】以下、本発明の一実施例を図面を参照しなが
ら詳述する。
ら詳述する。
【0013】図1は、この実施例による構文解析方式の
機能構成を示すものである。なお、ハードウェア的に
は、ワークステーション等の一般的なコンピュータシス
テムによって実現されている。
機能構成を示すものである。なお、ハードウェア的に
は、ワークステーション等の一般的なコンピュータシス
テムによって実現されている。
【0014】図1において、係り性質・受け性質決定手
段1には、形態素分割、品詞決定が既に行われた、しか
も、文節の区切りも済んだ文情報が入力される。係り性
質・受け性質決定手段1は、入力文の全ての文節に対し
て、その文節が有する係り受け関係における係りの性質
及び受けの性質を求め、それぞれ係り性質コード及び受
け性質コードとして文節に付与するものである。
段1には、形態素分割、品詞決定が既に行われた、しか
も、文節の区切りも済んだ文情報が入力される。係り性
質・受け性質決定手段1は、入力文の全ての文節に対し
て、その文節が有する係り受け関係における係りの性質
及び受けの性質を求め、それぞれ係り性質コード及び受
け性質コードとして文節に付与するものである。
【0015】なお、文節は、それ自体の種類によって、
この文節が受け文節となる可能性がある係り受け関係の
種類を規定することができ、また、この文節が係り文節
となる可能性がある係り受け関係の種類を規定すること
ができる。この実施例は、このような文節自体の種類に
よって係り受け関係における性質が定まることを利用し
たものである。
この文節が受け文節となる可能性がある係り受け関係の
種類を規定することができ、また、この文節が係り文節
となる可能性がある係り受け関係の種類を規定すること
ができる。この実施例は、このような文節自体の種類に
よって係り受け関係における性質が定まることを利用し
たものである。
【0016】図2は、各文節に付与される係りコード及
び受けコードのデータ形式を示すものである。図2
(A)に示す係りコードも図2(B)に示す受けコード
も同一ビット数(図のものはnビット)でなるコードで
ある。係りコード及び受けコードにおける各ビットは、
係り受け関係におけるある関係種類を意味しており、例
えば、最下位ビットは「ガ格の関係」を意味し、第2ビ
ットは「連体修飾の関係」を意味する。対象文節が、係
り文節になる場合において、「ガ格の関係」があるもの
であれば係りコードの最下位ビットには“1”が挿入さ
れ、「連体修飾の関係」があるものであれば係りコード
の第2ビットには“1”が挿入される。なお、係りコー
ドの複数のビットに“1”が挿入されることも当然にあ
り得る。対象文節が、受け文節になる場合においても、
「ガ格の関係」があるものであれば受けコードの最下位
ビットには“1”が挿入され、「連体修飾の関係」があ
るものであれば受けコードの第2ビットには“1”が挿
入される。なお、受けコードでも複数のビットに“1”
が挿入されることも当然にあり得る。
び受けコードのデータ形式を示すものである。図2
(A)に示す係りコードも図2(B)に示す受けコード
も同一ビット数(図のものはnビット)でなるコードで
ある。係りコード及び受けコードにおける各ビットは、
係り受け関係におけるある関係種類を意味しており、例
えば、最下位ビットは「ガ格の関係」を意味し、第2ビ
ットは「連体修飾の関係」を意味する。対象文節が、係
り文節になる場合において、「ガ格の関係」があるもの
であれば係りコードの最下位ビットには“1”が挿入さ
れ、「連体修飾の関係」があるものであれば係りコード
の第2ビットには“1”が挿入される。なお、係りコー
ドの複数のビットに“1”が挿入されることも当然にあ
り得る。対象文節が、受け文節になる場合においても、
「ガ格の関係」があるものであれば受けコードの最下位
ビットには“1”が挿入され、「連体修飾の関係」があ
るものであれば受けコードの第2ビットには“1”が挿
入される。なお、受けコードでも複数のビットに“1”
が挿入されることも当然にあり得る。
【0017】係り性質・受け性質決定手段1は、上述し
た決定の処理の際に、図3に一例を示す係り受け規則2
を利用する。係り受け規則2は、図3に示すように、例
えば表形式でなり、文節種類を特定する欄2aと、その
文節種類で定まる係り性質を記述した欄2bと、その文
節種類で定まる受け性質を記述した欄2cからなる。こ
の例の場合、欄2b及び2cに格納されている係り性質
情報及び受け性質情報自体が上述した形式のコードとな
っている。
た決定の処理の際に、図3に一例を示す係り受け規則2
を利用する。係り受け規則2は、図3に示すように、例
えば表形式でなり、文節種類を特定する欄2aと、その
文節種類で定まる係り性質を記述した欄2bと、その文
節種類で定まる受け性質を記述した欄2cからなる。こ
の例の場合、欄2b及び2cに格納されている係り性質
情報及び受け性質情報自体が上述した形式のコードとな
っている。
【0018】各文節についてそれぞれ係り性質コード及
び受け性質コードが付与された入力文情報は、係り受け
可能性判定手段3に与えられる。係り受け可能性判定手
段3は、文節間に係り受け関係がある可能性があるか否
か判定するものである。係り受け可能性判定手段3は、
例えば、文頭側の文節から順に判定処理を行なう。今、
ある文節を着目文節としたとき、この文節の係りコード
と他の文節(全ての他の文節又は着目文節より文末側に
ある全ての他の文節)の受けコードとを照合して係り受
け関係の可能性がある文節を検出する。例えば、係りコ
ードと受けコードとの対応ビット同士を乗算し、乗算結
果に“1”のビットがある場合に、これら文節間には係
り受け関係の可能性があると判定する。また、乗算結果
が“1”のビットに割当てられた意味を、これら文節間
にある係り受け関係の種類と判別する。
び受け性質コードが付与された入力文情報は、係り受け
可能性判定手段3に与えられる。係り受け可能性判定手
段3は、文節間に係り受け関係がある可能性があるか否
か判定するものである。係り受け可能性判定手段3は、
例えば、文頭側の文節から順に判定処理を行なう。今、
ある文節を着目文節としたとき、この文節の係りコード
と他の文節(全ての他の文節又は着目文節より文末側に
ある全ての他の文節)の受けコードとを照合して係り受
け関係の可能性がある文節を検出する。例えば、係りコ
ードと受けコードとの対応ビット同士を乗算し、乗算結
果に“1”のビットがある場合に、これら文節間には係
り受け関係の可能性があると判定する。また、乗算結果
が“1”のビットに割当てられた意味を、これら文節間
にある係り受け関係の種類と判別する。
【0019】なお、係り受け可能性判定手段3による係
り受け関係の判定は、文全体における位置や文構造を考
慮したものでないので、この判定によって得られた結果
は、あくまでも係り受け関係がある可能性を示唆してい
るものである。
り受け関係の判定は、文全体における位置や文構造を考
慮したものでないので、この判定によって得られた結果
は、あくまでも係り受け関係がある可能性を示唆してい
るものである。
【0020】このようにして得られた係り受け関係の可
能性情報を含む入力文情報は、構文解析手段4に与えら
れる。構文解析手段4は、文節間の係り受け関係の可能
性情報を用い、かつ文解析規則5に従って構文解析す
る。この実施例の場合、文節間の係り受け関係の可能性
の判定処理を、構文解析処理から取出しているが、構文
解析処理自体には従来から存在する方式を適用すること
ができる。従って、構文解析処理についての具体的説明
は省略する。
能性情報を含む入力文情報は、構文解析手段4に与えら
れる。構文解析手段4は、文節間の係り受け関係の可能
性情報を用い、かつ文解析規則5に従って構文解析す
る。この実施例の場合、文節間の係り受け関係の可能性
の判定処理を、構文解析処理から取出しているが、構文
解析処理自体には従来から存在する方式を適用すること
ができる。従って、構文解析処理についての具体的説明
は省略する。
【0021】次に、例文「〜犬が道路を走る〜」におけ
る文節「犬が」と「走る」との間に係り受け関係がある
可能性を有するか否かの結果を得るまでの、上記実施例
による処理を説明する。
る文節「犬が」と「走る」との間に係り受け関係がある
可能性を有するか否かの結果を得るまでの、上記実施例
による処理を説明する。
【0022】係り性質・受け性質決定手段1が、文節
「犬が」を処理対象とすると、この文節を構成する形態
素「犬」及び「が」の情報に基づいて、最初の形態素が
普通名称であって第2の形態素が「が」である文節種類
を、係り受け規則2の文節種類欄2aから探索する。そ
して、発見すると、係り受け規則2のその文節種類に対
応した係り性質欄2bに記述されている係りコードをこ
の文節「犬が」に付与する。また、受け性質欄2cに記
述されている受けコードもこの文節「犬が」に付与す
る。
「犬が」を処理対象とすると、この文節を構成する形態
素「犬」及び「が」の情報に基づいて、最初の形態素が
普通名称であって第2の形態素が「が」である文節種類
を、係り受け規則2の文節種類欄2aから探索する。そ
して、発見すると、係り受け規則2のその文節種類に対
応した係り性質欄2bに記述されている係りコードをこ
の文節「犬が」に付与する。また、受け性質欄2cに記
述されている受けコードもこの文節「犬が」に付与す
る。
【0023】係り性質・受け性質決定手段1が、文節
「走る」を処理対象とすると、この文節を構成する形態
素「走る」(なお、この実施例の場合「走る」を1個の
形態素とする辞書が形態素解析で利用されているとす
る)の情報に基づいて、形態素が動詞終止形(動詞連体
形)である文節種類を、係り受け規則2の文節種類欄2
aから探索する。そして、発見すると、係り受け規則2
のその文節種類に対応した係り性質欄2bに記述されて
いる係りコードと、受け性質欄2cに記述されている受
けコードとをこの文節「走る」に付与する。
「走る」を処理対象とすると、この文節を構成する形態
素「走る」(なお、この実施例の場合「走る」を1個の
形態素とする辞書が形態素解析で利用されているとす
る)の情報に基づいて、形態素が動詞終止形(動詞連体
形)である文節種類を、係り受け規則2の文節種類欄2
aから探索する。そして、発見すると、係り受け規則2
のその文節種類に対応した係り性質欄2bに記述されて
いる係りコードと、受け性質欄2cに記述されている受
けコードとをこの文節「走る」に付与する。
【0024】図4は、文節「犬が」及び「走る」に付与
された係りコード及び受けコードを示すものである。文
節「犬が」の係りコードにおいては、図4(A1)に示
すように、「ガ格の関係」を意味する最下位ビットは
“1”で、「連体修飾の関係」を意味する第2ビットは
“0”になっている。なお、例文以外にも文節「犬が」
を含む「〜私の犬が〜」というような文も考えられるの
で、文節「犬が」の受けコードにおいては、図4(A
2)に示すように、最下位ビットは“0”で、第2ビッ
トは“1”になっている。また、例文以外にも文節「走
る」を含む「〜道路を走る犬が〜」というような文も考
えられるので、文節「走る」の係りコードにおいては、
図4(B1)に示すように、「最下位ビットは“0”
で、第2ビットは“1”になっている。文節「走る」の
受けコードにおいては、図4(B2)に示すように、最
下位ビットは“1”で、第2ビットは“0”になってい
る。
された係りコード及び受けコードを示すものである。文
節「犬が」の係りコードにおいては、図4(A1)に示
すように、「ガ格の関係」を意味する最下位ビットは
“1”で、「連体修飾の関係」を意味する第2ビットは
“0”になっている。なお、例文以外にも文節「犬が」
を含む「〜私の犬が〜」というような文も考えられるの
で、文節「犬が」の受けコードにおいては、図4(A
2)に示すように、最下位ビットは“0”で、第2ビッ
トは“1”になっている。また、例文以外にも文節「走
る」を含む「〜道路を走る犬が〜」というような文も考
えられるので、文節「走る」の係りコードにおいては、
図4(B1)に示すように、「最下位ビットは“0”
で、第2ビットは“1”になっている。文節「走る」の
受けコードにおいては、図4(B2)に示すように、最
下位ビットは“1”で、第2ビットは“0”になってい
る。
【0025】係り受け可能性判定手段3が、文節「犬
が」を着目文節とすると、この文節「犬が」の係りコー
ドを他の文節の受けコードとをビット乗算する。他の文
節として文節「走る」の順番になると、図4(A1)に
示した係りコードと図4(B2)に示した受けコードと
がビット乗算される。乗算結果において、少なくとも最
下位ビットは“1”であり、文節「犬が」及び「走る」
間に係り受け関係の可能性があること、及び、その際の
係り受け関係が「ガ格の関係」であることが判定され
る。
が」を着目文節とすると、この文節「犬が」の係りコー
ドを他の文節の受けコードとをビット乗算する。他の文
節として文節「走る」の順番になると、図4(A1)に
示した係りコードと図4(B2)に示した受けコードと
がビット乗算される。乗算結果において、少なくとも最
下位ビットは“1”であり、文節「犬が」及び「走る」
間に係り受け関係の可能性があること、及び、その際の
係り受け関係が「ガ格の関係」であることが判定され
る。
【0026】なお、文「〜道路を走る犬が〜」の場合に
は、同様にして、文節「走る」及び「犬が」間に係り受
け関係の可能性があること、及び、その際の係り受け関
係が「連体修飾の関係」であることが判定される。この
場合、文節「走る」が係り文節、文節「犬が」が受け文
節である。
は、同様にして、文節「走る」及び「犬が」間に係り受
け関係の可能性があること、及び、その際の係り受け関
係が「連体修飾の関係」であることが判定される。この
場合、文節「走る」が係り文節、文節「犬が」が受け文
節である。
【0027】従って、上述の実施例によれば、入力文の
各文節に対して、係り受け関係における係り性質及び受
け性質を求めてそれをコード化し、異なる文節の係りコ
ードと受けコードとの照合によって、文節間に係り受け
関係の可能性があるか否かを、また、ある場合の係り受
け関係の内容を判定するようにしたので、かかる判定を
少ない演算で高速に行なうことができる。特に、上記実
施例の場合コード同士のビット乗算の結果によって判定
できるので非常に高速となる。
各文節に対して、係り受け関係における係り性質及び受
け性質を求めてそれをコード化し、異なる文節の係りコ
ードと受けコードとの照合によって、文節間に係り受け
関係の可能性があるか否かを、また、ある場合の係り受
け関係の内容を判定するようにしたので、かかる判定を
少ない演算で高速に行なうことができる。特に、上記実
施例の場合コード同士のビット乗算の結果によって判定
できるので非常に高速となる。
【0028】また、この実施例の場合、文節間の係り受
け関係の判定に供する係り受け規則は、1個の文節を意
味したものですみ、複数文節の配列による従来の場合に
比べれば、記憶容量を少なくすることができる。
け関係の判定に供する係り受け規則は、1個の文節を意
味したものですみ、複数文節の配列による従来の場合に
比べれば、記憶容量を少なくすることができる。
【0029】さらに、この実施例の場合、かかる判定処
理を構文解釈処理本体から切り離した処理としているの
で、構文解釈処理本体の処理手順を簡単なものとするこ
とができ、この点からも構文解析を高速に実行させるこ
とができる。
理を構文解釈処理本体から切り離した処理としているの
で、構文解釈処理本体の処理手順を簡単なものとするこ
とができ、この点からも構文解析を高速に実行させるこ
とができる。
【0030】なお、上記実施例においては、係り受け関
係の可能性の判定処理を構文解釈処理本体から切り離し
たものを示したが、構文解釈処理の途中途中において可
能性を判断するようなものにも本発明を適用することが
できる。
係の可能性の判定処理を構文解釈処理本体から切り離し
たものを示したが、構文解釈処理の途中途中において可
能性を判断するようなものにも本発明を適用することが
できる。
【0031】また、各文節の係り性質及び受け性質を表
すコード化は、上記実施例のものに限定されるものでも
なく、係りコードと受けコードとの照合も上記実施例の
ものに限定されるものではない。
すコード化は、上記実施例のものに限定されるものでも
なく、係りコードと受けコードとの照合も上記実施例の
ものに限定されるものではない。
【0032】さらに、本発明の対象としての文章は日本
語文に限定されるものではなく、文節に相当するような
区切りが可能な言語の文をも対象とすることができる。
例えば、英語文であっても、句を単位にして処理するよ
うな場合に本発明を適用できる。特許請求の範囲におけ
る文節の語はこの場合をも含むものとする。
語文に限定されるものではなく、文節に相当するような
区切りが可能な言語の文をも対象とすることができる。
例えば、英語文であっても、句を単位にして処理するよ
うな場合に本発明を適用できる。特許請求の範囲におけ
る文節の語はこの場合をも含むものとする。
【0033】
【発明の効果】以上のように、本発明によれば、入力文
の各文節に対して、係り受け関係における係り性質及び
受け性質を求めてそれをコード化し、異なる文節の係り
性質データと受け性質データとの照合によって、文節間
に係り受け関係の可能性があるか否かを、また、ある場
合の係り受け関係の内容を判定するようにしたので、か
かる判定を少ない演算で高速に行なうことができ、ま
た、この判定を構文解析自体から分離させるようなこと
も可能となる。
の各文節に対して、係り受け関係における係り性質及び
受け性質を求めてそれをコード化し、異なる文節の係り
性質データと受け性質データとの照合によって、文節間
に係り受け関係の可能性があるか否かを、また、ある場
合の係り受け関係の内容を判定するようにしたので、か
かる判定を少ない演算で高速に行なうことができ、ま
た、この判定を構文解析自体から分離させるようなこと
も可能となる。
【図1】実施例の機能構成を示すブロック図である。
【図2】その係りコード及び受けコードのデータ形式を
示す説明図である。
示す説明図である。
【図3】係り受け規則2の構成例を示す説明図である。
【図4】実施例の具体的例文に対する処理の説明に用い
る図である。
る図である。
1…係り性質・受け性質決定手段、2…係り受け規則、
3…係り受け可能性判定手段。
3…係り受け可能性判定手段。
Claims (2)
- 【請求項1】 文節種類に応じて定まる係り受け関係に
おける係り性質及び受け性質を格納している係り受け規
則格納手段と、 入力文の全ての文節の係り性質及び受け性質を、上記係
り受け規則格納手段の格納内容に応じて決定して、係り
性質データ及び受け性質データを出力する文節性質決定
手段と、 各文節の係り性質データと、各文節の受け性質データと
を照合して、係り受け関係が成立している可能性を有す
る文節の対を抽出する係り受け可能性判定手段とを備え
たことを特徴とした係り受け関係判定方式。 - 【請求項2】 係り性質データ及び受け性質データを、
対応位置のそれぞれのビットが係り受け関係上の意味を
有するものとし、 上記係り受け可能性判定手段が、ある文節の係り性質デ
ータと他の文節の受け性質データとをビット乗算して照
合することを特徴とする請求項1に記載の係り受け関係
判定方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3237791A JPH0581314A (ja) | 1991-09-18 | 1991-09-18 | 係り受け関係判定方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3237791A JPH0581314A (ja) | 1991-09-18 | 1991-09-18 | 係り受け関係判定方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0581314A true JPH0581314A (ja) | 1993-04-02 |
Family
ID=17020487
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3237791A Pending JPH0581314A (ja) | 1991-09-18 | 1991-09-18 | 係り受け関係判定方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0581314A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0994544A (ja) * | 1995-09-29 | 1997-04-08 | Shibaura Eng Works Co Ltd | 超音波洗浄装置 |
-
1991
- 1991-09-18 JP JP3237791A patent/JPH0581314A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0994544A (ja) * | 1995-09-29 | 1997-04-08 | Shibaura Eng Works Co Ltd | 超音波洗浄装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6816830B1 (en) | Finite state data structures with paths representing paired strings of tags and tag combinations | |
| US7269547B2 (en) | Tokenizer for a natural language processing system | |
| US7970600B2 (en) | Using a first natural language parser to train a second parser | |
| US6862566B2 (en) | Method and apparatus for converting an expression using key words | |
| JP4544674B2 (ja) | 選択文字列に関連する情報を提供するシステム | |
| CN100440150C (zh) | 基于例子的机器翻译系统和方法 | |
| EP0281742B1 (en) | Method for verifying spelling of compound words | |
| EP0971294A2 (en) | Method and apparatus for automated search and retrieval processing | |
| JPH0724055B2 (ja) | 単語分割処理方法 | |
| US20050065776A1 (en) | System and method for the recognition of organic chemical names in text documents | |
| US12437150B2 (en) | System and method of performing data training on morpheme processing rules | |
| CN114661917A (zh) | 文本扩增方法、系统、计算机设备及可读存储介质 | |
| US20060241936A1 (en) | Pronunciation specifying apparatus, pronunciation specifying method and recording medium | |
| US20100063795A1 (en) | Data processing device, data processing method, and data processing program | |
| US20110106849A1 (en) | New case generation device, new case generation method, and new case generation program | |
| US8131537B2 (en) | Apparatus and method for morphological analysis | |
| CN115115432B (zh) | 基于人工智能的产品信息推荐方法及装置 | |
| JPH0581314A (ja) | 係り受け関係判定方式 | |
| JP2807236B2 (ja) | 形態素解析方法 | |
| KR20000039406A (ko) | 부분 구문 분석을 통한 보어-술어 관계의 복합명사 색인 방법 | |
| JP3908919B2 (ja) | 形態素解析システムと形態素解析方法 | |
| JP2546515B2 (ja) | 情報抽出装置 | |
| EP0469485B1 (en) | Language processing system using an expanded LR parser | |
| JP3827191B2 (ja) | 係り受け関係解析装置 | |
| JPH0262668A (ja) | 文章情報解析技法を用いた文章情報検索方式 |