JPH07262189A - 文型パタン抽出装置 - Google Patents
文型パタン抽出装置Info
- Publication number
- JPH07262189A JPH07262189A JP6051463A JP5146394A JPH07262189A JP H07262189 A JPH07262189 A JP H07262189A JP 6051463 A JP6051463 A JP 6051463A JP 5146394 A JP5146394 A JP 5146394A JP H07262189 A JPH07262189 A JP H07262189A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- rule
- sentence pattern
- pattern
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 本発明は、テキストから文型パタンを自動抽
出する文型パタン抽出装置に関し、対象とする範囲の多
量のテキストを用意し、その全体に亘って文型パタンを
抽出して統合し、自動的に全ての文型パタンを収集する
と共にこの文型パタンの支援を受けて構文解析規則の修
正を簡易に可能にすることを目的とする。 【構成】 多量のテキストを形態素解析する形態素解析
部2と、この形態素解析部2によって形態素解析された
結果に対して、予め作成した文型パタン抽出規則4を適
用して文型パタンを抽出する文型パタン抽出部3と、こ
の文型パタン抽出部3によって抽出された文型パタンの
集合を統合する文型パタン統合部6とを備えるように構
成する。
出する文型パタン抽出装置に関し、対象とする範囲の多
量のテキストを用意し、その全体に亘って文型パタンを
抽出して統合し、自動的に全ての文型パタンを収集する
と共にこの文型パタンの支援を受けて構文解析規則の修
正を簡易に可能にすることを目的とする。 【構成】 多量のテキストを形態素解析する形態素解析
部2と、この形態素解析部2によって形態素解析された
結果に対して、予め作成した文型パタン抽出規則4を適
用して文型パタンを抽出する文型パタン抽出部3と、こ
の文型パタン抽出部3によって抽出された文型パタンの
集合を統合する文型パタン統合部6とを備えるように構
成する。
Description
【0001】
【産業上の利用分野】本発明は、テキストから文型パタ
ンを自動抽出する文型パタン抽出装置であって、自然言
語処理における構文規則の作成およびキーワードの抽出
規則の作成などのための基礎的な資料となる文型パタン
を自動抽出する装置であり、特に多量の入力テキストを
与えて自動的に文型パタンを抽出・作成する文型パタン
抽出装置に関するものである。
ンを自動抽出する文型パタン抽出装置であって、自然言
語処理における構文規則の作成およびキーワードの抽出
規則の作成などのための基礎的な資料となる文型パタン
を自動抽出する装置であり、特に多量の入力テキストを
与えて自動的に文型パタンを抽出・作成する文型パタン
抽出装置に関するものである。
【0002】
【従来の技術】自然言語処理において、入力されたテキ
ストの文の構造を解析するための構文解析は最も基本的
な処理の1つである。このためには、予め用意された構
文解析規則を用い、その構文解析規則に従って文要素の
書き換えを繰り返すことにより、文全体の構造を解析す
る。ここで用いられる構文解析規則は、多くの言語学者
が理論的に提案した文法を計算機で処理可能な形式に書
き直したものが用いられるが、世の中に流通する現実の
テキスト中の文においては例外が多く、実際にはそのよ
うな構文解析規則をかなりの部分を修正することが必要
となる。
ストの文の構造を解析するための構文解析は最も基本的
な処理の1つである。このためには、予め用意された構
文解析規則を用い、その構文解析規則に従って文要素の
書き換えを繰り返すことにより、文全体の構造を解析す
る。ここで用いられる構文解析規則は、多くの言語学者
が理論的に提案した文法を計算機で処理可能な形式に書
き直したものが用いられるが、世の中に流通する現実の
テキスト中の文においては例外が多く、実際にはそのよ
うな構文解析規則をかなりの部分を修正することが必要
となる。
【0003】また、多量のテキストからの情報抽出の一
環として、キーワードの抽出や、複数のキーワード間の
関係の抽出、更にテキストの要約などの知識の抽出の目
的のために、文型パタンに関する規則を用意し、この文
型パタンにマッチした文から、それぞれのパタンに依存
した箇所の情報を抽出する方法がとられる。
環として、キーワードの抽出や、複数のキーワード間の
関係の抽出、更にテキストの要約などの知識の抽出の目
的のために、文型パタンに関する規則を用意し、この文
型パタンにマッチした文から、それぞれのパタンに依存
した箇所の情報を抽出する方法がとられる。
【0004】以上のように、構文解析規則や文型パタン
は広範囲の自然言語処理のために必須のものであるが、
従来は作成する人間の言語的洞察に重きを置いて理論的
な方法で作り上げていく方法がとられていた。
は広範囲の自然言語処理のために必須のものであるが、
従来は作成する人間の言語的洞察に重きを置いて理論的
な方法で作り上げていく方法がとられていた。
【0005】
【発明が解決しようとする課題】上述した方法では、作
成された規則を対象テキストに適用して評価し、その結
果をもとに修正を繰り返すので、一般に、非常に微妙で
困難な修正作業が長期間続くことが多いという問題があ
る。更に、そうして作成された規則が対象テキスト全体
に亘って正しく適用できるか、あるいは新しく対象テキ
ストが加わった場合に、それに対しても同様に正しく適
用できるかについては、確実な保証がないために、修正
作業が果てしなく続くという現状となってしまう問題が
あった。
成された規則を対象テキストに適用して評価し、その結
果をもとに修正を繰り返すので、一般に、非常に微妙で
困難な修正作業が長期間続くことが多いという問題があ
る。更に、そうして作成された規則が対象テキスト全体
に亘って正しく適用できるか、あるいは新しく対象テキ
ストが加わった場合に、それに対しても同様に正しく適
用できるかについては、確実な保証がないために、修正
作業が果てしなく続くという現状となってしまう問題が
あった。
【0006】本発明は、これらの問題を解決するため、
対象とする範囲の多量のテキストを用意し、その全体に
亘って文型パタンを抽出して統合し、自動的に全ての文
型パタンを収集すると共にこの文型パタンの支援を受け
て構文解析規則の修正を簡易に可能にすることを目的と
している。
対象とする範囲の多量のテキストを用意し、その全体に
亘って文型パタンを抽出して統合し、自動的に全ての文
型パタンを収集すると共にこの文型パタンの支援を受け
て構文解析規則の修正を簡易に可能にすることを目的と
している。
【0007】
【課題を解決するための手段】図1は、本発明の原理ブ
ロック図を示す。図1において、テキストベース部1
は、多量のテキスト(文)を蓄積するものである。多量
のテキストから選択条件に合致したテキストを選択して
取り出すことができる。ここで、選択条件としては、テ
キストの分野を指定する条件の他に、表層的な文字列を
指定する条件などがある。これら選択条件に合致したテ
キスト(文)を選択し、後述する文型パタンの自動抽出
を行う。
ロック図を示す。図1において、テキストベース部1
は、多量のテキスト(文)を蓄積するものである。多量
のテキストから選択条件に合致したテキストを選択して
取り出すことができる。ここで、選択条件としては、テ
キストの分野を指定する条件の他に、表層的な文字列を
指定する条件などがある。これら選択条件に合致したテ
キスト(文)を選択し、後述する文型パタンの自動抽出
を行う。
【0008】形態素解析部2は、テキストを形態素解析
するものである。文型パタン抽出部3は、形態素解析さ
れた結果に文型パタン抽出規則4を適用し、文型パタン
を抽出するものである。
するものである。文型パタン抽出部3は、形態素解析さ
れた結果に文型パタン抽出規則4を適用し、文型パタン
を抽出するものである。
【0009】文型パタン抽出規則4は、形態素解析され
た結果から文型パタンを抽出するための規則である。文
型パタン5は、文型パタン抽出部3によって文から抽出
された文型パタンの集合である。
た結果から文型パタンを抽出するための規則である。文
型パタン5は、文型パタン抽出部3によって文から抽出
された文型パタンの集合である。
【0010】文型パタン統合部6は、文型パタン抽出部
3によって抽出された文型パタンの集合を統合するもの
である。構文解析部7は、自然言語文に構文解析規則8
を適用して構文解析するものである。
3によって抽出された文型パタンの集合を統合するもの
である。構文解析部7は、自然言語文に構文解析規則8
を適用して構文解析するものである。
【0011】結果表示・編集部9は、構文解析部7によ
って構文解析された構文解析結果および使用した構文解
析規則8を表示したり、構文解析規則8の修正に対応し
て修正後の構文解析結果などを表示したりするものであ
る。
って構文解析された構文解析結果および使用した構文解
析規則8を表示したり、構文解析規則8の修正に対応し
て修正後の構文解析結果などを表示したりするものであ
る。
【0012】
【作用】本発明は、図1に示すように、形態素解析部2
が入力された多量のテキストから1文ずつ形態素解析
し、文型パタン抽出部3がこの形態素解析結果に文型パ
タン抽出規則4を適用して文型パタン5を抽出し、文型
パタン統合部6がこれら文型パタン5の集合をまとめて
統合した文型パタンを生成するようにしている。
が入力された多量のテキストから1文ずつ形態素解析
し、文型パタン抽出部3がこの形態素解析結果に文型パ
タン抽出規則4を適用して文型パタン5を抽出し、文型
パタン統合部6がこれら文型パタン5の集合をまとめて
統合した文型パタンを生成するようにしている。
【0013】また、自然言語文について、構文解析部7
が予め作成された構文解析規則8を適用して構文解析処
理を行い、その構文解析結果を表示させると共に当該構
文解析結果を得るのに使用した構文解析規則8を当該構
文解析結果の該当部分に対応づけて表示させ、結果表示
・編集部8が自然言語文に関する統合された文型パタン
を取り出して併せて表示し、表示された構文解析結果に
使用した構文解析規則8の修正指示に対応して、統合さ
れた文型パタンに適合したときに修正後の構文解析規則
8を構文解析部7に渡し、構文解析処理を行わせ、その
構文解析結果を表示すると共に当該構文解析結果を得る
のに使用した構文解析規則8を対応づけて表示すること
を繰り返し、構文解析規則8を編集するようにしてい
る。
が予め作成された構文解析規則8を適用して構文解析処
理を行い、その構文解析結果を表示させると共に当該構
文解析結果を得るのに使用した構文解析規則8を当該構
文解析結果の該当部分に対応づけて表示させ、結果表示
・編集部8が自然言語文に関する統合された文型パタン
を取り出して併せて表示し、表示された構文解析結果に
使用した構文解析規則8の修正指示に対応して、統合さ
れた文型パタンに適合したときに修正後の構文解析規則
8を構文解析部7に渡し、構文解析処理を行わせ、その
構文解析結果を表示すると共に当該構文解析結果を得る
のに使用した構文解析規則8を対応づけて表示すること
を繰り返し、構文解析規則8を編集するようにしてい
る。
【0014】従って、対象とする範囲の多量のテキスト
を用意し、その全体に亘って文型パタンを抽出して統合
したり、文型パタンを参照して構文解析規則8を修正し
て望ましい構文解析結果を生成するように編集すること
により、多量の文から自動的に全ての文型パタンを収集
することが可能となると共に、文型パタンの支援を受け
て構文解析規則を容易に修正・作成などすることが可能
となる。
を用意し、その全体に亘って文型パタンを抽出して統合
したり、文型パタンを参照して構文解析規則8を修正し
て望ましい構文解析結果を生成するように編集すること
により、多量の文から自動的に全ての文型パタンを収集
することが可能となると共に、文型パタンの支援を受け
て構文解析規則を容易に修正・作成などすることが可能
となる。
【0015】
【実施例】次に、図2の(a)、および図3から図6を
用い、多量の文から文型パタンを自動抽出するときの図
1の構成の動作を詳細に説明する。
用い、多量の文から文型パタンを自動抽出するときの図
1の構成の動作を詳細に説明する。
【0016】図2の(a)は、文型パタンの自動抽出フ
ローチャートを示す。図2の(a)において、S1は、
1文の取り込みを行う。これは、図1のテキストベース
部1から多量のテキスト(文)から1文、例えば選択条
件で指定した特定分野の多量のテキスト(文)から1文
の取り込みを行う。
ローチャートを示す。図2の(a)において、S1は、
1文の取り込みを行う。これは、図1のテキストベース
部1から多量のテキスト(文)から1文、例えば選択条
件で指定した特定分野の多量のテキスト(文)から1文
の取り込みを行う。
【0017】S2は、形態素解析する。これは、S1で
取り込んだ1文の形態素解析を行う。例えば1文「親ク
ラスのスロットを親スロットと呼ぶ。」を形態素解析し
てそれ以上分割すると意味をなさなくなる単位に分割す
る。ここでは、図3の(a)に示す親クラス の スロット を 親スロット と 呼ぶ
。 の下線のように分割する。
取り込んだ1文の形態素解析を行う。例えば1文「親ク
ラスのスロットを親スロットと呼ぶ。」を形態素解析し
てそれ以上分割すると意味をなさなくなる単位に分割す
る。ここでは、図3の(a)に示す親クラス の スロット を 親スロット と 呼ぶ
。 の下線のように分割する。
【0018】S3は、文型パタンを抽出する。これは、
S2で形態素解析した結果に対して、文型パタン抽出規
則4を適用し、文型パタンの抽出を行う。例えば図3の
(a)で形態素解析した結果に対して、図4の文型パタ
ン抽出規則4を繰り返し適用し、図3の(b)、
(c)、(d)、(e)に示すように、これ以上適用で
きなくなった図3の(e)の文型パタンを抽出する。例
えば図3の(a)の形態素解析した結果に対して文型パ
タン抽出規則4を繰り返し適用し、図3の(b)、
(c)、(d)、(e)に示すように置き換える。以下
具体的に説明する。
S2で形態素解析した結果に対して、文型パタン抽出規
則4を適用し、文型パタンの抽出を行う。例えば図3の
(a)で形態素解析した結果に対して、図4の文型パタ
ン抽出規則4を繰り返し適用し、図3の(b)、
(c)、(d)、(e)に示すように、これ以上適用で
きなくなった図3の(e)の文型パタンを抽出する。例
えば図3の(a)の形態素解析した結果に対して文型パ
タン抽出規則4を繰り返し適用し、図3の(b)、
(c)、(d)、(e)に示すように置き換える。以下
具体的に説明する。
【0019】(1) 親クラス は、“普通名詞”であるので“名詞類”に置き換え、更
に、当該普通名詞を任意の表層表現(*)で表現し、結
果として(名詞類,*)と置き換える。
に、当該普通名詞を任意の表層表現(*)で表現し、結
果として(名詞類,*)と置き換える。
【0020】(2) の は、“助詞”であるので“助詞”に置き換え、更に、当
該助詞をそのまま「の」で表現し、結果として(助詞,
「の」)と置き換える。
該助詞をそのまま「の」で表現し、結果として(助詞,
「の」)と置き換える。
【0021】(3) スロット は、“普通名詞”であるので“名詞類”に置き換え、更
に、当該普通名詞を任意の表層表現(*)で表現し、結
果として(名詞類,*)と置き換える。
に、当該普通名詞を任意の表層表現(*)で表現し、結
果として(名詞類,*)と置き換える。
【0022】(4) これら(1)から(3)によっ
て、図3の(b)に示すように、(名詞類,*)(助
詞,「の」)(名詞類,*)と置き換える。
て、図3の(b)に示すように、(名詞類,*)(助
詞,「の」)(名詞類,*)と置き換える。
【0023】(5) (4)に対して、図4の(a)の
文型パタン抽出規則のの(名詞類,*)(助詞,
[の])(名詞類,*)→(名詞類,N)を適用し、
(名詞類,N)と置き換える(図3の(c)、(d)参
照)。
文型パタン抽出規則のの(名詞類,*)(助詞,
[の])(名詞類,*)→(名詞類,N)を適用し、
(名詞類,N)と置き換える(図3の(c)、(d)参
照)。
【0024】(6) 同様に、形態素解析したを を(助詞,「を」)に置き換える。
【0025】(7) 同様に、形態素解析した親スロット を(名詞類,N)に置き換える。
【0026】(8) 同様に、形態素解析したと を(助詞,「と」)に置き換える。
【0027】(9) 同様に、形態素解析した呼ぶ を(動詞「呼ぶ」)に置き換える。
【0028】(10) 以上の(1)から(9)の置き
換えによって、図3の(d)に示すように、(名詞類,
N)(助詞,[を])(名詞類,N)(助詞,「と」)
(動詞,「呼ぶ」)に置き換える。
換えによって、図3の(d)に示すように、(名詞類,
N)(助詞,[を])(名詞類,N)(助詞,「と」)
(動詞,「呼ぶ」)に置き換える。
【0029】(11) (10)は定義文であるので、
N を N と 呼ぶ。と変換し、求める文型パタンを
自動抽出する。
N を N と 呼ぶ。と変換し、求める文型パタンを
自動抽出する。
【0030】S4は、1文に対応する文型パタンの蓄積
を行う。これは、図1の文型パタン5として蓄積する。
S5は、終か判別する。これは、例えば分野別の多量の
文について全て文型パタンの抽出を終か判別する。YE
Sの場合には、S6に進む。NOの場合には、S1に戻
り、次の1文を取り込み、S2以降を繰り返す。
を行う。これは、図1の文型パタン5として蓄積する。
S5は、終か判別する。これは、例えば分野別の多量の
文について全て文型パタンの抽出を終か判別する。YE
Sの場合には、S6に進む。NOの場合には、S1に戻
り、次の1文を取り込み、S2以降を繰り返す。
【0031】S6は、文の種類毎にまとめる。これは、
S4で蓄積した文型パタンについて、文の種類(例えば
定義文、方法文など)毎にまとめる。S7は、まとめた
結果を統合する。これは、文の種類毎にまとめた文型パ
タンの集合、例えば図5の定義文の集合のの4つ、
の4つをそれぞれまとめて、図6の’、’に統合す
る(図6の説明参照)。
S4で蓄積した文型パタンについて、文の種類(例えば
定義文、方法文など)毎にまとめる。S7は、まとめた
結果を統合する。これは、文の種類毎にまとめた文型パ
タンの集合、例えば図5の定義文の集合のの4つ、
の4つをそれぞれまとめて、図6の’、’に統合す
る(図6の説明参照)。
【0032】以上によって、多量の分野別の文を1文ず
つ形態素解析、図4の文型パタン抽出規則を適用して図
5の文型パタンを抽出し、この図5の文型パタンの集合
をまとめて図6の統合した文型パタンを自動生成する。
これにより、多量の文から文型パタンを自動抽出するこ
とが可能となった。
つ形態素解析、図4の文型パタン抽出規則を適用して図
5の文型パタンを抽出し、この図5の文型パタンの集合
をまとめて図6の統合した文型パタンを自動生成する。
これにより、多量の文から文型パタンを自動抽出するこ
とが可能となった。
【0033】図3は、本発明の具体例説明図を示す。図
3の(a)は、形態素解析した結果を示す。下線の部分
が形態素解析して分割した文字列(それ以上分割すると
意味をなさなくなる単位)を示す。
3の(a)は、形態素解析した結果を示す。下線の部分
が形態素解析して分割した文字列(それ以上分割すると
意味をなさなくなる単位)を示す。
【0034】図3の(b)は、形態素解析した結果のう
ち、親クラス の スロット について、普通名詞“親クラス”、助詞“の”、普通名
詞“スロット”をもとに(名詞類,*)(助詞,
「の」)(名詞類,*)に置き換えた様子を示す。
ち、親クラス の スロット について、普通名詞“親クラス”、助詞“の”、普通名
詞“スロット”をもとに(名詞類,*)(助詞,
「の」)(名詞類,*)に置き換えた様子を示す。
【0035】図3の(c)は、図3の(b)に対して、
図4のの文型パタン抽出規則を適用して置き換えた結
果(名詞類,N)を示す。
図4のの文型パタン抽出規則を適用して置き換えた結
果(名詞類,N)を示す。
【0036】図3の(d)は、図3の(c)と同様に、
図4の文型パタン抽出規則を適用して置き換えた結果
(名詞類,N)(助詞,[を])(名詞類,N)(助
詞,「と」)(動詞,「呼ぶ」)を示す。
図4の文型パタン抽出規則を適用して置き換えた結果
(名詞類,N)(助詞,[を])(名詞類,N)(助
詞,「と」)(動詞,「呼ぶ」)を示す。
【0037】図3の(e)は、図3の(d)が定義文で
あるので、N を N と 呼ぶ。と変換し、文型パタ
ンに置き換えた様子を示す。
あるので、N を N と 呼ぶ。と変換し、文型パタ
ンに置き換えた様子を示す。
【0038】図4は、本発明の文型パタン抽出規則例を
示す。ここで、*は何でもよいことを表す。例えば(名
詞類,*)の*は名詞類であれば、何でもよいことを表
す。
示す。ここで、*は何でもよいことを表す。例えば(名
詞類,*)の*は名詞類であれば、何でもよいことを表
す。
【0039】Nは名詞を表す記号である。は、既述し
た図3の(b)に適用して図3の(c)に置き換えたと
きの文型パタン抽出規則である。
た図3の(b)に適用して図3の(c)に置き換えたと
きの文型パタン抽出規則である。
【0040】図5は、本発明の抽出した文型パタン例を
示す。これは、既述した図3のようにして文を形態素解
析して図4の文型パタン抽出規則を適用し、自動抽出し
た文型パタンの集合である。ここで、、の各4つの
定義文を統合すると、図6の’、’の定義文にそれ
ぞれまとめられる。
示す。これは、既述した図3のようにして文を形態素解
析して図4の文型パタン抽出規則を適用し、自動抽出し
た文型パタンの集合である。ここで、、の各4つの
定義文を統合すると、図6の’、’の定義文にそれ
ぞれまとめられる。
【0041】図6は、本発明の統合した文型パタン例を
示す。これは、上述したように、図5の、の文型パ
タンの4つをそれぞれまとめて統合した文型パタンであ
る。この統合した文型パタン中の、[ ]は、あっても
なくてもよい旨を表す記号である。
示す。これは、上述したように、図5の、の文型パ
タンの4つをそれぞれまとめて統合した文型パタンであ
る。この統合した文型パタン中の、[ ]は、あっても
なくてもよい旨を表す記号である。
【0042】|は、or(いずれかを)を表す記号であ
る。従って、図6の’の統合した文型パタンのうち、
あってもなくてもよい[]で囲まれたものを除くと、N
をNと{いう|呼ぶ|よぶ}。となり、|がorである
ので、これは、 ・NをNという。
る。従って、図6の’の統合した文型パタンのうち、
あってもなくてもよい[]で囲まれたものを除くと、N
をNと{いう|呼ぶ|よぶ}。となり、|がorである
ので、これは、 ・NをNという。
【0043】・NをNと呼ぶ。 ・NをNとよぶ。 の3つを表すこととなる。
【0044】次に、図2の(b)、および図7から図9
を用い、構文解析結果の表示および構文解析規則の編集
について図1の構成の動作を詳細に説明する。図2の
(b)は、構文解析規則の編集フローチャートを示す。
を用い、構文解析結果の表示および構文解析規則の編集
について図1の構成の動作を詳細に説明する。図2の
(b)は、構文解析規則の編集フローチャートを示す。
【0045】図2の(b)において、S11は、1文の
取り込みを行う。これは、図1のテキストベース部1か
ら構文解析対象のテキスト(文)群から1文の取り込み
を行う。
取り込みを行う。これは、図1のテキストベース部1か
ら構文解析対象のテキスト(文)群から1文の取り込み
を行う。
【0046】S12は、構文解析する。これは、S11
で取り込んだ1文を形態素解析した後、構文解析規則8
を適用して構文解析を行う。S13は、構文解析結果を
表示する。これは、例えば後述する図8に示すように、
画面上に構文解析結果およびそのときに適用した構文解
析規則8を対応づけて表示する。
で取り込んだ1文を形態素解析した後、構文解析規則8
を適用して構文解析を行う。S13は、構文解析結果を
表示する。これは、例えば後述する図8に示すように、
画面上に構文解析結果およびそのときに適用した構文解
析規則8を対応づけて表示する。
【0047】S14は、S13で表示した構文解析結果
が良好かユーザが判別する。YESの場合には、1文の
構文解析結果が良好であったので、S11に戻り、次の
1文の取り込みを行う。一方、NOの場合には、1文の
構文解析結果が良好でなかったので、S15でユーザが
構文解析規則8の修正を行う、即ち図8で画面上に表示
された構文解析結果、そのときに使用した構文解析規則
8と、このときの文に対応する文型パタンとを併せて表
示させておき、ユーザが両者を比較し、構文解析結果が
良好となるように、このときに使用した構文解析規則8
を修正する。
が良好かユーザが判別する。YESの場合には、1文の
構文解析結果が良好であったので、S11に戻り、次の
1文の取り込みを行う。一方、NOの場合には、1文の
構文解析結果が良好でなかったので、S15でユーザが
構文解析規則8の修正を行う、即ち図8で画面上に表示
された構文解析結果、そのときに使用した構文解析規則
8と、このときの文に対応する文型パタンとを併せて表
示させておき、ユーザが両者を比較し、構文解析結果が
良好となるように、このときに使用した構文解析規則8
を修正する。
【0048】S16は、S15で修正した構文解析規則
8について、文型パタン5と照合、即ち構文解析対象と
なっている文の文型パタンと照合して適合しているか判
別する。YESの場合には、適合しているので、S12
に戻り、修正後の構文解析規則8を使用し、構文解析を
再実行し、その構文解析結果およびそのときに使用した
構文解析規則を対応づけて画面上にS13で表示する。
そして、S14で良好となれば、この修正した構文解析
規則8を保存する。そして、S11に戻り、次の1文の
取り込みに進む。一方、S17でNOの場合には、ユー
ザに再度、構文解析規則の修正のやり直しを促すメッセ
ージを表示し、S15に戻る。
8について、文型パタン5と照合、即ち構文解析対象と
なっている文の文型パタンと照合して適合しているか判
別する。YESの場合には、適合しているので、S12
に戻り、修正後の構文解析規則8を使用し、構文解析を
再実行し、その構文解析結果およびそのときに使用した
構文解析規則を対応づけて画面上にS13で表示する。
そして、S14で良好となれば、この修正した構文解析
規則8を保存する。そして、S11に戻り、次の1文の
取り込みに進む。一方、S17でNOの場合には、ユー
ザに再度、構文解析規則の修正のやり直しを促すメッセ
ージを表示し、S15に戻る。
【0049】以上によって、自然言語文を1文つづ取り
込んで構文解析規則8を適用して構文解析結果およびそ
のときに使用した構文解析規則8を対応づけて画面上に
表示し、ユーザが構文解析結果が良好と判断したときに
次の1文の取り込みに進み、一方、構文解析結果が良好
でないと判断したときは文に対応する文型パタンと、使
用した構文解析規則8とを比較し、より望ましい構文解
析結果が得られるようにユーザが構文解析規則を修正す
る。そして、修正後の構文解析規則を使用して構文解析
を行い、構文解析結果および使用した構文解析規則を対
応づけて表示させ、良好であれば構文解析規則が修正さ
れたので、これを保存する。以下順次詳細に説明する。
込んで構文解析規則8を適用して構文解析結果およびそ
のときに使用した構文解析規則8を対応づけて画面上に
表示し、ユーザが構文解析結果が良好と判断したときに
次の1文の取り込みに進み、一方、構文解析結果が良好
でないと判断したときは文に対応する文型パタンと、使
用した構文解析規則8とを比較し、より望ましい構文解
析結果が得られるようにユーザが構文解析規則を修正す
る。そして、修正後の構文解析規則を使用して構文解析
を行い、構文解析結果および使用した構文解析規則を対
応づけて表示させ、良好であれば構文解析規則が修正さ
れたので、これを保存する。以下順次詳細に説明する。
【0050】図7は、本発明の構文解析規則の修正フロ
ーチャートを示す。図7において、S21は、解析結果
を表示する。これは、例えば図8の構文解析結果と示す
ように、予め作成した構文解析規則8を適用して生成し
た構文解析結果を図的に表示する。
ーチャートを示す。図7において、S21は、解析結果
を表示する。これは、例えば図8の構文解析結果と示す
ように、予め作成した構文解析規則8を適用して生成し
た構文解析結果を図的に表示する。
【0051】S22は、例文の種別をキーとして蓄積さ
れた文型パタンから関連する文型パタンを取り出して表
示する。これは、図8の例文の種別(例えば定義文)を
キーに既述したように文型パタン抽出規則4を適用して
抽出した文型パタンを含む統合した文型パタンを取り出
して表示する。
れた文型パタンから関連する文型パタンを取り出して表
示する。これは、図8の例文の種別(例えば定義文)を
キーに既述したように文型パタン抽出規則4を適用して
抽出した文型パタンを含む統合した文型パタンを取り出
して表示する。
【0052】S23は、解析結果に表示された構文解析
規則8の規則番号をキーとして関連する構文解析規則を
取り出して並べて表示する。これは、S21で表示した
構文解析結果について、使用した構文解析規則を取り出
して図8の使用した構文解析規則と記載したように表示
する。
規則8の規則番号をキーとして関連する構文解析規則を
取り出して並べて表示する。これは、S21で表示した
構文解析結果について、使用した構文解析規則を取り出
して図8の使用した構文解析規則と記載したように表示
する。
【0053】S24は、両者(文型パタンおよび構文解
析規則8)を比較・検討してよりよい構文解析規則をユ
ーザが作成し、それをもとに構文解析を行って構文解析
結果を修正する。
析規則8)を比較・検討してよりよい構文解析規則をユ
ーザが作成し、それをもとに構文解析を行って構文解析
結果を修正する。
【0054】S25は、修正後の構文解析結果を表示す
る。これらS24、S25は、例えば図8の構文解析結
果に使用して構文解析規則8を修正し、再度構文解析を
行って図9の構文解析結果のように修正して表示する。
る。これらS24、S25は、例えば図8の構文解析結
果に使用して構文解析規則8を修正し、再度構文解析を
行って図9の構文解析結果のように修正して表示する。
【0055】S26は、OKか判別する。これは、S2
5で修正して表示した構文解析結果がOKか判別する。
YESの場合には、修正できたので、その構文解析規則
8を保存して終了する。一方、NOの場合には、S23
に戻り繰り返す。
5で修正して表示した構文解析結果がOKか判別する。
YESの場合には、修正できたので、その構文解析規則
8を保存して終了する。一方、NOの場合には、S23
に戻り繰り返す。
【0056】以上によって、自然言語文に構文解析規則
8を適用して構文解析を行ってその構文解析結果を表示
およびそのときに使用した構文解析規則を対応づけて表
示すると共に、当該自然言語文の文型パタンを併せて表
示し、ユーザが文型パタンと使用した構文解析規則の両
者を比較・検討し、構文解析規則を修正する。そして、
修正後の構文解析規則を使用して再度、構文解析を行っ
てその構文解析結果および使用した構文解析規則を表示
することを繰り返し、所望の構文解析結果が得られるよ
うに構文解析規則を修正し、修正できたときにその構文
解析規則を保存する。これらにより、構文解析時に必要
な構文解析規則について、文型パタンを参照して容易に
構文解析規則を修正・作成することが可能となった。
8を適用して構文解析を行ってその構文解析結果を表示
およびそのときに使用した構文解析規則を対応づけて表
示すると共に、当該自然言語文の文型パタンを併せて表
示し、ユーザが文型パタンと使用した構文解析規則の両
者を比較・検討し、構文解析規則を修正する。そして、
修正後の構文解析規則を使用して再度、構文解析を行っ
てその構文解析結果および使用した構文解析規則を表示
することを繰り返し、所望の構文解析結果が得られるよ
うに構文解析規則を修正し、修正できたときにその構文
解析規則を保存する。これらにより、構文解析時に必要
な構文解析規則について、文型パタンを参照して容易に
構文解析規則を修正・作成することが可能となった。
【0057】図8は、本発明の文の構文解析結果例を示
す。ここで、構文解析結果の欄の上段は入力された自然
言語文を示し、下線は形態素解析した結果を示し、3行
目以降は構文解析結果の木構造およびそのときに使用し
て構文解析規則の番号、、を示す。
す。ここで、構文解析結果の欄の上段は入力された自然
言語文を示し、下線は形態素解析した結果を示し、3行
目以降は構文解析結果の木構造およびそのときに使用し
て構文解析規則の番号、、を示す。
【0058】使用した構文解析規則の欄は、構文解析結
果の欄で使用して構文解析規則の番号、、に対応
する構文解析規則を示す。文型パタンは、自然言語文の
文型パタンを示す。
果の欄で使用して構文解析規則の番号、、に対応
する構文解析規則を示す。文型パタンは、自然言語文の
文型パタンを示す。
【0059】図9は、本発明の文の修正した構文解析結
果例を示す。これは、図8の構文解析結果が非所望であ
ったので、ユーザが文型パタンを参照して構文解析規則
を図示のように修正したことに対応して、生成された構
文解析結果を示す。図中のから、(10)、(1
1)は、修正した構文解析規則に同一番号にそれぞれ対
応している。この図9の構文解析結果はOKであるの
で、このときに使用した構文解析規則を保存する。
果例を示す。これは、図8の構文解析結果が非所望であ
ったので、ユーザが文型パタンを参照して構文解析規則
を図示のように修正したことに対応して、生成された構
文解析結果を示す。図中のから、(10)、(1
1)は、修正した構文解析規則に同一番号にそれぞれ対
応している。この図9の構文解析結果はOKであるの
で、このときに使用した構文解析規則を保存する。
【0060】
【発明の効果】以上説明したように、本発明によれば、
対象とする範囲の多量のテキストを用意し、その全体に
亘って文型パタン抽出して統合したり、文型パタンを参
照して構文解析規則8を修正して望ましい構文解析結果
を生成できるように編集したりする構成を採用している
ため、多量の自然言語文から自動的に全ての文型パタン
を収集することができると共に、文型パタンの支援を受
けて構文解析規則を容易に修正・作成することができ
る。
対象とする範囲の多量のテキストを用意し、その全体に
亘って文型パタン抽出して統合したり、文型パタンを参
照して構文解析規則8を修正して望ましい構文解析結果
を生成できるように編集したりする構成を採用している
ため、多量の自然言語文から自動的に全ての文型パタン
を収集することができると共に、文型パタンの支援を受
けて構文解析規則を容易に修正・作成することができ
る。
【図1】本発明の原理ブロック図である。
【図2】本発明の全体動作説明フローチャートである。
【図3】本発明の具体例説明図である。
【図4】本発明の文型パタン抽出規則例である。
【図5】本発明の抽出した文型パタン例である。
【図6】本発明の統合した文型パタン例である。
【図7】本発明の構文解析規則の修正フローチャートで
ある。
ある。
【図8】本発明の文の構文解析結果例である。
【図9】本発明の文の修正した構文解析結果例である。
1:テキストベース部 2:形態素解析部 3:文型パタン抽出部 4:文型パタン抽出規則 5:文型パタン 6:文型パタン統合部 7:構文解析部 8:構文解析規則 9:結果表示・編集部
Claims (2)
- 【請求項1】テキストから文型パタンを自動抽出する文
型パタン抽出装置において、 多量のテキストを形態素解析する形態素解析部(2)
と、 この形態素解析部(2)によって形態素解析された結果
に対して、予め作成した文型パタン抽出規則(4)を適
用して文型パタンを抽出する文型パタン抽出部(3)
と、 この文型パタン抽出部(3)によって抽出された文型パ
タンの集合を統合する文型パタン統合部(6)とを備え
たことを特徴とする文型パタン抽出装置。 - 【請求項2】自然言語文について、予め作成された構文
解析規則(8)を適用して構文解析処理を行い、その構
文解析結果を表示させると共に当該構文解析結果を得る
のに使用した構文解析規則(8)を当該構文解析結果の
該当部分に対応づけて表示させる構文解析部(7)と、 上記自然言語文について関連する上記統合された文型パ
タンを取り出して併せて表示し、上記使用した構文解析
規則(8)の修正指示に対応して、上記統合された文型
パタンに適合するか否かを判別し、適合したときに修正
後の構文解析規則(8)を上記構文解析部(7)に渡
し、構文解析処理を行わせ、その構文解析結果を表示す
ると共に当該構文解析結果を得るのに使用した構文解析
規則(8)を対応づけて表示することを繰り返し、構文
解析規則(8)を編集する結果表示・編集部(9)とを
備え、 構文解析規則(8)を編集することを特徴とする請求項
1記載の文型パタン抽出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6051463A JPH07262189A (ja) | 1994-03-23 | 1994-03-23 | 文型パタン抽出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6051463A JPH07262189A (ja) | 1994-03-23 | 1994-03-23 | 文型パタン抽出装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07262189A true JPH07262189A (ja) | 1995-10-13 |
Family
ID=12887642
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6051463A Withdrawn JPH07262189A (ja) | 1994-03-23 | 1994-03-23 | 文型パタン抽出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07262189A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012181685A (ja) * | 2011-03-01 | 2012-09-20 | Toshiba Corp | 代表文抽出装置およびプログラム |
-
1994
- 1994-03-23 JP JP6051463A patent/JPH07262189A/ja not_active Withdrawn
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012181685A (ja) * | 2011-03-01 | 2012-09-20 | Toshiba Corp | 代表文抽出装置およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6782505B1 (en) | Method and system for generating structured data from semi-structured data sources | |
| US20070233460A1 (en) | Computer-Implemented Method for Use in a Translation System | |
| EP0645720A2 (en) | Dictionary creation supporting system | |
| Silberztein | NooJ: A Cooperative, Object-Oriented Architecture for NLP | |
| JP3832693B2 (ja) | 構造化文書検索表示方法及び装置 | |
| JPH1097541A (ja) | 文書ブラウズ支援システムおよび文書処理システム | |
| JPS6318458A (ja) | 感情情報抽出装置 | |
| JPH07262189A (ja) | 文型パタン抽出装置 | |
| JPH0877196A (ja) | 文書情報抽出装置 | |
| JP3311567B2 (ja) | 対訳文対応付け装置 | |
| JP2885489B2 (ja) | 文書内容検索装置 | |
| JP2536221B2 (ja) | 複合語抽出装置 | |
| JP2004318809A (ja) | 情報抽出規則生成装置および方法 | |
| JPH0743728B2 (ja) | 要約文生成方式 | |
| JP4399154B2 (ja) | 翻訳装置、及び翻訳プログラム | |
| JP3003459B2 (ja) | プログラム作成支援装置 | |
| JP3419483B2 (ja) | 自然言語処理装置及びその方法 | |
| KR20000049713A (ko) | 인터넷신문의 저작시스템 및 저작방법 | |
| JPH03127266A (ja) | 機械翻訳装置における単語間関係編集/学習装置 | |
| JP2001067356A (ja) | 語彙獲得方法、語彙獲得装置及び語彙獲得プログラムを記録したコンピュータ読み取り可能な記憶媒体 | |
| JP2004310170A (ja) | 対訳単語対の学習方法、装置、及び、対訳単語対の学習プログラムを記録した記録媒体 | |
| Yona | A finite-state based morphological analyzer for Hebrew | |
| JPH0728821A (ja) | テキスト処理装置 | |
| JPS62272358A (ja) | 翻訳装置における翻訳中断時の表示方式 | |
| JP2000311088A (ja) | データ検索装置、方法及び記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20010605 |