JPH04220767A - 文脈処理方式 - Google Patents

文脈処理方式

Info

Publication number
JPH04220767A
JPH04220767A JP2404767A JP40476790A JPH04220767A JP H04220767 A JPH04220767 A JP H04220767A JP 2404767 A JP2404767 A JP 2404767A JP 40476790 A JP40476790 A JP 40476790A JP H04220767 A JPH04220767 A JP H04220767A
Authority
JP
Japan
Prior art keywords
expression
meaning
semantic
pattern matching
noun phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2404767A
Other languages
English (en)
Inventor
Ko Ri
航 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2404767A priority Critical patent/JPH04220767A/ja
Publication of JPH04220767A publication Critical patent/JPH04220767A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然言語による情報検
索方式において、自然言語の入力文の中に現れる指示代
名詞の指示対象を認定し、省略された名詞句を補完する
自然言語の文脈処理方式に関する。
【0002】
【従来の技術】自然言語による情報検索において、ユー
ザの自然言語による検索が入力され、情報検索用命令言
語に変換される。自然言語による情報検索を利用するこ
とによって、情報検索用命令言語を知らないユーザでも
、例えば、日本語でデータベースを検索することができ
る。自然言語による情報検索方式においては、自然言語
の入力文の指示代名詞の指示対象を認定し、省略された
名詞句を補完する必要がある。
【0003】従来において、意味ネットワークにある単
語間の意味関係を参照することによって文脈処理を実現
していた。図2に意味ネットワークの例を示す。例えば
、「太郎が花子を愛している」の文脈の中で「彼女は美
人だ」という文の「彼女」が「花子」を指示することが
、「花子」と「彼女」が同じく意味ネットワークにおい
て「女性」の下位関係にあることによって認定される。
【0004】例えば、特開昭62−206670 に記
載のように、上位下位関係と属性関係と深層格関係と類
義関係という意味関係をもつ意味ネットワークを参照す
ることによって、文脈処理を実現していた。図3に特開
昭62−206670 に記載の文脈処理方式の構成図
を示す。
【0005】
【発明が解決しようとする問題点】意味ネットワークに
おける単語間の意味関係を参照する前記従来の文脈処理
方式においては、膨大な意味ネットワークを用意しなけ
ればならず、ネットワークにおけるデータの検索を効率
よく実現することができない。更に、自然言語の単語の
数の増大にともない、意味ネットワークの用意が実質的
に不可能になる。
【0006】
【課題を解決するための手段】第1の発明は、計算機に
入力された、情報検索のための自然言語を解析し、情報
検索用命令言語に変換する方式において、各単語の意味
標識を登録する意味標識辞書と入力文を受理して前記意
味標識辞書を参照し第1の意味表現を出力する構文解析
手段と、第1の意味表現と第2の意味表現とのパターン
照合を行い第3の意味表現を出力するパターン照合手段
と、前記パターン照合手段から出力された第3の意味表
現を格納し、第2の意味表現として出力する先行文脈格
納手段とからなることを特徴とする。
【0007】第2の発明は、検索情報のデータモデルを
参照することによって、第1の意味表現と第2の意味表
現とのパターン照合を行い第3の意味表現を出力するパ
ターン照合手段を用いることを特徴とする。
【0008】第3の発明は、機能表現のテーブルを参照
することによって、第1の意味表現と第2の意味表現と
のパターン照合を行い第3の意味表現を出力するパター
ン照合手段を用いることを特徴とする。
【0009】第4の発明は、検索情報のデータモデル及
び機能表現のテーブルを参照することによって第1の意
味表現と第2の意味表現とのパターン照合を行い第3の
意味表現を出力するパターン照合手段を用いることを特
徴とする。
【0010】
【作用】本発明の文脈処理方式において、パターン照合
手段が、単語の意味標識と検索情報のデータモデルと機
能表現のテーブルを参照することによって、意味表現と
先行文脈とのパターン照合を行う。意味標識辞書と検索
情報のデータモデルと機能表現テーブルは、単語間の兄
弟関係だけに着目するデータで、簡単に用意することが
できる。
【0011】意味標識辞書は単語の数のオーダーの記述
量ですむ。検索情報のデータモデルとして、データベー
スのスキーマがある。データベースのスキーマはデータ
ベースが定義された時点で定まり、その記述量が限られ
ている。機能表現のテーブルに記述される機能表現の数
も限られている。全体として、より少ない計算機のメモ
リで文脈処理を実現することができる。
【0012】更に、意味表現と先行文脈とのパターン照
合を行うパターン照合手段において、参照する単語の意
味標識辞書と検索情報のデータモデルと機能表現テーブ
ルが分散された形で記述されているため、パターン照合
の成功の可能性が高く、処理の効率がよい。
【0013】
【実施例】以下本発明の実施例を示す。図1は本発明の
文脈処理方式の構成を示す図である。図1においては、
1が入力文、2が意味標識辞書、3が構文解析手段、4
が検索情報のデータモデル、5がパターン照合手段、6
が先行文脈格納手段、7が機能表現テーブル、8が結果
出力手段である。
【0014】a.意味標識辞書 本発明において、単語の意味標識を、その単語の上位概
念によって定義する。例えば、名詞句「計算機」の上位
概念が「もの」であるので、名詞句「計算機」の意味標
識を「もの」と定義する。予め、あらゆる可能な意味標
識を用意し、意味標識辞書に各単語の意味標識を登録す
る。図4に名詞句の可能な意味標識の一覧を示す。図4
においては、意味標識を略記号で表現している。例えば
、意味標識「もの」の略記号が「mo」である。図5に
意味標識辞書における単語の意味標識の例を示す。
【0015】b.検索情報のデータモデル検索情報のデ
ータモデルは、検索情報がデータベースに格納される場
合、データベーススキーマによって実現される。データ
ベースのスキーマは、検索する情報の格納されるデータ
ベースのデータ項目によって定義される。 例えば、図6に示すデータベースのスキーマは、図7に
示す通りである。他のデータベースと共通した項目を持
つデータベースのスキーマがその共通した項目によって
他のデータベースのスキーマと関連づけられ、一緒に定
義される。例えば、図8に示しているように、「名前」
という共通した項目をもつ二つのデータベースのスキー
マが「名前」という共通した項目によって関連づけられ
、定義される。
【0016】c.機能表現テーブル 自然言語の入力文の中に、検索する情報の内容に依存し
ない検索機能だけを表現する機能表現がある。例えば、
「値段の平均値を示せ」の中の名詞句「平均値」と「身
長の平均値を示せ」の中の名詞句「平均値」が検索する
情報の内容によらず、共に検索機能の「平均値」を表現
する。このように、予め機能表現となる単語の機能表現
テーブルを用意する。図9に名詞句の機能表現のテーブ
ルの一例を示す。
【0017】d.構文解析手段 構文解析手段は、入力文を受理し、意味表現を出力する
。意味表現は、自然言語の検索内容を表現するものであ
る。図10に意味表現の例を示す。
【0018】e.先行文脈格納手段 先行文脈格納手段は、ユーザの一つ前の情報検索で検索
した先行文脈を格納する。本発明において、先行文脈の
表現手段を、意味表現と同じ表現にする。例えば、一つ
前の情報検索が「A社の売上を示せ」である時、先行文
脈格納手段は、「A社の売上を示せ」という文の意味表
現を格納する。
【0019】f.パターン照合手段 パターン照合手段は、先行文脈格納手段から得られる先
行文脈の意味表現と構文解析手段から得られる入力文の
意味表現を入力しパターン照合を行うことにより、先行
文脈中の名詞句と兄弟関係にある入力文中の名詞句を検
出し、パターン照合された意味表現を結果出力手段に出
力する。また、入力文中に、先行文脈中の名詞句と兄弟
関係にある名詞句がない場合、パターン照合手段は、構
文解析手段からの入力文の意味表現を結果出力手段に出
力する。兄弟関係にある名詞句とは、 イ.同じ意味標識を持つ名詞句 ロ.同じスキーマにある、或いは関連づけられたスキー
マにある名詞句 ハ.機能表現のテーブルに登録された名詞句をいう。
【0020】例えば、名詞句「太郎」と名詞句「花子」
が共に「hi」という意味標識をもつため、互いに兄弟
関係にある。図5に名詞句「太郎」と名詞句「花子」の
意味標識を示している。また、名詞句「値段」と名詞句
「年齢」が共に関連づけられたデータベースのスキーマ
にあるため、互いに兄弟関係にある。図8に名詞句「値
段」と名詞句「年齢」の関係を示している。また、名詞
句「平均値」と名詞句「最大値」が共に機能表現のテー
ブルにあるため、互いに兄弟関係にある。図7に名詞句
「平均値」と「最大値」の入っている機能表現のテーブ
ルの例を示している。
【0021】以下では、入力文における名詞句と先行文
脈における名詞句が兄弟関係にある場合、それぞれを名
詞句1と名詞句2と記す。パターン照合手段は名詞句1
を修飾する入力文における名詞句と名詞句2を修飾する
先行文脈における名詞句とのパターン照合を行い、同時
に名詞句1に修飾される入力文における名詞句と名詞句
2に修飾される先行文脈における名詞句とのパターン照
合を行う。
【0022】パターン照合手段は、名詞句1を修飾する
名詞句と名詞句2を修飾する名詞句とのパターン照合を
行うとき、名詞句1を修飾する名詞句と名詞句2を修飾
する名詞句が更に兄弟関係にあるかどうかを検出する。 名詞句1を修飾する名詞句が、名詞句2を修飾する名詞
句と兄弟関係になければ、パターン照合手段が名詞句2
を修飾する名詞句を名詞句1を修飾するものとして新た
に入力された意味表現に付け加える。例えば、「太郎の
年齢を教えてください」の意味表現が先行文脈にあって
、次に「その住所は」が入力された場合、「住所」は「
年齢」と共に同じデータベースのスキーマにあるため、
兄弟関係にある。「年齢」を修飾する「太郎」が、「住
所」を修飾する他の部分と更に兄弟関係にないため、パ
ターン照合手段は「太郎」を修飾する部分として新たに
「年齢」に付け加えて、「太郎の住所は」という意味表
現を結果出力手段に出力する。
【0023】また、「値段の最大値は」が先行文脈にあ
って、「その平均値は」が次に入力される場合、「最大
値」と「平均値」が共に機能表現のテーブルにあるため
、兄弟関係にある。パターン照合手段が入力された意味
表現と先行文脈とのパターン照合を行った結果、「最大
値」を修飾する「値段」を新たに「平均値」につけて、
「値段の平均値」という意味表現を出力する。
【0024】また、「太郎の年齢を教えてください」と
いう先行文脈があって、次に「花子の住所は」が入力さ
れた場合、「住所」と「年齢」が兄弟関係にある。しか
し、「年齢」を修飾する「太郎」と「住所」を修飾する
「花子」とが兄弟関係にあるため、パターン照合手段は
「花子の住所は」という入力文の意味表現を結果出力手
段に出力する。
【0025】パターン照合手段は、名詞句1に修飾され
る名詞句が名詞句2に修飾される名詞句と兄弟関係にな
ければ、名詞句2に修飾される名詞句を、名詞句1に修
飾されるものとして、新たに入力された意味表現に付け
加える。例えば、「太郎の年齢を教えてください」とい
う入力文が先行文脈にあって、次に「花子は」が入力さ
れた場合、意味表現と先行文脈の照合によって、「太郎
」と「花子」が兄弟関係にあることが検出される。 「太郎」に修飾されるのが「年齢」であり、「花子」に
修飾されるものがないので、パターン照合手段は「年齢
」を「花子」に修飾されるものとして新たに入力された
意味表現に付け加えて、「花子の年齢は」という意味表
現を結果出力手段に出力する。
【0026】図11にパターン照合手段の行うパターン
照合の例を示す。図11においては、(1)が先行文脈
の意味表現、(2)が構文解析手段から入力される入力
文の意味表現、(3)が(1)と(2)に示した意味表
現をパターン照合することによって得られる意味表現で
ある。
【0027】g.結果出力手段 結果出力手段は、パターン照合手段からの意味表現を入
力し、先行文脈格納手段に先行文脈の意味表現として出
力する。
【0028】
【発明の効果】本発明によって、自然言語による情報検
索の方式において、指示代名詞の指示対象を認定し、名
詞句の補完を実現することができる。意味標識辞書と検
索情報のデータモデルと機能表現のテーブルを参照する
ことによって、従来の方式より少ない計算機の記述で文
脈処理に必要なデータを記述することができ、処理効率
の向上をはかることができる。
【図面の簡単な説明】
【図1】本発明の文脈処理方式の構成を示す図である。
【図2】意味ネットワークの例を示す図である。
【図3】従来の文脈処理方式の例を示す図である。
【図4】名詞句の意味標識の一覧を示す図である。
【図5】意味標識辞書における単語の意味標識の例を示
す図である。
【図6】データベースの例を示す図である。
【図7】データベースのスキーマの例を示す図である。
【図8】関連づけられたデータベースのスキーマの例を
示す図である。
【図9】機能表現のテーブルの例を示す図である。
【図10】意味表現の例を示す図である。
【図11】パターン照合手段の行うパターン照合の例を
示す図である。
【符号の説明】
1  入力文 2  意味標識辞書 3  構文解析手段 4  検索情報のデータモデル 5  パターン照合手段 6  先行文脈格納手段 7  機能表現テーブル 8  結果出力手段

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】  計算機に入力された、情報検索のため
    の自然言語を解析し、情報検索用命令言語に変換する方
    式において、各単語の意味標識を登録する意味標識辞書
    と、入力文を受理して前記意味標識辞書を参照し第1の
    意味表現を出力する構文解析手段と、第1の意味表現と
    第2の意味表現とのパターン照合を行い第3の意味表現
    を出力するパターン照合手段と、前記パターン照合手段
    から出力された第3の意味表現を格納し、第2の意味表
    現として出力する先行文脈格納手段とからなることを特
    徴とする文脈処理方式。
  2. 【請求項2】  検索情報のデータモデルを参照するこ
    とによって、前記第1の意味表現と前記第2の意味表現
    とのパターン照合を行い前記第3の意味表現を出力する
    パターン照合手段を用いることを特徴とする請求項1に
    記載の文脈処理方式。
  3. 【請求項3】  機能表現のテーブルを参照することに
    よって、前記第1の意味表現と前記第2の意味表現との
    パターン照合を行い前記第3の意味表現を出力するパタ
    ーン照合手段を用いることを特徴とする請求項1に記載
    の文脈処理方式。
  4. 【請求項4】  検索情報のデータモデル及び機能表現
    のテーブルを参照することによって、前記第1の意味表
    現と前記第2の意味表現とのパターン照合を行い前記第
    3の意味表現を出力するパターン照合手段を用いること
    を特徴とする請求項1に記載の文脈処理方式。
JP2404767A 1990-12-21 1990-12-21 文脈処理方式 Pending JPH04220767A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2404767A JPH04220767A (ja) 1990-12-21 1990-12-21 文脈処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2404767A JPH04220767A (ja) 1990-12-21 1990-12-21 文脈処理方式

Publications (1)

Publication Number Publication Date
JPH04220767A true JPH04220767A (ja) 1992-08-11

Family

ID=18514426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2404767A Pending JPH04220767A (ja) 1990-12-21 1990-12-21 文脈処理方式

Country Status (1)

Country Link
JP (1) JPH04220767A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195374A (ja) * 1992-09-25 1994-07-15 Nec Corp 文脈解析方式
US5734889A (en) * 1993-07-29 1998-03-31 Nec Corporation Method and apparatus for retrieving data and inputting retrieved data to spreadsheet including descriptive sentence input means and natural language interface means

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195374A (ja) * 1992-09-25 1994-07-15 Nec Corp 文脈解析方式
US5734889A (en) * 1993-07-29 1998-03-31 Nec Corporation Method and apparatus for retrieving data and inputting retrieved data to spreadsheet including descriptive sentence input means and natural language interface means

Similar Documents

Publication Publication Date Title
CN109684448B (zh) 一种智能问答方法
JP2783558B2 (ja) 要約生成方法および要約生成装置
McKeown Paraphrasing questions using given and new information
Kiyavitskaya et al. Cerno: Light-weight tool support for semantic annotation of textual documents
CA2329345A1 (en) Method and apparatus for processing free-format data
Rodrigues et al. Advanced applications of natural language processing for performing information extraction
Beckwith et al. Implementing a lexical network
CN111859858A (zh) 从文本中提取关系的方法及装置
Melo et al. A strategy for archives metadata representation on CIDOC-CRM and knowledge discovery
JP2002132811A (ja) 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体
Kazman Structuring the text of the Oxford English Dictionary through finite state transduction
Radoev et al. A language adaptive method for question answering on French and English
Gautam et al. Soundex algorithm revisited for Indian language
Fatima et al. STEMUR: An automated word conflation algorithm for the Urdu language
Šukys Querying ontologies on the base of semantics of business vocabulary and business rules
Mandal et al. Natural language query in Bengali to SQL generation using named entity recognition
JPH04220767A (ja) 文脈処理方式
Arumugam Processing the textual information using open natural language processing (NLP)
Salem et al. Designing an XML lexicon architecture for Arabic machine translation based on Role and Reference Grammar
Bajwa et al. A controlled natural language interface to class models
Izo et al. Named entities as a metadata resource for indexing and searching information
Du On the use of natural language processing for automated conceptual data modeling
AU774729B2 (en) Method and apparatus for processing free-format data
Antony et al. Entity and verb semantic role labelling for tamil biomedicine
JP2013206130A (ja) 検索装置、検索方法およびプログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980414