JPH0310374A - 漢字複合語キーワード検索装置 - Google Patents

漢字複合語キーワード検索装置

Info

Publication number
JPH0310374A
JPH0310374A JP1146361A JP14636189A JPH0310374A JP H0310374 A JPH0310374 A JP H0310374A JP 1146361 A JP1146361 A JP 1146361A JP 14636189 A JP14636189 A JP 14636189A JP H0310374 A JPH0310374 A JP H0310374A
Authority
JP
Japan
Prior art keywords
vocabulary
word
search
library
decomposing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1146361A
Other languages
English (en)
Other versions
JP2666475B2 (ja
Inventor
Kiyoshi Aimori
會森 清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1146361A priority Critical patent/JP2666475B2/ja
Publication of JPH0310374A publication Critical patent/JPH0310374A/ja
Application granted granted Critical
Publication of JP2666475B2 publication Critical patent/JP2666475B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、検索質問として入力した質問語を用語分解用
辞書を用いて単語に分解し、分解した単語をAND演算
子で結合し、その式と入力した質問語をOR演算子で結
合した検索式を自動的に生成してデータベースを検索す
る漢字複合語キーワード検索装置に関する。
〔従来の技術〕
従来のこの種の漢字キーワード検索は、検索者が投入し
た用語をシステムが読みとり、そのままキーワードとし
てデータベースに対して検索処理を行っている。複数の
単語からなる複合語のキーワードを投入した場合でも、
複合語を構成している個々の単語には着目せずに、その
ままをキーワードとして検索している。特に複合語の場
合、単語に分解して検索式を生成するのは、検索者の作
業に頼っている。
〔発明が解決しようとする課題〕
上述したような従来の日本語キーワード検索手段は、複
合語を構成している個々の単語がテキスト中に現われて
、しかも質問語に表現される検索要求が複合語の現われ
るテキストと同じであってもそれをヒツトせず、このた
め検索精度が落ちるという欠点がある。また、検索者が
複合語を単語に分解して個々の単語をAND演算子で結
合するにしても、その検索者が、使用するデータベース
を熟知していないと、データベースに合った検索式を作
成できないという欠点もある。
〔発明が解決しようとする課題〕
本発明の漢字複合語キーワード検索装置は、上述した従
来の問題を解決し得る漢字複合語キーワード検索装置を
提供するもので、検索質問として入力する質問語を読込
むデータ入力手段と、入力した質問語を単語に分解する
ために使用する用語分解用辞書を参照しながら質問語の
先頭文字を開始点として質問語を単語に分解する処理を
質問語の最後の文字まで繰り返す用語分解手段と、用語
分解用辞書を用いて分解した単語と質問語から検索式を
生成する検索式生成手段と、データベースのインデック
スに対して検索式生成部で作った検索式を満たすテキス
トデータがあるか否かを検索して適合した件数である回
答を出力する検索手段とを備えている。
〔実施例〕
次に、本発明の実施例について図面を参照して説明する
第1図は本発明の一実施例を示すブロック図である。第
2図は第1図の実施例において入力した質問語を単語に
分解するために参照する用語分解用辞書の内容の一例を
示す説明図である。第3図は第1図の実施例において用
語分解の手順を示す説明図である。第4図は第1図の実
施例において検索対象となるデータベースの内容の一例
を示す説明図であり、テキストデータと検索時に参照す
るインデックスとから構成されている。ここで、個々の
キーワードは各データに付与されており、個々のキーワ
ードは付与されているデータのレコード番号をもってい
る。このレコード番号テテータとインデックスが対応し
ている。第5図は第1図の実施例において分解した用語
を格納するキーワード保存テーブルの内容の一例を示す
説明図である。
第1図において、1は検索質問として入力される質問語
、2は質問語1を読込むデータ入力部、3は質問語を単
語に分解するために使用する用語分解用辞書4を参照し
ながら質問語1を分解する用語分解部である。用語分解
部3では、はじめに質問語1をキーワード保存テーブル
に格納し、続いて用語分解を行う。まず質問語1の先頭
文字を開始点とし、1文字目の用語が用語分解用辞書4
の中の用語と一致するか否かを調べる。一致しない場合
は、さらに1文字加えた長さまでの用語が用語分解用辞
書4の中の用語と一致するか否かを調べる。一致した場
合は、開始点から一致した長さまでの用語をキーワード
保存テーブルに格納する。そして一致した長さに1を加
えた次の文字を新たな開始点とする。上述の処理を質問
語1の最後の文字まで繰返す。ここで一致する用語がな
く、最後の文字に到達したときは、開始点からの文字を
キーワード保存テーブルに格納する。5はキワード保存
テーブルに格納した用語を用いて検索部6に渡す検索式
を生成する検索式生成部である。
検索式は、分解した用語が同一データ内に出現しても検
索できるように、分解した用語をAND演算子で結合し
、その検索結果と入力した質問語1の検索結果の論理和
を回答8として出力するように、AND演算子で結合し
た式と質問語1とをOR演算子で結合し、 A  OR(B  AND  CAND・・・・・・)
の形式をとる。ここで、Aは質問語1を、BおよびCは
それぞれキーワード保存テーブルに格納されている分解
された用語を示す。キーワード保存テーブルに質問語1
と同じ用語が格納されている場合は、質問語1がそのま
ま検索式として生成される。すなわち という検索式が生成される。6はデータベース7のイン
デックスに対して検索式生成部5で作った検索式を満た
すテキストデータがあるか否かを探=6 索し、適合した件数である回答8を出力する検索部であ
る。
次に一例をあげて上述の実施例の動作について説明する
。説明の都合上、質問語1に「図書館業務」を入力した
ものとする。
データ入力部2は、「図書館業務」といり質問語1を読
込んで用語分解部3に渡す。用語分解部3は、はじめに
キーワード保存テーブルに質問語1 「図書館業務」を
格納する。続いて用語「図」を始めの開始点21として
用語分解用辞書4に「図」があるか否かを調べる。しか
し、これは存在しないので、次の1文字を加えて用語「
図書」で参照する。このように調べていくと、第2図に
示すように用語「図書館」 31が一致することがわか
る。用語「図書館J31をキーワード保存テーブルに格
納し、続いて「業」を次の開始点22として探索すると
、用語「業務」32が用語分解用辞書4に存在するので
、これをキーワード保存テーブルに格納する。このテー
ブルは検索式生成部5に渡され、「図書館」と「業務」
とをAND演算子て結合し、その式と「図書館」をOR
演算子で結合した 図書館業務 OR(図書館 AND  業務)という検
索式を生成する。
検索部6では、データベース7のインデックス部に対し
「図書館業務」というキーワードを、もつデータまたは
「図書館」と「業務」という二つのキーワードをもつデ
ータを探索し、その論理和をとる。第4図に示すように
「図書館業務」というキーワードをもつデータはデータ
3に格納され、「図書館」と「業務」の2つのキーワー
ドをもつデータは、データ1およびデータ2およびデー
タ3に格納されていることがわかる。結果として回答7
には「3件」が出力される。
さらに−例として「レファレンス」といつ質問語1を入
力したとする。はじめにキーワード保存テーブルに「レ
ファレンスJを格納する。続いて用語分解部5は、用語
「しjを開始点として用語分解用辞書4を参照する。こ
れにより第2図に示すように用語分解用辞書4には用語
[レファレンス」が格納されていることがわかり、これ
をキーワード保存テーブルに格納する。このテーブルは
検索式生成部5に渡されて検索式を生成する。ここで、
質問語1と同じ用語がキーワード保存テーブルに格納さ
れているため、 レファレンス という検索式が生成される。検索部6ではデータベース
に対し「レファレンス」というキーワードをもつデータ
を探索し、第2図に示すように回答7には「2件」が出
力される。
〔発明の効果〕
以上説明したように、本発明の漢字複合語キーワード検
索装置は、質問として入力された質問語を用語分解用辞
書を用いて単語に分解し、質問語と分解された単語とか
ら検索式を自動的に生成してデータベースを検索するこ
とにより、複合語を構成している個々の単語がテキスト
中に現われて、しかも質問語に表現される検索要求が複
合語の現われるテキストと同じであってもヒツトしない
ということや、検索者が個々の単語をAND演算子− で結合する必要がなくなるため、熟練していない検索者
でも熟練者と同じ検索結果を得ることができるという効
果がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図の実施例において入力した用語を単語に分解する
ために参照する用語分解用辞書の内容を示す説明図、第
3図は第1図の実施例の用語分解の手順を示す説明図、
第4図は第1図の実施例において検索対象となるデータ
ベースの内容の一例を示す説明図、第5図は第1図の実
施例において分解された検索語を格納するキーワード保
存テーブルの内容の一例を示す説明図である。 1・・・・・・質問語、2・・・・・・データ入力部、
3・・・・・用語分解部、4・・・・・・用語分解用辞
書、5・・・・・・検索式生成部、6・・・・・・検索
部、7・・・・・・データベース、8・・・・・・回答

Claims (1)

    【特許請求の範囲】
  1. 検索質問として入力する質問語を読込むデータ入力部と
    、入力した前記質問語を単語に分解するために使用する
    用語分解用辞書を参照しながら前記質問語の先頭文字を
    開始点として質問語を単語に分解する処理を質問語の最
    後の文字まで繰返す用語分解部と、前記用語分解辞書を
    用いて分解した単語と前記質問語から検索式を生成する
    検索式生成部と、データベースのインデックスに対して
    前記検索式生成部で作った検索式を満たすテキストデー
    タがあるか否かを探索して適合した件数である回答を出
    力する検索部とを備えることを特徴とする漢字複合語キ
    ーワード検索装置。
JP1146361A 1989-06-07 1989-06-07 漢字複合語キーワード検索装置 Expired - Lifetime JP2666475B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1146361A JP2666475B2 (ja) 1989-06-07 1989-06-07 漢字複合語キーワード検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1146361A JP2666475B2 (ja) 1989-06-07 1989-06-07 漢字複合語キーワード検索装置

Publications (2)

Publication Number Publication Date
JPH0310374A true JPH0310374A (ja) 1991-01-17
JP2666475B2 JP2666475B2 (ja) 1997-10-22

Family

ID=15405982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1146361A Expired - Lifetime JP2666475B2 (ja) 1989-06-07 1989-06-07 漢字複合語キーワード検索装置

Country Status (1)

Country Link
JP (1) JP2666475B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09198395A (ja) * 1996-01-16 1997-07-31 Fuji Xerox Co Ltd 文書検索装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63201824A (ja) * 1987-02-18 1988-08-19 Hitachi Ltd 検索キ−ワ−ド選択方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63201824A (ja) * 1987-02-18 1988-08-19 Hitachi Ltd 検索キ−ワ−ド選択方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09198395A (ja) * 1996-01-16 1997-07-31 Fuji Xerox Co Ltd 文書検索装置

Also Published As

Publication number Publication date
JP2666475B2 (ja) 1997-10-22

Similar Documents

Publication Publication Date Title
US6167370A (en) Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
US7444326B1 (en) Method of performing approximate substring indexing
JPH0527149B2 (ja)
JPH11110413A (ja) データベース検索結果を生成するための方法および装置
JPH0395673A (ja) 文章間リンク設定方法およびその装置
JP3123836B2 (ja) テキスト型データベース装置
JPH0310374A (ja) 漢字複合語キーワード検索装置
JPS617936A (ja) 情報検索方式
JP3558267B2 (ja) 文書検索装置
JPH0581326A (ja) データベース検索装置
JP3222193B2 (ja) 情報検索装置
JP3343941B2 (ja) 例文検索システム
JPH0944521A (ja) インデックス作成装置および文書検索装置
JPH03148765A (ja) 文書検索装置
JPH08249341A (ja) 文書データベースの文書格納・検索装置
US20040249827A1 (en) System and method of retrieving a range of rows of data from a database system
JPH1125117A (ja) 語検索装置
JPH06504858A (ja) テキスト管理システム
JPS60247756A (ja) デ−タベ−ス装置
JPH06168271A (ja) 項目別辞書利用データベース検索システム
JPH05250413A (ja) テキストデータ検索装置
JPH0765013A (ja) 文書検索装置
JPH0973460A (ja) 文書検索装置
JPH08287083A (ja) 辞書未登録語展開方法及び装置
JPH0731684B2 (ja) 日本語文章処理方式