JPH0481973A - 文書検索装置 - Google Patents
文書検索装置Info
- Publication number
- JPH0481973A JPH0481973A JP2195748A JP19574890A JPH0481973A JP H0481973 A JPH0481973 A JP H0481973A JP 2195748 A JP2195748 A JP 2195748A JP 19574890 A JP19574890 A JP 19574890A JP H0481973 A JPH0481973 A JP H0481973A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- search condition
- search
- condition expression
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、利用者がキーワードと論理演算子とからなる
検索条件式を作成入力し、この検索条件式に合致する文
書を文書データベース中から検索する文書検索装置に関
する。
検索条件式を作成入力し、この検索条件式に合致する文
書を文書データベース中から検索する文書検索装置に関
する。
従来の技術
従来1文書検索装置においては種々の検索方式があるが
、その一つとして各キーワード間の関連度を記述したキ
ーワードコネクション表なる知識ベースを用いて、関連
キーワード検索やあいまい検索を可能にしたものが、本
出願人により例えば特願昭63−8291号F文書検索
装置」等により提案されている。このような文書検索装
置にあっては、使用者が正確なキーワードを覚えていな
くてもキーワードコネクション表を使ったあいまい検索
を行なうことにより、適量・適量な検索結果を得ること
ができる。
、その一つとして各キーワード間の関連度を記述したキ
ーワードコネクション表なる知識ベースを用いて、関連
キーワード検索やあいまい検索を可能にしたものが、本
出願人により例えば特願昭63−8291号F文書検索
装置」等により提案されている。このような文書検索装
置にあっては、使用者が正確なキーワードを覚えていな
くてもキーワードコネクション表を使ったあいまい検索
を行なうことにより、適量・適量な検索結果を得ること
ができる。
発明が解決しようとする課題
ところが、このようなキーワードコネクション表を利用
したあいまい検索法にあっても、同義語のように表記は
異なるが意味が同一であるキーワードが存在する場合、
適切なコネクション値を実装できず、検索漏れを生じ得
る。これは、キーワードコネクション表を有しない従前
の文書検索装置にあってはもちろんである。
したあいまい検索法にあっても、同義語のように表記は
異なるが意味が同一であるキーワードが存在する場合、
適切なコネクション値を実装できず、検索漏れを生じ得
る。これは、キーワードコネクション表を有しない従前
の文書検索装置にあってはもちろんである。
課題を解決するための手段
キーワードと論理演算子とを組合せた検索条件式を作成
入力し、この検索条件式に合致する文書を検索するよう
にした文書検索装置、又は、キーワード間の関連度を記
述したキーワードコネクション表を有し、文書検索時に
キーワードと論理演算子とを組合せた検索条件式を作成
入力し、前記キーワードコネクション表を用いてこの検
索条件式に合致する文書を検索するようにした文書検索
装置において、同義語をなす語群を表として保持する同
義語テーブルを設け、入力された検索条件式中のキーワ
ードがこの同義語テーブル中に存在するときにその同義
語を前記検索条件式中に所定の論理演算子とともに組込
む同義語展開処理を行う条件式展開手段を有して展開さ
れた検索条件式に基づいて文書を検索する文書選出手段
を設けた。
入力し、この検索条件式に合致する文書を検索するよう
にした文書検索装置、又は、キーワード間の関連度を記
述したキーワードコネクション表を有し、文書検索時に
キーワードと論理演算子とを組合せた検索条件式を作成
入力し、前記キーワードコネクション表を用いてこの検
索条件式に合致する文書を検索するようにした文書検索
装置において、同義語をなす語群を表として保持する同
義語テーブルを設け、入力された検索条件式中のキーワ
ードがこの同義語テーブル中に存在するときにその同義
語を前記検索条件式中に所定の論理演算子とともに組込
む同義語展開処理を行う条件式展開手段を有して展開さ
れた検索条件式に基づいて文書を検索する文書選出手段
を設けた。
作用
同義語をなす語群が同義語テーブルにより保持されてお
り、検索条件式を入力したときに、その中の任意のキー
ワードが同義語テーブル中に存在すればその同義語も検
索条件式中に組込む展開処理を行ってから、検索処理を
行うことにより、漏れの少ない検索が可能となる。特に
、キーワードコネクション表を用いたものにあっては、
同義語展開機能の付加により、キーワードコネクション
表のみによる不備をカバーでき、あいまい検索機能が一
層向上したものとなる。
り、検索条件式を入力したときに、その中の任意のキー
ワードが同義語テーブル中に存在すればその同義語も検
索条件式中に組込む展開処理を行ってから、検索処理を
行うことにより、漏れの少ない検索が可能となる。特に
、キーワードコネクション表を用いたものにあっては、
同義語展開機能の付加により、キーワードコネクション
表のみによる不備をカバーでき、あいまい検索機能が一
層向上したものとなる。
実施例
本発明の一実施例を図面に基づいて説明する。
まず、本発明が適用される文書検索装置の概要を第1図
のブロック図を参照して説明する。本実施例は、前述し
た既提案内容のようにキーワードコネクション表を用い
たものに適用したものである。キーワード抽呂部lは登
録文書2を入力するとそのキーワードを抽出し、キーワ
ード及び登録文書2の情報を文書情報管理部3、キーワ
ードコネクション表処理部4及びインバーテツドファイ
ル作成部5へ出力する。文書情報管理部3は抽出された
キーワードと書誌的情報6とをファイル7に格納し、検
索時に利用可能な形にデータベース化する。キーワード
コネクション表処理部4は必要なキーワードとともに関
連性のあるキーワード同士のつながり及びその関連度を
記述したキーワードコネクション表を作成しファイル9
に格納するものである。ここに、キーワードコネクショ
ン表は例えばリスト構造とされ、関連度の大きい順にソ
ートされる。インバーテツドファイル作成部5は各キー
ワードと登録文書2とを対応付けるインバーテツドファ
イル10を作成し、ファイル11に格納するものである
。即ち、インバーテツドファイル10はキーワードから
そのキーワードを含む文書を指すポインタを集合させた
ものである。
のブロック図を参照して説明する。本実施例は、前述し
た既提案内容のようにキーワードコネクション表を用い
たものに適用したものである。キーワード抽呂部lは登
録文書2を入力するとそのキーワードを抽出し、キーワ
ード及び登録文書2の情報を文書情報管理部3、キーワ
ードコネクション表処理部4及びインバーテツドファイ
ル作成部5へ出力する。文書情報管理部3は抽出された
キーワードと書誌的情報6とをファイル7に格納し、検
索時に利用可能な形にデータベース化する。キーワード
コネクション表処理部4は必要なキーワードとともに関
連性のあるキーワード同士のつながり及びその関連度を
記述したキーワードコネクション表を作成しファイル9
に格納するものである。ここに、キーワードコネクショ
ン表は例えばリスト構造とされ、関連度の大きい順にソ
ートされる。インバーテツドファイル作成部5は各キー
ワードと登録文書2とを対応付けるインバーテツドファ
イル10を作成し、ファイル11に格納するものである
。即ち、インバーテツドファイル10はキーワードから
そのキーワードを含む文書を指すポインタを集合させた
ものである。
ついで、文書選出部(文書選出手段)12が設けられて
いる。この文書選出部12は検索利用者の要求主題・要
求概念により近い文書ファイルをキーワード群によって
抽出することを目的としたもので、キーボード13から
アクセスする利用者に対してキーワード−覧表をデイス
プレィ14に出力する。その中から利用者は要求主題に
必要なキーワードを選択するか、自由キーワードを選択
して、必要な論理演算子(AND、OR,又はN0T)
で結合した検索条件式を作成し、再びキーボード13か
ら表示検索要求を入力するものである。このような文書
選出部12は、要求処理部15とソート部16と表示管
理部17とキーワード間関速度計算部18と文書確度計
算部19とよりなる。要求処理部15はキーボード13
から受理した検索条件式中のキーワードをキーワード間
関速度計算部18に転送する。キーワード間関速度計算
部18では転送されたキーワードに関する関連キーワー
ドとその関連情報をキーワードコネクション表8から抽
出する。抽出されたキーワード群は関連の強い順にソー
ト部16でソートされて表示管理部17へ出力される。
いる。この文書選出部12は検索利用者の要求主題・要
求概念により近い文書ファイルをキーワード群によって
抽出することを目的としたもので、キーボード13から
アクセスする利用者に対してキーワード−覧表をデイス
プレィ14に出力する。その中から利用者は要求主題に
必要なキーワードを選択するか、自由キーワードを選択
して、必要な論理演算子(AND、OR,又はN0T)
で結合した検索条件式を作成し、再びキーボード13か
ら表示検索要求を入力するものである。このような文書
選出部12は、要求処理部15とソート部16と表示管
理部17とキーワード間関速度計算部18と文書確度計
算部19とよりなる。要求処理部15はキーボード13
から受理した検索条件式中のキーワードをキーワード間
関速度計算部18に転送する。キーワード間関速度計算
部18では転送されたキーワードに関する関連キーワー
ドとその関連情報をキーワードコネクション表8から抽
出する。抽出されたキーワード群は関連の強い順にソー
ト部16でソートされて表示管理部17へ出力される。
表示管理部17はこの関連キーワード群をデイスプレィ
14に出力し、利用者に対して表示する。この表示に従
い、利用者がさらに必要なキーワードを選択入力するこ
とにより、最終的なキーワード群が文書選択要求ととも
に要求処理部15へ送られる。
14に出力し、利用者に対して表示する。この表示に従
い、利用者がさらに必要なキーワードを選択入力するこ
とにより、最終的なキーワード群が文書選択要求ととも
に要求処理部15へ送られる。
要求処理部15では文書選択要求を受けると、文書確度
計算部19にキーワード群を転送させる。
計算部19にキーワード群を転送させる。
同時に、最終的なキーワード群に関する関連情報の重み
変更を行うようにキーワードコネクション表処理部4に
指示する。文書確度計算部19では受理したキーワード
群とキーワードコネクション表8及びインバーテツドフ
ァイル10を用いて、登録文書2のファイル7について
文書確度を計算し、結果をソート部16に転送する。必
要な文書確度の計算が終了すると、ソート部16による
ソートを経てデイスプレィ14に表示され、検索結果と
される。
変更を行うようにキーワードコネクション表処理部4に
指示する。文書確度計算部19では受理したキーワード
群とキーワードコネクション表8及びインバーテツドフ
ァイル10を用いて、登録文書2のファイル7について
文書確度を計算し、結果をソート部16に転送する。必
要な文書確度の計算が終了すると、ソート部16による
ソートを経てデイスプレィ14に表示され、検索結果と
される。
しかして、本実施例では、第1図に示すように、文書選
出部12中に要求処理部15に接続された同義語テーブ
ル20を設けるとともに、要求処理部15中に同義語展
開機能を持たせたものである。
出部12中に要求処理部15に接続された同義語テーブ
ル20を設けるとともに、要求処理部15中に同義語展
開機能を持たせたものである。
ここに、同義語テーブル20は、表記は異なるが意味が
同一である2以上の語群を記述したもので、その内容の
一例を第2図に示す。
同一である2以上の語群を記述したもので、その内容の
一例を第2図に示す。
このような構成において、既提案内容と同様に、キーボ
ード13から入力された検索条件式中のキーワードは要
求処理部15においてその処理要求に応じて文書確度計
算部19、キーワード間関速度計算部18へ転送される
が、これに先立ち、同義語テーブル20を用いた同義語
展開処理が行なわれる。同義語展開とは、検索条件式中
の任意のキーワードが同義語テーブル20中に存在する
場合、同一の意味を持つ他の表記の語をこのキーワード
の語と論理和(OR)により結合して、当初の検索条件
式中の該当キーワードに代入することをいう。例えば、
展開前の検索条件式を(A I )*(エキスパートシ
ステム)とすると、第2図の同義語テーブル20を用い
て同義語展開された後の検索条件式は、((AI)+(
人工知能))*((エキスパートシステム)+ (ES
))となる(“ネ”は論理積、′+”は論理和を示す)
。要求処理部15はこのように同義語展開された検索条
件式を文書確度計算部19、キーワード間関速度計算部
18へ転送し、既提案内容と同様に文書検索処理を行う
。よって、利用者が意識しない同義語が存在するような
場合、その同義語を検索キーワードとして入力しなかっ
たとしても同義語が加味された検索が行なわれることに
なり、所望の文書検索について漏れの少ないものとなる
。特に、本実施例のように、あいまい検索を可能とする
キ−ワードコネクション表を用いたものにあっては、キ
ーワードコネクションでは実現しにくい同義語の扱いが
容易となる。このような同義語展開機能の付加&こより
、キーワードコネクション表のみによる不備をカバーで
き、あいまい検索機能が一層向上したものとなる。8 なお、同義語テーブル20についての同義語の追加/更
新/削除等の処理は簡単に行える。
ード13から入力された検索条件式中のキーワードは要
求処理部15においてその処理要求に応じて文書確度計
算部19、キーワード間関速度計算部18へ転送される
が、これに先立ち、同義語テーブル20を用いた同義語
展開処理が行なわれる。同義語展開とは、検索条件式中
の任意のキーワードが同義語テーブル20中に存在する
場合、同一の意味を持つ他の表記の語をこのキーワード
の語と論理和(OR)により結合して、当初の検索条件
式中の該当キーワードに代入することをいう。例えば、
展開前の検索条件式を(A I )*(エキスパートシ
ステム)とすると、第2図の同義語テーブル20を用い
て同義語展開された後の検索条件式は、((AI)+(
人工知能))*((エキスパートシステム)+ (ES
))となる(“ネ”は論理積、′+”は論理和を示す)
。要求処理部15はこのように同義語展開された検索条
件式を文書確度計算部19、キーワード間関速度計算部
18へ転送し、既提案内容と同様に文書検索処理を行う
。よって、利用者が意識しない同義語が存在するような
場合、その同義語を検索キーワードとして入力しなかっ
たとしても同義語が加味された検索が行なわれることに
なり、所望の文書検索について漏れの少ないものとなる
。特に、本実施例のように、あいまい検索を可能とする
キ−ワードコネクション表を用いたものにあっては、キ
ーワードコネクションでは実現しにくい同義語の扱いが
容易となる。このような同義語展開機能の付加&こより
、キーワードコネクション表のみによる不備をカバーで
き、あいまい検索機能が一層向上したものとなる。8 なお、同義語テーブル20についての同義語の追加/更
新/削除等の処理は簡単に行える。
発明の効果
本発明は、上述したように同義語をなす語群を同義語テ
ーブルにより保持し、検索条件式を入力したときに、そ
の中の任意のキーワードが同義語テーブル中に存在すれ
ばその同義語も検索条件式中に組込む展開処理を行って
から、検索処理を行うようにしたので、漏れの少ない検
索が可能となり、特に、キーワードコネクション表を用
いたものにあっては、このような同義語展開機能の付加
により、キーワードコネクション表のみによる不備をカ
バーでき、あいまい検索機能を一層向上させることがで
きる。
ーブルにより保持し、検索条件式を入力したときに、そ
の中の任意のキーワードが同義語テーブル中に存在すれ
ばその同義語も検索条件式中に組込む展開処理を行って
から、検索処理を行うようにしたので、漏れの少ない検
索が可能となり、特に、キーワードコネクション表を用
いたものにあっては、このような同義語展開機能の付加
により、キーワードコネクション表のみによる不備をカ
バーでき、あいまい検索機能を一層向上させることがで
きる。
図面は本発明の一実施例を示すもので、第1し:はブロ
ック図、第2図は同義語テーブルの内、容を示す説明図
である。
ック図、第2図は同義語テーブルの内、容を示す説明図
である。
Claims (1)
- 【特許請求の範囲】 1、キーワードと論理演算子とを組合せた検索条件式を
作成入力し、この検索条件式に合致する文書を検索する
ようにした文書検索装置において、同義語をなす語群を
表として保持する同義語テーブルを設け、入力された検
索条件式中のキーワードがこの同義語テーブル中に存在
するときにその同義語を前記検索条件式中に所定の論理
演算子とともに組込む同義語展開処理を行う条件式展開
手段を有して展開された検索条件式に基づいて文書を検
索する文書選出手段を設けたことを特徴とする文書検索
装置。 2、キーワード間の関連度を記述したキーワードコネク
シヨン表を有し、文書検索時にキーワードと論理演算子
とを組合せた検索条件式を作成入力し、前記キーワード
コネクシヨン表を用いてこの検索条件式に合致する文書
を検索するようにした文書検索装置において、同義語を
なす語群を表として保持する同義語テーブルを設け、入
力された検索条件式中のキーワードがこの同義語テーブ
ル中に存在するときにその同義語を前記検索条件式中に
所定の論理演算子とともに組込む同義語展開処理を行う
条件式展開手段を有して展開された検索条件式に基づい
て文書を検索する文書選出手段を設けたことを特徴とす
る文書検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2195748A JPH0481973A (ja) | 1990-07-24 | 1990-07-24 | 文書検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2195748A JPH0481973A (ja) | 1990-07-24 | 1990-07-24 | 文書検索装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0481973A true JPH0481973A (ja) | 1992-03-16 |
Family
ID=16346315
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2195748A Pending JPH0481973A (ja) | 1990-07-24 | 1990-07-24 | 文書検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0481973A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11328221A (ja) * | 1998-05-14 | 1999-11-30 | Nippon Telegr & Teleph Corp <Ntt> | データ検索方法、その装置および記録媒体 |
-
1990
- 1990-07-24 JP JP2195748A patent/JPH0481973A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11328221A (ja) * | 1998-05-14 | 1999-11-30 | Nippon Telegr & Teleph Corp <Ntt> | データ検索方法、その装置および記録媒体 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH11282876A (ja) | 文書検索装置 | |
| KR102256007B1 (ko) | 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법 | |
| JP3173411B2 (ja) | 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体 | |
| JP3584848B2 (ja) | 文書処理装置、項目検索装置及び項目検索方法 | |
| JPH0486950A (ja) | 文書検索方法 | |
| JPH0248772A (ja) | 類似画像検索方式 | |
| JP2001188802A (ja) | 情報検索装置及び情報検索方法 | |
| JPH09231231A (ja) | データ検索装置 | |
| JP2604587B2 (ja) | 情報検索装置 | |
| JPH0481973A (ja) | 文書検索装置 | |
| JPH0581326A (ja) | データベース検索装置 | |
| JP3007375B2 (ja) | 文書情報検索装置 | |
| JPH07146878A (ja) | 情報検索装置 | |
| JPH05233719A (ja) | 複合的な情報間の関連性識別方法 | |
| JP3328104B2 (ja) | キーワード自動抽出装置および文書検索装置 | |
| JPH0227478A (ja) | 文書管理装置 | |
| JPH11154164A (ja) | 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体 | |
| JP3077615B2 (ja) | ホームページ分析表示システム | |
| JP3043596B2 (ja) | キーワード抽出装置 | |
| JPH03294964A (ja) | 文書検索方法 | |
| KR100434718B1 (ko) | 문서 색인 시스템 및 그 방법 | |
| JPH05250411A (ja) | 検索条件式作成装置 | |
| JP2639804B2 (ja) | データベース検索装置 | |
| JPH03123973A (ja) | 文書検索方法 | |
| JPH04135278A (ja) | 文書検索装置 |