JPH0481973A - Document retrieving device - Google Patents

Document retrieving device

Info

Publication number
JPH0481973A
JPH0481973A JP2195748A JP19574890A JPH0481973A JP H0481973 A JPH0481973 A JP H0481973A JP 2195748 A JP2195748 A JP 2195748A JP 19574890 A JP19574890 A JP 19574890A JP H0481973 A JPH0481973 A JP H0481973A
Authority
JP
Japan
Prior art keywords
keyword
search condition
search
condition expression
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2195748A
Other languages
Japanese (ja)
Inventor
Tetsuya Morita
哲也 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2195748A priority Critical patent/JPH0481973A/en
Publication of JPH0481973A publication Critical patent/JPH0481973A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、利用者がキーワードと論理演算子とからなる
検索条件式を作成入力し、この検索条件式に合致する文
書を文書データベース中から検索する文書検索装置に関
する。
[Detailed Description of the Invention] Industrial Application Field The present invention allows a user to create and input a search condition expression consisting of keywords and logical operators, and to search a document database for documents that match this search condition expression. The present invention relates to a document search device.

従来の技術 従来1文書検索装置においては種々の検索方式があるが
、その一つとして各キーワード間の関連度を記述したキ
ーワードコネクション表なる知識ベースを用いて、関連
キーワード検索やあいまい検索を可能にしたものが、本
出願人により例えば特願昭63−8291号F文書検索
装置」等により提案されている。このような文書検索装
置にあっては、使用者が正確なキーワードを覚えていな
くてもキーワードコネクション表を使ったあいまい検索
を行なうことにより、適量・適量な検索結果を得ること
ができる。
Conventional Technology Conventional 1 Document search devices have various search methods, one of which is to use a knowledge base that is a keyword connection table that describes the degree of association between each keyword to enable related keyword searches and ambiguous searches. The present applicant has proposed, for example, Japanese Patent Application No. 8291/1988 "Document Retrieval Apparatus". In such a document search device, even if the user does not remember exact keywords, by performing a vague search using a keyword connection table, an appropriate amount of search results can be obtained.

発明が解決しようとする課題 ところが、このようなキーワードコネクション表を利用
したあいまい検索法にあっても、同義語のように表記は
異なるが意味が同一であるキーワードが存在する場合、
適切なコネクション値を実装できず、検索漏れを生じ得
る。これは、キーワードコネクション表を有しない従前
の文書検索装置にあってはもちろんである。
Problems to be Solved by the Invention However, even with such a fuzzy search method using a keyword connection table, if there are keywords that have different spellings but the same meaning, such as synonyms,
Failure to implement appropriate connection values may result in missed searches. This is of course true for conventional document search devices that do not have keyword connection tables.

課題を解決するための手段 キーワードと論理演算子とを組合せた検索条件式を作成
入力し、この検索条件式に合致する文書を検索するよう
にした文書検索装置、又は、キーワード間の関連度を記
述したキーワードコネクション表を有し、文書検索時に
キーワードと論理演算子とを組合せた検索条件式を作成
入力し、前記キーワードコネクション表を用いてこの検
索条件式に合致する文書を検索するようにした文書検索
装置において、同義語をなす語群を表として保持する同
義語テーブルを設け、入力された検索条件式中のキーワ
ードがこの同義語テーブル中に存在するときにその同義
語を前記検索条件式中に所定の論理演算子とともに組込
む同義語展開処理を行う条件式展開手段を有して展開さ
れた検索条件式に基づいて文書を検索する文書選出手段
を設けた。
Means for Solving the Problem A document search device that creates and inputs a search condition expression that combines keywords and logical operators and searches for documents that match this search condition expression, or a document search device that searches for documents that match this search condition expression, or The system has a described keyword connection table, creates and inputs a search condition expression combining keywords and logical operators when searching for documents, and uses the keyword connection table to search for documents that match this search condition expression. In a document retrieval device, a synonym table is provided that holds a group of synonymous words as a table, and when a keyword in an input search condition expression exists in this synonym table, the synonym is used in the search condition expression. Document selection means is provided for searching documents based on the expanded search conditional expression, which has conditional expression expansion means that performs synonym expansion processing to be incorporated together with a predetermined logical operator.

作用 同義語をなす語群が同義語テーブルにより保持されてお
り、検索条件式を入力したときに、その中の任意のキー
ワードが同義語テーブル中に存在すればその同義語も検
索条件式中に組込む展開処理を行ってから、検索処理を
行うことにより、漏れの少ない検索が可能となる。特に
、キーワードコネクション表を用いたものにあっては、
同義語展開機能の付加により、キーワードコネクション
表のみによる不備をカバーでき、あいまい検索機能が一
層向上したものとなる。
Groups of words that form action synonyms are held in a synonym table, and when a search condition expression is input, if any keyword among them exists in the synonym table, that synonym will also be included in the search condition expression. By performing the search process after performing the expansion process to incorporate, it is possible to perform a search with fewer omissions. Especially when using keyword connection tables,
By adding the synonym expansion function, the deficiencies of only the keyword connection table can be covered, and the fuzzy search function will be further improved.

実施例 本発明の一実施例を図面に基づいて説明する。Example An embodiment of the present invention will be described based on the drawings.

まず、本発明が適用される文書検索装置の概要を第1図
のブロック図を参照して説明する。本実施例は、前述し
た既提案内容のようにキーワードコネクション表を用い
たものに適用したものである。キーワード抽呂部lは登
録文書2を入力するとそのキーワードを抽出し、キーワ
ード及び登録文書2の情報を文書情報管理部3、キーワ
ードコネクション表処理部4及びインバーテツドファイ
ル作成部5へ出力する。文書情報管理部3は抽出された
キーワードと書誌的情報6とをファイル7に格納し、検
索時に利用可能な形にデータベース化する。キーワード
コネクション表処理部4は必要なキーワードとともに関
連性のあるキーワード同士のつながり及びその関連度を
記述したキーワードコネクション表を作成しファイル9
に格納するものである。ここに、キーワードコネクショ
ン表は例えばリスト構造とされ、関連度の大きい順にソ
ートされる。インバーテツドファイル作成部5は各キー
ワードと登録文書2とを対応付けるインバーテツドファ
イル10を作成し、ファイル11に格納するものである
。即ち、インバーテツドファイル10はキーワードから
そのキーワードを含む文書を指すポインタを集合させた
ものである。
First, an overview of a document retrieval device to which the present invention is applied will be explained with reference to the block diagram of FIG. This embodiment is applied to the previously proposed content that uses a keyword connection table. When the keyword extraction section 1 receives the registered document 2, it extracts the keyword, and outputs the keyword and information about the registered document 2 to the document information management section 3, the keyword connection table processing section 4, and the inverted file creation section 5. The document information management unit 3 stores the extracted keywords and bibliographic information 6 in a file 7, and creates a database in a format that can be used during a search. The keyword connection table processing unit 4 creates a keyword connection table that describes the necessary keywords as well as the connections between related keywords and their degree of association, and files the file 9.
It is stored in . Here, the keyword connection table has a list structure, for example, and is sorted in descending order of relevance. The inverted file creation section 5 creates an inverted file 10 that associates each keyword with the registered document 2, and stores it in a file 11. That is, the inverted file 10 is a collection of pointers pointing from keywords to documents containing the keywords.

ついで、文書選出部(文書選出手段)12が設けられて
いる。この文書選出部12は検索利用者の要求主題・要
求概念により近い文書ファイルをキーワード群によって
抽出することを目的としたもので、キーボード13から
アクセスする利用者に対してキーワード−覧表をデイス
プレィ14に出力する。その中から利用者は要求主題に
必要なキーワードを選択するか、自由キーワードを選択
して、必要な論理演算子(AND、OR,又はN0T)
で結合した検索条件式を作成し、再びキーボード13か
ら表示検索要求を入力するものである。このような文書
選出部12は、要求処理部15とソート部16と表示管
理部17とキーワード間関速度計算部18と文書確度計
算部19とよりなる。要求処理部15はキーボード13
から受理した検索条件式中のキーワードをキーワード間
関速度計算部18に転送する。キーワード間関速度計算
部18では転送されたキーワードに関する関連キーワー
ドとその関連情報をキーワードコネクション表8から抽
出する。抽出されたキーワード群は関連の強い順にソー
ト部16でソートされて表示管理部17へ出力される。
Next, a document selection section (document selection means) 12 is provided. This document selection section 12 is intended to extract document files that are closer to the subject matter/required concept of the search user using a group of keywords. Output to. From there, the user selects the keywords necessary for the requested subject, or selects free keywords, and applies the necessary logical operators (AND, OR, or NOT).
A combined search condition expression is created, and a display search request is input again from the keyboard 13. The document selection section 12 includes a request processing section 15 , a sorting section 16 , a display management section 17 , a keyword correlation speed calculation section 18 , and a document accuracy calculation section 19 . The request processing unit 15 is the keyboard 13
The keywords in the search condition expression received from are transferred to the keyword relationship speed calculation section 18. The keyword relationship speed calculation unit 18 extracts related keywords and their related information regarding the transferred keyword from the keyword connection table 8. The extracted keyword group is sorted by the sorting unit 16 in order of strong relevance and output to the display management unit 17.

表示管理部17はこの関連キーワード群をデイスプレィ
14に出力し、利用者に対して表示する。この表示に従
い、利用者がさらに必要なキーワードを選択入力するこ
とにより、最終的なキーワード群が文書選択要求ととも
に要求処理部15へ送られる。
The display management unit 17 outputs this related keyword group to the display 14 and displays it to the user. When the user further selects and inputs necessary keywords according to this display, the final keyword group is sent to the request processing unit 15 together with the document selection request.

要求処理部15では文書選択要求を受けると、文書確度
計算部19にキーワード群を転送させる。
Upon receiving the document selection request, the request processing section 15 causes the document certainty calculation section 19 to transfer the keyword group.

同時に、最終的なキーワード群に関する関連情報の重み
変更を行うようにキーワードコネクション表処理部4に
指示する。文書確度計算部19では受理したキーワード
群とキーワードコネクション表8及びインバーテツドフ
ァイル10を用いて、登録文書2のファイル7について
文書確度を計算し、結果をソート部16に転送する。必
要な文書確度の計算が終了すると、ソート部16による
ソートを経てデイスプレィ14に表示され、検索結果と
される。
At the same time, the keyword connection table processing unit 4 is instructed to change the weight of related information regarding the final keyword group. The document probability calculation section 19 calculates the document probability for the file 7 of the registered document 2 using the received keyword group, keyword connection table 8, and inverted file 10, and transfers the result to the sorting section 16. When the necessary document accuracy calculations are completed, the documents are sorted by the sorting unit 16 and displayed on the display 14 as search results.

しかして、本実施例では、第1図に示すように、文書選
出部12中に要求処理部15に接続された同義語テーブ
ル20を設けるとともに、要求処理部15中に同義語展
開機能を持たせたものである。
Accordingly, in this embodiment, as shown in FIG. It is something that has been set.

ここに、同義語テーブル20は、表記は異なるが意味が
同一である2以上の語群を記述したもので、その内容の
一例を第2図に示す。
Here, the synonym table 20 describes two or more word groups that have different notations but the same meaning, and an example of the contents is shown in FIG. 2.

このような構成において、既提案内容と同様に、キーボ
ード13から入力された検索条件式中のキーワードは要
求処理部15においてその処理要求に応じて文書確度計
算部19、キーワード間関速度計算部18へ転送される
が、これに先立ち、同義語テーブル20を用いた同義語
展開処理が行なわれる。同義語展開とは、検索条件式中
の任意のキーワードが同義語テーブル20中に存在する
場合、同一の意味を持つ他の表記の語をこのキーワード
の語と論理和(OR)により結合して、当初の検索条件
式中の該当キーワードに代入することをいう。例えば、
展開前の検索条件式を(A I )*(エキスパートシ
ステム)とすると、第2図の同義語テーブル20を用い
て同義語展開された後の検索条件式は、((AI)+(
人工知能))*((エキスパートシステム)+ (ES
))となる(“ネ”は論理積、′+”は論理和を示す)
。要求処理部15はこのように同義語展開された検索条
件式を文書確度計算部19、キーワード間関速度計算部
18へ転送し、既提案内容と同様に文書検索処理を行う
。よって、利用者が意識しない同義語が存在するような
場合、その同義語を検索キーワードとして入力しなかっ
たとしても同義語が加味された検索が行なわれることに
なり、所望の文書検索について漏れの少ないものとなる
。特に、本実施例のように、あいまい検索を可能とする
キ−ワードコネクション表を用いたものにあっては、キ
ーワードコネクションでは実現しにくい同義語の扱いが
容易となる。このような同義語展開機能の付加&こより
、キーワードコネクション表のみによる不備をカバーで
き、あいまい検索機能が一層向上したものとなる。8 なお、同義語テーブル20についての同義語の追加/更
新/削除等の処理は簡単に行える。
In such a configuration, the keywords in the search condition expression inputted from the keyboard 13 are processed in the document accuracy calculation unit 19 and the keyword relationship speed calculation unit 18 in accordance with the processing request in the request processing unit 15, similar to the content already proposed. However, prior to this, synonym expansion processing using the synonym table 20 is performed. Synonym expansion means that when an arbitrary keyword in the search condition expression exists in the synonym table 20, a word with the same meaning in another notation is combined with the word of this keyword by logical sum (OR). , refers to substituting the corresponding keyword in the original search condition expression. for example,
If the search condition expression before expansion is (AI)*(expert system), the search condition expression after synonym expansion using the synonym table 20 in FIG. 2 is ((AI)+(
Artificial Intelligence)) * ((Expert System) + (ES
)) (“ne” indicates logical product, “+” indicates logical sum)
. The request processing unit 15 transfers the search condition expression expanded into synonyms in this way to the document certainty calculation unit 19 and the keyword correlation speed calculation unit 18, and performs document search processing in the same manner as the already proposed content. Therefore, if there is a synonym that the user is not aware of, even if the synonym is not entered as a search keyword, the search will be performed with the synonym taken into account, which will prevent omissions in the desired document search. It becomes less. Particularly, in the case of the present embodiment, which uses a keyword connection table that enables ambiguous searches, it becomes easy to handle synonyms that are difficult to implement using keyword connections. By adding and combining such a synonym expansion function, the deficiencies caused by only the keyword connection table can be covered, and the ambiguous search function is further improved. 8. Processing such as adding/updating/deleting synonyms in the synonym table 20 can be easily performed.

発明の効果 本発明は、上述したように同義語をなす語群を同義語テ
ーブルにより保持し、検索条件式を入力したときに、そ
の中の任意のキーワードが同義語テーブル中に存在すれ
ばその同義語も検索条件式中に組込む展開処理を行って
から、検索処理を行うようにしたので、漏れの少ない検
索が可能となり、特に、キーワードコネクション表を用
いたものにあっては、このような同義語展開機能の付加
により、キーワードコネクション表のみによる不備をカ
バーでき、あいまい検索機能を一層向上させることがで
きる。
Effects of the Invention As described above, the present invention stores a group of synonymous words in a synonym table, and when a search condition expression is input, if any keyword among the keywords exists in the synonym table, Since synonyms are also expanded into the search condition expression before the search process is performed, it is possible to perform a search with fewer omissions, especially when using a keyword connection table. By adding the synonym expansion function, the deficiencies of only the keyword connection table can be covered, and the fuzzy search function can be further improved.

【図面の簡単な説明】[Brief explanation of the drawing]

図面は本発明の一実施例を示すもので、第1し:はブロ
ック図、第2図は同義語テーブルの内、容を示す説明図
である。
The drawings show one embodiment of the present invention, and the first part is a block diagram, and the second part is an explanatory diagram showing the contents of a synonym table.

Claims (1)

【特許請求の範囲】 1、キーワードと論理演算子とを組合せた検索条件式を
作成入力し、この検索条件式に合致する文書を検索する
ようにした文書検索装置において、同義語をなす語群を
表として保持する同義語テーブルを設け、入力された検
索条件式中のキーワードがこの同義語テーブル中に存在
するときにその同義語を前記検索条件式中に所定の論理
演算子とともに組込む同義語展開処理を行う条件式展開
手段を有して展開された検索条件式に基づいて文書を検
索する文書選出手段を設けたことを特徴とする文書検索
装置。 2、キーワード間の関連度を記述したキーワードコネク
シヨン表を有し、文書検索時にキーワードと論理演算子
とを組合せた検索条件式を作成入力し、前記キーワード
コネクシヨン表を用いてこの検索条件式に合致する文書
を検索するようにした文書検索装置において、同義語を
なす語群を表として保持する同義語テーブルを設け、入
力された検索条件式中のキーワードがこの同義語テーブ
ル中に存在するときにその同義語を前記検索条件式中に
所定の論理演算子とともに組込む同義語展開処理を行う
条件式展開手段を有して展開された検索条件式に基づい
て文書を検索する文書選出手段を設けたことを特徴とす
る文書検索装置。
[Claims] 1. In a document search device that creates and inputs a search condition expression that combines keywords and logical operators, and searches for documents that match this search condition expression, a group of words forming synonyms is used. A synonym table is provided in which a synonym table is held as a table, and when a keyword in an input search condition expression exists in this synonym table, the synonym is incorporated into the search condition expression together with a predetermined logical operator. 1. A document retrieval device, comprising: a conditional expression expansion unit that performs expansion processing; and a document selection unit that searches for documents based on the expanded search conditional expression. 2. Have a keyword connection table that describes the degree of association between keywords, create and input a search condition expression that combines keywords and logical operators when searching documents, and use the keyword connection table to create and input a search condition expression. In a document retrieval device configured to search for documents that match, a synonym table is provided that holds a group of synonymous words as a table, and a keyword in an input search condition expression exists in this synonym table. document selection means for searching documents based on the expanded search condition expression; A document retrieval device characterized in that:
JP2195748A 1990-07-24 1990-07-24 Document retrieving device Pending JPH0481973A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2195748A JPH0481973A (en) 1990-07-24 1990-07-24 Document retrieving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2195748A JPH0481973A (en) 1990-07-24 1990-07-24 Document retrieving device

Publications (1)

Publication Number Publication Date
JPH0481973A true JPH0481973A (en) 1992-03-16

Family

ID=16346315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2195748A Pending JPH0481973A (en) 1990-07-24 1990-07-24 Document retrieving device

Country Status (1)

Country Link
JP (1) JPH0481973A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328221A (en) * 1998-05-14 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> Data retrieval method, device thereof, and recording medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328221A (en) * 1998-05-14 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> Data retrieval method, device thereof, and recording medium

Similar Documents

Publication Publication Date Title
JPH11282876A (en) Document search device
KR102256007B1 (en) System and method for searching documents and providing an answer to a natural language question
JP3173411B2 (en) Related document search device and recording medium storing related document search program
JP3584848B2 (en) Document processing device, item search device, and item search method
JPH0486950A (en) Document search method
JPH0248772A (en) Analogous picture retrieving system
JP2001188802A (en) Information retrieval apparatus and information retrieval method
JPH09231231A (en) Data retrieval device
JP2604587B2 (en) Information retrieval device
JPH0481973A (en) Document retrieving device
JPH0581326A (en) Data base retrieving device
JP3007375B2 (en) Document information retrieval device
JPH07146878A (en) Information retrieval device
JPH05233719A (en) A method for identifying relationships between complex information
JP3328104B2 (en) Keyword automatic extraction device and document search device
JPH0227478A (en) document management device
JPH11154164A (en) Fitness calculation method in full-text search processing and storage medium storing program according to the method
JP3077615B2 (en) Homepage analysis display system
JP3043596B2 (en) Keyword extraction device
JPH03294964A (en) Document search method
KR100434718B1 (en) Method and system for indexing document
JPH05250411A (en) Search condition formula generator
JP2639804B2 (en) Database search device
JPH03123973A (en) Document retrieval method
JPH04135278A (en) document search device