JPH0776973B2 - 情報処理装置 - Google Patents

情報処理装置

Info

Publication number
JPH0776973B2
JPH0776973B2 JP2060180A JP6018090A JPH0776973B2 JP H0776973 B2 JPH0776973 B2 JP H0776973B2 JP 2060180 A JP2060180 A JP 2060180A JP 6018090 A JP6018090 A JP 6018090A JP H0776973 B2 JPH0776973 B2 JP H0776973B2
Authority
JP
Japan
Prior art keywords
keyword
search
registration
keywords
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2060180A
Other languages
English (en)
Other versions
JPH03260868A (ja
Inventor
忠一 菊池
Original Assignee
株式会社テレマティーク国際研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社テレマティーク国際研究所 filed Critical 株式会社テレマティーク国際研究所
Priority to JP2060180A priority Critical patent/JPH0776973B2/ja
Publication of JPH03260868A publication Critical patent/JPH03260868A/ja
Publication of JPH0776973B2 publication Critical patent/JPH0776973B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、情報処理装置における複数のキーワードを用
いる情報検索に係わるものであり、特に大量の情報を高
速に検索するものに適する。
〔概要〕
本発明は、複数のキーワードを有する情報に対して1個
以上のキーワード検索を行い、その照合を行って求める
情報の検索処理を行う情報処理装置において、 検索ファイルにキーワードに対応するレコードを割り当
て、登録情報の有するキーワードごとに、レコードに対
応するキーワードの登録頻度以上のすべてのキーワード
をレコードに格納しておき、最も登録頻度の低いキーワ
ードに対応するレコードの中から検索入力に共通する登
録情報を取り出すことにより、 複数の検索入力に対する大量のデータ検索を高速に行う
ことができるようにするものである。
〔従来の技術〕
従来、情報処理装置の情報検索は、任意の1個以上の検
索入力に対して完全転置方式の情報検索が行われること
が多い。この完全転置方式は、キーワードのすべての属
性ごとに転置ファイルを準備し、検索入力の属性に該当
する転置ファイルから検索入力に対応したレコードを取
り出し、この取り出したレコードから、検索入力に共通
の情報を取り出すことによって検索処理を行うものであ
る。
〔発明が解決しようとする課題〕
しかし、転置ファイル方式による検索は、複数の検索入
力に対して検索入力数に比例した転置ファイルからのア
クセス時間を要し、しかも大量情報検索時にはレコード
間に共通する情報を取り出すのに時間がかかるため大量
の情報の高速検索には向かない問題があった。
この例を説明する。
図書館においてその図書管理を行うデータベースシステ
ムを構築するとき、収納する図書には著者、発行者、件
名等の複数のキーワードがあり、検索時にはこれらのキ
ーワードの中から任意のキーワードを使用して検索す
る。このとき、転置ファイル方式を用いる場合は著者
名、発行者、件名の3つの検索入力を用いると、この3
つの検索入力のそれぞれに対応するレコードを取り出す
必要がある。このため、複数の検索入力数に比例した検
索時間を要することにより、複数の検索入力による情報
検索を行う場合には検索時間が長くなる問題があった。
さらに、大量の情報の検索処理を行う場合には取り出し
た各レコードのデータ量が巨大なものとなるため、レコ
ード間に共通する情報を取り出すのに時間がかかる問題
があった。
本発明は、複数検索入力に対して1レコードだけで検索
すると高速性が得られることと、複数レコード間の共通
情報取り出し処理では最初の2レコード間の処理に多く
の時間がかかるので、登録時に検索処理の最初の2レコ
ード間の共通情報抽出を行っておくことで検索の高速性
が得られることに着目してなされたもので、複数の検索
入力に対して高速に大量の検索処理を行うことができる
情報処理装置および情報の検索方法を提供することを目
的とする。
〔課題を解決するための手段〕
本発明は、検索用のキーワードを記憶する領域を備えた
記憶装置と検索入力にしたがって検索処理を実行する検
索処理装置とを備え、検索対象の登録情報から抽出され
た検索用のキーワードが登録され、この登録キーワード
と検索入力との照合を行うことにより検索を行う情報処
理装置において、 登録されるキーワードの登録頻度を計数する第一手段
と、この登録されたキーワードの登録頻度数とキーワー
ドとを対応させたキーワード表を作成する第二手段と、
このキーワードとキーワードの登録頻度数とを対応させ
たキーワード表に基づいて、このキーワードが属する登
録情報の全キーワードを対象としてこのキーワードの登
録頻度以上の登録キーワードと登録情報とを対にして格
納したレコードからなる検索ファイルを作成する第三手
段とを備えたことを特徴とする。
さらに本発明は、検索処理装置が入力された複数の検索
用キーワードの中から最もキーワード登録頻度の低いキ
ーワードを上記キーワード表より取り出し、取り出した
キーワードの該当するレコードを上記検索ファイルから
検索し、このレコードから上記入力された複数の検索用
キーワードに共通する登録情報を検索結果として取り出
す手段を備えたことを特徴とする。
〔作用〕
本発明の情報処理装置は、キーワードの登録処理と検索
入力にしたがって登録キーワードとの一致確認による検
索処理の二つの動作をもつ。
キーワードの登録処理は、まず、検索対象の登録情報か
ら抽出され、この登録情報と対に対応づけられているキ
ーワードについて、登録するキーワードとその登録キー
ワードの登録頻度を計数してキーワードとそのキーワー
ドの識別符号と登録頻度とを対応づけたキーワード表を
作成する。
ついで登録するすべてのキーワードごとに作成されるレ
コード欄からなり、このレコード欄にはキーワードの識
別符号と登録情報とが対になって格納されている検索フ
ァイルを作成する。このレコード欄には、このレコード
欄のキーワードの登録頻度以上のキーワードの識別符号
と登録情報の対を登録しておく。
キーワードを検索入力として登録キーワードとの照合を
行うときは、入力された複数のキーワードのうち、もっ
とも登録頻度の低いキーワードを探し、この最も登録頻
度の低いキーワードについての検索ファイルのレコード
を検索して、そのレコード内に格納されている検索入力
されたすべてのキーワードに係わるキーワードの識別符
号と登録情報との対を抽出する。そして入力された複数
の検索入力に共通の登録情報を取り出せば、求める検索
対象を抽出することができる。
本発明はこのように複数検索入力に対して最少登録頻度
のキーワードに該当する検索ファイルのレコードを検索
することで高速に検索できるようにしている。
〔実施例〕
以下図面を参照して本発明の実施例を説明する。第1図
は本発明一実施例における情報処理装置の構成を示すも
のである。
本実施例の情報処理装置は、各種演算処理あるいは判断
処理を行うCPU1と、検索処理、キーワード登録処理等の
プログラム、キーワード等を記憶するメモリ2、キーワ
ード4、ディスプレイ5を接続する入出力部3、検索フ
ァイル等の各種情報が記憶される外部記憶装置7を接続
する外部記憶装置制御部6、CPU1、メモリ2、入出力部
3、外部記憶装置制御部6を接続する共通バス8を備え
る。
本実施例での情報処理装置の処理は検索処理に供するた
めのキーワード登録と検索ファイルの作成に係わる登録
処理と、検索入力に対する検索処理との二つに分けられ
る。この実施例では電子図書館の閲覧用検索表示を行う
場合について説明する。
まず、キーワード登録と検索ファイルの作成登録処理に
ついて説明する。
第2図は、このキーワード登録において作成されるキー
ワード表を示す。
このキーワード表は登録するキーワードの種類の数のキ
ーワードエリアから構成されており、各キーワードエリ
アは、キーワード欄9と、登録番号欄10と、登録頻度欄
11とで構成されている。このキーワード欄9は登録する
図書のキーワードを記憶する4バイトのフィールドであ
り、登録番号欄10はキーワードの登録順番を示す登録番
号を記憶する4バイトのフィールドであり、登録頻度欄
11は図書登録に使用されるキーワードの登録頻度を記憶
する4バイトのフィールドである。ここでキーワードは
登録時に入力される文字列であり、登録番号と登録頻度
はともに正の整数からなる。第3図は、ハッシュ値頻度
表を示すものであり、設定者が設定する数のハッシュ値
頻度欄12で構成される。例えば、ハッシュ値を1000個と
すると、ハッシュ値頻度表にはNo.1ハッシュ値頻度欄か
らNo.1000ハッシュ値頻度欄まで1000個のフィールドが
確保される。各ハッシュ値頻度欄12には、ハッシュ関数
から算出される同一ハッシュ値を持つキーワードの数を
示す算出頻度が記憶される。すなわち、ハッシュ値頻度
欄12の算出頻度は、第2図に示すキーワード表におい
て、同一ハッシュ値になるキーワードが連続配列される
数も示している。例えば、No.1ハッシュ値頻度欄の算出
頻度が「5」で、No.2ハッシュ値頻度欄の算出頻度が
「3」の場合には、キーワード表のNo.1キーワードから
No.5までの5個のキーワードがNo.1ハッシュ値頻度欄の
算出頻度の算出頻度「5」に対応し、キーワード表のN
o.6キーワードからNo.8キーワードまでの3個のキーワ
ードがNo.2ハッシュ値頻度欄の算出頻度「3」に対応す
る。
第4図は、ハッシュ値先頭番地表の構成を示すもので、
第3図に示すハッシュ値頻度表のハッシュ値頻度欄12と
同数の4バイトのフィールドであるハッシュ値先頭番地
欄13で構成されている。このハッシュ値先頭番地欄13に
は、第2図のキーワード表に格納する登録キーワードの
キーワードエリア先頭番地が記憶される。すなわち、ハ
ッシュ値先頭番地表は、第3図に示すキーワード算出頻
度表に対応して、例えば、No.1ハッシュ値先頭番地欄の
先頭番地は、No.1ハッシュ値頻度欄に対応するキーワー
ド表のキーワード群の先頭番地を示している。
第5図は、検索ファイルの構成を示す図である。この検
索ファイルはキーワード表に示すキーワードエリアの数
のレコードエリアから構成されており、各レコードエリ
アは、ヘッダ部14とデータ部15とで構成されている。
第6図はこの検索ファイル内のレコードの構成を示すも
のである。ヘッダ部14は、レコード番号欄16と収容数欄
17とで構成されており、レコード番号欄16は4バイトの
フィールドで構成され、キーワードの登録番号をレコー
ドを識別するレコード番号として記憶する。収容数欄17
は、4バイトのフィールドで構成され、データ部15に格
納されるキーワードエリアの数を示すレコード容量を記
憶する。
データ部15は、収容数欄17のレコード容量で示すキーワ
ードエリアで構成されており、それぞれのキーワードエ
リアは、登録番号欄18と情報番号欄19とから構成されて
いる。この登録番号欄18は、4バイトのフィールドで構
成され、キーワードの登録番号を記憶する。情報番号欄
19は4バイトのフィールドで構成され、検索対象であ
り、登録番号欄18のキーワードに対応する図書の情報番
号を記憶する。
第7図は、レコード容量表の構成を示すもので、第2図
に示すキーワード表のキーワードエリアと同数のレコー
ド容量欄20で構成され、キーワード表の登録番号「1」
から昇順にレコード容量欄も「1」から昇順に対応づけ
ている。レコード容量欄20は、第5図に示す検索ファイ
ルの各レコードエリアのデータ部の容量を示す数値を記
憶する4バイトのフィールドからなる。
第8図は、それぞれのレコード格納番地を示すレコード
先頭番地表であり、レコード容量表と同数のn個のレコ
ード先頭番地欄21から構成され、各レコード容量欄20に
対応している。このレコード先頭番地欄21は、上述の検
索ファイルに記憶する各レコードのレコード先頭番地を
記憶するもので、第7図のレコード容量表のレコード容
量欄20に対応し、例えばNo.1レコード先頭番地はNo.1レ
コード容量欄に対応するレコードの検索ファイルにおけ
る先頭番地を示している。
次に具体的にキーワードの登録処理動作の流れ図を第9
図に示して説明する。
このキーワード登録処理の動作は、大きく分けてキーワ
ードの分類とその登録頻度数の計数と、検索ファイルの
キーワードごとのレコードに、登録番号および情報番号
の対を格納して検索ファイルを作成する動作に分けられ
ており、第1のステップは、キーワードのハッシュ値に
よるハッシュ値先頭番地表の作成、第2のステップはキ
ーワード表の作成、第3のステップは検索ファイルの先
頭番地を作成、第4のステップは検索ファイルの作成の
動作からなっている。
まず、第1のステップはキーワード表作成の前処理とし
て、キーワードをハッシュ値で分類し、ハッシュ値分類
したキーワードの数と、キーワード表内におけるハッシ
ュ値分類したキーワード群の先頭番地を算出する。
この動作を説明する。
まず、登録ファイルから書誌情報を取り出し(S101)、
書誌情報の中からキーワードをすべて取り出す。ハッシ
ュ関数を用いてこれらのキーワードのハッシュ値を算出
し、第3図のハッシュ値頻度表の該当するハッシュ値頻
度欄12に「1」を加算する(S102)。同様の処理を登録
されている書誌情報すべてについて行う。
次にハッシュ値先頭番地表を作成する。まずNo.1ハッシ
ュ値先頭番地欄に「0」を格納する(S104)。そして、
No.2ハッシュ値先頭番地欄に移り(S105)、ハッシュ値
頻度表No.1ハッシュ値頻度欄の算出頻度を3倍した値に
No.1ハッシュ値先頭番地の「0」を加算した値を先頭番
地としてNo.2ハッシュ値先頭番地欄に格納する(S10
6)。ハッシュ値頻度表のハッシュ値頻度欄と同数のハ
ッシュ値先頭番地欄に先頭番地を格納したかを調べ(S1
07)、同様にハッシュ値頻度表のNo.2ハッシュ値頻度欄
の算出頻度を3倍した値にNo.2ハッシュ値先頭番地欄の
数値を加算した値を先頭番地としてNo.3ハッシュ値先頭
番地欄に格納する。これは{No.(n−1)ハッシュ値
頻度欄}×3+{No.(n−1)ハッシュ値先頭番地
欄}をNo.nハッシュ値先頭番地に格納するものである。
同様の処理をハッシュ値先頭番地表の全ハッシュ値先頭
番地欄に対して行う。
第2のステップでは、キーワード表を作成する。
登録番号に「1」をセットした後、登録ファイルから書
誌情報を取り出し(S110、111)、書誌情報の中からキ
ーワードを取り出し、ハッシュ関数を用いてこのキーワ
ードのハッシュ値を算出して(S112)、ハッシュ値先頭
番地表から、このハッシュ値に該当するハッシュ値先頭
番地欄の先頭番地を取り出す(S113)。この先頭番地に
該当するキーワード表のキーワードエリア以降の空きエ
リアのキーワード欄に書誌情報から取り出したキーワー
ドを、登録番号欄に、このキーワードの登録番号になる
登録番号の現在値を、登録頻度欄に、ハッシュ値頻度表
の該当するハッシュ値頻度欄の算出頻度を格納する(S1
14)。そして次のキーワードを処理する前に登録番号に
「1」を加算する(S115)。同様の処理を取り出した書
誌情報のすべてのキーワードについて行う。同様の処理
を書誌情報すべてについて行う。
第3のステップでは、検索ファイル作成の前処理とし
て、検索ファイルの各レコードの容量と、検索ファイル
内の先頭番地を算出する。
初めに、レコード容量表を作成する。登録ファイルから
書誌情報を1冊分取り出し(S118)、書誌情報の中から
キーワードを取り出す、ハッシュ関数を用いてこのキー
ワードのハッシュ値を算出する(S119)。ハッシュ値先
頭番地表から、このハッシュ値に該当するハッシュ値先
頭番地欄の先頭番地を取り出し(S120)、この先頭番地
に該当するハッシュ値頻度欄の算出頻度が示す数のキー
ワードエリアを取り出す(S121、122)。取り出したキ
ーワードエリアの中から、登録処理中のキーワードに一
致するキーワードを記憶しているキーワードエリアの登
録番号と登録頻度を取り出す(S123)。同様の処理を取
り出した書誌情報の残りのキーワードについて行う。
取り出したこれらの登録番号と登録頻度の対の中で、最
少登録頻度の登録番号に該当するレコード容量表のレコ
ード容量欄に、取り出したこれらの登録番号と登録頻度
の対の数を格納する(S125)。これらの登録番号と登録
頻度の対から、最少登録頻度の対を削除し(S126)、再
び残った登録番号と登録頻度の対の中で、最少登録頻度
の登録番号に該当するレコード容量表のレコード容量欄
に、登録番号と登録頻度の対の数を格納し、最少登録頻
度の対を削除する(S127)。同様の処理を登録番号と登
録頻度の対が無くなるまで繰り返す。
次にレコード先頭番地表を作成する。
まず、No.1先頭番地欄に「0」を格納する(S130)。レ
コード容量表のNo.1レコード容量欄の容量に、第6図に
示すレコードのヘッダ部の容量として「1」を加算し、
この値を2倍した値にNo.1先頭番地欄の「0」を加算
し、この値を先頭番地として、No.2レコード先頭番地欄
に記憶する。さらに、レコード容量表のNo.2レコード容
量欄の容量に「1」を加えた値を2倍した値に、No.2レ
コード先頭番地欄の数値を加算した値を先頭番地とし
て、No.3レコード先頭番地に格納する。この処理は、N
o.nハッシュ値先頭番地に{No.(n−1)レコード容量
欄+1}×2+{No.(n−1)レコード先頭番地欄}
の値を格納するものである(S132)。同様の処理をレコ
ード容量表のレコード容量欄分行う(S133〜135)。
第4のステップでは、検索ファイルを作成する。
登録ファイルから書誌情報を1冊分取り出し(S140)、
書誌情報の中からキーワードを取り出し、ハッシュ関数
を用いてこのキーワードのハッシュ値を算出する(S14
1)。そしてハッシュ値先頭番地表から、このハッシュ
値に該当するハッシュ値先頭番地欄の先頭番地を取り出
し(S142)、この先頭番地に該当するキーワード表のキ
ーワードエリアから、ハッシュ値頻度表の該当するハッ
シュ値頻度欄の算出頻度が示すキーワードエリアを取り
出す(S143、144)。取り出したキーワードエリアの中
から、取り出した書誌情報のキーワードに一致するキー
ワードを格納している登録番号と登録頻度を取り出す
(S145)。同様の処理を取り出した書誌情報の残りのキ
ーワードについて行う。
取り出したこれらの登録番号と登録頻度との対の中で、
最少登録頻度の登録番号に該当するレコード先頭番地表
のレコード先頭番地欄の先頭番地が示す検索ファイルの
レコード番号欄に、最少登録頻度の登録番号を格納し、
収容数欄に登録処理中のこれらの登録番号と登録頻度の
対の数を加算し、データ部の空き領域に取り出し登録処
理中のすべての登録番号と登録頻度とを格納する(S14
7、148)。
さらに、これらの登録番号と登録頻度の対から最少登録
頻度の対を削除し(S149)、再び残った登録番号と登録
頻度の対の中で、最少登録頻度の登録番号に該当するレ
コード先頭番地表のレコード先頭番地欄の先頭番地に該
当する検索ファイルのレコード番地に最少登録頻度の登
録番地を格納し、収容数欄に残った登録番号と登録頻度
の対の数を加算し、データ部の空き領域に残った登録番
号と登録頻度を格納し、最少登録頻度の対を削除する。
同様の処理を登録番号と登録頻度の対がなくなるまで行
う(S150、147〜149)。同様の処理を登録ファイルの全
登録書誌情報について行う。
第10図は、検索動作を示す流れ図である。
まず、検索入力からキーワードを取り出し、ハッシュ関
数を用いてこのキーワードのハッシュ値を算出する(S2
01)。ハッシュ値先頭番地表から、このハッシュ値に該
当するハッシュ値先頭番地欄の先頭番地を取り出し(S2
02)、ハッシュ値頻度表から算出したハッシュ値に該当
する算出頻度を取り出す(S203)。そして先頭番地に該
当するキーワード表のキーワードエリアから、ハッシュ
値頻度表から取り出した算出頻度が示すキーワードエリ
アを取り出す(S204)。取り出したキーワードエリアの
キーワード欄が検索入力から取り出した検索処理中のキ
ーワードに一致するキーワードを格納しているキーワー
ドエリアの登録番号と登録頻度を取り出す(S205)。同
様の処理を検索入力された残りのキーワードについて行
い、検索入力に該当するキーワードの登録番号と登録頻
度を絞り込む。
これらの絞り込んだ登録番号と登録頻度の対の中で最少
登録頻度に該当するレコード先頭番地表のレコード先頭
番地欄の先頭番地と、最少登録頻度の登録番号に該当す
るレコード容量が示す容量を取り出し、この先頭番地と
レコード容量が示す検索ファイルのレコードを取り出す
(S207〜209)。そしてこのレコードのデータ部16につ
いて、絞り込んだ全登録番号に共通する情報番号を抽出
し、検索対象とする(S210)。
例えば第6図のレコードで、検索入力されたキーワード
に対応する登録番号が「11」と「50」と「88」とする
と、これらに共通する情報番号は「100」となり、これ
が検索図書の情報番号となる。
さらに具体的な例を挙げて説明する。
例えば、図書館の登録ファイルに登録された書誌番号
「100」が、キーワードとして「ISDN」、「通信」、「O
SI」を有していたとする。この3つのキーワードについ
てその登録番号と登録頻度数について見てみると、「IS
DN」は登録番号が「50」で登録頻度数が「100」、「通
信」が登録番号が「11」で登録頻度数が「350」、「OS
I」がその登録番号が「88」で登録頻度数が「50」であ
ったとする。
登録頻度数は、 「OSI」<「ISDN」<「通信」 の関係にあるため、検索ファイルの「OSI」のレコード
には「OSI」、「ISDN」、「通信」をその登録番号と情
報番号(書誌番号「100」)とともに格納し、「ISDN」
のレコードには、「ISDN」と「通信」をその登録番号と
情報番号とともに格納し、「通信」のレコードには、
「通信」をその登録番号と情報番号とともに格納し検索
ファイルを作成しておく。
検索処理を行う場合に、検索入力として「OSI」、「ISD
N」、「通信」のキーワードが入力されると、この3つ
のキーワードの登録頻度を調べ、最も登録頻度の低い
「OSI」のレコードを取り出す。この「OSI」のレコード
のデータ部から、「OSI」、「ISDN」、「通信」の3つ
の登録番号「88」、「50」、「11」に共通する情報番号
「100」が取り出され、共通する情報番号「100」の書誌
情報すなわち図書が検索結果として取り出される。
このようにして、もっとも登録頻度の少ないキーワード
に対応する検索用レコードを検索するだけで複数の検索
入力に対する検索が可能であり、その検索を高速化する
ことができる。
〔発明の効果〕 以上説明したように、本発明は、複数検索入力に対して
1レコードだけで検索できることと、登録時に検索処理
の最初の2レコード間の共通情報抽出を行っておくこと
により、大量の情報を複数の検索入力で検索する場合に
その検索処理を高速化することができる優れた効果があ
る。
【図面の簡単な説明】
第1図は実施例情報処理装置の構成例。 第2図は実施例のキーワード表。 第3図は実施例のハッシュ値頻度表。 第4図は実施例ハッシュ値先頭番地表。 第5図は実施例検索ファイル。 第6図は検索ファイルのレコード構成を示す図。 第7図は実施例のレコード容量表。 第8図は実施例のレコード先頭番地表。 第9図は実施例のキーワード登録処理動作を説明する
図。 第10図は実施例の検索処理動作を説明する図。 1……CPU、2……メモリ、3……入出力部、4……キ
ーボード、5……ディスプレイ、6……外部記憶装置制
御部、7……外部記憶装置、8……共通バス。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】検索用のキーワードを記憶する領域を備え
    た記憶装置と検索入力にしたがって検索処理を実行する
    検索処理装置とを備え、 検索対象の登録情報から抽出された検索用のキーワード
    が登録され、この登録キーワードと検索入力との照合を
    行うことにより検索を行う情報処理装置において、 登録されるキーワードの登録頻度を計数する第一手段
    と、 この登録されたキーワードの登録頻度数とキーワードと
    を対応させたキーワード表を作成する第二手段と、 このキーワードとキーワードの登録頻度数とを対応させ
    たキーワード表に基づいて、登録キーワードごとに、こ
    のキーワードが属する登録情報の全キーワードを対象と
    して、このキーワードの登録頻度以上の登録キーワード
    と登録情報とを対にして格納したレコードからなる検索
    ファイルを作成する第三手段と を備えたことを特徴とする情報処理装置。
  2. 【請求項2】検索用のキーワードを記憶する領域を備え
    た記憶装置と検索入力にしたがって検索処理を実行する
    検索処理装置とを備え、 検索対象の登録情報から抽出された検索用のキーワード
    が登録され、この登録キーワードと検索入力との照合を
    行うことにより検索を行う情報処理装置において、 登録されるキーワードの登録頻度を計数する第一手段
    と、 この登録されたキーワードの登録頻度数とキーワードと
    を対応させたキーワード表を作成する第二手段と、 このキーワードとキーワードの登録頻度数とを対応させ
    たキーワード表に基づいて、登録キーワードごとに、こ
    のキーワードが属する登録情報の全キーワードを対象と
    して、このキーワードの登録頻度以上の登録キーワード
    と登録情報とを対にして格納したレコードからなる検索
    ファイルを作成する第三手段と を備え、 上記検索処理装置は、 入力された複数の検索用キーワードの中から最もキーワ
    ード登録頻度の低いキーワードを上記キーワード表より
    取り出し、取り出したキーワードの該当するレコードを
    上記検索ファイルから検索し、このレコードから上記入
    力された複数の検索用キーワードに共通する登録情報を
    検索結果として取り出す手段 を備えたことを特徴とする情報処理装置。
JP2060180A 1990-03-12 1990-03-12 情報処理装置 Expired - Lifetime JPH0776973B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2060180A JPH0776973B2 (ja) 1990-03-12 1990-03-12 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2060180A JPH0776973B2 (ja) 1990-03-12 1990-03-12 情報処理装置

Publications (2)

Publication Number Publication Date
JPH03260868A JPH03260868A (ja) 1991-11-20
JPH0776973B2 true JPH0776973B2 (ja) 1995-08-16

Family

ID=13134703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2060180A Expired - Lifetime JPH0776973B2 (ja) 1990-03-12 1990-03-12 情報処理装置

Country Status (1)

Country Link
JP (1) JPH0776973B2 (ja)

Also Published As

Publication number Publication date
JPH03260868A (ja) 1991-11-20

Similar Documents

Publication Publication Date Title
US5745745A (en) Text search method and apparatus for structured documents
US7809758B2 (en) Database and method of generating same
EP0722145B1 (en) Information retrieval system and method of operation
JPH0765035A (ja) 構造化文書検索装置
JP2888188B2 (ja) 情報検索装置
JPH0628403A (ja) 文書検索装置
JP2693914B2 (ja) 検索システム
JPH0776973B2 (ja) 情報処理装置
JPH0561910A (ja) 全文インデツクス検索方法
JP2535629B2 (ja) 検索システムの入力文字列正規化方式
JP3288063B2 (ja) 可変長データの格納および参照システム
JPH04340163A (ja) キーワード検索方式
JPH0991305A (ja) 情報処理方法及び装置
JPH06162096A (ja) レコード検索方法
JPH06215044A (ja) 情報検索処理装置
JPH05158984A (ja) 文字列抽出装置
JPH04337867A (ja) データベース検索システム
JPH0748218B2 (ja) 情報処理装置
JPH03123973A (ja) 文書検索方法
JP3036246B2 (ja) 情報検索装置
JPS6261118A (ja) 木構造インデクスの検索方式
JPH04230576A (ja) 項目選択装置
JPH0962708A (ja) データ索引方法
JPH07262223A (ja) 自動索引作成装置
JPH0934897A (ja) 図書管理システム