JPH03260868A - 情報処理装置 - Google Patents

情報処理装置

Info

Publication number
JPH03260868A
JPH03260868A JP2060180A JP6018090A JPH03260868A JP H03260868 A JPH03260868 A JP H03260868A JP 2060180 A JP2060180 A JP 2060180A JP 6018090 A JP6018090 A JP 6018090A JP H03260868 A JPH03260868 A JP H03260868A
Authority
JP
Japan
Prior art keywords
search
keyword
registered
registration
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2060180A
Other languages
English (en)
Other versions
JPH0776973B2 (ja
Inventor
Chuichi Kikuchi
菊池 忠一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TEREMATEIIKU KOKUSAI KENKYUSHO KK
Original Assignee
TEREMATEIIKU KOKUSAI KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TEREMATEIIKU KOKUSAI KENKYUSHO KK filed Critical TEREMATEIIKU KOKUSAI KENKYUSHO KK
Priority to JP2060180A priority Critical patent/JPH0776973B2/ja
Publication of JPH03260868A publication Critical patent/JPH03260868A/ja
Publication of JPH0776973B2 publication Critical patent/JPH0776973B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、情報処理装置における複数のキーワードを用
いる情報検索に係わるものであり、特に大量の情報を高
速に検索するものに適する。
〔概要〕
本発明は、複数のキーワードを有する情報に対して1個
以上のキーワード検索を行い、その照合を行って求める
情報の検索処理を行う情報処理装置において、 検索ファイルにキーワードに対応するレコードを割り当
て、登録情報の有するキーワードごとに、レコードに対
応するキーワードの登録頻度以上のすべてのキーワード
をレコードに格納しておき、最も登録頻度の低いキーワ
ードに対応するレコードの中から検索入力に共通する登
録情報を取り出すことにより、 複数の検索入力に対する大量のデータ検索を高速に行う
ことができるようにするものである。
〔従来の技術〕
従来、情報処理装置の情報検索は、任意の1個以上の検
索入力に対して完全転置方式の情報検索が行われること
が多い。この完全転置方式は、キーワードのすべての属
性ごとに転置ファイルを準備し、検索入力の属性に該当
する転置ファイルから検索入力に対応したレコードを取
り出し、この取り出したレコードから、検索入力に共通
の情報を取り出すことによって検索処理を行うものであ
る。
〔発明が解決しようとする課題〕
しかし、転置ファイル方式による検索は、複数の検索入
力に対して検索入力数に比例した転置ファイルからのア
クセス時間を要し、しかも大量情報検索時にはレコード
間に共通する情報を取り出すのに時間がかかるため大量
の情報の高速検索には向かない問題があった。
この例を説明する。
図書館においてその図書管理を行うデータベースシステ
ムを構築するとき、収納する図書には著者、発行者、件
名等の複数のキーワードがあり、検索時にはこれらのキ
ーワードの中から任意のキーワードを使用して検索する
。このとき、転置ファイル方式を用いる場合は著者名、
発行者、件名の3つの検索入力を用いると、この3つの
検索入力のそれぞれに対応するレコードを取り出す必要
がある。このため、複数の検索入力数に比例した検索時
間を要することになり、複数の検索入力による情報検索
を行う場合には検索時間が長くなる問題があった。
さらに、大量の情報の検索処理を行う場合には取り出し
た各レコードのデータ量が巨大なものとなるため、レコ
ード間に共通する情報を取り出すのに時間がかかる問題
があった。
本発明は、複数検索入力に対してlレコードだけで検索
すると高速性が得られることと、複数レコード間の共通
情報取り出し処理では最初の2レコ一ド間の処理に多く
の時間がかかるので、登録時に検索処理の最初の2レコ
一ド間の共通情報抽出を行っておくことで検索の高速性
が得られることに着目してなされたもので、複数の検索
入力に対して高速に大量の検索処理を行うことができる
情報処理装置および情報の検索方法を提供することを目
的とする。
〔課題を解決するための手段〕
本発明は、検索用のキーワードを記憶する領域を備えた
記憶装置と検索入力にしたがって検索処理を実行する検
索処理装置とを備え、検索対象の登録情報から抽出され
た検索用のキーワードが登録され、この登録キーワード
と検索入力との照合を行うことにより検索を行う情報処
理装置において、 登録されるキーワードの登録頻度を計数する第一手段と
、この登録されたキーワードの登録頻度数とキーワード
とを対応させたキーワード族を作成する第二手段と、上
記第一手段および第二手段を参照して登録キーワードご
とに、このキーワードが属する登録情報の全キーワード
を対象としてこのキーワードの登録頻度以上の登録キー
ワードと登録情報とを対にして格納したレコードからな
る検索ファイルを作成する第三手段とを備えたことを特
徴とする。
さらに本発明は、検索処理装置が入力された複数の検索
用キーワードの中から最もキーワード登録頻度の低いキ
ーワードを上記キーワード族より取り出し、このキーワ
ードをディレクトリとして、上記検索ファイルの該当す
るレコード欄を検索し、このレコード欄から上記入力さ
れた複数の検索用キーワードに共通する登録情報を検索
結果として取り出す手段を備えたことを特徴とする。
〔作用〕
本発明の情報処理装置は、キーワードの登録処理と検索
入力にしたがって登録キーワードとの一致確認による検
索処理の二つの動作をもつ。
キーワードの登録処理は、まず、検索対象の登録情報か
ら抽出され、この登録情報と対に対応づけられているキ
ーワードについて、登録するキーワードとその登録キー
ワードの登録頻度を計数してキーワードとそのキーワー
ドの識別符号と登録頻度とを対応づけたキーワード族を
作成する。
ついで登録するすべてのキーワードごとに作成されるレ
コード欄からなり、このレコード欄にはキーワードの識
別符号と登録情報とが対になって格納されている検索フ
ァイルを作成する。このレコード欄には、このレコード
欄のキーワードの登録頻度以上のキーワードの識別符号
と登録情報の対を登録しておく。
キーワードを検索入力として登録キーワードとの照合を
行うときは、入力された複数のキーワードのうち、もっ
とも登録頻度の低いキーワードを探し、この最も登録頻
度の低いキーワードについての検索ファイルのレコード
を検索して、そのレコード内に格納されている検索入力
されたすべてのキーワードに係わるキーワードの識別符
号と登録情報との対を抽出する。そして入力された複数
の検索入力に共通の登録情報を取り出せば、求める検索
対象を抽出することができる。
本発明はこのように複数検索入力に対して最少登録頻度
のキーワードに該当する検索ファイルのレコードを検索
することで高速に検索できるようにしている。
〔実施例〕
以下図面を参照して本発明の詳細な説明する。
第1図は本発明一実施例における情報処理装置の構成を
示すものである。
本実施例の情報処理装置は、各種演算処理あるいは判断
処理を行うCPU1と、検索処理、キーワード登録処理
等のプログラム、キーワード等を記憶するメモリ2、キ
ーボード4、デイスプレィ5を接続する人出力部3、検
索ファイル等の各種情報が記憶される外部記憶装置7を
接続する外部記憶装置制御部6、CPU1、メモリ2、
人出力部3、外部記憶装置制御部6を接続する共通バス
8を備える。
本実施例での情報処理装置の処理は検索処理に供するた
めのキーワード登録と検索ファイルの作成に係わる登録
処理と、検索入力に対する検索処理との二つに分けられ
る。この実施例では電子図書館の閲覧用検索表示を行う
場合について説明する。
まず、キーワード登録と検索ファイルの作成登録処理に
ついて説明する。
第2図は、このキーワード登録において作成されるキー
ワード族を示す。
このキーワード族は登録するキーワードの種類の数のキ
ーワードエリアから構成されており、各キーワードエリ
アは、キーワード欄9と、登録番号欄lOと、登録頻度
欄11とで構成されている。このキーワード欄9は登録
する図書のキーワードを記憶する4バイトのフィールド
であり、登録番号欄10はキーワードの登録順番を示す
登録番号を記憶する4バイトのフィールドであり、登録
頻度欄11は図書登録に使用されるキーワードの登録頻
度を記憶する4バイトのフィールドである。ここでキー
ワードは登録時に入力される文字列であり、登録番号と
登録頻度はともに正の整数からなる。
第3図は、ハツシュ値頻度表を示すものであり、設定者
が設定する数のハツシュ値頻度欄12で構成される。例
えば、ハツシュ値を1000個とすると、ハツシュ値頻
度表にはNα1ハツシュ値頻度欄からNQ、1000ハ
ツシュ値頻度欄まで1000個のフィールドが確保され
る。各ハツシュ値頻度欄12には、ハツシュ関数から算
出される同一ハツシュ値を持つキーワードの数を示す算
出頻度が記憶される。すなわち、ハツシュ値頻度欄12
の算出頻度は、第2図に示すキーワード族において、同
一ハツシュ値になるキーワードが連続配列される数も示
している。
例えば、No、 1ハツシュ値頻度欄の算出頻度が「5
」で、NO12ハツシュ値頻度欄の算出頻度が「3」の
場合には、キーワード族のNα1キーワードからN11
5までの5個のキーワードがNα1ハツシュ値頻度欄の
算出頻度の算出頻度「5」に対応し、キーワード族のN
α6キーワードからNα8キーワードまでの3個のキー
ワードがNα2ハッシン値頻度欄の算出頻度「3」に対
応する。
第4図は、ハツシュ値先頭番地表の構成を示すもので、
第3図に示すハツシュ値頻度表のハツシュ値頻度欄12
と同数の4バイトのフィールドであるハツシュ値先頭番
地欄13で構成されている。このハツシュ値先頭番地欄
13には、第2図のキーワード族に格納する登録キーワ
ードのキーワードエリア先頭番地が記憶される。すなわ
ち、ハツシュ値先頭番地表は、第3図に示すキーワード
算出頻度表に対応して、例えば、N+lL1ハツシュ値
先頭番地欄の先頭番地は、NCL 1ハツシュ関数度欄
に対応するキーワード族のキーワード群の先頭番地を示
している。
第5図は、検索ファイルの構成を示す図である。
この検索ファイルはキーワード族に示すキーワードエリ
アの数のレコードエリアから構成されており、各レコー
ドエリアは、ヘッダ部14とデータ部15とで構成され
ている。
第6図はこの検索ファイル内のレコードの構成を示すも
のである。ヘッダ部14は、レコード番号欄16と収容
数欄17とで構成されており、レコード番号欄16は4
バイトのフィールドで構成され、キーワードの登録番号
をレコードを識別するレコード番号として記憶する。収
容数欄17は、4バイトのフィールドで構成され、デー
タ部15に格納されるキーワードエリアの数を示すレコ
ード容量を記憶する。
データ部15は、収容数欄17のレコード容量で示す数
のキーワードエリアで構成されており、それぞれのキー
ワードエリアは、登録番号欄18と情報番号欄19とか
ら構成されている。この登録番号欄18は、4バイトの
フィールドで構成され、キーワードの登録番号を記憶す
る。情報番号欄19は4バイトのフィールドで構成され
、検索対象であり、登録番号欄18のキーワードに対応
する図書の情報番号を記憶する。
第7図は、レコード容量表の構成を示すもので、第2図
に示すキーワード族のキーワードエリアと同数のレコー
ド容量欄20で構成され、キーワード族の登録番号「l
」から昇順にレコード容量欄も「1」から昇順に対応づ
けている。レコード容量欄20は、第5図に示す検索フ
ァイルの各レコードエリアのデータ部の容量を示す数値
を記憶する4バイトのフィールドからなる。
第8図は、それぞれのレコードの格納番地を示すレコー
ド先頭番地表であり、レコード容量表と同数のn個のレ
コード先頭番地欄21から構成され、各レコード容量欄
20に対応している。このレコード先頭番地欄21は、
上述の検索ファイルに記憶する各レコードのレコード先
頭番地を記憶するもので、第7図のレコード容量表のレ
コード容量欄20に対応し、例えばklレコード先頭番
地はNα1しコード容量欄に対応するレコードの検索フ
ァイルにおける先頭番地を示している。
次に具体的にキーワードの登録処理動作の流れ図を第9
図に示して説明する。
このキーワード登録処理の動作は、大きく分けてキーワ
ードの分類とその登録頻度数の計数と、検索ファイルの
キーワードごとのレコードに、登録番号および情報番号
の対を格納して検索ファイルを作成する動作に分けられ
ており、第1のステップは、キーワードのハツシュ値に
よるハツシュ先頭頭番地表の作成、第2のステップはキ
ーワード族の作成、第3のステップは検索ファイルの先
頭番地を作成、第4のステップは検索ファイルの作成の
動作からなっている。
まず、第1のステップはキーワード表作成の前処理とし
て、キーワードをハツシュ値で分類し、ハツシュ値分類
したキーワードの数と、キーワード表内におけるハラシ
ン値分類したキーワード群の先頭番地を算出する。
この動作を説明する。
まず、登録ファイルから書誌情報を取り出しく3101
)、書誌情報の中からキーワードをすべて取り出す。ハ
ツシュ関数を用いてこれらのキーワードのハツシュ値を
算出し、第3図のハツシュ値頻度表の該当するハツシュ
値頻度欄12に「1」を加算する( S 102)。同
様の処理を登録されている書誌情報すべてについて行う
次にハツシュ先頭頭番地表を作成する。まずNαlハツ
シュ値先頭番地欄に「0」を格納する(S104〉。そ
して、Nα2ハツシュ値先頭番地欄に移り(3105)
 、ハツシュ値頻度表のNCL 1ハツシュ値頻度欄の
算出頻度を3倍した値にNIIL1ハツシュ値先頭番先
頭「0」を加算した値を先頭番地としてNα2ハツシュ
値先頭番地欄に格納する(3106)。ハツシュ値頻度
表のハラシス値頻度欄と同数のハツシュ先頭頭番地欄に
先頭番地を格納したかを調べ(3107) 、同様にハ
ツシュ値頻度表のNcL2ハツシュ値頻度欄の算出頻度
を3倍した値にNα2ハツシュ値先頭番地欄の数値を加
算した値を先頭番地として&3ハツシュ値先頭番地欄に
格納する。これは(NcL(n −1) バーiシュ値
頻度欄)×3+(Nα(n−1)バッジ・ユ先頭頭番地
欄)をNo、 nハツシュ値先頭番地に格納するもので
ある。同様の処理をハツシュ先頭頭番地表の全ハツシュ
先頭頭番地欄に対して行う。
第2のステップでは、キーワード族を作成する。
登録番号に「1」をセットした後、登録ファイルから書
誌情報を取り出しく3110.111)、書誌情報の中
からキーワードを取り出し、ハツシュ関数を用いてこの
キーワードのハツシュ値を算出して(S112)、ハツ
シュ先頭頭番地表から、このハツシュ値に該当するハツ
シュ先頭頭番地欄の先頭番地を取り出す(sl13)。
この先頭番地に該当するキーワード族のキーワードエリ
ア以降の空きエリアのキーワード欄に書誌情報から取り
出したキーワードを、登録番号欄に、このキーワードの
登録番号になる登録番号の現在値を、登録頻度欄に、ハ
ツシュ値頻度表の該当するハツシュ値頻度欄の算出頻度
を格納する(S114)。そして次のキーワードを処理
する前に登録番号に「l」を加算する(S115)。同
様の処理を取り出した書誌情報のすべてのキーワードに
ついて行う。同様の処理を書誌情報すべてについて行う
第3のステップでは、検索ファイル作成の前処理として
、検索ファイルの各レコードの容量と、検索ファイル内
の先頭番地を算出する。
初めに、レコード容量表を作成する。登録ファイルから
書誌情報を1冊分取り出しく3118)、書誌情報の中
からキーワードを取り出す、ハツシュ関数を用いてこの
キーワードのハツシュ値を算出する(S119)。ハツ
シュ先頭頭番地表から、このハツシュ値に該当するハツ
シュ先頭頭番地欄の先頭番地を取り出しく3120)、
この先頭番地に該当するハツシュ値頻度欄の算出頻度が
示す数のキーワードエリアを取り出す(5121、12
2)。取り出したキーワードエリアの中から、登録処理
中のキーワードに一致するキーワードを記憶しているキ
ーワードエリアの登録番号と登録頻度を取り出す(S1
23)。同様の処理を取り出した書誌情報の残りのキー
ワードについて行う。
取り出したこれらの登録番号と登録頻度の対の中で、最
少登録頻度の登録番号に該当するレコード容量表のレコ
ード容量欄に、取り出したこれらの登録番号と登録頻度
の対の数を格納する( S 125)。
これらの登録番号と登録頻度の対から、最少登録頻度の
対を削除しく S 126)、再び残った登録番号と登
録頻度の対の中で、最少登録頻度の登録番号に該当する
レコード容量表のレコード容量欄に、登録番号と登録頻
度の対の数を格納し、最少登録頻度の対を削除する( 
S 127)。同様の処理を登録番号と登録頻度の対が
無くなるまで繰り返す。
次にレコード先頭番地表を作成する。
まず、Nαルコード先頭番地欄に「0」を格納する( 
S 130)。レコード容量表のklレコード容量欄の
容量に、第6図に示すレコードのヘッダ部の容量として
「1」を加算し、この値を2倍した値にNa I先頭番
地欄の「O」を加算し、この値を先頭番地として、N(
L2レコード先頭番地欄に記憶する。さらに、レコード
容量表のNα2レコード容量欄の容量に「1」を加えた
値を2倍した値に、Nα2レコ一ド先頭番地欄の数値を
加算した値を先頭番地として、Nα3レコ一ド先頭番地
に格納する。
この処理は、No、nハツシュ値先頭番地に(NCL(
Tl−1)レコード容量欄+1)x2+ (N(L (
n−1)レコード先頭番地欄)の値を格納するものであ
る( S 132)。同様の処理をレコード容量表の全
レコード容量欄分行う(S133〜135)。
第4のステップでは、検索ファイルを作成する。
登録ファイルから書誌情報を1冊分取り出しく S 1
40) 、書誌情報の中からキーワードを取り出し、ハ
ツシュ関数を用いてこのキーワードのハツシュ値を算出
する( S 141)。そしてハツシュ先頭頭番地表か
ら、このハツシュ値に該当するハツシュ先頭頭番地欄の
先頭番地を取り出しく S 142)、この先頭番地に
該当するキーワード族のキーワードエリアから、ハツシ
ュ値頻度表の該当するハツシュ値頻度欄の算出頻度が示
すキーワードエリアを取り出す(S143.144)。
取り出したキーワードエリアの中から、取り出した書誌
情報のキーワードに一致するキーワードを格納している
登録番号と登録頻度を取り出す(S 145)。同様の
処理を取り出した書誌情報の残りのキーワードについて
行う。
取り出したこれらの登録番号と登録頻度との対の中で、
最少登録頻度の登録番号に該当するレコード先頭番地表
のレコード先頭番地欄の先頭番地が示す検索ファイルの
レコード番号欄に、最少登録頻度の登録番号を格納し、
収容数欄に登録処理中のこれらの登録番号と登録頻度の
対の数を加算し、データ部の空き領域に取り出し登録処
理中のすべての登録番号と登録頻度とを格納する( S
 147.148〉。
さらに、これらの登録番号と登録頻度の対から最少登録
頻度の対を削除しく S 149)、再び残った登録番
号と登録頻度の対の中で、最少登録頻度の登録番号に該
当するレコード先頭番地表のレコード先頭番地欄の先頭
番地に該当する検索ファイルのレコード番地に最少登録
頻度の登録番地を格納し、収容数欄に残った登録番号と
登録頻度の対の数を加算し、データ部の空き領域に残っ
た登録番号と登録頻度を格納し、最少登録頻度の対を削
除する。同様の処理を登録番号と登録頻度の対がなくな
るまで行う(3150,147〜149〉。同様の処理
を登録ファイルの全登録書誌情報について行う。
第1O図は、検索動作を示す流れ図である。
まず、検索入力からキーワードを取り出し、ハツシュ関
数を用いてこのキーワードのハツシュ値を算出する(S
201)。ハツシュ先頭頭番地表から、このハツシュ値
に該当するハツシュ先頭頭番地欄の先頭番地を取り出し
く S 202)、ハツシュ値頻度表から算出したハツ
シュ値に該当する算出頻度を取り出す(S 203>。
そして先頭番地に該当するキーワード族のキーワードエ
リアから、ハツシュ値頻度表から取り出した算出頻度が
示すキーワードエリアを取り出す(S 204)。取り
出したキーワードエリアのキーワード欄が検索入力から
取り出した検索処理中のキーワードに一致するキーワー
ドを格納しているキーワードエリアの登録番号と登録頻
度を取り出す(S 205)。同様の処理を検索入力さ
れた残りのキーワードについて行い、検索入力に該当す
るキーワードの登録番号と登録頻度を絞り込む。
これらの絞り込んだ登録番号と登録頻度の対の中で最少
登録頻度に該当するレコード先頭番地表のレコード先頭
番地欄の先頭番地と、最少登録頻度の登録番号に該当す
るレコード容量が示す容量を取り出し、この先頭番地と
レコード容量が示す検索ファイルのレコードを取り出す
(3207〜209)。
そしてこのレコードのデータ部16について、絞り込ん
だ全登録番号に共通する情報番号を抽出し、検索対象と
する(3210)。
例えば第6図のレコードで、検索入力されたキーワード
に対応する登録番号が「11Jと「50」と「88」と
すると、これらに共通する情報番号はrloOJとなり
、これが検索図書の情報番号となる。
さらに具体的な例を挙げて説明する。
例えば、図書鎗の登録ファイルに登録された書誌番号r
100 Jが、キーワードとしてrISDNJ、「通信
」、rO3IJを有していたとする。この3つのキーワ
ードについてその登録番号と登録頻度数について見てみ
ると、r I S DNJは登録番号が「50」で登録
頻度数がrloo J、「通信」が登録番号が「11」
で登録頻度数がr350 J、「03IJがその登録番
号が「88」で登録頻度数が「50」であったとする。
登録頻度数は、 rO3I」<rlsDN」<r通信」 の関係にあるため、検索ファイルのrO3Ijのレコー
ドにはrO3IJ、「l5DN」、「通信」をその登録
番号と情報番号(書誌番号r100 J )とともに格
納し、rlsDNJのレコードには、「l5DN」と「
通信」をその登録番号と情報番号とともに格納し、「通
信」のレコードには、「通信」をその登録番号と情報番
号とともに格納し検索ファイルを作成しておく。
検索処理を行う場合に、検索入力として「O3■」、r
lsDN」、「通信」のキーワードが入力されると、こ
の3つのキーワードの登録頻度を調べ、最も登録頻度の
低いrO3IJのレコードを取り出す。このrO3IJ
のレコードのデータ部から、「○SIJ、rlsDNJ
、「通信」の3つの登録番号「88」、「50」、「1
1」に共通する情報番号r100 Jが取り出され、共
通する情報番号r100 Jの書誌情報すなわち図書が
検索結果として取り出される。
このようにして、もっとも登録頻度の少ないキーワード
に対応する検索用レコードを検索するだけで複数の検索
入力に対する検索が可能であり、その検索を高速化する
ことができる。
〔発明の効果〕
以上説明したように、本発明は、複数検索入力に対して
ルーコードだけで検索できることと、登録時に検索処理
の最初の2レコ一ド間の共通情報抽出を行っておくこと
により、大量の情報を複数の検索入力で検索する場合に
その検索処理を高速化することができる優れた効果があ
る。
【図面の簡単な説明】
第1図は実施例情報処理装置の構成例。 第2図は実施例のキーワード表。 第3図は実施例のハツシュ値頻度表。 第4図は実施例ハツシュ先頭頭番地表。 第5図は実施例検索ファイル。 第6図は検索ファイルのレコード構成を示す図。 第7図は実施例のレコード容量表。 第8図は実施例のレコード先頭番地表。 第9図は実施例のキーワード登録処理動作を説明する図
。 第10図は実施例の検索処理動作を説明する図。 1・・・CPU、2・・・メモリ、3・・・人出力部、
4・・・キーボード、5・・・デイスプレィ、6・・・
外部記憶装置制御部、7・・・外部記憶装置、訃・・共
通バス。

Claims (1)

  1. 【特許請求の範囲】 1、検索用のキーワードを記憶する領域を備えた記憶装
    置と検索入力にしたがって検索処理を実行する検索処理
    装置とを備え、 検索対象の登録情報から抽出された検索用のキーワード
    が登録され、この登録キーワードと検索入力との照合を
    行うことにより検索を行う情報処理装置において、 登録されるキーワードの登録頻度を計数する第一手段と
    、 この登録されたキーワードの登録頻度数とキーワードと
    を対応させたキーワード表を作成する第二手段と、 上記第一手段および第二手段を参照して登録キーワード
    ごとに、このキーワードが属する登録情報の全キーワー
    ドを対象として、このキーワードの登録頻度以上の登録
    キーワードと登録情報とを対にして格納したレコードか
    らなる検索ファイルを作成する第三手段と を備えたことを特徴とする情報処理装置。 2、検索用のキーワードを記憶する領域を備えた記憶装
    置と検索入力にしたがって検索処理を実行する検索処理
    装置とを備え、 検索対象の登録情報から抽出された検索用のキーワード
    が登録され、この登録キーワードと検索入力との照合を
    行うことにより検索を行う情報処理装置において、 登録されるキーワードの登録頻度を計数する第一手段と
    、 この登録されたキーワードの登録頻度数とキーワードと
    を対応させたキーワード表を作成する第二手段と、 上記第一手段および第二手段を参照して登録キーワード
    ごとに、このキーワードが属する登録情報の全キーワー
    ドを対象として、このキーワードの登録頻度以上の登録
    キーワードと登録情報とを対にして格納したレコードか
    らなる検索ファイルを作成する第三手段と を備え、 上記検索処理装置は、 入力された複数の検索用キーワードの中から最もキーワ
    ード登録頻度の低いキーワードを上記キーワード表より
    取り出し、このキーワードをディレクトリとして、上記
    検索ファイルの該当するレコードを検索し、このレコー
    ドから上記入力された複数の検索用キーワードに共通す
    る登録情報を検索結果として取り出す手段 を備えたことを特徴とする情報処理装置。
JP2060180A 1990-03-12 1990-03-12 情報処理装置 Expired - Lifetime JPH0776973B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2060180A JPH0776973B2 (ja) 1990-03-12 1990-03-12 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2060180A JPH0776973B2 (ja) 1990-03-12 1990-03-12 情報処理装置

Publications (2)

Publication Number Publication Date
JPH03260868A true JPH03260868A (ja) 1991-11-20
JPH0776973B2 JPH0776973B2 (ja) 1995-08-16

Family

ID=13134703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2060180A Expired - Lifetime JPH0776973B2 (ja) 1990-03-12 1990-03-12 情報処理装置

Country Status (1)

Country Link
JP (1) JPH0776973B2 (ja)

Also Published As

Publication number Publication date
JPH0776973B2 (ja) 1995-08-16

Similar Documents

Publication Publication Date Title
JP2832988B2 (ja) データ検索システム
US20080319987A1 (en) System, method and program for creating index for database
US8266150B1 (en) Scalable document signature search engine
JPH11212980A (ja) インデクス作成方法および検索方法
WO2002039320A1 (en) Method for structuring and searching information
CN102867049A (zh) 一种基于单词查找树实现的汉语拼音快速分词方法
JP2693914B2 (ja) 検索システム
JP2535629B2 (ja) 検索システムの入力文字列正規化方式
JP3552318B2 (ja) 文書検索方法およびシステム
JPH03260868A (ja) 情報処理装置
JPH0561910A (ja) 全文インデツクス検索方法
JP2002202973A (ja) 構造化文書管理装置
JPH04340163A (ja) キーワード検索方式
JP3288063B2 (ja) 可変長データの格納および参照システム
JP3649472B2 (ja) 情報検索装置
JP2000090115A (ja) インデクス作成方法および検索方法
JP2000322416A (ja) 文書検索装置
JPH06162096A (ja) レコード検索方法
JPH06215044A (ja) 情報検索処理装置
JPS63153630A (ja) 被引用文献検索方式
JP2718107B2 (ja) 比較処理方式
JPH0342774A (ja) 情報処理装置
JP3036246B2 (ja) 情報検索装置
CN118861076A (zh) 一种代码表的检索方法及装置、电子设备、存储介质
JPS5850044A (ja) インデクス・レコ−ドの検索処理方式