JPS6142032A - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPS6142032A
JPS6142032A JP16312884A JP16312884A JPS6142032A JP S6142032 A JPS6142032 A JP S6142032A JP 16312884 A JP16312884 A JP 16312884A JP 16312884 A JP16312884 A JP 16312884A JP S6142032 A JPS6142032 A JP S6142032A
Authority
JP
Japan
Prior art keywords
data
address
hashing
information
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16312884A
Other languages
English (en)
Inventor
Masayuki Kozuka
雅之 小塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP16312884A priority Critical patent/JPS6142032A/ja
Publication of JPS6142032A publication Critical patent/JPS6142032A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、データ処理装置と外部記憶装置とで構成され
る情報検索装置において、大量のデータの検索・登録等
を行なう情報検索装置に関するものである。
従来例の構成とその問題点 従来例を図を用いて説明を行なう。第1図は、ハツシン
グ関数を用いた情報検索装置の構成方式の1例であり、
1a、1bは検索キーワード、2a。
2bはハツシングテーブル上のアドレス、3a。
3bはデータアドレス記憶部内の該当キーワードのアド
レス、4a、4bはデータ記憶部の該当キ−ワードのア
ドレス群、6は求めるデータのデータ記憶部内のアドレ
ス、6は求めるデータ、7はデータ記憶部の該当キーワ
ードのアドレス群の取出し、8は求めるデータの取出し
を表す。更にAはハツシング処理手段を実現したハツシ
ング処理部、Bはハツシング処理を実現するためのキー
ワード情報を格納するハツシングテーブル部、Cはハツ
シングテーブル本体、Dはキーワードが該当する区画内
のハツシングテーブル本体のパケット内に入りきらない
時のためのオーバーフローエリア、Fはキーワードのデ
ータが格納されているアドレスを記憶しているデータア
ドレス記憶部、Eはハツシング処理により取出された該
当キーワードのデータアドレス記憶部のアドレスを用い
てデータアドレス記憶部Fから取り出したいデータのア
ドレス情報を取出すデータアドレス取出部、Gは複数の
キーワードに対して取出されたデーイアドレス群に対し
論理演算を行い取出すべきデータの絞り込みを行なうデ
ータアドレス演算部、■は求めるデータが格納されてい
るデータ記憶部、Hはデータ記憶部工のアドレス情報5
を用いて実際に求めるデータを取出すデータ取出部であ
る。第2図aは、第1図のハツシングテーブル部Bの実
現方法の一例であり、ハツシングテーブル11オーバー
フローエリアKがそれぞれ第1図のC,Dに対応してい
る。Llはハツシング処理部で生成されるアドレス表示
、Mlはキーワード情報格納エリア、N1は該当するキ
ーワードのデータアドレス記憶部のアドレス情報格納エ
リア、01は該当スるハツシングテーブルのパケットが
総て使用された場合に用いるオーバーフローエリアにの
格納位置を示すエリア、L2はオーバーフローエリアに
のアドレス表示、M2はオーツ5−フロー二リアにのキ
ーワード情報格納エリア、N2はオーバーフローエリア
にの該当するキーワードのデータアドレス記憶部のアド
レス情報格納エリア、02は次に用いるオーバーフロー
エリアにの格納位置を示すエリアである。第3図は第1
図のデータアドレス記憶部Fの実現方法の一例であり固
定長のセルに求めるデータのアドレス情報を複数個格納
している。Pは該当するデータアドレス情報を取出すた
めのアドレス表示、Qはデータ記憶部のアドレス情報を
格納するエリア、Rはそのエリア内のアドレス情報を入
れる場所が総て使用された場合の次格納エリアを示すエ
リアである。
第1図のように構成されたハツシング関数を用いた検索
装置において、成るハツシングアルゴリズムによって第
2図す、cのようなキーワードが登録されテイテ、!−
’7−)’NI SHIMOTOとKATOHに関する
データを取出す場合を考える。このとき第1図において
&をNISHIMOTOlbをKATOHとする。キー
ワード1aと1bがハツシング処理部Aで処理されハツ
シングテーブルアドレス2aと2b(具体的には第2図
で示したように06とOAになる)となり、これらをハ
ツシングテーブル部Bに入れデータアドレス記憶部Fの
アドレス情報3aと3b(具体的には第2図で示したよ
うに36と34になる)を得る。
その際、キーワードKATOHの方は該当する区画にシ
ノニムがないためすぐに求めるアドレス情報を得ること
ができるが、キーワードNISHIMOTOの方は該当
区画内にシノニムが多数二芋在するためハツシングテー
ブル内の該当する区画内だけでなくオーバーフローエリ
アに内の該当区画内まで検索しているキーワードを探す
ことによって求めるアドレス情報を得ている。このよう
に従来のハツシング処理方式では該当区画内に発生する
シノニムの処理においてオーバーフローエリアの管理・
該当区画内で求めるキーワードを検索する処理等を避け
ることが不可能であり、簡単で高速な処理が可能なハツ
シング処理において問題となっている。
次に求めたデータアドレス記憶部Qのアドレス情報3a
と3bをデータアドレス取出部EK入れ各キーワードの
データ記憶部のアドレス情報4aと4b(具体的には第
3図す、cで示したように(51,65,66,59,
60,85,87)と(51,52,63,54,55
,56,57)になる)を求める。この時も、第3図の
ように求めるアドレス情報が複数個存在する場合は可変
長個数のデータを管理する機構が必要になり、そのデー
タの登録・取出処理の実現方法が問題となってくる。さ
らに求めた各キーワードのデータ記憶部のアドレス情報
4aと4bをデータアドレス演算部Gに入れ、絞り込ん
だデータ記憶部のアドレス情報5(具体的には第3図d
で示したように〔sl、tsts、6e〕fなる)を求
める。この時も、第3図のように求めるアドレス情報が
多数個存在する場合はその論理演算処理の実現方法が問
題となってくる。最後にこのアドレス情報6をデータ取
出部Hに入れ求めるデータをデータ記憶部工から取出す
以上のように第1図のような情報検索装置においてはハ
ツシングテーブル部のシノニムの処理、データアドレス
記憶部での複数データの管理、データアドレス演算部で
の大量データの演算という困難な問題が存在していた。
発明の目的 本発明は、従来ハッシング関数を用いる情報検索方式に
おいてはハツシングテーブル部のシノニムの処理、デー
タアドレス記憶部での複数データの管理、データアドレ
ス演算部での大量データの演算という困難な処理の問題
を解決するものである。
発明の構成 本発明は、ハツシングテーブルの内容を直接データ記憶
部のアドレス情報を表せるビットマツプテーブルに変更
することと、データ取出部の代わりにデータ記憶部から
求めるデータを取出す際にただ単にデータを取出すので
はなく、求めるデータか判断しながら取出すデータ判別
取出部を用いることにより、従来の欠点を除去するもの
である。
実施例の説明 第4図は、本発明の情報検索装置の一実施例を示す構成
図であり、20a 、20bは検索キーワード、21a
、21bはハツシングテーブル上のアドレス、22a 
、22bは該当するキーワードが格納されている区画内
の総てのシノニムのデータ記憶部のアドレス情報を表す
ビットマツプ情報、23は各キーワードごとのビットマ
ツプに論理演算を加え情報の絞り込みを行なった殆ど求
めるデータのアドレス情報を表すと考えられるビットマ
ツプ情報、24は23のビットマツプ情報をデータ記憶
部のアドレス情報に変換したアドレス情報群、26は求
めるデータ、26は24のアドレス情報を用いたデータ
記憶部からのデータの取出しを表す。更に10はハツシ
ング処理手段を実現したハツシング処理部、11はハツ
シング処理を実現するための情報を格納するハッシング
テーブル部、12は各区画内のシノニムのデータ記憶部
のアドレス情報を表すビットマツプで構成されたノ・ッ
シングテーブル、13は各キーワードの区画内のビット
マツプ同志の論理演算を行うことによりデータ記憶部の
アドレス情報の絞り込みを行なうピットマッグ演N部、
14ri絞り込み7行なったビットマツプをデータ記憶
部のアドレス情報に変換するデータアドレス変換部、1
6は求めるデータが格納されているデータ記憶部、15
はデータ記憶部16のアドレス情報24を用いて実際に
データを取出しその取り出されたデータが検索したキー
ワードのものかシノニムのものか取出されたデータをも
とにして判別し求めるデータであれば取出すデータ判別
取出部である。
第6図は、第4図のハツシングテーブル12の実現方法
の一例であり、ビットマツプテーブルを持ったハツシン
グテーブルを示し、テーブル内のデータは従来例と全く
同じものを用いている。
Tはハツシング処理部で生成される7ドレス表示、Sは
該当するキーワードが格納されている区画内の総てのシ
ノニムのデータ記憶部の7ドレス情報を表すビットマツ
プ格納エリア、Uは各ビットマツプのどのビットがどの
データ記憶部のアドレスに対応するか示すアドレス表示
である。
第4図のように構成された本発明の検索装置において、
従来例と同じ成るハツシングアルゴリズムによって同じ
キーワード・データが登録されている場合の例が第5図
aのビットマツプテーブルで構成されたハッシングテー
ブルであり、従来例と同様に第6図す、cに示すキーワ
ードN I S HIM:)T。
とKATOHをに関するデータを取出す場合を考える。
このとき第4図においてaをNISHIM)To 。
bをKATOHとする。キーワード20aと20bがハ
ツシング処理部10で処理されハツシングテーブルアド
レス21aと21b(具体的には第5図す、cで示した
ようtlcorsとOAになる)となり、これらをハツ
シングテーブル部11に入れデータ記憶部16のアドレ
ス情報22aと22b(具体的には第6図す、cで示し
たようK〔01α℃11oo100001o1o1o0
1o1oOoo01oO〕と〔になる)を得る。その際
、キーワードKATOHの方は該当する区画にシノニム
がないため求めるアドレス情報であるが、キーワードN
ISHIMOTOの方は該当区画内にシノニムが多数存
在するため得られた情報はそのシノニムのデータのアド
レス情報をも含んでいる。しかしシノニムを含んだ情報
を格納することにより従来例で問題になった各種のシノ
ニムの処理用の機構(複数のパケット。
オーバーフローエリア、該当区画内で求めるキーワード
を検索する処理等)が不用となった。
次に求めたデータ記憶部16のアドレ;(情報22aと
22bをビットマツプ演算部13に入れ殆ど求めるデー
タのアドレス情報を表すと考えられるビットマツプ情報
23(具体的には第5図dで示したように〔olooo
llooooOooOoooOoOooooooooo
oo)になる)を求める。この時も、第3図の場合は求
めるアドレス情報が多数個存在する場合はその論理演算
処理の実現方法が問題と成ったが、第6図の場合は各ビ
ットマツプの論理演算を繰り返すだけなだめ非常に簡単
な機構で処理を実現できうる。さらに求めた論理演算後
のビットマツプ情報23をデータアドレス変換部14に
入れ、ビットマツプ情報をデータ記憶部のアドレスに変
換したアドレス情報24(具体的には第5図eで示した
ように(al、ess、ese)になる)を求める。最
後にこのアドレス情報24をデータ判別取出部16に入
れデータをデータ記憶部18から取出し、その取り出さ
れたデータが検索したキーワードのものかシノニムのも
のか取出されたデータをもとにして判別し求めるデータ
であれは取出す処理を行い求めるデータ26を求める。
即ち、本発明の情報検索装置においては、ハツシング処
理に不可欠と考えられていたハツシングテーブル部での
シノニム処理を行なう代わりに、ビットマツプ演算部に
おいて複数のキーワードに対するデータ記憶部のアドレ
スの論理演算を行なうことと論理、演算よっては削除す
ることができなかった若干の誤ったデータ混入を、デー
タ取出の際に取り除く機能を追加することにより、より
簡単な構成で効率的な検索方式を実現している。
これは、検索されるデータに付加されたキーワード間の
関係と同じ区画にはいるシノニムキーワード間の関係が
無相関であるため、あるデータを取出す際に、検索に使
用される複数のキーワードの情報とそのキーワードと同
じ区画に入るシノニムキーワードの情報が混在しても、
検索対象のシノニムキーワード情報は論理演算の際に無
相関であるため、振るい落とされる可能性が高いという
性質を利用している。
発明の効果 以上のように本発明は高速な検索が必要でかつキーワー
ドの追加・削除が多い場合一般的に用いられている、ハ
ツシング関数を用いた情報検索装置において、そのハフ
シングチ−プル内のシノニムキーワードの処理を、検索
されるデータに付加されたキーワード間の関係と同じ区
画にはいるシノニムキーワード間の関係が無相関である
という性質を利用して、ハツシングテーブル内に取り出
したいデータのアドレスを表すビットマツプとそのビッ
トマツプの論理演算を行なう機構を持つことでより、効
率的なハツシング処理を利用した情報検索装置を実現し
ている。また、このことは従来複雑な記憶管理機構や処
理が必要で凌)った・・ッシング処理に不可欠と考えら
れていたシノニムの管理をなくすと同時に、キーワード
が関係するデータのアドレス管理機構をも廃したより簡
単な構成の情報検索装置を実現している。
【図面の簡単な説明】
第1図はハツシング関数を用いた従来例の情報検索装置
の構成を示す図、第2図a −Cは第1図の情報検索方
式のハツシングテーブル部の構成を示す図、第3図a 
−dは第1図の情報検索方式のデータアドレス記憶部の
構成を示す図、第4図は本発明の情報検索装置の一実施
例を示す構成図、第6図a −eは同実施例のハツシン
グテーブル部の構成を示す図である。 1 a 、 1 b 、 20a 、 20b−−・・
−キーワード情報、2a、2b、21a、21b・・・
・・・ハツシングテーブル上のアドレス、3a、3b・
・・・・・データアドレス記憶部内の該当キーワードの
アドレス、4a、4b・・・・・・データ記憶部の該当
キーワードのアドレス群、6・・・・・・求めるデータ
のデータ記憶部内のアドレス、6・・・・・・求めるデ
ータ、7・・・・・・データ記憶部の該当キーワードの
アドレス群の取出し、8・・・・・・求めるデータの取
出し、22a、22b・・・・・・データ記憶部のアド
レス情報を表すビットマツプ情報、23・・・・・・論
理演算後のビットマッグ情報、24・・・・・・データ
記憶部のアドレス情報群、26・・・・・・求めるデー
タ、26・・・・・・データ記憶部からのデータの取出
し、A・・・・・・ハツシング処理部、B・・・・・・
ハツシングテーブル部、C・・・・・・ハツシングテー
ブル本体、D・・・・・・オーバーフローエIJ7、E
・・・・・・データアドレス取出部、F・・・・・・デ
ータアドレス記憶部、G・・・・・・データアドレス演
算部、H・・・・・・データ取出部、工・・・・・・デ
ータ記憶部、Ll・・・・・・ハツシングテーブルのア
ドレス表示、Ml・・・・・・キーワード情報格納エリ
ア、N1・・・・・・データアドレス記憶部のアドレス
情報格納エリア、01・・・・・・オーバーフローエリ
ア内の格納位置を示すエリア、L2・・・・・・オーバ
ーフローエリアのアドレス表示、N2・・・・・・キー
ワード情報格納エリア、N2・・・・・・データアドレ
ス記憶部のアドレス情報格納エリア、02・・・・・・
次に用いるオーバーフローエリア内の格納位置を示すエ
リア、P・・・、・・アドレス表示、Q・・・・・・デ
ータ記憶部のアドレス情報格納エリア、R・・・・・・
次データアドレス情報格納位置表示エリア、S・・・・
・・区画内のすべてのシノニムのデータ記憶部内のアド
レス情報を表すビットマツプ格納エリア、T・・・・・
・アドレス表示、U・・・・・・データ記憶部のどのア
ドレスに対応するかの表示、10・・・・・・ハツシン
グ処理部、11・・・・・・ハツシングチープル部、1
2・・・・・・ビア)マツプテーブル状のハツシングテ
ーブル、13・・・・・・ビットマツプ演算部、14・
・・・・・データアドレス変換部、15・・・・・・デ
ータ判別取出部、16・・・・・・データ記憶部。

Claims (1)

    【特許請求の範囲】
  1. 検索されるデータと前記検索されるデータを取出すため
    の検索キーワードとを格納した外部記憶装置を有し、前
    記データを外部記憶装置から取出すために、前記検索キ
    ーワードをハッシング関数を用いてハッシングテーブル
    上のアドレスに変換するハッシング処理手段を有し、前
    記ハッシング処理手段で求めたハッシングテーブル上の
    該当位置には前記検索されるデータが格納されたブロッ
    クのアドレスを表すビットマップテーブルが格納されて
    おり、複数の検索キーワードに対しそれぞれのビットマ
    ップテーブルを取出すことができ、前記取出されたビッ
    トマップテーブルの論理演算を行なうことにより前記検
    索されるデータが格納されたブロックのアドレスを絞り
    込む機能を持つビットマップ演算手段を有し、前記ビッ
    トマップ演算手段で作成されたビットマップを前記検索
    されるデータの格納位置アドレスに変換するアドレス変
    換手段を有し、前記アドレス変換手段により生成された
    アドレスにより前記検索されるデータ及び検索キーワー
    ドを取出しそのデータが求める検索キーワードを含むか
    判断し含む場合はそのデータを取出すデータ判別取出手
    段を有することを特徴とする情報検索装置。
JP16312884A 1984-08-02 1984-08-02 情報検索装置 Pending JPS6142032A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16312884A JPS6142032A (ja) 1984-08-02 1984-08-02 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16312884A JPS6142032A (ja) 1984-08-02 1984-08-02 情報検索装置

Publications (1)

Publication Number Publication Date
JPS6142032A true JPS6142032A (ja) 1986-02-28

Family

ID=15767722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16312884A Pending JPS6142032A (ja) 1984-08-02 1984-08-02 情報検索装置

Country Status (1)

Country Link
JP (1) JPS6142032A (ja)

Similar Documents

Publication Publication Date Title
US12287898B2 (en) Query-based database redaction
CN108536819A (zh) 整型列与字符串比较的方法、装置、服务器及存储介质
JPS6142032A (ja) 情報検索装置
JPH0991303A (ja) データ管理装置
JPH08255170A (ja) ソート付き検索処理装置
EP0170443B1 (en) Method for searching an association matrix
EP0649106B1 (en) Compactly stored word groups
JPS6143338A (ja) 連想技術を使用して稀薄なデータベースをサーチする方法
JPH03137772A (ja) データベース利用システム
JPS6118071A (ja) 辞書検索方式
JPS6091443A (ja) 情報検索方式
JP3224159B2 (ja) エキスパートシステム
JPH10222540A (ja) 文書検索方法、装置及び記録媒体
JPS63187334A (ja) 文字列パタ−ンマツチング装置
JPH02153474A (ja) 不要語辞書作成装置
JPH0743942B2 (ja) 複合連想メモリ
JPH04156624A (ja) 知識ベースシステムにおける高速アクセス方式
CN112650893A (zh) 一种字符串检索方法、系统、设备及计算机可读存储介质
JPS5844437Y2 (ja) 情報検索装置
JPS6091444A (ja) 情報検索方式
JPH0844542A (ja) 論理演算処理方法
JPS5952377A (ja) 電子式翻訳機
JPH0272481A (ja) 論理式による文字列検索装置及び同装置の制御方式
JPS62109126A (ja) デ−タベ−スのデ−タ検索方法
JPH10187736A (ja) 電子ファイリングシステム、電子ファイリング方法及び記録媒体