JPS62204376A - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPS62204376A
JPS62204376A JP61046554A JP4655486A JPS62204376A JP S62204376 A JPS62204376 A JP S62204376A JP 61046554 A JP61046554 A JP 61046554A JP 4655486 A JP4655486 A JP 4655486A JP S62204376 A JPS62204376 A JP S62204376A
Authority
JP
Japan
Prior art keywords
information
storage device
search
external storage
document number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61046554A
Other languages
English (en)
Other versions
JPH0574859B2 (ja
Inventor
Masayuki Kozuka
雅之 小塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61046554A priority Critical patent/JPS62204376A/ja
Publication of JPS62204376A publication Critical patent/JPS62204376A/ja
Publication of JPH0574859B2 publication Critical patent/JPH0574859B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、データ処理装置と内部記憶装置と外部記憶装
置とで構成される情報検索装置に関するものであり、外
部記憶装置から検索するためのデータを取り出し、内部
記憶装置に格納した後に処理を行う情報検索装置で利用
するものである。
従来の技術 OAシステム等に用いられている情報検索装置はその外
部記憶装置内の検索情報をすべて内部記憶装置内に格納
した上で、検索処理を行なう内部記憶検索と、外部記憶
装置内の検索情報のインデックス情報等の検索情報の一
部を内部記憶装置に格納し、検索の度に必要になった検
索情報をインデックス情報等から発見し外部記憶装置か
ら内部記憶装置に取り出して検索を行う外部記tα検索
がある。最近は半導体メモリの価格低下により大量の内
部記憶容量を持った内部記憶装置を安価に作成すること
が可能になってきたことと、最近のOAシステム等で用
いられている情報検索装置はユーザーと装置間の会話型
処理が中心となっているために応答時間が従来以上に重
視されるようになり、大量の情報をより速く検索できる
装置が要求されてきたこと等により内部記憶検索も多く
用いられるようになってきた。
内部記憶検索では、頻繁に情報の追加編集等が行われる
揮発性の高い場合は内部記憶装置内の情報は瞬時に更新
されるため問題は起こらないが、その情報を不揮発性の
記憶装置である外部記憶装置に記憶する必要があり、こ
の外部記憶装置に記憶するタイミングが問題となる。こ
こで外部記憶装置が磁気記憶媒体のような書き換え可能
な媒体の場合は内部記憶装置内の情報が更新される度に
更新することも、処理終了時にまとめて更新することも
可能であるが、光デイスク装置のような追記型の媒体の
場合は書き直しが出来ないため、この方法を用いると、
記憶容量が非常に無駄になり従来はあまり行われていな
かった。
ここで追記型の外部記憶装置を用いて内部記憶検索を行
っている従来の方式の例を述べると次の2つの方式が考
えられる。どちらの方式も更新(登録時)の度に生じる
検索情報をルコード毎に追記型の装置にその都度記憶し
、第22図のように格納することにより、記憶領域の無
駄は防止している。そのためにシステム起動時に検索情
報を内部記tへ*構内に展開する処理が生じ、この処理
の実現方式に2つに分かれる。
1、システム起動時に生じる検索情報の内部記憶装置へ
の展開は、単純にその形式で内部記憶装置に格納するこ
とにより行う。つまり、内部記憶装置への展開時に検索
情報の論理構造の変更を行わないで、内部記憶装置内も
一次正規形で検索情報を格納する方式。この方式では検
索情報の格納構造の変更を伴わないため高速の起動処理
が期待できる。
2.1.0方式では内部記憶装置内も一次正規形で検索
情報を格納しているため、高速の起動処理が期待できる
が検索処理の効率の向上が余り望めない。そのため、外
部記憶装置内の検索情報を内部記憶装置に格納する際に
、時間は掛かるが検索に適した論理構造に編集し直した
上で格納する方式があり、この方式では第21図に示す
ように、情報形式変換機構内の情報取出機構で検索情報
の展開時に検索情報をルコードづつ取り出し、その検索
情報を検索情報変更機構で通常の更新処理と同様な処理
を行うことにより、検索情報を内部記憶装置内に展開し
ている。
以上述べたように1.及び2.の方式は共に、検索処理
の応答性と内部記憶装置内への検索情報の展開時間の間
に相反する関係が有り、両者の利点を活かすことが出来
ないという欠点があった。特に2.の方式については一
度検索情報を内部記憶装置内に展開した後は、検索情報
は検索に適した論理構造を持つため、高速でかつ高度な
検索処理が望め検索装置としては非常に魅力的な方式で
ある。このためこの方式において高速な展開方式を実現
することが追記型の外部記憶装置を用いて内部記憶検索
を実現するための最大の問題点であった。
発明が解決しようとする問題点 以上のように従来の内部記憶検索を行う情報検索装置で
は、まとめると下記のような欠点があると考えられる。
1、外部記憶装置と内部記憶装置の一致性の保証のため
に終了時にすべてのデータを外部記憶装置に書き直す必
要がある。このため追記型の媒体を使用する場合は記憶
領域の無駄を防ぐために特殊な方法で検索情報を記憶す
る必要がある。
2、外部記憶装置内の情報が動的に変化するため登録順
の情報が管理出来ない。
3、外部記憶装置に追記型の媒体を利用した場合は、検
索情報を検索処理に適した構造に変換して格納する場合
は、外部記憶装置から内部記憶装置にデータを格納する
処理において、通常の更新処理を同様の処理を必要とす
る。このためかなりの処理時間を消費することになる。
4、外部記憶装置に追記型の媒体を利用した場合は外部
記憶装置から内部記憶装置にデータを格納する処理を通
常の登録処理でない方法で行うと、外部記憶装置内部記
憶装置と同様な構造で検索情報を格納することとなり高
速な検索を行うために有効なデータ構造を採用すること
が困難である。
本発明はかかる点に鑑みてなされたもので、上記の欠点
を克服するために外部記憶装置内に検索情報に若干の情
報を付加した情報(以下補助情報と記述する)を更新処
理に検索情報とともに記憶し、この情報を用いて検索情
報を検索処理に適した構造に編集した上で高速に外部記
憶装置から内部記憶装置内に格納することを可能にする
手段を提供することを目的としている。
問題点を解決するための手段 本発明は上記の欠点を解決するために以下のような処理
を行っている。検索装置の情報更新時には内部記憶装置
内の検索情報と外部記憶装置内の検索情報を更新するが
、この際内部記憶装置内の検索情報を更新した際の更新
方法を示す情報(たとえば更新方法、検索情報を格納し
た位置・格納方法、他の変更された情報の位置・内容等
)を検索情報とともに1回の更新分づつ外部記憶装置に
記憶する。そして検索情報を外部記憶装置から内部記憶
装置内に格納する際にはその情報を1回の更新分づつ取
り出し、通常の更新処理に換えて更新時に記憶した補助
情報を用いて外部記憶装置から内部記憶装置への検索情
報の格納処理と検索情報の論理構造の変更処理を高速に
行うものである。
作用 本発明は、上記した構成により外部記憶装置に格納され
た検索情報を内部記憶装置に展開する際に、内部記憶装
置内への格納方法や格納位置の情報である補助情報を用
いることにより、通常の更新処理を用いずに検索情報の
論理構造をも変更した上で内部記憶装置内に検索情報を
高速に展開する情報検索装置であり、従来困難であった
高速な起動処理と高度な検索機能を両立させることがで
きる。
実施例 第1図は本発明の情報検索装置の一実施例を示すブロッ
ク図である。第1図において、102は外部記憶装置、
103は内部記憶装置、101は外部記憶装置内の検索
情報を取り出し、論理構造を変換した形で内部記憶装置
内に展開する情報形式変換機構、104は内部記憶装置
103内の検索情報を用いて検索を行う情報検索機構、
105は外部記憶装置内の検索情報及び補助情報を取り
出す情報取出機構、106は取出した情報から補助情報
の部分を抜き取る補助情報抽出機構、107は取出した
補助を用いて検索情報を格納する位置を決定する情報格
納位置確定機構、108は情報格納位置確定機構で決め
られた位置に情報を格納し指定された方法で内部記憶装
置内の検索情報の更新を行う情報格納機構とを有す。1
10.111は外部記憶装置102から取り出される情
報、112は検索情報と補助情報に分けられた情報、1
13゜114は検索情報とその格納位置、方法等を指示
する情報、115は内部記憶装置103内の検索情報を
検索した結果である。
第2図は本発明の情報検索装置において1回の更新処理
に伴って作成され、外部記憶装置102に格納する検索
情報および補助情報フォーマットの一実施例を示す図あ
り、(a)は検索情報の領域と補助情報の領域を分けた
例であり、(ハ)は検索情報に対応する補助情報とを組
にして格納した例である。
第3図は第2図の(a)の情報を実際に外部記憶装置に
記憶した場合の一実施例であり、第4図はその情報の検
索情報1の属性の部分を内部記憶装置内に逆ファイル構
造に変換して展開した場合の論理構造を示す図である。
第3図において検索情報の部分は一次正規形であるため
、このままの形で内部記憶装置に格納すると検索効率が
良くないため、第4図のような逆ファイル構造に展開し
て格納する。この一実施例では一次正規形で外部記憶装
置に格納された検索情報を逆ファイル構造に変換して内
部記憶装置に格納する例を述べて行くが、索引順次編成
等の別の論理構造に変換することも可能である。
第5図は本発明の異なる実施例の情報検索装置の一実施
例を示すブロック図である。第5図の上半分は第1図と
同じであり、第1図に更新処理時の処理を行う検索情報
更新機構505を加えたものである。検索情報更新機構
505内には検索装置に対して送られてきた更新情報5
30を受取り内部記憶装置内の検索情報を更新する検索
情報変更機構513があり、更新情報530から検索情
報531を取り出し指定された更新方法で内部記憶装置
503を更新し、その更新方法、更新位置等の補助情報
を生成するための情報532を受は取る。この補助情報
を生成するための情報532と更新情報から取り出した
検索情報とを補助情報生成記憶512に送る。補助情報
生成記憶512では送られてきた情報から補助情報を生
成し検索情報とともに記憶情報編集機構511に再転送
する。記憶情報編集機構511では送られてきた検索情
報と補助情報を第2図に示したようなフォーマットの情
報に編集し情報記憶機構510に送る。情報記憶機構5
10では転送されてきた情報を外部記憶装置502に記
憶する。
第6図は本発明の情報検索装置を光デイスク装置を外部
記憶装置に用いた文書ファイルシステムに適応した場合
のブロック図である。6゜1はシステム全体の制御を行
う制御装置であり第5図の情軸形式変換機構501及び
検索情報更新機構505もこの中に実現されている。6
02は追記型の光デイスク装置を用いた外部記憶装置で
ありシステムに入力された文書情報や検索情報を記憶す
る。603は半導体メモリを用いた内部記憶装置、60
5は文書の入出力を行う画像入出力装置、604は文書
の表示を行う画像表示装置である。
第7図は補助情報のフォーマットの一実施例であり、第
8図は補助情報のフォーマットの別の実施例である。第
7図の実施例の場合は5種類の更新処理を1個のフォー
マットで表現している例であり、第8図の場合は3種類
の更新処理を別個のフォーマットで表現している例であ
る。フォーマットの形式は異なっているがともに同様な
処理に対する補助情報を示している。
第9図から第20図までは各更新処理をこの補助情報を
用いて行う場合の処理を示す図である。これらは第4図
で示したような逆ファイル構造に検索情報を編集した上
で格納する場合の例である。ここでは通常の更新処理を
行う場合の処理と補助情報を用いて行う処理とを対比し
て述べていく。基本的な更新処理の方法としては更新す
る検索情報から更新対象のキーワードを取り出し、vJ
J図の様に構成された検索情報内のどの位置に更新対象
のキーワードが格納されているかを検索し、該当のキー
ワードがある場合はそのキーワードに対して更新処理を
行い、ない場合はその更新処理が登録処理の場合は新た
にキーワードを登録する位置にキーワードを格納し、そ
れ以外の処理の場合は該当するキーワードが検索装置内
に存在しないことは異常であるため、その処理要求にあ
った異常処理を行う。以下登録処理について第9図から
第20図までの各図を用いて説明していくが、各図の見
方を説明すると、各図とも3段の横のポインタ列があり
、上の列は第4図のキーワード領域の論理構造をポイン
タを用いて示したものであり、中の列は同図の文書番号
領域の論理構造をポインタを用いて示したものである、
さらに下の図は文書番号領域の空き領域を管理するため
の未使用の文書番号領域をつないで作った空き文書番号
領域のリストである。以下登録処理、削除処理、変更処
理の順で説明していく。
第9図〜第14図は検索装置に検索情報を登録する場合
の処理である。通常の登録処理の場合はキーワード領域
を検索することを行い、この結果により該当キーワード
が存在しない場合と存在する場合とにわかれ、更に存在
する場合は該当キーワードが管理している文書番号領域
に空きがある場合とない場合とに分けて処理を行ってい
る。
通常の登録処理の場合の処理は次のような順序で行われ
る。
1、登録する文書番号とその文書番号を検索するために
ユーザー等によって付与されたキーワードとを取り出す
2、取り出したキーワードを第4図のインデックス領域
とキーワード領域を検索することにより、該当キーワー
ドが格納されている位置を探す。
3、発見され無かった場合は第9図、第10図に示した
一度も登録されていないキーワードを登録する場合の処
理を行う。
4、発見された場合はそのキーワードを用いている文書
番号を格納している文書番号領域へのポインタをたどり
、該当キーワードの文書番号領域に空きがあるか調べる
5、文書番号領域に空きがある場合は、第11図、第1
2図に示した文書番号の追加登録処理1を行い、無い場
合は第13図、第14図に示した文書番号の追加登録処
理2を行う。
補助情報を用いた更新処理(検索処理及び削除、変更処
理)の場合は次のような順序で行われる。
1°登録する文書番号とその文書番号に付与されたキー
ワードとキーワードの補助情報を取り出す。
2′取出したキーワードの補助情報の種類の項目を調べ
て処理の種類を決定する。
3°各処理にキーワードと補助情報と文書番号を渡し処
理を行う。
次に個々の登録処理の内容に付いて記述していく。
第9図、第10図に示した一度も登録されて−いないキ
ーワードを登録する場合の処理は次のような順序で行わ
れる(処理順序を表す丸材数字は′M10図のそれに対
応している)。
■ 空きキーワード領域の先頭に該当キーワードを格納
する。
■ 2.の処理が失敗した位置の直前のキーワード(論
理的にキーワードを挿入する位置の直前のキーワード)
の位置を位置情報1として記憶する(この処理は補助情
報を作成するための特殊な処理)。
■ 直前のキーワードの文書番号へのポインタをたどり
直前のキーワードの管理する文書番号領域の終わりの位
置を位置情報2として記tqする(この処理は補助情報
を作成するための特殊な処理)。
■ 直前のキーワードの次のキーワードへのポインタの
情報を登録したキーワードの次のキーワードへのポイン
タ情報の内容に入れる。
■ 直前のキーワードの次のキーワードへのポインタの
情報の内容を登録したキーワードの位Uを示すポインタ
情報に変える。
■ 登録されたキーワードの数を更新する(1個増やす
)。
■ 空き文書番号領域ポインタで示された空き文書番号
領域の先頭の位置に登録する文書番号を格納する。
■ 空き文書番号領域ポインタの内容を登録したキーワ
ードの文@番号へのポインタの内容に置き換える。
■ 文書番号を登録した文書番号領域の次文書番号領域
指示ポインタの内容を空き文書番号領域ポインタの内容
に置き換える。
■ 位置情報2を付与した文書番号領域の次文書番号領
域指示ポインタの内容を文書番号を登録した文書番号領
域の次文書番号領域指示ポインタの内容に置き換える。
■ 位置情報2を付与した文書番号領域の次文@番号領
域指示ポインタの内容を文書番号を登録した文書番号領
域の位置を示すポインタ情報に変える。
■ 補助情報の種類の項目を0にする。(この処理は補
助情報を作成するための特殊な処理) ■ 登録された文書番号の数を更新する(1個増やす)
1.2.の処理のほかに以上のような処理を行う必要が
あり、特に2.の処理がキーワード領域内を検索するた
め処理時間が掛かる。ここで説明した■〜0までの処理
の内■■@の処理は補助情報を作成するための特殊な処
理であり、補助情報を作成する処理を行わない場合は必
要は無い。以上述べたように新規にキーワードを検索装
置内に登録する処理はかなりの処理量があり、これを起
動時に各文書番号毎(例えば第6図に示した文書ファイ
ルシステムに応用する場合は1〜2万文書程度の文書が
光ディスクに記憶できるためこの程度の回数の登録処理
が行われることを想定する必要がある)に行っていては
非常に時間が掛かってしまい実用にならない。そこでつ
ぎのような補助情報を使った新規キーワードの登録処理
を起動時に行うことにより高速な起動処理を実現してい
る。
具体的な処理は次のような順序で行われる(処理順序を
表すカッコ付数字は第10図のそれに対応している)。
(1)空きキーワード領域の先頭に該当キーワードを格
納する。
(2)補助情報1の示すキーワードの次のキーワードへ
のポインタの情報を登録したキーワードの次のキーワー
ドへのポインタ情報の内容に入れる。
(3)補助情報1の示すキーワードの次のキーワードへ
のポインタの情報の内容を登録したキーワードの位置を
示すポインタ情報に変える。
(4)空き文書番号領域ポインタで示された空き文書番
号領域の先頭の位置に登録する文書番号を格納する。
(5)文書番号を登録した文書番号領域の次文書番号領
域指示ポインタの内容を空き文書番号領域ポインタの内
容に置き換える。
(6)位置情報2を付与した文書番号領域の次文書番号
領域指示ポインタの内容を文書番号を登録した文書番号
領域の次文書番号領域指示ポインタの内容に置き換える
(6)  位置情報2を付与した文書番号領域の次文書
番号領域指示ポインタの内容を文書番号を登録した文書
番号領域の位置を示すポインタ情報に変える。
(7)空き文書番号領域ポインタの内容を登録したキー
ワードの文@番号へのポインタの内容に置き換える。
(8)  登録されたキーワードの数を更新する(1個
増やす)。
(9)登録された文書番号の数を更新する(1個増やす
)。
以上の様に時間の掛かる処理である2、を行う必要が無
く、補助情報が示す領域と新規に登録した領域のポイン
タ情報を変えるだけで容易に登録処理が終わることが分
かる。
第11図、第12図に示した文書番号の追加登録処理1
の場合の通常処理は次のような順序で行われる。(処理
順序を表す先付数字は第12図のそれに対応している。
) ■ 2.の処理の結果、登録するキーワードを格納した
位置を発見しその位置を位置情報1として記憶する(こ
の処理は補助情報を作成するための特殊な処理)。
■ 4.の処理を行い、文書番号領域内に新たな文書番
号を登録する場所を発見する。
■ ■の処理の結果、登録する文書番号を格納した位置
を発見しその位置を位置情報2として記憶する。(この
処理は補助情報を作成するための特殊な処理) ■ 位置清報2の示す位置に登録する文書番号を格納す
る。
■ 登録された文書番号の数を更新する(1個増やす)
■ 補助情報の種類の項目を1にする(この処理は補助
情報を作成するための特殊な処理)。
この処理では■で行うキーワード領域内の登録キーワー
ド位置の検索処理と■で行う文書番号領域内の空き領域
を発見するための処理が処理時間を食う。
次に補助情報を用いた同様な処理について記述する(処
理順序を表すカッコ付数字は第12図のそれに対応して
いる)。
(1)位置情報2の示す位置に登録する文書番号を格納
する。
(2)位置情報1の示すキーワード領域内にある登録さ
れた文書番号の数を更新する(1個増やす)。
の2つの処理で処理を終了することができ、非常に高速
であることがわかる。
更に、第13図、m14図に示した文書番号の追加登録
処理2の場合の通常処理は次のような順序で行われる(
処理順序を表す先付数字は第14図のそれに対応してい
る)。
■ 2.の処理の結果、登録するキーワードを格納した
位置を発見しその位置を位[117報1として記憶する
(この処理は補助情報を作成するだめの特殊な処理)。
■ 4.0処理を行い、文書番号領域内に新たな文書番
号を登録する場所を操作するが失敗する。
■ ■の処理の結果、発見した文書番号領域の最終領域
の次文書番号領域指示ポインタの位置を位置情報2とし
て記憶する(この処理は補助情報を作成するための特殊
な処理)。
■ 空き文書番号領域ポインタの指す空き文書番号領域
の先頭位置に登録する文書番号を格納する。
■ 文書番号を格納した文書番号領域の次文書番号領域
指示ポインタの内容を空き文書番号領域ポインタの内容
に置き換える(この処理に先立って空き文書番号領域ポ
インタの内容を退避する)。
■ 文書番号を格納した文書番号領域の次文四番号領域
指示ポインタの内容に位置情報2が示す位置の次文書番
号領域指示ポインタの内容を格納する。
■ 位置情報2が示す位置の次文書番号領域指示ポイン
タの内容を退避した空き文書番号領域ポインタの内容に
置き換える。
■ 登録された文書番号の数を更新する(1個増やす)
■ 補助情報の種類の項目を2にする(この処理は補助
情報を作成するための特殊な処理)。
この処理でも■で行うキーワード領域内の登録キーワー
ド位置の検索処理と■で行う文書番号領域内の空き領域
を発見するための処理が処理時間を食う。
次に補助情報を用いた同様な処理について記述する(処
理順序を表すカッコ付数字はm14図のそれに対応して
いる)。
(1)空き文書番号領域ポインタの指す空き文書番号領
域の先頭位置に登録する文書番号を格納する。
(2)文書番号を格納した文書番号領域の次文書番号領
域指示ポインタの内容を空き文書番号領域ポインタの内
容に置き換える(この処理に先立って空き文書番号領域
ポインタの内容を退避する)。
(3)  文@番号を格納した文書番号領域の次文書番
号領域指示ポインタの内容に位置情報2が示す位置の次
文書番号領域指示ポインタの内容を格納する。
(4)位置情報2が示す位置の次文書番号領域指示ポイ
ンタの内容を退避した空き文書番号領域ポインタの内容
に置き換える。
(5)位置情報1の示すキーワード領域内にある登録さ
れた文書番号の数を更新する(1個増やす)。
以上の処理で登録処理を終了することができ、処理速度
が高速であることがわかる。
次に、第15図、第16図を用いて文書番号の削除処理
の場合の処理を説明していく。ここで用いる削除処理は
実際に領域を開放を伴うものでは無く、文書番号を削除
マークに置き換えることによる論理的な削除である。ま
たここで削除された文書番号はガーベージコレクション
処理により一括的に領域の開放処理が行なう。
この処理については第17図、第18図を用いて説明す
る。
まず通常処理について説明すると通常処理は次のような
順序で行われる(処理順序を表す先付数字は第16図の
それに対応している)。
■ 削除する文書番号とその文書番号に付与されていた
キーワードを取り出す。
■ 取出したキーワードがキーワード領域のどの位置に
格納されているか操作し、発見する。
発見できない場合はエラー処理を行う。
■ 発見した位置を位置情報1として記憶する(この処
理は補助情報を作成するための特殊な処理)。
■ 該当キーワード領域の文書番号領域ポインタを用い
て文書番号領域の先頭を割り出し、文″4!!番号領域
内を削除対象の文書番号が格納されている位置を走査す
る。
■ ■の処理の結果、発見した文書番号領域内の削除対
象文書番号の位置を位置情報2として記憶する(この処
理は補助情報を作成するための特殊な処理)。
■ 削除された文書番号の数を更新する(1個減らす)
■ 補助情報の種類の項目を3にする(この処理は補助
情報を作成するための特殊な処理)。
この処理でも■で行うキーワード領域内の削除キーワー
ド位置の検索処理と■で行う文書番号領域内の削除対象
の文書番号を発見するための処理が処理時間を食う。
次に補助情報を用いた同様な処理について記述する(処
理順序を表すカッコ付数字は第16図のそれに対応して
いる)。
(1)位置情報2の示す位置に削除マークを格納する。
(2)位置情報1の示すキーワード領域内にある登録さ
れた文書°番号の数を更新する(1個減らす)。
以上の処理で処理を終了することができ、処理速度が非
常に高速であることがわかる。
次に、第17図、第18図を用いて文書番号の削除処理
用の補助情報を用いた特殊な場合の処理として、ガーベ
ージコレクション処理に削除時の補助情報を用いた例を
説明していく。
(1)位置情報1以降に文書番号が登録されているか調
べる。ない場合は終了。
し) ある場合は1個づつ文書番号を前にずらす。
(3)最後の文書番号領域内に文書番号があるかどうか
調べる。ない場合は最終文書番号領域の次文書番号領域
指示ポインタの内容を直前の次文書番号領域指示ポイン
タの内容に誼き換える。あった場合は終了。
(4)空き文書番号領域ポインタの内容を最終文書番号
領域の次文書番号領域指示ポインタの内容に置き換える
(5)  空き文書番号領域ポインタの内容を最終文書
番号領域の位置情報に置き換える。
以上の処理で文書番号領域内の削除マークを総当たり的
に調べることなしでガーベージコレクション処理を高速
に行うこともできる。従って本発明の補助情報を作成し
それを更新処理に用いる本発明の用途は起動処理時の検
索情報の展開処理に限定されるものではなく一般的なデ
ータ構造の変更処理にも用いることができることがわか
る。
更に、第19図、第20図を用いて文書番号の変更処理
の場合の処理を説明していく。
まず通常処理について説明すると通常処理は次のような
順序で行われる(処理順序を表す先付数字は第20図の
それに対応している)。
■ 変更する文書番号とその文書番号に付与されていた
キーワードと新たな文書番号とを取り出す。
■ 取出したキーワードがキーワード領域のどの位置に
格納されているか操作し、発見する。
発見できない場合はエラー処理を行う。
■ 新たな文書番号を位置情報1として記憶する(この
処理は補助情報を作成するための特殊な処理)。
■ 該当キーワード領域の文書番号領域ポインタを用い
て文書番号領域の先頭を割り出し、文書番号領域内を変
更対象の文書番号が格納されている位置を走査する。
■ ■の処理の結果、発見した文書番号領域内の削除対
象文書番号の位置を位置情報2として記憶する(この処
理は補助情報を作成するための特殊な処理)。
■ 位置情報2の位置に新たな文書番号を格納する。
■ 補助情報の種類の項目を4にする(この処理は補助
情報を作成するための特殊な処理)。
この処理でも■で行うキーワード領域内の削除キーワー
ド位置の検索処理と■で行う文書番号領域内の削除対象
の文書番号を発見するための処理が処理時間を食う。
次に補助情報を用いた同様な処理について記述する(処
理順序を表すカッコ付数字は第20図のそれに対応して
いる)。
(1)位置情報2の示す位置に位置情報1を格納する。
以上の処理で処理を終了することができ、処理速度が非
常に高速であることがわかる。
以上いろいろな更新処理について通常の処理と通常処理
で作成した補助情報を用いて行った処理を第7図に示し
た補助情報のフォーマットを用いた場合について対比し
ながら説明してきたが、第8図をはじめとして他のフォ
ーマットを用いた場合も同様な高速処理が可能である。
この補助情報を通常の更新処理時に作成し、検索情報と
ともに記憶することにより、この情報検索装置において
は検索に適したフォーマットに内部記憶装置内の検索情
報を展開することが、この検索情報と補助情報を起動処
理時に以上述べてきたような方式を用いることにより高
速に行うことができる。これは特に第6図に示したよう
な文書ファイルシステムの情報検索装置に応用した場合
、高速かつ高度な検索処理機能と高速な起動処理の2つ
を同時に満たすことのできるものである。
発明の効果 以上述べてきたように、本発明によれば、外部記憶装置
に情報検索装置に必要な情報を記憶する際に、検索情報
と内部記憶装置内に格納する場合に使用する位置や方法
についての補助情報とを記憶し、この検索情報と補助情
報を用いることにより、内部記憶装置内は検索に適した
論理構造を採りつつ、外部記憶装置から内部記憶装置へ
の検索情報の高速な展開を可能にするものである。
【図面の簡単な説明】
第1図は本発明の情報検索装置の一実施例を示すブロッ
ク図、第2図は本発明の情報検索装置において1回の更
新処理に伴って作成され、外部記憶装置102に格納す
る検索情報および補助情報構造に変換して展開した場合
の論理構造を示す固剤5図は本発明の異なる実施例の情
報検索装置のは補助情報情報フォーマットの一実施例を
示す図、第8図は補助情報フォーマットの別の一実施例
を示す図、第9図〜第20図までは更新処理を説明する
ためのキーワード領域と文書番号領域での更新処理内容
を示す図、第21図は従来例の情報検索装置のブロック
図、第22図は従来例で外部記憶装置内に検索情報を一
次正規形で格納した図である。 101・・・情報形式変換機構、102・・・外部記憶
装置、103・・・内部記憶装置、104・・・情報検
索機構、105 ・°情報取出機構、106・・・補助
情報抽出機構、107−・・°情報格納位置確定機構、
108・・・情報格納機構、110.111−・・−外
部記憶装置102から取り出される情報、112−・・
・検索情報と補助情報に分けられた情報、113.11
4・・−検索情報とその格納位置、方法等を指示する情
報、115パ・内部記憶装置103内の検索情報を検索
した結果を示す図である。 代理人の氏名 弁理士 中尾敏男 はか1名第5図 第6図 4B 8j−・橿 へ 母 第22図 手続補正書嶋式) 昭和61年6 月/と日

Claims (5)

    【特許請求の範囲】
  1. (1)検索情報を記憶する外部記憶装置と、前記外部記
    憶装置から取り出した前記検索情報を記憶する内部記憶
    装置と、前記外部記憶装置から前記内部記憶装置に前記
    検索情報を転送する際に検索情報の記憶形式を変換する
    機構とを有し、前記外部記憶装置に格納した検索情報に
    は検索を行うためのキーワード情報等に加え前記内部記
    憶装置内への格納位置や格納方法等を示す補助的な情報
    (以下補助情報と略記)をも記憶し、前記形式変換機構
    では前記補助情報を用いて外部記憶装置から内部記憶装
    置への検索情報の形式変換及び格納処理を高速に行うこ
    とを特徴とする情報検索装置。
  2. (2)内部記憶装置内に格納された検索情報の論理的な
    データ構造がポインタを用いて構成され、外部記憶装置
    から内部記憶装置へのデータの格納処理時に行われるポ
    インタ情報の変更処理を容易にするための情報を外部記
    憶装置に格納したデータに付加し、その情報を用いて外
    部記憶装置から内部記憶装置へのデータの格納処理を高
    速に行うことを特徴とする特許請求の範囲第1項記載の
    情報検索装置。
  3. (3)外部記憶装置にある個数の情報が登録される際に
    、その情報を整理した上で、またはそのままで、外部記
    憶装置に一括に記憶し、検索情報を内部記憶装置に再生
    する際は、まず前記一括記憶した情報を再生した後、一
    括記憶処理以降に更新された情報を再生することを特徴
    とする特許請求の範囲第1項又は第2項記載の情報検索
    装置。
  4. (4)外部記憶装置が追記型の媒体を用いることを特徴
    とする特許請求の範囲第1項、第2項、又は第3項記載
    の情報検索装置。
  5. (5)外部記憶装置が読みだし専用の媒体を用い、媒体
    作成時の検索情報を記憶する際に補助情報をも同時に記
    憶することを特徴とする特許請求の範囲第1項又は第2
    項記載の情報検索装置。
JP61046554A 1986-03-04 1986-03-04 情報検索装置 Granted JPS62204376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61046554A JPS62204376A (ja) 1986-03-04 1986-03-04 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61046554A JPS62204376A (ja) 1986-03-04 1986-03-04 情報検索装置

Publications (2)

Publication Number Publication Date
JPS62204376A true JPS62204376A (ja) 1987-09-09
JPH0574859B2 JPH0574859B2 (ja) 1993-10-19

Family

ID=12750538

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61046554A Granted JPS62204376A (ja) 1986-03-04 1986-03-04 情報検索装置

Country Status (1)

Country Link
JP (1) JPS62204376A (ja)

Also Published As

Publication number Publication date
JPH0574859B2 (ja) 1993-10-19

Similar Documents

Publication Publication Date Title
JP3178475B2 (ja) データ処理装置
CA2204447C (en) Document display system and electronic dictionary
US7127472B1 (en) Data processing method and data processing device
US5881380A (en) Device and method for data management based on values
US5258910A (en) Text editor with memory for eliminating duplicate sentences
JP2925042B2 (ja) 情報リンク生成方法
JPS62204376A (ja) 情報検索装置
JP2000090093A (ja) 全文検索方法及び全文検索システム並びに全文検索プログラムを記録した記録媒体
JPS6254369A (ja) 文書フアイル検索方式
JP3157235B2 (ja) データ管理装置
JPH02135549A (ja) フアイル一覧表の表示方法
JP2000293519A (ja) 文書処理装置
JP2679602B2 (ja) 退避媒体作成システム
EP0353097B1 (en) A text processing system
JPH0215374A (ja) 画像情報検索装置
JPS62186362A (ja) 情報検索装置
JPH0785079A (ja) 情報ファイルの管理装置
JP2888458B2 (ja) ファイル格納装置
JPH09282326A (ja) 文書高速構造検索方式
JPS6380346A (ja) 文書認識装置
JPH023871A (ja) 画像情報ファイリング装置
JP2002528821A (ja) 共用ファイル環境用の改良された情報格納および検索システムを有する物理格納アーキテクチャのための方法および装置
JPH0240763A (ja) 文書管理方式
JPH05108314A (ja) 原始プログラムの管理方法
JPH02137036A (ja) データベース更新方式