JPH0432420B2

JPH0432420B2 -

Info

Publication number: JPH0432420B2
Application number: JP58238027A
Authority: JP
Priority date: 1983-02-03
Filing date: 1983-12-19
Publication date: 1992-05-29
Also published as: US4611272A; JPS59146356A

Description

【発明の詳細な説明】〔発明の技術分野〕本発明はコンピユータ・システムのためのフア
イル編成技術に係り、更に具体的には本発明は最
少回数のアクセス試行によつてデイスクの様な２
次記憶システムに於けるデータのアクセスを行な
う技術に係る。〔従来技術〕大型コンピユータ・システムに於ける２次的記
憶装置はコンピユータの主記憶装置との間におい
て大量のデータの記憶、更新及び検索を行う。フ
アイルと称せられるその様なデータの編成はアク
セス動作を有効なものにするために重要である。
更に、特にデイスクの様なランダム・アクセス２
次的記憶装置におけるフアイルに新しいデータ要
素を挿入し、該フアイルからデータ要素を削除す
る事が出来る事が重要である。その様なフアイル
を“ダイナミツク”フアイルと称する。周知の様にその様なフアイルを構成するために
多数の技術が提案された。現在Ｂ−Treeインデ
ツクス構成が市販装置の標準である。D.Comer
の“The Ubiquitous Ｂ−Tree”と題する論文
（Computing Surveys，Vol.11No.２，June 1979，
pp.1−137）にＢ−Treeについての説明がみられ
る。ダイナミツク・フアイルに適した最近のフアイ
ル編成技法は、拡張可能（extendible）ハツシン
グである。固定寸法のフアイルとか寸法が増大す
るフアイルとかのための外部記憶装置に存在する
大型フアイルをアクセスするための高速法として
拡散可能ハツシングを用いうる様にする多数の技
法が開発された。たとえば、R.Fagin等の
“Extendible Hashing−Ａ Fast Access
Method for Dymanic Files”と称する論文
（ACM Trans.Data Base Syst.Vol.4，No.３，
September，1979，pp.315−344）には通常のハ
ツシングと異なり、フアイルと同様に伸長し、収
縮する構成を有する拡張可能ハツシングのアクセ
ス技術が開示されている。Fagin等の方法はハツ
シユ関数とデータを記憶するデイスク・アドレス
の間にインデツクスを用いる事によつて、データ
のアドレス空間からハツシユ・アドレス空間を分
離する。それによつてインデツクス項を識別する
ために初期に必要とされるビツトよりも更に多数
のビツトが生じる。しかしながら、Fagin等の場
合、フアイルが十分に大きく、インデツクスの小
部分のみが主記憶装置に於て適合すると、２デイ
スク・アクセス／データ・アクセスを必要とす
る。 Litwinの“Linear Virtual Hashing：Ａ
New Tool for Files and Tables
Implementation”，（Proc.6th Int′l.Cont.on
Very Lage Data Bases，Montreal，1980，
pp.213−223）に於ては、キイのハツシユ・アド
レスが、そのページのオーバフローしたデータに
関するハツシユ・アドレスを変更する事なく或る
予じめ定義した順序で変更される、線形ハツシン
グ関数と称するダイナミツク・ハツシング関数を
開示している。これはフアイルのために割り振つ
たスペースを現在のフアイルの端部へ連接したペ
ージを付加する事によつて線形的に伸長させる利
点を有する。しかしながら、Litwinは、空間を有効に利用
するためには、有効ではい、隣接した連続的なア
ドレス空間の存在を仮定した。彼はデイスク・ア
ドレスに対するページ番号をマツピングする方法
を説明しているが、彼のデイスク空間を利用する
方法は、デイスク・アクセスに於てフアイルに付
加的な１次ページ（Primary page）を付加する
ためのコストが典型例として３アクセス／ページ
を要するという結果を呈する。更に、用いられる
オーバフロー・ページの数及びパフオーマンスは
本発明と比べて好ましいものではない。 G.Martinの“Spiral Storage；Incrementally
Augmentable Hash Addressed Storage”
（Theory of Computation，Report No.．27，
U.of warwick，Conventry，England，Merch
1979）に於ては、キイがアドレス空間内にマツピ
ングされ、よつてキイがその空間のある部分に於
いて他の部分よりも濃密となるハツシング技術が
開示されている。フアイル伸長の際に、より濃密
な空間を占めるために用いたキイは新しい、より
濃密でない空間に拡散される。Martinはキイを
均一でなくエクスポネンシヤルに空間にキイをマ
ツピングするハツシユ関数を用いている。しかし
ながら、ハツシユ関数により生じた相対的ページ
を実際のデイスク・アドレスへマツピングする。
Martinの方法は複雑であり、デイスク・アクセ
ス／付加した１次ページに関して高価につく。更
に、オーバフロー・レコードを処理する彼の方法
は特に不成功サーチの場合において好ましくない
パフオーマンスを呈するリハツシング
（rehashing）を含む。これらの拡張可能ハツシング技術はフアイル伸
長もしくは収縮に対処するための完全なフアイル
再編成及びリハツシングを必要としない。加え
て、それらの技術はＢ−Treeの様な３インデツ
クス法によつて呈せられるものよりもより高速の
ランダム・アクセスが可能である。更にそれらの
技術は限定された形の順次性即ちキイ・オーダー
でなく或る順序でフアイルのレコードを順序付け
る能力を与える。しかしながら、これらのハツシ
ング法のいずれもがそれだけでは、フアイル・ア
ドレツシングに於て必要とされる利点を組合わさ
れたもの即ち単一デイスク・アクセス、下方に存
在するデイスク空間の直接的な記憶管理及び衝突
に対処するためのリハツシングの必要性の回避等
を可能とし得ない。上記Martinの論文におけるスパイラル記憶の
例外は別として、全ての拡張可能なハツシング技
法の特徴はパフオーマンスが変動する点にある。
ハツシユ関数はハツシングされたキイをフアイル
のページ全体に均一に分布させる。即ち、これら
のページが均一に満たされ、ほとんど同時に完全
にいつぱいになる。更にフアイルが成長する短い
期間に於て、フアイル・ページの大多数が全てオ
ーバフローし、それらのエントリは２ページに分
割しなければならない。その結果、利用度
（utilization）は50％及びほとんど100％の間の変
化を呈し短い分割期間に於て突然50％に低下す
る。更に挿入を行なうコストは低利用度の場合比
較的低いが、分割期間に於ては極めて多数の挿入
がページ分割に先行するので相当高くなる。最後
に、もしもその技法に於てオーバフロー・レコー
ドが通常の方法で要求されるならば、オーバフロ
ーの生じる頻度は利用度が100％に近付くにつれ
て劇的に増加する。これによつて、オーバフロ
ー・レコードのアクセスが増々共通してくるの
で、デイスク・アクセスに関して挿入及びサーチ
のコストの急峻な増加が生じる。〔発明の目的及び概要〕本発明の目的は殆どの場合単一アクセスでもつ
て選択された（任意の）キイからデータを検索す
るための技術を提供する事にある。本発明の他の目的は大きな再編成もしくはリハ
ツシングを行う事なくフアイルの寸法の変更を可
能にする技術を提供する事である。本発明の更に他の目的は、直接的な技法によつ
て、記憶スペースが有効に使われる様に方法それ
自体の一部として物理的なデイスク空間を管理す
る技術を提供する事である。本発明の更に他の目的は、キイの挿入及びサー
チのコストが、フアイルが伸長するかあるいは収
縮する際に変動しないアクセス技術を提供する事
にある。本発明は、フアイル構成が２つのレベル即ちイ
ンデツクス・レベル及びデータ・レベルのみから
なる様なキイ・アクセス（インデツクス）型フア
イルの編成技術に係る。両方のレベルは、ページ
のランダム・アクセスを支援するページ編成２次
記憶媒体に永久的に記憶される。インデツクス・
レベルは固定された、指定可能な数のページを有
する様に設計され、フアイルが使用中の場合は全
体がコンピユータの記憶装置内に記憶される。フ
アイルが寸法を変えるにつれて、各インデツク
ス・エントリをして数が増大（縮小）するデー
タ・ページを有するデータ・ノードを参照させる
事によつて固定寸法のインデツクスが可能にな
る。インデツクス・エントリによつて参照した１
より多い数のデータ・ページのアクセスを回避す
る事はサーチ・アーギユメント（サーチ引数）の
ビツトを用いるアドレス計算によつて達成され
る。この計算に含まれるビツトの数は次の様に与
えられる。 log₂（インデツクス項によつて参照されたペー
ジの数）ここでその様なページの数は２のｎ乗である。最大のバツフア寸法としては、データのアクセ
スを支援するためにフアイル（及びアクセス）方
法に関連する主記憶装置のページの数を示す寸法
が選択される。このバツフアは拡張可能ハツシン
グに於ける様にフアイルに対するインデツクスを
含むが、そのインデツクスはバツフア寸法内に含
まれる様に制限される。インデツクス・レベルの
存在によつて記憶管理がより容易になる。インデ
ツクスがその限度まで伸長すると、データ・ノー
ドに於けるページの数を二倍にし、よつてインデ
ツクス・エントリによつて参照されたページの数
も同様にして二倍化する事によつて、更にフアイ
ルの伸長を行わせる。必要に応じて、記憶装置の利用度が適度に高く
なる事を保証するためにオーバフロー・ページが
用いられる。オーバフロー・ページに関する新規
な技法によつて、不成功サーチが２デイスク・ア
クセスよりも多数のアクセスを必要とする事が僅
少であつて、しかもオーバフロー・ページのため
の空間利用度を高くしうる事が保証される。その方法はフアイルのキイを不均一に分布させ
るハツシング関数、ｈ（key）、の選択を含む。次
にこの関数の結果を、キイ空間の１つの境界付近
に於て他の境界に於けるよりも２倍の数のキイが
存在する様に他の関数、exhash（key）、を用いて
エクスポネンシヤルに分布させる。この新規な改良した形態の拡張可能ハツシング
を境界付けたインデツクス・エクスポネンシヤ
ル・ハツシング（bounded index exponential
hashing）“BEH”と称することにする。これは
１デイスク・アクセスに近いフアイルの任意レコ
ードへのランダム・アクセスとフアイル寸法によ
つて変動しないパフオーマンスとを提供する点に
於て他の伸長可能ハツシング技法よりもすぐれた
利点を有する。それは実施がまわりくどくなくて
直接的であり、しかもこのパフオーマンスを達成
するのに一定の指定しうる量の主記憶しか必要と
しない。その基礎となる物理的なデイスク記憶が
容易に管理され、不成功サーチに於ては２アクセ
スより多いアクセスを用いるのがまれである事を
保証する様にレコード・オーバフローが処理され
る。〔実施例〕以下の説明に於いて、本技術分野に於いて標準
的に用いられる次の様な用語を用いる。フアイル
はレコードの集合体であつて、各レコードはキイ
によつて識別される。アクセス法は、その内部に
フアイルをマツピングできる論理的記憶構成とこ
の構成を管理するのに必要なアルゴリズムとを含
む。その方法は１つもしくは複数の２次記憶装置
の通常固定された寸法のページと称する記憶単位
の集合体を管理する。アクセス方法を指定するた
めに、複数のページ間の関係、ページの内部構造
並びにフアイル更新（レコードの挿入、削除もし
くは変更）のためのアルゴリズム及び検索が記述
されねばならない。“アクセス”という用語は更
新もしくは検索の任意の動作を意味する。ページ
はページ間につながるアクセス路に従つてアクセ
スされる。一般的にはページはレコードと他のペ
ージに対するポインタを含むインデツクス・エン
トリとを含む。もしもページがインデツクス・エ
ントリのみを含むならば、それを登録簿（もしく
はインデツクス）ページと称する。もしもページ
が複数のキイとそれらに関連するレコードのみを
含むならば、それをデータ・ページもしくはデー
タ・リーフと称する。総括本発明に従つて、フアイルのキイを出来るだけ
均一に分布されるハツシング関数ｈ（key）が選
択される。J.L.Carter等の“Universal Classes
of Hash Functions”という題名の論文（J.
Computers and System Science，Vol.18，No.
２，April，1979，pp.143−144）に於いて示され
る様な或る一群の汎用ハツシング関数から選択し
たハツシング関数を用いると、ハツシングされた
キイが均一に分布される確率が非常に高くなる。
例えば次の様なハツシング関数が適している。 (1) ｈ（key）＝（（m^*key）＋ｎ）mod ｐ）mod
ｂここでｐは基数であり、ｂはハツシユ空間の
寸法であり、ｍ及びｎは整数であるものとす
る。ハツシユ・アドレス空間（ｈの領域）は実用
上24ビツト以上のハツシユ・アドレスを生じる
ので、フアイルの全体的な予定された伸長分を
収容するものでなければならない。これらアド
レスは０と１の間の24ビツト（もしくはそれ以
上）の小数点部として解釈される。次にハツシユ関数(1)の結果を次の関数を用い
てエクスポネンシヤルに分布させる。 (2) exhash（key）＝2^h(key)−１ここで、ｈ（key）は汎用（universal）ハツ
シユ関数を適用した結果である。式(1)の目的は
フアイルが伸長する場合のパフオーマンスの変
動を回避して均一なパフオーマンスを保証する
ためである。このステツプの後で、ハツシユ関
数のエクスポネンシヤル特性はそのアクセス法
にはそれ以上導入されない。パフオーマンスは
影響されるが、アルゴリズムは影響されない。関数exhash（key）は均一に分布したハツシ
ングされた０ないし１の範囲のキイを０ないし
１の範囲の値に再マツピング（remap）する。
ただし、ハツシングされたキイの頻度はこの範
囲にわたつて変動する。エクスポネンシヤル・
ハツシングを用いてハツシングされた０付近の
キイは、１付近のハツシングされたキイの２倍
の頻度である。任意所定の利用度を有するペー
ジの相対的頻度を一定にし、オーバフローに於
ける及び分割頻度に於ける変動を除去する事が
できるので、デイスク・アクセス動作を一定に
する事ができる。本発明では他の拡張可能なハツシング技法の
重要な特性を変更する事なく、エクスポネンシ
ヤル・ハツシングが用いられる。即ち、エクス
ポネンシヤルにハツシングしたキイ値をデータ
及びインデツクス・エントリと共に記憶させる
事が出来、フアイルに於けるページ内部のサー
チを支援するために用いる事が出来る。更に重
要な事は、ページがオーバフローする場合、記
憶したハツシングされたキイのビツトが、２ペ
ージにわたるオーバフロー・ページ上のエント
リをどの様に分割する（split）がを決定する
事である。その分割は多くの拡散可能なハツシング法に
必要とされるものと同種のデイジタル分割であ
る。kpを、所定のページに記憶される全ての
ハツシングされたキイ値（すなわちexhash
（key）の結果）のプレフイツクス（接頭部）
であるとする。ページが一杯でしかもなお１つ
のキイを挿入したい場合、ページの内容は次の
様にして２つのページの間で分割される。kp
〓“０”のプレフイツクスを有するハツシング
されたキイに関連するページの内容（インデツ
クスもしくはデータ）がそれらのページの一方
に配置され、kp〓“１”のプレフイツクスを
有するハツシングされたキイに関連する内容が
他のページ上に配置される。第１図はコンピユータの主記憶装置１に於け
るBEHインデツクス（BEH INDEX）物理的
配置、２次記憶装置２（例えばデイスク・メモ
リ）に連続したページのブロツクとして配置し
たデータ・ノードを図示する。ページの数は２
のｎ乗である。第２，１図はデータ・ノード３の２倍化
（doubling）の前のBEH編成フアイルの状態を
示する。この段階に於て、インデツクス・レベ
ルのコピーが主（１次）コンピユータ記憶装置
のバツフア内にあり、データ・レベルはデイス
クの様な２次記憶装置内にある。説明を簡単に
するためにページ単位で４のインデツクス寸法
を仮定する。Ａフアイル・サーチ実施例に於てはフアイルは次の様にサーチ
（探索）する。exhash（ARG）−−ARGはデー
タが所望される探索キイである−−の先頭（若
しくは最初）の２ビツトを、ARGのデータの
探索が連続するところのインデツクス・ページ
を選択するために用いる。図に示すフアイルに
於いて、exhash（ARG）の最初の２ビツトを
用いて、“01”インデツクス・ページが選択さ
れる。exhash（ARG）の他ビツト、（例えばビ
ツト２ないし５）は、もしも探索が成功である
ならば、ARGのためのデータが存在するペー
ジを参照するインデツクス・ページ“01”に於
けるデイスク・アドレス、“PTR”、を見出す
ために用いる。PTRによつて参照されたペー
ジが読取られ、“ARG”が存在するかどうかを
決定するために、探索され、もしも存在するな
らば、それと関連するデータを戻す。第２，１
図に於けるデータ・レベルのノード（ページ）
は“01”〓“101”で始まるexhash（ARG）の
値に関するデータを含む。データ・レベル・ペ
ージに於けるDiはARG＝Kiに関するデータで
あつて、exhash（ARG）＝“01”〓“101”〓
“011′＝“01101011”である。データ・ノードの
２倍化前後のフアイル探索は本明細書のフアイ
ル動作（fileoperation）の項で説明する。Ｂバツフアが充填した後の伸長データ・ノード（頁）がオーバフローし、そ
れを参照するインデツクス・ページ自体が充満
しているものと仮定する。標準的な拡張可能ハ
ツシング法に於いては、これが引金となつてデ
ータ・ページの分割が行なわれる。よつてイン
デツクス・ページはオーバフローする。インデ
ツクス・オーバフローはインデツクス寸法を２
倍化する事によつて処理され、これによつて入
来する挿入引数（arguments）に対して
exhashを適用する場合の記憶された結果の未
使用サフイツクス（接尾部）であるIDの第１
ビツトに基いて、インデツクスの各ページのエ
ントリを２ページに分離させる。即ち、インデ
ツクスは８ページに増え、それをアクセスする
のに３ビツトのexhash（ARG）が必要となる。本発明のBHFハツシングに於ては、インデ
ツクス寸法は増えない。むしろ、そのノードの
２つのノードへの分割ではなくて、オーバフロ
ーを収容する様にデータ・ノードの寸法が２倍
になる。即ち、多種ページ・データ・ノードが
フアイルの寸法が伸長されるにつれて発生す
る。その後のページ・オーバフローも後続する
付加的なデータ・ノードの２倍化を生じうる。
丁度分割がそうであつた様に、２倍化は記憶し
たハツシングされたキイ値の次のビツトの値に
基いてページの間に於てエントリを分ける。こ
の場合、(a)インデツクス・レベルに於けるエン
トリがデータ・ノード（この寸法も指示され
る）を参照する事並びに(b)ARGに関連するデ
ータを有するデータ・ノードのページを選択す
るために、探索手順がこの寸法及び適当なビツ
トを利用する事が必要である。 (b)の故にこの寸法をlog₂（ページで示したノ
ード寸法）とする事は有用である。何故なら、
これはその選択を行なう場合に用いられる
exhash（ARG）のビツトの数であるからであ
る。第２，２図はexhash（ARG）を含むノー
ドが２倍化したのちのBEHフアイルを示す。ノードの元の寸法に関係なく、ノードの２倍
化によつてノードの各ページの内容を２倍化し
たノードの２つのページの間に於てノードの各
ページの内容が分割される。第２，１図及び第
２，２図の例に於て、ノードは１ページから２
ページになつている。新規な２倍化したノード
の２つのページにわたるページ内容の分割は丁
度大抵の拡張可能なハツシング法に於いて分割
が実行される様にして、ハツシングされたキイ
値の適当な２進値に基いて実施される。即ち、
もしもkpが元のノードのページの全てのハツ
シングされたキイ値のプレフイツクス（接頭
部）であるならば、これらの値を含む２倍化し
たノードの２つの隣接するページはkp〓“０”
がページの１つの全てのハツシングされたキイ
値のプレフイツクスであり、そしてkp〓“１”
が他方のページの全てのハツシングされたキイ
値のプレフイツクスである様になる。第２，１
図、第２，２図の例に於いて、第２，１図のデ
ータ・ノードに関してkp＝“01”〓“101”で
ある。この値はノードの各ページに関してでは
なく第２，２図のデータ・ノードに関してハツ
シングされたキイ・プレツクスとして連続す
る。第１（第０番）のページに関するハツシン
グされたキイ・プレフイツクスは“01”〓
“101”〓“０”であつて、第２（１番）のペー
ジに関するハツシングされたプレフイツクスは
“01”〓“101”〓“１”である。２倍化の時点に於て、元のページに関連する
全ての情報が上記の様に２つの新規なページ間
に於いて分割される。この場合、元のページの
直接的な内容のみならずもしも十分な空間があ
つたならば、元のページに於いて含まれたであ
ろうところの任意のオーバフロー情報をも含
む。即ち、典型例としてノードの２倍化によつ
てその様なオーバフロー情報が２つの新しいペ
ージ内に吸収される。Ｃフアイルの初期伸長フアイルの初期伸長は、ページに於けるイン
デツクスがバツフア内に含まれうる限りに於い
て、伸長可能なハツシングのインデツクス２倍
化技法を用いて実施しうる。データ・ノード２
倍化を用いて全ての後続するフアイル伸長が処
理される。１は１ページ・インデツクスでもつ
て始まり、そのインデツクス・ページがデー
タ・ページを指す全ての所要のインデツクス・
エントリをもはや保持し得なくなるまで、“レ
コード”を挿入する。この時点に於いて、イン
デツクスは２倍になり、“０”ビツトで始まる
全てのエントリはインデツクスのページ０を介
してインデツクスされ、“１”ビツトで始まる
全てのエントリはページ１を介してインデツク
スされる。続いて、それらのインデツクス・ペ
ージの１つがオーバフローすると、拡散可能ハ
ツシングの場合の様に再びインデツクスが２倍
化される。この２倍化はページで示すインデツ
クス寸法がバツフア寸法によつて許容される最
大寸法と等しくなる場合に停止する。更にフア
イルが伸長する場合はデータ・ノード２倍化が
用いられる。フアイル動作Ａ探索（サーチ）探索方法即ち所与のキイに関連するデータを
見付け出す方法を後で示す表のSEARCHプ
ログラムによつて示す。そのプログラムを説明
する。ARGの値としてSEARCHへキイを供給
する。キイに関連するデータの主記憶装置に於
けるアドレスが、もしもARGが見出されると、
Ｄ ADRに於いてGEARCHによつて戻され
る。もしもARGが見出されるならば、変数
FOUNDがSEARCHが戻される時に真（true）
へセツトされ、さもない場合はそれが偽
（false）へセツトされる。SEARCHは次の操
作によつて開始される。 CAll SEARCH（ARG，Ｄ ADR，
FOUND）以下はどの様にしてこのSEARCH手順がそ
の目的を達成するかの説明である。 (1) EXHASHを用いてサーチ・アーギユメン
トARGをそのハツシングした値へ変換；その
値をHKと称する。 HK：＝EXHASH（ARG） (2) Ｐをインデツクス・ページの開始２次記憶装
置アドレスとし、Ｉ SIZEをインデツクスの
ページ数で示す寸法の２を底とする対数とす
る。 (3) ARGに対するデータへ導びくインデツク
ス・エントリを見出すためのインデツクス・ペ
ージＱを計算；それはHKの先頭からＩ SIZE
で設定された数のビツトをとり、それらをＰに
加える、即ち、Ｑ：＝Ｐ＋SUBSTR（HK，Ｏ，Ｉ SIZE）^* によつて見出される。 (4) 主記憶装置に於けるページの開始アドレスを
捜出する事によつて記憶アドレスへデイスク・
アドレスＱを変換。Ｉ ADDR＝LOCATE（Ｑ）（これは、フアイルのインデツクス・ページ
が既に主記憶装置内にあるため、２次記憶装置
からデータを読取る事を行わないでも可能であ
る。） (5) Ｉ ADDRにより指定（point）されたペー
ジに於けるHKに関するインデツクス・エント
リを捜出する。インデツクス・エントリはイン
デツクス・ページを捜出するのに用いたHKの
部分を含む必要がないので、次の操作のみが必
要である。 HK REST＝SUBSTR（HK，Ｉ SIZE，^*）これはHKの先頭からＩ SIZEで指定された数
のビツトを取り除く。HK RESTに関してイ
ンデツクス・エントリを捜出する結果として得
られるのは３つの量である。 LEN…インデツクス・エントリを捜出す
るのに費やしたHK RESTのビツトの数； SIZE…インデツクス・エントリによつて
参照したデータ・ノードに於けるページ数の
２を底とするす対数； PTR…インデツクス・エントリによつて
参照されるデータ・ノードの第１（０番）の
頁のデイスク・アドレス。よつて、CALL IFIND（HK REST，Ｉ
ADDR，SIZE，PTR）が実施される。 (6) インデツクス・エントリを識別するのに用い
たHK RESTのビツト（即ちLENで指定され
た数のビツト）の次のSIZEで指定された数の
ビツトを用いて、ARGに関するデータを捜出
すべきデータ・ページのデイスク・アドレスを
計算。 PAGE DISP＝SUBSTR（HK REST，
LEN，SIZE）及び DATA PAGE＝PTR＋PAGE DISD (7) ２次記憶装置からメモリ内へDATA
PAGEに於て指定したデータ・ページを読取
り、DATA ADDRに於けるそのメモリ・ア
ドレスをレポート。 CALL READ（DATA PAGE，DAHA
ADDR）注…データ・ページのオーバフローが生じる
場合を除いて、このREADのための呼出しは
２次記憶の読取が要求される唯一の個所であ
る。 (8) メモリ内へ読込まれたデータ・ページに於い
てARGを捜出。もしもARGが見出されるなら
ば、FOUNDが真（true）にセツトされ、そう
でないならば、偽（false）にセツトされる。
そのノードに関してオーバフローが存在するな
らば、OVERFLOWが真にセツトされ、そう
でないならば、偽にセツトされる。もしもオー
バフローが真ならば、Ｏ PAGEはオーバフロ
ー・ページのデイスク・アドレスへセツトされ
る。もしもARGが見出されるならば、そのデ
ータのアドレスがＤ ADR内にされる。すな
わち、 CALL DFIND（ARG，Ｄ ADR，
FOUND，OVERF LOW，Ｏ PAGE） (9) もしもARGのデータが捜出されたならば、
SEARCH手順の結果としてＤ ADDを戻し、
FOUNDを真へセツトする。すなわち、 IF FOUND THEN RETURN (10) もしもARGのデータが捜出されず、オーバ
フロー・ページもないならば、ARGのデータ
はフアイルに存在しない。SEARCH手順の結
果としてRETURN FOUNDが偽へセツトさ
れる。即ち IF NOT（OVERFLOW）THEN
RETURN (11) もしもARGは捜出されないが、ARGに関す
るデータが配置されるオーバフロー・ページが
存在するならば、ARGのデータのためのオー
バフロー・ページ（もしくは複数ページ）を探
索。オーバフロー・ページがPAGE DISPによ
つてノード内に於て指定されるので、DAGE
DISD並びにARG及びＯ PAGEを供給しな
ければならない。予期される結果は量Ｄ
ADR及びFOUNDのための適当なセツテイン
グである。即ち、 CALL OFIND（ARG，Ｏ PAGE，PAGE
DISP，Ｄ ADR，FOUND）（OFINDは、オーバフローが普通でない状態
であるので、通常は呼出されない事に注目された
い。更に、もしもそれが呼出されるならば、それ
は通常２次記憶装置からのページの単一の読取の
みを含む。）＊ SUBSTARはストリング・アーギユメン
ト（例えばHK）、ストリングに於けるスタ
ート位置（例えば０）及びサブストリングの
ための長さ（例えばＩ SIZE）を取る関数
手続きであつて、ストリング・アーギユメン
トの“スタート”位置ないし“スタート＋長
さ−１”からなるストリングを戻す関数手続
きである。もしも＊が長さとして与えられる
ならば、指定されたサブストリングはアーギ
ユメント・ストリングの残部を含む。【表】Ｂ更新（Updating）挿入及び削除は共に、まず指定されたエントリ
を探索し、それが存在しあるいは存在する予定の
ページを捜出する事によつて進行する。大抵の場
合、これらの更新オペレーシヨンは予期された方
法で即ち、挿入に関しては前には存在しなかつた
キイ値を有する新規なレコードを包含し、そして
削除に関しては、指定されたキイ値にマツチする
キイを有するレコードを除去する事によつてその
ページを変更する。これらのケースに於て、オーバフロー・レコー
ドが不在である場合、両オペレーシヨン共に単一
の読取のみを要し、続いてデイスクへの更新した
ページの単一の書き戻しが行なわれる。オーバフ
ロー・レコードの存在は書込の前に第２の読取を
必要とする。もしも挿入がページの分割（split）
を必要とするならば、データ・ノードの寸法が２
倍化され、よつて２つのページにわたつてそのペ
ージの各々のエントリを散す。その様なマルチ・
ページ２倍化は、ページが隣接しているので、各
Ｉ／Ｏ動作の間に多重ページを読取り、書込む事
によつて極めて有効に行なう事ができる。Ｃ順次読取（ハツシング・キイ順）ハツシングはキイ順の順次サーチを支援し得な
い。しかしながら、順次アクセスが望ましく、し
かもキイ順位が重要でない場合がある。この場
合、BEHハツシングはノード内のページの連続
性に関する非常に好ましい特性を有する。これは
単一のＥ／Ｏ読取による複数のページのブロツク
の読取とその結果の緩衝記憶を可能にする。これ
らの条件の下でデイスク・アームの移動も大きく
減じられる事は云う迄もない。オーバフローの処理オーバフロー・エントリを収容するのにもつぱ
ら用いるページの数の適当な選択によつて、適度
なレベルにフアイル利用度（utilization）を維持
する事を保証するために、オーバフローを処理す
る具体的方法を説明する。これによつてフアイル
の良好な一定の性能が保証される。Ａ連続したページのオーバフロー１オーバフロー・ページはデータ・ノードの各
2ⁿの隣接したページと関連している。数ⁿは個定
されないが、ノードの利用度が増加するにつれて
変わる。利用度とデイスク・アクセスのパフオー
マンスの間の良好な妥協点を見出すために、非常
に小さなページ寸法を除いて、１オーバフロー・
ページ／４データ・ページよりも多数のオーバフ
ロー・ページを有する必要はない。オーバフロ
ー・ページは、長さｎのビツト・ストリングと連
結された共通プレフイツクスｘがその関連する１
次ページ（primary pages）の１つの共通接頭部
kpを生じる様に、共通接頭部ｘを有するエント
リを含む。オーバフロー・ページが連続した１ページと関
連するという事実は同じ基本的な理由からノード
２倍化及び逐次サーチに関して重要な含意を有し
ている。これらの事例の両方に於いて、常に多数
のページをアクセスしなければならないが故に多
重ページＩ／Ｏオペレーシヨンを実施する事が可
能である。即ち、別個のＩ／Ｏオペレーシヨンの
数を大幅に減らす事ができる。しかしながら顕著
な節減を呈するには、これらのページの関連する
オーバフロー・エントリをアクセスする場合の多
数のＩ／Ｏオペレーシヨンを回避する事が必要で
ある。この編成は、2ⁿの連続したページに対する
オーバフロー・ページをアクセスするために１つ
の付加的Ｉ／Ｏオペレーシヨンを必要とする。こ
れによつて、１次ページのためのＩ／Ｏオペレー
シヨンに於ける節減はオーバフロー・ページが含
まれた後にも真の節減となる。Ｂオーバフロー・ページのトリーノードの或るページがまずオーバフローする場
合、それはそのノードに於ける指定されたページ
−−多分、もしも存在するならば最初のオーバフ
ロー・ページに対する基準をうるための第１ペー
ジ（ページ・ゼロ）−−を参照しなければならな
い。もしもその様なオーバフロー・ページが存在
しないならば、１が割付けられ、それに対するポ
インタが限在オーバフローしていないページのた
めに両方のページ・ゼロに及びオーバフローして
いるページに記憶される。この初期オーバフロ
ー・ページは、更に多数のオーバフロー・ページ
が必要とされる様に、オーバフロー・エントリの
数が増大するに従つて成長するオーバフロー・ペ
ージのトリ−の根としての働きをする。オーバフロー・ページ自体がオーバフローする
場合は常に、ページ上のエントリがキイのビツト
に基いて現在ページ及び新規に割付けたページの
２つのページに分割される。即ち、オーバフロ
ー・ページは１次ページに於けるエントリがそう
である様に正確にデイジタルに分割される。２つ
のページの各々は元のオーバフロー・ページによ
つてサービスされた１次ページの1/2のためのオ
ーバフロー・ページとして働らく。新しいオーバ
フロー・ページに対するポインタが元のオーバフ
ロー・ページに記憶され、そしてその挿入によつ
て分割を生じた１次ページに適宜記憶される。
（新規なオーバフロー・ページを共有する他の１
次ページはそのオーバフロー・ポインタが直ちに
更新されない事に注目されたい。むしろそれはオ
ーバフロー・ページに対するアクセスを必要とす
る１次ページに対する次のアクセスに於いて行な
われる。）第３図はこのプロセスが行なわれる方
法を示す。第３図に示す様にこの成長プロセスは
Ｏトリ−と称するトリーが存在するまで連続しう
る。第３図に於いて４は暗黙２進トリ−を、５は
根（root）を、６はキイ・プレフイツクス（kp）
を有するデータ・ノードの１次ページを、７はＯ
トリー・ページを示す。１つの１次ページが（特にページ寸法が小さい
場合に）１オーバフロー・ページよりも多いオー
バフロー・ページを有した状態で終る様に、Ｏト
リ−を十分に成長させる事が可能である。この成
長はＯトリ−構成と正確に同じ方法で進行するこ
とができる。しかしながら、１次ページ自体はそ
のオーバフロー・エントリを含む全てのページに
直接指向されるべきである。即ち、１次ページは
単に１ポインタよりはむしろそのオーバフローペ
ージの各々に対する小さいインデツクスを含む必
要がある。このインデツクスはオーバフロー・ペ
ージ・アドレスのみでなく、各々その様なページ
に於けるエントリのキイ・スペースも指示すべき
である。この情報によつてサーチのデイスク・ア
クセス・コストは２アクセスよりも大とならない
様に続けて制限できる。他のノードの源もしくは先祖として働くＯトリ
−の各ノードもまたリーフ・ノードとして働き、
よつてＯトリー構造は不在（missing）リンクを
有する。特に、第３図に於いてＯトリーを構成し
てある様に、トリ−の左端ページへの全てのリン
クは削除されている。これによつてスペースとサ
ーチ時間の両方が節約される。ＣＯトリーのサーチ１ページが一杯である場合、各々の連続する挿
入によつてエントリがオーバフロー・ページに配
置される事になる。オーバフロー・ページは次の
様に見出される。オーバフロー・ページに対する
ポインタはノードの第１ページへあるいは実際の
オーバフロー・ページへ指向される。もしもその
ページがノードの第１ページならば、このページ
に於けるポインタはＯトリーの根を参照する。ポ
インタに従う事によつてＯトリーの根へ達し、状
態はあたかも１次ページにおけるオーバフロー・
ポインタが最初にオーバフロー・ページをポイン
タ表示したかの様な状態と同じになる。もしもオ
ーバフロー・ページに関連する接頭部もしくはプ
レフイツクスがエントリのプレフイツクスである
ならば、そのページは１次ページに対する正確な
オーバフロー・ページであり、エントリはこのペ
ージに挿入出来る（あるいはもしもオペレーシヨ
ンがサーチであるならば、このページにおいて見
出す事が出来る）。もしもそうでないならば、そ
のページにおけるインデツクスは、エントリのた
めのオーバフロー・ページが指定されるＯトリー
における次のノードへのポインタを見出すために
アクセスしなければならない。アーギユメント・
キイにおいて１ビツトに遭隅する場合においての
み間接路（indirections）が用いられる。横断し
たリンクの数は平均してＯトリーによつて表現し
た暗黙２進トリー４（第３図）の高さの1/2であ
る。１次ページがサーチもしくは挿入の際にそのオ
ーバフロー・ページの動いた事を見出すと常にそ
れは新しいオーバフロー・ページを参照するため
にそのオーバフロー・ページ・ポインタを更新す
る。（オーバフロー・ページはＯトリーが成長し、
そしてオーバフロー・ページが分割されるにつれ
て“移動”する。）すなわち、時々付加的オーバ
フロー・ページへのエクストラ・アクセスが生じ
る。エクストラ・アクセスにおける不利点を減じる
事が可能である。ノード２が２倍にされる場合に
初期オーバフロー・ページ（単数もしくは複数）
を割振る事によつて、ノードの第１ページに対す
る初期参照を省く事ができる。よつて１次ページ
は、Ｏトリーの根へ直接向う様に初期設定する事
ができる。更に、Ｏトリーの高さは選択された数
（例えば６）をけつして越えない様にクリツプす
ることができる。これはわずかに１／ノードでは
なくノードの64ページ毎にオーバフロー・ページ
を割振る事によつて達成する事ができる。ノードを２倍化する場合Ｏトリーは増々多くのオーバフロー・エントリ
を収容する様に成長しうるダイナミツク構造であ
るので、エントリを挿入できないが故にノードを
２倍化しなければならない固定点は存在しない。
ななわち２倍化を生ぜしめる場合を定義する事が
必要である。それを実施する場合、フアイルの寸
法が既知である時には、２倍化が行なわれるべき
exhash（ARG）の領域内にある２倍化境界
（frontier）ｘを定める事ができるという事実が
用いられる。ｘの値はフアイル寸法と共に変化す
る。その結果、フアイルが成長するにつれて、ｘ
の値は異なつたデータ・ノード内に含まれる事に
なる。現にｘの値を含むノードが、２倍化される
べきノードである。もしもフアイルが収縮するな
らば、このプロセスは逆行でき、よつて表示され
たノードの1/2化が行なわれる。ｘの値を決定するために、フアイルに含まれる
エントリ（レコード）Ｅの数のカウントを保持し
なければならない。このカウントは主記憶バツフ
アにおけるフアイルのためのインデツクスと共に
保持することができる。次の固定量もｘの値の決定の一助となる。 (1) Ｉ：インデツクス項の数、従つてデータ・ノ
ードの数。 (2) Ｍ：データ・ページ上に含む事のできるデー
タ・エントリ（レコード）の数。もしもレコー
ドの寸法が変可ならば、これは平均値である。 (3) ｎ：exhash（key）＝“11…１”の為のインデ
ツクス・エントリ即ちインデツクスの最後のエ
ントリに関する寸法。この寸法は2ⁿページのデ
ータ・ノードを示す。 (4) ｕ：オーバフロー・ページの存在が無視され
るならば、フアイル利用度。これは所望された
利用度である。オーバフローの無視によつて生
じたエラーはｕから75ないし80％の値に関して
は非常に小さい。単純な下記計算によつて、どのノードを２倍化
すべきかを指示する値ｘを計算することができ
る。ｘ＝Ｅ／I^*2^n*M^*ｕ−１ｘの値は、 ΔE＝2^n*M^*ｕエントリの挿入後即ち１つの付加的データ・ノードを滴す
ための十分なデータの挿入後にノード境界を横切
るであろう。ΔEの値は、最後のインデツクス・
エントリのデータ・ノード寸法が2ⁿページから
2ⁿ⁺¹ページへ増加したのちに２倍化する。この時
点に於いて、ｘの値は“11…１”から“０…０”
へと、即ち最後のインデツクス・エントリの参照
から第１のインデツクス・エントリの参照へと変
化する。ノードを２倍化するための信号はそのＯトリー
の状態態によつて与えられず、フアイルの特性即
ちｘの値によつて与えられる。デイスク記憶管理 BEHフアイルのためのインデツクス・レベル
を有するための２つの理由がある。第１の理由は
フアイルのノードを非直接記憶装置内に於いてマ
ツピングされる事を可能にし、データを記憶する
ためにスペースが必要とされる前にフアイルへデ
イスクの大きなブロツクを予じめ割振りする事に
よつて生じる記憶装置の利用度に関する不利点を
回避するためである。第２の理由は、ノード２倍
化（もしくはノード1/2化）の間に、あるいは順
次読取のために、多重ページ読取及び書込を可能
にし、よつてこれらのオペレーシヨンのパホーマ
ンスを改良するためである。 BEH編成フアイルはノード２倍化によつて成
長するので（あるいはノード1/2化によつて収縮
するので、）それらのフアイルは下記の文献に示
される“buddy”法と称せられる記憶管理技法か
ら導かれる方法によつて管理される。 D.Knuth著The Art of Computer
Programming Vol.1，Fundamental
Algorithms，Addison Weslqy，（1977）。 “buddy”割振り法は単位が２のｎ乗の寸法で
ある記憶装置のブロツクに対して機能する。各々
の異つた寸法のブロツクのために別個の自由リス
トが維持される。もしもあるブロツク寸法が要求
され、その寸法のブロツクが無いならば、所望寸
法のブロツクを提供するためにより大きなブロツ
クが分割される（必要ならその分割片が再び分割
片が再び分割される）。ブロツクが自由になると、
より大きなブロツクを作るために自由になつたブ
ロツクがよれと合体できるかについての決定を行
うためにブロツクの“buddy”を調べなければな
らない。任意の合体したブロツクは更に合体する
ための候補でもある。このプロセスの故に、その
方法にその様な名が付けられた。自由な状態のブロツクに対する“buddy”はア
ドレスが下記の様にして決定される自由ブロツク
と同寸法のブロツクである。もしも各デイスク・
アドレスがｌビツト長で、自由ブロツクが2k単
位の記憶（ページ）を有するならば、“buddy”
は自由ブロツクと共通のプレフイツクス（その長
さはｌ−ｋ−１）を共有するであろう。この共通
プレフイツクスに続く“buddy”に於けるビツト
は自由ブロツクに於ける対応するビツトの補数で
ある。もしも合体が生じると、結果物は寸法が
2^k+1の自由ブロツクである。 BEFフアイルに於いて、全てのノードは２の
ｎ乗のページ数を有する。よつてブロツク内では
スペースの無駄がない。更に、フアイルの成長
（もしくは収縮）は前のブロツクの寸法を２倍化
（もしくは1/2化）する、あるブロツク寸法から他
のブロツク寸法への漸次変化を要求する様に行な
われる。ブロツク寸法を変える動作はｘの値で指
示された境界（frontier）において生じる。この
領域におけるブロツクは、所定寸法のブロツクの
各自由リスト上のいくつかのブロツクが大きくな
る事なく、フアイル成長の際に容易に合体され
る。フアイルの収縮に於いては、ブロツクの分割
は長さの短いこれらのリストを保存する。主メモリの場合と異なり、デイスク記憶を管理
する場合は、“buddy”それ自体が自由か、そし
て丁度自由になつたブロツクと合体できるかを見
るために“buddy”それ自体に指向する事を避け
たい。もしもそれが行なわれると、それは各々の
自由なオペレーシヨンのためにエクストラなデイ
スク・アクセスを要求するであろう。この理由か
ら、その方法によつて要求された全てのブツクキ
ーピング操作は管理される記憶装置から完全に分
離され、よつてそれは主メモリ内に保持すること
ができる。利用可能なブロツクの各寸法のための
短い自由リストの故に、適当な寸法ブロツクを有
する自由リストを単にサーチすることによつて
“buddy”を容易に見出す事ができる。もしもこ
れらのリストが非常に短いならば、順次サーチが
適当である。もしもリストが幾分長いならば、
“buddy”を見付けるのに２進デイジタル・トリ
ー（trie）を用いる事ができる。いずれの場合に
於ても、必要とされる技法は複雑ではない。

【図面の簡単な説明】

第１図は主メモリに於けるインデツクス・レベ
ルの配置及び２次メモリに於けるデータ・ノー
ド・レベルの配置を示す図である。第２，１図及
び第２，２図は夫々、データ・ノード２倍化の前
及び後のフアイルの構成を示す図である。第３図
はオーバフロー・ページの関連するトリー（Ｏト
リー）と共にデータ・ノードの構成を示すブロツ
ク図である。１…コンピユータ・メモリ、２…デイスク・メ
モリ、３…データ・ノード、４…暗黙２進トリ
ー、５…根、６…１次ページ、７…Ｏトリー・ペ
ージ。

Claims

【特許請求の範囲】１主記憶装置及び２次記憶装置を有するコンピ
ユータ・システムにおいてキイによつて識別され
る複数のデータを含むキイ・アクセス型フアイル
を管理する方法であつて、キイのハツシング値に従つて配列されたデータ
を含む所定数のページをそれぞれ有する複数のノ
ードから成るデータ・レベルを上記２次記憶装置
に記憶し、フアイルの使用時に、上記複数のノードのそれ
ぞれに対応して、上記２次記憶装置における対応
するノードの開始アドレスと該ノードに属するペ
ージの数を反映する寸法情報とをそれぞれ含む複
数のインデツクス・エントリから成り、主記憶装
置に納まるように寸法が制限されたインデツク
ス・レベルを上記主記憶装置に記憶し、フアイルの寸法の変化につれて、上記データ・
レベルにおける任意のノードに属する上記所定数
のページの容量限度を越えて該ノードにデータを
挿入する必要があるときには、該ノードに属する
ページの数を上記所定数の２倍にするように追加
のページを該ノードに割当てることによつて、該
ノードを拡張し、且つ該拡張に応じて該ノードに
対応するインデツクス・エントリの寸法情報を変
更することを特徴とするキイ・アクセス型フアイル管理
方法。２上記ノードに属するページの数が２のｎ乗で
あり（ｎは整数）、且つ各インデツクス・エント
リに含まれている寸法情報が対応するノードに関
するｎを示すことを特徴とする特許請求の範囲第
１項記載のキイ・アクセス型フアイル管理方法。３更に、上記キイを用いて所望のデータを探索
するステツプを有し、該ステツプが、上記キイのハツシング値の先頭の所定のビツト
をアドレスとして用いて上記インデツクス・レベ
ルにおける１つのインデツクス・エントリを選択
し、該インデツクス・エントリに含まれている寸法
情報によつて示される数をｎとして、上記キイの
ハツシング値の上記所定のビツトの次のｎ個のビ
ツトを該インデツクス・エントリに含まれている
開始アドレスに加えて、該インデツクス・エント
リに対応するノードにおける所望のデータを含む
ページのアドレスを生成することを含む特許請求の範囲第２項記載のキイ・ア
クセス型フアイル管理方法。