JPH01314348A

JPH01314348A - データ格納方式

Info

Publication number: JPH01314348A
Application number: JP63147247A
Authority: JP
Inventors: Kyoji Kawagoe; 恭二川越
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1988-06-14
Filing date: 1988-06-14
Publication date: 1989-12-19

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野〕本発明はデータ格納方式に関し、特に幾つかの属性を有
するデータの集合をファイルに格納するデータ格納方式
に関する。

〔従来の技術〕

従来のデータ格納方式は、例えば、会社の従業ｉ情報、
販売情報、生産管理情報などを統一的に管理する関係デ
ータベースの格納において、原データを一意に識別でき
る属性である一次キーによって原データの格納番地を定
めて格納するとともに、−次キー以外の属性の値から、
その値を持つ原データを取出すための索引データを作成
して格納する方式がある。

このような索引データを作成する方式としては、各属性
ごとにそれぞれの値から原データの格納番地を得ること
ができる格納方式がある。

この格納方式の参考文献には、ソーティング・アンド・
サーチング（Ｓｏｒｔｉｎｇ　　ａｎｃｉＳｅａｒｃｈ
ｉｎｇ）、６．５節、アディソン・ウエズレイ（Ａｄｄ
ｉｓｏｎ−Ｗｅｓｌｅｙ）社、１９７３がある。

また、複数の属性の索引データを一括して格納する方式
がある。

この格納方式を示している参考文献には、ザ・フォード
トリー・アンド・リレイティッド・ヒエラキカル・デー
タ・ストラフチャ（Ｔ　ｈ　ｅＱｕａｄｔｒｅｅ　　ａ
ｎｄ　　Ｒｅ１ａｔｅｄＨｉｅｒａｒｃｈｉｃａｌ　　
Ｄａｔａ　　５ｔｒｕｃｔｕｒｅｓ）、コンピユーテイ
ング・サーベイズ（Ｃｏｍｐｕｔｉｎｇ　　５ｕｒｖｅ
ｙｓ）、１６巻２号、１８７頁〜２６０頁、ＡＣＭ、１
９８４がある。

〔発明が解決しようとする課題〕

上述した従来のデータ格納方式は、−様に分布するデー
タに対しては効率良く格納することができるが、分布に
偏りが存在したり複数の属性の間で相関関係が存在する
データについては、保存するファイルの容量や索引デー
タ量が増加し、その結束としてデータのアクセスを行う
時間も増加するという問題点がある。

本発明の目的は、−様に分布していないデータ、あるい
は複数の属性の間に相関関係が存在するデータについて
も、保存するファイルの容量や索引データ量の増加を少
なくするとともに、その結果としてデータを取出すため
のアクセスを行う時間も短縮することができるデータ格
納方式を提供することにある。

〔課題を解決するための手段〕

本発明のデータ格納方式は、複数の属性を有する原デー
タの集合を保存するファイルのデータ格納方式において
、（Ａ）前記原データに有する幾つかの属性で構成される
属性空間で、あらかじめ定められた座標系の回転を行う
ことにより、それらの幾つかの属性の値を変換する座標
系回転手段、（Ｂ）前記座標系回転手段で変換された新
たな幾つかの属性の値から、前記原データのそれぞれを
格納すべき前記ファイル内のデータ格納番地を算定する
データ格納番地算定手段、（Ｃ）前記データ格納番地算
定手段で算定されたデータ格納番地に前記原データのそ
れぞれを格納するデータ格納手段、を備えて構成されている。

〔作用〕

本発明のデータ格納方式は、索引に使用する幾つかの属
性の値に対して一様に分布していない原データについて
、まず、その索引に使用する幾つかの属性で構成される
属性空間で、あらかじめ定められた座標系の回転を行う
ことにより、それらの幾つかの属性の値に座標系の回転
変換を施している。

この座標系の回転変換は、原データが変換後の新たな幾
つかの属性の値に対して出来る限り一様に分布するよう
に、あらかじめ定められる。

次に、変換された結果の新たな幾つかの属性の値を使用
して原データのデータ格納番地を算定するとともに、そ
の索引データを作成する。

そして、原データを、算定したデータ格納番地にそのま
ま格納することにより、原データは、変換された結果の
新たな幾つかの属性の値に対してほぼ一様に分布するの
で、ファイルに効率良く格納される。

このように、−様に分布していないデータに対して効率
的でない従来のデータ格納方式に対して、本発明のデー
タ格納方式は、あらかじめ座標系の回転変換によって一
様分布に近づけることにより、ファイルにデータを効率
良く格納することができる。

〔実施例〕

次に本発明の実施例について図面を参照して説明する。

第１図は本発明のデータ格納方式の一実施例を示すブロ
ック図である。

第１図に示すように、座標系回転手段１は、格納する原
データＤのそれぞれに有する索引に使用する幾つかの属
性で構成される属性空間で、あらかじめ定められた座標
系の回転を行うことにより、それらの幾つかの属性の値
を変換している。

また、データ格納番地算定手段２は、座標系回転手段１
で変換された新たな幾つかの属性の値から、原データＤ
のそれぞれを格納すべきファイルＦ内のデータ格納番地
を算定している。

一方、データ格納手段３は、データ格納番地算定手段２
で算定されたファイルＦ内のデータ格納番地に原データ
Ｄのそれぞれを格納している。

第２図は本実施例のデータ格納方式の動作の一例を示す
流れ図である。

第２図のステップ２１で、座標系回転手段１は、変換さ
れた新たな幾つかの属性の値として得られるベクトルｇ
＝　（ｇ＋　、・・・・・・、・・・ｇｏ）’　を、索
引に使用する幾つかの属性の値で構成されるベクトルに
＝［ｋ、、・・・・・・・・・ｋ、、］’と座標系回転
行列Ｔとの積として、ｇ＝Ｔ＊ｋを計算している。

次に、ステ・ツブ２２で、データ格納番地算定手段２は
、ベタ１〜ルｇから格納すべき番地Ａｄｒを以Ｆのよう
に算定している。

すなわち、ｇｌの取り得る最大の値と最小の値とを各々
ｂ、、ａｌ　とし、ｇｌに対するそのときの等分割数を
ｎｌとして、Ａ　ｄｒ＝　Ｘ　１１Ｘ＋　＝ｎ＋　＊ｘ、−，＋ｙ。

ただし、ｉ−２，・・・・・・ｎである。

ただし、ｉ＝１．・・・・・・ｎであり、ＩｚｌはＺを
越えない最大の整数である。

Ｘ、＝Ｙ。

を算定している。

さらに、ステップ２３で、データ格納手段３は、原デー
タＤのそれぞれを以下のようにして格納している。

まず、ステップ２３−１で、もし、Ａｄｒで示された番
地に既にデータが格納され、これ以上格納できないなら
ば、ｇ、の等分割数を適当数だけ増加させ、これに応じ
て、すべてのデータの格納状態の再構成を実施する。

そこで、ステップ２３−２で、Ａｄｒで示される番地に
格納できる領域が存在すれば、その領域に原データを格
納する。

次に示す第１表は格納する原データＤの一例を示してい
る。

第１表第１表の原データＤは、三つの属性Ａｌ。

Ａ２．Ａ３を有しているが、以下に、索引に使用する属
性は、Ａ１とＡ２との二つであり、Ａ１と、へ２の取り
得る値がそれぞれＯと１との間である場合について、デ
ータが全く格納されていないファイルに第１表の原デー
タＤを格納する例を説明する。

なお、最初、ＡＩとＡ２とも分割はなくｎｌ　＝ｔであ
り、番地に格納できるデータの数も１として説明する。

また、座標系回転行列Ｔは、原データＤが変換後の新た
な２つの属性の値に対して出来る限り一様に分布するよ
うに、あらかじめ次の値に定められているものとする。

この結果、変換後の新たな属性のベクトルｇ”　ｌ−、
ｇ＋　、ｇｌ：Ｉ　’の取り得る値は、ｇ、が０とｆ２
との間で、ｇｌが一１／ｆ２と１／Ｆ２との間になる。

まず、第１表の最初の原データＤＩについて、第２図に
示すように、ステップ２１で、上記の行列の値に示す座
標系の回転変換を行って、ｇ＝（０，３５３５，−０，
２１２１）’を得ることができる。

次に、第２図のステップ２２で、番地Ａｄｒを求めれば
、Ｙｌ−０、ｘ、　＝ｏ、　Ｙ２　＝、０１Ｘ２＝Ｏで
、Ａｄ　ｒ＝ｏとなる。そこで、Ｄｌを番地０に格納す
る。

第３図は第１表の原データを順次格納するときの格納状
況の一例を示す格納状況説明図である。

第３図（ａ）に示すように、Ｄ１格納時には、Ｄｌが番
地０に格納される。

次に、第１表の原データＤ２についても、同様に番地Ａ
ｄｒを求めれば、ＤＩと同じＡｄｒ＝Ｏとなる。そこで
、第２図のステップ２３−１で、分割数を増加させ、ｎ
２−２とする。

そして、Ｄｌに対して再びＡｄｒを求めれば、Ａ　ｄｒ
＝　Ｏとなる。このため、Ｄｌを番地０がら移動する必
要はない。一方、Ｄ２については、Ａｄｒ＝１となるの
で、Ｄ２を番地１に格納する。

この結果、第３図（ｂ）に示すように、Ｄ２格納時には
、Ｄｌが番地０に、Ｄ２が番地１に格納されることとな
る。

次に、Ｄ３については、Ａｄｒ＝Ｏとなり、再び分割し
なければならないので、ｎｌ　＝２とする。

そして、ＤｌとＤ２とＤ３のＡｄｒを再計算すると、Ｄ
ｌについてはＡｄｒ−〇、Ｄ２についてはＡｄｒ＝３．
Ｄ３についてはＡｄｒ＝２となるので、それぞれの番地
に格納する。

この結果、第３図（Ｃ）に示すように、Ｄ３格納時には
、Ｄｌが番地Ｏに、Ｄ２が番地３、Ｄ３を番地２に格納
されることとなる。

以降のＤ４．Ｄ５．Ｄ６についても、同様の処理を施す
ことにより、第３図（ｄ）、（ｅ）。

（ｆ）に示すように、Ｄｌ、・・・・・・・・・Ｄ６が
それぞれ格納されることとなる。

一方、第４図は第１表の原データを従来のデータ格納方
式で格納するときの格納状況の一例を示す格納状況説明
図である。

第４図に示すように、従来のデータ格納方式のファイル
は、索引に使用する属性のＡＩとＡ２とをそれぞれ等間
隔に区分して、６つの原データＤ１．・・・・・・・・
・Ｄ６を格納するための１２個のデータ格納番地を有し
ている。

従って、第４図に示す従来のデータ格納方式のファイル
は、第３図（ｆ）の本実施例のデータ格納方式に比べて
、データ格納番地の数が多く、データを格納していない
データ格納番地の数が多くなっている。

このように、本実施例のデータ格納方式は、座標系の回
転変換により、必要な格納領域が少なく、効率良くデー
タを格納することができる。

以上述べたように、本実施例のデータ格納方式は、−様
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができる。

なお、本実施例は、索引に使用する属性が２つの場かに
ついて述べているが、２つである必要はなく、幾つの場
合にも適用できる。

また、本発明のデータ格納方式は、座標系の回転変換を
データ格納番地の計算の前に使用することに特徴がある
ので、第２図のステップ２２におけるデータ格納番地の
計算方法も、これに限ることなく、索引ファイルを使用
する方法、ハツシングによる方法、配列による方法など
様々な方法をＩＸＥ用することができる。

［発明の効果〕以上説明したように、本発明のデータ格納方式は、−様
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができるという効果を有している。

【図面の簡単な説明】

第１図は本発明のデータ格納方式の一実施例を示すブロ
ック図、第２図は本実施例のデータ格納方式の動作の一
例を示す流れ図、第３図は第１表の原データを順次格納
するときの格納状況の一例を示す格納状況説明図、第４
図は第１表の原データを従来のデータ格納方式で格納す
るときの格納状況の一例を示す格納状況説明図である。１・・・・・・座標系回転手段、２・・・・・・データ
格納番地算定手段、３・・・・・・データ格納手段、Ｄ
・・・・・・原データ、Ｆ・・・・・・ファイル。

Claims

【特許請求の範囲】　複数の属性を有する原データの集合を保存するファイ
ルのデータ格納方式において、（Ａ）前記原データに有する幾つかの属性で構成される
属性空間で、あらかじめ定められた座標系の回転を行う
ことにより、それらの幾つかの属性の値を変換する座標
系回転手段、（Ｂ）前記座標系回転手段で変換された新たな幾つかの
属性の値から、前記原データのそれぞれを格納すべき前
記ファイル内のデータ格納番地を算定するデータ格納番
地算定手段、（Ｃ）前記データ格納番地算定手段で算定されたデータ
格納番地に前記原データのそれぞれを格納するデータ格
納手段、を備えることを特徴とするデータ格納方式。