JPH01314348A - データ格納方式 - Google Patents
データ格納方式Info
- Publication number
- JPH01314348A JPH01314348A JP63147247A JP14724788A JPH01314348A JP H01314348 A JPH01314348 A JP H01314348A JP 63147247 A JP63147247 A JP 63147247A JP 14724788 A JP14724788 A JP 14724788A JP H01314348 A JPH01314348 A JP H01314348A
- Authority
- JP
- Japan
- Prior art keywords
- data
- data storage
- stored
- file
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013500 data storage Methods 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 238000003860 storage Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野〕
本発明はデータ格納方式に関し、特に幾つかの属性を有
するデータの集合をファイルに格納するデータ格納方式
に関する。
するデータの集合をファイルに格納するデータ格納方式
に関する。
従来のデータ格納方式は、例えば、会社の従業i情報、
販売情報、生産管理情報などを統一的に管理する関係デ
ータベースの格納において、原データを一意に識別でき
る属性である一次キーによって原データの格納番地を定
めて格納するとともに、−次キー以外の属性の値から、
その値を持つ原データを取出すための索引データを作成
して格納する方式がある。
販売情報、生産管理情報などを統一的に管理する関係デ
ータベースの格納において、原データを一意に識別でき
る属性である一次キーによって原データの格納番地を定
めて格納するとともに、−次キー以外の属性の値から、
その値を持つ原データを取出すための索引データを作成
して格納する方式がある。
このような索引データを作成する方式としては、各属性
ごとにそれぞれの値から原データの格納番地を得ること
ができる格納方式がある。
ごとにそれぞれの値から原データの格納番地を得ること
ができる格納方式がある。
この格納方式の参考文献には、ソーティング・アンド・
サーチング(Sorting anciSearch
ing)、6.5節、アディソン・ウエズレイ(Add
ison−Wesley)社、1973がある。
サーチング(Sorting anciSearch
ing)、6.5節、アディソン・ウエズレイ(Add
ison−Wesley)社、1973がある。
また、複数の属性の索引データを一括して格納する方式
がある。
がある。
この格納方式を示している参考文献には、ザ・フォード
トリー・アンド・リレイティッド・ヒエラキカル・デー
タ・ストラフチャ(T h eQuadtree a
nd Re1atedHierarchical
Data 5tructures)、コンピユーテイ
ング・サーベイズ(Computing 5urve
ys)、16巻2号、187頁〜260頁、ACM、1
984がある。
トリー・アンド・リレイティッド・ヒエラキカル・デー
タ・ストラフチャ(T h eQuadtree a
nd Re1atedHierarchical
Data 5tructures)、コンピユーテイ
ング・サーベイズ(Computing 5urve
ys)、16巻2号、187頁〜260頁、ACM、1
984がある。
上述した従来のデータ格納方式は、−様に分布するデー
タに対しては効率良く格納することができるが、分布に
偏りが存在したり複数の属性の間で相関関係が存在する
データについては、保存するファイルの容量や索引デー
タ量が増加し、その結束としてデータのアクセスを行う
時間も増加するという問題点がある。
タに対しては効率良く格納することができるが、分布に
偏りが存在したり複数の属性の間で相関関係が存在する
データについては、保存するファイルの容量や索引デー
タ量が増加し、その結束としてデータのアクセスを行う
時間も増加するという問題点がある。
本発明の目的は、−様に分布していないデータ、あるい
は複数の属性の間に相関関係が存在するデータについて
も、保存するファイルの容量や索引データ量の増加を少
なくするとともに、その結果としてデータを取出すため
のアクセスを行う時間も短縮することができるデータ格
納方式を提供することにある。
は複数の属性の間に相関関係が存在するデータについて
も、保存するファイルの容量や索引データ量の増加を少
なくするとともに、その結果としてデータを取出すため
のアクセスを行う時間も短縮することができるデータ格
納方式を提供することにある。
本発明のデータ格納方式は、複数の属性を有する原デー
タの集合を保存するファイルのデータ格納方式において
、 (A)前記原データに有する幾つかの属性で構成される
属性空間で、あらかじめ定められた座標系の回転を行う
ことにより、それらの幾つかの属性の値を変換する座標
系回転手段、(B)前記座標系回転手段で変換された新
たな幾つかの属性の値から、前記原データのそれぞれを
格納すべき前記ファイル内のデータ格納番地を算定する
データ格納番地算定手段、(C)前記データ格納番地算
定手段で算定されたデータ格納番地に前記原データのそ
れぞれを格納するデータ格納手段、 を備えて構成されている。
タの集合を保存するファイルのデータ格納方式において
、 (A)前記原データに有する幾つかの属性で構成される
属性空間で、あらかじめ定められた座標系の回転を行う
ことにより、それらの幾つかの属性の値を変換する座標
系回転手段、(B)前記座標系回転手段で変換された新
たな幾つかの属性の値から、前記原データのそれぞれを
格納すべき前記ファイル内のデータ格納番地を算定する
データ格納番地算定手段、(C)前記データ格納番地算
定手段で算定されたデータ格納番地に前記原データのそ
れぞれを格納するデータ格納手段、 を備えて構成されている。
本発明のデータ格納方式は、索引に使用する幾つかの属
性の値に対して一様に分布していない原データについて
、まず、その索引に使用する幾つかの属性で構成される
属性空間で、あらかじめ定められた座標系の回転を行う
ことにより、それらの幾つかの属性の値に座標系の回転
変換を施している。
性の値に対して一様に分布していない原データについて
、まず、その索引に使用する幾つかの属性で構成される
属性空間で、あらかじめ定められた座標系の回転を行う
ことにより、それらの幾つかの属性の値に座標系の回転
変換を施している。
この座標系の回転変換は、原データが変換後の新たな幾
つかの属性の値に対して出来る限り一様に分布するよう
に、あらかじめ定められる。
つかの属性の値に対して出来る限り一様に分布するよう
に、あらかじめ定められる。
次に、変換された結果の新たな幾つかの属性の値を使用
して原データのデータ格納番地を算定するとともに、そ
の索引データを作成する。
して原データのデータ格納番地を算定するとともに、そ
の索引データを作成する。
そして、原データを、算定したデータ格納番地にそのま
ま格納することにより、原データは、変換された結果の
新たな幾つかの属性の値に対してほぼ一様に分布するの
で、ファイルに効率良く格納される。
ま格納することにより、原データは、変換された結果の
新たな幾つかの属性の値に対してほぼ一様に分布するの
で、ファイルに効率良く格納される。
このように、−様に分布していないデータに対して効率
的でない従来のデータ格納方式に対して、本発明のデー
タ格納方式は、あらかじめ座標系の回転変換によって一
様分布に近づけることにより、ファイルにデータを効率
良く格納することができる。
的でない従来のデータ格納方式に対して、本発明のデー
タ格納方式は、あらかじめ座標系の回転変換によって一
様分布に近づけることにより、ファイルにデータを効率
良く格納することができる。
次に本発明の実施例について図面を参照して説明する。
第1図は本発明のデータ格納方式の一実施例を示すブロ
ック図である。
ック図である。
第1図に示すように、座標系回転手段1は、格納する原
データDのそれぞれに有する索引に使用する幾つかの属
性で構成される属性空間で、あらかじめ定められた座標
系の回転を行うことにより、それらの幾つかの属性の値
を変換している。
データDのそれぞれに有する索引に使用する幾つかの属
性で構成される属性空間で、あらかじめ定められた座標
系の回転を行うことにより、それらの幾つかの属性の値
を変換している。
また、データ格納番地算定手段2は、座標系回転手段1
で変換された新たな幾つかの属性の値から、原データD
のそれぞれを格納すべきファイルF内のデータ格納番地
を算定している。
で変換された新たな幾つかの属性の値から、原データD
のそれぞれを格納すべきファイルF内のデータ格納番地
を算定している。
一方、データ格納手段3は、データ格納番地算定手段2
で算定されたファイルF内のデータ格納番地に原データ
Dのそれぞれを格納している。
で算定されたファイルF内のデータ格納番地に原データ
Dのそれぞれを格納している。
第2図は本実施例のデータ格納方式の動作の一例を示す
流れ図である。
流れ図である。
第2図のステップ21で、座標系回転手段1は、変換さ
れた新たな幾つかの属性の値として得られるベクトルg
= (g+ 、・・・・・・、・・・go)’ を、索
引に使用する幾つかの属性の値で構成されるベクトルに
=[k、、・・・・・・・・・k、、]’と座標系回転
行列Tとの積として、 g=T*k を計算している。
れた新たな幾つかの属性の値として得られるベクトルg
= (g+ 、・・・・・・、・・・go)’ を、索
引に使用する幾つかの属性の値で構成されるベクトルに
=[k、、・・・・・・・・・k、、]’と座標系回転
行列Tとの積として、 g=T*k を計算している。
次に、ステ・ツブ22で、データ格納番地算定手段2は
、ベタ1〜ルgから格納すべき番地Adrを以Fのよう
に算定している。
、ベタ1〜ルgから格納すべき番地Adrを以Fのよう
に算定している。
すなわち、glの取り得る最大の値と最小の値とを各々
b、、al とし、glに対するそのときの等分割数を
nlとして、 A dr= X 11 X+ =n+ *x、−,+y。
b、、al とし、glに対するそのときの等分割数を
nlとして、 A dr= X 11 X+ =n+ *x、−,+y。
ただし、i−2,・・・・・・nである。
ただし、i=1.・・・・・・nであり、IzlはZを
越えない最大の整数である。
越えない最大の整数である。
X、=Y。
を算定している。
さらに、ステップ23で、データ格納手段3は、原デー
タDのそれぞれを以下のようにして格納している。
タDのそれぞれを以下のようにして格納している。
まず、ステップ23−1で、もし、Adrで示された番
地に既にデータが格納され、これ以上格納できないなら
ば、g、の等分割数を適当数だけ増加させ、これに応じ
て、すべてのデータの格納状態の再構成を実施する。
地に既にデータが格納され、これ以上格納できないなら
ば、g、の等分割数を適当数だけ増加させ、これに応じ
て、すべてのデータの格納状態の再構成を実施する。
そこで、ステップ23−2で、Adrで示される番地に
格納できる領域が存在すれば、その領域に原データを格
納する。
格納できる領域が存在すれば、その領域に原データを格
納する。
次に示す第1表は格納する原データDの一例を示してい
る。
る。
第1表
第1表の原データDは、三つの属性Al。
A2.A3を有しているが、以下に、索引に使用する属
性は、A1とA2との二つであり、A1と、へ2の取り
得る値がそれぞれOと1との間である場合について、デ
ータが全く格納されていないファイルに第1表の原デー
タDを格納する例を説明する。
性は、A1とA2との二つであり、A1と、へ2の取り
得る値がそれぞれOと1との間である場合について、デ
ータが全く格納されていないファイルに第1表の原デー
タDを格納する例を説明する。
なお、最初、AIとA2とも分割はなくnl =tであ
り、番地に格納できるデータの数も1として説明する。
り、番地に格納できるデータの数も1として説明する。
また、座標系回転行列Tは、原データDが変換後の新た
な2つの属性の値に対して出来る限り一様に分布するよ
うに、あらかじめ次の値に定められているものとする。
な2つの属性の値に対して出来る限り一様に分布するよ
うに、あらかじめ次の値に定められているものとする。
この結果、変換後の新たな属性のベクトルg” l−、
g+ 、gl:I ’の取り得る値は、g、が0とf2
との間で、glが一1/f2と1/F2との間になる。
g+ 、gl:I ’の取り得る値は、g、が0とf2
との間で、glが一1/f2と1/F2との間になる。
まず、第1表の最初の原データDIについて、第2図に
示すように、ステップ21で、上記の行列の値に示す座
標系の回転変換を行って、g=(0,3535,−0,
2121)’を得ることができる。
示すように、ステップ21で、上記の行列の値に示す座
標系の回転変換を行って、g=(0,3535,−0,
2121)’を得ることができる。
次に、第2図のステップ22で、番地Adrを求めれば
、Yl−0、x、 =o、 Y2 =、01X2=Oで
、Ad r=oとなる。そこで、Dlを番地0に格納す
る。
、Yl−0、x、 =o、 Y2 =、01X2=Oで
、Ad r=oとなる。そこで、Dlを番地0に格納す
る。
第3図は第1表の原データを順次格納するときの格納状
況の一例を示す格納状況説明図である。
況の一例を示す格納状況説明図である。
第3図(a)に示すように、D1格納時には、Dlが番
地0に格納される。
地0に格納される。
次に、第1表の原データD2についても、同様に番地A
drを求めれば、DIと同じAdr=Oとなる。そこで
、第2図のステップ23−1で、分割数を増加させ、n
2−2とする。
drを求めれば、DIと同じAdr=Oとなる。そこで
、第2図のステップ23−1で、分割数を増加させ、n
2−2とする。
そして、Dlに対して再びAdrを求めれば、A dr
= Oとなる。このため、Dlを番地0がら移動する必
要はない。一方、D2については、Adr=1となるの
で、D2を番地1に格納する。
= Oとなる。このため、Dlを番地0がら移動する必
要はない。一方、D2については、Adr=1となるの
で、D2を番地1に格納する。
この結果、第3図(b)に示すように、D2格納時には
、Dlが番地0に、D2が番地1に格納されることとな
る。
、Dlが番地0に、D2が番地1に格納されることとな
る。
次に、D3については、Adr=Oとなり、再び分割し
なければならないので、nl =2とする。
なければならないので、nl =2とする。
そして、DlとD2とD3のAdrを再計算すると、D
lについてはAdr−〇、D2についてはAdr=3.
D3についてはAdr=2となるので、それぞれの番地
に格納する。
lについてはAdr−〇、D2についてはAdr=3.
D3についてはAdr=2となるので、それぞれの番地
に格納する。
この結果、第3図(C)に示すように、D3格納時には
、Dlが番地Oに、D2が番地3、D3を番地2に格納
されることとなる。
、Dlが番地Oに、D2が番地3、D3を番地2に格納
されることとなる。
以降のD4.D5.D6についても、同様の処理を施す
ことにより、第3図(d)、(e)。
ことにより、第3図(d)、(e)。
(f)に示すように、Dl、・・・・・・・・・D6が
それぞれ格納されることとなる。
それぞれ格納されることとなる。
一方、第4図は第1表の原データを従来のデータ格納方
式で格納するときの格納状況の一例を示す格納状況説明
図である。
式で格納するときの格納状況の一例を示す格納状況説明
図である。
第4図に示すように、従来のデータ格納方式のファイル
は、索引に使用する属性のAIとA2とをそれぞれ等間
隔に区分して、6つの原データD1.・・・・・・・・
・D6を格納するための12個のデータ格納番地を有し
ている。
は、索引に使用する属性のAIとA2とをそれぞれ等間
隔に区分して、6つの原データD1.・・・・・・・・
・D6を格納するための12個のデータ格納番地を有し
ている。
従って、第4図に示す従来のデータ格納方式のファイル
は、第3図(f)の本実施例のデータ格納方式に比べて
、データ格納番地の数が多く、データを格納していない
データ格納番地の数が多くなっている。
は、第3図(f)の本実施例のデータ格納方式に比べて
、データ格納番地の数が多く、データを格納していない
データ格納番地の数が多くなっている。
このように、本実施例のデータ格納方式は、座標系の回
転変換により、必要な格納領域が少なく、効率良くデー
タを格納することができる。
転変換により、必要な格納領域が少なく、効率良くデー
タを格納することができる。
以上述べたように、本実施例のデータ格納方式は、−様
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができる。
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができる。
なお、本実施例は、索引に使用する属性が2つの場かに
ついて述べているが、2つである必要はなく、幾つの場
合にも適用できる。
ついて述べているが、2つである必要はなく、幾つの場
合にも適用できる。
また、本発明のデータ格納方式は、座標系の回転変換を
データ格納番地の計算の前に使用することに特徴がある
ので、第2図のステップ22におけるデータ格納番地の
計算方法も、これに限ることなく、索引ファイルを使用
する方法、ハツシングによる方法、配列による方法など
様々な方法をIXE用することができる。
データ格納番地の計算の前に使用することに特徴がある
ので、第2図のステップ22におけるデータ格納番地の
計算方法も、これに限ることなく、索引ファイルを使用
する方法、ハツシングによる方法、配列による方法など
様々な方法をIXE用することができる。
[発明の効果〕
以上説明したように、本発明のデータ格納方式は、−様
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができるという効果を有している。
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができるという効果を有している。
第1図は本発明のデータ格納方式の一実施例を示すブロ
ック図、第2図は本実施例のデータ格納方式の動作の一
例を示す流れ図、第3図は第1表の原データを順次格納
するときの格納状況の一例を示す格納状況説明図、第4
図は第1表の原データを従来のデータ格納方式で格納す
るときの格納状況の一例を示す格納状況説明図である。 1・・・・・・座標系回転手段、2・・・・・・データ
格納番地算定手段、3・・・・・・データ格納手段、D
・・・・・・原データ、F・・・・・・ファイル。
ック図、第2図は本実施例のデータ格納方式の動作の一
例を示す流れ図、第3図は第1表の原データを順次格納
するときの格納状況の一例を示す格納状況説明図、第4
図は第1表の原データを従来のデータ格納方式で格納す
るときの格納状況の一例を示す格納状況説明図である。 1・・・・・・座標系回転手段、2・・・・・・データ
格納番地算定手段、3・・・・・・データ格納手段、D
・・・・・・原データ、F・・・・・・ファイル。
Claims (1)
- 【特許請求の範囲】 複数の属性を有する原データの集合を保存するファイ
ルのデータ格納方式において、 (A)前記原データに有する幾つかの属性で構成される
属性空間で、あらかじめ定められた座標系の回転を行う
ことにより、それらの幾つかの属性の値を変換する座標
系回転手段、 (B)前記座標系回転手段で変換された新たな幾つかの
属性の値から、前記原データのそれぞれを格納すべき前
記ファイル内のデータ格納番地を算定するデータ格納番
地算定手段、 (C)前記データ格納番地算定手段で算定されたデータ
格納番地に前記原データのそれぞれを格納するデータ格
納手段、 を備えることを特徴とするデータ格納方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63147247A JPH01314348A (ja) | 1988-06-14 | 1988-06-14 | データ格納方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63147247A JPH01314348A (ja) | 1988-06-14 | 1988-06-14 | データ格納方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01314348A true JPH01314348A (ja) | 1989-12-19 |
Family
ID=15425910
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63147247A Pending JPH01314348A (ja) | 1988-06-14 | 1988-06-14 | データ格納方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01314348A (ja) |
-
1988
- 1988-06-14 JP JP63147247A patent/JPH01314348A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7213025B2 (en) | Partitioned database system | |
| US6009432A (en) | Value-instance-connectivity computer-implemented database | |
| EP0124097B1 (en) | Method for storing and retrieving data in a data base | |
| US5832475A (en) | Database system and method employing data cube operator for group-by operations | |
| CN102968503B (zh) | 数据库系统的数据处理方法以及数据库系统 | |
| JP3318834B2 (ja) | データファイルシステム及びデータ検索方法 | |
| JPH0554076A (ja) | メモリ内のデータサーチ及びデータ保持方法 | |
| JPH09330324A (ja) | 並列検索技術 | |
| EP0627697B1 (en) | Indexing/compression scheme for supporting graphics and data selection | |
| US6745198B1 (en) | Parallel spatial join index | |
| US7310719B2 (en) | Memory management tile optimization | |
| US7822776B2 (en) | Multidimensional dynamic clustering (MDDC) | |
| US9747363B1 (en) | Efficient storage and retrieval of sparse arrays of identifier-value pairs | |
| Vassilakopoulos et al. | Dynamic inverted quadtree: A structure for pictorial databases | |
| JPH01314348A (ja) | データ格納方式 | |
| JPH08235033A (ja) | オブジェクト指向データベース管理システムにおける結合演算方式 | |
| Chan | Multidisk file design: An analysis of folding buckets to disks | |
| JPH022433A (ja) | データ格納方式 | |
| JP3980326B2 (ja) | データ管理方法およびコンピュータ読み取り可能な記録媒体 | |
| JP2000148555A (ja) | オブジェクトモデルとリレーショナルモデルとの間でのマッピング方法 | |
| JPS62287350A (ja) | インデツクス一括更新方式 | |
| JP3145727B2 (ja) | データの検索装置 | |
| Xu et al. | Efficiently Update Disk-Resident Interval Tree | |
| Wang et al. | Applying Hilbert spatial ordering code to partition massive spatial data in PC cluster system | |
| JP2708625B2 (ja) | 均質ハッシング処理方式 |