JPH0240772A

JPH0240772A - インデックス生成方式

Info

Publication number: JPH0240772A
Application number: JP63190810A
Authority: JP
Inventors: Toshiro Nakajima; 利朗中島
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1988-07-30
Filing date: 1988-07-30
Publication date: 1990-02-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野〕本発明は、データ管理システムにおいてデ、−タレコー
ドを構成する複数のフィールドに対してインデックスを
生成するインデックス生成方式に関するものである。

〔従来の技術〕

比較的規模の大きなデータ管理システムにおいては、デ
ータレコードの検索を高速化するために、データレコー
ドを構成する複数のフィールドに対するそれぞれのイン
デックスを予め生成して格納しておき、そのインデック
スを用いて検索を行うようにしたものが一般的となって
いる。

この種のデータ管理システムにおける従来のインデック
ス生成方式としては、データレコードを読み込み、その
データレコードを構成する複数のフィールドの中からイ
ンデックスを作成しようとする単一のフィールドを取り
出し、そのフィールドの値に該データレコードのアドレ
スを付加した中間レコード（第２のレコード）を生成し
て中間ファイルに出力し、対象とするデータレコードの
全てに対してこれらの処理を行い、その後、中間レコー
ドをフィールドの値をキー値としてソートすることによ
り、単一のフィールドに対するインデックスを生成して
いた。そして、データレコードを構成する他のフィール
ドに対してもインデックスを生成する場合には、上記の
処理をそれぞれのフィールドについて繰り返すものであ
った。

〔発明が解決しようとする課題〕

上述したように、従来のインデックス生成方式では、デ
ータレコードを構成する複数のフィールドに対するイン
デックスの生成において、フィールド毎に中間レコード
を生成してソートを行っていたため、一連のデータレコ
ードに対する処理がインデックスを作成しようとするフ
ィールドの個数分だけ必要となり、 ■一連のデータレコードに対する読み込み要求がインデ
ックスを作成しようとするフィールドの個数分だけ発生
し、処理速度の低下を招く。

■ソート手段を起動する回数がインデックスを作成しよ
うとするフィールドの個数分だけ発生し、ソート手段起
動のためのオーバーヘッドにより処理速度の低下を招く
。

等の欠点があった。

本発明は上記の点に鑑み提案されたものであり、その目
的とするところは、データレコードの読み込み要求の回
数を削減すると共に、ソート手段の起動によるオーバー
ヘッドを減少させ、処理速度の高速化を図ることのでき
るインデックス生成方式を提供することにある。

〔課題を解決するための手段〕

本発明は上記の目的を達成するため、データレコードを
読み込み、複数のフィールドの値を取り出し、それぞれ
のフィールドの属性に従いストリングデータとして大小
比較が行える変換キー値に変換し、該変換キー値と該デ
ータレコードのアドレスと該フィールドを識別するフィ
ールド識別子とから構成される中間レコードを中間ファ
イルに出力するレコード入力手段と、前記中間ファイル上の中間レコードに対し、フィールド
識別子を第１ソートキー、変換キー値を第２ソートキー
としてソートするソート手段と、ソートされた中間レコ
ードを入力し、前記レコード入力手段における変換の逆
変換を行ってフィールドの値を取り出し、フィールド識
別子の値に従って個々のフィールドに対するインデック
スを生成するインデックス生成手段とを備えるようにし
ている。

〔作用〕

本発明のインデックス生成方式にあっては、レコード入
力手段がデータレコードを読み込み、複数のフィールド
の値を取り出し、それぞれのフィールドの属性に従いス
トリングデータとして大小比較が行える変換キー値に変
換し、該変換キー値と該データレコードのアドレスと３
亥フイールドを識別するフィールド識別子とから構成さ
れる中間レコードを中間ファイルに出力し、ソート手段が前記中間ファイル上の中間レコードに対し
、フィールド識別子を第１ソートキー変換キー値を第２
ソートキーとしてソートし、インデックス生成手段がソ
ートされた中間レコードを入力し、前記レコード入力手
段における変換の逆変換を行ってフィールドの値を取り
出し、フィールド識別子の値に従って個々のフィールド
に対するインデックスを生成する。

〔実施例〕

以下、本発明の実施例につき図面を参照して説明する。

第１図は本発明のインデックス生成方式の一実施例を示
す構成図である。第１図において、ｌはデータレコード
の格納されたレコードファイル、２はレコードファイル
１からデータレコードを読み込んで中間レコードを生成
するレコード入力手段、３はレコード入力手段２で生成
された中間レコードを格納する中間ファイル、４は中間
ファイル３に格納された中間レコードをソートするソー
ト手段、５は中間ファイル３上のソートされた中間レコ
ードからフィールド毎のインデックスを生成するインデ
ックス生成手段、６はインデックス生成手段５で生成さ
れたインデックスを格納するインデックスファイルであ
る。

更に詳述すると、レコード入力手段２はレコードファイ
ルｌから例えば第２図に示すようなデータレコードＲを
読み込み、データレコードＲを構成する複数のフィール
ドＦ１．Ｆ２．Ｆ３の値を取り出し、それぞれのフィー
ルドの属性に従いストリングデータとして大小比較が行
える変換キー値に変換（キー値変換）し、該変換キー値
と該データレコードＲのアドレスと該フィールドを識別
するフィールド識別子とから構成される中間レコードＲ
°を生成し、中間ファイル３に出力する機能を有してい
る。なお、レコード入力手段２における処理のフローチ
ャートを第３図に示す。

第３図において、レコード入力手段２は、先ず、データ
レコードの各フィールドの定義から全てのフィールドの
中での最大の長さを算出しくステップ２０１）、次いで
データレコードを入力しくステップ２０２）、データレ
コードの終了の判定を行い（ステップ２０３）、終了で
あれば処理を終了しくステップ２０８）、終了でなけれ
ば入力したデータレコード中から順にフィールド値を取
り出しくステップ２０４）、フィールドの終了の判定を
行う（ステップ２０５）、ここで、終了と判定されれば
ステップ２０２に戻り、終了でなければ取り出したフィ
ールド値をフィールドの属性に従ってストリングデータ
として大小比較ができるようにステップ２０１で算出し
た最大の長さに適合する変換キー値に変換しくステップ
２０６）、ステップ２０６で変換された変換キー値の前
後にフィールド識別子とデータレコードのアドレスとを
付加して中間レコードを生成し、中間ファイル３に出力
しくステップ２０７＞、ステップ２０４に戻って同様の
動作を繰り返す。

第４図ないし第７図は上記のレコード入力手段２のフィ
ールドの値から変換キー値への変換の具体的手法を示し
たものであり、第４図はストリングデータフィールドに
対するキー値変換、第５図は符号付き１０進データフイ
ールドに対するキー値変換、第６図は固定小数点２進デ
ータフイールドに対するキー値変換、第７図は浮動小数
点２進データフイールドに対するキー値変換である。す
なわち、本実施例ではフィールドのデータ属性として、
ストリング比較がそのまま可能な英数字・漢字・符号無
し１０進数のストリングデータと、符号付き１０進数の
符号付き１０進データと、固定小数点２進数の固定小数
点２進データと、浮動小数点２進数の浮動小数点２進デ
ータとの計４種類を許しており、よって、それぞれに対
応してレコード人力手段２のキー値変換の処理にも第４
図〜第７図のように４種類が存在する。なお、いずれの
キー値変換も長さの同じストリングデータとして大小関
係を比較できるような変換キー値に変換することを目的
としている。

しかして、第４図のストリングデータフィールド用のキ
ー値変換では、最大の長さに合わせて後ろにゼロを付加
する（ステップ２１１）ことにより、長さの揃った変換
キー値を得ている。なお、Ｆはフィールドの値の例、Ｆ
ｏ　は変換キー値の例である。

第５図の符号付きｌＯ進データフィールド用のキー値変
換では、小数点位置を右端とみなして数値桁分の最大値
（９９９・・・９）を１０進加算して正の符号無しｌＯ
道データに変換しくステップ２２１）、最大の長さに合
わせて後ろにゼロを付加する（ステップ２２２）、これ
によって大小関係を維持したストリングデータを得てい
る。

第６図の固定小数点２進データフイールド用のキー値変
換では、２の補数形式で表された２進データの符号ビッ
トであるビット０を反転して正の符号無し２進データと
しくステップ２３１）、最大の長さに合わせて後ろにゼ
ロを付加する（ステップ２３２）、これにより、大小関
係を維持したストリングデータを得ている。

第７図の浮動小数点２進データフイールド用のキー値変
換では、正規化を行い（ステップ２４１）、指数部・仮
数部のそれぞれについて２の補数形式で表された２進デ
ータの符号ビットであるビット０を反転し、正の符号無
し２進データとしくステップ２４２）、仮数部のビット
０．指数部、仮数部のビット１以降の順に詰め替え（ス
テップ２４３）、最大の長さに合わせて後ろにゼロを付
加する（ステップ２４４）、これによって大小関係を維
持したストリングデータを得ている。

次いで、第１図において、ソート手段４は上述のように
して中間ファイル３に格納された中間レコード（Ｒｏ）
に対し、フィールド識別子を第１ソートキー、変換キー
値を第２ソートキーとしてソートする。すなわち、フィ
ールド識別子を第１ソートキーとしてソートすることに
より中間レコードはフィールドの同じもの同士がまとま
った配列となり、変換キー値を第２ソートキーとしてソ
ートすることにより、各フィールド毎のまとまりの中で
データ属性の大小関係に従った配列となる。

次いで、インデックス生成手段５はソートされた中間レ
コードを中間ファイル３から入力し、レコード入力手段
２における変換の逆変換を行ってフィールドの値を取り
出し、フィールド識別子の値に従って個々のフィールド
に対するインデックスを生成する。なお、インデックス
生成手段５における処理のフローチャートを第８図に示
す。

第８図において、インデックス生成手段５は中間ファイ
ル３からソートされた中間レコードＲ゛を入力しくステ
ップ５０１）、フィールド識別子に対応するフィールド
のインデックスをオープン（開設）する（ステップ５０
２）、次に、変換キー値を元のフィールドの値に逆変換
しくステップ５０３）、逆変換されたフィールドの値と
データレコードのアドレスとから構成されるインデック
スレコードをオーブンしたインデックスに記憶する（ス
テップ５０４）、次いで、再び中間ファイル３からソー
トされた中間レコードＲ゛を入力しくステップ５０５）
、レコードの終了判定を行う（ステップ５０６）、ここ
で終了と判定されれば処理を終了しくステップ５０８）
、判定されなければフィールド識別子が変わったかどう
かを判定しくステップ５０７）、変わっていればステッ
プ５０２に移行し、変わっていなければステップ５０３
に移行して同様の動作を繰り返す。

〔発明の効果〕

以上説明したように、本発明のインデックス生成方式に
あっては、対象となるデータレコード中の属性の異なる
フィールドを同じ長さのストリングデータに一律に変換
し、−括してソートを行ってフィールド毎のインデック
スを生成するため、■一連のデータレコードに対する読
み込み要求が１回で済むため、読み込み処理に要する時
間が短縮され、処理速度が向上する。

■ソート手段を起動する回数も一連のデータレコードに
対して１回で済むため、ソート手段起動のためのオーバ
ーヘッドが大幅に削減でき、処理速度が向上する。

等の効果がある。

【図面の簡単な説明】

第１図は本発明のインデックス生成方式の一実施例を示
す構成図、第２図は中間レコードの説明図、第３図はレコード入力手段の処理例を示すフローチャー
ト、第４図ないし第７図はレコード入力手段におけるキー値
変換の処理例を示すフローチャートおよび、第８図はインデックス生成手段の処理例を示すフローチ
ャートである。図において、１・・・レコードファイル、２・・・レコ
ード入力手段、３・・・中間ファイル、４・・・ソート
手段、５・・・インデックス生成手段、６・・・インデ
ックスファイル、Ｒ・・・データレコード、Ｒｏ・・・
中間レコード、Ｆｌ、Ｆ２．Ｆ３・・・フィールド、Ｆ
・・・フィールドの値、Ｆｏ・・・変換キー値。

Claims

【特許請求の範囲】データレコードを読み込み、複数のフィールドの値を取
り出し、それぞれのフィールドの属性に従いストリング
データとして大小比較が行える変換キー値に変換し、該
変換キー値と該データレコードのアドレスと該フィール
ドを識別するフィールド識別子とから構成される中間レ
コードを中間ファイルに出力するレコード入力手段と、前記中間ファイル上の中間レコードに対し、フィールド
識別子を第１ソートキー、変換キー値を第２ソートキー
としてソートするソート手段と、ソートされた中間レコ
ードを入力し、前記レコード入力手段における変換の逆
変換を行ってフィールドの値を取り出し、フィールド識
別子の値に従って個々のフィールドに対するインデック
スを生成するインデックス生成手段とを備えたことを特
徴とするインデックス生成方式。