JPS6322340B2 - - Google Patents

Info

Publication number
JPS6322340B2
JPS6322340B2 JP58137336A JP13733683A JPS6322340B2 JP S6322340 B2 JPS6322340 B2 JP S6322340B2 JP 58137336 A JP58137336 A JP 58137336A JP 13733683 A JP13733683 A JP 13733683A JP S6322340 B2 JPS6322340 B2 JP S6322340B2
Authority
JP
Japan
Prior art keywords
information
cell
checkpoint
cells
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58137336A
Other languages
English (en)
Other versions
JPS6027953A (ja
Inventor
Kazunori Hiraishi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58137336A priority Critical patent/JPS6027953A/ja
Publication of JPS6027953A publication Critical patent/JPS6027953A/ja
Publication of JPS6322340B2 publication Critical patent/JPS6322340B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 (A) 発明の技術分野 本発明はチエツクポイント処理方式、特にデー
タ処理システムにおいて、システム異常の際の環
境の復元にあたつて、環境の復元率を高め、破壊
に強いチエツクポイントを提供するチエツクポイ
ント処理方式に関するものである。
(B) 従来技術と問題点 データ処理システムにおける信頼性の向上は、
最重要な課題の1つであり、そのため、システム
の障害発生時に旧環境に復元するためいわゆるチ
エツクポイント処理方式が、いろいろ考えられて
いる。特に、例えば仮想入出力(VIO)ボリユー
ムの各種管理情報、データセツトの更新制御情報
等といつた重要な情報で、頻繁に更新される情報
に関するチエツクポイント情報は、世代管理等が
なされている。従来、このような世代管理がなさ
れるチエツクポイント情報は、次のように管理さ
れていた。
第1図は従来方式の例を示す。例えば第1図イ
図示の如く、各チエツクポイント・レコードのチ
エツクポイントデータセツト内における位置を覚
えておくために、各レコードにポインタPを持た
せ、復元時にポインタPの情報により、次のレコ
ードの位置がわかるようにする。また、第1図ロ
の方式では、全てのレコードのアドレスを記録し
た管理レコードMRを持たせ、この管理レコード
MRによつて、各レコードR1〜Roの位置がわか
るようにする。しかし、第1図イの方式では、例
えばばレコードR2のポインタPが、破壊された
り読み込みが不可能となつた場合に、後続するレ
コードR3,R4…についての復元処理を行うこ
とができなくなる。また、第1図ロの方式では、
管理レコードMRが破壊された場合に、各レコー
ドR1〜Roに全くアクセスできなくなるという問
題があつた。さらに両方式とも、書き込み時のエ
ラー等に対するリカバリ処理が、複数レコードに
影響するため複雑であり、かつ入出力時間が大で
あるという問題があつた。
(C) 発明の目的と構成 本発明は上記問題点の解決を図り、各レコード
の独立性を高めることにより、チエツクポイント
データセツトに対する記録時間の短縮、リカバリ
処理の簡易化、および環境の復元率の向上を可能
とすることを目的としている。そのため、本発明
のチエツクポイント処理方式は、動作中のデータ
処理システムのシステム環境を外部記憶媒体のチ
エツクポイントデータセツトへ記録しておき、シ
ステム異常時に上記チエツクポイントデータセツ
トの内容に従つて旧環境を復元するチエツクポイ
ント処理方式において、上記チエツクポイントデ
ータセツトは、チエツクポイント情報の入出力単
位となる複数個のセルと、該複数個のセルの各セ
ルについて有効または無効を示すセル・マツプ領
域とを有し、チエツクポイント対象の情報種別毎
に上記セルをn世代管理するセル管理部と、ジヤ
ーナル依頼元の要求に応じて上記セル管理部によ
つて通知されたセルに現時刻情報と情報種別を示
す情報識別子とを含むチエツクポイント情報を書
き出す出力処理部と、環境復元時に上記セル・マ
ツプ領域のマツプ情報に従つて全有効セルを読み
込む入力処理部と、該入力処理部が読み出した上
記有効セルについて上記現時刻情報およ上記情報
識別子を参照し情報種別毎に最新のチエツクポイ
ント情報に従つて旧環境の復元を行う復元処理部
とをそなえたことを特徴としている。以下図面を
参照しつつ実施例に従つて説明する。
(D) 発明の実施例 第2図は本発明に係るチエツクポイントデータ
セツトの構造説明図、第3図は本発明の一実施例
構成を示す。
図中、1は外部記憶装置、2はチエツクポイン
トデータセツト、3―1および3―2はセル・マ
ツプ領域、4はセル、10はジヤーナル依頼部、
11は復元処理部、12はチエツクポイントプロ
セツサ、13は出力処理部、14はセル管理部、
15は入力処理部、16は入出力実行部、17は
チヤネル、18はコントローラを表わす。
チエツクポイントデータセツト2は、例えば磁
気デイスク装置等の外部記憶装置1、特に直接ア
クセス装置(DASD)のボリユームに設けられ
る。チエツクポイントデータセツト2の記憶領域
は、例えば第2図図示の如く、チエツクポイント
情報の入出力単位となる複数個のセルに予め区分
される。また、チエツクポイントデータセツト2
の固定したアドレスに、セル・マツプ領域3―
1,3―2が設けられる。本実施例の場合、セ
ル・マツプが2世代管理されるものとして、以下
説明する。すなわち、セル・マツプ領域3―1ま
たは3―2のいずれかが最新のセル・マツプ情報
を保持し、他方が第2世代のセル・マツプ情報を
保持する。セル・マツプの情報の書き込みは、セ
ル・マツプ領域3―1およびセル・マツプ領域3
―2に対して、交互に行われる。セル・マツプ
は、例えば1ビツトが1個のセル4に対応し、該
ビツトが「1」のときに、対応するセル4が使用
中であり有効であることを示し、「0」のときに、
対応するセル4が空状態であつて、その中の情報
が無効であることを示すものである。各セル・マ
ツプ領域3―1,3―2の先頭および最終位置に
は、それぞれ処理装置が管理する実時間情報
TOD(Time Of Day)が書き込まれる。環境の
復元時に、セル・マツプ領域3―1と3―2のう
ち、どちらのセル・マツプ領域が最新のセル・マ
ツプを保持するかは、この実時間情報を比較する
ことによつて判断される。セル・マツプ領域3―
1,3―2の先頭の実時間情報TOD1と最終位
置の実時間情報TOD2とは、同じデータが書き
込まれる。もし、読み出したときに、TOD1と
TOD2との値が違つていれば、セル・マツプの
書き込み中に、入出力障害もしくは本体系の障害
が発生していることになるので、そのセル・マツ
プ領域の情報を無効とし、他方のセル・マツプ領
域の情報を環境の復元に利用する。
各セル4にも同様に、先頭および最終位置に実
時間情報TOD1,TOD2が書き込まれるように
なつている。読み出したときに、TOD1とTOD
2の内容に食違いがあれば、そのセルのチエツク
ポイント情報は棄去される。本発明の場合、各セ
ル4同士は、相互にポインタ情報等を持つことは
なく、各々独立している。各セル4には、チエツ
クポイント情報DATAの前に、さらにそのチエ
ツクポイント情報の種別を示す識別子IDが付加
される。システム異常時には、上記セル・マツプ
領域3―1または3―2の最新のセル・マツプに
より、有効なセル4が抽出され、識別子ID毎に、
実時間情報にもとづいて、最新のチエツクポイン
ト情報が選択されて、環境の復元が行われること
になる。
次に第3図を参照し、本発明の一実施例につい
て説明する。ジヤーナル依頼部10は、種々の事
象発生に伴い、各種管理テーブル、制御テーブル
等の内容が更新され、もしくは新たに作成され、
環境が変化して、チエツクポイントデータセツト
2に対する情報の書き込みが必要となつた場合
に、チエツクポイントプロセチツサ12に対し
て、チエツクポイント情報の書き込み要求を行う
ものである。このとき、情報種別を示す識別子
IDも通知する。同期をとる必要がある場合には、
チエツクポイントプロセツサ12からのジヤーナ
ル完了通知があるまで待ち状態に入る。
復元処理部11は、例えばシステム・ダウン後
のシステムの再開時に動作し、第2図で説明した
チエツクポイントデータセツト2の内容だけにも
とづいて、旧環境の復元を行うものである。ま
ず、チエツクポイントプロセツサ12に対して、
全有効セルの読み込みを依頼する。セルの内容が
読み込まれたならば、情報の識別子IDおよび各
情報の前後に付加されているTODの値に従つて、
ソート/マージを行い、情報の種別毎に最も新し
いチエツクポイント情報を抽出して、メモリの所
定の領域に設定し、旧環境を復元する。1つのセ
ル情報に入力エラーがあつたとしても、第2図で
説明したチエツクポイントデータセツト2の構造
により、他のセルに影響を及ぼして、アクセスで
きなくなるようなことはなく、例えばそのセル情
報によつて復元されるべき情報が1世代前のセル
情報によつて復元されることとなるだけである。
従つて、障害の波及範囲を局所化できることとな
る。
チエツクポイントプロセツサ12は、チエツク
ポイントデータセツト2を管理し、ジヤーナル依
頼部10および復元処理部11からのチエツクポ
イント情報の入出力処理依頼を実行するものであ
る。ジヤーナル依頼部10からの書き込み要求が
あると出力処理部13が起動される。出力処理部
13は、どのセルに情報を書き込めばよいかを決
定するために、セル管理部14を呼び出し、セル
の選択依頼を行う。
セル管理部14は、メモリ上でチエツクポイン
トデータセツト2のセル・マツプ,セル・アドレ
ス等を管理するものである。各セルの有効/無効
を示すセル・マツプは、メモリ上で常に最新のも
のを保持している。セルの確保が必要な場合に
は、セル・マツプ上のビツト値「0」に対応する
セルを見つけ、そのセルを割当てる。セルを割当
てた場合、セル・マツプのそのビツト値を「1」
にし、第2図図示セル・マツプ領域3―1または
3―2のうち、より古い情報を持つほうに、実時
間情報とともに書き込む。すなわち、セル・マツ
プ領域3―1および3―2には、交互に最新のセ
ル・マツプが書き込まれる。あるチエツクポイン
ト情報が、n世代管理されている場合には、その
情報を記録すべきセルを最低n個持つている。セ
ル管理部14は、メモリ上でそれらのセル・アド
レスを保持し、n個のセルがサイクリツクに使用
されるようにして、チエツクポイントデータセツ
ト2がn世代の情報を保持可能としている。な
お、何世代管理するかどうか等については、予め
登録された情報の識別子IDにもとづいて決定さ
れる。出力処理部13からのセル選択依頼に対し
ては、新たに確保したセル、またはサイクリツク
に使用しているセルのアドレスを通知する。出力
処理部13は、そのセル・アドレスに従つて
CCW(Channel Command Word)を作成し、チ
エツクポイント情報に、その時の実時間情報
TODを付加して、入出力実行部16に入出力命
令の実行を依頼する。この入出力命令の実行にお
いて、入出力障害が発生した場合には、セル管理
部14に通知し、新たなセルを確保して、そのセ
ルに情報を書き出す。このリトライ処理は、他の
セルに無関係に実行可能である。
入力処理部15は、復元処理部11からの要求
により、有効なセルのチエツクポイント情報を読
み出すものである。まず、チエツクポイントデー
タセツト2の固定領域に設けられた2つのセル・
マツプ領域3―1,3―2の情報を入力し、
TODを比較することによつて最新のセル・マツ
プを得る。次に、そのセル・マツプを参照して有
効なセルをさがし、READのCCWを作成して、
入出力実行部16に処理を依頼する。入出力実行
部16は、チヤネル17、コントローラ18のア
クセス・パスを決定し、入出力命令を発行して、
チヤネルにCCWの実行を依頼する。
なお、セル管理部14は、同一情報に対するジ
ヤール情報が書き込まれたセルが、同一トラツク
上に集まらないようにセルの位置を決定するとよ
い。こうすれば、例えばトラツク障害によつて、
そのトラツク上にあるすべてのセルが無効となつ
ても、ジヤーナル情報を復元できる確率がさらに
高められる。
また、2世代管理されるセル・マツプ領域3―
1,3―2からのセル・マツプの読み込みが、両
面失敗した場合であつても、次のように復元が可
能である。有効/無効にかかわらず、すべてのセ
ルを読み取り、前後のTODが等しいものだけを
有効とする。次に各セルの情報を、識別子IDお
よびTODで分類する。分類した結果にもとづい
て、チエツクポイント情報をグループ化し、それ
ぞれのグループについて、そのグループに含まれ
ているべき情報がすべて入つているかどうかによ
り、正当性チエツクを行う。正当性チエツクに合
格したものでTODが最新のものにより、環境の
復元を行い、すべてのグループについての処理が
終了したならば、リスタート準備完了となる。
(E) 発明の効果 以上説明した如く本発明によれば、チエツクポ
イント情報が格納されるセルには、他のセルをポ
イントする情報は不要であり、かつ世代判定およ
び正常出力の判定に利用できる実時間情報等を持
つため、チエツクポイントデータセツト自体を管
理するセル・マツプ領域や、セルの一部が破壊さ
れても、他のチエツクポイント情報を無事に復元
に利用することができる。従つて環境の復元率を
高めることができる。さらに、通常の記録時間の
短縮が可能になり、入出力障害等に対するリカバ
リ処理も簡易化される。
【図面の簡単な説明】
第1図は従来方式の例についての説明図、第2
図は本発明に係るチエツクポイントデータセツト
の構造説明図、第3図は本発明の一実施例構成を
示す。 図中、2はチエツクポイントデータセツト、3
―1および3―2はセル・マツプ領域、4はセ
ル、13は出力処理部、14はセル管理部、15
は入力処理部を表わす。

Claims (1)

    【特許請求の範囲】
  1. 1 動作中のデータ処理システムのシステム環境
    を外部記憶媒体のチエツクポイントデータセツト
    へ記録しておき、システム異常時に上記チエツク
    ポイントデータセツトの内容に従つて旧環境を復
    元するチエツクポイント処理方式において、上記
    チエツクポイントデータセツトは、チエツクポイ
    ント情報の入出力単位となる複数個のセルと、該
    複数個のセルの各セルについて有効または無効を
    示すセル・マツプ領域とを有し、チエツクポイン
    ト対象の情報種別毎に上記セルをn世代管理する
    セル管理部と、ジヤーナル依頼元の要求に応じて
    上記セル管理部によつて通知されたセルに現時刻
    情報と情報種別を示す情報識別子とを含むチエツ
    クポイント情報を書き出す出力処理部と、環境復
    元時に上記セル・マツプ領域のマツプ情報に従つ
    て全有効セルを読み込む入力処理部と、該入力処
    理部が読み出した上記有効セルについて上記現時
    刻情報および上記情報識別子を参照し情報種別毎
    に最新のチエツクポイント情報に従つて旧環境の
    復元を行う復元処理部とをそなえたことを特徴と
    するチエツクポイント処理方式。
JP58137336A 1983-07-27 1983-07-27 チエツクポイント処理方式 Granted JPS6027953A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58137336A JPS6027953A (ja) 1983-07-27 1983-07-27 チエツクポイント処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58137336A JPS6027953A (ja) 1983-07-27 1983-07-27 チエツクポイント処理方式

Publications (2)

Publication Number Publication Date
JPS6027953A JPS6027953A (ja) 1985-02-13
JPS6322340B2 true JPS6322340B2 (ja) 1988-05-11

Family

ID=15196267

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58137336A Granted JPS6027953A (ja) 1983-07-27 1983-07-27 チエツクポイント処理方式

Country Status (1)

Country Link
JP (1) JPS6027953A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63228245A (ja) * 1987-03-17 1988-09-22 Nec Corp デ−タベ−ス自動復旧方式
JP5537917B2 (ja) * 2009-12-04 2014-07-02 三菱電機株式会社 管理装置及びデータ処理制御装置及び管理方法及びデータ処理制御方法及びプログラム

Also Published As

Publication number Publication date
JPS6027953A (ja) 1985-02-13

Similar Documents

Publication Publication Date Title
US6535994B1 (en) Method and apparatus for identifying and repairing mismatched data
US5497483A (en) Method and system for track transfer control during concurrent copy operations in a data processing storage subsystem
US6233696B1 (en) Data verification and repair in redundant storage systems
KR100238925B1 (ko) 비휘발성 메모리를 갖는 복원 가능 디스크 제어 시스템
US6604171B1 (en) Managing a cache memory
JP2003223287A (ja) 記憶装置、この記憶装置のバックアップ方法及びプログラム
EP0566968A2 (en) Method and system for concurrent access during backup copying of data
JPH07500203A (ja) ロールバックのためのデータ・バックアップ・システム
WO1993022719A1 (en) Disk storage system
JPH0644010A (ja) タイムゼロ・バックアップ・コピー・プロセスにおける副ファイル状態のポーリングのための方法およびシステム
US6389511B1 (en) On-line data verification and repair in redundant storage system
JP2810593B2 (ja) 記憶装置
US5421003A (en) Disk storage system with fault tolerant media maintenance
US10649829B2 (en) Tracking errors associated with memory access operations
US20030177307A1 (en) Detecting open write transactions to mass storage
JPH039494B2 (ja)
US20220374310A1 (en) Write request completion notification in response to partial hardening of write data
JP2001075741A (ja) ディスク制御システムおよびデータ保全方法
US6854038B2 (en) Global status journaling in NVS
JPS6322340B2 (ja)
JPH0816881B2 (ja) データベース更新方法
JPS58182775A (ja) 磁気デイスク装置の自己診断方式
JPH06187201A (ja) ファイルシステム
JPH0690683B2 (ja) マルチプロセッサシステムの障害処理方式
JPS6167153A (ja) 直接アクセス記憶装置の部分障害回復処理方法