JPH05108388A - プロセス復旧方式 - Google Patents

プロセス復旧方式

Info

Publication number
JPH05108388A
JPH05108388A JP3266668A JP26666891A JPH05108388A JP H05108388 A JPH05108388 A JP H05108388A JP 3266668 A JP3266668 A JP 3266668A JP 26666891 A JP26666891 A JP 26666891A JP H05108388 A JPH05108388 A JP H05108388A
Authority
JP
Japan
Prior art keywords
copy
checkpoint
data
page
restoration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3266668A
Other languages
English (en)
Inventor
Toshio Shirokibara
敏雄 白木原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP3266668A priority Critical patent/JPH05108388A/ja
Publication of JPH05108388A publication Critical patent/JPH05108388A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 計算機において、プロセス復旧のためのオー
バヘッドを小さくすることを目的とする。 【構成】 プロセス実行中に書き込みが起こった場合、
その部分のコピーを取り、更新はコピーに対して行い、
プロセス実行中のチェックポイント時にはコピーを有効
にし、プロセス復旧時にはコピーを無効にし最も近いチ
ェックポイントからプロセスを再実行することによりプ
ロセス復旧を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、オペレーティングシ
ステムにおいて、プロセスが更新したデータを最も近い
チェックポイント時に復旧するプロセス復旧方式に関す
る。
【0002】
【従来の技術】プロセス実行中にエラーなどによってプ
ロセスの実行が継続できなくなったときに、そのプロセ
スの実行中に適宜チェックポイントを設定しておき、プ
ロセスの実行が継続できなくなった時点で最も最近のチ
ェックポイントまでデータを復旧し、そのチェックポイ
ントからプロセスを再実行させる必要が生じる場合があ
る。
【0003】例えばデータベースシステムにおいて、ト
ランザクション実行中にデッドロックが発生した場合に
は、最も最近のコミットポイントからデッドロックが起
きた時点までに更新したデータをもとに戻し、そのコミ
ットポイントから実行を再開する必要がある。
【0004】また、複数のプロセッサが1つの実行キュ
ーからプロセスを取り、実行するようなマルチプロセッ
サシステムにおいて、あるプロセッサがハードウェアの
故障などによりプロセスの実行が継続できなくなった場
合、プロセスがディスパッチされてから変更したデータ
をもとに戻し、プロセスの状態を実行した時点の状態に
戻して実行キューにつなぐことにより、他のプロセッサ
によって実行させることができる。
【0005】このようなプロセス復旧方式において、プ
ロセスが更新したデータを最も最近のチェックポイント
時まで復元する方法には、以下の2つのようなものがあ
る。 (1)チェックポイントにおいて、プロセスの持ってい
るデータイメージ(データ領域)全体をコピーし、復旧
の必要が生じたときには、その時点のデータイメージを
無効にし、コピーしたデータイメージを有効にする方
法。
【0006】(2)プロセスがどのデータをどの様に変
更したかというデータ更新の履歴を取っておき、その履
歴をもとにチェックポイント時のデータイメージを復旧
する方法。
【0007】しかしながら(1)の方法では、チェック
ポイントでのデータイメージを保存しなければならず、
データイメージ保存のためのメモリ領域を必要とし、又
コピーの為のオーバヘッドが大きくなってしまう。
【0008】また、(2)の方法では、プロセスのデー
タ更新の履歴を取る必要があり履歴のコピーのオーバヘ
ッドは元より、復旧時にはその履歴をもとにデータを復
旧するための手間がかかる。
【0009】
【発明が解決しようとする課題】このように従来の方法
では、データイメージの保存、プロセスのデータ更新履
歴の保存及びその履歴に基づくデータの復旧のオーバヘ
ッドが大きくなっていた。本発明は上記のような従来技
術の欠点を除去し、プロセス復旧のためのオーバヘッド
を小さくするプロセス復旧方式を提供することを目的と
するものである。
【0010】
【課題を解決するための手段】上記目的を達成するため
に本発明においては、MMU(メモリ・マネージメント
・ユニット)のライト・プロテクト機能によりプロセス
実行中の書き込みを検出し、書き込みが起こった部分の
コピーを作成し、そのコピーに対して更新を行う。ま
た、MMUのページテーブルを操作することにより、プ
ロセス実行中のチェックポイント通過時には前記コピー
をコピー元に反映し、プロセスが更新したデータを最も
最近のチェックポイント時に復旧する場合には前記コピ
ーを無効にすることによりプロセスの復旧を行う。
【0011】
【作用】このような方式においては、チェックポイント
でのファイルイメージ全体をコピーせず、更新された部
分のみをコピーする。また、復旧時には、プロセスの実
行の履歴は必要なく、コピーを無効にするのみでよいた
め、プロセス復旧のためのオーバヘッドを軽減できる。
【0012】
【実施例】以下本発明の一実施例を図面を参照して説明
する。
【0013】図1は本実施例の構成図を示したものであ
る。オペレーティングシステム(OS)101内には、書
き込みトラップ処理部102,チェックポイント処理部
103,プロセス復旧部104が存在する。オペレーテ
ィングシステム101はMMU105によって仮想記憶
を実現している。また、主記憶(MM)上106にはペー
ジテーブル107、コピー管理テーブル108がある。
【0014】図1の動作を図2のフローを用いて説明す
る。図2(a)は「書き込み」、(b)は「チェックポ
イント」、(c)は「プロセス復旧」のイベントに対す
る処理の流れを示している。「書き込み」のイベントが
起こった場合、予めMMU105によりライト・プロテ
クトをかけておきMMUに例外(割り込み)を発生させ
る(ステップ1)。その例外はMMU105からの書き
込みトラップにより書き込みトラップ処理部102に入
力する。書き込みトラップ処理部102では、コピー管
理テーブル108を調べコピーが存在するか否かを検出
する(ステップ2)。コピーが存在しなければ書き込み
が起こったページのコピーを作成し(ステップ3)、ペ
ージテーブル107を更新する(ステップ4)。この更
新はページテーブル107内の書き込みが起こったペー
ジを指している部分が、新たに作成したコピーを指すよ
うに変更するものであって、この後コピー管理テーブル
108は変更内容を保存し管理する(ステップ5)。こ
の後、ステップ6においてコピーに対し更新を行う。
【0015】次に「チェックポイント」のイベントにつ
いて説明する。チェックポイントの処理は、チェックポ
イント処理部103で行われる。この処理部103で
は、コピー管理テーブル108をクリアーすることによ
りコピーを有効にする。又「プロセス復旧」はプロセッ
サからの復旧命令をプロセス復旧部104に入力し、コ
ピー管理テーブル108の内容をページテーブル107
に書き戻すことによりコピーを無効化し、プロセスを最
も近いチェックポイントから再実行するようにする。
【0016】図3は仮想空間及び実空間(メインメモ
リ)との対応及びページテーブル,コピー管理テーブル
の内容を示す図である。今、実空間302上のページ番
号Raにマッピングされているページ番号Vaに対する
書き込みが起こり(仮想空間301上のa→a´)実空
間302上のページRaのコピーRa´を作成し更新し
た時点を考える。この場合、図3(b)に示すようにペ
ージテーブルのページ番号はVaからRa´に更新さ
れ、又コピー管理テーブルのページ番号はVaからRa
に変更されている。
【0017】以上の説明をあるプロセスPがファイルF
の内容を複数ページにわたって更新する様子について詳
細に説明することにする。図4はプロセスPの流れを示
し、チェックポイント1の通過後、チェックポイント2
の間でページaがa´にbがb´に、cがc´に更新さ
れたとする。
【0018】図5はプロセスpの実行の対象となるファ
イルFの仮想空間及び実空間のイメージを示したもので
ある。仮想空間上のページ番号Pa,Pb,Pcの内容
はそれぞれa,b,cで、実空間のページ番号Ra,R
b,Rcにマッピングされている。図6はファイルFの
ページテーブルの一部を示したものである。プロセスp
はチェックポイント1の後、ページ番号Paの内容aを
変更してa´にする。同様にページ番号Pbの内容bを
b´に、ページ番号Pcの内容cをc´に変更しチェッ
クポイント2に達するものとする。ファイルイメージは
コミットポイント1の後ライト・プロテクトされ、それ
以降に書き込みが起こると、それを処理するトラップ・
ルーチンにより書き込みが起こったページのコピーが作
成され、ページテーブルにつながれ更新される。また、
トラップ・ルーチンは更新されたページが更新前にどの
実空間にマッピングされていたかをコピー管理テーブル
に登録する。すなわち、チェックポイント2の直前で
は、ファイルイメージは図7のようになっている。ペー
ジテーブル,コピー管理テーブルはそれぞれ図8,図9
の様になっている。その後、チェックポイント2を通過
した時点で、コピー管理テーブルをクリアすることによ
り更新が有効になる。図10は、図4中の時刻tのファ
イルイメージを示したものである。図11は時刻tのペ
ージテーブルである。図12は時刻tのコピー管理テー
ブルである。この時刻においてデッドロックなどが起こ
った場合、コピー管理テーブルの内容をページテーブル
を書き戻す事により、ページテーブルは図6のようにな
り、コピーしたページRa´,Rb´は無効になる。そ
の後プロセスpの実行をチェックポイント1から再開す
ることにより復旧が可能になる。
【0019】
【発明の効果】以上述べたきたように、本発明によれ
ば、チェックポイントでのファイルイメージ全体(領域
全体)をコピーせず、更新された部分(ページ)のみを
コピーし、また復旧時には、プロセスの実行の履歴は必
要なく、コピーを無効にするのみでよいため、プロセス
復旧のためのオーバヘッドを軽減できる。
【図面の簡単な説明】
【図1】 本発明の一実施例を示す構成図。
【図2】 処理の流れを示すフロー図。
【図3】 書き込みが起こった場合の状態を示す図。
【図4】 プロセスpの実行の流れを示す図。
【図5】 ファイルFのファイルイメージを示す図。
【図6】 ファイルFのページテーブルの一部を示す
図。
【図7】 チェックポイント2の直前のファイルイメー
ジを示す図。
【図8】 チェックポイント2の直前のページテーブル
を示す図。
【図9】 チェックポイント2の直前のコピー管理テー
ブルを示す図。
【図10】 時刻tのファイルイメージを示す図。
【図11】 時刻tのページテーブルを示す図。
【図12】 時刻tのコピー管理テーブルを示す図。
【符号の説明】
101…オペレーティングシステム 102…書き込みトラップ処理ルーチン 103…チェックポイント処理部 104…プロセス復旧部 105…MMU 106…主記憶 107…ページテーブル 108…コピー管理テーブル

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 所定のプロセスを適宜チェックポイント
    を設定しながら実行し、プロセス実行中にプロセスの実
    行継続できなくなった場合に、プロセスの実行が継続で
    きなくなった時点から最も近いチェックポイントまでデ
    ータを復旧し、このチェックポイントからプロセスを再
    実行するプロセス復旧方式において、メモリ・マネージ
    メント・ユニットを用いプロセス実行中のメモリへの書
    き込みを検出し、書き込みが起こったページのコピーを
    作成し、このコピーに対して更新を行い、メモリ・マネ
    ージメント・ユニットの使用するページテーブルを操作
    して前記コピーをコピー元に対して有効または無効に
    し、プロセス実行中のチェックポイント時に前記コピー
    をコピー元に反映し、プロセスが更新したデータを最も
    近いチェックポイント時に復旧する場合は前記コピーを
    無効にすることを特徴とするプロセス復旧方式。
JP3266668A 1991-10-16 1991-10-16 プロセス復旧方式 Pending JPH05108388A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3266668A JPH05108388A (ja) 1991-10-16 1991-10-16 プロセス復旧方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3266668A JPH05108388A (ja) 1991-10-16 1991-10-16 プロセス復旧方式

Publications (1)

Publication Number Publication Date
JPH05108388A true JPH05108388A (ja) 1993-04-30

Family

ID=17434035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3266668A Pending JPH05108388A (ja) 1991-10-16 1991-10-16 プロセス復旧方式

Country Status (1)

Country Link
JP (1) JPH05108388A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249224A (ja) * 1995-03-10 1996-09-27 Toshiba Corp トランザクション管理装置
WO2014064547A1 (en) * 2012-10-24 2014-05-01 International Business Machines Corporation In-memory continuous data protection
JP2015064696A (ja) * 2013-09-24 2015-04-09 富士通株式会社 シンボリック実行方法、シンボリック実行装置、およびシンボリック実行プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249224A (ja) * 1995-03-10 1996-09-27 Toshiba Corp トランザクション管理装置
WO2014064547A1 (en) * 2012-10-24 2014-05-01 International Business Machines Corporation In-memory continuous data protection
US10055304B2 (en) 2012-10-24 2018-08-21 International Business Machines Corporation In-memory continuous data protection
JP2015064696A (ja) * 2013-09-24 2015-04-09 富士通株式会社 シンボリック実行方法、シンボリック実行装置、およびシンボリック実行プログラム

Similar Documents

Publication Publication Date Title
EP0900420B1 (en) Main memory system and checkpointing protocol for fault-tolerant computer system using a read buffer
Memaripour et al. Atomic in-place updates for non-volatile main memories with kamino-tx
JP2916420B2 (ja) チェックポイント処理加速装置およびデータ処理方法
EP0827079B1 (en) Checkpoint computer system
US5751939A (en) Main memory system and checkpointing protocol for fault-tolerant computer system using an exclusive-or memory
EP0566966B1 (en) Method and system for incremental backup copying of data
US6779087B2 (en) Method and apparatus for checkpointing to facilitate reliable execution
US7840768B2 (en) Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
US20130339569A1 (en) Storage System and Method for Operating Thereof
US6766428B2 (en) Method and apparatus for storing prior versions of modified values to facilitate reliable execution
US9087006B2 (en) Destaging cached data in multiple recurrences in a storage system
US8990159B2 (en) Systems and methods for durable database operations in a memory-mapped environment
JPH07200367A (ja) メモリ・スナップショット方法及びメモリ・スナップショット機能を持つ情報処理装置
JPH05210555A (ja) ゼロ時間データ・バックアップ・コピーの方法及び装置
Ng et al. The design and verification of the Rio file cache
JP4095139B2 (ja) コンピュータシステムおよびファイル管理方法
Brown Asynchronous multicaches
JPH05108388A (ja) プロセス復旧方式
KR100365891B1 (ko) 주기억장치 상주형 데이터베이스 시스템에서 로그 처리를하지 않는 백업/회복 장치 및 그 방법
JP3070453B2 (ja) 計算機システムのメモリ障害回復方法および回復システム
JPH03265951A (ja) 故障回復型計算機
JP2001188690A (ja) コンピュータシステム及びチェックポイント情報保存方法
USRE45632E1 (en) Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
JPH05165663A (ja) データ処理装置
Schagaev et al. Recovery Preparation