JPH09171441A - 二重化記憶装置の記憶一致方法および装置 - Google Patents

二重化記憶装置の記憶一致方法および装置

Info

Publication number
JPH09171441A
JPH09171441A JP7331356A JP33135695A JPH09171441A JP H09171441 A JPH09171441 A JP H09171441A JP 7331356 A JP7331356 A JP 7331356A JP 33135695 A JP33135695 A JP 33135695A JP H09171441 A JPH09171441 A JP H09171441A
Authority
JP
Japan
Prior art keywords
storage device
command
standby
active
execution result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7331356A
Other languages
English (en)
Inventor
Yuzuru Maya
讓 真矢
Soichi Isono
聡一 磯野
Akira Otsuji
彰 大辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7331356A priority Critical patent/JPH09171441A/ja
Priority to US08/766,455 priority patent/US5845328A/en
Publication of JPH09171441A publication Critical patent/JPH09171441A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

(57)【要約】 【課題】 二重化記憶装置をホットスタンバイ方式の構
成にした場合に、現用の記憶装置のオーバヘッドを小さ
くすること、また複数の処理装置と現用の記憶装置およ
び待機の記憶装置とをチャンネル装置によって接続した
構成であっても、現用の記憶装置と待機の記憶装置の記
憶内容を一致させること。 【解決手段】 処理装置からは現用の記憶装置にのみコ
マンドを発行し、待機の記憶装置に対しては現用の記憶
装置からコマンドを転送させ、それぞれの記憶装置にお
いて受信コマンドに対する処理を実行させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一方を現用の記憶
装置、他方を待機の記憶装置とした二重化記憶一致方法
および装置に係り、特に、現用の記憶装置が処理装置か
ら受信したコマンドを待機の記憶装置に転送することに
より、コマンドの受信順序を保証し、かつ大量のチェッ
クポイントデータの転送を不要とする二重化記憶一致方
法および装置に関するものである。
【0002】
【従来の技術】従来において、複数の処理装置(中央処
理複合体)に対し二重化記憶装置を接続して成る計算機
システムとして、二重化記憶装置のうち1つに障害が発
生した場合には、その障害を複数の処理装置に意識させ
て他方の記憶装置に切り替え、並列トランザクションサ
ーバの持つリカバリ機能を利用して障害を回復するよう
にしたものがある。
【0003】
【発明が解決しようとする課題】しかしながら、上記の
ような二重化記憶装置をホットスタンバイ方式の構成に
した場合、処理装置の数の増加や処理能力の向上によ
り、現用系から待機系に転送するチェックポイントデー
タ量が多くなり、これを転送するための現用の記憶装置
のオーバヘッドが大きくなるという問題が発生する。
【0004】すなわち、一般的なホットスタンバイ方式
では、現用系の処理装置は一定の時間間隔でチェックポ
イントデータ(チェックポイントダンプ)を待機系の処
理装置に送信する。そして、現用系で障害が発生する
と、待機系の処理装置は現用系から受信したチェックポ
イントデータにより現用系の処理を引き継ぐようにして
いる。従って、この方式を上記二重化記憶装置を持つ計
算機システムに適用した場合、処理装置の数の増加や処
理能力の向上により、現用系から待機系に転送するチェ
ックポイントデータ量が多くなり、これを転送するため
の現用の記憶装置のオーバヘッドが大きくなるという問
題が発生する。
【0005】一方、チェックポイントデータを転送しな
いで、現用系と待機系がコマンド(電文)を同時に受信
することを保証することにより、記憶内容を一致させる
ホットスタンバイ方式がある。この方式にあっては、現
用系と待機系とをそれぞれLANあるいは回線切替装置
により接続し、コマンドの送信側がLANあるいは回線
切替装置を占有することにより、両系におけるコマンド
の受信順序が一致するようにコマンドを送信する。
【0006】ところが、複数の処理装置と現用の記憶装
置および待機の記憶装置とをチャンネル装置によって接
続した場合、チャンネル装置を通じて複数の処理装置が
別々に現用および待機の記憶装置にコマンドを発行する
ことが可能となり、現用の記憶装置と待機の記憶装置の
コマンドの受信順序が一致しなくなり、その結果、現用
の記憶装置と待機の記憶装置の記憶内容が一致しなくな
るという問題が発生する。
【0007】本発明の目的は、二重化記憶装置をホット
スタンバイ方式の構成にした場合に、現用の記憶装置の
オーバヘッドを小さくすることができる二重化記憶一致
方法および装置を提供することにある。
【0008】同時に、複数の処理装置と現用の記憶装置
および待機の記憶装置とをチャンネル装置によって接続
した構成であっても、現用の記憶装置と待機の記憶装置
の記憶内容を一致させることができる二重化記憶一致方
法および装置を提供することにある。
【0009】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、処理装置からは現用の記憶装置にのみコ
マンドを発行し、待機の記憶装置に対しては現用の記憶
装置からコマンドを転送させ、それぞれの記憶装置にお
いて受信コマンドに対する処理を実行させるようにした
ことを主要な特徴とするものである。
【0010】このような手段によれば、処理装置が記憶
装置をアクセスする場合、現用の記憶装置にみにコマン
ドを発行する。現用の記憶装置は、処理装置からコマン
ドを受信すると、そのコマンドを待機の記憶装置に転送
すると同時に、その受信コマンドに対する処理を実行
し、処理装置に処理結果を戻す。
【0011】一方、待機の記憶装置は、現用の記憶装置
から受信したコマンドに対する処理を実行する。
【0012】従って、現用の記憶装置と待機の記憶装置
におけるコマンドの受信順序は常に一致し、これら記憶
装置と処理装置とをチャンネル装置によって接続したと
しても、両者の記憶内容を一致させることができる。
【0013】また、現用の記憶装置は、従来のチェック
ポイントデータに代えて、該チェックポイントデータよ
りもデータ量の少ないコマンドを待機の記憶装置に送信
することになるので、現用の記憶装置のオーバヘッドを
小さくすることができる。
【0014】ここで、記憶装置には、データキャッシュ
機能を提供するキャッシュ構造、メッセージ通信機能お
よびデータのロック機能を提供するリスト構造がある。
【0015】このような構造を有する処理装置が記憶装
置をアクセスする場合、現用の記憶装置は、処理装置か
らコマンドを受信すると、そのコマンドに対する処理を
実行し、処理装置に処理結果を戻す。その際、現用の記
憶装置は受信したコマンドを解析し、受信コマンドがキ
ャッシュ構造あるいはリスト構造を更新するコマンドな
らば、これを待機の記憶装置に送信する。待機の記憶装
置は、受信したコマンドに対する処理を実行し、応答を
現用の記憶装置に戻す。最後に、現用の記憶装置は処理
装置に応答を戻す。
【0016】しかし、受信したコマンドが上記構造を更
新しないコマンドならば、現用の記憶装置は受信コマン
ドを待機の記憶装置に送信しない。現用の記憶装置のみ
コマンドに対する処理を実行し、処理装置に応答を戻
す。
【0017】この結果、現用の記憶装置と待機の記憶装
置は、同一のコマンドを同一の順序で実行することによ
り、現用の記憶装置と待機の記憶装置の内容が一致する
ようになる。
【0018】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。
【0019】なお、実施例を説明するための全図におい
て、同一機能を有するものは同一符号を付け、その繰り
返しの説明は省略する。
【0020】図1は、本発明を適用した並列計算機シス
テムの実施形態を示すシステム構成図であり、現用の記
憶装置10、待機の記憶装置11および3台の処理装置
20〜22から構成されている。
【0021】記憶装置10、11と処理装置20〜22
のハードウェア構成は同一とし、それぞれプロセッサ1
0−1〜22−1、メモリ10−2〜22−2、IOP
10−3〜22−3、システム監視装置10−4〜22
−4と入出力チャネル10−6〜22−6とから構成さ
れている。
【0022】各処理装置20〜22は、入出力チャネル
20−6〜22−6により、2台の記憶装置10、11
と接続されている。換言すれば、二重化された2台の記
憶装置10、11は、処理装置20〜22のいずれかか
らでもアクセス可能になっている。
【0023】2台の記憶装置10,11のシステム監視
装置10−4〜11−4は、制御用通信パス3により接
続され、この制御用通信パス3によって相手の記憶装置
をリセットするためのメッセージを通信するようになっ
ている。
【0024】処理装置20〜22は、ディスク4を共有
する。
【0025】記憶装置10、11には、処理装置20〜
22のデータキャッシュ機能を提供するキャッシュ構
造、処理装置20〜22間のメッセージ通信機能とデー
タの排他制御機能を提供するリスト構造がある。この構
造については、図3および図4で後述する。
【0026】図2は、記憶装置10、11のソフトウェ
ア構成を示す図であり、現用の記憶装置10のソフトウ
ェアは、スーパバイザ部10−10、コマンド処理部1
0−11および一致制御処理部10−12とを備てい
る。この他に、受信したコマンドを格納するバッファ1
0−13とコマンドの処理に対する処理を監視するタイ
マのタイムアウト時に使用する再開テーブル10−14
を備えている。
【0027】コマンド処理部10−11は、コマンドを
実行するものであり、一致制御処理部10−12は、コ
マンドの実行結果が一致したかチェックするものであ
る。
【0028】待機の記憶装置11のソフトウェアは、現
用の記憶装置10のソフトウェアと同一構成であり、ス
ーパバイザ部11−10、コマンド処理部11−11お
よび一致制御処理部11−12を備え、さらに、受信し
たコマンドを格納するバッファ11−13とタイムアウ
ト時に使用する再開テーブル11−14を備えている。
【0029】この構成における動作の概要は次の通りで
ある。
【0030】処理装置20〜22が現用および待機の記
憶装置10,11をアクセスする場合には、処理装置2
0〜22は該当するコマンドを現用の記憶装置10に送
信する(処理50)。
【0031】現用の記憶装置10は、処理装置20〜2
2のいずれかからコマンドを受信すると、受信したコマ
ンドに対する処理を実行することにより、記憶装置10
内のキャッシュ構造30−0またはリスト構造40−0
をアクセスする(処理51)。
【0032】更に、このコマンドが記憶装置10,11
の内容(キャッシュ構造またはリスト構造)を更新する
コマンドならば、現用の記憶装置10はこのコマンドを
待機の記憶装置11に送信する(処理52)。このコマ
ンドは、記憶装置10と11との間の通信パス5を経由
して送信される。
【0033】待機の記憶装置11は、受信したコマンド
に対する処理、すなわちキャッシュ構造30−1または
リスト構造40−1に対する更新処理を実行し(処理5
3)、処理結果の応答メッセージを現用の処理装置10
に返信する(処理54)。この応答メッセージは、記憶
装置10と11との間の通信パス5を経由して送信され
る。
【0034】現用の記憶装置10の一致制御部10−1
2は、両記憶装置の実行結果が一致したか否かをチェッ
クし(処理55)、その結果を処理装置20〜22に戻
す(処理56)。
【0035】現用の記憶装置10は、処理装置20〜2
2から受信したコマンドがキャッシュ構造またはリスト
構造の更新コマンドでなければ、このコマンドは待機の
記憶装置11に送信しない。
【0036】従って、処理装置20〜22から受信した
コマンドがキャッシュ構造またはリスト構造の更新コマ
ンドでなければ、現用の記憶装置10のみがそのコマン
ドに対する処理を実行し、処理装置20〜22に対し読
み出したデータを戻す(処理57)。
【0037】現用の記憶装置10のキャッシュ構造30
−0やリスト構造40−0で状態遷移が発生すると(処
理60)、現用の記憶装置10は処理装置20〜22に
対して状態遷移を通知するために、状態遷移コマンドを
発行する(処理61)。
【0038】一方、待機の処理装置11のキャッシュ構
造30−1やリスト構造40−1で状態遷移が発生する
と(処理62)、待機の処理装置11は状態遷移コマン
ドを現用の記憶装置10に発行する(処理63)。この
状態遷移コマンドは、記憶装置10と11との間の通信
パス5を経由して送信される。
【0039】そして、現用の記憶装置10は、一致制御
処理部10−12で一定時間内に状態遷移コマンドが一
致したか判定する(処理64)。
【0040】図3は、キャッシュ構造30−0の詳細を
示す図である。
【0041】キャッシュ構造は、特開平6−83706
号の「シスプレックス共用データコヒーレンシを維持す
る方法」に記載されているように、キャッシュ構造制御
情報30−3、ローカルキャッシュ構造制御情報30−
4、キャストアウトクラス制御情報30−5、ディレク
トリ項目30−7およびキャッシュ構造データ30−8
から構成されている。
【0042】キャッシュ構造制御情報30−3は、構造
サイズ、キャストアウトクラス数などキャッシュ構造に
関する制御情報である。ローカルキャッシュ制御情報3
0−4は、ローカルキャッシュ(処理装置にあるキャッ
シュ)がSESキャッシュ(記憶装置にあるキャッシ
ュ)に割り当てられているときに有効な情報である。
【0043】キャストアウトクラス制御情報30−5
は、変更済みのデータをディスク4に格納するキャスト
アウト処理のための情報である。
【0044】ディレクトリ項目30−7には、キャッシ
ュの名前30−10とデータ域ポインタ30−11があ
り、キャッシュの名前30−10でデータを識別し、デ
ータ域ポインタ30−11でキャッシュ構造データ30
−8の格納場所を特定するようになっている。
【0045】ディレクトリ項目30−7の数には上限が
あり、これが上限に達すると、メモリ不足というメッセ
ージを処理装置20〜22に通知する。
【0046】図4は、リスト構造の詳細を示す図であ
る。
【0047】リスト構造は、特開平6−44195号の
「シスプレックス共用データコヒーレンシを維持する方
法」に記載されているように、リスト構造制御情報40
−3、ユーザ制御情報40−4、ロックテーブル40−
5、リスト制御情報40−6、リスト項目制御情報40
−10、リスト構造データ40−18および付属リスト
構造データ40−19で構成されている。リスト項目制
御情報40−10には、ポインタによって次のリスト項
目制御情報40−20が関連付けられている。
【0048】リスト構造制御情報40−3は、構造の大
きさ、リストの数などリスト構造に関する制御情報であ
る。ユーザ制御情報40−4は、ユーザが定義して利用
する情報である。ロックテーブル40−5は、リスト項
目制御情報40−10の読み出しや書き込みの排他制御
を行うテーブルである。
【0049】リスト制御情報40−6は、リスト項目の
カウントや最大値を示す情報である。リスト項目制御情
報40−10,40−20は、リスト構造データ40−
18,40−28や付属リスト構造データ40−19,
40−29を識別するリスト項目識別子40−11,4
0−21、データ40−18,40−58へのポインタ
(データ域ポインタ)40−12,40−22、付属デ
ータ40−19,40−29へのポインタ(付属データ
域ポインタ)40−13,40−23および次リスト項
目制御情報へのポインタ(次リスト項目制御ポインタ)
40−14,40−24を備えている。
【0050】リスト項目制御情報40−10,40−2
0の数には上限があり、これが上限に達すると、メモリ
不足というメッセージを処理装置20〜22に通知す
る。
【0051】図5は、コマンドの実行結果を示す図であ
る。
【0052】コマンドの実行結果には、正常終了80、
タイムアウト81、メモリ不足82および構造の障害8
3という4つの分類がある。
【0053】正常終了80とは、コマンドが正しく実行
された場合である。これは記憶装置状態は正常であり、
現用の記憶装置10のコマンドの実行結果と待機の記憶
装置11のコマンドの実行結果は必ず一致する。
【0054】タイムアウト81とは、記憶装置10,1
1の状態は実行処理量が多く、あるいはI/O待ち時間
が長いため、記憶装置10,11の状態は正常である
が、一定時間以内に応答を返すことを指し、タイムアウ
トになった場合は、コマンドの再開箇所と共に処理装置
20〜22に返信する。現用の記憶装置10と待機の記
憶装置11のコマンドの実行結果は、再開箇所を含める
と、一致するとは限らない。また、一方の記憶装置1
0、11は、正常終了するかも知れない。
【0055】メモリ不足82とは、書き込みコマンドの
場合には、ディレクトリ項目情報30−7あるいはリス
ト項目制御情報40−10,40−20を書き込む際、
空きの項目がないため、書き込み処理が実行できなかっ
た場合のことである。現用の記憶装置10と待機の記憶
装置11のコマンドの実行結果は必ず一致する。
【0056】障害83とは、記憶装置10、11が自身
のメモリ10−2、11−2をアクセスしたが、アクセ
スできなかった場合のことである。
【0057】図6および図7は、現用の記憶装置10の
受信コマンドに対する処理手順を示すフローチャートで
ある。
【0058】現用の記憶装置10は、処理装置20ヵ〜
22からコマンドを受信したならば、受信したコマンド
に対する処理を実行する(ステップ100)。
【0059】次に、現用の記憶装置10は、受信したコ
マンドを待機の記憶装置11に送信する(ステップ10
1)。そして、現用の記憶装置10のコマンドの実行結
果を判定する(ステップ102)。
【0060】現用の記憶装置10の実行結果が正常終了
またはメモリ不足の場合、現用の記憶装置10は待機の
記憶装置11のコマンドの実行結果を待たないで、コマ
ンドの実行結果を処理装置20〜22に送信する(ステ
ップ103)。そして、待機の記憶装置11のコマンド
の実行結果を待つ(ステップ104)。
【0061】現用の記憶装置10のコマンドの実行結果
がメモリ不足の場合(ステップ105)、現用の記憶装
置10の実行結果と待機の記憶装置の実行結果が共にメ
モリ不足となっているかどうかを判定し(ステップ11
2)、共にメモリ不足となっている場合は、現用の記憶
装置10はバッファ10−13にコマンド格納されてい
るかチェックする(ステップ120)。そして、バッフ
ァ10−13にコマンドがあれば、ステップ100に戻
り、次ののコマンド処理を継続する。バッファ10−1
3にコマンドがなければ、コマンド受付待ち状態にする
(ステップ122)。
【0062】待機の記憶装置11のコマンドの実行結果
がメモリ不足でない場合には、現用の記憶装置10のコ
マンドの実行結果と待機の記憶装置11のコマンドの実
行結果が一致していないので、待機の記憶装置11で障
害が発生したと判定し、待機の記憶装置11をリセット
する(ステップ114)。
【0063】現用の記憶装置10のコマンドの実行結果
が正常終了であった場合(ステップ105)、待機の記
憶装置11のコマンドの実行結果が正常終了かどうかを
判定する(ステップ106)。
【0064】待機の記憶装置11のコマンドの実行結果
が正常終了であった場合には、次のコマンドの処理(ス
テップ120〜122)を実行する。
【0065】待機の記憶装置11のコマンドの実行結果
が正常終了でなかった場合は、待機の記憶装置11のコ
マンドの実行結果がタイムアウトかどうかを判定する
(ステップ107)。
【0066】待機の記憶装置のコマンドの実行結果がタ
イムアウトであった場合には、待機の記憶装置11は最
後までコマンドを実行する(ステップ111)。待機の
記憶装置11のコマンドの実行結果がメモリ不足あるい
は障害の場合、待機の記憶装置11をリセットする(ス
テップ110)。
【0067】一方、ステップ102において、現用の記
憶装置10のコマンドの実行結果がタイムアウトであっ
た場合、現用の記憶装置10は待機の記憶装置11の実
行結果を待つ(ステップ130)。そして、待機の記憶
装置11の実行結果を判定する(ステップ131)。そ
の結果、待機の記憶装置11の実行結果が正常終了ある
いはタイムアウトであった場合、再開テーブル10−1
4に再開箇所を設定する(ステップ132)。そして、
現用の記憶装置10は自身のコマンドの実行結果を処理
装置20〜22に送信する(ステップ133)。
【0068】ステップ131において、待機の記憶装置
11の実行結果がメモリ不足あるいは障害であった場
合、待機の記憶装置11に異常が発生したと判定し、待
機の記憶装置11をリセットする(ステップ134)。
そして、次コマンドの処理(ステップ120〜122)
を実行する。
【0069】ステップ102において、現用の記憶装置
10の実行結果が障害であった場合、現用の記憶装置1
0は待機の記憶装置11の実行結果を待つ(ステップ1
40)。そして、現用の記憶装置10は待機の記憶装置
11のコマンドの実行結果を処理装置20〜22に送信
する(ステップ141)。そして、待機の記憶装置11
は現用の記憶装置10をリセットし、待機の記憶装置1
1を現用に切り替える(ステップ142)。そして、新
たに現用となった記憶装置10が次コマンドの処理(ス
テップ120〜122)を実行する。
【0070】ここで、タイムアウトが発生した場合の処
理について詳細に記述する。
【0071】図8は、タイムアウトの処理を示す説明図
である。
【0072】ここでは、現用の記憶装置10が2項目を
処理した後、タイムアウト81になったが、待機の記憶
装置11は3項目を処理した後、タイムアウト81にな
った場合を示している。
【0073】図9は、図8のようなタイムアウト事例に
おける再開テーブル10−14の内容を示す説明図であ
る。これは、現用の記憶装置10のコマンドの実行結果
がタイムアウトになった場合に使用するテーブルであ
る。
【0074】この再開テーブル10−14は、現用の記
憶装置10が待機の記憶装置11の再開箇所を管理する
ためのテーブルである。再開テーブル10−14には、
コマンドの実行結果がタイムアウト81になった場合
に、該当するコマンドの識別子、および現用と待機の記
憶装置10、11の再開箇所を格納する。
【0075】図8の例の場合、コマンドの識別子は“W
RITE1”,現用の記憶装置の再開箇所は“3”,待
機の記憶装置の再開箇所は“4”とする。
【0076】図10は、コマンドの応答情報を示す説明
図である。
【0077】タイムアウトの場合の応答情報は、コマン
ド識別子90、応答情報91および再開箇所92から構
成される。図8の例の場合、コマンド識別子90には実
行中のコマンドを示す識別子“WRITE1”を、応答
情報91には“タイムアウト”を、再開箇所92は現用
の記憶装置は“3”、待機の記憶装置は“4”を設定す
る。
【0078】図11はコマンドのリトライを示す説明図
である。
【0079】現用の記憶装置10でタイムアウトが発生
すると、処理装置20〜22はタイムアウトの発生した
コマンドを再送しなければならない。処理装置20〜2
2はコマンドに再開箇所を設定し、現用の記憶装置10
にコマンドを発行する。
【0080】現用の記憶装置10では、最初に受信した
時に、すべての書き込みデータをバッファ10−13に
格納しておく。
【0081】その後、現用の記憶装置10は、再開テー
ブル10−14を参照することにより、再開箇所92で
指定された部分から処理を継続する。更に、現用の記憶
装置10は、待機の記憶装置11にコマンドを転送する
が、この際、複数の書き込みのデータを送信する場合に
は、すべての書き込みデータを送信する。
【0082】待機の記憶装置10は、すべての書き込み
データをバッファ10−13に格納する。
【0083】そして、待機の記憶装置10は、リトライ
コマンド290を現用の記憶装置10から受信すると、
再開テーブル11−14で指定された再開箇所から再開
する。その処理が終了すると、応答メッセージ291を
現用の記憶装置10に戻す。
【0084】このようにして、現用の記憶装置10は処
理装置20〜22からコマンドを受信し、その受信コマ
ンドを待機の記憶装置11に転送することによって、待
機の記憶装置11と記憶内容を一致させることが可能と
なる。
【0085】次に、記憶装置10、11でキャッシュ構
造またはリスト構造の状態遷移が発生すると、これを処
理装置20〜22に通知しなければならない。この状態
遷移コマンドについて説明する。
【0086】図12は、状態遷移コマンドの一致制御処
理を示す図である。
【0087】状態遷移コマンドは、リスト構造40(4
0−0,40−1)あるいはキャッシュ構造30(30
−0,30−1)で状態遷移が発生した場合に、これを
処理装置20〜22に通知するコマンドである。
【0088】現用と待機の記憶装置10、11は、受信
したコマンドの書き込みや削除など項目の操作時にその
実行時をイベントとして発生する。
【0089】状態遷移コマンドは、現用の記憶装置10
と待機の記憶装置11で同一イベント時に発生するた
め、状態遷移コマンドが同期して発生するかチェックす
ることにより、現用と待機の記憶装置10、11が正常
に実行しているかチェックする。
【0090】このように、一方の記憶装置のみで状態遷
移が発生した場合には、状態遷移が発生しなかった記憶
装置は、障害が発生したとみなし、リセットする。以下
にこの処理手順を説明する。
【0091】現用の記憶装置10で状態遷移が発生する
と(ステップ300)、現用の記憶装置10は処理装置
20〜22に対して状態遷移コマンドを発行する(ステ
ップ301)。そして、一定時間、同一の状態遷移コマ
ンドを待機の記憶装置11から受信するかチェックする
(ステップ302)。
【0092】現用の記憶装置10がこれを受信すると、
待機の記憶装置11は正常と判定するが、一定時間経過
しても受信しない場合は(ステップ303)、待機の記
憶装置11をリセットする(ステップ304)。
【0093】この結果、現用の記憶装置10と待機の記
憶装置11は、それぞれ受信したコマンドを実行するこ
とにより、メモリの内容を一致することが可能となる。
【0094】以上、本発明者によってなされた発明を、
前記実施例に基づき具体的に説明したが、本発明は、前
記実施例に限定されるものではなく、その要旨を逸脱し
ない範囲において種々変更可能であることは勿論であ
る。
【0095】
【発明の効果】以上説明したように、本発明によれば、
処理装置からは現用の記憶装置にのみコマンドを発行
し、待機の記憶装置に対しては現用の記憶装置からコマ
ンドを転送させ、それぞれの記憶装置において受信コマ
ンドに対する処理を実行させるようにしたため、二重化
記憶装置をホットスタンバイ方式の構成にした場合に、
現用の記憶装置のオーバヘッドを小さくすることができ
る。
【0096】同時に、複数の処理装置と現用の記憶装置
および待機の記憶装置とをチャンネル装置によって接続
した構成であっても、現用の記憶装置と待機の記憶装置
の記憶内容を一致させることができる。
【図面の簡単な説明】
【図1】本発明を適用した並列計算機システムの実施の
形態を示すシステム構成図である。
【図2】二重化記憶装置のソフトウェア構成を示す図で
ある。
【図3】現用および待機の記憶装置におけるキャッシュ
構造を示す図である。
【図4】現用および待機の記憶装置におけるリスト構造
を示す図である。
【図5】現用および待機の記憶装置に対するコマンドの
実行結果の分類を示す図である。
【図6】処理装置から受信したコマンドに対する処理手
順を示すフローチャートである。
【図7】図6の続きを示すフローチャートである。
【図8】タイムアウト時の処理を示す説明図である。
【図9】タイムアウト時の再開テーブルの内容を示す説
明図である。
【図10】タイムアウト時の応答情報を示す説明図であ
る。
【図11】コマンドのリトライを実行する場合の説明図
である。
【図12】状態遷移コマンドの一致制御処理を示すフロ
ーチャートである。
【符号の説明】
10…現用の記憶装置、10−1,11−1,20−
1,20−2,20−3…プロセッサ、10−2,11
−2,20−2,21−2,22−2…メモリ、10−
4,11−4,20−4,21−4,22−4…システ
ム監視装置、10−6,11−6,20−6,21−
6,22−6…入出力チャネル、10−11,11−1
1…コマンド処理部、10−12,11−12…一致制
御処理部、10−14,11−14…再開テーブル、1
1…待機の記憶装置、20〜22…処理装置。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 一方を現用の記憶装置とし、他方を待機
    の記憶装置とするプロセッサを備えた複数の記憶装置か
    ら成り、処理装置が発行するコマンドにより前記複数の
    記憶装置をアクセスする二重化記憶装置の記憶一致方法
    であって、 処理装置から発行するコマンドは現用の記憶装置にのみ
    送信し、待機の記憶装置に対しては現用の記憶装置が受
    信したコマンドを転送し、現用と待機の記憶装置のそれ
    ぞれに受信したコマンドに対する処理を実行させること
    を特徴とする二重化記憶装置の記憶一致方法。
  2. 【請求項2】 現用の記憶装置は、現用の記憶装置の内
    容を更新するコマンドのみを待機の記憶装置に送信する
    ことを特徴とする請求項1記載の二重化記憶装置の記憶
    一致方法。
  3. 【請求項3】 現用の記憶装置のコマンドの実行結果が
    正常終了の場合、現用の記憶装置は待機の記憶装置の実
    行結果と比較せずに現用の記憶装置のコマンド実行結果
    を処理装置に送信し、さらに、現用の記憶装置は、待機
    の記憶装置からコマンド実行結果を参照し、その実行結
    果がメモリ不足あるいは障害の場合は、待機の記憶装置
    をリセットすることを特徴とする請求項1または2記載
    の二重化記憶装置の記憶一致方法。
  4. 【請求項4】 現用の記憶装置のコマンドの実行結果が
    正常終了の場合、現用の記憶装置は待機の記憶装置の実
    行結果と比較せずに現用の記憶装置のコマンド実行結果
    を処理装置に送信し、さらに、現用の記憶装置は、待機
    の記憶装置からコマンド実行結果を参照し、その実行結
    果がタイムアウトの場合は、待機の記憶装置におけるコ
    マンドに対する処理を最後まで実行させることを特徴と
    する請求項1または2記載の二重化記憶装置の記憶一致
    方法。
  5. 【請求項5】 前記処理装置は複数の処理装置で構成さ
    れ、前記現用の記憶装置と待機の記憶装置とはチャネル
    装置によって接続されていることを特徴とする請求項1
    ないし4記載のいずれかの二重化記憶装置の記憶一致方
    法。
  6. 【請求項6】 一方を現用の記憶装置とし、他方を待機
    の記憶装置とするプロセッサを備えた複数の記憶装置か
    ら成り、処理装置の発行するコマンドにより前記複数の
    記憶装置をアクセスする二重化記憶装置であって、 現用の記憶装置は処理装置から発行されたコマンドを受
    信し、その受信したコマンドに対する処理を実行する手
    段と、受信したコマンドを待機の記憶装置に対して転送
    する手段とを備え、待機の記憶装置は現用の記憶装置か
    ら受信したコマンドに対する処理を実行する手段を備え
    ることを特徴とする二重化記憶装置。
  7. 【請求項7】 現用の記憶装置における前記受信したコ
    マンドを待機の記憶装置に対して転送する手段は、現用
    の記憶装置の内容を更新するコマンドのみを待機の記憶
    装置に転送することを特徴とする請求項6記載の二重化
    記憶装置。
  8. 【請求項8】 現用の記憶装置における前記受信したコ
    マンドを待機の記憶装置に対して転送する手段は、現用
    の記憶装置のコマンドの実行結果が正常終了の場合、待
    機の記憶装置の実行結果と比較せずに現用の記憶装置の
    コマンド実行結果を処理装置に送信し、さらに、現用の
    記憶装置は、待機の記憶装置からコマンド実行結果を参
    照し、その実行結果がメモリ不足あるいは障害の場合
    は、待機の記憶装置をリセットする手段を備えることを
    特徴とする請求項6または7記載の二重化記憶装置。
  9. 【請求項9】 現用の記憶装置における前記受信したコ
    マンドを待機の記憶装置に対して転送する手段は、現用
    の記憶装置のコマンドの実行結果が正常終了の場合、待
    機の記憶装置の実行結果と比較せずに現用の記憶装置の
    コマンド実行結果を処理装置に送信し、さらに、現用の
    記憶装置は、待機の記憶装置からコマンド実行結果を参
    照し、その実行結果がタイムアウトの場合は、待機の記
    憶装置におけるコマンドに対する処理を最後まで実行さ
    せる手段を備えることを特徴とする請求項6または7記
    載の二重化記憶装置。
  10. 【請求項10】 前記処理装置は複数の処理装置で構成
    され、前記現用の記憶装置と待機の記憶装置とはチャネ
    ル装置によって接続されていることを特徴とする請求項
    6ないし9記載のいずれかの二重化記憶装置。
JP7331356A 1995-12-20 1995-12-20 二重化記憶装置の記憶一致方法および装置 Pending JPH09171441A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7331356A JPH09171441A (ja) 1995-12-20 1995-12-20 二重化記憶装置の記憶一致方法および装置
US08/766,455 US5845328A (en) 1995-12-20 1996-12-12 Method for ensuring data coherency for redundat storage by transferring copies of access requests from on-line storage to back-up storage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7331356A JPH09171441A (ja) 1995-12-20 1995-12-20 二重化記憶装置の記憶一致方法および装置

Publications (1)

Publication Number Publication Date
JPH09171441A true JPH09171441A (ja) 1997-06-30

Family

ID=18242773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7331356A Pending JPH09171441A (ja) 1995-12-20 1995-12-20 二重化記憶装置の記憶一致方法および装置

Country Status (2)

Country Link
US (1) US5845328A (ja)
JP (1) JPH09171441A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11265320A (ja) * 1998-03-16 1999-09-28 Fujitsu Ltd リモート転送機能を有する外部記憶制御装置
US6393538B2 (en) 1998-09-18 2002-05-21 Fujitsu Limited Reproducing updates in a first file storage unit to a second file storage unit by transferring update information from the first unit to the second unit
EP0939371A3 (en) * 1998-02-26 2006-08-02 Hitachi, Ltd. Memory subsystem and method of reorganising multiplexed data

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7114049B2 (en) * 1997-01-08 2006-09-26 Hitachi, Ltd. Adaptive remote copy in a heterogeneous environment
JP3414218B2 (ja) * 1997-09-12 2003-06-09 株式会社日立製作所 記憶制御装置
US6988176B2 (en) * 1997-09-12 2006-01-17 Hitachi, Ltd. Method and apparatus for data duplexing in storage unit system
US6233696B1 (en) * 1997-12-31 2001-05-15 Emc Corporation Data verification and repair in redundant storage systems
US6167485A (en) 1997-12-31 2000-12-26 Emc Corporation On-line data verification and repair in redundant storage systems
US6195761B1 (en) 1997-12-31 2001-02-27 Emc Corporation Method and apparatus for identifying and repairing mismatched data
JP4689137B2 (ja) 2001-08-08 2011-05-25 株式会社日立製作所 リモートコピー制御方法、及びストレージシステム
US8024761B1 (en) * 1999-04-01 2011-09-20 Cox Communications, Inc. Method and apparatus of load sharing and fault tolerance in an interactive video distribution system
JP2000305856A (ja) * 1999-04-26 2000-11-02 Hitachi Ltd ディスクサブシステム及びこれらの統合システム
US7167962B2 (en) 1999-08-19 2007-01-23 Hitachi, Ltd. Remote copy for a storage controller with reduced data size
JP4434407B2 (ja) * 2000-01-28 2010-03-17 株式会社日立製作所 サブシステム及びこれらの統合システム
JP4044717B2 (ja) * 2000-03-31 2008-02-06 株式会社日立製作所 記憶サブシステムのデータ二重化方法及びデータ二重化システム
US6732193B1 (en) 2000-06-09 2004-05-04 International Business Machines Corporation Method, system, and program for determining a number of write operations to execute
US6526419B1 (en) 2000-06-09 2003-02-25 International Business Machines Corporation Method, system, and program for remote copy in an open systems environment
US7404005B1 (en) 2000-06-09 2008-07-22 International Business Machines Corporation Method, system, and program for selecting one of multiple paths to communicate with a device
US7194590B2 (en) * 2001-02-28 2007-03-20 Hitachi, Ltd. Three data center adaptive remote copy
US7213114B2 (en) * 2001-05-10 2007-05-01 Hitachi, Ltd. Remote copy for a storage controller in a heterogeneous environment
US7143252B2 (en) * 2001-05-10 2006-11-28 Hitachi, Ltd. Storage apparatus system and method of data backup
JP2003076592A (ja) * 2001-09-04 2003-03-14 Hitachi Ltd データ格納システム
US6954877B2 (en) * 2001-11-29 2005-10-11 Agami Systems, Inc. Fault tolerance using logical checkpointing in computing systems
US7237141B2 (en) * 2003-06-19 2007-06-26 Lsi Corporation Method for recovering data from a redundant storage object
JP2016057876A (ja) * 2014-09-10 2016-04-21 富士通株式会社 情報処理装置、入出力制御プログラム、及び入出力制御方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4577272A (en) * 1983-06-27 1986-03-18 E-Systems, Inc. Fault tolerant and load sharing processing system
US5193154A (en) * 1987-07-10 1993-03-09 Hitachi, Ltd. Buffered peripheral system and method for backing up and retrieving data to and from backup memory device
JPH0743676B2 (ja) * 1988-03-11 1995-05-15 株式会社日立製作所 バツクアツプデータダンプ制御方法及び装置
JPH0664838B2 (ja) * 1988-09-02 1994-08-22 松下電器産業株式会社 光デイスクファイル装置
US5537574A (en) * 1990-12-14 1996-07-16 International Business Machines Corporation Sysplex shared data coherency method
US5317739A (en) * 1992-03-30 1994-05-31 International Business Machines Corp. Method and apparatus for coupling data processing systems
US5548711A (en) * 1993-08-26 1996-08-20 Emc Corporation Method and apparatus for fault tolerant fast writes through buffer dumping

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0939371A3 (en) * 1998-02-26 2006-08-02 Hitachi, Ltd. Memory subsystem and method of reorganising multiplexed data
JPH11265320A (ja) * 1998-03-16 1999-09-28 Fujitsu Ltd リモート転送機能を有する外部記憶制御装置
US6393538B2 (en) 1998-09-18 2002-05-21 Fujitsu Limited Reproducing updates in a first file storage unit to a second file storage unit by transferring update information from the first unit to the second unit

Also Published As

Publication number Publication date
US5845328A (en) 1998-12-01

Similar Documents

Publication Publication Date Title
JPH09171441A (ja) 二重化記憶装置の記憶一致方法および装置
KR100194295B1 (ko) 데이타 처리 시스템 및 큐의 상태 갱신 방법
US5742792A (en) Remote data mirroring
US5889935A (en) Disaster control features for remote data mirroring
US6052797A (en) Remotely mirrored data storage system with a count indicative of data consistency
US6970972B2 (en) High-availability disk control device and failure processing method thereof and high-availability disk subsystem
EP0029331B1 (en) Inter-subsystem communication system
US5649092A (en) Fault tolerant apparatus and method for maintaining one or more queues that are shared by multiple processors
US7143206B2 (en) Method for controlling data transfer unit having channel control unit, storage device control unit, and DMA processor
US6389554B1 (en) Concurrent write duplex device
US20060089975A1 (en) Online system recovery system, method and program
US5963634A (en) Method for warming up a spare process in a replicated real-time system, in particular in a telephone exchange
JPH06131244A (ja) 共有メモリの非同期アクセス方式
US20060184706A1 (en) Method and apparatus for multiplexing commands in a symmetric multiprocessing system interchip link
US5943509A (en) Small size inter-processor data transfer system
JP2000148523A (ja) 二重化メモリ装置及びメモリ切替方法
JPH0324634A (ja) 二重系システム装置
JP2856150B2 (ja) トランザクション履歴記録システム
JPH06259274A (ja) 二重系システム
EP1380954B1 (en) Computer system and data processing method
JP3273191B2 (ja) データ転送装置
JPH0628407A (ja) データベースシステム
KR20020033254A (ko) 이중화 프로세서의 흐름 제어장치 및 방법
JPH10254845A (ja) 並列計算機におけるポーリング方法
JPH103460A (ja) 共用メモリの二重化システム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040608