JPH08278909A

JPH08278909A - 高信頼化システムおよび方法

Info

Publication number: JPH08278909A
Application number: JP7082175A
Authority: JP
Inventors: Masanori Hirano; 正則平野; Tsunemichi Shiozawa; 恒道塩澤; Yasuo Kinouchi; 康夫木ノ内; Takashi Suzuki; 孝至鈴木
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 1995-04-07
Filing date: 1995-04-07
Publication date: 1996-10-22

Abstract

(57)【要約】【目的】同一地点内またはノード相互において、相手方
プロセッサまたは相手方ノードの障害時に、自分のトラ
ンザクション処理に影響を与えることなく、障害のプロ
セッサまたはノードに対するトランザクション処理をバ
ックアップし、高信頼化を保証しながら、システム全体
の経済化を図る。【構成】各モジュールのプロセッサの使用率が５０％以
下となるようにデータベースを割り当て、障害となった
モジュールの半導体ファイル装置からチェックポイント
データベースを読み出し、チェックポイント時点後のロ
グ情報に従ってデータベースを復元し、障害となったモ
ジュールのトランザクション処理を再開する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、２台のモジュールのう
ち一方が障害となった場合でも、トランザクション処理
に影響を及ぼすことなく、障害となったモジュールに対
するトランザクション処理をバックアップして、システ
ムの高信頼化を保証しながら、システムの経済化を図る
ことができる高信頼化システムおよび高信頼化方法に関
する。

【０００２】

【従来の技術】オンラインリアルタイム処理とは、デー
タが発生する都度、その場で端末から入力し、通信回線
を通してコンピュータシステムに入力して即時処理し、
その結果を端末等に応答する処理方式である。オンライ
ンリアルタイムシステムは、銀行におけるバンキングシ
ステム、列車等の座席予約システム等で使用されている。
トランザクションとは、オンラインリアルタイムシステ
ムにおいて、コンピュータシステムに対して端末等から
処理を要求してくる単位のことである。従来、トランザ
クション処理の高信頼化方法としては、プロセッサを２
台設けて、そのうちの１台のプロセッサで全トランザク
ションの処理を行い（以下、このプロセッサをアクトプ
ロセッサと記す）、残りの１台を予備として待機させる
（以下、このプロセッサをスタンバイプロセッサと記
す）方法が一般に採用されている。この方法では、アク
トプロセッサが障害になった場合、スタンバイプロセッ
サが半導体ファイル装置からチェックポイントデータベ
ースとログ情報を読み出し、これらの情報によりアクト
プロセッサが障害になった時点のデータベースを復元し
て、トランザクション処理を再開する。しかしながら、
再開処理の間、全てのトランザクション処理が中断され
るという問題がある。また、この方法では、地震、水害
等の大規模災害時には、システム（ノード）全体の機能
が停止してしまう。このような場合でも、トランザクシ
ョン処理を継続させるためには、遠隔地点にも予備のプ
ロセッサを設置することが必要であり、遠隔地点に２台
のプロセッサを設置して待機させておくと、全体で４台
のプロセッサを設置しながら、実際にトランザクション
処理のために稼働するプロセッサは１台だけであるた
め、高信頼のための設備費が膨大になるという問題があ
る。

【０００３】図８は、従来のノード内のアクト−スタン
バイプロセッサによるバックアップシステムの接続構成
図である。図８において、１，２はプロセッサ、３は半
導体ファイル装置、４は通信制御装置（ＣＣＵ）、５
５，５６はそれぞれプロセッサ１，２と通信制御装置４
を接続する信号線、５７，５８はそれぞれプロセッサ
１，２と半導体ファイル装置３を接続する信号線、５９
はプロセッサ１とプロセッサ２を接続する信号線、６０
はトランザクションが送られてくる通信回線である。一
方のプロセッサ１は、アクトプロセッサとしてトランザ
クション処理を行い、他方のプロセッサ２はスタンバイ
プロセッサとして待機しているものとする。通信回線６
０から入力されたトランザクションは通信制御装置４で
受信され、信号線５５を介してプロセッサ１に入力され
る。プロセッサ１は主メモリ上にデータベースを有して
おり、このデータベースの内容に従ってトランザクショ
ン処理を行うとともに、データベースの更新を行う。デ
ータベースの更新を行った場合、そのデータベース内の
アドレスおよび更新データをログ情報として信号線５７
を介して半導体ファイル装置３に書き込む。さらに、ト
ランザクションへの応答を信号線５５を介して通信制御
装置４に送出する。このようにして、逐次、通信回線６
０を介して送られてきるトランザクションは処理され
る。プロセッサ１は、予め決められた周期で、主メモリ
上のデータベースを半導体ファイル装置３にチェックポ
イント情報として格納する。

【０００４】図９は、従来のノード間バックアップ方法
を説明するための接続構成図である。図９において、１
０００は地点Ａ（例えば、東京）のノード、２０００は
地点Ｂ（例えば、大阪）に設置されたバックアップノー
ドである。地点Ａと地点Ｂは遠隔地に位置しており、地
点Ａで地震、水害等の災害によりノード１０００全体が
障害となった場合には、地点Ｂでバックアップが可能で
ある。なお、ノード１０００内の１〜１０は図８の符号
と同じものを示し、ノード２０００内の１０１〜１１０
はそれぞれ図８の１〜１０と同じものである。３０００
は、ノード１０００内の通信制御装置４とノード２００
０内の通信制御装置１０４とを接続する信号線である。
ノード１０００内のプロセッサ１はアクトプロセッサと
してトランザクション処理を行い、プロセッサ２はスタ
ンバイプロセッサとして、プロセッサ１が障害となった
場合に、トランザクション処理をバックアップするため
に待機している。ノード２０００のプロセッサ１０１は
主メモリ上にプロセッサ１のデータベースを有してお
り、トランザクション処理は行わないが、プロセッサ１
から信号線５５、通信制御装置４、通信回線３０００、
通信制御装置１０４、信号線４０５を介して送られてく
るデータベース更新のログ情報により、主メモリ内のデ
ータベースを更新するとともに、信号線４０７を介して
半導体ファイル装置１０３にもログ情報を書き込む。ま
た、予め決められた周期で、主メモリ上のデータベース
をチェックポイント情報として半導体ファイル装置１０
３に書き込む。プロセッサ１０２はプロセッサ１０１が
障害となった場合、これをバックアップするために待機
している。

【０００５】

【発明が解決しようとする課題】このように、従来、図
８に示すようなノード内のバックアップ方法を採用する
とともに、図９に示すようなノード間のバックアップ方
法を採用していた。しかしながら、図８および図９のバ
ックアップ方法では、次のような問題がある。すなわ
ち、図８においては、プロセッサ１が障害になった場
合、スタンバイプロセッサ２で処理を再開するため、プ
ロセッサ１は障害である旨を信号線５９を介してスタン
バイプロセッサ２に通知する。この通知を受信したプロ
セッサ２は、半導体ファイル装置３からチェックポイン
トデータベースを主メモリ上に読み出し、その後、ログ
情報によりチェックポイント時点からのデータベースの
更新内容を上書きする。これにより、プロセッサ２の主
メモリには、プロセッサ１が障害になった時点のデータ
ベースが復元される。データベースの復元が終了する
と、プロセッサ２は信号線５６を介して通信制御装置４
に通知する。通信制御装置４は、送られてきたトランザ
クションを信号線５６を介してプロセッサ２に送り、プ
ロセッサ２によりトランザクション処理が再開される。
この方法では、プロセッサ２が再開処理を行っている
間、全てのトランザクション処理が中断されるという問
題がある。

【０００６】次に、図９においては、ノード１０００で
大規模災害が生じ、このためトランザクション処理が不
可能となった場合、図示されていないが、通信回線６
０、１１０に接続され、これらのノードが正常か否かを
監視するための管理ノードにより障害が検出され、トラ
ンザクション送出元に対してノード１０００が障害であ
る旨を通知する。以後、トランザクションは通信回線４
１０を介してノード２０００に送られ、プロセッサ１０
１で処理される。しかし、このような大規模災害時に
も、トランザクション処理を可能とするためには、図９
に示すように４台のプロセッサを設置しながら、実際に
トランザクション処理のために稼働するのは１台のプロ
セッサのみであり、高信頼化のための設備コスト負担は
極めて大となるという問題がある。

【０００７】本発明の目的は、このような従来の課題を
解決し、障害処理中にかけるトランザクション処理での
影響範囲を極力少なくするとともに、モジュール全体と
しての高信頼化を図ることができ、また異なる２地点で
のノード相互のバックアップのためのプロセッサ使用率
の余裕を共用することができる高信頼化システムおよび
方法を提供することにある。

【０００８】

【課題を解決するための手段】上記目的を達成するた
め、本発明による高信頼化システムは、プロセッサと
該プロセッサによりアクセスされる半導体ファイル装置
とを備えたモジュールを２台設置し、データベースを用
いてトランザクション処理を行う高信頼の情報処理シス
テムにおいて、各モジュールのプロセッサの使用率が５
０％以下となるように、各モジュールに割り当てられた
データベースを格納する主メモリと、各モジュールが障
害となり、自ら回復処理を実施したが、回復できないこ
とが判明したとき、その旨を他モジュールに通知する障
害通知手段と、該障害通知手段により通知を受けると、
各モジュールが相互に他モジュールの半導体ファイル装
置をアクセスして、チェックポイント時点のデータベー
スを上記主メモリに読み出すとともに、該チェックポイ
ント時点後のログ情報を読み出し、上記データベースに
上書きして、障害時点の他モジュールのデータベースを
復元する中央処理手段とを有することを特徴としてい
る。

【０００９】また、本発明による高信頼化方法は、プ
ロセッサと該プロセッサによりアクセスされる半導体フ
ァイル装置とを備えたモジュールを２台設置し、データ
ベースを用いてトランザクション処理を行う高信頼化方
法において、使用率が５０％以下となるように、分割さ
れたデータベースが割り当てられた各モジュールは、割
り当てられた全てのデータベースを主メモリに格納し、
該データベースを用いてトランザクション処理を行い、
該データベースの更新を主メモリ上で行うとともに、該
データベースの更新履歴をログ情報として上記半導体フ
ァイル装置に書き込み、かつ予め決められたチェックポ
イントで主メモリ上の全てのデータベースをチェックポ
イント情報として該半導体ファイル装置に書き込み、ト
ランザクション処理中に障害となったモジュールは、半
導体ファイル装置からチェックポイント時点のデータベ
ースを主メモリ上に読み出すとともに、該チェックポイ
ント時点後のログ情報を読み出して、該ログ情報で上記
データベース上に上書きし、障害時点のデータベースを
復元して、トランザクション処理を再開するが、再度障
害となった場合には、同じ処理を繰り返して、予め決め
られた回数の再開処理を行っても回復しない場合には、
固定障害であることを２台のうちの正常なモジュールに
通知し、該正常なモジュールは、プロセッサの５０％の
使用率で自モジュールに対するトランザクション処理を
行いながら、残りの５０％の使用率で障害となったモジ
ュールの半導体ファイル装置からチェックポイント時点
のデータベースを主メモリ上に読み出し、該チェックポ
イント時点後のログ情報を読み出して、該ログ情報で上
記データベースに上書きし、障害となった時点の他モジ
ュールのデータベースを復元して、他モジュールのデー
タベースに対するトランザクション処理も処理すること
を特徴としている。

【００１０】また、２台のモジュールを異なる２地点
Ａ，Ｂに設置し、それぞれ分散してトランザクション処
理を行い、地点Ａの第１のモジュールと地点Ｂの第１の
モジュールは相互に相手モジュールのデータベースを備
え、自モジュールのデータベースのログ情報を通信回線
を介して送信し、該ログ情報を受信したモジュールは、
相手モジュールのデータベースを更新し、地点Ａの第２
のモジュールと地点Ｂの第２のモジュールも上記と同じ
処理を行い、Ａ,Ｂいずれかの地点で１台のモジュール
が障害となった場合には、同一地点の正常なモジュール
が障害となったモジュールのトランザクション処理を継
続し、Ａ,Ｂいずれかの地点で２台のモジュールが同時
に障害となった場合には、他地点の２台のモジュール
が、障害となった地点の２台のモジュールのトランザク
ション処理を継続することも特徴としている。

【００１１】

【作用】本発明においては、２台のモジュールがプロセ
ッサの使用率５０％以内で自モジュールに対するトラン
ザクション処理を行い、いずれか一方のモジュールが障
害となった場合には、正常なモジュールはプロセッサの
５０％の使用率で自モジュールに対するトランザクショ
ン処理を行いながら、残りの５０％の使用率で障害とな
ったモジュールの半導体ファイル装置からチェックポイ
ント時点のデータベースおよびログ情報を読み出し、他
モジュールが障害となった時点のデータベースを復元
し、他モジュールに対するトランザクション処理を肩代
りする。これにより、障害処理中におけるトランザクシ
ョン処理に対する影響を少なくでき、かつモジュール全
体の高信頼化を図ることができる。また、異なる２地点
にそれぞれ２台のモジュールを設置し、それぞれ独立に
プロセッサの使用率５０％以内で自モジュールに対する
トランザクション処理を行い、地点の異なるモジュール
間では、相互に相手モジュールのデータベースを持ち合
い、データベースの更新履歴をログ情報として通信回線
を介して送り、地点の異なる２モジュール間での相互バ
ックアップを可能としている。この時、同一地点内での
モジュール間相互バックアップと異なる２地点間でのノ
ード間相互バックアップのためのプロセッサ使用率の余
裕を共用することにより、効率のよい高信頼化方法を実
現することができる。

【００１２】

【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図１は、本発明の第１の実施例を示すトラン
ザクション処理の高信頼化システムの構成図である。図
１において、１，２はモジュール、３，４はそれぞれモ
ジュール１，２内のプロセッサ、５，６はそれぞれモジ
ュール１，２内の半導体ファイル装置、７，８はそれぞ
れプロセッサ３，４内の中央処理装置であって、命令の
実行、入出力処理を行うものである。また、９，１０は
それぞれプロセッサ３，４内の主メモリ、１１，１２は
それぞれプロセッサ３，４内の障害検出・通知装置、１
３，１４はそれぞれ主メモリ９，１０に記憶されている
データベース、１５，１６はそれぞれ半導体ファイル
５，６に記憶されているチェックポイント時点のデータ
ベース、１７，１８はそれぞれ半導体ファイル装置５，
６に記憶されているログ情報、１９は通信回線２６を介
してトランザクションを受信する通信制御装置である。
また、２４，２５は受信したトランザクションをそれぞ
れ中央処理装置７，８に送る信号線、２０，２１はそれ
ぞれ中央処理装置７，８と半導体ファイル装置５，６と
を接続する信号線、２２，２３はそれぞれ中央処理装置
７，８と半導体ファイル装置６，５とを接続する信号
線、２７は障害検出・通知装置１１，１２間を接続する
信号線、２８，２９はそれぞれ中央処理装置７，８と主
メモリ９，１０とを接続する信号線、３０，３１はそれ
ぞれ中央処理装置７，８と障害検出・通知装置１１，１
２間を接続する信号線である。

【００１３】図２は、本発明の各モジュールのプロセッ
サの通常動作および障害検出時動作の各フローチャート
である。図１において、通信回線２６を介して送られて
きたトランザクションは、通信制御装置１９で受信され
る。通信制御装置１９は、当該トランザクションがモジ
ュール１内のデータベース１３で処理されるものであれ
ば、信号線２４を介して中央処理装置７に送られ、また
モジュール２内のデータベース１４で処理されるもので
あれば、信号線２５を介して中央処理装置８に送られ
る。以下、当該トランザクションがモジュール１内のデ
ータベース１３で処理されるものとして説明する。図２
に示すように、中央処理装置７に送られたトランザクシ
ョンは、データベース１３に従って処理された後（ステ
ップ３０１，３０２）、信号線２８を介して主メモリ９
にアクセスされ、データベース１３の内容が書き換えら
れる（ステップ３０３）。また、中央処理装置７は、書
き換えたデータベース１３のアドレスおよび書き換え内
容を信号線２０を介して半導体ファイル装置５のログ情
報１７にも書き込む（ステップ３０４）。その後、中央
処理装置７は当該トランザクションへの応答を信号線２
４を介して通信制御装置（ＣＣＵ）１９に送ると（ステ
ップ３０５）、通信制御装置１９は通信回線２６を介し
てトランザクション送出元に当該トランザクションへの
応答を送る。同じように、通信回線２６を介して送られ
てくるトランザクションは、モジュール１またはモジュ
ール２で処理される。この場合、モジュール１，２に
は、プロセッサ３，４の使用率が５０％以下となるよう
にデータベース１３，１４の量が調整されて格納されて
いる。また、中央処理装置７，８は、予め決められた周
期でデータベース１３，１４の内容をチェックポイント
情報として、信号線２０，２１を介して半導体ファイル
装置５，６のチェックポイントデータベースエリア１
５，１６に書き込む。

【００１４】図１、図２において、トランザクションが
上述のように処理されている途中で、モジュール１が障
害なり、この障害をプロセッサ３内の障害検出・通知装
置１１で検出したとする（ステップ３１１）。障害検出
・通知装置１１は、信号線３０を介して中央処理装置７
をリセットする（ステップ３１３）。これにより、中央
処理装置７は、プログラムを最初から開始し、信号線２
８を介して主メモリ９の内容を初期化し（ステップ３１
４）、信号線２０を介して半導体ファイル装置５内のチ
ェックポイントデータベース１５を主メモリ９のデータ
ベース格納エリア１３に読み出す（ステップ３１５）。
さらに、中央処理装置７は、信号線２０を介して半導体
ファイル装置５に格納されているログ情報１７を読み出
し、このログ情報に従って主メモリ９上のデータベース
１３を書き換える（ステップ３１６）。チェックポイン
ト時点からの全ログ情報について上記処理が終了すると
（ステップ３１７）、主メモリ９上のデータベース１３
は、障害が検出された直前の内容となる。このようにし
て、データベース１３が復元されると、再びモジュール
１でのトランザクション処理が再開される（ステップ３
１８）。データベース１３の回復中に再度プロセッサ３
が障害になると、それを障害検出・通知装置１１が検出
し、前述と同じデータベース回復処理を行う。障害検出
・通知装置１１は予め決められた回数だけ障害を検出す
ると（ステップ３１２）、プロセッサ３が固定障害であ
るとみなして、信号線２７を介してその旨をモジュール
２内の障害検出・通知装置１２に通知する（ステップ３
１９）。障害検出・通知装置１２は、信号線３１を介し
て中央処理装置８にモジュール１が固定障害であること
を通知する。

【００１５】図３は、本発明による相手方障害時のモジ
ュールのプロセッサの動作フローチャートである。中央
処理装置８は、信号線２３を介して半導体ファイル装置
５からチェックポイントデータベース１５を主メモリ１
０に読み出す（ステップ３２１）。次に、中央処理装置
８は、信号線２３を介して半導体ファイル装置５に格納
されているログ情報１７を読み出し（ステップ３２
２）、このログ情報に従って、主メモリ１０に読み出し
たチェックポイントデータベース１５を書き換える（ス
テップ３２３）。チェックポイント時点からの全ログ情
報について上記処理が終了すると（ステップ３２４）、
主メモリ１０上にはモジュール１の障害直前のデータベ
ースが復元される。中央処理装置８は、信号線２５を介
して通信制御装置（ＣＣＵ）１９にモジュール１のデー
タベースが復元されたことを通知する（ステップ３２
５）。通信制御装置１９は、モジュール１で処理される
トランザクションも信号線２５を介して中央処理装置８
に送る（ステップ３２６）。これにより、モジュール１
に対するトランザクション処理は、モジュール２で再開
される。モジュール２は、プロセッサの使用率５０％以
内で自モジュールに対するトランザクション処理を行う
とともに、残りの５０％の使用率で上述のモジュール１
のデータベースの復元を行い、次にモジュール１に対す
るトランザクション処理を行う（ステップ３２７）。こ
のようにして、プロセッサ３，４がそれぞれプロセッサ
の使用率５０％以内でトランザクション処理を半分ずつ
分担して処理を行うことにより、いずれか一方のプロセ
ッサが障害となった場合でも、相互にバックアップが可
能となる。また、いずれか一方のモジュールが障害とな
り、当該モジュールのデータベースを復元中でも、正常
なモジュールのトランザクション処理は影響を受けない
ため、全体のトランザクション処理への影響は少なくて
すむという利点がある。

【００１６】図４は、本発明の第２の実施例を示すトラ
ンザクション処理の高信頼化システムの構成図である。
図４において、１〜３１の符号は図１と同じものを示
す。３２，３３はそれぞれ半導体ファイル装置５，６に
格納されているプロセッサ４，３内のデータベース１
４，１３のチェックポイントデータベース、３４，３５
はそれぞれ半導体ファイル装置５，６に格納されている
ログ情報である。図１の実施例と異なる点は、プロセッ
サ３でトランザクション処理を行った場合、ログ情報を
半導体ファイル装置５内のエリア１７のみでなく、半導
体ファイル装置６内のエリア３５にも格納すること、お
よびプロセッサ３内のデータベース１３のチェックポイ
ントデータベースを半導体ファイル装置５内のエリア１
５のみでなく、半導体ファイル装置６内のエリア３３に
も格納することである。また、同じように、プロセッサ
４からのログ情報は半導体ファイル装置５，６のエリア
１８，３４に格納され、チェックポイントデータベース
は半導体ファイル装置６，５のエリア１６，３２に格納
される。このように、ログ情報とチェックポイントデー
タベースを２台の半導体ファイル装置５，６に二重化し
て格納することにより、どちらかの半導体ファイル装置
が障害となって、ログ情報およびチェックポイントデー
タベースが失われたとしても、正常な半導体ファイル装
置からログ情報およびチェックポイントデータベースを
読み出して再開処理を行うことが可能となり、信頼性を
より一層向上できる。

【００１７】図５は、本発明の第３の実施例を示すトラ
ンザクション処理の高信頼化システムの構成図である。
図５において、符号１〜３１は図１の実施例と同じもの
を示している。３６，３７はそれぞれモジュール１，２
内に設けられた２台目の半導体ファイル装置、３８，３
９はそれぞれ半導体ファイル装置３６，３７内のチェッ
クポイントデータベース、４０，４１はそれぞれ半導体
ファイル装置３７，３８内のログ情報である。図５の実
施例が図１の実施例と異なる点は、モジュール１，２内
にそれぞれ半導体ファイル装置を２台設け、チェックポ
イントデータベースおよびログ情報を２台の半導体ファ
イル装置３６，３７に二重化して格納することである。
これにより、半導体ファイル装置の１台が障害となり、
チェックポイントデータベースおよびログ情報が失われ
たとしても正常な半導体ファイル装置からチェックポイ
ントデータベースおよびログ情報を読み出して再開処理
を行うことが可能となり、信頼性を一層向上させること
ができる。

【００１８】図６は、本発明の第４の実施例を示すトラ
ンザクション処理の高信頼化システムの構成図である。
図６において、符号１〜３１および３６〜４１は図５の
実施例と同じものを示している。４２はプロセッサ３が
半導体ファイル装置６に格納したチェックポイントデー
タベース、４３はプロセッサ３が半導体ファイル装置６
に格納したログ情報である。図６においては、図５の状
態でトランザクション処理を行っているとき、半導体フ
ァイル装置５が障害となり（×で示す）、半導体ファイ
ル装置５内のチェックポイントデータベース１５および
ログ情報１７が失われたため、プロセッサ３が半導体フ
ァイル装置６にチェックポイントデータベース４２およ
びログ情報４３を格納した場合を示している。このよう
に、いずれか一方のモジュールの半導体ファイル装置の
１台が故障した場合、他モジュールの半導体ファイル装
置にチェックポイントデータベースおよびログ情報を書
き込むことにより、常にチェックポイントデータベース
およびログ情報が半導体ファイル装置に二重化して格納
されるため、全体としての信頼性をより一層向上でき
る。

【００１９】図７は、本発明の第５の実施例を示すトラ
ンザクション処理のノード間における高信頼化システム
の構成図である。図７において、１０００は地点Ａ（例
えば、東京）のノード、２０００は地点Ｂ（例えば、大
阪）のノードである。地点Ａと地点Ｂは離れた場所に位
置し、いずれかの地点で地震、水害等の災害によりノー
ド全体が障害となった場合に、他の正常なノードが障害
になったノードのバックアップを可能とするものであ
る。ノード１０００内で、符号１〜３１は図１と同じも
のを示し、ノード２０００内の１０１〜１３１はそれぞ
れ図１の１〜３１と同じものを示している。２０１，２
０２は、それぞれプロセッサ１０３，３のデータベース
１１３、１３のコピーデータベース、２０３，２０４は
それぞれプロセッサ１０４，４のデータベース１１４，
１４のコピーデータベース、２０５，２０６はプロセッ
サ３，１０３のコピーデータベース２０１，２０２を予
め決められた周期で半導体ファイル装置５，１０５に格
納したチェックポイントデータベース、２０９，２１０
はプロセッサ４，１０４のコピーデータベース２０３，
２０４を予め決められた周期で半導体ファイル装置６，
１０６に格納したチェックポイントデータベース、２０
７，２０８はプロセッサ３，１０３のコピーデータベー
ス２０１，２０２の更新履歴を半導体ファイル装置５，
１０５に格納したログ情報、２１１，２１２はプロセッ
サ４，１０４のコピーデータベース２０３，２０４の更
新履歴を半導体ファイル装置６，１０６に格納したログ
情報である。３０００は、通信制御装置１９と通信制御
装置１１９間を接続する通信回線である。

【００２０】図７において、プロセッサ３，４，１０
３，１０４はそれぞれデータベース１３，１４，１１
３，１１４を用い、プロセッサの使用率５０％以内でト
ランザクション処理を行う。ノード１０００内では、モ
ジュール１とモジュール２とが相互バックアップ状態に
あり、ノード２０００内ではモジュール１０１とモジュ
ール１０２とが相互バックアップ状態にある。各ノード
でのトランザクション処理および各ノード内で１台のモ
ジュールが障害となった場合のモジュール間のバックア
ップ処理は、図１において説明した通りである。ここで
は、ノード間のバックアップ処理について、図７により
説明する。ノード１０００のモジュール１とノード２０
００のモジュール１０１、ノード１０００のモジュール
２とノード２０００のモジュール１０２とが、相互バッ
クアップ状態にある。ノード１０００の中央処理装置７
は、データベース１３に対するトランザクション処理を
行うとともに、予め決められた周期でログ情報１７を信
号線２０を介して半導体ファイル装置５から読み出し、
信号線２４を介して通信制御装置１９に送る。通信制御
装置１９は、ログ情報を通信回線３０００を介して通信
制御装置１１９に送る。通信制御装置１１９は、ログ情
報を通信回線１２４を介して中央処理装置１０７に送
る。

【００２１】中央処理装置１０７は、送られたログ情報
をもとにコピーデータベース２０２を書き換える。ま
た、中央処理装置１０７は、送られたログ情報を信号線
１２０を介して半導体ファイル装置１０５のログ情報格
納エリア２０８に書き込む。プロセッサ１０９のコピー
データベース２０２は、中央処理装置１０７の制御のも
とに、予め決められた周期で信号線１２０を介して半導
体ファイル装置１０５のチェックポイントデータベース
格納エリア２０６に書き込まれる。全く同じように、ノ
ード２０００のプロセッサ１０３のデータベース１１３
は、ノード１０００のプロセッサ３内のコピーデータベ
ース２０１に復元され、さらに半導体ファイル装置５内
にコピーデータベース２０１のチェックポイントデータ
ベース２０５およびログ情報２０７が格納される。以
上、ノード１０００内のモジュール１とノード２０００
内のモジュール１０１のデータベースを相互に送り合っ
て、相手モジュールのデータベースのコピーを主メモリ
に復元する方法、およびチェックポイントデータベー
ス、ログ情報を半導体ファイル装置に格納する方法につ
いて述べた。全く同じようにして、ノード１０００内の
モジュール２とノード２０００内のモジュール１０２
は、相互バックアップ状態にある。

【００２２】このような状態で、ノード２０００が地
震、水害等の災害によりトランザクション処理が停止す
ると、図７では図示省略されているが、通信回線２６，
１２６に接続され、これらのノードが正常か否かを監視
する管理ノードにより障害が検出されるので、管理ノー
ドによりトランザクション送出元にノード２０００が障
害である旨を通知する。以後、トランザクションは、通
信回線２６を介してノード１０００に送られる。トラン
ザクションを受信した通信制御装置１９は、信号線２
４，２５を介して中央処理装置７，８に通知する。中央
処理装置７は、５０％の使用率で自モジュールへのトラ
ンザクション処理を行うとともに、残りの５０％のプロ
セッサ使用率でモジュール１０１に対するトランザクシ
ョン処理もデータベース２０１を用いて処理する。中央
処理装置８も、同じように５０％のプロセッサ使用率で
自モジュールに対するトランザクション処理を行いなが
ら、残りの５０％のプロセッサ使用率でモジュール１０
２に対するトランザクションをデータベース２０３を用
いて処理する。各モジュールは、正常時にはプロセッサ
の使用率５０％以内で自モジュールに対するトランザク
ション処理を行いながら、残りの５０％のプロセッサ使
用率により、同一ノード内のモジュール障害時には、正常なモジュ
ールが障害となったモジュールのトランザクション処理
をバックアップし、ノード全体が障害時には、正常なノードの２台のモジ
ュールが障害となったノードの２台のモジュールに対す
るトランザクション処理をバックアップする。このよう
に、ノード内でのモジュール間相互バックアップと、ノ
ード間での相互バックアップのためのプロセッサの使用
率の余裕を共用することにより、高い信頼度を維持した
まま、経済的にシステムを構成することができる。

【００２３】

【発明の効果】以上説明したように、本発明によれば、
同一地点内の２台のモジュールによる相互バックアップ
では、いずれか一方のモジュールが障害となったとき、
正常なモジュールで処理していたトランザクション処理
に影響を与えることなく、障害となったモジュールに対
するトランザクション処理をバックアップできる。ま
た、地震、水害等の大規模災害に対して、システム全体
として高信頼化を図るためには、異なる２地点間での相
互バックアップが必要となるが、ノード内のモジュール
間相互バックアップのためのプロセッサ使用率の余裕と
ノード間相互バックアップのためのプロセッサ使用率の
余裕を共用することにより、システムの高信頼化を保証
しながら、システム全体としての経済化を図ることがで
きる。

【図面の簡単な説明】

【図１】本発明の第１の実施例を示すトランザクション
処理の高信頼化システムの構成図である。

【図２】図１におけるアクトプロセッサの正常時動作お
よび障害時動作のフローチャートである。

【図３】図１におけるスタンバイプロセッサの障害時動
作のフローチャートである。

【図４】本発明の第２の実施例を示すトランザクション
処理の高信頼化システムの構成図である。

【図５】本発明の第３の実施例を示すトランザクション
処理の高信頼化システムの構成図である。

【図６】本発明の第４の実施例を示すトランザクション
処理の高信頼化システムの構成図である。

【図７】本発明の第５の実施例を示すトランザクション
処理のノード間の高信頼化システムの構成図である。

【図８】従来のトランザクション処理の高信頼化システ
ムの構成図である。

【図９】従来のトランザクション処理のノード間の高信
頼化システムの構成図である。

【符号の説明】

１，２…モジュール、３，４…プロセッサ、５，６…半
導体ファイル装置、７，８…中央処理装置、９，１０…
主メモリ、１１，１２…障害検出・通知装置、１３，１
４…データベース、１５，１６…チェックポイントデー
タベース、１７，１８…ログ情報、１９…通信制御装
置、２６…通信回線、２０〜２５，２７…信号線、３
２，３３…半導体ファイル装置内の相手方チェックポイ
ントデータベース、３４，３５…半導体ファイル装置内
の相手方ログ情報、３６，３７…他の半導体ファイル装
置、３８，３９…他の半導体ファイル装置内のチェック
ポイントデータベース、４０，４１…他の半導体ファイ
ル装置内のログ情報、４２，４３…相手方のチェックポ
イントデータベース、およびログ情報、１０１，１０２
…モジュール、１０３，１０４…プロセッサ、１０５，
１０６…半導体ファイル装置、１０７，１０８…中央処
理装置、１０９，１１０…主メモリ、１１１，１１２…
障害検出・通知装置、１１３，１１４，１１５，１１６
…チェックポイントデータベース、２０２，２０４，１
１７，１１８…ログ情報。

───────────────────────────────────────────────────── フロントページの続き (72)発明者鈴木孝至東京都千代田区内幸町１丁目１番６号日本電信電話株式会社内

Claims

【特許請求の範囲】

【請求項１】プロセッサと該プロセッサによりアクセス
される半導体ファイル装置とを備えたモジュールを２台
設置し、データベースを用いてトランザクション処理を
行う高信頼の情報処理システムにおいて、各モジュールのプロセッサの使用率が５０％以下となる
ように、各モジュールに割り当てられたデータベースを
格納する主メモリと、各モジュールが障害となり、自ら回復処理を実施した
が、回復できないことが判明したとき、その旨を他モジ
ュールに通知する障害通知手段と、該障害通知手段により通知を受けると、各モジュールが
相互に他モジュールの半導体ファイル装置をアクセスし
て、チェックポイント時点のデータベースを上記主メモ
リに読み出すとともに、該チェックポイント時点後のロ
グ情報を読み出し、上記データベースに上書きして、障
害時点の他モジュールのデータベースを復元する中央処
理手段とを有することを特徴とする高信頼化システム。
【請求項２】プロセッサと該プロセッサによりアクセス
される半導体ファイル装置とを備えたモジュールを２台
設置し、データベースを用いてトランザクション処理を
行う高信頼化方法において、使用率が５０％以下となるように、分割されたデータベ
ースが割り当てられた各モジュールは、割り当てられた
全てのデータベースを主メモリに格納し、該データベー
スを用いてトランザクション処理を行い、該データベー
スの更新を主メモリ上で行うとともに、該データベース
の更新履歴をログ情報として上記半導体ファイル装置に
書き込み、かつ予め決められたチェックポイントで主メ
モリ上の全てのデータベースをチェックポイント情報と
して該半導体ファイル装置に書き込み、トランザクション処理中に障害となったモジュールは、
半導体ファイル装置からチェックポイント時点のデータ
ベースを主メモリ上に読み出すとともに、該チェックポ
イント時点後のログ情報を読み出して、該ログ情報で上
記データベース上に上書きし、障害時点のデータベース
を復元して、トランザクション処理を再開するが、再度障害となった場合には、同じ処理を繰り返して、予
め決められた回数の再開処理を行っても回復しない場合
には、固定障害であることを２台のうちの正常なモジュ
ールに通知し、該正常なモジュールは、プロセッサの５０％の使用率で
自モジュールに対するトランザクション処理を行いなが
ら、残りの５０％の使用率で障害となったモジュールの
半導体ファイル装置からチェックポイント時点のデータ
ベースを主メモリ上に読み出し、該チェックポイント時
点後のログ情報を読み出して、該ログ情報で上記データ
ベースに上書きし、障害となった時点の他モジュールの
データベースを復元して、他モジュールのデータベース
に対するトランザクション処理も処理することを特徴と
する高信頼化方法。
【請求項３】前記各モジュールは、チェックポイント時
点のデータベースおよびログ情報を、自モジュール内の
半導体ファイル装置と、他モジュール内の半導体ファイ
ル装置の両方に二重化して格納することを特徴とする請
求項２に記載の高信頼化方法。
【請求項４】前記各モジュールは、半導体ファイル装置
を２台設け、チェックポイント時点のデータベースおよ
びログ情報を前記２台の半導体ファイル装置に二重化し
て格納することを特徴とする請求項２に記載の高信頼化
方法。
【請求項５】前記各モジュールは、半導体ファイル装置
の２台のうちの１台が故障した場合、他モジュールの１
台にもチェックポイント時点のデータベースおよびログ
情報を格納し、常にチェックポイント時点のデータベー
スおよびログ情報を２台の半導体ファイル装置に二重化
して格納することを特徴とする請求項４に記載の高信頼
化方法。
【請求項６】前記２台のモジュールを異なる２地点Ａ，
Ｂに設置し、それぞれ分散してトランザクション処理を
行い、地点Ａの第１のモジュールと地点Ｂの第１のモジュール
は相互に相手モジュールのデータベースを備え、自モジ
ュールのデータベースのログ情報を通信回線を介して送
信し、該ログ情報を受信したモジュールは、相手モジュ
ールのデータベースを更新し、地点Ａの第２のモジュールと地点Ｂの第２のモジュール
も上記と同じ処理を行い、Ａ,Ｂいずれかの地点で１台のモジュールが障害となっ
た場合には、同一地点の正常なモジュールが障害となっ
たモジュールのトランザクション処理を継続し、Ａ,Ｂいずれかの地点で２台のモジュールが同時に障害
となった場合には、他地点の２台のモジュールが、障害
となった地点の２台のモジュールのトランザクション処
理を継続することを特徴とする請求項２に記載の高信頼
化方法。