JP3438986B2 - 多重化コンピュータシステムおよび障害回復方法 - Google Patents
多重化コンピュータシステムおよび障害回復方法Info
- Publication number
- JP3438986B2 JP3438986B2 JP07880395A JP7880395A JP3438986B2 JP 3438986 B2 JP3438986 B2 JP 3438986B2 JP 07880395 A JP07880395 A JP 07880395A JP 7880395 A JP7880395 A JP 7880395A JP 3438986 B2 JP3438986 B2 JP 3438986B2
- Authority
- JP
- Japan
- Prior art keywords
- arithmetic processing
- synchronization
- failure
- access
- flag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Description
ステムに関し、特に、多重化されたコンピュータシステ
ムのいずれかに障害が発生した場合に、発生した障害か
らの回復を迅速に行う多重化コンピュータシステムおよ
び障害回復方法に関する。
して実行する、従来の多重化コンピュータシステムで
は、各演算処理装置が、システムによって与えられるク
ロックに同期した状態で多重化動作を行なう構成になっ
ているため、起動時あるいは動作中における同期化が必
要な場合に、全ての演算処理装置を一斉に同期させる手
段を備えることが必要であった。
生したために、ある演算処理装置が動作不能となった
り、ある演算処理装置の定期点検を行なったりした後
に、再度多重化動作を行なわせるための再同期を行なう
ために必要となる。
処理装置を同期させる1つの方式として、以下の方式が
一般的に採用されている。
タシステムにおいて、動作している演算処理装置(正常
系)が備えるメモリ装置の記憶内容と、動作している演
算処理装置が備えるメモリ装置によって受け取られた全
てのデータとを、動作していない演算処理装置(異常
系)が備えるメモリ装置へ転送し、正常系のメモリ装置
の記憶内容が完全に転送された時点で、両演算処理装置
を同一状態となるように一時的にリセット処理し、両演
算処理装置内において、オペレーティングシステムを再
起動することによって両系の同期化を行う。これに関連
する技術を開示した特許公報例として、特開平3−18
2958号公報等が挙げられる。
耐障害性機能を有するコンピュータシステムは、たとえ
そのダウン時間(故障発生から、再度多重化動作を行な
うようになるまでの時間)がいかに短くとも極めて弊害
が大きく、プラント運営コスト等のコストを増大させて
しまうようなシステム、例えば、航空交通管制システム
や核処理プラントの制御等の各種の分野に使用される。
したがって、ダウン時間が長期化すればするほど、シス
テムダウンによってもたらされる実際の弊害や該弊害が
他のシステムの運営に与える潜在的な弊害は増大してし
まうことになる。
ば、同期化を行うために全演算処理装置をリセットし、
さらに、起動に時間を要するオペレーティングシステム
を再起動する処理を行なう必要があるために、システム
全体が長時間動作不能となる事態が発生してしまい、弊
害の増大を招いてしまうという問題があった。
装置で構成された多重化コンピュータシステムにおい
て、障害から復旧した演算処理装置を再同期させる際
に、極力短時間内の動作停止で同期化させることを可能
とする多重化コンピュータシステムおよび障害回復方法
を提供することにある。
に、以下のようなシステムが考えられる。
は、同一の演算処理を同期して行なう複数の演算処理装
置と、前記各演算処理装置に接続され再同期の処理を行
なう同期処理装置と、を備え、前記各演算処理装置は、
他の演算処理装置の、故障からの回復を検出する故障回
復検出手段と、前記故障回復検出手段が他の演算処理装
置の、故障からの回復を検出した場合および自演算処理
装置が故障から回復した場合に、それぞれ、予め定めら
れたアドレスに対するアクセス要求を、自演算処理装置
の同期処理装置に行なう手段と、前記アドレス要求に対
するアクセス許可に応じて、前記アドレスに対するアク
セスを行なうアクセス手段と、を備える。
る演算処理装置による前記アクセス要求と前記故障から
回復した演算処理装置による前記アクセス要求との時間
差が、予め定めた時間差以内である場合には、前記正常
動作する演算処理装置および前記故障から回復した演算
処理装置の双方のアクセス手段に、同時に、前記アクセ
ス許可を与える同期化手段を備える。
れる。
演算処理装置のいずれかが故障した場合、故障から回復
した演算処理装置を、他の演算処理装置の演算処理動作
に再同期させる障害回復方法であって、正常動作するい
ずれかの演算処理装置が、他の演算処理装置の故障及び
当該故障からの回復を検出した場合に、予め定められた
アドレスに対するアクセス要求を行なう処理と、故障か
ら回復した演算処理装置が、前記アドレスに対するアク
セス要求を行なう処理と、前記正常動作する演算処理装
置による前記アクセス要求と前記故障から回復した演算
処理装置によるアクセス要求との時間差が、予め定めた
時間差以内である場合には、前記正常動作する演算処理
装置及び前記故障から回復した演算処理装置に接続され
た同期処理装置が、前記正常動作する演算処理装置及び
前記故障から回復した演算処理装置に、同時に、前記ア
ドレス要求に対するアクセス許可を与える処理と、 を含
む。
て行なっており、各演算処理装置に接続された同期処理
装置は、再同期の処理を行なう。
演算処理装置の故障を検出する。
の演算処理装置の故障及び当該故障からの回復を検出し
た場合に、予め定められたアドレスに対するアクセス要
求を、例えば、所定時間間隔で行なう。
故障から回復した場合、前記アドレスに対するアクセス
要求を行なう。
段は、処理装置からのアクセス許可に対して、前記アド
レスに対するアクセスを行なう。
作する演算処理装置による前記アクセス要求と前記故障
から回復した演算処理装置による前記アクセス要求との
時間差が、予め定めた時間差以内である場合には、前記
正常動作する演算処理装置および前記故障から回復した
演算処理装置の双方のアクセス手段に、同時に、前記ア
クセス許可を与える。
グを調整する。
算処理装置および故障から回復した演算処理装置が備え
るアクセス手段からのアクセスを同期化のための基準信
号とし、両演算処理装置の動作を再同期する。
て説明する。
タシステム10の構成図を示す。
クロック装置190とA系サブシステム20aとB系サ
ブシステム20bとを有して構成され、さらに、両系サ
ブシステムと端末装置170とは、端末接続装置180
を介して接続されている。
められた所定の演算処理を行なう演算処理装置30a
と、複数の多重化バス制御装置100a、110aと複
数のI/O装置160aとを少なくとも備えた構成を有
し、同様に、B系サブシステム20bは、予め定められ
た所定の演算処理を行なう演算処理装置30bと、複数
の多重化バス制御装置100b、110bと、複数のI
/O装置160bとを少なくとも備えた構成を有してい
る。
構成要素は、同一の機能を有しており、両系は、同一の
構成となっている。
つ、同一位相を有するクロックを、A系サブシステム2
0aおよびB系サブシステム20bに供給する装置であ
る。
ム20bは、上述したように同一の構成であって、クロ
ック装置190によって供給されるクロックの周期にし
たがって、同一動作、即ち、同期動作を行っている。つ
まり、A系サブシステム20aとB系サブシステム20
bとは、同一の演算処理を行なう2重系動作を行なって
いる。
操作することによって、例えば、多重化コンピュータシ
ステム10の保守操作を行なえる。
とによって、多重化コンピュータシステム10に、予め
定められた処理を行なうように要求すると、多重化コン
ピュータシステム10は、要求された処理をA系サブシ
ステム20aとB系サブシステム20bの双方で同時に
実行する。このため、一方のサブシステムに故障が発生
して処理が停止したとしても、他方のサブシステムによ
り、処理が継続して実行され、要求した処理が行なわれ
ることになる。
ステム20aは、さらに、複数のI/O装置160aを
接続するI/Oバス140aと、I/O装置160aや
端末接続装置180をI/Oバス140aに接続するI
/Oインターフェース150aと、複数のI/O装置1
60aによるDMAアクセス(Direct Memory Access)
を調停する機能を有するI/Oバス制御装置130a
と、I/Oバス制御装置130aとA系の多重化バス制
御装置100aとB系の多重化バス制御装置100bと
を接続する多重化バス120aと、I/Oバス制御装置
130bとA系の多重化バス制御装置110aとB系の
多重化バス制御装置110bとを接続する多重化バス1
20bと、I/O装置160aのDMAアクセスと演算
処理装置30aのPIOアクセスとを調停する多重化バ
ス制御装置100aと、I/O装置160bのDMAア
クセスと演算処理装置30aのPIOアクセスとを調停
する多重化バス制御装置110aと、演算処理装置30
aと多重化バス制御装置100aと多重化バス制御装置
110aを接続するシステムバス90aとを備えてい
る。
システム20bもA系サブシステム20aと同一の構成
であるので、A系サブシステム20a側のみについて、
その構成を説明する。
置100aと多重化バス制御装置100bとの間で、多
重化バス制御装置に与える制御信号を互いに送受信する
ための信号線であり、信号線115は、多重化バス制御
装置110aと多重化バス制御装置110bとの間で、
多重化バス制御装置に与える制御信号を互いに送受信す
るための信号線である。
クロックの同期にしたがって同一処理を行う2台のプロ
セッサ40aと50aと、メモリ装置60aと、系間イ
ンターフェイス80aと、所定のプログラムが内蔵され
ているROM88aとを有して構成され、さらに、コン
トロールユニット70aには、システムバス90aが、
また、系間インターフェイス80aには、系間バス85
が接続されている。
ロセッサ40aとプロセッサ4050aとから出力され
る出力データを比較して、それらのデータが不一致なら
ばプロセッサ40aまたはプロセッサ50aにおいて、
エラーが発生したと判断するエラー検出機能、メモリ装
置60aのエラーをECCコードにより検出する機能、
および、システムバス90aの故障(エラー)をパリテ
ィチェックにより検出する機能を備えている。演算処理
装置30bは、演算処理装置30aと同一の構成要素を
有しているため、演算処理装置30aと同様な機能を有
する。なお、本発明においては、エラー検出機能は本質
的なものではないので、その詳細な説明は省略すること
にする。
30bとが備える系間インターフェース80aと80b
は、サブシステムの動作状態等の情報を互いに交換する
ためのインターフェースとして機能する。系間インター
フェース80aと80bとの間の情報の伝送は、系間バ
ス85を介して行なわれる。
80aがサブシステムの動作状態を、多重化バス制御装
置100aおよび多重化バス制御装置110aに通知す
るための信号線であり、信号線880bは、系間インタ
ーフェース80bがサブシステムの動作状態を、多重化
バス制御装置100bおよび多重化バス制御装置110
bに通知するための信号線であり、両信号線は、同一の
役目を行なう。
は、それぞれ、立ち上げ処理プログラムおよび障害回復
処理プログラムとを少なくとも、予め内蔵するROM8
8a、88bが備えられている。前記立ち上げ処理プロ
グラムは、サブシステムを起動するためのプログラムで
あり、サブシステムの起動時に実行される。また、前記
障害回復処理プログラムは、例えば、一方のサブシステ
ムに故障が発生したために動作が停止した場合、サブシ
ステムの故障部分を、システムの保守者であるユーザ等
が交換した後、処理を継続している他方のサブシステム
と再び同期動作を行わせる(これを「同期化」あるいは
「再同期」と称する)ために実行させるプログラムであ
る。なお、前記立ち上げ処理プログラム、障害回復処理
プログラムの実行開始は、例えば、端末装置170の操
作により指示すれば行なわれるように、システム構成を
行なっておけば良い。
部である系間インターフェース80aおよび系間インタ
ーフェース80b、さらには、その付随構成要素構成の
構成および動作を説明する。
処理装置30aおよびB系演算処理装置30bの双方が
同期動作中であることを示すフラグである同期フラグ8
1aと、B系の演算処理装置30bがA系の演算処理装
置30aに対して同期化を要求していることを示すフラ
グである同期化要求フラグ82aと、A系の演算処理装
置30aがB系の演算処理装置30bに対して同期化を
要求していることを示すフラグである同期待ちフラグ8
3aと、A系の演算処理装置30aが故障したことを示
すフラグである故障フラグ84aと、A系の演算処理装
置30aが障害からの復旧中であることを示すフラグで
ある復旧フラグ89aと、各種の論理演算素子とを有し
て構成される。
0aが、A系の演算処理装置30aで発生したエラーを
検出したことを系間インターフェース80aに通知する
エラー検出信号を伝送する信号線であり、信号線86a
は、A系の演算処理装置30aおよびB系の演算処理装
置30bの双方が同期化を試みる状態であることを、系
間インターフェース80aが多重化バス制御装置100
aと110aに通知する同期化モード信号を送信する信
号線であり、さらに、信号線108aは、多重化バス制
御装置100aまたは110aが、系間インターフェー
ス80aに、同期化の成功を通知する同期化成功信号を
伝送する信号線である。
である。
ラー検出信号73aがアサートされるとセットされ、プ
ロセッサ40a、50aによるレジスタライト動作によ
ってリセットされる。
b上のエラー検出信号がアサートされるとセットされ、
プロセッサ40b、50bによるレジスタライト動作に
よって、リセットされる。
2aと同期待ちフラグ83aがセットされている場合で
あって、同期化成功信号108aがアサートされるとセ
ットされる。ここで各種フラグのセットとは、各フラグ
の内容として、例えば、デジタル信号「1」が格納され
た状態、また、リセットとは、各フラグの内容として、
デジタル信号「0」が格納された状態に対応すると考え
れば良い。また、そのように、セット、リセット動作が
行なわれる。
イッチとして機能する、即ち、ORゲート出力(出力
「1」の状態)によってリセット動作が行なわれ、AN
Dゲートは、セットスイッチとして機能する、即ち、A
NDゲート出力(出力「1」の状態)によってリセット
動作が行なわれるものとする。
フラグ82bと同期待ちフラグ83bがセットされてい
る場合であって、同期化成功信号108bがアサートさ
れるとセットされる。
れると、同期フラグ81aと81bの双方ともがリセッ
トされる。同期化要求フラグ82bと同期待ちフラグ8
3aと復旧フラグ89aとは、プロセッサ40a、50
aによるレジスタライト動作によって、セット/リセッ
トされる。
ちフラグ83bと復旧フラグ89bとは、プロセッサ4
0b、50bによるレジスタライト動作でセット/リセ
ットされる。
bは、図2に示す総てのフラグの状態をレジスタリード
動作により調べることが可能である。
ラグ82aと同期待ちフラグ83aとがセットさるとア
サートされ、同期化要求フラグ82a、または、同期待
ちフラグ83aがリセットされるとネゲートされる。同
様に、同期化モード信号86bは、同期化要求フラグ8
2bと同期待ちフラグ83bとがセットさるとアサート
され、同期化要求フラグ82b、または、同期待ちフラ
グ83bがリセットされるとネゲートされる。
ない、同期化を行なうために多重化制御装置側に同期化
モード信号を出力し、同期化が成功した場合には、多重
化制御装置側から同期化成功信号を受信する処理を行な
うことができる。
制御装置100aおよび100b、さらに、その周辺構
成要素の構成図を示す。
/データバッファ101aと、演算処理装置30aおよ
びI/Oバス制御装置130a間のアクセスを調停する
調停手段102aと、演算処理装置30aと演算処理装
置30bの同期化を行う同期化手段103aとを有して
構成される。
ス80aとは、前述した、信号線86a、信号線108
aによって接続されており、それぞれの信号線に対応す
る信号が送受信されている。
2aと信号線93aは、それぞれシステムバス90aを
構成する信号線であり、信号線91aは、アドレス/デ
ータ情報を伝送する信号線であるアドレス/データ線、
信号線92aは、演算処理装置30aから多重化バス制
御装置100aへのアクセス要求信号を伝送する信号
線、信号線93aは、多重化バス制御装置100aから
演算処理装置30aへのアクセス許可信号を伝送する信
号線である。
信号線123aは、それぞれシステムバス90aを構成
する信号線であり、信号線121aは、アドレス/デー
タ情報を伝送する信号線であるアドレス/データ線と、
信号線122aは、I/Oバス制御装置130aから多
重化バス制御装置100aへのアクセス要求信号を伝送
する信号線、信号線123aは、多重化バス制御装置1
00aからI/Oバス制御装置130aへのアクセス許
可信号を伝送する信号線である。
算処理装置30aにアクセス権を与えることを決定した
ことを示すアクセス可能信号を、B系に伝送する信号線
である。多重化バス制御装置100aは、演算処理装置
30aおよびI/Oバス制御装置130aから、アクセ
ス要求を行なうためにアクセス要求信号が出力される
と、調停手段102aによって、アクセス要求の調停を
行う。
にアクセス権を与えることを決定した場合、調停手段1
02aは、アクセス可能信号(106a)をアサートす
る。
されると、同期化手段103aは、後に説明する制御動
作によって、アクセス許可信号(信号線93a)をアサ
ートする。そして、調停手段102aは、アクセス許可
信号93aがアサートされると、アクセス可能信号10
6aをネゲートする。
装置130aにアクセス権を与えることを決定した場
合、調停手段102aは、アクセス許可信号(123
a)をアサートする。
0aおよび11bも、上述したような、多重化バス制御
装置100aと同様の動作を行なう。
30bとが同期動作中であれば、多重化バス制御装置1
00aと多重化バス制御装置100bの動作も同期して
行なわれる。多重化バス制御装置100aと多重化バス
制御装置100bは、システムの立ち上げ時に、それぞ
れ、プライマリ・モードとセカンダリ・モードに設定さ
れる。プライマリ・モードでは、多重化バス120aに
よる信号の入出力が可能な状態である。また、セカンダ
リ・モードは、多重化バス120aからの、信号の入力
のみが可能状態であり、多重化バス120aへの、信号
の出力は不可能である。
装置30bの双方の装置から、同時にI/Oバス制御装
置130aへアクセスを行なう場合、実際には、演算処
理装置30aのみがアクセス動作を行ない、I/Oバス
制御装置130aから、演算処理装置30aと演算処理
装置30bへのアクセスは同時に行われる。
算装置およびI/Oバス制御装置からのアクセス要求の
調停、調停手段が自系の演算処理装置にアクセス権を与
えることを、他系に伝える動作、演算処理装置へのアク
セス許可信号を伝送する動作等を行なう。
示す。同期化手段103aは、コントロール部1031
aとタイマー部1032aとを有して構成される。
aがアクセス可能信号106aをアサートしてから、予
めユーザーが設定したタイムアウト時間内に、調停手段
102bがアクセス可能信号106bをアサートしなか
ったことをコントロール部1031aに通知する機能を
有する。
セス可能信号106aがアサートされると内蔵する、時
間を計測する機能を有する時間計測手段(図示せず)を
起動し、起動時から予め定めたタイムアウト時間が経過
するとタイムアウト信号(1033a)をアサートし、
また、アクセス可能信号106bがアサートされると、
前記時間計測手段がリセットされる。タイムアウト時間
の設定は、タイマー部1032aが備えるレジスタへの
書き込み操作によって行うことができるようにしておけ
ばよい。
ド信号(86a)、アクセス可能信号(106a)、ア
クセス可能信号(106b)、および、タイマー部10
32aからのタイムアウト信号(1033a)を入力
し、これらの入力信号に基いて、アクセス許可信号(9
3a)と同期化成功信号(108a)を出力する処理を
行なう。
素子の組み合わせ回路で実現でき、コントロール部10
31aにおける具体的な制御動作の態様は、以下に示す
ものがある。
6aがアサートされていない場合には、アクセス可能信
号(106a)がアサートされると、コントロール部1
031aは、アクセス許可信号93aのみをアサートす
る。
(86a)がアサートされ、かつ、アクセス可能信号
(106a)とアクセス可能信号(106b)がアサー
トされた場合、コントロール部(1031a)は、アク
セス許可信号(93a)と同期化成功信号(108a)
をアサートする。
(86a)がアサートされ、かつ、アクセス可能信号
(106a)とタイムアウト信号(1033a)がアサ
ートされた場合、コントロール部(1031a)は、ア
クセス許可信号93aのみをアサートする。
に基づいて同期化成功信号(108a)をアサートし、
該信号を系間インターフェイスに伝える機能を有する。
エラーが発生した場合の、障害回復処理プログラムの実
行による障害回復動作を説明するためのフローチャート
を示す。
る動作、右側には、B系演算処理装置における動作を示
す。
ラー(故障の発生)が検出されると(ステップ501
0)、エラー検出信号(73b)がアサートされ、故障
フラグ84bがセットされる(ステップ5020)。
フラグ81aと81bがリセットされる。
を停止し(ステップ5040)、A系演算処理装置30
aが、単独で処理を継続することになる。この時点で、
2重系動作が行なわれなくなる。
B系演算処理装置30bの故障部分、例えば、故障した
プロセッサやメモリ等を、正常動作する同一の機能を有
するデバイスと交換する作業を行ない(ステップ505
0)、作業完了後に、端末装置170の操作等によっ
て、B系演算処理装置30bを起動する(ステップ50
60)。
端末装置170の操作により行なえるようにシステムを
構成してもよいし、B系演算処理装置30bに起動スイ
ッチを設け、この起動スイッチの操作によって、起動操
作に対応した処理を行なうプログラムを実行するように
しておいてもよい。
作が行なわれると、ROM88bに内蔵してある、初期
化プログラムの実行により、プロセッサ40b、50b
が備えるキャッシュメモリやメモリ装置60bの記憶内
容等をクリアするとともに、故障フラグ84bをリセッ
トし、復旧フラグ89aをセットする(ステップ507
0)。
サ40a、50aは、例えば、通常行なっている処理の
合間をみて、B系の故障フラグ84bの内容を適宜リー
ドして監視する動作を行なっている(ステップ508
0)。もちろん、所定時間間隔で故障フラグ84bの内
容をリードして監視する動作を行なうようにしても良
い。
た場合(5090)、メモリ装置60aの内容を、メモ
リ装置60bにコピーするメモリコピー処理を行う(ス
テップ5100)。
a、50aが、メモリ装置60aを一定領域単位に所定
時間間隔でリードし、リードした内容を、コントロール
ユニット70a、システムバス90a、多重化バス制御
装置100aと110a、多重化バス120aと120
bを介し、さらに、多重化バス制御装置100bと11
0b、システムバス90b、コントロールユニット70
bを介して、メモリ装置60bにライトする処理であ
る。
ための準備が行なわれる。
モリコピーを開始してから、A系演算処理装置30aと
B系演算処理装置30bの同期化が成功するまで、プロ
セッサ40a、50aまたはI/O装置160aから、
メモリ装置60aへのライトデータも上記の経路によっ
て、メモリ装置60bにライトする機能を有する。
憶内容と、メモリ装置60aの記憶内容とが一致する。
リ装置60aの全記憶領域のリード動作を完了すると、
即ち、メモリ装置60aの全記憶内容をメモリ装置60
bにライトすると、プロセッサ40a、50aは、同期
化タスクを実行する(ステップ5110)。
とB系演算処理装置30bを再同期させるための処理で
ある。プロセッサ40a、50aは、故障していないた
め、通常処理の合間をみて同期化タスクを実行すればよ
いが、1回目の同期化タスク実行で同期化を実現できる
とは限られないため、2回以上、同期化タスクを実行す
る場合もある(ステップ5120等)。このような、リ
トライ処理を行なうようにプログラミングしておけばよ
い。
実現しない場合、自動的にリトライ処理を行なうように
してもよい。
て実行する必要はなく、通常処理の合間に実行すればよ
い。上記の同期化タスクは、後述するように、他系の同
期要求フラグをセットする処理を含んでおり、この処理
によって、プロセッサ40a、50aは、同期化タスク
の実行時に、同期要求フラグ82bをセットする。
は、同期要求フラグ82bの内容を定期的にリードして
おり(ステップ5130)、同期要求フラグ82bがセ
ットされると(5140)、プロセッサ40b、50b
も同期化タスクを実行する(ステップ5150)。
0aとB系演算処理装置30bが同期化すると、A系プ
ロセッサ40a、50aおよびB系プロセッサ40b、
50bは同期化タスクを終了し(ステップ5160)、
通常処理を開始する。
に障害が発生しても、他系に障害回復動作のための過大
な処理時間を要求しないで障害回復を行ない、再同期を
行なうことができる。
フローチャートである。
同期化タスクが実行されると、プロセッサ40a、50
aによって、(他系)同期化要求フラグ82bおよび
(自系)同期化待ちフラグ83aをセットする(ステッ
プ6010)。
化タスクを実行することによって、同期化要求フラグ8
2aがセットされたならば、系間インターフェース80
aは、同期化モード信号86aをアサートする。次に、
特定のアドレスに対するアクセスである、PIOアクセ
スを発行する(ステップ6020)。
クのプログラムにおいて、予め指定した多重化バス制御
装置の内部レジスタのアドレスやI/O装置におけるア
ドレス等である。
演算処理装置30aによるPIOアクセスと、B系の演
算処理装置30bによるPIOアクセスとの、アクセス
時間を等しくするためである。
ドレスは、完全に一致させるのが好ましいが、例えば、
所定のエリアが有するアドレス(アドレスの値に幅があ
る)をアクセスするようにしてもよい。
を、複数に分割し、各分割部分に前記特定アドレスを格
納しておき、いずれかの特定アドレスを用いて本発明に
かかる処理を行なうようにしてもよい。
装置30aは、アクセス要求信号92aをアサートす
る。そして、調停手段102aは、アクセス要求信号9
2aに対し、アクセス可能信号106aをアサートす
る。同期化手段103aは、前述したように、アクセス
許可信号93aをアサートと、条件が満足すれば同期化
成功信号108aもアサートする。
トされると同期フラグ81aが、セットされる。プロセ
ッサ40a、50aは、PIOアクセスが完了した後
に、同期フラグ81aの内容を調べる(ステップ603
0)。
いれば(Yes)、(他系)同期化要求フラグ82b
と、(自系)同期待ちフラグ83aと、(自系)復旧フ
ラグ89aをリセットして(ステップ6040)、同期
化タスクの処理を終了する。
なければ(No)、復旧フラグ89aの内容を調べ(ス
テップ6050)、復旧フラグ89aがセットされてい
れば(Yes)、再び、PIOアクセスを発行し(60
20)、復旧フラグ89aがセットされていなければ
(No)、(他系)同期化要求フラグ82bと、(自
系)同期待ちフラグ83aと、(自系)復旧フラグ89
aをリセットして(ステップ6040)同期化タスクの
処理を終了する。
する(PIO)アクセス動作が許可されて、PIOアク
セスが実際に行なわれることによって、両演算装置の再
同期を行なうもの、すなわち、実際のPIOアクセスを
基準信号として、同期化を行なっているが、特定のアド
レスに対するアクセス許可信号93a、93bが生成さ
れる際、これらの許可信号を、両演算装置の再同期を行
なうための基準信号として、両演算装置の動作のタイミ
ング調整を行なっても良い。
スクの処理が実行される。
算処理装置30aとB系の演算処理装置30bが行なう
同期化までの動作の変化状態を示した図である。
50a、多重化バス制御装置100a、系間インターフ
ェイス80aの動作状態の変化を示し、右側は、B系の
系間インターフェイス80b、多重化バス制御装置10
0b、プロセッサ40b、50bの動作状態の変化を示
す。
化タスクを起動すると(7010)、同期化要求フラグ
82bおよび同期待ちフラグ83aをセットする(70
20)。
的に同期化要求フラグ82bの内容をリードしており
(7030)、同期化要求フラグ82bがセットされて
いると同期化タスクを起動する(7040)。
化バス制御装置100aにPIOアクセスを要求するが
(7050)、B系のプロセッサ40b、50bによる
同期化要求フラグ82aおよび同期待ちフラグ83bの
セット(7060)が遅れると、系間インターフェース
80aは同期化モード信号86aをアサートしないの
で、多重化バス制御装置100aは、アクセス許可信号
93aだけをアサートする(7070)。
は、アクセス許可信号93aがアサートされるとPIO
アクセスを実行する(7080)。
化要求フラグ82bと同期待ちフラグ83bはセットさ
れているので、B系の系間インターフェース80bは、
同期化モード信号86bをアサートする(7090)。
化バス制御装置100bにPIOアクセスを要求するが
(7100)、同期化モード信号86bがアサートされ
ているので、多重化バス制御装置100bは、多重化バ
ス制御装置100aがアクセス可能信号106aをアサ
ートするか、系間インターフェース80bが同期化モー
ド信号86bをネゲートするか、同期化手段103bの
タイマー部1032bがタイムアウトを通知するまで、
アクセス許可信号93bおよび同期化成功信号108b
のいずれもアサートしない(7110)。
Oアクセス終了後、同期フラグ81aの内容をリード
し、同期フラグ81aがセットされていないと、同期化
要求フラグ82bおよび同期待ちフラグ83aをリセッ
トして(7120)、同期化タスクを終了し(713
0)、通常処理のタスクを起動する(7140)。
期化要求フラグ82bがリセットされると同期化モード
信号86bをネゲートする(7150)。多重化バス制
御装置100bは、同期化モード信号86bがネゲート
されると、アクセス許可信号93bだけをアサートする
(7160)。
セス許可信号93bがアサートされると、PIOアクセ
スを実行する(7170)。プロセッサ40b、50b
は、PIOアクセス終了後に同期フラグ81bの内容を
リードし、同期フラグ81bがセットされていなけれ
ば、再度PIOアクセス要求を試みる(7180)。
の良い時に(例えば、1つのサブルーチンに対する処理
の終了後等)通常処理のタスクを終了させ(719
0)、再度同期化タスクを起動する(7200)。
する、各構成要素の動作について説明する。
化要求フラグ82bおよび同期待ちフラグ83aをセッ
トすると(7210)、同期化要求フラグ82aおよび
同期待ちフラグ83bは、既にセットされているので、
系間インターフェース80aと80bは、同期化モード
信号(86a)と同期化モード信号(86b)をアサー
トする(7220)。
が、多重化バス制御装置100aに対し、PIOアクセ
スを要求すると(7230)、多重化バス制御装置10
0aは、アクセスの調停結果として、アクセス可能信号
(106a9をアサートする(7240)。
期化手段103aは、多重化バス制御装置100bがア
クセス可能信号(106b)をアサートするか、タイマ
ー部1032aがタイムアウトを通知するまで、アクセ
ス許可信号(93a)および同期化成功信号(108
a)のいづれもアサートしない。
が、多重化バス制御装置100bに対し、PIOアクセ
スを要求すると(7250)、多重化バス制御装置10
0bは、アクセスの調停結果として、アクセス可能信号
(106b)をアサートする(7260)。
期化手段103aと多重化バス制御装置100bの同期
化手段103bとは、アクセス許可信号(93a)とア
クセス許可信号(93b)、および、同期化成功信号
(108a)と同期化成功信号(108b)のすべてを
同時にアサートする(7270)。
クセス許可信号(93b)が同時にアサートされると、
A系のプロセッサ40a、50aとB系のプロセッサ4
0b、50bは、同時にPIOアクセスを実行する(7
280)。
期化成功信号(108b)とがアサートされると、系間
インターフェース80aと系間インターフェース80b
は、同期フラグ81aと同期フラグ81bとをセットす
る(7290)。
と、B系のプロセッサ40b、50bとは、PIOアク
セス終了後に、それぞれ自系の同期フラグ81a、同期
フラグ81bの内容をリードし、同期フラグ81a、8
1bがセットされていると、同期化要求フラグ82a、
同期化要求フラグ82b、同期待ちフラグ83a、同期
待ちフラグ83a、および、復旧フラグ89a、復旧フ
ラグ89bをリセットして(7300)、同期化タスク
の処理を終了し(7310)、通常処理のタスクを起動
する(7320)。以後、A系の演算処理装置30aと
B系の演算処理装置30bは同期動作を行うことにな
る。
重系の動作にを行なうシステムについて説明してきた
が、3重系以上の多重化コンピュータシステムについて
も本発明を適用できることは、いうまでもない。
を行なう際に、演算処理装置は、アクセス要求に対する
信号であるアクセス許可信号を受け取るまでアクセス許
可待ち状態であることを利用し、さらに、演算処理装置
30a、30bに、PIOアクセスのアクセス許可信号
93a、93bを同時にアサートすることにより、演算
処理装置30a、30bにPIOアクセスを同時に実行
させて、演算処理装置30a、30bの同期化を実現す
ることを可能にする。
セット動作等を不要とし、極めて短時間内のの通常動作
の停止で、両装置の同期化を実現できることになる。さ
らに、本発明によれば、従来のように、複数の演算処理
装置を同期化するための特別なリセット手段を設ける必
要ななく、通常のシステム構成に、複数種類のフラグと
単純な組み合わせ回路を有した手段を備えることにより
簡単に構成でき、同期化を行なうための手段を設ける際
のコスト増加も低減できる。
構成された耐障害性機能を有するコンピュータシステム
において、所定のアドレスをアクセスした応答信号を複
数の演算処理装置に同時に送信することにより、障害か
ら復旧した演算処理装置の再同期化を行なう構成にする
ことによって、同期化を行なうためのシステムリセット
を不要とし、極めて短時間内の動作停止によって再同期
化を行なえ、迅速な再同期処理を行なうことを可能にす
る。
際のコスト増加も低減できる。
ロセッサ、50b…プロセッサ、60a…メモリ装置、
60b…メモリ装置、70a…コントロールユニット、
70b…コントロールユニット、80a…系間インター
フェース、80b…系間インターフェース、88a…障
害回復プログラム格納用ROM、88b…障害回復プロ
グラム格納用ROM、90a…システムバス、90b…
システムバス、100a…多重化バス制御装置、110
a…多重化バス制御装置、100b…多重化バス制御装
置、110b…多重化バス制御装置、120a…多重化
バス、120b…多重化バス、130a…I/Oバスア
ダプタ、130b…I/Oバスアダプタ、140a…I
/Oバス、140b…I/Oバス、150a…I/Oイ
ンターフェース、150b…I/Oインターフェース、
152a…I/Oインターフェース、152b…I/O
インターフェース、160a…I/O装置、160b…
I/O装置、170…端末装置
Claims (6)
- 【請求項1】同一の演算処理を同期して行なう複数の演
算処理装置と、 前記各演算処理装置に接続され再同期の処理を行なう同
期処理装置と、 を備え、 前記各演算処理装置は、 他の演算処理装置の、故障からの回復を検出する故障回
復検出手段と、 前記故障回復検出手段が他の演算処理装置の、故障から
の回復を検出した場合および自演算処理装置が故障から
回復した場合に、それぞれ、予め定められたアドレスに
対するアクセス要求を行なう手段と、 前記アドレス要求に対するアクセス許可に応じて、前記
アドレスに対するアクセスを行なうアクセス手段と、 を備え、 前記同期処理装置は、 前記正常動作する演算処理装置による前記アクセス要求
と前記故障から回復した演算処理装置による前記アクセ
ス要求との時間差が、予め定めた時間差以内である場合
には、前記正常動作する演算処理装置および前記故障か
ら回復した演算処理装置の双方のアクセス手段に、同時
に、前記アクセス許可を与える同期化手段を備える、 ことを特徴とする多重化コンピュータシステム。 - 【請求項2】同一演算処理を同期して行なう演算処理装
置のいずれかが故障した場合、故障から回復した演算処
理装置を、他の演算処理装置の演算処理動作に再同期さ
せる障害回復方法であって、 正常動作するいずれかの演算処理装置が、他の演算処理
装置の、故障からの回復を検出した場合に、予め定めら
れたアドレスに対するアクセス要求を行なう処理と、 故障から回復した演算処理装置が、前記アドレスに対す
るアクセス要求を行なう処理と、 前記正常動作する演算処理装置による前記アクセス要求
と前記故障から回復した演算処理装置によるアクセス要
求との時間差が、予め定めた時間差以内である場合に
は、前記正常動作する演算処理装置及び前記故障から回
復した演算処理装置に接続された同期処理装置が、前記
正常動作する演算処理装置及び前記故障から回復した演
算処理装置に、同時に、前記アドレス要求に対するアク
セス許可を与える処理と、 を含むことを特徴とする障害回復方法。 - 【請求項3】請求項1記載の多重化コンピュータシステ
ムにおいて、 前記各演算処理装置は、 前記複数の演算処理装置のいずれかの演算処理装置が故
障した場合には、同期フラグをリセットし、前記正常動
作する演算処理装置による前記アクセス要求と前記故障
から回復した演算処理装置によるアクセス要求との時間
差が前記予め定めた時間差以内である場合には、前記同
期フラグをセットする同期フラグ設定部を備えることを
特徴とする多重化コンピュータシステム。 - 【請求項4】請求項1記載の多重化コンピュータシステ
ムにおいて、 前記各演算処理装置は、 他の演算処理装置から同期化を行なうことを要求されて
いることを示すフラグである同期化要求フラグを設定す
る同期化要求フラグ設定部と、 自演算処理装置が前記他の演算処理装置に同期化を行な
うことを要求することを示すフラグである同期化待ちフ
ラグを設定する同期化待ちフラグ設定部と、 を備え、 前記各演算処理装置の、前記アクセス要求を行う手段
は、 前記同期化要求フラグ設定部および前記同期化待ちフラ
グ設定部の双方にフラグが設定されている場合に、前記
アドレスに対するアクセス要求を行うことを特徴とする
多重化コンピュータシステム。 - 【請求項5】請求項4記載の多重化コンピュータシステ
ムにおいて、 前記同期処理装置は、 前記同期化要求フラグ設定部および前記同期化待ちフラ
グ設定部の双方にフラグが設定されている場合であっ
て、全演算処理装置に対してアクセス許可を与える際
に、全演算処理装置に同期化が成功した旨を報告する手
段を備えることを特徴とする多重化コンピュータシステ
ム。 - 【請求項6】請求項1記載の多重化コンピュータシステ
ムにおいて、 前記各演算処理装置は、 予め定めた所定時間内に、前記アドレスに対するアクセ
ス許可を受け取れない場合に、前記アドレスに対するア
クセス要求を再度行うリトライ手段を備えることを特徴
とする多重化コンピュータシステム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP07880395A JP3438986B2 (ja) | 1995-04-04 | 1995-04-04 | 多重化コンピュータシステムおよび障害回復方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP07880395A JP3438986B2 (ja) | 1995-04-04 | 1995-04-04 | 多重化コンピュータシステムおよび障害回復方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH08278950A JPH08278950A (ja) | 1996-10-22 |
| JP3438986B2 true JP3438986B2 (ja) | 2003-08-18 |
Family
ID=13672022
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP07880395A Expired - Fee Related JP3438986B2 (ja) | 1995-04-04 | 1995-04-04 | 多重化コンピュータシステムおよび障害回復方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3438986B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4558111B2 (ja) * | 1998-08-17 | 2010-10-06 | 株式会社Ihi | 三重系フォールトトレラントシステムのデータ変更方法 |
| JP4492035B2 (ja) | 2003-04-21 | 2010-06-30 | 日本電気株式会社 | データ処理装置 |
-
1995
- 1995-04-04 JP JP07880395A patent/JP3438986B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH08278950A (ja) | 1996-10-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1078317B1 (en) | Method for switching between multiple system processors | |
| EP0306244A2 (en) | Fault tolerant computer system with fault isolation | |
| EP0315303A2 (en) | Duplicated fault-tolerant computer system with error checking | |
| EP0306209A2 (en) | Dual rail processors with error checking at single rail interfaces | |
| EP0306348A2 (en) | Dual rail processors with error checking on i/o reads | |
| EP0306252A2 (en) | Fault tolerant computer system input/output interface | |
| JP2002518734A (ja) | マルチプロセッサ・システム用のブリッジにおけるメモリ・ページ変更のトラッキング | |
| JP2002518745A (ja) | サイクル終了モニタ付きのバス・コントローラ | |
| JP2002518738A (ja) | ポスティング済み書き込みバッファを備えたプロセッサ・ブリッジ | |
| JP2002518739A (ja) | マルチプロセッサ・システム・ブリッジ | |
| EP0868692B1 (en) | Processor independent error checking arrangement | |
| JP2002518736A (ja) | アクセスが制御されるマルチプロセッサ・システム・ブリッジ | |
| JP2002518742A (ja) | マルチプロセッサ・システム用のブリッジにおける直接記憶アクセス | |
| EP0683456A1 (en) | Fault-tolerant computer system with online reintegration and shutdown/restart | |
| JP3329986B2 (ja) | マルチプロセッサシステム | |
| US20020065996A1 (en) | Processor state reintegration | |
| AU2005246990A1 (en) | Fault tolerant computer system and interrupt control method for the same | |
| US7493517B2 (en) | Fault tolerant computer system and a synchronization method for the same | |
| JP2002518737A (ja) | 異種データ・アクセスを伴うプロセッサ・ブリッジ | |
| GB2369690A (en) | A dirty memory using redundant entries indicating that blocks of memory associated with the entries have been written to | |
| JP2002526818A (ja) | コンピュータ・システムにおけるリソース制御 | |
| JP3438986B2 (ja) | 多重化コンピュータシステムおよび障害回復方法 | |
| US6981172B2 (en) | Protection for memory modification tracking | |
| JP3424968B2 (ja) | 計算機システム及びプロセッサチップ及び障害復旧方法 | |
| JPH06242979A (ja) | 二重化コンピュータ装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080613 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080613 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090613 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100613 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100613 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130613 Year of fee payment: 10 |
|
| LAPS | Cancellation because of no payment of annual fees |