JPH08235133A

JPH08235133A - 多重処理システム

Info

Publication number: JPH08235133A
Application number: JP7040659A
Authority: JP
Inventors: Tetsuo Hasegawa; 哲夫長谷川
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1995-02-28
Filing date: 1995-02-28
Publication date: 1996-09-13

Abstract

(57)【要約】【目的】ハードウェアの故障やプログラムのバグで計算
機に障害が発生した場合でも、全計算機のダウンを防止
できる多重処理システムを提供する。【構成】複数の計算機１〜４を先行系の計算機１，２と
追従系の計算機３，４とに分類し、先行系の計算機に特
定のアプリケーションプロセス群を実行開始させるとと
もに先行系の計算機の実行開始時点より所定の条件を満
たす期間だけ遅れた時点から追従系の計算機で上記特定
のアプリケーションプロセス群を実行開始させる手段
と、先行系の計算機がハードウェアの障害でダウンした
か否かを判定する手段と、この手段で先行系の計算機が
ハードウェアの障害以外の原因でダウンした判定された
ときには、ダウンしたときに先行系の計算機で実行して
いたアプリケーションプロセスを追従系の計算機のアプ
リケーションプロセス群の中から取り除いて追従系の計
算機を先行系として動作させる手段とを有している。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、複数の計算機で同一の
処理ないし同一の機能を有する処理を並行して実行する
多重処理システムに関する。

【０００２】

【従来の技術】変動するデータを処理し、その処理結果
を化学・鉄鋼プラントのような産業システム、交通制御
システムあるいは原子力プラントのような電力システム
といった制御対象システムに伝達制御するシステムにお
いては、いかなる状況下にあってもシステムを常に安全
に制御し、システムに与えられたミッションを確実に達
成することが要求される。

【０００３】このような要求に対し、複数の計算機によ
り同一処理または同一機能を有する処理を並行して実行
する多重処理システムが従来から利用されている。多重
処理システムには、以下に示す種々の方式がある。

【０００４】(1) 複数の計算機で同一のアプリケーショ
ンプロセス群を実行する方式複数の計算機に同一のアプリケーションプロセス群を実
行させる多重処理システムでは、たとえ１台の計算機が
何らかの障害によってダウンしても、他の計算機で処理
を続行させることができるので、処理の中断を避けるこ
とができる。この方式の多重処理システムは、いずれか
１台の計算機にハードウェア障害が発生する確率に比べ
て複数の計算機に同時にハードウェア障害が発生する確
率が非常に低いことを有効に利用している。

【０００５】しかしながら、アプリケーションプロセス
のプログラムが完全であるという保証はない。プログラ
ムバグを含むアプリケーションプロセスを実行すると、
計算機に障害が発生し、この障害は全ての計算機で起こ
る。従って、たとえ並列多重処理を行っていても、シス
テムでの処理が中断することになる。

【０００６】小型の計算機や制御用に用いられる高速応
答性を重視した計算機においては、計算機の動きを管理
するＯＳ（オペレーティングシステム）等の保護機構が
弱く、アプリケーションプロセスのプログラムバグによ
り障害の発生する可能性が高い。従って、並列多重処理
を行っても、一部のアプリケーションプロセスのプログ
ラムバグでシステム全体の処理が中断してしまうという
問題がある。

【０００７】(2) 複数の計算機で同一の機能を有する複
数の版のプログラムに従ってアプリケーションプロセス
を並行に実行する方式複数の計算機に同一の機能を有する複数の版（バージョ
ン）のプログラム構造に基づくアプリケーションプロセ
スを並行に実行させる多重処理システムでは、たとえ１
台の計算機が何らかの障害によってダウンするか、また
は内部状態に矛盾を起こしたとき外部に悪影響を及ぼす
ことを避けるために以降の処理を中断しても、他の計算
機で処理を続行させることができるので、処理の中断を
避けることができる。

【０００８】この方式の多重処理システムは、いずれか
１台の計算機にハードウェア障害が発生する確率が複数
台の計算機に同時に発生する確率に比べて非常に少ない
ことに加えて、同一機能を有するアプリケーションプロ
セスを有するいずれかの版のプログラムにプログラムバ
グが存在して障害が発生しても、同一の機能を有する他
の版のプログラムにはプログラムバグが存在せず、障害
が発生しない可能性が高い点を有効に利用している。

【０００９】この方式の並列処理システムにおいて、シ
ステム全体の処理が中断されないためには、同一の機能
を有する複数の版のプログラムのうちの最低１つの版は
障害が発生しないことが条件である。

【００１０】しかし、障害が発生しにくい安全な作り方
をしたいわゆる安全版プログラムは実行時間が余分にか
かる場合が多く、その結果、このような安全版プログラ
ムに従って処理を実行させると、システム全体としての
処理時間が遅くなってしまうという問題がある。

【００１１】安全版プログラムの実行時間が余分にかか
る理由は、プログラム中の随所に障害発生を防ぐための
異常検出処理を追加しなくてはならないことにある。な
お、時間がかかる処理の代表である検索処理において、
不要な検索を防ぐための処理を追加することによって処
理時間を短縮する手法も各種考案されているが、一般に
高速化するためには余分な処理が必要であり、それに伴
ってプログラムバグが発生し易くなる。

【００１２】(3) 複数の計算機内で稼働するプログラム
全体をＮ版プログラム方式によって多重化する方式プログラムの多重化は、本来プログラムを複製して複数
の計算機で実行する方式であるから、プログラムにバグ
が内在していれば、多重化していても共通のバグが原因
で計算の停止やシステムの一部機能の停止を引き起こす
原因となり、システムに与えられたミッションを達成す
ることが不可能になる。

【００１３】このような事態を回避するための一つの方
式として、“Ｎ版プログラム方式”がある。この方式は
(2) の方式と類似しているが、特に同一機能を達成する
複数の版（バージョン）のプログラムを別々の設計者が
異なる手順で互いに隔離された環境下で作成することが
特徴である。そして、このようにして作成された同一機
能を果たす異なったプログラム群を複数の計算機内で並
列に実行し、それにより得られた複数の出力結果のうち
過半数が一致したものを正しい出力結果として選択す
る。

【００１４】この“Ｎ版プログラム方式”は、複数版の
プログラムモジュール群を相互に隔離された複数の設計
者で作成するため、プログラムモジュール数が多くなる
ほどプログラム作成コストの増大を招くとともに保守管
理のコスト増大を引き起こすことになる。例えば、３チ
ームが独立に異なる手順で同一機能のプログラムを開発
する場合、従来と同一水準の品質を保証するプログラム
を開発するには３倍の開発人員が必要となり、保守の観
点からも３つの版のプログラム保守・管理のコスト増大
は避けられない。また、３つの版のプログラムを並列に
動作させて結果を判定する場合、最も処理の遅いプログ
ラムの処理性能でシステム性能が決まってしまうため、
処理速度は必然的に遅くなる。

【００１５】上述の如く、(1) のシステムではいずれか
の計算機がハードウェア障害によってダウンしても処理
を続行できる利点はあるが、アプリケーションプロセス
のプログラムにバグが含まれていたときには全計算機が
ダウンする問題があり、（２）のシステムではいずれか
の計算機がハードウェア障害によってダウンした場合
や、いずれかの版のプログラムにバグが含まれていた場
合でも他の安全版のプログラムに従って処理を続行でき
る利点はあるが、安全版のプログラムに従って処理を実
行させると処理時間が大幅に遅くなる問題があり、
（３）のシステムではいずれかの計算機がハードウェ
ア障害によってダウンした場合や、いずれかの版のプロ
グラムにバグが含まれている場合でも他の版のプログラ
ムに従って処理を続行できる利点はあるが、処理時間が
遅くなるとともにプログラムの開発コストおよび保守・
管理コストの増加を招く問題があった。

【００１６】

【発明が解決しようとする課題】上述の如く、従来の多
重処理システムにあっては、いずれかの計算機がハード
ウェア障害によってダウンした場合でも高速な処理を続
行できること、アプリケーションプロセスのいずれかの
プログラムにバグが含まれていた場合においても高速な
処理を続行できること、という２つの望まれる要件を満
すことができないため、これらの障害発生時に効率の悪
い処理速度でしか運転できない問題があった。

【００１７】そこで本発明は、ハードウェア障害やプロ
グラムバグに起因して全計算機がダウンするのを防止で
きるとともに、特に障害が発生した時でも効率の良い処
理速度で運転を続行させることができる多重処理システ
ムを提供することを目的としている。

【００１８】

【課題を解決するための手段】上記目的を達成するため
に、第１の発明に係る多重処理システムでは、複数の計
算機と、これらの計算機を先行系の計算機と追従系の計
算機とに分類し、上記先行系の計算機に特定のアプリケ
ーションプロセス群を実行開始させるとともに、上記先
行系の計算機の実行開始時点より所定の条件を満たす期
間だけ遅れた時点から上記追従系の計算機で上記特定の
アプリケーションプロセス群を実行開始させる手段と、
前記先行系の計算機がダウンしたときに、ダウンの原因
がハードウェアの障害によるものか否かを判定する判定
手段と、この判定手段で前記先行系の計算機がハードウ
ェアの障害以外の原因でダウンしたと判定されたときに
は、ダウンしたときに上記先行系の計算機で実行してい
たアプリケーションプロセスを前記追従系の計算機のア
プリケーションプロセス群の中から取り除いて上記追従
系の計算機を先行系として動作させる手段とを備えてい
る。

【００１９】上記目的を達成するために、第２の発明に
係る多重処理システムでは、複数の計算機と、これらの
計算機を先行系の計算機と追従系の計算機とに分類し、
上記先行系の計算機に特定のアプリケーションプロセス
群を実行開始させるとともに、上記先行系の計算機の実
行開始時点より所定の条件を満たす期間だけ遅れた時点
から上記追従系の計算機で上記特定のアプリケーション
プロセス群を実行開始させる手段と、前記先行系の計算
機がダウンしたときに、ダウンの原因がハードウェアの
障害によるものか否かを判定する判定手段と、この判定
手段で前記先行系の計算機がハードウェアの障害以外の
原因でダウンしたと判定されたときには、ダウンしたと
きに上記先行系の計算機で実行していたアプリケーショ
ンプロセスを前記追従系の計算機のアプリケーションプ
ロセス群の中から取り除くとともに上記追従系を構成し
ている計算機を新先行系と新追従系とに再構成し、上記
新先行系の計算機側から残りのアプリケーションプロセ
スを実行開始させる手段とを備えている。

【００２０】上記目的を達成するために、第３の発明に
係る多重処理システムでは、複数の計算機と、これらの
計算機を先行系の計算機と追従系の計算機とに分類し、
上記先行系の計算機に特定のアプリケーションプロセス
群を実行開始させるとともに、上記先行系の計算機の実
行開始時点より所定の条件を満たす期間だけ遅れた時点
から上記追従系の計算機で上記特定のアプリケーション
プロセス群を実行開始させる手段と、前記先行系の計算
機がダウンしたときに、ダウンの原因がハードウェアの
障害によるものか否かを判定する判定手段と、この判定
手段で前記先行系の計算機がハードウェアの障害以外の
原因でダウンしたと判定されたときには、ダウンしたと
きに上記先行系の計算機で実行していたアプリケーショ
ンプロセスを前記追従系の計算機のアプリケーションプ
ロセス群の中から取り除くとともに上記追従系を構成し
ている計算機を新先行系と新追従系とに再構成し、上記
新先行系の計算機側から残りのアプリケーションプロセ
スを実行開始させる手段、前記判定手段で前記先行系の
計算機がハードウェアの障害でダウンしたと判定された
ときには、稼働中の計算機を新先行系と新追従系とに再
構成する手段とを備えている。

【００２１】上記目的を達成するために、第４の発明に
係る多重処理システムでは、同一の機能を有する複数の
版のアプリケーションプロセス用プログラムを保持した
複数の計算機と、これらの計算機を先行系の計算機と追
従系の計算機とに分類し、上記先行系の計算機で特定の
アプリケーションプロセス群をそれぞれ特定の版のプロ
グラムに従って実行開始させるとともに、上記先行系の
計算機の実行開始時点より所定の条件を満たす期間だけ
遅れた時点から上記追従系の計算機で上記特定のアプリ
ケーションプロセス群をそれぞれ上記特定の版あるいは
異なる版のアプリケーションプロセス用プログラムに従
って実行開始させる手段と、前記先行系の計算機がダウ
ンしたときに、ダウンの原因がハードウェアの障害によ
るものか否かを判定する判定手段と、この判定手段で前
記先行系の計算機がハードウェアの障害以外の原因でダ
ウンしたと判定されたときには、ダウンしたときに上記
先行系の計算機で実行していたアプリケーションプロセ
スを前記特定の版とは異なる版のプログラムに従って前
記追従系の計算機で実行させる手段とを備えている。

【００２２】上記目的を達成するために、第５の発明に
係る多重処理システムでは、同一の機能を有する複数の
版のアプリケーションプロセス用プログラムを保持した
複数の計算機と、これらの計算機を先行系の計算機と追
従系の計算機とに分類し、上記先行系の計算機で特定の
アプリケーションプロセス群をそれぞれ特定の版のプロ
グラムに従って実行開始させるとともに、上記先行系の
計算機の実行開始時点より所定の条件を満たす期間だけ
遅れた時点から上記追従系の計算機で上記特定のアプリ
ケーションプロセス群をそれぞれ上記特定の版あるいは
異なる版のアプリケーションプロセス用プログラムに従
って実行開始させる手段と、前記先行系の計算機がダウ
ンしたときに、ダウンの原因がハードウェアの障害によ
るものか否かを判定する判定手段と、この判定手段で前
記先行系の計算機がハードウェアの障害以外の原因でダ
ウンしたと判定されたときには、前記追従系を構成して
いる計算機を新先行系と新追従系とに再構成し、ダウン
したときに上記先行系の計算機で実行していたアプリケ
ーションプロセスを前記特定の版とは異なる版のプログ
ラムに従って上記新先行系の計算機側から残りのアプリ
ケーションプロセスを実行開始させる手段とを備えてい
る。

【００２３】上記目的を達成するために、第６の発明に
係る多重処理システムでは、同一の機能を有する複数の
版のアプリケーションプロセス用プログラムを保持した
複数の計算機と、これらの計算機を先行系の計算機と追
従系の計算機とに分類し、上記先行系の計算機で特定の
アプリケーションプロセス群をそれぞれ特定の版のプロ
グラムに従って実行開始させるとともに、上記先行系の
計算機の実行開始時点より所定の条件を満たす期間だけ
遅れた時点から上記追従系の計算機で上記特定のアプリ
ケーションプロセス群をそれぞれ上記特定の版あるいは
異なる版のアプリケーションプロセス用プログラムに従
って実行開始させる手段と、前記先行系の計算機がダウ
ンしたときに、ダウンの原因がハードウェアの障害によ
るものか否かを判定する判定手段と、この判定手段で前
記先行系の計算機がハードウェアの障害以外の原因でダ
ウンしたと判定されたときには、前記追従系を構成して
いる計算機を新先行系と新追従系とに再構成し、ダウン
したときに上記先行系の計算機で実行していたアプリケ
ーションプロセスを上記特定の版とは異なる版のプログ
ラムに従って上記新先行系の計算機側から残りのアプリ
ケーションプロセスを実行開始させる手段と、前記判定
手段で前記先行系の計算機がハードウェアの障害でダウ
ンしたと判定されたときには、稼働中の計算機を新先行
系と新追従系とに再構成する手段とを備えている。な
お、前記判定手段は、先行系の計算機の全てがダウンし
たときに、ハードウェアの障害以外の原因でダウンした
と判定する手段を備えたものが好ましい。

【００２４】

【作用】第１の発明に係る多重処理システムでは、複数
の計算機を先行系と追従系とに分類し、先行系の計算機
に特定のアプリケーションプロセス群を実行開始させる
とともに先行系の計算機より所定の条件を満たす期間だ
け遅れた時点から追従系の計算機で上記特定のアプリケ
ーションプロセス群を実行開始させる。そして、先行系
の計算機がダウンしたとき、ダウンの原因がハードウェ
アの障害によるものか否かを判定手段で判定させ、先行
系の計算機がハードウェアの障害以外の原因でダウンし
たと判定されたときには、ダウンしたときに先行系の計
算機で実行していたアプリケーションプロセスを追従系
の計算機のアプリケーションプロセス群の中から取り除
いて追従系の計算機を先行系として動作させる。

【００２５】したがって、追従系の計算機では、ダウン
の原因となったアプリケーションプロセスを含まないア
プリケーションプロセスの処理を続行することになるの
で、追従系の計算機までダウンするのを防止できる。ま
た、追従系での処理速度は先行系での処理速度と同じで
あるため、効率の良い処理を継続できることになる。ま
た、先行系を複数の計算機で構成する方式を採用してい
れば、判定手段でダウンの原因がハードウェア障害によ
るものと判定されても、先行系の計算機のうちの健全な
計算機で処理を続行させることができるので、処理速度
が低下するようなこともない。

【００２６】第２の発明に係る多重処理システムでは、
判定手段で先行系の計算機がハードウェアの障害以外の
原因でダウンしたと判定されたときに、ダウンしたとき
に先行系の計算機で実行していたアプリケーションプロ
セスを追従系の計算機のアプリケーションプロセス群の
中から取り除くとともに追従系を構成している計算機を
新先行系と新追従系とに再構成し、新先行系の計算機側
から残りのアプリケーションプロセスを実行開始させる
ので、第１の発明に係る多重処理システムと同様にダウ
ンの原因となったアプリケーションプロセスで追従系の
計算機までダウンするのを防止できるとともに、新先行
系と新追従系とに再構成しているので、次に起こり得る
ハードウェア障害以外の原因でのダウンに備えることが
できる。また、この場合も先行系（新先行系）を複数の
計算機で構成する方式を採用していれば、判定手段でダ
ウンの原因がハードウェア障害によるものと判定されて
も、先行系（新先行系）の計算機のうちの健全な計算機
で処理を続行させることができるので、処理速度が低下
するようなこともない。

【００２７】第３の発明に係る多重処理システムでは、
第２の発明に係る多重処理システムが備えている構成に
加えて、判定手段で先行系の計算機がハードウェアの障
害でダウンしたと判定されたときに、稼働中の計算機を
新先行系と新追従系とに再構成する手段を備えているの
で、新先行系の計算機数を常に複数に保つことが可能と
なり、次に起こり得るハードウェア障害によるダウンに
備えることができる。

【００２８】第４の発明に係る多重処理システムでは、
判定手段で先行系の計算機がハードウェアの障害以外の
原因でダウンしたと判定されたとき、ダウンしたときに
先行系の計算機で実行していたアプリケーションプロセ
スの版とは異なる版のプログラムに従って追従系の計算
機で実行させる手段を備えているので、第１〜３の発明
に係る多重処理システムと同様に、処理を続行させるこ
とができる。また、先行系を複数の計算機で構成する方
式を採用していれば、判定手段でダウンの原因がハード
ウェア障害によるものと判定されても、先行系の計算機
のうちの健全な計算機で処理を続行させることができ
る。

【００２９】第５の発明に係る多重処理システムでは、
判定手段で先行系の計算機がハードウェアの障害以外の
原因でダウンしたと判定されたときに、追従系を構成し
ている計算機を新先行系と新追従系とに再構成し、ダウ
ンしたときに先行系の計算機で実行していたアプリケー
ションプロセスの版とは異なる版のプログラムに従って
新先行系の計算機側から残りのアプリケーションプロセ
スを実行開始させる手段を設けているので、第４の発明
に係る多重処理システムと同様に処理を続行させること
ができるとともに、新先行系と新追従系とに再構成して
いるので、次に起こり得るハードウェア障害以外の原因
でのダウンに備えることができる。また、この場合も先
行系（新先行系）を複数の計算機で構成する方式を採用
していれば、判定手段でダウンの原因がハードウェア障
害によるものと判定されても、先行系（新先行系）の計
算機のうちの健全な計算機で処理を続行させることがで
きるので、処理速度が低下するようなこともない。

【００３０】第６の発明に係る多重処理システムでは、
第５の発明に係る多重処理システムの構成に加えて、判
定手段で先行系の計算機がハードウェアの障害でダウン
したと判定されたときに、稼働中の計算機を新先行系と
新追従系とに再構成する手段を備えているので、新先行
系の計算機数を常に複数に保つことが可能となり、次に
起こり得るハードウェア障害によるダウンに備えること
ができる。

【００３１】なお、ハードウェアの故障は通常各計算機
が持つ、たとえば、タイムアウト検出を用いたハードウ
ェア自己診断機能の診断結果を参照することによって知
ることができるが、先行系の計算機の全てがダウンした
ときに、ハードウェアの障害以外の原因でダウンしたと
判定する判定手段であれば、ハードウェア診断機能を備
えていない計算機群で構成されるシステムでも、その判
断が可能である。

【００３２】

【実施例】以下、図面を参照しながら実施例を説明す
る。図１には本発明の一実施例に係る多重処理システム
のブロック構成図が示されている。

【００３３】この多重処理システムは、大きく分けて、
計算機１〜４と、共有メモリ５と、この共有メモリと各
計算機１〜４とを結合するバス６とで構成されている。
各計算機１〜４は、演算装置１１，２１，３１，４１
と、ローカルメモリ１４，２４，３４，４４と、タイム
スライスを発生して各演算装置に知らせるタイマ１５，
２５，３５，４５とを備えている。なお、この例の場
合、各計算機のタイムスライスの間隔は同一に設定され
ている。

【００３４】各ローカルメモリ１４，２４，３４，４４
には、実行中プロセスキュー１２，２２，３２，４２、
実行遅延プロセスキュー１３，２３，３３，４３、アプ
リケーションプロセスの高速版プログラムを格納する高
速版プログラム格納エリア１６，２６，３６，４６、ア
プリケーションプロセスの安全版プログラムを格納する
安全版プログラム格納エリア１７，２７，３７，４７が
設定されている。なお、安全版プログラムは、高速版プ
ログラムと同一機能を有しているが、高速版プログラム
に比べて障害が発生しにくい安全な作り方をしたプログ
ラムであり、この例では高速版プログラムに比べて２倍
の実行時間を必要としている。

【００３５】共有メモリ５は、実行状態テーブル５１、
実行終了プロセステーブル５２、障害プロセステーブル
５３を持ち、これらが全計算機とバス６で結合され、全
計算機からアクセスされる。

【００３６】次に、上記のように構成された多重処理シ
ステムの動作を図２〜図４に示す流れ図を適宜参照しな
がら説明する。本実施例に係る多重処理システムでは、
４つの計算機１〜４を先行系と追従系とに分けて動作さ
せている。すなわち、「先行系期待台数」を２台とし、
当初、計算機１と２が先行系に分類され、計算機３と４
が追従系に分類されているものとする。また、各キュー
やテーブルの初期状態は空で何も登録されておらず、タ
イムスライス回数は０から始まるものとする。さらに、
高速版プログラム格納エリア１６，２６，３６，４６に
はそれぞれアプリケーションプロセスＰ１〜Ｐ３の高速
版プログラムが格納され、安全版プログラム格納エリア
１７，２７，３８，４７にはそれぞれＰ１〜Ｐ３の高速
版と同一機能を有する安全版プログラムが格納されてい
るものとする。また、本実施例では指定条件（障害が発
生しなかったことを後段に知らせる条件）として、アプ
リケーションプロセスの実行終了を用いている。

【００３７】そして、ここでは、各アプリケーションプ
ロセスＰ１〜Ｐ３の高速版プログラムにバグが無けれ
ば、図５に示すタイミングでＰ１〜Ｐ３が生成され、実
行されるべきところ、実際にはタイムスライス回数１回
目に計算機２がハードウェアの故障が原因でダウンし、
さらにＰ３の高速版プログラムにバグがあった場合を例
にとって説明する。

【００３８】まず、実行状態テーブル５１の内容は図６
に示す状態にあるものとする。この状態で全計算機１〜
４にプロセスＰ１が投入されたとする。プロセスＰ１が
投入されると、計算機１では図２に示す流れ図に従っ
て、まず発生プロセスが障害プロセステーブル５３に無
いことを確認し（Ｓ１１）、自計算機が先行系であるこ
とを確認し（Ｓ１３）、発生プロセスＰ１を、該プロセ
スのプログラムアドレスを高速版プログラム格納エリア
１６に格納されているＰ１の高速版プログラムのアドレ
スにして、実行中プロセスキュー１２に入れる（Ｓ１
４）。計算機２も同様の動作をする。

【００３９】一方、これと同時に計算機３では、やはり
図２に示す流れ図に従って、発生プロセスＰ１が障害プ
ロセステーブル５３に無く（Ｓ１１）、自計算機が追従
系で、かつＰ１が実行終了プロセステーブル５２にも無
いことを確認し（Ｓ１３）、発生プロセスＰ１を実行遅
延プロセスキュー３３に入れる（Ｓ１５）。計算機４も
同様の動作をする。

【００４０】この結果、計算機１〜４のキューの内容は
図７(a) ，(b) のようになる。この時点で、他のキュー
は依然空のままである。なお、以下の説明で用いる図で
は、実行中プロセスキュー１２，２２，３２，４２に格
納されているアプリケーションプロセスのうち、プログ
ラムアドレスとして高速版プログラムのアドレスになっ
ているプロセスをＰｎ（高）で表記し、安全版プログラ
ムのアドレスになっているプロセスをＰｎ（安）で表記
する。ただし、ｎ＝１〜３である。

【００４１】＜回数１のタイムスライス開始＞ここで、
タイムスライスが起きる。すると計算機１では図３に示
す流れ図に従って、現在実行中のプロセスが無いことを
確認して何もせず（Ｓ２１）、実行状態テーブル５１上
の自計算機の部分のタイムスライス回数を１増して
「１」にし（Ｓ２２）、自計算機が先行系であることを
確認し（Ｓ２３）、実行中プロセスキュー１２からプロ
セスＰ１を取り出してこれを現在実行中のプロセスとし
て実行状態テーブル５１に登録してプロセスＰ１を起動
する（Ｓ３１）。このＰ１はプログラムアドレスが高速
版プログラムのものであるため、高速版プログラムに従
って実行される。計算機２も同様に動作する。

【００４２】一方、これと同時に計算機３では、計算機
１と同様、図３に示す流れ図に従って、ステップＳ２２
まで計算機１と同様に動作するが、自計算機が追従系で
あるため（Ｓ２３）、先行系の「稼働中」の計算機のす
べてのタイムスライス番号が自計算機の「１」より２以
上遅れていない（この時点では先行系の計算機１、２と
も「０」または「１」である）ことを確認し（Ｓ２
４）、（先行系期待台数（この実施例では２）−タイム
スライス番号が自計算機より２以上遅れていない計算機
数（この時点で２））が０であることを確認し（Ｓ２
６）、実行終了プロセステーブル５２には何も入ってお
らず（Ｓ２９）、実行中プロセスキュー３２には何も入
っていないので何もしない（Ｓ３１）。計算機４も同様
に動作する。

【００４３】この結果、実行状態テーブル５１および各
キューの内容は図８(a) 〜(c) のようになる。この回数
１のタイムスライスの間に計算機１ではプロセスＰ１が
プロセスＰ２を生成する。すると、計算機１は図２に示
す流れ図に従い、発生プロセスＰ２が障害プロセステー
ブル５３に無いことを確認し（Ｓ１１）、自計算機が先
行系なので（Ｓ１３）、発生プロセスＰ２を、該プロセ
スのプログラムアドレスを高速版プログラム格納エリア
１６に格納されているＰ２の高速版プログラムのアドレ
スにして、実行中プロセスキュー１２に入れる（Ｓ１
４）。この結果の様子を図８(d) に示す。

【００４４】一方、この回数１のタイムスライスの間に
計算機２がハードウェアの故障が原因でダウンしたとす
る。＜回数２のタイムスライス開始＞次に、再度タイムスラ
イスが起きると、計算機１では図３に示す流れ図に従っ
て、現在実行中のプロセスＰ１を図８(d) に示す状態の
実行中プロセスキュー１２に入れ（Ｓ２１）、実行状態
テーブル５１上の自計算機の部分のタイムスライス回数
を１増して「２」にし（Ｓ２２）、自計算機が先行系で
あることを確認し（Ｓ２３）、実行中プロセスキュー１
２からＰ２を取り出して、これを現在実行中プロセスと
して実行状態テーブル５１に登録して起動する（Ｓ３
１）。このＰ２はプログラムアドレスが高速版のものな
ので、高速版プログラムに従って実行される。

【００４５】このとき、計算機２はダウンしているので
何もしない。一方、計算機３、４では、回数１のタイム
スライスの時と同様の手続きが行われる。この結果、実
行状態テーブル５１および各キューの内容は図９(a) 〜
(c)のようになる。

【００４６】この回数２のタイムスライスの間に計算機
１ではプロセスＰ２がプロセスＰ３を生成する。する
と、計算機１は図２に示す流れ図に従い発生プロセスＰ
３が障害プロセステーブル５３に無いことを確認し（Ｓ
１１）、自計算機が先行系なので（Ｓ１３）、発生プロ
セスＰ３を、該プロセスのプログラムアドレスを高速版
プログラム格納エリア１６に格納されているＰ３の高速
版プログラムのアドレスにして、実行中プロセスキュー
１２に入れる（Ｓ１４）。この結果の様子を図９(d) に
示す。

【００４７】さらに、この回数２のタイムスライスの間
に計算機１ではＰ２の処理が終了する。すると、計算機
１では図４に示す流れ図に従って、自計算機が先行系で
あることを確認し（Ｓ４１）、終了したプロセスＰ２を
実行終了プロセステーブル５２に入れる。この結果、実
行終了プロセステーブル５２は図９(e) に示すようにな
る。

【００４８】＜回数３のタイムスライス開始＞次に、再
度タイムスライスが起きると、計算機１では回数２のタ
イムスライス開始時と同様、図３に示す流れ図に従った
手続きを行い、Ｐ１を起動する。

【００４９】これと同時に計算機３では、図３に示す流
れ図に従って現在実行中のプロセスが無いことを確認し
て何もせず（Ｓ２１）、実行状態テーブル５１上の自計
算機の部分のタイムスライス回数を１増して「３」にし
（Ｓ２２）、自計算機が追従系であることを確認し（Ｓ
２３）、先行系でかつ「稼働中」の計算機すべてのタイ
ムスライス番号が自計算機のタイムスライス番号「３」
より２以上遅れていないことを確認し（計算機１が
「３」）（Ｓ２４）、自計算機のサイト番号３が追従系
の計算機群の中で小さい方から（先行系期待台数（２）
−タイムスライス番号が自計算機より２以上遅れていな
い計算機数（この時点で１）＝１）番目でかつ最大サイ
ト番号（この実施例では４）ではないことを確認し（Ｓ
２６）、実行状態テーブル５１上で「稼働中」かつタイ
ムスライス番号が自計算機より２以上遅れている先行系
の計算機２を「ダウン中」にし、実行遅延プロセスキュ
ー３３内のプロセスＰ１を、そのアドレスを高速版プロ
グラム格納エリア３６に格納されているプロセスＰ１の
高速版プログラムのアドレスに合わせて実行中プロセス
キュー３２に移し（Ｓ２７）、自計算機を先行系に分類
する（Ｓ２８）。実行終了プロセステーブル５２にある
プロセスＰ２が実行遅延プロセスキュー３３にはないこ
とを確認し（Ｓ２９）、実行中プロセスキュー３２から
Ｐ１を取り出し、これを現在実行中プロセスとして実行
状態テーブル５１に登録して起動する（Ｓ３１）。この
Ｐ１はプログラムアドレスが高速版プログラムのものな
ので、高速版プログラムに従って実行される。

【００５０】これと同時に計算機４では、計算機３と同
様、図３に示す流れ図に従って（Ｓ２１）〜（Ｓ２４）
まで実行するが、自計算機のサイト番号４が追従系の計
算機群の中で最大であることを確認し（Ｓ２６）、実行
終了プロセステーブル５２にあるプロセスＰ２が実行遅
延プロセスキュー４３にはないことを確認し（Ｓ２
９）、実行中プロセスキュー４２が空なので何も起動し
ない（Ｓ３１）。

【００５１】これらの結果、実行状態テーブル５１およ
び各キューの内容は図１０(a) 〜(e) のようになる。こ
の回数３のタイムスライスの間に計算機１ではＰ１の処
理が終了する。すると、計算機１では図４に示す流れ図
に従って、自計算機１が先行系であることを確認し（Ｓ
４１）、終了したプロセスＰ１を実行終了プロセステー
ブル５２に入れる。この結果、実行終了プロセステーブ
ル５２は図１０(f) に示すようになる。

【００５２】一方、この回数３のタイムスライスの間に
計算機３ではプロセスＰ１がプロセスＰ２を生成する。
すると、計算機３は図２に示す流れ図に従い発生プロセ
スＰ２が障害プロセステーブル５３に無いことを確認し
て（Ｓ１１）、自計算機が先行系なので（Ｓ１３）、発
生プロセスＰ２を、該プロセスのプログラムアドレスを
高速版プログラム格納エリア３６に格納されているＰ２
の高速版プログラムのアドレスにして、実行中プロセス
キュー３２に入れる（Ｓ１４）。この結果、計算機３の
実行中プロセスキュー３２は図１０(g) のようになる。

【００５３】＜回数４のタイムスライス開始＞再度タイ
ムスライスが起きると、計算機１では回数３のタイムス
ライス開始時と同様、図３に示す流れ図に従った手続き
を行い、Ｐ３を起動する。

【００５４】これと同時に計算機３では、図３に示す流
れ図に従い回数２のタイムスライス開始時の計算機１と
同様の手続きを踏んでＰ２を起動する。これと同時に計
算機４では図３に示す流れ図に従って現在実行中のプロ
セスが無いことを確認して何もせず（Ｓ２１）、実行状
態テーブル５１の自計算機の部分のタイムスライス回数
を１増して「４」にし（Ｓ２２）、自計算機が追従系で
あることを確認し（Ｓ２３）、先行系でかつ「稼働中」
の計算機すべてのタイムスライス番号が自計算機のタイ
ムスライス番号「４」より２以上遅れていないことを確
認し（Ｓ２４）、自計算機のサイト番号が追従系の計算
機群の中で最大であることを確認し（Ｓ２６）、実行終
了プロセステーブル５２にありかつ実行遅延プロセスキ
ュー４３にあるプロセスＰ１を、そのアドレスを高速版
プログラム格納エリア４６に格納されているプロセスＰ
１の高速版プログラムのアドレスに合わせて実行遅延プ
ロセスキュー４３から実行中プロセスキュー４２に移し
（Ｓ２９）、実行中プロセスキュー４２からＰ１を取り
出して、これを現在実行中プロセスとして実行状態テー
ブル５１に登録して起動する（Ｓ３１）。このＰ１はプ
ログラムアドレスが高速版プログラムのものなので、高
速版プログラムに従って実行される。

【００５５】これらの結果、実行状態テーブル５１およ
び各キューの内容は図１１(a) 〜(d) のようになる。こ
の回数４のタイムスライスの間に計算機１で実行中のプ
ロセスＰ３の高速版プログラムにあるバグが原因で計算
機１がダウンしたとする。

【００５６】一方、この回数４のタイムスライスの間に
計算機３ではプロセスＰ２がプロセスＰ３を生成する。
すると、計算機３は図２に示す流れ図に従い発生プロセ
スＰ３が障害プロセステーブル５３に無いことを確認し
て（Ｓ１１）、自計算機が先行系であることを確認し
（Ｓ１３）、発生プロセスＰ３を、該プロセスのプログ
ラムアドレスを高速版プログラム格納エリア３６に格納
されているＰ３の高速版プログラムのアドレスにして、
実行中プロセスキュー３２に入れる（Ｓ１４）。この結
果、計算機３の実行中プロセスキュー３２は図１１(e)
のようになる。

【００５７】さらに、この回数４のタイムスライスの間
に計算機４ではプロセスＰ１がプロセスＰ２を生成す
る。すると、計算機４は図２に示す流れ図に従い発生プ
ロセスＰ２が障害プロセステーブル５３に無いことを確
認し（Ｓ１１）、自計算機が追従系であるが、Ｐ２が実
行終了プロセステーブル５２にあるので（Ｓ１３）、発
生プロセスＰ２を、該プロセスのプログラムアドレスを
高速版プログラム格納エリア４６に格納されているＰ２
の高速版プログラムのアドレスにして、実行中プロセス
キュー４２に入れる（Ｓ１４）。この結果、計算機４の
実行中プロセスキューは図１１(f) のようになる。

【００５８】その後、この回数４のタイムスライスの間
に計算機３ではＰ２の処理が終了する。すると、計算機
３では図４に示す流れ図に従って、自計算機３が先行系
であることを確認し（Ｓ４１）、終了したプロセスＰ２
を実行終了プロセステーブル５２に入れる。すでに実行
終了プロセステーブル５２にＰ２が入っているので図１
０(f) に示すまま変化はない。

【００５９】＜回数５のタイムスライス開始＞再度タイ
ムスライスが起きると、計算機３では図３に示す流れ図
に従い計算機１の回数３のタイムスライス開始時と同様
の手続きを行い、Ｐ１を起動する。

【００６０】これと同時に計算機４では図３に示す流れ
図に従って同計算機４の回数４のタイムスライスの開始
時と同様の手続きを行い、Ｐ２を起動する。これらの結
果、実行状態テーブルおよび各キューの内容は図１２
(a) 〜(c) のようになる。

【００６１】この回数５のタイムスライスの間に計算機
３ではプロセスＰ１が終了し、計算機３は図４に示す流
れ図に従って回数３のタイムスライスの間に計算機１で
プロセスＰ１が終了したときと同じ手続きをする。ただ
し、実行終了プロセステーブル５２には既にＰ１が入っ
ているので変化はない。

【００６２】一方、この回数５のタイムスライスの間に
計算機４ではプロセスＰ２がプロセスＰ３を生成する。
すると、計算機４は図２に示す流れ図に従い発生プロセ
スＰ３が障害プロセステーブル５３に無いことを確認し
て（Ｓ１１）、自計算機が追従系で、かつＰ３が実行終
了プロセステーブル５２に無いことを確認し（Ｓ１
３）、発生プロセスＰ３を実行遅延プロセスキュー４３
に入れる（Ｓ１４）。この結果、計算機４の実行遅延プ
ロセスキューは図１２(d) のようになる。

【００６３】＜回数６のタイムスライス＞計算機３では
回数４のタイムスライス開始時の計算機１と同様に手続
きしてプロセスＰ３を起動する。

【００６４】これと同時に計算機４では図３に示す流れ
図に従って同計算機４の回数４のタイムスライスの開始
時と同様の手続きを行い、Ｐ１を起動する。これらの結
果、実行状態テーブル５１および各キューの内容は図１
３(a) 〜(d) のようになる。

【００６５】この回数６のタイムスライスの間に計算機
３はプロセスＰ３の高速版プログラムのバグが原因でダ
ウンする。一方、この回数６のタイムスライスの間に計
算機４ではプロセスＰ１が終了し、この計算機４は図４
に示す流れ図に従って回数３のタイムスライスの間に計
算機１でプロセスＰ１が終了した時と同様の手続きをす
る。ただし、実行終了プロセステーブル５２には既にＰ
１が入っているので変化はない。

【００６６】＜回数７のタイムスライス＞計算機４で
は、回数６のタイムスライスの場合と同様、図３に示す
流れ図に従って（Ｓ２１）〜（Ｓ２９）までの手続きを
するが、実行中プロセスキュー４２が空であるため、プ
ロセスの起動はしない（Ｓ３１）。

【００６７】この結果、実行状態テーブルおよび各キュ
ーの内容は図１４(a) 〜(c) のようになる。＜回数８のタイムスライス＞計算機４では、図３に示す
流れ図に従って現在実行中のプロセスが無いことを確認
し（Ｓ２１）、実行状態テーブル５１上の自計算機の部
分のタイムスライス回数を１増して「８」とし（Ｓ２
２）、自計算機が追従系であることを確認し（Ｓ２
３）、先行系の「稼働中」の計算機すべてのタイムスラ
イス番号が自計算機より２以上遅れていることを確認し
（図１４(a) に示すように計算機１が「４」、計算機３
が「６」）（Ｓ２４）、それらの計算機１および計算機
３を「ダウン中」とし、実行中となっているプロセスＰ
３を障害プロセステーブル５３に追加し、さらに図１４
(c) に示すようにプロセスＰ３が自計算機の実行遅延プ
ロセスキュー４３にあるので、そのプログラムアドレス
を安全版プログラム格納エリア４７に格納されているプ
ロセスＰ３の安全版プログラムのアドレスに合わせて実
行中プロセスキュー４２に移す（Ｓ２５）。そして、自
計算機以外がすべて「ダウン中」になっていることを確
認し（Ｓ２６）、タイムスライス番号が自計算機より２
以上遅れている先行系の計算機は既に「ダウン中」にな
っており、実行遅延プロセスキュー４３が空であること
を確認し（Ｓ２７）、自計算機を先行系に分類する（Ｓ
２８）。その後、実行終了プロセステーブル５２にある
プロセスＰ１とＰ２がいずれも実行遅延プロセスキュー
４３（現在空）に無いことを確認し（Ｓ２９）、実行中
プロセスキュー４２からプロセスＰ３を取り出して実行
状態テーブル５１に現在実行中のプロセスとして登録
し、起動する（Ｓ３１）。このＰ１はプログラムアドレ
スが安全版のものなので、安全版プログラムに従って実
行される。

【００６８】以降、計算機１はプロセスＰ３を安全版の
プログラムに従って実行する。安全版のプログラムに従
った場合は高速版のプログラムに従った場合の２倍の時
間がかかるので、回数９のタイムスライス中に無事その
実行を終了する。

【００６９】このように、本実施例に係るシステムで
は、４つの計算機１〜４を先行系の計算機１，２と追従
系の計算機３，４とに分類して動作開始させる。そし
て、たとえば回数１のタイムスライスでハードウェアの
故障が原因でプロセスＰ１を実行中の計算機２がダウン
すると、最初に追従系に分類されていた計算機３を先行
系に組入れ、プロセスＰ１を高速版のプログラムに従っ
て実行させる。また、たとえばプロセスＰ３の高速版プ
ログラムのバグが原因で回数４のタイムスライスの間に
計算機１がダウンし、計算機３が回数６のタイムスライ
ス間にダウンすると、最初に追従系に分類されていた計
算機４が先行系となってプロセスＰ３を今度は安全版の
プログラムに従って実行させるようにしている。各計算
機が各回数のタイムスライス間に実行したプロセスの一
覧を図１６に示す。

【００７０】上記動作から判るように、本実施例に係る
システムでは、ハードウェア故障が原因で計算機がダウ
ンした場合には、高速版のプログラムに従って効率を落
とすこと無くプロセスを実行させることができ、またプ
ログラムバグが原因で計算機がダウンした場合には安全
版のプログラムに従って追従系の計算機に先行系の計算
機の処理を引継がせることができるので、効率を落とす
こと無く、かつプロセスの実行を止めること無く計算処
理を続行させることができる。

【００７１】比較参考のために他計算機がダウンした時
に実行していたプロセスを、ダウンの理由に関わらず以
降追従系の計算機で安全版のプログラムに従って実行さ
せ場合、各計算機が各回数のタイムスライス間に実行す
るプロセスの一覧を図１７に示す。これから判るよう
に、本実施例の方が処理を止めること無く、速く全プロ
セスの処理を終了させることができる。

【００７２】なお、本発明は上述した実施例に限定され
るものではない。すなわち、上述した実施例では、プロ
グラムバグによる計算機のダウンを純ソフトウェア的に
検出しているが、たとえば計算機に付設されているハー
ドウェア診断装置の診断結果を参照し、図３のステップ
Ｓ２４で「ハードウェアの故障が記録されていなくて、
かつタイムスライス番号が自計算機より２以上遅れてい
る先行系の「稼働中」の計算機があるか」なる比較を行
わせることによって実施例と同様の動作を行わせること
ができる。

【００７３】また、先の実施例では先行系の台数が減っ
た場合に、先行系と追従系とを再構成して、先行系の台
数を常に複数台（実施例では２台）保つようにしている
が、先行系の台数が１台でよい場合には、図３のステッ
プＳ２６で「先行系の計算機がすべて「ダウン中」にな
り、かつ、自計算機のサイト番号が追従系のなかで最小
であるか」なる比較を行わせればよい。

【００７４】また、上述した実施例では、アプリケーシ
ョンプロセス群の各アプリケーションプロセスに高速版
プログラムと安全版プログラムとを用意しているが、高
速版プログラムだけを用いることもできる。

【００７５】

【発明の効果】以上説明したように、本発明によれば、
ハードウェア故障が原因で計算機がダウンした場合に
は、高速版のプログラムに従って効率を落とすこと無く
プロセスを実行させることができ、またプログラムバグ
が原因で計算機がダウンした場合には高速版あるいは安
全版のプログラムに従って追従系の計算機に先行系の計
算機の処理を引継がせることができるので、効率を落と
すこと無く、かつプロセスの実行を止めること無く処理
を続行させることができる。

【図面の簡単な説明】

【図１】本発明の一実施例に係る多重処理システムのブ
ロック構成図

【図２】同システムにおけるアプリケーションプロセス
発生時の動作を示す流れ図

【図３】同システムにおけるタイムスライス開始時の動
作を示す流れ図

【図４】同システムにおけるアプリケーションプロセス
終了時の動作を示す流れ図

【図５】同システムでアプリケーションプロセスを実行
させたときの期待される実行例を示す図

【図６】同システムの初期状態における実行状態テーブ
ルの内容を示す図

【図７】同システムへプロセスを投入した時における各
キューの内容を示す図

【図８】同システムにおける回数１のタイムスライス開
始時処理後の実行状態テーブルおよび各キューの内容を
示す図

【図９】同システムにおける回数２のタイムスライス開
始時処理後の実行状態テーブルおよび各キューの内容を
示す図

【図１０】同システムにおいて回数３のタイムスライス
開始時処理後の実行状態テーブルおよび各キューの内容
を示す図

【図１１】同システムにおける回数４のタイムスライス
開始時処理後の実行状態テーブルおよび各キューの内容
を示す図

【図１２】同システムにおける回数５のタイムスライス
開始時処理後の実行状態テーブルおよび各キューの内容
を示す図

【図１３】同システムにおける回数６のタイムスライス
開始時処理後の実行状態テーブルおよび各キューの内容
を示す図

【図１４】同システムにおける回数７のタイムスライス
開始時処理後の実行状態テーブルおよび各キューの内容
を示す図

【図１５】同システムにおける回数８のタイムスライス
開始時処理中および処理後の実行状態テーブルおよび各
キューの内容を示す図

【図１６】同システムにおいて各計算機が実行したプロ
セスの一覧を示す図

【図１７】計算機のダウンに伴わせて安全版に切換えた
ときに各計算機が実行したプロセスの一覧を示す図

【符号の説明】

１，２，３，４…計算機５…共有メモリ６…バス１１，２１，３１，４１…演算装置１２，２２，３２，４２…実行中プロセスキュー１３，２３，３３，４３…実行遅延プロセスキュー１４，２４，３４，４４…ローカルメモリ１５，２５，３５，４５…タイマ１６，２６，３６，４６…高速版プログラム格納エリア１７，２７，３７，４７…安全版プログラム格納エリア５１…実行状態テーブル５２…実行終了プロセステーブル５３…障害プロセステーブル

Claims

【特許請求の範囲】

【請求項１】複数の計算機と、これらの計算機を先行系の計算機と追従系の計算機とに
分類し、上記先行系の計算機に特定のアプリケーション
プロセス群を実行開始させるとともに、上記先行系の計
算機の実行開始時点より所定の条件を満たす期間だけ遅
れた時点から上記追従系の計算機で上記特定のアプリケ
ーションプロセス群を実行開始させる手段と、前記先行系の計算機がダウンしたときに、ダウンの原因
がハードウェアの障害によるものか否かを判定する判定
手段と、この判定手段で前記先行系の計算機がハードウェアの障
害以外の原因でダウンしたと判定されたときには、ダウ
ンしたときに上記先行系の計算機で実行していたアプリ
ケーションプロセスを前記追従系の計算機のアプリケー
ションプロセス群の中から取り除いて上記追従系の計算
機を先行系として動作させる手段とを具備してなること
を特徴とする多重処理システム。
【請求項２】複数の計算機と、これらの計算機を先行系の計算機と追従系の計算機とに
分類し、上記先行系の計算機に特定のアプリケーション
プロセス群を実行開始させるとともに、上記先行系の計
算機の実行開始時点より所定の条件を満たす期間だけ遅
れた時点から上記追従系の計算機で上記特定のアプリケ
ーションプロセス群を実行開始させる手段と、前記先行系の計算機がダウンしたときに、ダウンの原因
がハードウェアの障害によるものか否かを判定する判定
手段と、この判定手段で前記先行系の計算機がハードウェアの障
害以外の原因でダウンしたと判定されたときには、ダウ
ンしたときに上記先行系の計算機で実行していたアプリ
ケーションプロセスを前記追従系の計算機のアプリケー
ションプロセス群の中から取り除くとともに上記追従系
を構成している計算機を新先行系と新追従系とに再構成
し、上記新先行系の計算機側から残りのアプリケーショ
ンプロセスを実行開始させる手段とを具備してなること
を特徴とする多重処理システム。
【請求項３】複数の計算機と、これらの計算機を先行系の計算機と追従系の計算機とに
分類し、上記先行系の計算機に特定のアプリケーション
プロセス群を実行開始させるとともに、上記先行系の計
算機の実行開始時点より所定の条件を満たす期間だけ遅
れた時点から上記追従系の計算機で上記特定のアプリケ
ーションプロセス群を実行開始させる手段と、前記先行系の計算機がダウンしたときに、ダウンの原因
がハードウェアの障害によるものか否かを判定する判定
手段と、この判定手段で前記先行系の計算機がハードウェアの障
害以外の原因でダウンしたと判定されたときには、ダウ
ンしたときに上記先行系の計算機で実行していたアプリ
ケーションプロセスを前記追従系の計算機のアプリケー
ションプロセス群の中から取り除くとともに上記追従系
を構成している計算機を新先行系と新追従系とに再構成
し、上記新先行系の計算機側から残りのアプリケーショ
ンプロセスを実行開始させる手段、前記判定手段で前記先行系の計算機がハードウェアの障
害でダウンしたと判定されたときには、稼働中の計算機
を新先行系と新追従系とに再構成する手段とを具備して
なることを特徴とする多重処理システム。
【請求項４】同一の機能を有する複数の版のアプリケー
ションプロセス用プログラムを保持した複数の計算機
と、これらの計算機を先行系の計算機と追従系の計算機とに
分類し、上記先行系の計算機で特定のアプリケーション
プロセス群をそれぞれ特定の版のプログラムに従って実
行開始させるとともに、上記先行系の計算機の実行開始
時点より所定の条件を満たす期間だけ遅れた時点から上
記追従系の計算機で上記特定のアプリケーションプロセ
ス群をそれぞれ上記特定の版あるいは異なる版のアプリ
ケーションプロセス用プログラムに従って実行開始させ
る手段と、前記先行系の計算機がダウンしたときに、ダウンの原因
がハードウェアの障害によるものか否かを判定する判定
手段と、この判定手段で前記先行系の計算機がハードウェアの障
害以外の原因でダウンしたと判定されたときには、ダウ
ンしたときに上記先行系の計算機で実行していたアプリ
ケーションプロセスを前記特定の版とは異なる版のプロ
グラムに従って前記追従系の計算機で実行させる手段と
を具備してなることを特徴とする多重処理システム。
【請求項５】同一の機能を有する複数の版のアプリケー
ションプロセス用プログラムを保持した複数の計算機
と、これらの計算機を先行系の計算機と追従系の計算機とに
分類し、上記先行系の計算機で特定のアプリケーション
プロセス群をそれぞれ特定の版のプログラムに従って実
行開始させるとともに、上記先行系の計算機の実行開始
時点より所定の条件を満たす期間だけ遅れた時点から上
記追従系の計算機で上記特定のアプリケーションプロセ
ス群をそれぞれ上記特定の版あるいは異なる版のアプリ
ケーションプロセス用プログラムに従って実行開始させ
る手段と、前記先行系の計算機がダウンしたときに、ダウンの原因
がハードウェアの障害によるものか否かを判定する判定
手段と、この判定手段で前記先行系の計算機がハードウェアの障
害以外の原因でダウンしたと判定されたときには、前記
追従系を構成している計算機を新先行系と新追従系とに
再構成し、ダウンしたときに上記先行系の計算機で実行
していたアプリケーションプロセスを前記特定の版とは
異なる版のプログラムに従って上記新先行系の計算機側
から残りのアプリケーションプロセスを実行開始させる
手段とを具備してなることを特徴とする多重処理システ
ム。
【請求項６】同一の機能を有する複数の版のアプリケー
ションプロセス用プログラムを保持した複数の計算機
と、これらの計算機を先行系の計算機と追従系の計算機とに
分類し、上記先行系の計算機で特定のアプリケーション
プロセス群をそれぞれ特定の版のプログラムに従って実
行開始させるとともに、上記先行系の計算機の実行開始
時点より所定の条件を満たす期間だけ遅れた時点から上
記追従系の計算機で上記特定のアプリケーションプロセ
ス群をそれぞれ上記特定の版あるいは異なる版のアプリ
ケーションプロセス用プログラムに従って実行開始させ
る手段と、前記先行系の計算機がダウンしたときに、ダウンの原因
がハードウェアの障害によるものか否かを判定する判定
手段と、この判定手段で前記先行系の計算機がハードウェアの障
害以外の原因でダウンしたと判定されたときには、前記
追従系を構成している計算機を新先行系と新追従系とに
再構成し、ダウンしたときに上記先行系の計算機で実行
していたアプリケーションプロセスを上記特定の版とは
異なる版のプログラムに従って上記新先行系の計算機側
から残りのアプリケーションプロセスを実行開始させる
手段と、前記判定手段で前記先行系の計算機がハードウェアの障
害でダウンしたと判定されたときには、稼働中の計算機
を新先行系と新追従系とに再構成する手段とを具備して
なることを特徴とする多重処理システム。
【請求項７】前記判定手段は、前記先行系の計算機の全
てがダウンしたときに、ハードウェアの障害以外の原因
でダウンしたと判定する手段を備えていることを特徴と
する請求項１乃至６の何れか１項に記載の多重処理シス
テム。