JPH0750464B2 - 疎結合マルチプロセッサシステム - Google Patents
疎結合マルチプロセッサシステムInfo
- Publication number
- JPH0750464B2 JPH0750464B2 JP63056717A JP5671788A JPH0750464B2 JP H0750464 B2 JPH0750464 B2 JP H0750464B2 JP 63056717 A JP63056717 A JP 63056717A JP 5671788 A JP5671788 A JP 5671788A JP H0750464 B2 JPH0750464 B2 JP H0750464B2
- Authority
- JP
- Japan
- Prior art keywords
- processor
- communication
- disconnected
- processors
- operating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000004891 communication Methods 0.000 claims description 43
- 238000012806 monitoring device Methods 0.000 description 10
- 230000005856 abnormality Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
Landscapes
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は疎結合マルチプロセッサシステムに関する。
疎結合マルチプロセッサシステムでは、プロセッサ監視
装置が各プロセッサの切り離しを行う。具体的には、プ
ロセッサ監視装置が、切り離されるべきプロセッサに対
して、切り離しを通知する。一方、他のプロセッサに
は、このプロセッサが切り離された旨の通知を行い、こ
のプロセッサとの交信を禁止する。
装置が各プロセッサの切り離しを行う。具体的には、プ
ロセッサ監視装置が、切り離されるべきプロセッサに対
して、切り離しを通知する。一方、他のプロセッサに
は、このプロセッサが切り離された旨の通知を行い、こ
のプロセッサとの交信を禁止する。
ところが、このような疎結合マルチプロセッサシステム
では、伝送路や受信装置の異常のために、この通知が切
り離されるべきプロセッサに届かないことがある。この
ような状況では、切り離されるべきプロセッサ以外のシ
ステムは、このプロセッサが切り離されたものとして処
理を行う。同時に、本来切り離されるべきプロセッサ
は、自身が切り離されたことを認識しないまま、通常通
りの動作を継続する。この結果、本来切り離されるべき
プロセッサが、共有ファイルをアクセスして、その内容
を破壊してしまうという欠点があった。
では、伝送路や受信装置の異常のために、この通知が切
り離されるべきプロセッサに届かないことがある。この
ような状況では、切り離されるべきプロセッサ以外のシ
ステムは、このプロセッサが切り離されたものとして処
理を行う。同時に、本来切り離されるべきプロセッサ
は、自身が切り離されたことを認識しないまま、通常通
りの動作を継続する。この結果、本来切り離されるべき
プロセッサが、共有ファイルをアクセスして、その内容
を破壊してしまうという欠点があった。
本発明の疎結合マルチプロセッサシステムは、 全プロセッサのシステムとしての動作状態を認識するプ
ロセッサ状態認識手段を有し、 各プロセッサは、他のプロセッサのシステムとしての動
作状態が変化したことを知らせる前記プロセッサ状態認
識手段からの通知を記憶し、かつ、システムから切離さ
れた他のプロセッサからの通信を受取らない機能を持
ち、他のプロセッサが自プロセッサの通信を受取らない
ことを検出した場合、自プロセッサが前記プロセッサ状
態認識手段からの通知により該通信相手プロセッサのシ
ステムとしての動作状態をどのように記憶しているか
を、プロセッサのシステムとしての動作状態の変化が他
のプロセッサに認識されるに要する最大時間以上経過後
に調べ、システムとして動作中であると記憶していると
きは自プロセッサの動作を停止する。
ロセッサ状態認識手段を有し、 各プロセッサは、他のプロセッサのシステムとしての動
作状態が変化したことを知らせる前記プロセッサ状態認
識手段からの通知を記憶し、かつ、システムから切離さ
れた他のプロセッサからの通信を受取らない機能を持
ち、他のプロセッサが自プロセッサの通信を受取らない
ことを検出した場合、自プロセッサが前記プロセッサ状
態認識手段からの通知により該通信相手プロセッサのシ
ステムとしての動作状態をどのように記憶しているか
を、プロセッサのシステムとしての動作状態の変化が他
のプロセッサに認識されるに要する最大時間以上経過後
に調べ、システムとして動作中であると記憶していると
きは自プロセッサの動作を停止する。
プロセッサ監視装置からの切り離し指示が、切り離され
るべきプロセッサに通知されなかったときでも、切り離
されるべきプロセッサは、他のプロセッサとのプロセッ
サ間通信により、そのことを認識して自プロセッサの動
作を停止するので、システムから切離されたプロセッサ
がプロセッサ間で共有しているファイルにアクセスして
内容を破壊することがない。
るべきプロセッサに通知されなかったときでも、切り離
されるべきプロセッサは、他のプロセッサとのプロセッ
サ間通信により、そのことを認識して自プロセッサの動
作を停止するので、システムから切離されたプロセッサ
がプロセッサ間で共有しているファイルにアクセスして
内容を破壊することがない。
次に、本発明の実施例について図面を参照して説明す
る。
る。
第1図は本発明の疎結合マルチプロセッサシステムの一
実施例のブロック図、第2図は第1図のプロセッサ間通
信制御部31,32,…,3nの処理の流れ図である。
実施例のブロック図、第2図は第1図のプロセッサ間通
信制御部31,32,…,3nの処理の流れ図である。
疎結合マルチプロセッサシステムはプロセッサ11,12,
…,1nとプロセッサ監視装置2により構成され、各プロ
セッサ11,12,…,1nには、それぞれプロセッサ間通信
制御部31,32,…,3nが設けられている。また、各プロ
セッサ11,12,…,1nは通信路41,42,…,4nを介してプ
ロセッサ監視装置2に接続され、プロセッサ間通信制御
部31,32,…,3nにより通信路5を介して相互に接続さ
れている。プロセッサ監視装置2は一定時間ごとにハー
トビートチェックにより動作中の全プロセッサ11,12,
…,1nのシステムとしての動作状態を監視し、障害等の
発生によりシステムから切り離すべき状態にあるプロセ
ッサを発見した場合は、このプロセッサに切り離しを指
示するとともに、このプロセッサが切り離されたことを
他の全プロセッサ11,12,…,1nのプロセッサ間通信制
御部31,32,…,3nに通知する。プロセッサ間通信制御
部31,32,…,3nは第2図に示すように、通信路5を介
してプロセッサ11,12,…,1n相互間の通信を司どって
おり(ステップ11)、システムから切離されたプロセッ
サ11,12,…,1nからの通信は無視して受取らないよう
になっている。また、プロセッサ間通信制御部31,32,
…,3nは、他のプロセッサ11,12,…,1nが自プロセッ
サからの通信を受取らない場合は通信エラーとして検出
する。通信相手プロセッサ11,12,…,1nが通信を受取
らないので通信エラーとして検出される原因として、 (1)通信相手プロセッサ11,12,…,1nが、通信元プ
ロセッサである自プロセッサがシステムから切離された
と認識している場合と、(2)通信相手プロセッサ11,1
2,…,1nがシステムから切離されて、通信元プロセッ
サである自プロセッサの通信を受取らない場合とがあ
る。
…,1nとプロセッサ監視装置2により構成され、各プロ
セッサ11,12,…,1nには、それぞれプロセッサ間通信
制御部31,32,…,3nが設けられている。また、各プロ
セッサ11,12,…,1nは通信路41,42,…,4nを介してプ
ロセッサ監視装置2に接続され、プロセッサ間通信制御
部31,32,…,3nにより通信路5を介して相互に接続さ
れている。プロセッサ監視装置2は一定時間ごとにハー
トビートチェックにより動作中の全プロセッサ11,12,
…,1nのシステムとしての動作状態を監視し、障害等の
発生によりシステムから切り離すべき状態にあるプロセ
ッサを発見した場合は、このプロセッサに切り離しを指
示するとともに、このプロセッサが切り離されたことを
他の全プロセッサ11,12,…,1nのプロセッサ間通信制
御部31,32,…,3nに通知する。プロセッサ間通信制御
部31,32,…,3nは第2図に示すように、通信路5を介
してプロセッサ11,12,…,1n相互間の通信を司どって
おり(ステップ11)、システムから切離されたプロセッ
サ11,12,…,1nからの通信は無視して受取らないよう
になっている。また、プロセッサ間通信制御部31,32,
…,3nは、他のプロセッサ11,12,…,1nが自プロセッ
サからの通信を受取らない場合は通信エラーとして検出
する。通信相手プロセッサ11,12,…,1nが通信を受取
らないので通信エラーとして検出される原因として、 (1)通信相手プロセッサ11,12,…,1nが、通信元プ
ロセッサである自プロセッサがシステムから切離された
と認識している場合と、(2)通信相手プロセッサ11,1
2,…,1nがシステムから切離されて、通信元プロセッ
サである自プロセッサの通信を受取らない場合とがあ
る。
以上の2つのうち(2)の場合であれば自プロセッサを
自ら停止させる必要がないので、これを確認するために
通信エラーを検出したとき(ステップ12)、ある一定時
間に設定されたタイマを起動してタイムアウトするまで
待つ(ステップ13)。タイマがタイムアウトすると通信
エラーとなった相手プロセッサ11,12,…,1nのシステ
ムとしての動作状態を自プロセッサがどのように認識し
ているかを調べ(ステップ14)、システムから切離され
たと認識しているならば、通信エラーとなった原因は相
手プロセッサ11,12,…,1nがシスムから切離されたた
めであるので何も行なわないが、システムとして動作中
であると認識しているならば、相手プロセッサ11,12,
…,1nが通信元プロセッサ、すなわち自プロセッサがシ
ステムから切離されたと認識しているためであり、ま
た、あるプロセッサ11,12,…,1nが他のプロセッサか
ら見てシステムから切離されているということは、その
プロセッサがシステムから切離されていることであるの
で、自プロセッサを停止させる(ステップ15)。
自ら停止させる必要がないので、これを確認するために
通信エラーを検出したとき(ステップ12)、ある一定時
間に設定されたタイマを起動してタイムアウトするまで
待つ(ステップ13)。タイマがタイムアウトすると通信
エラーとなった相手プロセッサ11,12,…,1nのシステ
ムとしての動作状態を自プロセッサがどのように認識し
ているかを調べ(ステップ14)、システムから切離され
たと認識しているならば、通信エラーとなった原因は相
手プロセッサ11,12,…,1nがシスムから切離されたた
めであるので何も行なわないが、システムとして動作中
であると認識しているならば、相手プロセッサ11,12,
…,1nが通信元プロセッサ、すなわち自プロセッサがシ
ステムから切離されたと認識しているためであり、ま
た、あるプロセッサ11,12,…,1nが他のプロセッサか
ら見てシステムから切離されているということは、その
プロセッサがシステムから切離されていることであるの
で、自プロセッサを停止させる(ステップ15)。
なお、ステップ12で通信エラーを検出してから一定時間
待つ(ステップ13)ためのタイマの設定時間は、あるプ
ロセッサ11,12,…,1nがシステムから切離されてか
ら、そのことがプロセッサ監視装置2を介して動作中の
他のプロセッサ11,12,…,1nに認識されるに必要な最
大時間よりも大きな値としておく。
待つ(ステップ13)ためのタイマの設定時間は、あるプ
ロセッサ11,12,…,1nがシステムから切離されてか
ら、そのことがプロセッサ監視装置2を介して動作中の
他のプロセッサ11,12,…,1nに認識されるに必要な最
大時間よりも大きな値としておく。
次に、本実施例の動作を説明する。
動作中の疎結合マルチプロセッサシステムでプロセッサ
11がシステムから切離された場合について説明する。
11がシステムから切離された場合について説明する。
プロセッサ監視装置2は、ハートビートチェックの結果
プロセッサ11が切り離すべき状態にあると検出すると、
プロセッサ11に切り離しを指示する。しかしながら、伝
送路41の異常により、この通知はプロセッサ11に到達し
ない。このため、プロセッサ11は通常動作を継続する。
一方、プロセッサ監視装置2は、プロセッサ11が切り離
された旨を他のプロセッサ12,…,1nに通知し、プロセ
ッサ間通信制御部32,…,3nはプロセッサ11がシステム
から切離されたことを記憶するとともにプロセッサ11か
らの通信を受取らなくなる。プロセッサ間通信制御部31
は、他のプロセッサ12,…,1nへの通信を通信エラーと
して検出するのでタイマを起動し、タイムアウトすると
他のプロセッサ12,…,1nの動作状態を自プロセッサ11
がどのように認識しているかを調べ、この場合システム
として動作中であると認識しているので、自プロセッサ
11はシステムから切離されていると判断して自プロセッ
サ11を停止させる。
プロセッサ11が切り離すべき状態にあると検出すると、
プロセッサ11に切り離しを指示する。しかしながら、伝
送路41の異常により、この通知はプロセッサ11に到達し
ない。このため、プロセッサ11は通常動作を継続する。
一方、プロセッサ監視装置2は、プロセッサ11が切り離
された旨を他のプロセッサ12,…,1nに通知し、プロセ
ッサ間通信制御部32,…,3nはプロセッサ11がシステム
から切離されたことを記憶するとともにプロセッサ11か
らの通信を受取らなくなる。プロセッサ間通信制御部31
は、他のプロセッサ12,…,1nへの通信を通信エラーと
して検出するのでタイマを起動し、タイムアウトすると
他のプロセッサ12,…,1nの動作状態を自プロセッサ11
がどのように認識しているかを調べ、この場合システム
として動作中であると認識しているので、自プロセッサ
11はシステムから切離されていると判断して自プロセッ
サ11を停止させる。
以上説明したように本発明は、各プロセッサで他のプロ
セッサのシステムとしての動作状態が変化したことを認
識し、システムから切離されたプロセッサからの通信を
受取らないようにし、他のプロセッサが通信を受取らな
いとき、その相手プロセッサのシステムとしての動作状
態を自プロセッサがどのように認識しているかを、ある
プロセッサの状態変化が他のプロセッサに認識されるに
要する時間以上経過してから調べて、システムとして動
作中であると認識しているならば、プロセッサが自発的
に停止する。すなわち、本来切り離されるべきプロセッ
サが、その旨の通知を受信していないときでも、他プロ
セッサとの交信が行われれば、このプロセッサは自身が
切り離されていることを認識する。したがって、共有フ
ァイルへのアクセスに先立ってプロセッサ間通信が実施
されれば、本来切り離されるべきプロセッサが共有ファ
イルの内容を破壊することはない。実際には、プロセッ
サ間通信は頻繁に行われるので、多くの場合、共有ファ
イルの破壊を防止できる。
セッサのシステムとしての動作状態が変化したことを認
識し、システムから切離されたプロセッサからの通信を
受取らないようにし、他のプロセッサが通信を受取らな
いとき、その相手プロセッサのシステムとしての動作状
態を自プロセッサがどのように認識しているかを、ある
プロセッサの状態変化が他のプロセッサに認識されるに
要する時間以上経過してから調べて、システムとして動
作中であると認識しているならば、プロセッサが自発的
に停止する。すなわち、本来切り離されるべきプロセッ
サが、その旨の通知を受信していないときでも、他プロ
セッサとの交信が行われれば、このプロセッサは自身が
切り離されていることを認識する。したがって、共有フ
ァイルへのアクセスに先立ってプロセッサ間通信が実施
されれば、本来切り離されるべきプロセッサが共有ファ
イルの内容を破壊することはない。実際には、プロセッ
サ間通信は頻繁に行われるので、多くの場合、共有ファ
イルの破壊を防止できる。
第1図は本発明の疎結合マルチプロセッサシステムの一
実施例のブロック図、第2図は第1図のプロセッサ間通
信制御部31,32,…,3nの処理の流れ図である。 11,12,…,1n……プロセッサ、2……プロセッサ監視
装置、31,32,…,3n……プロセッサ間通信制御部、41,
42,…,4n,5……通信路。
実施例のブロック図、第2図は第1図のプロセッサ間通
信制御部31,32,…,3nの処理の流れ図である。 11,12,…,1n……プロセッサ、2……プロセッサ監視
装置、31,32,…,3n……プロセッサ間通信制御部、41,
42,…,4n,5……通信路。
Claims (1)
- 【請求項1】疎結合マルチプロセッサシステムにおい
て、 全プロセッサのシステムとしての動作状態を認識するプ
ロセッサ状態認識手段を有し、 各プロセッサは、他のプロセッサのシステムとしての動
作状態が変化したことを知らせる前記プロセッサ状態認
識手段からの通知を記憶し、かつ、システムから切離さ
れた他のプロセッサからの通信を受取らない機能を持
ち、他のプロセッサが自プロセッサの通信を受取らない
ことを検出した場合、自プロセッサが前記プロセッサ状
態認識手段からの通知により該通信相手プロセッサのシ
ステムとしての動作状態をどのように記憶しているか
を、プロセッサのシステムとしての動作状態の変化が他
のプロセッサに認識されるに要する最大時間以上経過後
に調べ、システムとして動作中であると記憶していると
きは自プロセッサの動作を停止することを特徴とする疎
結合マルチプロセッサシステム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63056717A JPH0750464B2 (ja) | 1988-03-09 | 1988-03-09 | 疎結合マルチプロセッサシステム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63056717A JPH0750464B2 (ja) | 1988-03-09 | 1988-03-09 | 疎結合マルチプロセッサシステム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01229359A JPH01229359A (ja) | 1989-09-13 |
| JPH0750464B2 true JPH0750464B2 (ja) | 1995-05-31 |
Family
ID=13035237
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63056717A Expired - Lifetime JPH0750464B2 (ja) | 1988-03-09 | 1988-03-09 | 疎結合マルチプロセッサシステム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0750464B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0460750A (ja) * | 1990-06-28 | 1992-02-26 | Fujitsu Ltd | クラスタ停止装置 |
-
1988
- 1988-03-09 JP JP63056717A patent/JPH0750464B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH01229359A (ja) | 1989-09-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100557399B1 (ko) | 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법 | |
| US20020152425A1 (en) | Distributed restart in a multiple processor system | |
| US5594893A (en) | System for monitoring and controlling operation of multiple processing units | |
| JPH0750464B2 (ja) | 疎結合マルチプロセッサシステム | |
| JPH0588926A (ja) | 監視制御系の自動切替回路 | |
| JPH08287030A (ja) | 多重系計算機システムの自動再起動装置および方法 | |
| JP3107104B2 (ja) | 待機冗長方式 | |
| JPH11175108A (ja) | 二重化コンピュータ装置 | |
| JPH01166161A (ja) | マルチプロセッサシステムの相互監視方式 | |
| JPS6252907B2 (ja) | ||
| JPH04153810A (ja) | 異常処理方式 | |
| JP2744113B2 (ja) | 計算機システム | |
| JPH03266131A (ja) | 多重化システムの無応答判定方式 | |
| JPH0430245A (ja) | マルチプロセッサ制御方式 | |
| JPS60254338A (ja) | マルチプロセツサの異常検出方式 | |
| JPS61267810A (ja) | 停電検出判定回路 | |
| JPH08305675A (ja) | マルチプロセッサシステムおよびその運転管理方 法 | |
| JPH04340649A (ja) | サブシステムのダウン検出方式 | |
| JPH0460750A (ja) | クラスタ停止装置 | |
| JPH05120048A (ja) | 障害識別方式 | |
| JPH0253156A (ja) | 入出力装置における異常監視装置 | |
| JPS62190536A (ja) | 冗長構成制御方式 | |
| JPH05298136A (ja) | 冗長化情報システムの立上げ方法 | |
| JPH0535517A (ja) | 二重化系の切替装置 | |
| JPS63279646A (ja) | 網管理装置の自動再開処理方式 |