JPH0414934A - 分散形処理システムにおける通信路故障検出方法 - Google Patents
分散形処理システムにおける通信路故障検出方法Info
- Publication number
- JPH0414934A JPH0414934A JP2117747A JP11774790A JPH0414934A JP H0414934 A JPH0414934 A JP H0414934A JP 2117747 A JP2117747 A JP 2117747A JP 11774790 A JP11774790 A JP 11774790A JP H0414934 A JPH0414934 A JP H0414934A
- Authority
- JP
- Japan
- Prior art keywords
- token
- loop
- system management
- management device
- communication path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Multi Processors (AREA)
- Computer And Data Communications (AREA)
- Small-Scale Networks (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、分散形処理システムにおける通信路故障検出
方法に関するものである。
方法に関するものである。
〔従来の技術]
複数の処理装置と一つのシステム管理装置を通信路を介
してループ状に接続し、各処理装置に固有の処理機能を
持たせ、各処理装置が互いに情報を通信路を介して交換
しながら、1つのシステムとしての仕事を分担して処理
する形式の分散形処理システムが知られている。
してループ状に接続し、各処理装置に固有の処理機能を
持たせ、各処理装置が互いに情報を通信路を介して交換
しながら、1つのシステムとしての仕事を分担して処理
する形式の分散形処理システムが知られている。
第4図は、かかる分散形処理システムを示すブロック図
である。同図において、101はシステム管理装置であ
って分散形処理システムを管理すル装置、102a〜1
02eはそれぞれ処理装置、103a 103bはそ
れぞれループ状通信路(略して単に通信路またはループ
ということもある)、である。
である。同図において、101はシステム管理装置であ
って分散形処理システムを管理すル装置、102a〜1
02eはそれぞれ処理装置、103a 103bはそ
れぞれループ状通信路(略して単に通信路またはループ
ということもある)、である。
トークンハツシング方式を採る分散形処理システムでは
、各ノード(処理装置やシステム管理装置)間の通信を
確立する手段として、トークンと呼ばれる送信権利を与
えることのできるフレーム構成のデータを通信路内に巡
回させ、通信を行いたいノードがトークンを捕捉するこ
とにより、当該ノードに通信路の使用を許して通信を行
わせるようになっている。
、各ノード(処理装置やシステム管理装置)間の通信を
確立する手段として、トークンと呼ばれる送信権利を与
えることのできるフレーム構成のデータを通信路内に巡
回させ、通信を行いたいノードがトークンを捕捉するこ
とにより、当該ノードに通信路の使用を許して通信を行
わせるようになっている。
第4図に示す分散形処理システムでは、通信路として1
03a、103bの2系統が設けられているので、仮に
片方の通信路が故障すれば、残りの通信路を使って各ノ
ード間で情報交換を行えるようになっている。
03a、103bの2系統が設けられているので、仮に
片方の通信路が故障すれば、残りの通信路を使って各ノ
ード間で情報交換を行えるようになっている。
さて、かかる分散形処理システムにおいて、仮に103
aなら103aの通信路に故障が起きた場合、システム
管理装置101では、通信路103aのどの区間で故障
が起きたかを検出する必要がある。従来のかかる分散形
処理システムにおける通信路故障検出方法を第5図を参
照して、以下、説明する。
aなら103aの通信路に故障が起きた場合、システム
管理装置101では、通信路103aのどの区間で故障
が起きたかを検出する必要がある。従来のかかる分散形
処理システムにおける通信路故障検出方法を第5図を参
照して、以下、説明する。
第5図は各処理装置(システム管理装置を含む)102
のループインタフェース部を示すブロック図である。ル
ープインタフェース部201は、通信路の数に対応して
それぞれ設けられるので、この場合は、通信路103a
、103bに対応して2組設けられるが、第5図では、
通信路103aに対するものが示されている。
のループインタフェース部を示すブロック図である。ル
ープインタフェース部201は、通信路の数に対応して
それぞれ設けられるので、この場合は、通信路103a
、103bに対応して2組設けられるが、第5図では、
通信路103aに対するものが示されている。
第5図において、202は受信バッファ、203はバッ
ファ制御部、204はフレーム制御部、205はフレー
ム破棄通信制御部、206は送信セレクタ、207は送
信バッファ、208はCPUインタフェース、209は
CPU、210はメモリ、である。
ファ制御部、204はフレーム制御部、205はフレー
ム破棄通信制御部、206は送信セレクタ、207は送
信バッファ、208はCPUインタフェース、209は
CPU、210はメモリ、である。
通常は、トークン及びデータは、受信バッファ202に
よりループインタフェース部201に取り込まれる。バ
ッファ制御部203は、取り込まれたデータの中で自装
置に必要なデータをCPLIインタフェース208を介
してCPU208へ伝えたり、自装置から送信したいデ
ータを送信セレクタ206へ送出したりする。フレーム
制御部204は、受信したデータで自装置に不要なもの
をフレーム破棄通信制御部205を通して通過させたり
、若しくは終端の制御を行う。送信セレクタ206は、
送信すべきデータの選択を行い、送信ハソファ207へ
送出する。
よりループインタフェース部201に取り込まれる。バ
ッファ制御部203は、取り込まれたデータの中で自装
置に必要なデータをCPLIインタフェース208を介
してCPU208へ伝えたり、自装置から送信したいデ
ータを送信セレクタ206へ送出したりする。フレーム
制御部204は、受信したデータで自装置に不要なもの
をフレーム破棄通信制御部205を通して通過させたり
、若しくは終端の制御を行う。送信セレクタ206は、
送信すべきデータの選択を行い、送信ハソファ207へ
送出する。
今、通信路103aに故障が起きたことをシステム管理
装置101が検出したとする。するとシステム管理装置
101は、通信路103aを現用から外すと共に、健全
な通信路103bを使って各処理装置102に、通信路
103aについての試験命令を送る。
装置101が検出したとする。するとシステム管理装置
101は、通信路103aを現用から外すと共に、健全
な通信路103bを使って各処理装置102に、通信路
103aについての試験命令を送る。
すると、各処理装置102では、通信路103aに対応
のループインタフェース部201において、送信ハンフ
ァ207から受信ハソファ202に戻る破線で示した如
き通信路を作り、203→206→207→202→2
03という自装置内の折り返しループを形成し、このル
ープ内に試験フレームを流してその送受信状況から自装
置内における通信路103aの故障の有無を判定し、そ
の結果を健全な通信路103bを使ってシステム管理装
置101に報告していた。
のループインタフェース部201において、送信ハンフ
ァ207から受信ハソファ202に戻る破線で示した如
き通信路を作り、203→206→207→202→2
03という自装置内の折り返しループを形成し、このル
ープ内に試験フレームを流してその送受信状況から自装
置内における通信路103aの故障の有無を判定し、そ
の結果を健全な通信路103bを使ってシステム管理装
置101に報告していた。
〔発明が解決しようとする課題]
上述の如き従来の分散形処理システムにおける通信路故
障検出方法では、受信ハソファ202の一部、フレーム
破棄通信制御部205、送信セレクタ206の一部、な
どが故障を起こしていたり或いは処理装置と処理装置と
の間で通信路が故障を起こしていたりすると、故障箇所
が分からず、故障区間を特定できないという問題があっ
た。
障検出方法では、受信ハソファ202の一部、フレーム
破棄通信制御部205、送信セレクタ206の一部、な
どが故障を起こしていたり或いは処理装置と処理装置と
の間で通信路が故障を起こしていたりすると、故障箇所
が分からず、故障区間を特定できないという問題があっ
た。
本発明の目的は、かかる従来技術における問題点を解決
し、どんな所で故障が起きていようとも、通信路におけ
る故障区間を特定することのできる分散形処理システム
における通信路故障検出方法を捉供することにある。
し、どんな所で故障が起きていようとも、通信路におけ
る故障区間を特定することのできる分散形処理システム
における通信路故障検出方法を捉供することにある。
上記目的達成のため、本発明では、複数の処理装置と一
つのシステム管理装置を通信路を介してループ状に接続
して成る分散形処理システムにおいて、ループを構成す
る前記通信路が複数系統ある場合、その1系統が故障し
たとき、該故障ループの故障区間を検出するため、前記
各処理装置にトークン・カウンタを設けた。
つのシステム管理装置を通信路を介してループ状に接続
して成る分散形処理システムにおいて、ループを構成す
る前記通信路が複数系統ある場合、その1系統が故障し
たとき、該故障ループの故障区間を検出するため、前記
各処理装置にトークン・カウンタを設けた。
システム管理装置が前記複数系統のループの中の1系統
に故障が起きたことを何らかの方法で検出すると、正常
なループを介して各処理装置に各自のトークン・カウン
タをリセットするよう指示してリセットさせた後、トー
クンを発生して故障の起きた障害ループを介して送出す
ることにより、トークンを受信した処理装置はそのトー
クン・カウンタによりトークンの受信回数をカウントし
た後、次段の処理装置へトークンを送出し、トークンが
、成る一定限度時間を過ぎても、システム管理装置に戻
って来ないことをシステム管理装置において検出すると
、システム管理装置は、その時点における各処理装置の
トークン・カウンタにおけるカウント値を正常なループ
を介して報告させ、その報告結果から故障ループの故障
区間を検出する。
に故障が起きたことを何らかの方法で検出すると、正常
なループを介して各処理装置に各自のトークン・カウン
タをリセットするよう指示してリセットさせた後、トー
クンを発生して故障の起きた障害ループを介して送出す
ることにより、トークンを受信した処理装置はそのトー
クン・カウンタによりトークンの受信回数をカウントし
た後、次段の処理装置へトークンを送出し、トークンが
、成る一定限度時間を過ぎても、システム管理装置に戻
って来ないことをシステム管理装置において検出すると
、システム管理装置は、その時点における各処理装置の
トークン・カウンタにおけるカウント値を正常なループ
を介して報告させ、その報告結果から故障ループの故障
区間を検出する。
即ちシステム管理装置は、トークン・カウンタにおける
カウント値を、ループの上流の処理装置側から順に見て
ゆき、成る処理装置を境に、それ以後の処理装置におけ
るカウント値が一つ少なくなっているところを見つけ、
その境の装置とそれに隣接する装置との間が故障区間で
あると判定する。
カウント値を、ループの上流の処理装置側から順に見て
ゆき、成る処理装置を境に、それ以後の処理装置におけ
るカウント値が一つ少なくなっているところを見つけ、
その境の装置とそれに隣接する装置との間が故障区間で
あると判定する。
次に、図を参照して本発明の詳細な説明する。
第1図は、本発明の一実施例を説明するのに用いる各処
理装置のループインタフェース部を示すブロック図であ
る。
理装置のループインタフェース部を示すブロック図であ
る。
同図において、302は処理装置、310,311はそ
れぞれループ状通信路、401は通信路310に対応し
たループインタフェース部、402はトークン・カウン
タ、403はCPUインタフェース、404はCPU、
である。
れぞれループ状通信路、401は通信路310に対応し
たループインタフェース部、402はトークン・カウン
タ、403はCPUインタフェース、404はCPU、
である。
第5図に比較すると、トークン・カウンタ402が追加
されただけで、構成的には他に変わったところはない。
されただけで、構成的には他に変わったところはない。
第2図は、かかるループインタフェース部を持つ処理装
置302とシステム管理装置301とにより構成された
分散形処理システムの全体構成図である。処理装置30
2としては302a、302bの二つが例として示され
ている。
置302とシステム管理装置301とにより構成された
分散形処理システムの全体構成図である。処理装置30
2としては302a、302bの二つが例として示され
ている。
次に第1図、第2図を参照しながら、本発明にかかる分
散形処理システムにおける通信路故障検出方法の動作を
説明する。
散形処理システムにおける通信路故障検出方法の動作を
説明する。
今、通信路310に故障が起きたことをシステム管理装
置301が何らかの方法で検出したとする。するとシス
テム管理装置101は、通信路310を現用から外すと
共に、健全な通信路311を使って各処理装置302に
命令を送って、それぞれのトークン・カウンタをリセッ
トさせる。即ちシステム管理装置101からのりセント
命令は、各処理装置302において、受信バッファ、バ
ッファ制御部、CPUインタフェース403を介してC
PU404へ伝えられ、それに応じてCPU404はC
PUインタフェース403を介してトークン・カウンタ
402に信号を送出してリセットさせる。
置301が何らかの方法で検出したとする。するとシス
テム管理装置101は、通信路310を現用から外すと
共に、健全な通信路311を使って各処理装置302に
命令を送って、それぞれのトークン・カウンタをリセッ
トさせる。即ちシステム管理装置101からのりセント
命令は、各処理装置302において、受信バッファ、バ
ッファ制御部、CPUインタフェース403を介してC
PU404へ伝えられ、それに応じてCPU404はC
PUインタフェース403を介してトークン・カウンタ
402に信号を送出してリセットさせる。
次にシステム管理装置301内のCP Uで、トークン
に値するフレームを生成し、CPUインタフェース、バ
ッファ制御部、送信セレクタ、送信ハソファを介して、
故障の起きている通信路310に送出する。
に値するフレームを生成し、CPUインタフェース、バ
ッファ制御部、送信セレクタ、送信ハソファを介して、
故障の起きている通信路310に送出する。
トークンが各処理装置302において受信されると、そ
れは受信ハンファ、バッファ制御部、CPtJインタフ
ェース403を介してCPtJ404へ伝えられ、それ
に応してCPU404はCPUインタフェース403を
介してトークン・カウンタ402に信号を送出して1度
数をカウントアツプさせる。そしてトークンを更に下流
の処理装置へ向けて通過させる。
れは受信ハンファ、バッファ制御部、CPtJインタフ
ェース403を介してCPtJ404へ伝えられ、それ
に応してCPU404はCPUインタフェース403を
介してトークン・カウンタ402に信号を送出して1度
数をカウントアツプさせる。そしてトークンを更に下流
の処理装置へ向けて通過させる。
途中の故障箇所でトークンは紛失してしまい、システム
管理装置301に戻らない。システム管理装置301で
は、トークンが、成る一定限度時間を過ぎても、システ
ム管理装置301に戻って来ないことをタイマなどを使
って検出すると、健全な通信路311を使って各処理装
置302に命令を送って、それぞれのトークン・カウン
タのカウント値を読み出させ、報告させる。
管理装置301に戻らない。システム管理装置301で
は、トークンが、成る一定限度時間を過ぎても、システ
ム管理装置301に戻って来ないことをタイマなどを使
って検出すると、健全な通信路311を使って各処理装
置302に命令を送って、それぞれのトークン・カウン
タのカウント値を読み出させ、報告させる。
即ちシステム管理装置101からのトークン・カウンタ
読み出し命令は、各処理装置302において、受信バッ
ファ、バッファ制御部、CPUインタフェース403を
介してCPU404へ伝えられ、それに応じてCPU4
04はCPtJインタフェース403を介してトークン
・カウンタ402のカウント値の読み出しを行い、それ
を健全な通信路311を使ってシステム管理装置101
に報告する。システム管理装置101では、その報告結
果から故障通信路の故障区間を検出する。
読み出し命令は、各処理装置302において、受信バッ
ファ、バッファ制御部、CPUインタフェース403を
介してCPU404へ伝えられ、それに応じてCPU4
04はCPtJインタフェース403を介してトークン
・カウンタ402のカウント値の読み出しを行い、それ
を健全な通信路311を使ってシステム管理装置101
に報告する。システム管理装置101では、その報告結
果から故障通信路の故障区間を検出する。
即ちシステム管理装置101は、トークン・カウンタに
おけるカウント値を、通信路の上流の処理装置側から順
に見てゆき、成る処理装置を境に、それ以後の処理装置
におけるカウント値が一つ少なくなっているところを見
つけ、その境の装置とそれに隣接する装置との間が故障
区間であると判定するわけである。
おけるカウント値を、通信路の上流の処理装置側から順
に見てゆき、成る処理装置を境に、それ以後の処理装置
におけるカウント値が一つ少なくなっているところを見
つけ、その境の装置とそれに隣接する装置との間が故障
区間であると判定するわけである。
第3図に、以上説明した分散形処理システムにおける通
信路故障検出方法の処理フローを示したので参照された
い。第3図についての改めての説明は不要であろう。
信路故障検出方法の処理フローを示したので参照された
い。第3図についての改めての説明は不要であろう。
以上説明したように、本発明によれば、分散形処理シス
テムにおいて、ループ状通信路のどんな所で故障が起き
ていようとも、通信路における故障区間を特定できると
いう利点がある。その結果、通信路そのものに故障が起
きている確率よりも、ループインタフェース部に故障が
起きている確率の方が高いと考えられる場合には、その
特定された区間におけるループインタフェースを交換す
ることにより、迅速に故障を回復させることができ、保
守効率を高めることができる。
テムにおいて、ループ状通信路のどんな所で故障が起き
ていようとも、通信路における故障区間を特定できると
いう利点がある。その結果、通信路そのものに故障が起
きている確率よりも、ループインタフェース部に故障が
起きている確率の方が高いと考えられる場合には、その
特定された区間におけるループインタフェースを交換す
ることにより、迅速に故障を回復させることができ、保
守効率を高めることができる。
第1図は本発明を実施した際の各処理装置におけるルー
プインタフェース部を示すブロック図、第2図は本発明
を実施した際の分散形処理システムを示す構成図、第3
図は本発明にかかる通信路故障検出方法の動作を示すフ
ローチャート、第4図は分散形処理システムの構成例を
示すブロック図、第5図は従来の処理装置におけるルー
プインタフェース部を示すブロック図、である。 符号の説明 101.301・・・システム管理装置、102゜30
2・・・処理装置、202・・・受信バッファ、203
・・・バッファ制御部、204・・・フレーム制御部、
205・・・フレーム破棄通信制御部、206・・・送
信セレクタ、20′l・・・送信ハンファ、208,4
03・・・cpuインタフェース、209.404・・
・CPU、210・・・メモリ、402・・・トークン
・カウンタ 代理人 弁理士 並 木 昭 夫
プインタフェース部を示すブロック図、第2図は本発明
を実施した際の分散形処理システムを示す構成図、第3
図は本発明にかかる通信路故障検出方法の動作を示すフ
ローチャート、第4図は分散形処理システムの構成例を
示すブロック図、第5図は従来の処理装置におけるルー
プインタフェース部を示すブロック図、である。 符号の説明 101.301・・・システム管理装置、102゜30
2・・・処理装置、202・・・受信バッファ、203
・・・バッファ制御部、204・・・フレーム制御部、
205・・・フレーム破棄通信制御部、206・・・送
信セレクタ、20′l・・・送信ハンファ、208,4
03・・・cpuインタフェース、209.404・・
・CPU、210・・・メモリ、402・・・トークン
・カウンタ 代理人 弁理士 並 木 昭 夫
Claims (1)
- 1)複数の処理装置と一つのシステム管理装置を通信路
を介してループ状に接続して成る分散形処理システムに
おいて、ループを構成する前記通信路が複数系統ある場
合、その1系統が故障したとき、該故障ループの故障区
間を検出する通信路故障検出方法であって、前記各処理
装置にトークン・カウンタを設けておき、システム管理
装置が前記複数系統のループの中の1系統に故障が起き
たことを検出すると、正常なループを介して各処理装置
に各自のトークン・カウンタをリセットするよう指示し
てリセットさせた後、トークンを発生して故障の起きた
障害ループを介して送出することにより、トークンを受
信した処理装置はそのトークン・カウンタによりトーク
ンの受信回数をカウントした後、次段の処理装置へトー
クンを送出し、トークンがシステム管理装置に戻って来
ないことをシステム管理装置において検出すると、シス
テム管理装置は、その時点における各処理装置のトーク
ン・カウンタにおけるカウント値を正常なループを介し
て報告させ、その報告結果から故障ループの故障区間を
検出することを特徴とする分散形処理システムにおける
通信路故障検出方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2117747A JPH0414934A (ja) | 1990-05-09 | 1990-05-09 | 分散形処理システムにおける通信路故障検出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2117747A JPH0414934A (ja) | 1990-05-09 | 1990-05-09 | 分散形処理システムにおける通信路故障検出方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0414934A true JPH0414934A (ja) | 1992-01-20 |
Family
ID=14719314
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2117747A Pending JPH0414934A (ja) | 1990-05-09 | 1990-05-09 | 分散形処理システムにおける通信路故障検出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0414934A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0936902A (ja) * | 1995-07-20 | 1997-02-07 | Nec Corp | トークン障害検出方法 |
| GB2376612A (en) * | 2001-06-15 | 2002-12-18 | Ibm | Fault location in a loop network |
-
1990
- 1990-05-09 JP JP2117747A patent/JPH0414934A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0936902A (ja) * | 1995-07-20 | 1997-02-07 | Nec Corp | トークン障害検出方法 |
| GB2376612A (en) * | 2001-06-15 | 2002-12-18 | Ibm | Fault location in a loop network |
| GB2376612B (en) * | 2001-06-15 | 2004-06-09 | Ibm | Method and apparatus for fault location in a loop network |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7990851B2 (en) | Method, apparatus and computer program product for redundant ring communication | |
| US20060085669A1 (en) | System and method for supporting automatic protection switching between multiple node pairs using common agent architecture | |
| WO1989011187A1 (en) | Reconfigurable local area network | |
| JP5365234B2 (ja) | 端末装置間のトークン異常検出/回復方式 | |
| US5522047A (en) | Graceful insertion of a tree into a ring network | |
| JPH0414934A (ja) | 分散形処理システムにおける通信路故障検出方法 | |
| US6528901B1 (en) | Automatic protection switching | |
| JPH01217666A (ja) | マルチプロセッサシステムの障害検出方式 | |
| JPS6182548A (ja) | ト−クン送出権決定方法 | |
| JP5407382B2 (ja) | 出力モジュールの誤出力防止方式 | |
| JPH0311841A (ja) | ローカルエリアネットワーク | |
| JPH0595363A (ja) | 二重化リングバス障害検出装置 | |
| JP2005159483A (ja) | 二重化通信装置 | |
| US7124182B2 (en) | Method for real-time detection of which units are present on an arcnet | |
| JPH04321342A (ja) | トークンアクセス法での障害検出方法 | |
| JPS62175044A (ja) | 二重化ル−プ状伝送路 | |
| JPH01177738A (ja) | ループ障害処理方式 | |
| JPH02272845A (ja) | 異常フレーム検出方式 | |
| JP2000295142A (ja) | 自己診断装置 | |
| JP3115530B2 (ja) | 情報伝送装置 | |
| JPS63228849A (ja) | 分散型伝送装置 | |
| JPH0758766A (ja) | ループ型ネットワークの構成制御方式 | |
| JPH03261300A (ja) | 遠隔装置のcpuリセット方式 | |
| JPH08331162A (ja) | トークンパッシングリング故障検出方式 | |
| JPS6240845A (ja) | 通信ネツトワ−クシステムのネツトワ−ク制御権移行方式 |