JP3816529B2 - 相互接続の障害検出およびその位置特定方法および装置 - Google Patents
相互接続の障害検出およびその位置特定方法および装置 Download PDFInfo
- Publication number
- JP3816529B2 JP3816529B2 JP53035097A JP53035097A JP3816529B2 JP 3816529 B2 JP3816529 B2 JP 3816529B2 JP 53035097 A JP53035097 A JP 53035097A JP 53035097 A JP53035097 A JP 53035097A JP 3816529 B2 JP3816529 B2 JP 3816529B2
- Authority
- JP
- Japan
- Prior art keywords
- status message
- error
- node
- code
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0056—Systems characterized by the type of code used
- H04L1/0057—Block codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/08—Arrangements for detecting or preventing errors in the information received by repeating transmission, e.g. Verdan system
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/24—Testing correct operation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Description
本願発明の主題は、下記に掲げる出題の主題と関連している。
米国特許出願番号08/605,677:特願平9−530406(特表平11−511634)、弁護士用ドケット番号2268、“非同期パケット交換”の名称で、Thomas M. Wicki, Patrick J. Helland, Takeshi Shimizu, Wolf-Dietrich WeberおよびWinfried W. Wilckeによって1996年2月22日に出願、
米国特許出願番号08/605,676:特願平9−530304(特表平11−504494)、弁護士用ドケット番号2269、“ダイナミックなネットワーク・トポロジー探査のシステムおよび方法”の名称で、Thomas M. Wicki, Patrick J. Helland, Wolf-Dietrich WeberおよびWinfried W. Wilckeによって1996年2月22日に出願、
米国特許出願番号08/603,926:特願平9−530403(特表平11−504496)、弁護士用ドケット番号2270、“低い待ち時間、高いクロック周波数 プレジオ非同期 パケットベース クロスバー・スイッチング・チップ・システムおよび方法”の名称で、Thomas M. Wicki, Jeffrey D. Larson, Albert MuおよびRaghu Sastryによって1996年2月22日に出願、
米国特許出願番号08/603,880:特願平9−530328(特表平11−504781)、弁護士用ドケット番号2271、“パケットスイッチングネットワーク内のルーチングデバイス出力アクセス用調整方法および装置”の名称で、Jeffrey D. Larson, Albert MuおよびThomas M. Wickiによって1996年2月22日に出願、
米国特許出願番号08/604,920:特願平9−530405(特表平11−511633)、弁護士用ドケット番号2272、“電圧のスイングを少なくし、かつ、内部のブロック化データパスを生じさせないクロスバースイッチおよびその方法”の名称で、Albert MuおよびJeffrey D. Larsonによって1996年2月22日に出願、
米国特許出願番号08/603,913:特願平9−530318(特表2000−506326)、弁護士用ドケット番号2274、“フロー制御プロトコル・システムおよび方法”の名称で、Thomas M. Wicki, Patrick J. Helland, Jeffrey D. Larson, Albert Mu, Raghu SastryおよびRichard L. Schober, Jr.によって1996年2月22日に出願、
米国特許出願番号08/603,923:特願平9−530217(特表2000−503498)、弁護士用ドケット番号2277、“多重ワード通信におけるエラー検出方法および装置”の名称で、Thomas M. Wicki, Patrick J. HellandおよびTakeshi Shimizuによって1996年2月22日に出願、
米国特許出願番号08/603,882:特願平9−530202(特表2000−503449)、弁護士用ドケット番号2278、“正のソース帰還をそなえたクロック動作されるセンス増幅器”の名称で、Albert Muによって1996年2月22日に出願、
参考として、上記の出願の全てを本願発明の全体に亘って取り入れている。
1.発明の分野
本発明は、パケット交換網における障害検出、特に状態メッセージベースのリンク制御プロトコルを用いるパケット交換網内における相互接続障害の検出および位置特定に関する。
2.関連技術の記述
効率の良いパケット交換網は、ネットワーク内のノード間の信頼性ある電気接続を必要とする。ネットワーク内のノードを物理的にリンクする導体(例えば電線)が「縮退」(stuck-at)または「開放」状態のいずれかにある場合に、ネットワークの誤り(障害)が発生し得る。結合リンクが誤って特定的電圧レベルまで引き上げまたは引き下げられた場合に、導体は「縮退」状態にある。かくして、導体は、物理リンクに適用される信号のレベルの如何に拘わらず、引き上げまたは引き下げられたレベルに縮退される。「開放」状態は、リンクが信号に結合されずその代わりに信号を全く転送しておらず、かくして中間電圧レベルで「浮動している」ことを意味する。電気リンク内の「縮退」および「開放」条件は共に、パケット交換網内で障害条件を引き起こす。障害の検出および位置特定は、ネットワークメンテナンスにおいてネットワーク管理者を補助する上で重要であり、運用中における障害の検出および位置特定は、許容することのできない程の数の障害をもつネットワークエリアを回避するため、ソースノードがパケットを再度ルーチングすることを可能にする。かくして、障害の検出および位置特定は、信頼性の高いパケット交換網を維持する上で重要である。従来の障害検出方法の1つは、パケット交換網上を伝送される各々のパケットに含ませた巡回冗長検査コード(CRC)といった誤りコードを使用している。この従来の方法では、パケットを発信するノードは、誤り検出コードを生成し、伝送されるパケットにそのコードを追加する。受信ノード(宛先)はこのとき、従来通りであれば、受信したデータパケットについての誤り検査を実行して、そのパケットが何らかの伝送エラーを受けたか否かを見極める。この障害検出方式は、誤り検出をデータ伝送と一体化させ、かくしてデータパケットが宛先ノードで受信された後で初めて障害が検出されることになるという欠点をもつ。この従来の方式はさらに、障害が検出されるだけで、特定の物理リンクに隔離されることはないという欠点も有している。この検出方式の従来の変形形態では、障害をネットワーク内の1つの領域に隔離すべくネットワーク内の中間ノードで、パケットについての障害テストが行われる。しかしながらこの方式は、1つのパケットの合計伝送時間に待ち時間を付加することになり、かくしてネットワーク性能を劣化させる。
もう1つの従来の障害検出方式は、ネットワーク内のノード経路に沿ってテストソースからテストパケットを伝送する。経路(パス)に沿った各々のノードは、テストパケットを伝送し、受信ノードからの肯定応答(アクノリッジ)を待機する。いかなる肯定応答も受信されない場合、ノードはノード経路に沿ってテストソースまで、誤り位置情報と共に誤りを報告する。このようにして、テストモードの動作中に障害が検出され隔離される。この方式を用いると、テスト動作モードの間だけ障害が検出され位置特定されるので、専用テストパケットの使用が必要とされる。この従来の障害検出方式は、場合によっては、ネットワーク全体をテストするのに数多くのテストパケットが必要となるというさらなる欠点も有している。
かくして、テストモード中に専用テストパケットの生成を必要とせず、データパケットが送られていない場合でさえ障害を検出するようにして、パケット交換網内の障害を効率良く検出し位置特定するための方法および装置に対するニーズに存在する。
発明の要約
本発明によると、データフローを制御するために状態メッセージベースのリンク制御プロトコルを使用する、パケット交換網内の障害を効率良く検出し位置特定するための装置および方法が提供される。このプロトコルに従うと、受信ノード内のバッファ利用可能性について送信ノードに知らせるため、隣接ノード間で状態メッセージが伝送される。本発明によると、各々の状態メッセージに対して1つの誤りコードが生成される。具体的には、第1のノードは状態メッセージおよび対応する誤りコードを生成する。好ましくは、誤りコードは、1ビットパリティーチェックコードであり、したがって状態メッセージの反転(相補)バージョンである。状態メッセージは、リンクを用いて第1のノードから第2の隣接するノードへと送られる。誤り検査コードは同様に、状態メッセージを送るのに使用されたものと同じリンクを用いて、第1のノードから第2のノードまで送られる。好ましくは、状態メッセージおよび誤りコードは各々データリンクのビット幅に等しいビット幅をもつ。第2のノードでは、障害検出器が状態メッセージと誤り検査コードとを比較して、相互接続障害が発生したか否かを決定する。好ましくは、この比較は、パリティーチェックコードとして誤りコードを用いた受信状態メッセージの各ビットの1ビットパリティーチェックである。1つの実施形態においては、パリティーは、複数の「排他的論理和」ゲートおよび「論理積」ゲートツリーを含む論理ネットワークを用いて検査される。
好ましくは、障害が検出された場合で、ネットワークノードにあるエラーモニタ内のカウンタがカウントアップされる。エラーモニタは、障害情報を記憶しており、処理ノードによってアクセスされ得る。
【図面の簡単な説明】
図1は、本発明によるパケット交換網を例示するダイヤグラムである。
図2は、本発明によるルータノードの機能的ブロックダイヤグラムである。
図3は、本発明によるルータチップ上のポートの機能的ブロックダイヤグラムである。
図4Aは、本発明による中間状態ワードのビット配列を例示する。
図4Bは、本発明による、自身のパリティーチェックコードを含む状態メッセージのビット配列を例示する。
図5は、本発明による障害検出器回路の概略図である。
好ましい実施形態の説明
図1は、ノード間相互接続(リンク)104により相互接続された複数のルータノード103をもつメッシュ上で相互接続された複数の入出力(I/O)ノード102および中央処理ユニット(CPU)ノード101を有するパケット交換網100を例示するダイヤグラムである。動作中、データパケットは、1つのルータ103または一連のルータ103を通してパケットを(データフレーム内で)交換(スイッチ)することによって、発信(ソース)ノードから宛先ノードまで送られる。各々の相互接続104は、標準的には長さ約数メートルのケーブルであり、86本の電線を持つ。86本の電線は、データ用の34本の電線を2セット(すなわち2つのノード間の各方向について1つずつの、2つの34ビット幅のデータ経路)、フレーム指示および制御情報の伝送専用の2本の電線、差動クロック信号を伝送するための2本の電線およびデータのための電圧基準(voltage reference)信号用の5本の電線を含む。
本発明の原理は、さまざまなルーチング方法を用いるパケット交換網に適用されるが、例示された実施例で用いられるルーチング方法は、1つのパケットの経路全体(ネットワークを通してのルート)がパケットのソースにて決定されフレームヘッダを持つデータフレーム内に符号化されるソースルーチング技法である。かくして各々のパケットは、データフレームのヘッダ内にて規定された経路に沿ってソースノードから宛先ノードまで送られる。
本発明によると、CPUノード101、I/Oノード102およびルータノード103は、そのリンクプロトコル用状態メッセージベース(クレジットベース)のフロー制御メカニズムを使用する。このプロトコルによると、データフレームは、下流近辺(隣接ノード)において空のバッファが利用可能である場合のみ、CPUノード101、I/Oノード102およびルータノード103の間で伝送される。受信(宛先)ルータノード103(つまりCPUノード101またはI/Oノード102)が、状態メッセージを送信(ソース)ルータノード103(つまりCPUノード101またはI/Oノード102)まで送る。状態メッセージは、受信ノード101,102または103にある各々の入力バッファ313(図3に例示)の状態(満杯または空)を表示する。状態メッセージはデータパケットとインタリーブされているため、そして状態メッセージは使用中でない相互接続104上のデフォルトトラフィックであるために、状態メッセージは、高いパーセンテージの時間、相互接続104上に送られている。本発明の障害検出および位置特定方法は、状態メッセージのパリティーチェックを用いることから、本発明は有利にも、正常なネットワーク動作中および使用されていない時間中ともに、障害情報を収集する。かくして、本発明によると、ネットワークまたはその一部が専用テストモードで動作することを必要とすることなく、障害検出および位置特定情報が累積される。
図2には、本発明によるルータノード103の機能的ブロックタイヤグラムが例示されている。ルータノード103は、走査ポートによって診断プロセッサ203に結合されたルータチップ201を有する。診断プロセッサ203は同様に外部ポートにも結合されている。外部ポートは、誤りおよび性能情報を読取る目的で、処理ノード(例えばCPUノード101)によりアクセスされ得る。診断プロセッサ203に結合された外部ポートは、RS232Cシリアルポートといったような標準的インタフェースポートあるいはこのようなインタフェースポートの修正バーションである。
ルータチップ201は、パケット交換網100内の6つの相互接続104に結合するための6つの双方向ポート205を有する。ルータチップ201は付加的に、各ポート205に結合されたクロスバースイッチ207を有する。
ポート205は各々、クロスバースイッチ207を相互接続104に結合し、各々送信および受信の両方の機能を果す。各ポート205は、隣接ノードからデータパケット(データフレーム内の)を受信し、次のノードに送る(結合させる)ためフレームをクロスバースイッチ207を通して、選択されたポート205へとルーチングする。図3は、ポート205の機能的ブロックダイヤグラムである。ポート205はデータシンクロナイザ301、入力バッファ部302、制御装置303、出力セレクタ/誤りコード発生器304、メッシュ(mesh)インタフェース305およびエラーモニタ306を有する。
データシンクロナイザ301は相互接続104に結合され、隣接ノードからワード(34ビット幅)を受信する。受信したワードはデータフレームまたは状態メッセージの一部分である。データシンクロナイザ301はデータフレーム上でクロック同期を行い、受信したワードがデータフレームまたは状態メッセージのいずれの一部分であるかを決定する。データシンクロナイザ301が、受信したワードがデータフレームの一部分であると決定した場合には、データシンクロナイザ301は受信したワードを入力バッファ部302に結合する。しかしデータシンクロナイザ301が、受信したワードが状態メッセージであると決定した場合には、受信したワードは制御装置303および障害検出器307(データシンクロナイザ301の中にある)に結合される。
入力バッファ部302は、データシンクロナイザ301およびクロスバースイッチ207に結合されたデータ経路を有し、制御装置303から制御信号を受信する。入力バッファ部302は複数のデータフレームを受信し、それを記憶する。入力バッファ部302は、各々がデータフレーム全体を記憶するのに充分大きい6つのバッファ313を有しているので、この入力バッファ部302は、出力ポートの回線争奪(contension)の期間中、最高6つのデータフレームを記憶するための容量を持つことになる。
論述したとおり、ポート205は、データシンクロナイザ301、入力バッファ部302および出力セレクタ/誤りコード発生器304に結合された制御装置303をも含んでいる。好ましくは制御装置303は、入力バッファ部302内のデータフレームに対して優先性を割当てるためのアービトレーション部を有する。制御装置303は、入力バッファ部302および相互接続104に対する状態メッセージまたはデータフレームのいずれかの結合を選択するためのセレクタ304に結合された制御信号も生成する。
セレクタ304は、制御装置303からの制御信号および中間状態ワード(図4Aを参照して以下に記述される通り)を受信して、受信された制御信号に応答して、(i)誤り検査部分を有する状態メッセージまたは(ii)クロスバースイッチ207から受信したフレームのいずれかを、その出力端で生成する。出力セレクタ304は、メッシュインタフェース305に結合される。
制御装置303によって生成される中間状態ワード(Buff_Stat〔15:0〕)は、もし存在するならば、入力バッファ部302の6つの入力バッファ313のいずれが現在満杯(Currently_Full)である(利用できない)か、また最後の状態メッセージが隣接ノードに送られて以降どの入力バッファが使用されたか、を示すバッファ状態情報を含む。図4Aは、本発明による中間状態ワードのビット配列を例示する。中間状態ワード400は、16ビットのワードである。ビット0〜5はNext_Msg_To_Sendビット401であり、ビット6および7は予約されたビット402であり(例示された実施例においてはデジタル「1」にセットされている)、ビット8〜13はCurrently_Fullビット403であり、ビット14および15は予約されたビット404(例示された実施例ではデジタル「1」にセットされている)である。Next_Msg_To_Sendビット401は、各々6つの入力バッファ313(入力バッファ部302内にある)のうちの1つに結びつけられて(associated)おり、最後の状態メッセージが隣接ノードに送られた後、結びつけられた入力バッファ313が1つの入力フレームを受信していたならば、「1」にセットされる。かくしてNext_Msg_To_Sendビット401は各々、各状態メッセージの送信の間の入力バッファ313の状態に関する累積情報を含んでいる。予約ビット402は、例示された実施例にて用いられた6つのバッファに代えて最高8つのバッファをもつ構成とするときのために、予約される。Currentrly_Fullビット403は各々6つの入力バッファ313のうちの1つに結びつけられ、対応する入力バッファが現在満杯であり従って利用不可能である場合「1」にセットされる。予約ビット404は、例示された実施例において用いられた6つのバッファに代えて最高8つの入力バッファを有する構成とするときのために、予約される。
ここで再び図3を参照すると、セレクタ304は、インバータバンク(inv)310,311およびマルチプレクサ312を有する。マルチプレクサ312は、各々が68ビットの幅を有する第1および第2の入力、単一の68ビット幅の出力および第1または第2の入力のいずれかを選択するための選択制御信号を有する。第1のマルチプレクサ入力は、34ビットからなる下位部分と34ビットからなる上位部分とを有する。インバータバンク310,311は各々、中間状態ワードの一部分に結合されている。好ましくは、インバータバンク310は、Next_Msg_To_Sendビット401を含む下位8ビットに結合され、インバータ311はCurrently_Fullビット403に結合される。インバータバンク310,311は、中間状態ワード400に対応する1ビットパリティーチェックコードを生成すべく、中間状態ワードの各ビットを反転させる。インバータバンク310,311の出力は、第1のマルチプレクサ入力の上位部分に結合される。中間状態ワード400は、マルチプレクサ312の第1の入力の下位部分に結合される。第1のマルチプレクサ入力の下位部分に結びつけられた付加的な入力ビット(15−8,33−24)は、望むとおりに、満杯バッファ、ルータバージョン情報、状態情報またはその他のシステム情報を示すべく、「高」(デジタル「1」)電圧源または大地(デジタル「0」)のいずれかに結合される。第1のマルチプレクサビットの上位部分に結びつけられた対応する付加的入力ビット(49−42,67−58)は、下位部分と共に1ビットのパリティーチェックコードを形成するように選択される。かくして、第1のマルチプレクサ入力が選択された時点で、マルチプレクサ312は、状態情報を含む状態メッセージおよび対応する1ビットパリティーチェックコードを生成する。
図4Bは、セレクタ304によって生成される68ビットの状態メッセージを例示する。状態メッセージ410は68ビット幅であり、下位34ビット411内の状態情報および上位34ビット412内のパリティーチェックコードを有する。かくして、上位ビット412(ビット67〜34)は、状態メッセージの下位34ビット(ビット33〜0)の反転(相補)バージョンである。
セレクタ304は、制御装置303によって選択される通りに、状態モードまたはデータフローモードで作動する。制御装置303がデータフローモードを選択すると、セレクタ304は、クロスバースイッチ207から受信したデータをメッシュインタフェース305に結合する。しかしながら、制御装置303が状態モードを選択した場合、セレクタ304は、パリティーチェックコードを含む状態メッセージを生成し、この状態メッセージをメッシュインタフェース305に結合する。
メッシュインタフェース305は、マルチプレクサ312の68ビット幅出力を、相互接続104に結合する。メッシュインタフェース305は、相互接続104を用いた逐次伝送(sequential transmission)のために、マルチプレクサ312出力のパリティーチェックコード部分(下位34ビット)から、マルチプレクサ312出力の状態メッセージ部分(下位34ビット)を分離する。かくして、メッシュインタフェース305は、68ビット幅のデータワードを受信し、68ビットのワードの上位および下位部分を多重化して2つの逐次的34ビットワードを生成する。メッシュインタフェース305は次に、相互接続104の34ビット幅のデータ部分を用いて、隣接ノードに対し順次2つの34ビットのデータワードを送る。こうして、伝送されたデータビットに対応する各電線(導体)が、その付随するパリティーチェックコードを伴う1つのバッファ状態メッセージの送信中に、1つの遷移を有することが保証される。
好ましい実施例においては、メッシュインタフェース305は、相互接続104の帯域幅を最大限にすべく1クロックサイクル当り、1本の電線につき、2つのビットを転送する。この増大した帯域幅を利用することは、第1のクロック位相中第1のデータビットを、また第2のクロック位相中第2のデータビットを多重化することによって、達成される。かくして、隣接するノードの間の物理リンク(相互接続104)は、幅がわずか34ビットであるものの、有効な帯域幅は、全クロックサイクルに亘り68ビットである。しかしながら本発明の原理によれば、上述のように増大した帯域幅の利用(クロックの2つの位相を用いた)を伴う相互接続を使うことを必要としない。その代わり、状態メッセージおよび誤り検査コードは、各々逐次クロックサイクル上のクロックの同じ位相で、または異なる時点で同じ物理リンク上に状態メッセージおよび誤り検査コードの両方を転送すべくその他のあらゆるクロック方式を用いて、隣接するノードに対し順次送信することができる。
ここで再び第3図を参照すると、ポート205は、エラーモニタ306に対し相互接続障害を検出し報告するための障害検出器307(データシンクロナイザ301内にある)を有している。図5は、本発明による障害検出器307の概略図である。障害検出器307は、68ビットの立下りエッジトリガー形レジスタ(Reg)502に結合された。34ビット幅の立上りエッジトリガー形レジスタ(Reg)501を有する。レジスタ501は立上りエッジでトリガーされており、レジスタ502は立下りエッジでトリガーされていることから、レジスタ502は、逆クロック位相を用いて、単一のクロックサイクル全体にわたり、状態メッセージおよび誤り検査コードを含む68ビットをラッチする。かくしてレジスタ502は、下位34ビット内に状態メッセージを、そして上位34ビット内に誤りコード(1ビットのパリティーチェックコード)をそれぞれラッチする。障害検出器307はまた、状態メッセージのビット的な(bitwise)パリティーチェックを実行するため、レジスタ502に結合された論理ネットワーク503も有している。例示した実施例においては、論理ネットワーク503は、反転出力を有する「論理積ツリー」に直列に結合された「排他的論理和」(EXOR)論理ネットワーク504を含んでいる。この実施例では、論理ネットワーク503は、障害が検出されたか否か(状態メッセージビットのいずれかでパリティーエラーが発生したか否か)を示す障害状態信号(Buff_Stat_Err)を生成する。一変形例では、「排他的論理和」論理ネットワーク504の出力はさらに、相互接続104上のデータリンクの各ビットに結びつけられた障害情報を記憶するため、レジスタ(図示せず)またはその他の記憶装置に結合される。この構成では、検出された障害は、具体的なビット障害にまで隔離される。
第1のクロック位相中に状態メッセージをまた第2のクロック位相中に対応する1ビットのパリティーチェックコードを、同じ物理リンク(同じ34本の電線)上で送信することによって、障害検出器307は、相互接続104上に存在し得る「縮退」および「開放」誤りの両方共識別し隔離することができる。本発明の障害検出および位置特定方式は、例えば無線リンクまたはその他のあらゆる非配線リンクを用いるネットワーク内といったように、非物理リンクの中で発生する障害をも同様に隔離できる、ということも理解すべきである。
ここで再び図3を参照すると、ポート205はまた、エラーモニタ部306を含んでいる。エラーモニタ部306は障害検出器307に結合され、診断プロセッサ203による検索および処理のため誤りデータを収集する。エラーモニタ部306は、与えられた相互接続104上で検出された障害の現状カウントを保持するため、障害検出器307によって障害が検出される毎にカウントアップされるカウンタを有する。現状カウントは、診断プロセッサ203によるアクセスのために、エラーレジスタの中に記憶される。
好ましくは、カウンタ値は、エラーモニタ部306から検索されたカウンタ値を蓄積する診断プロセッサ203によって、定期的に読取られる(そしてその後クリアされる)。1つの実施例においては、診断プロセッサ203は、過渡的ネットワーク条件(transient network conditions)つまり「グリッチ」(glitches)の結果として検出された障害を識別すべく、しきい値解析を実行し、この情報を蓄積する。これに代えてまたは付加的に、CPUノード101より走らされた診断プログラムによりしきい値処理解析を実行することができる。
1つの実施例においては、エラーモニタ部306内のカウンタは、ひとたび最大に達した時点で最大カウント値(例えば、全ての「1s」)を保持する10ビットカウンタである。かくして、リンクが特に高い障害率を生じさせた場合、カウンタは「ラップアラウンド」(wrap araound)してゼロから計数し始めることはせず、代わりにカウンタ最大値を超えて、1つの誤り(障害)率をシグナリングする最大状態を維持することになる。
本発明の障害検出方法および装置は、特定のノードにおける相互接続104の特定のセットに専用のものとなっていることから、エラーモニタ部306の有利なこととして、診断プログラムまたはその他のタイプのネットワークモニタプログラム用の局所化された障害検出情報をエラーモニタ部306は提供し、エラーモニタ部306および診断プロセッサ203の中に蓄積された障害データをアクセスする。かくして、このような診断およびネットワークプログラムにより、高い障害率をもつ相互接続104を用いるのを避けるべく、ネットワークを再構成しルーチングテーブルを更新することができる。さらに、この障害検出および位置特定方法は、リンク制御プロトコルに使用される状態メッセージに基礎を置くことから、テストパケットまたはテスト動作モードもさらにはデータパケットの伝送さえも用いる必要なく、障害の検出および位置特定がなされる。
かくして、本発明の方法および装置は、状態メッセージベースのリンクフロー制御プロトコルを用いるパケット交換網内での、効率の良い障害検出および位置特定を実現する。
Claims (14)
- 複数のノードを有すると共にデータフローを制御するための状態メッセージが転送される制御プロトコルを使用するパケット交換網の中の障害を検出する方法であって、
第1のノードにおいて前記状態メッセージを生成し、
該状態メッセージに対応する誤り検査コードを生成し、
該第1のノードから第2のノードまで該状態メッセージを送信し、
該第1のノードから該第2のノードまで該誤り検査コードを送信し、および
障害を検出すべく該第2のノードで受信した該状態メッセージと該誤り検査コードを比較する段階を含んでなる方法。 - 前記誤り検査コードが1ビットパリティーチェックコードである請求項1に記載の方法。
- 前記の状態メッセージに対応する誤り検査コードを生成する段階は、反転状態メッセージを生成する段階を含む請求項2に記載の方法。
- 障害を検出すべく、前記第2のノードで受信した前記状態メッセージおよび誤り検査コードを比較する前記の段階は、
前記誤り検査コードを用いて前記状態メッセージの複数のビットについて、1ビットパリティーチェックを実行し、
いずれかのパリティーチェックが偶数パリティーであると決定した場合に、障害状態を第1の状態にセットし、および
各々のパリティーチェックが奇数パリティーであると決定した場合に、障害状態を第2の状態にセットする段階を含む請求項2に記載の方法。 - 前記第1のノードおよび前記第2のノードは隣接するノードである請求項1に記載の方法。
- 複数のノードを有すると共にデータフローを制御するための状態メッセージが転送される制御プロトコルを使用するパケット交換網におけるノードリンク内の障害を隔離するための方法であって、
1つのノードにおいて、障害情報を記憶し、
1つのリンクに亘って前記状態メッセージを受信し、
1つの該リンクに亘って誤り検査コードを受信し、
障害を検出すべく、該状態メッセージおよび該誤り検査コードを比較し、および
障害の検出に応答して障害情報を更新する段階を含んでなる方法。 - 前記誤り検査コードが1ビットパリティーチェックコードである請求項6に記載の方法。
- 障害を検出すべく、前記状態メッセージと前記誤り検査コードを比較する段階は、
前記誤り検査コードを用いて前記状態メッセージの複数のビットについて1ビットパリティーチェックを実行し、
いずれかのパリティーチェックが偶数パリティーであると決定した場合に、障害状態を第1の状態にセットし、および
各々のパリティーチェックが奇数パリティーであると決定した場合に、障害状態を第2の状態にセットする段階を含む請求項6に記載の方法。 - データパケットと、所定の制御プロトコルのもとでそのデータフローを制御するための状態メッセージとが送受信される複数のノードを有するパケット交換網内の障害を隔離するための障害検出装置であって、
データパケットおよび前記状態メッセージを受信するためのリンクインタフェース、
該リンクインタフェースに結合され、前記状態メッセージを検出する状態メッセージ検出器、および
前記状態メッセージが検出された時、該状態メッセージ上の障害検出を実行するため、前記リンクインタフェースに結合された障害検出器を含んでなる障害検出装置。 - 前記障害検出器は、1ビットパリティーチェッカを含む請求項9に記載の装置。
- 状態メッセージベースのリンクフロー制御プロトコルを有するパケット交換網内の1つのノードで障害検出状態メッセージを生成するための装置であって、該ノードは状態情報発生器を有し、該装置は
前記状態メッセージに対応する誤りコードを生成するため前記状態情報発生器に結合された誤りコード発生器、および
前記状態メッセージおよび前記誤りコードをリンクに逐次的に結合するため該誤りコード発生器および該状態メッセージに結合されたリンクインタフェースを含む装置。 - 前記誤りコードが1ビットパリティーチェックコードである請求項11に記載の装置。
- データパケットと、所定の制御プロトコルのもとでそのデータフローを制御するための状態メッセージとが送受信される複数のノードを有するパケット交換網内で相互接続の障害を検出するためのシステムであって、
状態発生器出力にて前記状態メッセージを生成するための状態発生器と、
出力にて該状態メッセージに応答して誤りコードを生成するため、前記状態発生器出力に結合された誤りコード発生器、および
該状態発生器出力および該誤りコード発生器出力に結合された入力を有し、かつ、該相互接続に結合された出力を有するメッシュインタフェースを備える第1のノード、および
メッシュに結合された入力を有するメッシュインタフェースおよび
前記メッシュインタフェースに結合された障害検出器、を有する第2のノードを含んでなるシステム。 - 前記誤りコード発生器はパリティーチェック生成回路を含み、前記障害検出器はパリティーチェッカを有する請求項13に記載のシステム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US08/603,911 US5768300A (en) | 1996-02-22 | 1996-02-22 | Interconnect fault detection and localization method and apparatus |
| US08/603,911 | 1996-02-22 | ||
| PCT/US1997/002788 WO1997031447A1 (en) | 1996-02-22 | 1997-02-21 | Interconnect fault detection and localization method and apparatus |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11504495A JPH11504495A (ja) | 1999-04-20 |
| JP3816529B2 true JP3816529B2 (ja) | 2006-08-30 |
Family
ID=24417418
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP53035097A Expired - Fee Related JP3816529B2 (ja) | 1996-02-22 | 1997-02-21 | 相互接続の障害検出およびその位置特定方法および装置 |
Country Status (5)
| Country | Link |
|---|---|
| US (2) | US5768300A (ja) |
| EP (1) | EP0846382B1 (ja) |
| JP (1) | JP3816529B2 (ja) |
| DE (1) | DE69734310T2 (ja) |
| WO (1) | WO1997031447A1 (ja) |
Families Citing this family (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5768300A (en) * | 1996-02-22 | 1998-06-16 | Fujitsu Limited | Interconnect fault detection and localization method and apparatus |
| DE29901302U1 (de) * | 1999-01-26 | 2000-03-30 | Siemens AG, 80333 München | Netzwerkteilnehmer |
| US6718382B1 (en) * | 1999-02-11 | 2004-04-06 | Yunzhou Li | Technique for detecting leaky points within a network protocol domain |
| US6601210B1 (en) | 1999-09-08 | 2003-07-29 | Mellanox Technologies, Ltd | Data integrity verification in a switching network |
| AU6863200A (en) * | 1999-09-08 | 2001-04-10 | Mellanox Technologies Ltd. | Data integrity verification in a switching network |
| US7389341B2 (en) | 2001-01-31 | 2008-06-17 | Accenture Llp | Remotely monitoring a data processing system via a communications network |
| US8176137B2 (en) * | 2001-01-31 | 2012-05-08 | Accenture Global Services Limited | Remotely managing a data processing system via a communications network |
| US6990609B2 (en) * | 2001-06-12 | 2006-01-24 | Sun Microsystems, Inc. | System and method for isolating faults in a network |
| JP2003037599A (ja) * | 2001-07-25 | 2003-02-07 | Allied Tereshisu Kk | ネットワークの管理装置、管理方法、通信装置及びネットワークシステム |
| US7054330B1 (en) | 2001-09-07 | 2006-05-30 | Chou Norman C | Mask-based round robin arbitration |
| US6920106B1 (en) | 2001-09-07 | 2005-07-19 | Agilent Technologies, Inc. | Speculative loading of buffers within a port of a network device |
| US6950394B1 (en) | 2001-09-07 | 2005-09-27 | Agilent Technologies, Inc. | Methods and systems to transfer information using an alternative routing associated with a communication network |
| US6763418B1 (en) | 2001-09-07 | 2004-07-13 | Agilent Technologies, Inc. | Request bus arbitration |
| US7237016B1 (en) | 2001-09-07 | 2007-06-26 | Palau Acquisition Corporation (Delaware) | Method and system to manage resource requests utilizing link-list queues within an arbiter associated with an interconnect device |
| US7209476B1 (en) | 2001-10-12 | 2007-04-24 | Avago Technologies General Ip (Singapore) Pte. Ltd. | Method and apparatus for input/output port mirroring for networking system bring-up and debug |
| US6922749B1 (en) | 2001-10-12 | 2005-07-26 | Agilent Technologies, Inc. | Apparatus and methodology for an input port of a switch that supports cut-through operation within the switch |
| US6839794B1 (en) | 2001-10-12 | 2005-01-04 | Agilent Technologies, Inc. | Method and system to map a service level associated with a packet to one of a number of data streams at an interconnect device |
| US7139824B2 (en) * | 2001-11-28 | 2006-11-21 | International Business Machines Corporation | Method and system for isolating and simulating dropped packets in a computer network |
| US6973595B2 (en) * | 2002-04-05 | 2005-12-06 | International Business Machines Corporation | Distributed fault detection for data storage networks |
| US7016996B1 (en) | 2002-04-15 | 2006-03-21 | Schober Richard L | Method and apparatus to detect a timeout condition for a data item within a process |
| US7895065B2 (en) * | 2003-02-26 | 2011-02-22 | Sony Corporation | Method and apparatus for an itinerary planner |
| JP3565835B1 (ja) * | 2003-04-28 | 2004-09-15 | 松下電器産業株式会社 | 配線基板およびその製造方法ならびに半導体装置およびその製造方法 |
| US20040218623A1 (en) * | 2003-05-01 | 2004-11-04 | Dror Goldenberg | Hardware calculation of encapsulated IP, TCP and UDP checksums by a switch fabric channel adapter |
| US20050022091A1 (en) * | 2003-07-21 | 2005-01-27 | Holman Thomas J. | Method, system, and apparatus for adjacent-symbol error correction and detection code |
| EP1921809A4 (en) * | 2005-08-05 | 2008-10-01 | Huawei Tech Co Ltd | METHOD FOR OBTAINING AN ERROR DETECTION OF AN IP FORWARDING LEVEL |
| JP2009129301A (ja) * | 2007-11-27 | 2009-06-11 | Nec Electronics Corp | 自己診断回路及び自己診断方法 |
| US9565094B2 (en) * | 2009-11-13 | 2017-02-07 | International Business Machines Corporation | I/O routing in a multidimensional torus network |
| US9954760B2 (en) | 2010-01-29 | 2018-04-24 | International Business Machines Corporation | I/O routing in a multidimensional torus network |
| DE102016206707A1 (de) | 2016-04-20 | 2017-10-26 | Siemens Aktiengesellschaft | Diagnoseverfahren und Diagnosevorrichtung für ein Netzwerk |
| CN109936518B (zh) * | 2017-12-18 | 2022-02-11 | 迈普通信技术股份有限公司 | 交换芯片通道故障的检测方法和分布式机架交换机 |
| US10613919B1 (en) | 2019-10-28 | 2020-04-07 | Capital One Services, Llc | System and method for data error notification in interconnected data production systems |
| CN114244692B (zh) * | 2021-04-30 | 2024-02-02 | 无锡江南计算技术研究所 | 一种适用于超大规模互连网络的故障快速定位方法 |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2032736B (en) * | 1978-10-24 | 1982-09-08 | Standard Telephones Cables Ltd | Data transfer system |
| US4599723A (en) * | 1984-02-14 | 1986-07-08 | Pulse Electronics, Inc. | Method of encoding data for serial transmission |
| US5127006A (en) * | 1989-05-01 | 1992-06-30 | Digital Equipment Corporation | Fault diagnostic system |
| US5068854A (en) * | 1989-09-12 | 1991-11-26 | Cupertino, California U.S.A. | Error detection for fiber distributed interfaced optic link |
| US4999829A (en) * | 1989-11-06 | 1991-03-12 | At&T Bell Laboratories | Automatic fault recovery in a packet network |
| FR2669488B1 (fr) * | 1990-11-15 | 1993-01-08 | Cit Alcatel | Methode de transmission d'information de controle pour liaison de transmission de cellules a multiplexage temporel asynchrone. |
| BE1004959A3 (nl) * | 1991-06-28 | 1993-03-02 | Bell Telephone Mfg | Werkwijze en inrichtingen voor het testen van atm-verbindingen. |
| DE4226599C2 (de) * | 1992-08-11 | 1994-08-04 | Siemens Ag | Verfahren zur Fehlererkennung in digitalen Kommunikationssystemen |
| US5390197A (en) * | 1992-12-04 | 1995-02-14 | Hughes Aircraft Company | Vestigial identification for co-channel interference in cellular communications |
| US5784393A (en) * | 1995-03-01 | 1998-07-21 | Unisys Corporation | Method and apparatus for providing fault detection to a bus within a computer system |
| US5854786A (en) * | 1995-08-09 | 1998-12-29 | Qualcomm Incorporated | Method and apparatus for distribution/consolidation (DISCO) interface units for packet switched interconnection system |
| US5682537A (en) * | 1995-08-31 | 1997-10-28 | Unisys Corporation | Object lock management system with improved local lock management and global deadlock detection in a parallel data processing system |
| US5768300A (en) * | 1996-02-22 | 1998-06-16 | Fujitsu Limited | Interconnect fault detection and localization method and apparatus |
-
1996
- 1996-02-22 US US08/603,911 patent/US5768300A/en not_active Expired - Fee Related
-
1997
- 1997-02-21 DE DE69734310T patent/DE69734310T2/de not_active Expired - Fee Related
- 1997-02-21 JP JP53035097A patent/JP3816529B2/ja not_active Expired - Fee Related
- 1997-02-21 WO PCT/US1997/002788 patent/WO1997031447A1/en not_active Ceased
- 1997-02-21 EP EP97914776A patent/EP0846382B1/en not_active Expired - Lifetime
-
1998
- 1998-03-20 US US09/045,456 patent/US5987629A/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US5987629A (en) | 1999-11-16 |
| EP0846382B1 (en) | 2005-10-05 |
| DE69734310T2 (de) | 2006-05-11 |
| JPH11504495A (ja) | 1999-04-20 |
| US5768300A (en) | 1998-06-16 |
| WO1997031447A1 (en) | 1997-08-28 |
| EP0846382A1 (en) | 1998-06-10 |
| DE69734310D1 (de) | 2006-02-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3816529B2 (ja) | 相互接続の障害検出およびその位置特定方法および装置 | |
| EP0823165B1 (en) | Asynchronous packet switching | |
| US6661773B1 (en) | Method for detection of stale cells following route changes in a data communication | |
| US20030206527A1 (en) | Transmitting data between multiple computer processors | |
| US5796720A (en) | Control method of asynchronous data communications | |
| JP3630739B2 (ja) | ローカルエリア・ネットワークシステムおよびスイッチング方法 | |
| CN1571417B (zh) | 网络数据重新路由 | |
| US6952419B1 (en) | High performance transmission link and interconnect | |
| US20090249115A1 (en) | Method and system for dynamic link failover management | |
| JPH10326261A (ja) | 分散コンピュータ・システムのハードウェア要素によりエラーを報告するシステム | |
| WO2010018361A1 (en) | A multi-path network | |
| CN110166354A (zh) | 一种包含片上网络容错路由的数据处理系统 | |
| JPH10326260A (ja) | 分散コンピュータ・システムのハードウェア要素によりエラーを報告する方法 | |
| CN101013928B (zh) | 实现伪线仿真线路故障检测的装置及方法 | |
| US5309435A (en) | Multiring data transmission system | |
| CN100466591C (zh) | 主从设备系统 | |
| US7170908B2 (en) | System and method of selecting sources for a network element having redundant sources | |
| EP0853850A4 (en) | DATA TRANSFER BETWEEN SEVERAL COMPUTER PROCESSORS | |
| JP3607080B2 (ja) | 回線障害検出方法および装置 | |
| AU718290B2 (en) | Transmitting data between multiple computer processors | |
| CN101090405B (zh) | E1级连接配置中故障状态传递方法 | |
| EP1298869B1 (en) | System and method of selecting data sources for a network element having redundant sources | |
| JPH098835A (ja) | 二重化通信パス切替方式 | |
| Marcon et al. | An implementation of a distributed fault-tolerant mechanism for 2D mesh NoCs | |
| JPH11234296A (ja) | 伝送装置の受信信号自動切替え方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040120 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051011 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051212 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060131 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060316 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060509 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060608 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100616 Year of fee payment: 4 |
|
| LAPS | Cancellation because of no payment of annual fees |