JPH05130101A - メツシユアーキテクチヤにおける故障許容のための方法と装置 - Google Patents
メツシユアーキテクチヤにおける故障許容のための方法と装置Info
- Publication number
- JPH05130101A JPH05130101A JP4099996A JP9999692A JPH05130101A JP H05130101 A JPH05130101 A JP H05130101A JP 4099996 A JP4099996 A JP 4099996A JP 9999692 A JP9999692 A JP 9999692A JP H05130101 A JPH05130101 A JP H05130101A
- Authority
- JP
- Japan
- Prior art keywords
- mesh
- node
- nodes
- fault
- faulty
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2051—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant in regular structures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2041—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Hardware Redundancy (AREA)
Abstract
(57)【要約】 (修正有)
【目的】 d次元メッシュ・アーキテクチャにおける故
障を許容する方法と装置を得る。 【構成】 アーキテクチャはk個までの故障の存在下で
運用可能な目標メッシュとして、スイッチを使用せずに
再構成できる。N=n1 ×n2 ×…nd 個のノードを有
するd次元メッシュアーキテクチャMを与えられると5
01、故障許容メッシュに正確にN+k個のノードを有
するサーキュラント・グラフ502〜504により表現
可能である505。このグラフは、1組のk個以下の故
障ノードを与えられると、予め定めたノード再命名処理
の実行後、残りのグラフがd≧2,nd ≧3である限り
目標メッシュに対応するグラフをサブグラフとして含む
ことを保証される。同時に、構築された故障許容メッシ
ュを与えられた時に、k個までのネットワーク構成部品
の存在下で健全な目標メッシュを有効に位置づける。
障を許容する方法と装置を得る。 【構成】 アーキテクチャはk個までの故障の存在下で
運用可能な目標メッシュとして、スイッチを使用せずに
再構成できる。N=n1 ×n2 ×…nd 個のノードを有
するd次元メッシュアーキテクチャMを与えられると5
01、故障許容メッシュに正確にN+k個のノードを有
するサーキュラント・グラフ502〜504により表現
可能である505。このグラフは、1組のk個以下の故
障ノードを与えられると、予め定めたノード再命名処理
の実行後、残りのグラフがd≧2,nd ≧3である限り
目標メッシュに対応するグラフをサブグラフとして含む
ことを保証される。同時に、構築された故障許容メッシ
ュを与えられた時に、k個までのネットワーク構成部品
の存在下で健全な目標メッシュを有効に位置づける。
Description
【0001】
【産業上の利用分野】本発明は一般的にはd次元メッシ
ュアーキテクチャにおける故障を許容する方法と装置に
関する。さらに詳しく言えば、本発明は、(1)事前に
選定した数までの故障を支援し、なおアーキテクチャに
接続された「健全な」メッシュをすなわち容易に識別で
き、またアーキテクチャにより支持されるシステムの性
能低下を受けずに運用できる包含メッシュを含んでいる
と保証され得るメッシュアーキテクチャ、および(2)
故障したネットワーク構成要素の存在下で健全なメッシ
ュを有効に探し出す手法に関する。
ュアーキテクチャにおける故障を許容する方法と装置に
関する。さらに詳しく言えば、本発明は、(1)事前に
選定した数までの故障を支援し、なおアーキテクチャに
接続された「健全な」メッシュをすなわち容易に識別で
き、またアーキテクチャにより支持されるシステムの性
能低下を受けずに運用できる包含メッシュを含んでいる
と保証され得るメッシュアーキテクチャ、および(2)
故障したネットワーク構成要素の存在下で健全なメッシ
ュを有効に探し出す手法に関する。
【0002】さらに特定の用語で言えば、本発明の一面
では、N=n1 ×n2 ×…×nd 個のノードを有するd
次元メッシュアーキテクチャMが与えられると、故障許
容メッシュMkは正確にN+k個のノードを有するサー
キュラント・グラフにより表わすことが出来る。k個以
下の故障ノードの組を与えられると、事前に選定したノ
ードの再命名処理の実行後に、d≧2,nd ≧3である
限りは、目標メッシュMに対応するグラフを残りのグラ
フがサブグラフとして含むことが保証されるという特性
を、Mkのグラフ表示は有している。
では、N=n1 ×n2 ×…×nd 個のノードを有するd
次元メッシュアーキテクチャMが与えられると、故障許
容メッシュMkは正確にN+k個のノードを有するサー
キュラント・グラフにより表わすことが出来る。k個以
下の故障ノードの組を与えられると、事前に選定したノ
ードの再命名処理の実行後に、d≧2,nd ≧3である
限りは、目標メッシュMに対応するグラフを残りのグラ
フがサブグラフとして含むことが保証されるという特性
を、Mkのグラフ表示は有している。
【0003】本発明の別の一面では、k個までの故障の
組を与えられて、Mkの中で健全なメッシュMを発見す
る方法は、(ここでMkはN=(n1 ×n2 ×…×
nd )+k個のノードを有し、MはN個のノードを有す
る、但しd≧2,nd ≧3)、(a)Mk中のいずれの
非故障ノードを目標メッシュMのノードOの候補と考え
るべきかを定めるステップ、(b)候補非故障ノード中
のいずれが目標メッシュのノードOであるべきかを定め
るステップ、ならびに(c)識別の組がメッシュMの行
優先順序づけを表わすように、ノードOから出発して各
非故障ノードに識別子を割り当てるステップ、とからな
る。
組を与えられて、Mkの中で健全なメッシュMを発見す
る方法は、(ここでMkはN=(n1 ×n2 ×…×
nd )+k個のノードを有し、MはN個のノードを有す
る、但しd≧2,nd ≧3)、(a)Mk中のいずれの
非故障ノードを目標メッシュMのノードOの候補と考え
るべきかを定めるステップ、(b)候補非故障ノード中
のいずれが目標メッシュのノードOであるべきかを定め
るステップ、ならびに(c)識別の組がメッシュMの行
優先順序づけを表わすように、ノードOから出発して各
非故障ノードに識別子を割り当てるステップ、とからな
る。
【0004】
【従来の技術】「メッシュ」は並列コンピュータと要素
配列(例えば、並列メモリ配列)を設計する際、またボ
ードあるいはチップに計算モジュールを接続するための
等に用いられる最も重要かつよく知られた並列アーキテ
クチャの一つである。
配列(例えば、並列メモリ配列)を設計する際、またボ
ードあるいはチップに計算モジュールを接続するための
等に用いられる最も重要かつよく知られた並列アーキテ
クチャの一つである。
【0005】とりわけ、2次元および3次元メッシュト
ポロジの並列コンピュータが多数現存し、あるいは開発
中である。例として、Goodyear Aerospace製作の2次元
メッシュコンピュータ(「MPP」コンピュータ)、
「MP−1」(MASPARが販売)、「VICTO
R」(IBM)、「DELTA」(Intel)があ
る。MITで開発中の「J−Machine」は3次元
メッシュアーキテクチャの一例である。並列処理を可能
にするシステム、要素配列を含むシステム等の設計での
最も重大な問題点の一つは、故障時のシステム性能であ
る。例えば、並列コンピュータでは、事前に決められた
ある数の故障が存在した場合、同一あるいはほぼ同一の
機能と性能を有するマシンが好まれる。
ポロジの並列コンピュータが多数現存し、あるいは開発
中である。例として、Goodyear Aerospace製作の2次元
メッシュコンピュータ(「MPP」コンピュータ)、
「MP−1」(MASPARが販売)、「VICTO
R」(IBM)、「DELTA」(Intel)があ
る。MITで開発中の「J−Machine」は3次元
メッシュアーキテクチャの一例である。並列処理を可能
にするシステム、要素配列を含むシステム等の設計での
最も重大な問題点の一つは、故障時のシステム性能であ
る。例えば、並列コンピュータでは、事前に決められた
ある数の故障が存在した場合、同一あるいはほぼ同一の
機能と性能を有するマシンが好まれる。
【0006】Wafer Scale Integration (WSI)配列
は故障許容設計のどこが重要であるかの他の列を提供す
る。ウェーハ上の配列中、構成要素の一つが故障してい
るというだけで全ウェーハを廃却しなくてもよいという
ことは明らかに有利である。WSIは性能向上の技術で
あるが、主として歩溜りの問題の故に市場ではまだ重大
な衝撃を与えなかった。従って、WSI等に用いるよう
なd次元メッシュアーキテクチャにおける故障を処理す
る有効な技法(経費の点で)を開発することは実用上非
常に重要である。
は故障許容設計のどこが重要であるかの他の列を提供す
る。ウェーハ上の配列中、構成要素の一つが故障してい
るというだけで全ウェーハを廃却しなくてもよいという
ことは明らかに有利である。WSIは性能向上の技術で
あるが、主として歩溜りの問題の故に市場ではまだ重大
な衝撃を与えなかった。従って、WSI等に用いるよう
なd次元メッシュアーキテクチャにおける故障を処理す
る有効な技法(経費の点で)を開発することは実用上非
常に重要である。
【0007】従来技術の特許や文献は多いが、いずれも
各種応用に対する故障許容ネットワークをいかに作り使
用するかを教えることに向けられている。教えのすべて
にメッシュアーキテクチャの使用を含んでいる設ではな
い。多くの教えは特定型式の故障部品(例えばメモリ部
品やプロセッサ、しかし両方ではない)以外には有効で
ない。さらに別の教えでは、多数の予備部品および/ま
たはスイッチ、余分の通信リンク等を必要とし、これが
ネットワークのコスト増および性能低下の傾向を生じた
り、あるいはネットワーク構造がアーキテクチャに含ま
れる特定部品の故障をマスクすることが不可能である等
の場合には、全然作動しないことになる。
各種応用に対する故障許容ネットワークをいかに作り使
用するかを教えることに向けられている。教えのすべて
にメッシュアーキテクチャの使用を含んでいる設ではな
い。多くの教えは特定型式の故障部品(例えばメモリ部
品やプロセッサ、しかし両方ではない)以外には有効で
ない。さらに別の教えでは、多数の予備部品および/ま
たはスイッチ、余分の通信リンク等を必要とし、これが
ネットワークのコスト増および性能低下の傾向を生じた
り、あるいはネットワーク構造がアーキテクチャに含ま
れる特定部品の故障をマスクすることが不可能である等
の場合には、全然作動しないことになる。
【0008】例えば、Choate等への米国特許4,
047,163、Choateへの米国特許4,05
1,354、Henryへの米国特許4,791,60
3は故障許容手法を述べているが、これはメモリ素子の
みに有効で、故障許容相互接続ネットワークに拡張した
り、包含したりはできない。
047,163、Choateへの米国特許4,05
1,354、Henryへの米国特許4,791,60
3は故障許容手法を述べているが、これはメモリ素子の
みに有効で、故障許容相互接続ネットワークに拡張した
り、包含したりはできない。
【0009】Mortonへの米国特許4,722,0
84は、共用バスに結合された並列線形配列の使用によ
り故障許容を達成するVLSI回路との使用に関する配
列構成機器を述べている。別の「ブス」志向の故障許容
計画はCorlieuへの米国特許4,891,810
に教えがある。ここではノードがブスに結合されている
再構成可能な計算素子を述べている。一般に、ブス志向
の故障許容アーキテクチャはシステム性能に重大な影響
を及ぼすことがあり、特に、支援されるシステムがブス
回線争奪への可能性およびブス管理コストに敏感な場合
はとりわけそうである。
84は、共用バスに結合された並列線形配列の使用によ
り故障許容を達成するVLSI回路との使用に関する配
列構成機器を述べている。別の「ブス」志向の故障許容
計画はCorlieuへの米国特許4,891,810
に教えがある。ここではノードがブスに結合されている
再構成可能な計算素子を述べている。一般に、ブス志向
の故障許容アーキテクチャはシステム性能に重大な影響
を及ぼすことがあり、特に、支援されるシステムがブス
回線争奪への可能性およびブス管理コストに敏感な場合
はとりわけそうである。
【0010】上記に示すように、ネットワークの故障許
容特性を向上させるための従来技術での取り上げ方の多
くにはスイッチの追加を含んでいる。一般に、これらシ
ステムは重大な処理遅れを生ずる可能性を有する。かか
るシステムの例は国際特許出願No.WO 89/07
298およびヨーロッパ特許EP−398971に教示
されており、スイッチを追加する故障許容ネットワーク
が述べられている。メッセージはこれらの可能な多数の
スイッチを介して送られ、これが望ましくない「減速
(スローダウン)」率を導入することがある。
容特性を向上させるための従来技術での取り上げ方の多
くにはスイッチの追加を含んでいる。一般に、これらシ
ステムは重大な処理遅れを生ずる可能性を有する。かか
るシステムの例は国際特許出願No.WO 89/07
298およびヨーロッパ特許EP−398971に教示
されており、スイッチを追加する故障許容ネットワーク
が述べられている。メッセージはこれらの可能な多数の
スイッチを介して送られ、これが望ましくない「減速
(スローダウン)」率を導入することがある。
【0011】目的を達成するために交換接続にたよる故
障許容ネットワークの別の例が、Davis等への米国
特許4,922,408に教示されている。ここでは、
故障許容通信を実行するのに、六角形配列を利用する多
重プロセッサ通信システムが述べられている。このシス
テムは、可能な多数の中間ノードを介して送られるメッ
セージを有し、このノードは、再度重大な処理遅れを生
ずる可能性を有する。
障許容ネットワークの別の例が、Davis等への米国
特許4,922,408に教示されている。ここでは、
故障許容通信を実行するのに、六角形配列を利用する多
重プロセッサ通信システムが述べられている。このシス
テムは、可能な多数の中間ノードを介して送られるメッ
セージを有し、このノードは、再度重大な処理遅れを生
ずる可能性を有する。
【0012】再び、上記で示すように、故障許容アーキ
テクチャを作るために予備ノードを追加する構想もまた
知られている。しかし、公知の手法のいずれも次の点を
考慮していない。即ち(1)追加される予備ノードの数
を最小にすることによりネットワークコストを最小にす
ること、(2)多次元メッシュにおける(予め決められ
た数kまでの)複数の故障を支援できること、(3)ノ
ードを介しての通信が不可能になるような全ノード故障
の場合でさえも故障許容を提供すること、(4)(特定
の故障条件下で動作しつづけなければならない基本ネッ
トワークの程度と比較し)作られつつある故障許容ネッ
トワークの次数を増加しないよう同時に保証すること、
である。)現在の技術水準の他の例が以下の文献に説明
されているが、そのいずれも上記基準を満足していな
い。
テクチャを作るために予備ノードを追加する構想もまた
知られている。しかし、公知の手法のいずれも次の点を
考慮していない。即ち(1)追加される予備ノードの数
を最小にすることによりネットワークコストを最小にす
ること、(2)多次元メッシュにおける(予め決められ
た数kまでの)複数の故障を支援できること、(3)ノ
ードを介しての通信が不可能になるような全ノード故障
の場合でさえも故障許容を提供すること、(4)(特定
の故障条件下で動作しつづけなければならない基本ネッ
トワークの程度と比較し)作られつつある故障許容ネッ
トワークの次数を増加しないよう同時に保証すること、
である。)現在の技術水準の他の例が以下の文献に説明
されているが、そのいずれも上記基準を満足していな
い。
【0013】Harper等の米国特許4,907,2
32およびGorin等の英国特許GB2231985
は並列アーキテクチャにおける悪質(Byzantine )故障
を許容する手法を教示している。しかし、k個の故障を
支援するのに、少くとも3k+1個の予備ノードが必要
である。
32およびGorin等の英国特許GB2231985
は並列アーキテクチャにおける悪質(Byzantine )故障
を許容する手法を教示している。しかし、k個の故障を
支援するのに、少くとも3k+1個の予備ノードが必要
である。
【0014】Wareの米国特許4,302,819は
故障許容モノリシック乗算器を述べている。これは許容
される故障数以上の数の予備品を必要とし、また故障が
発見された時に全列の構成要素を廃棄する。このシステ
ムは予備ノード要求の点でコストがかかる。
故障許容モノリシック乗算器を述べている。これは許容
される故障数以上の数の予備品を必要とし、また故障が
発見された時に全列の構成要素を廃棄する。このシステ
ムは予備ノード要求の点でコストがかかる。
【0015】Ramacher等の米国特許4,95
1,220は16の次数を有し、かつせいぜい2個の最
悪ケース故障を許容できる故障許容VLSIシステムを
述べている。この文献で、特に他次数、限定数の許容故
障の面で教えられる故障許容技法は、多次元メッシュ適
用には適していない。WareやHarper等と同
様、Ramacher等のシステムは、必要なノードの
数が許容される故障の数を越えているので予備ノードの
面でコストがかかる。
1,220は16の次数を有し、かつせいぜい2個の最
悪ケース故障を許容できる故障許容VLSIシステムを
述べている。この文献で、特に他次数、限定数の許容故
障の面で教えられる故障許容技法は、多次元メッシュ適
用には適していない。WareやHarper等と同
様、Ramacher等のシステムは、必要なノードの
数が許容される故障の数を越えているので予備ノードの
面でコストがかかる。
【0016】McCanny等の米国特許4,833,
635は、故障許容の2次元メッシュを含有するビット
スライス型ディジタルプロセッサを教示している。しか
し、故障許容は1次元メッシュを形成するサブシステム
に拡張するだけで、従って実際の適用は制限される。
635は、故障許容の2次元メッシュを含有するビット
スライス型ディジタルプロセッサを教示している。しか
し、故障許容は1次元メッシュを形成するサブシステム
に拡張するだけで、従って実際の適用は制限される。
【0017】ヨーロッパ特許出願190,813は故障
許容配列を構成するのに用いるための処理セルについて
述べている。セルは許容故障の数以上の予備を必要と
し、約10個を有し、また最悪分布の場合ではただ1個
の故障のみを許容できるにすぎない。この明細書に教示
されている処理セルの進め方は予備ノードおよびその数
の要求の点で明らかに貴用がかかる。
許容配列を構成するのに用いるための処理セルについて
述べている。セルは許容故障の数以上の予備を必要と
し、約10個を有し、また最悪分布の場合ではただ1個
の故障のみを許容できるにすぎない。この明細書に教示
されている処理セルの進め方は予備ノードおよびその数
の要求の点で明らかに貴用がかかる。
【0018】Grinberg等の米国特許4,50
7,726はノード内部の故障許容を提供する装置を教
示している。Yungの米国特許4,970,724お
よび国際特許出願WO 90/09635は故障許容を
達成するためにある程度まで故障ノードを通る経路を必
要とする故障許容ネットワークを教示している。しか
し、これらの教示のいずれも全ノード故障が生じる立場
では故障許容を提供しない。
7,726はノード内部の故障許容を提供する装置を教
示している。Yungの米国特許4,970,724お
よび国際特許出願WO 90/09635は故障許容を
達成するためにある程度まで故障ノードを通る経路を必
要とする故障許容ネットワークを教示している。しか
し、これらの教示のいずれも全ノード故障が生じる立場
では故障許容を提供しない。
【0019】最近の文献、「メッシュ中の故障回復のた
めのダイアゴナル交換計画」(研究発表説明書No.3
09、1990年1月発行、英国Kenneth Mason Public
ations出版)は最新技術の例を更に示している。ここで
は、並列プロセッサに対する故障回復計画が発表されて
いる。しかしこの計画は直角2次元メッシュのみに有効
であり、最悪分布の場合はせいぜい2個の故障を許容で
きるのみである。
めのダイアゴナル交換計画」(研究発表説明書No.3
09、1990年1月発行、英国Kenneth Mason Public
ations出版)は最新技術の例を更に示している。ここで
は、並列プロセッサに対する故障回復計画が発表されて
いる。しかしこの計画は直角2次元メッシュのみに有効
であり、最悪分布の場合はせいぜい2個の故障を許容で
きるのみである。
【0020】
【発明が解決しようとする課題】上記の文献および以下
に引用するその他の文献に照らして、現在の技術水準を
要約すると、メッシュ・アーキテクチャにおいて故障を
許容する基本的方法は2つある。
に引用するその他の文献に照らして、現在の技術水準を
要約すると、メッシュ・アーキテクチャにおいて故障を
許容する基本的方法は2つある。
【0021】第1の方法はアーキテクチャの健全な部分
を有するメッシュを模擬することにより、故障の影響を
機能的に隠すことである。このアプローチの期待は、適
当な減速率で同一の機能性が得られることである。この
方法はKaklamanis等により、表題「故障アレ
イプロセッサによる計算に対する漸近線的タイトバウン
ド」(コンピュータ科学基金に関する第31回米国電気
電子学会議事録、PP.285〜296、1990年10
月発行)の論文中で教示されている。
を有するメッシュを模擬することにより、故障の影響を
機能的に隠すことである。このアプローチの期待は、適
当な減速率で同一の機能性が得られることである。この
方法はKaklamanis等により、表題「故障アレ
イプロセッサによる計算に対する漸近線的タイトバウン
ド」(コンピュータ科学基金に関する第31回米国電気
電子学会議事録、PP.285〜296、1990年10
月発行)の論文中で教示されている。
【0022】Kaklamanis等が教示する方法は
理論上は完全であるが、性能上の減速が実用上はそれを
魅力のないものにしている。さらに、Kaklaman
is等の教示は、上記の他の引用文献のあるものと同じ
く、並行マシンにおけるように、1個の構成部品が他の
数個の構成部品を模擬できる時にのみ有効である。ノー
ドがメモリ素子のような、複数構成部品を模擬できない
構成部品から成立しているなら、本文献により教示され
ている方法は望ましい故障許容を提供できなくなる。
理論上は完全であるが、性能上の減速が実用上はそれを
魅力のないものにしている。さらに、Kaklaman
is等の教示は、上記の他の引用文献のあるものと同じ
く、並行マシンにおけるように、1個の構成部品が他の
数個の構成部品を模擬できる時にのみ有効である。ノー
ドがメモリ素子のような、複数構成部品を模擬できない
構成部品から成立しているなら、本文献により教示され
ている方法は望ましい故障許容を提供できなくなる。
【0023】前記文献の若干の典型となっており、メッ
シュアーキテクチャでの故障を許容する進め型として知
られる第2の方法は、アーキテクチャに予備のプロセッ
サおよび余分のリンクまたはスイッチを追加することで
ある。この進め方の構想は、健全ノードを有する全メッ
シュ構造を維持しつづける一方で、ある接続を無視する
か、あるいはスイッチを設けるかのいずれかにより、故
障を分離するものである。この進め方の側がKung等
による論文、表題「単一トラックスイッチを用いる故障
許容アレイプロセッサ」(コンピュータに関する米国電
気電子学会会報、C−38巻、第4号、PP.501〜5
14、198年4月発行)に述べられている。
シュアーキテクチャでの故障を許容する進め型として知
られる第2の方法は、アーキテクチャに予備のプロセッ
サおよび余分のリンクまたはスイッチを追加することで
ある。この進め方の構想は、健全ノードを有する全メッ
シュ構造を維持しつづける一方で、ある接続を無視する
か、あるいはスイッチを設けるかのいずれかにより、故
障を分離するものである。この進め方の側がKung等
による論文、表題「単一トラックスイッチを用いる故障
許容アレイプロセッサ」(コンピュータに関する米国電
気電子学会会報、C−38巻、第4号、PP.501〜5
14、198年4月発行)に述べられている。
【0024】メッシュアキテクチャ内で故障許容を得る
ためのこの第2の既知の進め方はいくつかの面で問題が
ある。例えば、もしスイッチ機構を用いるなら、その機
構自体が故障のないものでなければならない。さらに、
スイッチ、余分のリンク、あるいは予備プロセッサの追
加は、ネットワークコストを上昇させ、従って可能な限
り最も経済的なやり方で行わなければならない。さらに
その上、これら余分の構成部品はアーキテクチャの速度
を減速させる傾向があり、これによりネットワーク性能
を劣化させる。
ためのこの第2の既知の進め方はいくつかの面で問題が
ある。例えば、もしスイッチ機構を用いるなら、その機
構自体が故障のないものでなければならない。さらに、
スイッチ、余分のリンク、あるいは予備プロセッサの追
加は、ネットワークコストを上昇させ、従って可能な限
り最も経済的なやり方で行わなければならない。さらに
その上、これら余分の構成部品はアーキテクチャの速度
を減速させる傾向があり、これによりネットワーク性能
を劣化させる。
【0025】従って、メッシュ・アーキテクチャの故障
許容を達成し、かつ先行技術の故障許容機構で用いられ
るスイッチや余分のリンクの追加を廃除するような方法
と機器を提供することが望まれる。
許容を達成し、かつ先行技術の故障許容機構で用いられ
るスイッチや余分のリンクの追加を廃除するような方法
と機器を提供することが望まれる。
【0026】さらに、ネットワークの重大な性能劣化を
生ぜず、またコスト増加なしにメッシュ・アーキテクチ
ャの故障許容を達成できることが望ましい。さらに詳し
くは、構成体のコストを抑えるためには、構成、使用さ
れる故障許容ネットワークの次数(論理出力数)を最小
に保つことが望ましい。
生ぜず、またコスト増加なしにメッシュ・アーキテクチ
ャの故障許容を達成できることが望ましい。さらに詳し
くは、構成体のコストを抑えるためには、構成、使用さ
れる故障許容ネットワークの次数(論理出力数)を最小
に保つことが望ましい。
【0027】さらになお、それぞれの構成部品が、シス
テムの重大な性能劣化を蒙ることなしには、外の構成部
品の役を務めたり、あるいは模擬したりが出来ないよう
なメッシュアーキテクチャにおいて、故障に耐えること
が望ましい。
テムの重大な性能劣化を蒙ることなしには、外の構成部
品の役を務めたり、あるいは模擬したりが出来ないよう
なメッシュアーキテクチャにおいて、故障に耐えること
が望ましい。
【0028】さらにその上、故障許容メッシュを構成す
るのに用いる予備構成部品の数を最小に保つことが望ま
しい。詳しく言えば、許容さるべき故障の数より多い数
の予備構成部品を追加しなくてすむことが望ましい。
るのに用いる予備構成部品の数を最小に保つことが望ま
しい。詳しく言えば、許容さるべき故障の数より多い数
の予備構成部品を追加しなくてすむことが望ましい。
【0029】以下に示すように、上に述べた望ましい特
性のすべてを有する故障許容メッシュアーキテクチャ
が、本発明の一面に従い、次のようなグラフとしてメッ
シュ・アーキテクチャを取り扱うことにより実現でき
る。このグラフでは、グラフのノードは同一構成部品
(プロセッサ、メモリ素子等)を表わし、グラフのエッ
ジは例えば物理リンク、ラジオ通信リンク等のノード間
のリンクを表わしている。
性のすべてを有する故障許容メッシュアーキテクチャ
が、本発明の一面に従い、次のようなグラフとしてメッ
シュ・アーキテクチャを取り扱うことにより実現でき
る。このグラフでは、グラフのノードは同一構成部品
(プロセッサ、メモリ素子等)を表わし、グラフのエッ
ジは例えば物理リンク、ラジオ通信リンク等のノード間
のリンクを表わしている。
【0030】各種の異なる故障許容アーキテクチャを開
発するために、グラフモデルを利用する先行技術が存在
していることに注目すべきである。しかし、メッシュ・
アーキテクチャに適用されるような技術は知られていな
い。
発するために、グラフモデルを利用する先行技術が存在
していることに注目すべきである。しかし、メッシュ・
アーキテクチャに適用されるような技術は知られていな
い。
【0031】詳しく言えば、Hayesは、論文「故障
許容計算システムに対するグラフモデル」(コンピュー
タに関する米国電気電子学会会報、C−25巻、第9
号、PP.875〜884、1976年9月発行)中で、
周期、直線配列、ツリーの目標グラフで故障許容グラフ
の使用を教示している。Wongの論文、「最小K−ハ
ミルトングラフII」(The Journal ofGraph Theory ,
第8巻、PP.155〜165,1984)およびPao
li等の論文、「最小K−ハミルトングラフII」(The
Journal of Graph Theory ,第10巻,PP.79−9
5、1986)は共に周期にのみ関する。
許容計算システムに対するグラフモデル」(コンピュー
タに関する米国電気電子学会会報、C−25巻、第9
号、PP.875〜884、1976年9月発行)中で、
周期、直線配列、ツリーの目標グラフで故障許容グラフ
の使用を教示している。Wongの論文、「最小K−ハ
ミルトングラフII」(The Journal ofGraph Theory ,
第8巻、PP.155〜165,1984)およびPao
li等の論文、「最小K−ハミルトングラフII」(The
Journal of Graph Theory ,第10巻,PP.79−9
5、1986)は共に周期にのみ関する。
【0032】Dutt等によるより最近の刊行物、さら
に詳しくは、論文「k個の故障許容ツリーアーキテクチ
ャの設計および再構成について」(コンピュータに関す
る米国電気電子学会会報、C−29巻、第9号、PP.8
36〜840、1980)、および論文「故障許容コン
ピュータに関する第19回国際シンポジウムの議事録、
PP.496〜503、1989年6月)は、それぞれツ
リーとハイパーキャーブからなる目標グラフに関する。
に詳しくは、論文「k個の故障許容ツリーアーキテクチ
ャの設計および再構成について」(コンピュータに関す
る米国電気電子学会会報、C−29巻、第9号、PP.8
36〜840、1980)、および論文「故障許容コン
ピュータに関する第19回国際シンポジウムの議事録、
PP.496〜503、1989年6月)は、それぞれツ
リーとハイパーキャーブからなる目標グラフに関する。
【0033】上に示したように、上記文献はいずれも、
一般に目標メッシュのような他のメッシュを含む故障許
容メッシュ・アーキテクチャに対するモデルとしてグラ
フの使用を教示していないし、また以下詳細に述べるよ
うな、故障許容メッシュを構築、利用するための特別の
手法も教示されていない。
一般に目標メッシュのような他のメッシュを含む故障許
容メッシュ・アーキテクチャに対するモデルとしてグラ
フの使用を教示していないし、また以下詳細に述べるよ
うな、故障許容メッシュを構築、利用するための特別の
手法も教示されていない。
【0034】従って、故障許容メッシュ・アーキテクチ
ャを定義、構成、使用するための有効な方法よび装置を
提供することが本発明の1つの目的である。(以下一般
に参照するメッシュ・アーキテクチャはすべて、d次元
メッシュ・アーキテクチャと考えることを意味する。こ
こでdは任意に選べる整数である。)予め定めた数の故
障を支援でき、なお減速を受けずに作動できる健全なメ
ッシュ接続アーキテクチャを含むことをそれぞれ保証さ
れる故障許容メッシュ・アーキテクチャを提供すること
が本発明のもう一つの目的である。
ャを定義、構成、使用するための有効な方法よび装置を
提供することが本発明の1つの目的である。(以下一般
に参照するメッシュ・アーキテクチャはすべて、d次元
メッシュ・アーキテクチャと考えることを意味する。こ
こでdは任意に選べる整数である。)予め定めた数の故
障を支援でき、なお減速を受けずに作動できる健全なメ
ッシュ接続アーキテクチャを含むことをそれぞれ保証さ
れる故障許容メッシュ・アーキテクチャを提供すること
が本発明のもう一つの目的である。
【0035】さらに、故障の存在の下で、スイッチを使
用せずに、容易に再構成できる故障許容メッシュ・アー
キテクチャを提供すること、すなわち、故障ネットワー
ク中の健全メッシュを有効に探し出す手法を提供するこ
とが、本発明の一目的である。
用せずに、容易に再構成できる故障許容メッシュ・アー
キテクチャを提供すること、すなわち、故障ネットワー
ク中の健全メッシュを有効に探し出す手法を提供するこ
とが、本発明の一目的である。
【0036】その上さらに、k個までのノード故障を許
容するために正確にk個の予備ノードを追加することに
より、一方では同時にノード当りのリンクの数(メッシ
ュの次数)を最少に保つことにより、故障許容メッシュ
・アーキテクチャのコストを最小にすることが本発明の
一目的である。詳しく言えば、ただ1個の予備構成部品
の追加を要し、かつメッシュの最大次数を増加させない
単一ノード故障を許容するための方法と機器を提供する
のが本発明の目的の1つである。
容するために正確にk個の予備ノードを追加することに
より、一方では同時にノード当りのリンクの数(メッシ
ュの次数)を最少に保つことにより、故障許容メッシュ
・アーキテクチャのコストを最小にすることが本発明の
一目的である。詳しく言えば、ただ1個の予備構成部品
の追加を要し、かつメッシュの最大次数を増加させない
単一ノード故障を許容するための方法と機器を提供する
のが本発明の目的の1つである。
【0037】さらになお、並列コンピュータ、他の並列
アーキテクチャ、基板上の素子配列、WSI配列、メモ
リ素子等での使用に対し普及できる故障許容メッシュア
ーキテクチャの構築、使用のための方法および機器を提
供するのが本発明の一目的である。
アーキテクチャ、基板上の素子配列、WSI配列、メモ
リ素子等での使用に対し普及できる故障許容メッシュア
ーキテクチャの構築、使用のための方法および機器を提
供するのが本発明の一目的である。
【0038】本発明によれば、メッシュ・アーキテクチ
ャはあるグラフ中のノードは同一構成部品(プロセッ
サ、メモリ素子等)を表わし、グラフのエッジはノード
間の通信リンクを表わすようなグラフと見做される。
ャはあるグラフ中のノードは同一構成部品(プロセッ
サ、メモリ素子等)を表わし、グラフのエッジはノード
間の通信リンクを表わすようなグラフと見做される。
【0039】本発明のこの見方に従って、「目標メッシ
ュ」Mを先づ選定する。MはN=n1 ×n2 ×…×nd
個のノードを有するd次元メッシュ(ここでd≧2,n
d≧3)であってよい。続いて、N+k個のノードを有
する故障許容メッシュMkをサーキュラントグラフモデ
ルを用いて定義、構築する。このグラフは正確にN+k
個のノードを有するものとする。Mkのグラフ表示はk
個以下の故障ノードの組が与えられると、予め定められ
たノード再命名処理実行後、残りのグラフはサブグラフ
として含むことを保証され、そのグラフはd≧2,nd
≧3である限り目標メッシュに対応するという性質を有
する。niとndとは目標グラフの変更なしに変換可能
であるから、nd≧3の要求は、少なくとも1個のni
≧3の要求と等価であることに注目すべきである。
ュ」Mを先づ選定する。MはN=n1 ×n2 ×…×nd
個のノードを有するd次元メッシュ(ここでd≧2,n
d≧3)であってよい。続いて、N+k個のノードを有
する故障許容メッシュMkをサーキュラントグラフモデ
ルを用いて定義、構築する。このグラフは正確にN+k
個のノードを有するものとする。Mkのグラフ表示はk
個以下の故障ノードの組が与えられると、予め定められ
たノード再命名処理実行後、残りのグラフはサブグラフ
として含むことを保証され、そのグラフはd≧2,nd
≧3である限り目標メッシュに対応するという性質を有
する。niとndとは目標グラフの変更なしに変換可能
であるから、nd≧3の要求は、少なくとも1個のni
≧3の要求と等価であることに注目すべきである。
【0040】k個までの故障を支援できる故障許容メッ
シュを得るためには正確にk個の予備ノードが追加され
ることに注目すべきである。故障許容メッシュを構築す
るためのこの進め方は、目標メッシュにより支援される
よう設計されたいかなるプロセス、システム等も故障の
分布とは関係なくk個以下のノード故障の存在の下で遅
速を生ぜず作動することを保証する。
シュを得るためには正確にk個の予備ノードが追加され
ることに注目すべきである。故障許容メッシュを構築す
るためのこの進め方は、目標メッシュにより支援される
よう設計されたいかなるプロセス、システム等も故障の
分布とは関係なくk個以下のノード故障の存在の下で遅
速を生ぜず作動することを保証する。
【0041】本発明の教示に従って構築される故障許容
メッシュはその組み立てが最小次数(ノード当りのエッ
ジの数)および最小予備構成部品で故障許容グラフを構
築することになるので、最小コストで組み立てることが
できる。
メッシュはその組み立てが最小次数(ノード当りのエッ
ジの数)および最小予備構成部品で故障許容グラフを構
築することになるので、最小コストで組み立てることが
できる。
【0042】さらに以下に詳細に説明するように、与え
られた故障のあるエッジを附随するノードは故障ノード
として取扱えるので、本発明の教えはエッジ故障の許容
(ノード故障と同様)に拡張することも注目すべきであ
る。
られた故障のあるエッジを附随するノードは故障ノード
として取扱えるので、本発明の教えはエッジ故障の許容
(ノード故障と同様)に拡張することも注目すべきであ
る。
【0043】発明の他の一面によれば、故障許容ネット
ワーク(メッシュ)Mkはd次元目的メッシュMが与え
られると任意に構築できる。ここでMはN=n1 ×n2
×…×nd 個のノードを有し(d≧2,nd≧3)、ま
たMkはN+k個のノードを有し、k個までの故障を許
容できる。本発明の教示に従って構築されるMkは、k
個までの故障の発生の際与えられたd次元メッシュを形
成するために、スイッチを使用せずにMk中のノードの
いかなるNも再構成できるという性質を有している。
ワーク(メッシュ)Mkはd次元目的メッシュMが与え
られると任意に構築できる。ここでMはN=n1 ×n2
×…×nd 個のノードを有し(d≧2,nd≧3)、ま
たMkはN+k個のノードを有し、k個までの故障を許
容できる。本発明の教示に従って構築されるMkは、k
個までの故障の発生の際与えられたd次元メッシュを形
成するために、スイッチを使用せずにMk中のノードの
いかなるNも再構成できるという性質を有している。
【0044】更に詳しくは、本発明のこの分野は、N=
n1 ×n2 ×…×nd 個の同一ノード(d≧2,nd≧
3)を有するd次元メッシュMを含む故障許容メッシュ
Mkに関係する。ここでMkはk個までの故障を支援で
き、かつメッシュMを形成するのにスイッチの使用なし
に再構成できる。メッシュは(a)N+k個のノード、
ここで追加k個のノードは、メッシュMにおけるのと同
じタイプのものであり、サーキュラントグラフで配列す
る。(b)上記サーキュラントグラフに対する複数のエ
ッジはここで、kが奇数のときは、次のオフセットの組
の結合により定義される。
n1 ×n2 ×…×nd 個の同一ノード(d≧2,nd≧
3)を有するd次元メッシュMを含む故障許容メッシュ
Mkに関係する。ここでMkはk個までの故障を支援で
き、かつメッシュMを形成するのにスイッチの使用なし
に再構成できる。メッシュは(a)N+k個のノード、
ここで追加k個のノードは、メッシュMにおけるのと同
じタイプのものであり、サーキュラントグラフで配列す
る。(b)上記サーキュラントグラフに対する複数のエ
ッジはここで、kが奇数のときは、次のオフセットの組
の結合により定義される。
【0045】 {1+j 但し 0≦j≦(k−1)/2}; {n1 +j 但し 0≦j≦(k−1)/2}; {(n1 ×n2 )+j 但し 0≦j≦(k−1)/
2};から {(n1 ×n2 ×…×nd-1 )+j 但し 0≦j≦
(k−1)/2};まで またkが偶数のときは、エッジは次のオフセットの組の
結合により定義される。
2};から {(n1 ×n2 ×…×nd-1 )+j 但し 0≦j≦
(k−1)/2};まで またkが偶数のときは、エッジは次のオフセットの組の
結合により定義される。
【0046】 {1+j 但し 0≦j≦k/2}; {n1 +j 但し 0≦j≦k/2}; {(n1 ×n2 )+j 但し 0≦j≦k/2};から {(n1 ×n2 ×…×nd-1 )+j 但し 0≦j≦k
/2};まで 本発明の更に別の面は、k個までの故障の存在下で、故
障許容メッシュMkに健全メッシュを探し出し、作動可
能な目標メッシュMを得るためにMkを再構成する方法
に向けられている。ここで、本発明に従って、(1)
d,n1 ,n2 ,…,nd ,kの値;(2)サーキュラ
ント・グラフ・モデルで表現した故障許容メッシュMk
の構造、および(3)Mk中のk個までの故障の位置が
与えられると、Mを得るためにMk中のノードを「再ラ
ベル」する「再命名」処理が用いられる。本発明の実施
例の一つによれば、新ラベル付けは、健全メッシュを生
ずる非故障ノードの行優先順序付けに対応している。
/2};まで 本発明の更に別の面は、k個までの故障の存在下で、故
障許容メッシュMkに健全メッシュを探し出し、作動可
能な目標メッシュMを得るためにMkを再構成する方法
に向けられている。ここで、本発明に従って、(1)
d,n1 ,n2 ,…,nd ,kの値;(2)サーキュラ
ント・グラフ・モデルで表現した故障許容メッシュMk
の構造、および(3)Mk中のk個までの故障の位置が
与えられると、Mを得るためにMk中のノードを「再ラ
ベル」する「再命名」処理が用いられる。本発明の実施
例の一つによれば、新ラベル付けは、健全メッシュを生
ずる非故障ノードの行優先順序付けに対応している。
【0047】更に詳しくは、k個までの故障の組が与え
られると、Mk中の健全メッシュMを見出す方法は(こ
こでMkはN=(n1 ×n2 ×…×nd )+k個のノー
ドを有し、d≧2,nd≧3,またMはN個のノードを
有する)は次のステップから成る。即ち(a)Mk中の
どの非故障ノードが非故障メッシュM中のノード0の候
補と考えるべきかを決定するステップ、(b)候補非故
障ノード中のいずれが目標メッシュ中のノード0である
べきかを決定するステップ、および(c)ノード0で始
まる各非故障ノードに識別子を割り当てるステップであ
る。ここで識別子の組はメッシュMの行優先順を表わ
す。
られると、Mk中の健全メッシュMを見出す方法は(こ
こでMkはN=(n1 ×n2 ×…×nd )+k個のノー
ドを有し、d≧2,nd≧3,またMはN個のノードを
有する)は次のステップから成る。即ち(a)Mk中の
どの非故障ノードが非故障メッシュM中のノード0の候
補と考えるべきかを決定するステップ、(b)候補非故
障ノード中のいずれが目標メッシュ中のノード0である
べきかを決定するステップ、および(c)ノード0で始
まる各非故障ノードに識別子を割り当てるステップであ
る。ここで識別子の組はメッシュMの行優先順を表わ
す。
【0048】ここで説明する教示に従って構築される故
障許容メッシュは、予め定めた数までの故障の存在下
で、減速を生ぜずに作動可能な、完全メッシュを含むこ
とを保証されるという保証が、本発明の特徴である。故
障許容メッシュは最小コストで構築でき(次元および予
備構成部品に関し)、また並列コンピュータ、WSI配
列、メモリ素子配列等に広い適用範囲を有する。
障許容メッシュは、予め定めた数までの故障の存在下
で、減速を生ぜずに作動可能な、完全メッシュを含むこ
とを保証されるという保証が、本発明の特徴である。故
障許容メッシュは最小コストで構築でき(次元および予
備構成部品に関し)、また並列コンピュータ、WSI配
列、メモリ素子配列等に広い適用範囲を有する。
【0049】
【実施例】図−1に4列4行を有する2次元メッシュ
(16ノード)の例を示す。ノードは、ノード100〜
115とラベル付きで示されている。
(16ノード)の例を示す。ノードは、ノード100〜
115とラベル付きで示されている。
【0050】図−2は4個の予備ノード120〜123
の追加、および図−1に示すメッシュに予備ノードを結
合させるための連結リンク(点線で示すエッジ)を示し
ている。共に結合されると、図−2に示す20個のノー
ドはある場合には故障を許容でき、またここで述べる発
明を利用することにより解決される若干の問題を例示す
るメッシュとして役立つ。
の追加、および図−1に示すメッシュに予備ノードを結
合させるための連結リンク(点線で示すエッジ)を示し
ている。共に結合されると、図−2に示す20個のノー
ドはある場合には故障を許容でき、またここで述べる発
明を利用することにより解決される若干の問題を例示す
るメッシュとして役立つ。
【0051】例えば、ノード105(図−2の列2に示
す)が故障すると、故障許容を達成するための従来技術
の手法の一つは、図−2の列1,3,4,5が図1Aの
元の列1,2,3,4の代りをするように、図−2に示
す列を再命名することであった。
す)が故障すると、故障許容を達成するための従来技術
の手法の一つは、図−2の列1,3,4,5が図1Aの
元の列1,2,3,4の代りをするように、図−2に示
す列を再命名することであった。
【0052】この案が作動する前提は、図−2メッシュ
から除去される行を経由して、図−2の行1、行3間に
通信が持続されるということであり、故障ノード105
を通る通信を含んでいる。この前提は必ずしも正しくは
ないので、図−2メッシュは真の故障許容ではない場合
がある。更にこの簡単な例で故障ノードを含む列を交換
するコストが、単一故障の許容を要求するだけの適用に
おいて、4個の予備ノード(120〜123)を必要と
する。
から除去される行を経由して、図−2の行1、行3間に
通信が持続されるということであり、故障ノード105
を通る通信を含んでいる。この前提は必ずしも正しくは
ないので、図−2メッシュは真の故障許容ではない場合
がある。更にこの簡単な例で故障ノードを含む列を交換
するコストが、単一故障の許容を要求するだけの適用に
おいて、4個の予備ノード(120〜123)を必要と
する。
【0053】図示していないものは、スイッチ、追加エ
ッジ等の導入により更に複雑になったメッシュ・アーキ
テクチャの故障許容を達成するための他の従来技術の計
画であって、これらの導入は単純なメッシュでさえも動
作するのにコストを増大させまた性能を劣化することが
ある。
ッジ等の導入により更に複雑になったメッシュ・アーキ
テクチャの故障許容を達成するための他の従来技術の計
画であって、これらの導入は単純なメッシュでさえも動
作するのにコストを増大させまた性能を劣化することが
ある。
【0054】対照的に、本発明に従い、与えられたメッ
シュ・アーキテクチャが、グラフ中のノードはプロセッ
サ/構成部品に対応し、エッジはプロセッサ/構成部品
間のリンクであるグラフとして表わされるならば、故障
ノードは予備ノードの追加により扱うことが出来、最小
個数の予備ノードのみを追加すればよい。従って、k個
のノード故障を許容するならば、故障許容メッシュを得
るために目標メッシュにはk個のみ(かつ正確に)の予
備品を追加することが必要になる。本発明を実施する
際、後で具体的に説明するが、k個のノード故障の組が
与えられると、健全ノードはすべて健全メッシュとして
構成することが出来る。
シュ・アーキテクチャが、グラフ中のノードはプロセッ
サ/構成部品に対応し、エッジはプロセッサ/構成部品
間のリンクであるグラフとして表わされるならば、故障
ノードは予備ノードの追加により扱うことが出来、最小
個数の予備ノードのみを追加すればよい。従って、k個
のノード故障を許容するならば、故障許容メッシュを得
るために目標メッシュにはk個のみ(かつ正確に)の予
備品を追加することが必要になる。本発明を実施する
際、後で具体的に説明するが、k個のノード故障の組が
与えられると、健全ノードはすべて健全メッシュとして
構成することが出来る。
【0055】より形式的に言えば、d次元メッシュMは
N=n1 ×n2 ×…×nd 個のノードを有するグラフと
見做すことができる。ここで各niは第i次元の長さを
規定する。各ノードは形式(X1 ,X2 ,…,Xd )の
特有ベクトルでラベル付けされる。ここで1≦i≦dの
すべてのiに対し、0≦Xi≦Niである。各ノード
(X1 ,X2 ,…,Xd )は形式(X1 …Xi-1 ,X
i±1 ,Xi+1 …Xd )の高さ2d個のノードに連結さ
れる。
N=n1 ×n2 ×…×nd 個のノードを有するグラフと
見做すことができる。ここで各niは第i次元の長さを
規定する。各ノードは形式(X1 ,X2 ,…,Xd )の
特有ベクトルでラベル付けされる。ここで1≦i≦dの
すべてのiに対し、0≦Xi≦Niである。各ノード
(X1 ,X2 ,…,Xd )は形式(X1 …Xi-1 ,X
i±1 ,Xi+1 …Xd )の高さ2d個のノードに連結さ
れる。
【0056】N個のノードを有するd次元メッシュMが
与えられると、N+k個のノードを有するメッシュMk
は、もしN個のノードを有するNkのグラフ表示の各サ
ブグラフがサブグラフとしてMを含むならば、K−FT
d次元メッシュと称する。すなわち、グラフMkはk
個の故障を許容でき、メッシュMの健全なコピーを含む
ことがなお保証されている。
与えられると、N+k個のノードを有するメッシュMk
は、もしN個のノードを有するNkのグラフ表示の各サ
ブグラフがサブグラフとしてMを含むならば、K−FT
d次元メッシュと称する。すなわち、グラフMkはk
個の故障を許容でき、メッシュMの健全なコピーを含む
ことがなお保証されている。
【0057】本発明は2つの分離した部分を有する。第
1部はd≧2,nd≧3のd次元メッシュMに対するk
−FT d次元メッシュMkの構築のための処理であ
る。第2部はk個のノード故障を受けた後に、Mk中に
存在する良性メッシュの発見のための有効な処理であ
る。この処理は今後は、「再命名」処理として参照する
ことにする。
1部はd≧2,nd≧3のd次元メッシュMに対するk
−FT d次元メッシュMkの構築のための処理であ
る。第2部はk個のノード故障を受けた後に、Mk中に
存在する良性メッシュの発見のための有効な処理であ
る。この処理は今後は、「再命名」処理として参照する
ことにする。
【0058】上記の本発明の分離された「部分」は、一
緒に(順番に)あるいは別々に実行できることは、当業
者により、理解されるであろう。例えば、ここでの教示
に従って構築された故障許容メッシュを与えられ、再命
名処理のみを実行することが可能である。実際にノード
故障を関ししたり、健全メッシュを探し出すためにここ
でのべた新規な方法を実行したり当をせずに、ここで説
明する教示を利用する故障許容メッシュを簡単に構築す
ることも可能である。いずれにしても、以後説明される
故障許容メッシュ構築方法と健全メッシュ探査手法のい
ずれか又は両方の実施を容易化する方法および装置を、
本発明は包含することを意図している。
緒に(順番に)あるいは別々に実行できることは、当業
者により、理解されるであろう。例えば、ここでの教示
に従って構築された故障許容メッシュを与えられ、再命
名処理のみを実行することが可能である。実際にノード
故障を関ししたり、健全メッシュを探し出すためにここ
でのべた新規な方法を実行したり当をせずに、ここで説
明する教示を利用する故障許容メッシュを簡単に構築す
ることも可能である。いずれにしても、以後説明される
故障許容メッシュ構築方法と健全メッシュ探査手法のい
ずれか又は両方の実施を容易化する方法および装置を、
本発明は包含することを意図している。
【0059】概観するに、本発明の構築部分は目標メッ
シュMをグラフと見做し、故障許容グラフを構築(定
義)し、そこから故障許容メッシュMkを表わすことを
考えている。再命名処理は故障の存在下で故障許容メッ
シュの健全ノードに新しい論理ラベルを割り当てること
を考えている。
シュMをグラフと見做し、故障許容グラフを構築(定
義)し、そこから故障許容メッシュMkを表わすことを
考えている。再命名処理は故障の存在下で故障許容メッ
シュの健全ノードに新しい論理ラベルを割り当てること
を考えている。
【0060】本発明の詳述記述を始める前に、いくつか
の概念を定義しておく要がある。第1に、d次元メッシ
ュは、もし(次元である順序を仮定すると)ノードがメ
ッシュ中のその位置に従って、辞典編集的順序でラベル
付けされるならば、行優先順でラベル付けされると言え
る。例えば、2次元メッシュでは、ノードの位置はその
行と列番号で与えられる。すなわち、ノード(i1 j)
は行i1 列jにある。行優先ラベル付けはノード(0,
0)(ここでは「ノード0」として参照する)に始ま
り、辞典編集的に(0,1),(0,2),(0,3,
…,(1,0),(1,1)等と進む。図1Aに示すよ
うなメッシュが与えられると、行優先順はノード100
を0とラベル付けし、ノード101を1とラベル付けす
る等と進行する。
の概念を定義しておく要がある。第1に、d次元メッシ
ュは、もし(次元である順序を仮定すると)ノードがメ
ッシュ中のその位置に従って、辞典編集的順序でラベル
付けされるならば、行優先順でラベル付けされると言え
る。例えば、2次元メッシュでは、ノードの位置はその
行と列番号で与えられる。すなわち、ノード(i1 j)
は行i1 列jにある。行優先ラベル付けはノード(0,
0)(ここでは「ノード0」として参照する)に始ま
り、辞典編集的に(0,1),(0,2),(0,3,
…,(1,0),(1,1)等と進む。図1Aに示すよ
うなメッシュが与えられると、行優先順はノード100
を0とラベル付けし、ノード101を1とラベル付けす
る等と進行する。
【0061】本発明の理解にとって本質的なことは、サ
ーキュラントグラフとして知られるグラフ分類に精通す
ることである。かかるグラフは1組のジャンプあるいは
オフセットを用いてエッジが定義されるN個のノードを
有する。定義により、もしm個のオフセットの組が{S
j,但し1≦j≦m}ならば、その時は各ノード(例え
ばノードi)は、ノードi+Si ,i−Si ,i+
S2 ,i−S2 ,…,i+Sm ,i−Sm (modN)
に連結される。
ーキュラントグラフとして知られるグラフ分類に精通す
ることである。かかるグラフは1組のジャンプあるいは
オフセットを用いてエッジが定義されるN個のノードを
有する。定義により、もしm個のオフセットの組が{S
j,但し1≦j≦m}ならば、その時は各ノード(例え
ばノードi)は、ノードi+Si ,i−Si ,i+
S2 ,i−S2 ,…,i+Sm ,i−Sm (modN)
に連結される。
【0062】故障許容グラフ(および対応する故障許容
メッシュ)を構築する際、1組のオフセットを決定する
方法は、kが奇数か偶数かによって決まる。このことは
後にさらに詳しく説明する。
メッシュ)を構築する際、1組のオフセットを決定する
方法は、kが奇数か偶数かによって決まる。このことは
後にさらに詳しく説明する。
【0063】サーキュラノト・グラフの一例を図−3に
示す。図示のサーキュラント・グラフは200〜215
のラベル付けした16個のノードを有している。これら
ノードは、例えば図−1に示すメッシュアーキテクチャ
のノードに対応する。当業者は、図−1に示すメッシュ
に比し、図−3に示すサーキュラント・グラフでは、少
数の追加エッジが示されていることを認識するであろ
う。例えば、ノード200(図−1のノード100に対
応)は、ノード100に対する2個のエッジに対し、4
個のエッジを有する。図−1に示されるメッシュは4×
4 2次元メッシュであるから、N=16であり、m個
のオフセットの組は、後で具体的に説明する様に、
{1,4}である。
示す。図示のサーキュラント・グラフは200〜215
のラベル付けした16個のノードを有している。これら
ノードは、例えば図−1に示すメッシュアーキテクチャ
のノードに対応する。当業者は、図−1に示すメッシュ
に比し、図−3に示すサーキュラント・グラフでは、少
数の追加エッジが示されていることを認識するであろ
う。例えば、ノード200(図−1のノード100に対
応)は、ノード100に対する2個のエッジに対し、4
個のエッジを有する。図−1に示されるメッシュは4×
4 2次元メッシュであるから、N=16であり、m個
のオフセットの組は、後で具体的に説明する様に、
{1,4}である。
【0064】図−3に示すように、図−1に図示したメ
ッシュに対応するサーキュラント・グラフは、(上に示
したように、グラフは少数の追加エッジを含んでいる
が)前記定義に従って、隣接ノードに連結されるノード
を有し(すなわち、通信リング/エッジは1のオフセッ
トを有する)、また各ノードは4のオフセットを有する
ノードにも連結されている。従って、例えば図−3のノ
ード200はエッジ250,251を経由して、それぞ
れ隣接ノード215,201に連結される。同様に、ノ
ード200はエッジ252,253を経由し、それぞれ
ノード212,204に連結される。ノード201はエ
ッジ251,254を経由し、それぞれ隣接ノード20
0,202に連結される。ノード201はエッジ25
5,256を経由し、それぞれノード213,205に
も連結される等が示されている。
ッシュに対応するサーキュラント・グラフは、(上に示
したように、グラフは少数の追加エッジを含んでいる
が)前記定義に従って、隣接ノードに連結されるノード
を有し(すなわち、通信リング/エッジは1のオフセッ
トを有する)、また各ノードは4のオフセットを有する
ノードにも連結されている。従って、例えば図−3のノ
ード200はエッジ250,251を経由して、それぞ
れ隣接ノード215,201に連結される。同様に、ノ
ード200はエッジ252,253を経由し、それぞれ
ノード212,204に連結される。ノード201はエ
ッジ251,254を経由し、それぞれ隣接ノード20
0,202に連結される。ノード201はエッジ25
5,256を経由し、それぞれノード213,205に
も連結される等が示されている。
【0065】モジュロNセンスでは(ここで説明してい
る例ではモジュロ16)、図−3の各ノードは両方向
(サーキュラント・グラフの周り)のノード±1および
±4に連結されている。
る例ではモジュロ16)、図−3の各ノードは両方向
(サーキュラント・グラフの周り)のノード±1および
±4に連結されている。
【0066】図−3に示すサーキュラント・グラフは説
明用のみに示したものである。実際には、前に示したよ
うに、図−1に示すメッシュの「境界」に現われるノー
ド(ノード100のような)は図−3に示すすべてのエ
ッジを必要としない。従って、再びノード100を例に
用いるなら、メッシュが適切に機能するためには、2個
の相互連結リンク(エッジ)のみが必要である。一方、
ノード105のような「内部」ノードは4個のリンク
(メッシュの最大次数)を必要とする。
明用のみに示したものである。実際には、前に示したよ
うに、図−1に示すメッシュの「境界」に現われるノー
ド(ノード100のような)は図−3に示すすべてのエ
ッジを必要としない。従って、再びノード100を例に
用いるなら、メッシュが適切に機能するためには、2個
の相互連結リンク(エッジ)のみが必要である。一方、
ノード105のような「内部」ノードは4個のリンク
(メッシュの最大次数)を必要とする。
【0067】本発明を理解する上で注目すべく重要なこ
とは、図−3に図示した様式のサーキュラント・グラフ
が、与えられたメッシュおよび支援さるべき故障の最大
個数(k)に、数で対応する追加予備ノードの組から構
築され、k個の故障許容である等価メッシュを組み立て
るモデルとして役立つことがある点である。
とは、図−3に図示した様式のサーキュラント・グラフ
が、与えられたメッシュおよび支援さるべき故障の最大
個数(k)に、数で対応する追加予備ノードの組から構
築され、k個の故障許容である等価メッシュを組み立て
るモデルとして役立つことがある点である。
【0068】サーキュラント・グラフは当業者にはよく
知られており、Elspas等による論文、「サーキュ
ラント近接マトリックス」(組み合わせ理論学会誌、第
9号、pp.297〜307,1970年)で詳細に記
述されている。Elspas等の論文は、ここで参考文
献に含める。
知られており、Elspas等による論文、「サーキュ
ラント近接マトリックス」(組み合わせ理論学会誌、第
9号、pp.297〜307,1970年)で詳細に記
述されている。Elspas等の論文は、ここで参考文
献に含める。
【0069】以下の事項の基礎を築いた上で、故障許容
グラフ、従ってそれに対応する故障許容メッシュを構築
する方法の詳細を最初に一般的応用感覚で述べ、続いて
単一故障を支援するのに望ましいn×n2次元メッシュ
の特別事例の具体的実例を述べる。
グラフ、従ってそれに対応する故障許容メッシュを構築
する方法の詳細を最初に一般的応用感覚で述べ、続いて
単一故障を支援するのに望ましいn×n2次元メッシュ
の特別事例の具体的実例を述べる。
【0070】本発明によれば、もしMがN=n1 ×n2
×…×nd 個(d≧2,nd≧3)のノードを有するd
−次元メッシュであり、Mkが対応するk−FTメッシ
ュであると定義される時は、Mkは0からN+k−1ま
での番号を付したN+k個のノードからなる。ここでM
kはkが奇数か偶数かのいずれであるかの関数としてエ
ッジが定義されているサーキュラント・グラフで表わす
ことが出来る(すなわち、エッジの定義には2つの場合
がある)。
×…×nd 個(d≧2,nd≧3)のノードを有するd
−次元メッシュであり、Mkが対応するk−FTメッシ
ュであると定義される時は、Mkは0からN+k−1ま
での番号を付したN+k個のノードからなる。ここでM
kはkが奇数か偶数かのいずれであるかの関数としてエ
ッジが定義されているサーキュラント・グラフで表わす
ことが出来る(すなわち、エッジの定義には2つの場合
がある)。
【0071】事例1ではkは奇数である。この場合では
各ノードは高々d(k+1)次数を有する。エッジは次
のオフセットの組の組み合わせで定義される。
各ノードは高々d(k+1)次数を有する。エッジは次
のオフセットの組の組み合わせで定義される。
【0072】 {1+j 但し 0≦j≦(k−1)/2}; {n1 +j 但し 0≦j≦(k−1)/2}; {(n1 ×n2 )+j 但し 0≦j≦(k−1)/
2};から {(n1 ×n2 ×…×nd-1 )+j 但し 0≦j≦
(k−1)/2};まで 事例2ではkは奇数である。この場合には各ノードはd
(k+2)次数を有す。エッジは次のオフセットの組の
組み合わせで定義される。
2};から {(n1 ×n2 ×…×nd-1 )+j 但し 0≦j≦
(k−1)/2};まで 事例2ではkは奇数である。この場合には各ノードはd
(k+2)次数を有す。エッジは次のオフセットの組の
組み合わせで定義される。
【0073】 {1+j 但し 0≦j≦k/2}; {n1 +j 但し 0≦j≦k/2}; {(n1 ×n2 )+j 但し 0≦j≦k/2};から {(n1 ×n2 ×…×nd-1 )+j 但し 0≦j≦k
/2};まで 上記のサーキュラント・グラフに沿って作られたメッシ
ュ・アーキテクチャMkは、k個の故障許容であり、従
ってk個までの故障の存在下で、その分布に関係なくメ
ッシュMを含むことが保証される。
/2};まで 上記のサーキュラント・グラフに沿って作られたメッシ
ュ・アーキテクチャMkは、k個の故障許容であり、従
ってk個までの故障の存在下で、その分布に関係なくメ
ッシュMを含むことが保証される。
【0074】実用上の意義のある故障許容メッシュの例
は、n×n 2次元メッシュの非常に通常の場合であ
る。ここに述べた進め方を用い、kの奇数又は偶数に対
し、それぞれ2k+2又は2k+4次を有するk−FT
2次元メッシュを構築できる。特に興味がありまた有
用な事例は単一故障を支援するよう設計された故障許容
メッシュの場合である。1−FT 2次元メッシュはな
お最大4次を有する。すなわち、単一予備ノードを追加
し、次数を多くとも(原メッシュと同じ)4に保持する
ことにより、いかなる単一故障も許容できるアーキテク
チャが得られる。
は、n×n 2次元メッシュの非常に通常の場合であ
る。ここに述べた進め方を用い、kの奇数又は偶数に対
し、それぞれ2k+2又は2k+4次を有するk−FT
2次元メッシュを構築できる。特に興味がありまた有
用な事例は単一故障を支援するよう設計された故障許容
メッシュの場合である。1−FT 2次元メッシュはな
お最大4次を有する。すなわち、単一予備ノードを追加
し、次数を多くとも(原メッシュと同じ)4に保持する
ことにより、いかなる単一故障も許容できるアーキテク
チャが得られる。
【0075】形式的には、典型的なn×n 2次元メッ
シュに対する故障許容グラフでは、N=n2 +1個のノ
ードがある。エッジはオフセット{1,n}に従って定
義される。当業者は、これは行優先ラベル付けの拡張で
あると評価するであろう。
シュに対する故障許容グラフでは、N=n2 +1個のノ
ードがある。エッジはオフセット{1,n}に従って定
義される。当業者は、これは行優先ラベル付けの拡張で
あると評価するであろう。
【0076】図−4は(1個までの故障の存在下で)図
−1に描かれたメッシュを含むと保証される4×4 1
−FT 2次元メッシュの例を描いたものである。図4
のメッシュの17個のノードは300〜316のラベル
付けされる。メッシュ中の行優先順序位置はノードを表
わす円内に示されている。すなわち、ノード0に始ま
り、位置は0〜16である。ノード300〜316はそ
れぞれ図−1のノード100〜115に対応し、ノード
316は故障許容メッシュにおける「予備」ノードであ
る(図1Aで画かれたメッシュにはない)。
−1に描かれたメッシュを含むと保証される4×4 1
−FT 2次元メッシュの例を描いたものである。図4
のメッシュの17個のノードは300〜316のラベル
付けされる。メッシュ中の行優先順序位置はノードを表
わす円内に示されている。すなわち、ノード0に始ま
り、位置は0〜16である。ノード300〜316はそ
れぞれ図−1のノード100〜115に対応し、ノード
316は故障許容メッシュにおける「予備」ノードであ
る(図1Aで画かれたメッシュにはない)。
【0077】実践を用いて図4に示されたエッジは図−
1に描かれたそれらのエッジに対応する。(図−4で)
点線で示すエッジは故障が支援され、以下に説明する再
命名処理に従ってメッシュを再構成(再ラベル付け)す
る時に用いることがある。
1に描かれたそれらのエッジに対応する。(図−4で)
点線で示すエッジは故障が支援され、以下に説明する再
命名処理に従ってメッシュを再構成(再ラベル付け)す
る時に用いることがある。
【0078】図−4に示した故障許容メッシュ(描かれ
たすべてのエッジを含む)は図−5に示すサーキュラン
ト・グラフに対応する。ここでサーキュラント・グラフ
を構築するのに用いたオフセットは1と4とであり、す
べての計算は17を法として行われる。(予備ノードを
含み17個のノードがある)。図−4に描かれたすべて
の参照番号、ノード、エッジは図−4に示すものに対応
する。
たすべてのエッジを含む)は図−5に示すサーキュラン
ト・グラフに対応する。ここでサーキュラント・グラフ
を構築するのに用いたオフセットは1と4とであり、す
べての計算は17を法として行われる。(予備ノードを
含み17個のノードがある)。図−4に描かれたすべて
の参照番号、ノード、エッジは図−4に示すものに対応
する。
【0079】構築処理(すなわち図3Aに示す故障許容
メッシュに対するモデルとして図−5に示すグラフの構
築)に対する入力は次のとおりである。 (1) 目標メッ
シュの次元d(図1Aのケースではd=2)、 (2) n
1 ,n2 ,…,nd (すなわち、目標メッシュ自体の構
造が入力である。例えば図1Aのケースではn1 =n2
=4)、 (3) 支援さるべき故障数k(図−5に示す故
障許容グラフの構築ではk=1とおいた)。
メッシュに対するモデルとして図−5に示すグラフの構
築)に対する入力は次のとおりである。 (1) 目標メッ
シュの次元d(図1Aのケースではd=2)、 (2) n
1 ,n2 ,…,nd (すなわち、目標メッシュ自体の構
造が入力である。例えば図1Aのケースではn1 =n2
=4)、 (3) 支援さるべき故障数k(図−5に示す故
障許容グラフの構築ではk=1とおいた)。
【0080】要するに、本発明の一側面によれば、N=
n1 ×n2 ×…×nd 個の同一ノード(d≧2,nd≧
3)を有するd次元メッシュMを含む故障許容メッシュ
Mkは、Mkがk個までの故障を支援できかつメッシュ
Mを形成するのにスイッチを使用せずに再構成できる時
は、次の項を含む、 (a) N+k個のノード、追加のk
個のノードはメッシュMの場合と同じタイプであり、サ
ーキュラントグラフとして配列されている、 (b) 上記
サーキュラント・グラフに対する複数のエッジ、ここ
で、kが奇数の時は、エッジは次のオフセットの組の組
み合わせで定義される。
n1 ×n2 ×…×nd 個の同一ノード(d≧2,nd≧
3)を有するd次元メッシュMを含む故障許容メッシュ
Mkは、Mkがk個までの故障を支援できかつメッシュ
Mを形成するのにスイッチを使用せずに再構成できる時
は、次の項を含む、 (a) N+k個のノード、追加のk
個のノードはメッシュMの場合と同じタイプであり、サ
ーキュラントグラフとして配列されている、 (b) 上記
サーキュラント・グラフに対する複数のエッジ、ここ
で、kが奇数の時は、エッジは次のオフセットの組の組
み合わせで定義される。
【0081】 {1+j 但し 0≦j≦(k−1)/2}; {n1 +j 但し 0≦j≦(k−1)/2}; {(n1 ×n2 )+j 但し 0≦j≦(k−1)/
2};から {(n1 ×n2 ×…×nd-1 )+j 但し 0≦j≦
(k−1)/2};まで またkが偶数の時は、エッジは次のオフセットの組の組
み合わせにより定義される。
2};から {(n1 ×n2 ×…×nd-1 )+j 但し 0≦j≦
(k−1)/2};まで またkが偶数の時は、エッジは次のオフセットの組の組
み合わせにより定義される。
【0082】 {1+j 但し 0≦j≦k/2}; {n1 +j 但し 0≦j≦k/2}; {(n1 ×n2 )+j 但し 0≦j≦k/2};から {(n1 ×n2 ×…×nd-1 )+j 但し 0≦j≦k
/2};まで 次に、故障の存在下で故障許容メッシュを再ラベル付け
する系統的方法を述べる。Mk(k−FTメッシュ)に
k個の故障を与えられて、この再ラベル付け(再命名)
処理の結果は健全な目標メッシュMの識別である。
/2};まで 次に、故障の存在下で故障許容メッシュを再ラベル付け
する系統的方法を述べる。Mk(k−FTメッシュ)に
k個の故障を与えられて、この再ラベル付け(再命名)
処理の結果は健全な目標メッシュMの識別である。
【0083】本処理はノードに新ラベルを割り当てるこ
とにより、健全メッシュを識別(定義)する。この新ラ
ベル付けは健全メッシュの行優先ラベル付けに対応す
る。当業者は、以後説明する本発明の教示に従って構築
される(あるいは提供される)故障許容メッシュを与え
られると、すべての必要なエッジが本処理を実行するの
に存在していることを容易に理解するであろう。
とにより、健全メッシュを識別(定義)する。この新ラ
ベル付けは健全メッシュの行優先ラベル付けに対応す
る。当業者は、以後説明する本発明の教示に従って構築
される(あるいは提供される)故障許容メッシュを与え
られると、すべての必要なエッジが本処理を実行するの
に存在していることを容易に理解するであろう。
【0084】更に、本質的に再命名処理に関し、故障し
ているMk中のk個のノードは識別され、処理への入力
として提供される。これらノードはMk中の故障してい
る物理的構成部品に対応する。当業者は、以下示される
手法がk個の故障が識別され実時間で再命名処理の入力
として示されるか、あるいはオフラインベースでなされ
るかのいずれかとは無関係に効力があることを認めるで
あろう。故障ノード発見の方法および装置は当業者には
充分知られており、本質的には本発明の一部を構成しな
い。
ているMk中のk個のノードは識別され、処理への入力
として提供される。これらノードはMk中の故障してい
る物理的構成部品に対応する。当業者は、以下示される
手法がk個の故障が識別され実時間で再命名処理の入力
として示されるか、あるいはオフラインベースでなされ
るかのいずれかとは無関係に効力があることを認めるで
あろう。故障ノード発見の方法および装置は当業者には
充分知られており、本質的には本発明の一部を構成しな
い。
【0085】x個の故障ノード(x<k)がある場合に
は、本発明によれば、いかなるk−x個の健全ノードは
任意に選ばれ、故障していると考えられる。(Mkに対
応する)サーキュラント・グラフにおけるノードは0か
らN+k−1までの番号付けをすることが出来る点を思
い出すべきである。これらのノードは周期的に順序づけ
られるから、ノードN+k−1と0とは隣接している。
従って、ノードを昇順vたどるとノード0はノードN+
k−1の次であり、降順にたどるとノードN+k−1は
ノード0の次である。
は、本発明によれば、いかなるk−x個の健全ノードは
任意に選ばれ、故障していると考えられる。(Mkに対
応する)サーキュラント・グラフにおけるノードは0か
らN+k−1までの番号付けをすることが出来る点を思
い出すべきである。これらのノードは周期的に順序づけ
られるから、ノードN+k−1と0とは隣接している。
従って、ノードを昇順vたどるとノード0はノードN+
k−1の次であり、降順にたどるとノードN+k−1は
ノード0の次である。
【0086】以下の説明では、j=n1 ×n2 ×…×n
d-1 が最大オフセットの値であるとする。本発明で考え
られている再命名処理は以降説明するように3ステップ
(あるいはその等価変形)を含まなければならない。
「等価変形」によって本発明の図解による実施例が、例
えば「カウンタ」と参照する時、その値のトラックをカ
ウントし続ける手段はすべて本質的に物理的カウンタの
代りになり得るということ、すべての「カウンタ」が
「増分式」の時、その代りにすべてのカウンタが減分式
であっても等価の結果が得られうるということ、等を意
味する。再命名処理の以下の説明で使用する特別な術語
は説明の目的のみに示され、請求項で以後定義される本
発明の目的を制限することを意図するものではない。
d-1 が最大オフセットの値であるとする。本発明で考え
られている再命名処理は以降説明するように3ステップ
(あるいはその等価変形)を含まなければならない。
「等価変形」によって本発明の図解による実施例が、例
えば「カウンタ」と参照する時、その値のトラックをカ
ウントし続ける手段はすべて本質的に物理的カウンタの
代りになり得るということ、すべての「カウンタ」が
「増分式」の時、その代りにすべてのカウンタが減分式
であっても等価の結果が得られうるということ、等を意
味する。再命名処理の以下の説明で使用する特別な術語
は説明の目的のみに示され、請求項で以後定義される本
発明の目的を制限することを意図するものではない。
【0087】上記3ステップ処理の第1ステップは次の
2カウンタを利用する。故障ノードをカウントするステ
ップと、非故障ノードをカウントするステップである。
第1処理ステップによると、以下説明する手順は0≧i
≧Nk−1のすべてのi値に対し実施される。
2カウンタを利用する。故障ノードをカウントするステ
ップと、非故障ノードをカウントするステップである。
第1処理ステップによると、以下説明する手順は0≧i
≧Nk−1のすべてのi値に対し実施される。
【0088】始めは両カウンタはクリアされている(例
えば、0にセットされる)。次に、本発明の一つの実施
例に従うと、ノードはノードiで始まり降順で巡回され
る。各ノードが巡回されると適当なカウンタは増分され
る。すなわち、もし巡回されたノードが故障なら、故障
ノードに対するカウンタは増分され、また巡回されたノ
ードが非故障なら、非故障ノードに対するカウンタが増
分される。
えば、0にセットされる)。次に、本発明の一つの実施
例に従うと、ノードはノードiで始まり降順で巡回され
る。各ノードが巡回されると適当なカウンタは増分され
る。すなわち、もし巡回されたノードが故障なら、故障
ノードに対するカウンタは増分され、また巡回されたノ
ードが非故障なら、非故障ノードに対するカウンタが増
分される。
【0089】増分された後、非故障ノードに対するカウ
ンタはチェックされる。このカウンタがj(j=n1 ×
n2 ×…×nd-1 ということを思い出すこと)より大な
らば、降順でノードを巡回する処理は終り、故障ノード
に対するカウンタがチェックされる。故障ノードに対す
るカウンタがk/2より大であれば、ノードiは「マー
クあり」と呼ばれ、一方k/2より小又は等しければ、
ノードiは「マーク成し」と呼ばれる。各非故障「マー
クあり」ノードは目標メッシュのノード0に対する候補
である。
ンタはチェックされる。このカウンタがj(j=n1 ×
n2 ×…×nd-1 ということを思い出すこと)より大な
らば、降順でノードを巡回する処理は終り、故障ノード
に対するカウンタがチェックされる。故障ノードに対す
るカウンタがk/2より大であれば、ノードiは「マー
クあり」と呼ばれ、一方k/2より小又は等しければ、
ノードiは「マーク成し」と呼ばれる。各非故障「マー
クあり」ノードは目標メッシュのノード0に対する候補
である。
【0090】処理の第2ステップは候補非故障ノードの
いずれが非故障メッシュにおけるノード0の役割を果た
すべきかを決める。第2ステップは単一カウンタを使用
し、2段階よりなる。
いずれが非故障メッシュにおけるノード0の役割を果た
すべきかを決める。第2ステップは単一カウンタを使用
し、2段階よりなる。
【0091】段階1は、本発明の好ましい実施例によれ
ば、カウンタを0にセットすることにより開始される。
次いで、任意に選ばれたノードを出発点として、ノード
は降順で巡回される。
ば、カウンタを0にセットすることにより開始される。
次いで、任意に選ばれたノードを出発点として、ノード
は降順で巡回される。
【0092】各ノードが巡回されると、ノードはそれが
故障かどうかあるいはマークがあるか否かを調べるため
にチェックされる。もしノードが非故障でマークなしで
あれば、そのカウンタは増分する。ノードが非故障でマ
ークあれば、そのカウンタは0にリセットされる。ノー
ドが故障ならば、そのカウンタはそのままである。
故障かどうかあるいはマークがあるか否かを調べるため
にチェックされる。もしノードが非故障でマークなしで
あれば、そのカウンタは増分する。ノードが非故障でマ
ークあれば、そのカウンタは0にリセットされる。ノー
ドが故障ならば、そのカウンタはそのままである。
【0093】次にカウンタがチェックされ、もしカウン
タがN/2より大又は等しければ段階1は終了する。カ
ウンタがN/2に達した時に巡回されつつあったノード
は、本発明の好ましい実施例ではノードaと称せられ
る。
タがN/2より大又は等しければ段階1は終了する。カ
ウンタがN/2に達した時に巡回されつつあったノード
は、本発明の好ましい実施例ではノードaと称せられ
る。
【0094】段階2では、ノードはノードaで始まる昇
順で巡回される。マークありの非故障ノードに遭遇する
と段階2は終了する。本発明によれば、この非故障マー
クありノードはノードbと称される。
順で巡回される。マークありの非故障ノードに遭遇する
と段階2は終了する。本発明によれば、この非故障マー
クありノードはノードbと称される。
【0095】再命名処理の第3ステップは非故障ノード
に番号(識別子)を割り当てる。ノードbで始まる昇順
でノードが巡回され、非故障ノードは順に値0,1,
…,N−1を割り当てられる。従って、ノードbは0を
割り当てられ、巡回される次ぎの非故障ノードは1を割
り当てられ、巡回された最後の非故障ノードはN−1を
割り当てられる。これらの番号は非故障メッシュの行優
先ラベルに対応する。
に番号(識別子)を割り当てる。ノードbで始まる昇順
でノードが巡回され、非故障ノードは順に値0,1,
…,N−1を割り当てられる。従って、ノードbは0を
割り当てられ、巡回される次ぎの非故障ノードは1を割
り当てられ、巡回された最後の非故障ノードはN−1を
割り当てられる。これらの番号は非故障メッシュの行優
先ラベルに対応する。
【0096】再び、単一故障の場合には、上記処理は故
障直後に始まる新ラベル付けに帰着することに注目すべ
きである。例えば、図−6を参照し、図−4の4×4
1−FTメッシュを考え、ノード305が故障している
と仮定してみること。
障直後に始まる新ラベル付けに帰着することに注目すべ
きである。例えば、図−6を参照し、図−4の4×4
1−FTメッシュを考え、ノード305が故障している
と仮定してみること。
【0097】図−6は上に述べた再命名処理の実施後の
メッシュの新ラベル付けを表わす。新メッシュの効力の
あるエッジは実線で示してある。故障ノードを「削除」
(図−6では黒く塗りつぶした円で表す)した後、もう
使用しないエッジは点線で示される。
メッシュの新ラベル付けを表わす。新メッシュの効力の
あるエッジは実線で示してある。故障ノードを「削除」
(図−6では黒く塗りつぶした円で表す)した後、もう
使用しないエッジは点線で示される。
【0098】図−6ではkが1に等しい時、図3Aのノ
ード305の一に対応する)ノード405がスイッチあ
るいは(本発明の教示に従って要求される1個の予備ノ
ード以外の)余分のノードを使用せずに削除されること
が分かる。また、再ラベル付け処理の結果として、ノー
ド406は今度は図−4に示すメッシュのノード300
の行優先順の位置を占める(すなわちノード0として)
ことに注目すべきである。再構成されたメッシュでのノ
ード406は、原メッシュのノード310と同様、2個
のエッジのみを有することにも注目すべきである。
ード305の一に対応する)ノード405がスイッチあ
るいは(本発明の教示に従って要求される1個の予備ノ
ード以外の)余分のノードを使用せずに削除されること
が分かる。また、再ラベル付け処理の結果として、ノー
ド406は今度は図−4に示すメッシュのノード300
の行優先順の位置を占める(すなわちノード0として)
ことに注目すべきである。再構成されたメッシュでのノ
ード406は、原メッシュのノード310と同様、2個
のエッジのみを有することにも注目すべきである。
【0099】メッシュ内の故障許容を達成する上記手法
は、特にkの値が小さい時、完全に直接的方法で実行で
きる。例えば、単一故障(k=1)の場合には、1−F
Tメッシュの最大次数は2dであり、これは原メッシュ
と同一である。従って、故障許容メッシュはノードの仕
様変更なしに実行できる(与えられたノードからのある
いはノードへの追加の結合は必要でない)。kの値が更
に大きい時は、次数の増加を処理するためにスイッチ機
構を使用することが可能である。再び、kの値が小さい
時、これは非常に実用的かつ有効な進め方である。
は、特にkの値が小さい時、完全に直接的方法で実行で
きる。例えば、単一故障(k=1)の場合には、1−F
Tメッシュの最大次数は2dであり、これは原メッシュ
と同一である。従って、故障許容メッシュはノードの仕
様変更なしに実行できる(与えられたノードからのある
いはノードへの追加の結合は必要でない)。kの値が更
に大きい時は、次数の増加を処理するためにスイッチ機
構を使用することが可能である。再び、kの値が小さい
時、これは非常に実用的かつ有効な進め方である。
【0100】N個(ここで N=n1 ×n2 ×…nd、
また n≧2,nd ≧3)のノードを有するd次元目標
メッシュMを与えられた時、k個の故障許容メッシュM
kを構築する処理の流れ図表示である図5を、ここで参
照しなければならない。
また n≧2,nd ≧3)のノードを有するd次元目標
メッシュMを与えられた時、k個の故障許容メッシュM
kを構築する処理の流れ図表示である図5を、ここで参
照しなければならない。
【0101】図7のブロック501は本発明で想定して
いる構築処理に必要な入力を示している。示されている
個々の値については上記で既に詳細に説明した。
いる構築処理に必要な入力を示している。示されている
個々の値については上記で既に詳細に説明した。
【0102】ブロック502〜504は、今まで説明し
たサーキュラントグラフ作成のステップを表わしてお
り、グラフは(n1 ×n2 ×…nd )+k個のノードを
有し、またグラフのオフセットはkの値(奇数か偶数
か)に依存する。
たサーキュラントグラフ作成のステップを表わしてお
り、グラフは(n1 ×n2 ×…nd )+k個のノードを
有し、またグラフのオフセットはkの値(奇数か偶数
か)に依存する。
【0103】ブロック505は出力の故障許容メッシュ
を表わす。すなわち503か504の適当な方で構築さ
れたグラフモデルに従い組み立てることが出来るk個の
故障許容メッシュMを表わす。
を表わす。すなわち503か504の適当な方で構築さ
れたグラフモデルに従い組み立てることが出来るk個の
故障許容メッシュMを表わす。
【0104】目標メッシュMを探し出すのにk個までの
故障の存在下でK故障許容メッシュMkの再ラベル付け
に関するプロセスの流れ図表示である図8を参照しなけ
ればならない。
故障の存在下でK故障許容メッシュMkの再ラベル付け
に関するプロセスの流れ図表示である図8を参照しなけ
ればならない。
【0105】ブロック601は予め決められた順にサー
キュラントグラフのノードが巡回された場合、各非故障
ノードがマークありか、マークなしかを定めるステップ
を表わす。
キュラントグラフのノードが巡回された場合、各非故障
ノードがマークありか、マークなしかを定めるステップ
を表わす。
【0106】ブロック602はどの非故障マークありの
ノードが目標メッシュでノード0の役割を果たすべきか
を定めるステップを表わす。
ノードが目標メッシュでノード0の役割を果たすべきか
を定めるステップを表わす。
【0107】ブロック603は新規の残処理中の最終ス
テップを表わす、すなわちノード0から始まる各非故障
ノードに識別子を割り当てるステップであり、ここで識
別子の組は再構築されたメッシュの行優先順序づけを表
わす。
テップを表わす、すなわちノード0から始まる各非故障
ノードに識別子を割り当てるステップであり、ここで識
別子の組は再構築されたメッシュの行優先順序づけを表
わす。
【0108】これまで述べたことは、前に説明したすべ
ての目的に合致するメッシュ・アーキテクチャにおける
故障を許容するための方法と装置である。当業者は、前
記の記述が図解と説明のみの目的で示されたことを認め
るであろう。包括的であること、あるいは開示された厳
密な形に本発明を制限することを意図するものでなく、
また明かに多くの変更態様および変形が上記教示に徴し
て、可能である。
ての目的に合致するメッシュ・アーキテクチャにおける
故障を許容するための方法と装置である。当業者は、前
記の記述が図解と説明のみの目的で示されたことを認め
るであろう。包括的であること、あるいは開示された厳
密な形に本発明を制限することを意図するものでなく、
また明かに多くの変更態様および変形が上記教示に徴し
て、可能である。
【図1】4行4列(16ノード)を有する従来技術の2
次元メッシユの実施例を示す図。
次元メッシユの実施例を示す図。
【図2】図1に示したメッシュを、予備構成部品(4個
の余分な同一ノード)の追加により、ある場合には回収
メッシュが故障許容であるように回収するための従来技
術の手法を示す図。
の余分な同一ノード)の追加により、ある場合には回収
メッシュが故障許容であるように回収するための従来技
術の手法を示す図。
【図3】図1に示すメッシュと同様、4×4 2次元メ
ッシュに対応するサーキュラントグラフの実施例を示す
図。
ッシュに対応するサーキュラントグラフの実施例を示す
図。
【図4】K=1の場合に本発明の教示に従って伝えられ
るk個の故障許容4×4メッシュを示す図。
るk個の故障許容4×4メッシュを示す図。
【図5】図4に示す故障許容メッシュを構築できるサー
キュラント・グラフ・モデルであって、本発明の教示に
従って、図示サーキュラント・グラフを構築するのに用
いた与えられた目標メッシュが図1に示すメッシュであ
る場合のサーキュラント・グラフ・モデル。
キュラント・グラフ・モデルであって、本発明の教示に
従って、図示サーキュラント・グラフを構築するのに用
いた与えられた目標メッシュが図1に示すメッシュであ
る場合のサーキュラント・グラフ・モデル。
【図6】図4に示す(単一故障発生後の)故障許容メッ
シュの再構成版であって、スイッチを使用せず、本発明
の再命名処理部分に従って再構成が実施されている場合
の再構成版。
シュの再構成版であって、スイッチを使用せず、本発明
の再命名処理部分に従って再構成が実施されている場合
の再構成版。
【図7】N個の(N=n1 ×n2 ×…nd 、n≧2,n
d ≧3)のノードを有するα次元目標メッシュMが与え
られた時に、k個の故障許容メッシュMkを構築する処
理の流れ図。
d ≧3)のノードを有するα次元目標メッシュMが与え
られた時に、k個の故障許容メッシュMkを構築する処
理の流れ図。
【図8】目標メッシュMを探し出すため、k個までの故
障の存在下で、k個の故障許容メッシュの再ラベル付け
に対する処理の流れ図。
障の存在下で、k個の故障許容メッシュの再ラベル付け
に対する処理の流れ図。
100〜115 ノード 120〜123 予備ノード 200〜215 ノード 250〜256 エッジ 300〜315 ノード 316 予備ノード 400〜416 ノード 501〜505 ブロック 601〜603 ブロック
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ロバート、イー、サイフアー アメリカ合衆国カリフオルニア州、ロスガ トス、ベラ、ビスタ、アベニユ、344 (72)発明者 チン‐テイエン、ホ アメリカ合衆国カリフオルニア州、サンノ ゼ、アンジヨー、クリーク、サークル、 7055
Claims (10)
- 【請求項1】k個までの故障を支援可能であり、かつメ
ッシュMを形成するのにスイッチなしで再構成可能なよ
うに、N=n1 ×n2 ×…×n個(但しd≧2、nd≧
3)の同一ノードを有するd次元メッシュMを含む故障
許容メッシュMkであって、 (a) サーキュラント・グラフ形式で配置され、追加k
個のノードがメッシュMにおけるのと同一タイプである
ようなN+k個のノードと、 ならびに (b) kが奇数の時は、エッジが次のオフセットの組の
組み合せ {1+j但し0≦j≦(k−1)/2}; {n1 +j但し0≦j≦(k−1)/2}; {(n1 ×n2 )+j但し0≦j≦(k−1)/2};
から {(n1 ×n2 ×…×nd−1)+j但し0≦j≦(k
−1)/2};まで により定義され、またkが偶数の時は、エッジが次のオ
フセットの組の組み合わせ、 {1+j但し0≦j≦k/2}; {n1 +j但し0≦j≦k/2}; {(n1 ×n2 )+j但し0≦j≦k/2};から {(n1 ×n2 ×…×nd−1)+j但し0≦j≦k/
2};まで により定義される前記サーキュラントグラフに対する複
数のエッジとを有することを特徴とする故障許容メッシ
ュ。 - 【請求項2】k個の故障許容メッシュMkを構築するた
めの方法であって、 (a) N個(N=n1 ×n2 ×…×nd、但しd≧2、
nd≧3)のノードおよび前記サーキュラント・グラフ
に含まれるべきk個の追加ノード(但し、kはMk組み
立て用のモデルとしてMkに支援されるべき最大数の故
障に正確に等しい場合)を有するd次元メッシュMを与
えられた時にサーキュラント・グラフ表示を利用するス
テップと、 (b) 上記サーキュラント・グラフモデルに基づくk個
の故障許容メッシュMkを組み立てるステップ とを有することを特徴とする方法。 - 【請求項3】k個までの故障を支援可能であり、かつメ
ッシュMを形成するためにスイッチなしで再構成可能な
ように、N=n1 ×n2 ×…×nd個(但しd≧2、n
d≧3)の同一ノードを有するd次元メッシュMを含む
k個の故障許容メッシュMkを構築する方法であって、 (a) N個のノードならびに追加のk個のノードがサー
キュラント・グラフ形式で、メッシュMにおけるのと同
一タイプであるように、正確にk個の追加ノードを配置
するステップと、 (b) 前記サーキュラント・グラフのエッジを、kが奇
数の場合は次のオフセットの組の組み合わせ {1+j但し0≦j≦(k−1)/2}; {n1 +j但し0≦j≦(k−1)/2}; {(n1 ×n2 )+j但し0≦j≦(k−1)/2};
から {(n1 ×n2 ×…×nd−1)+j但し0≦j≦(k
−1)/2};まで により定義するステップと、 (a) 上記サーキュラント・グラフのエッジを、kが偶
数の場合は次のオフセットの組の組み合わせ {1+j但し0≦j≦k/2}; {n1 +j但し0≦j≦k/2}; {(n1 ×n2 )+j但し0≦j≦k/2};から {(n1 ×n2 ×…×nd−1)+j但し0≦j≦k/
2};まで により定義するステップと、 を有することを特徴とする方法。 - 【請求項4】N=n1 ×n2 ×…×nd個(但しd≧
2、nd≧3)のノードを有するいかなるd次元メッシ
ュでもよい目標メッシュMが与えられた時、d次元k故
障許容メッシュMkを組みたてる方法であって、 (a) 目標メッシュMの次元dを決定するステップと、 (b) n1 ,n2 …ndの値を入力することにより、目
標メッシュMの構造を識別するステップと、 (c) 構築されるべき故障許容メッシュMkにより支援
される故障数kを入力するステップと、 (d) 正確にN+K個のノードを有するサーキュラント
グラフを定義するステップと、 (e) kが奇数の時、次のオフセットの組の組み合わせ {1+j但し0≦j≦(k−1)/2}; {n1 +j但し0≦j≦(k−1)/2}; {(n1 ×n2 )+j但し0≦j≦(k−1)/2};
から {(n1 ×n2 ×…×nd−1)+j但し0≦j≦(k
−1)/2};まで により前記サーキュラント・グラフのエッジを定義する
ステップと、 (f) kが偶数の時は、次のオフセットの組の組み合わ
せ {1+j但し0≦j≦k/2}; {n1 +j但し0≦j≦k/2}; {(n1 ×n2 )+j但し0≦j≦k/2};から {(n1 ×n2 ×…×nd−1)+j但し0≦j≦k/
2};まで により前記サーキュラント・グラフのエッジを定義する
ステップと、 (d) d次元k故障許容メッシュMkを形成するため
に、上記サーキュラント・グラフに対応するメッシュを
構築するステップと、 を有することを特徴とする方法。 - 【請求項5】k個の故障の存在下で故障許容メッシュM
k中に健全な目標メッシュMを探し出し、および(1) M
の次元d、(2) kの値、(3) n1 、n2 …ndの値(こ
こで格ndはd次元メッシュの辺の長さでd≧2、nd
≧3)、(4) サーキュラント・グラフ・モデルに基づく
故障許容メッシュMkの構造、および(5) Mk中のk個
までの故障の位置、を与えられ、Mを得るためにMkの
再構成のための方法であって、 (a) Mkで支援される故障数がkより小さいかどうか
を決定するステップと、 (b) k−x個の非故障ノードを選定し、k個の故障ノ
ードの全体に対し、もしx<kならk−x個のノードを
故障と指示するステップと、 (c) Mkに残っている非故障ノードの中から目標メッ
シュM中のノード0を識別するステップと、 (d) ノード0で始まる行優先順序づけを用いて、健全
なメッシュMを得るためにMk中のノードを再ラベルづ
けするステップと、 を有することを特徴とする方法。 - 【請求項6】故障許容メッシュMkがN+k=(n1 ×
n2 ×…×nd)+k個(但しd≧2、nd≧3)のノ
ードを有し、健全メッシュMがN個のノードを有する場
合、k個までの故障の組を与えられて、故障許容メッシ
ュMk中に健全メッシュMを発見する方法であって、 (a) 故障許容メッシュMk中の非故障ノードがメッシ
ュMのノード0の候補と考えられるべきかどうかを決定
するステップと、 (b) いずれの候補非故障ノードが目標メッシュのノー
ド0であるべきかを決定するステップと、 (c) 識別子の組がメッシュMの行優先順序づけを表わ
すように、ノード0から始めて、各非故障ノードを有す
ることを特徴とする方法。 - 【請求項7】サーキュラント・グラフ・モデルで表わす
ことが可能であり、かつこのグラフ中の最大オフセット
がj=n1 ×n2 ×…×nd−1であるように、k個ま
での故障を支援していたk故障許容メッシュMk中に、
N個(但しN=n1 ×n2 ×…×nd、d≧2、nd≧
3)のノードを有するd次元目標メッシュMを探し出す
処理方法であって、 (a) Mk中の各故障および非故障ノードの識別ならび
にそのサーキュラント・グラフを入力するステップと、 (b) ノードiで始まり、サーキュラントグラフの周囲
を最初の事前選定方向に進めて各ノードを巡回すること
により、Mk中のすべてのノードi(但し0≦i≦N+
K−1)に対し、Mk中の故障ノードおよび非故障ノー
ドの数をカウントするステップと、 (c) 各非故障ノードの検出後に非故障ノードのカウン
トをチェックし、その非故障ノードのカウントがjより
大かどうかを決定するステップと、 (d) その非故障ノードの数がjより大であれば、上記
最初の事前選定方向でのノード巡回を終了するステップ
と、 (e) 前記終了のステップの後で、故障ノードの数がk
/2より大であるかどうかを決定し、もし大であればノ
ードiをマークありのノードと指定し、またもし大でな
ければノードiをマークなしと指定するステップと、 (f) メッシュMk中の各ノードi(但し0≦i≦N+
k−1)に対し、上述の処理を繰返すステップと、 を有することを特徴とする方法。 - 【請求項8】k個までの故障を支援可能で、かつメッシ
ュMを形成するのにスイッチを使用せずに再構成可能な
ように、N=n1 ×n2 ×…×nd個(但しd≧2、n
d≧3)の同一ノードを有するd次元メッシュMを含む
k故障許容メッシュMkの構築、およびk個までの故障
がMkにより支援される時に、Mk中にMを捜し出す方
法であって、 (a) メッシュMのN個のノードおよびサーキュラント
・グラフ形式で追加k個のノードがメッシュにおけるの
と同一タイプであるように、正確にk個の追加ノードを
配列するステップと、 (b) kが奇数の時に、次のオフセットの組の組み合わ
せ {1+j但し0≦j≦k/2}; {n1 +j但し0≦j≦k/2}; {(n1 ×n2 )+j但し0≦j≦k/2};から {(n1 ×n2 ×…×nd−1)+j但し0≦j≦k/
2};まで により前記サーキュラント・グラフのエッジを定義する
ステップと、 (c) kが偶数の時に、次のオフセットの組の組み合わ
せ {1+j但し0≦j≦k/2}; {n1 +j但し0≦j≦k/2}; {(n1 ×n2 )+j但し0≦j≦k/2};から {(n1 ×n2 ×…×nd−1)+j但し0≦j≦k/
2};まで により前記サーキュラント・グラフのエッジを定義する
ステップと、 (d) Mkがk個の故障を支援している時、Mk中のい
ずれの非故障ノードがノード0に対する候補と考えられ
るべきかを決定するステップと、 (e) 候補非故障ノードのいずれが目標メッシュM中の
ノード0であるべきかを決定するステップと、 (f) 識別子の組がメッシュMの業優先順序づけを表わ
すよう、ノード0で開始し、各非故障ノードに識別子を
割り当てるステップとを有することを特徴とする方法。 - 【請求項9】故障許容メッシュMkがN+k=(n1 ×
N2 ×…×nd)+k個(但しd≧2、nd≧3)のノ
ードを有し、また健全メッシュMがN個のノードを有す
る時に、k個までの故障の組を与えられ、故障許容メッ
シュMk中に健全メッシュMを識別するための装置であ
って、 (a) メッシュMk中のいずれの非故障ノードがメッシ
ュM中のノード0に対する候補と考えらべきかどうかを
識別する手段と、 (b) 決定のための方法が識別のための上記方法からの
入力に応答する時、候補非故障ノードのいずれが目標メ
ッシュ中のノード0であるべきかを決定する手段と、 (c) ノード0で始まり、識別子の組がメッシュMの業
優先順序づけを表わす時に、前記判別のための方法によ
って識別されるように、メッシュMk中の各非故障ノー
ドに識別子を割り当てるための再構成の手段と、 を有することを特徴とする装置。 - 【請求項10】請求項9記載の装置において、k個まで
の故障の存在下で、上記Mkがスイッチの使用なしに健
全目標メッシュM中に再構成することのできることを特
徴とする装置。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US07/723,287 US5280607A (en) | 1991-06-28 | 1991-06-28 | Method and apparatus for tolerating faults in mesh architectures |
| US723287 | 2003-11-26 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH05130101A true JPH05130101A (ja) | 1993-05-25 |
| JP2620457B2 JP2620457B2 (ja) | 1997-06-11 |
Family
ID=24905615
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4099996A Expired - Lifetime JP2620457B2 (ja) | 1991-06-28 | 1992-04-20 | メッシュアーキテクチャにおける故障許容のための方法と装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5280607A (ja) |
| JP (1) | JP2620457B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005539312A (ja) * | 2002-09-13 | 2005-12-22 | ドコモ コミュニケーションズ ラボラトリーズ ユー・エス・エー インコーポレーティッド | フォールトトレランススキームを動的に切換えるための方法 |
Families Citing this family (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1046994A3 (en) * | 1994-03-22 | 2000-12-06 | Hyperchip Inc. | Efficient direct cell replacement fault tolerant architecture supporting completely integrated systems with means for direct communication with system operator |
| US5590356A (en) * | 1994-08-23 | 1996-12-31 | Massachusetts Institute Of Technology | Mesh parallel computer architecture apparatus and associated methods |
| US5603044A (en) * | 1995-02-08 | 1997-02-11 | International Business Machines Corporation | Interconnection network for a multi-nodal data processing system which exhibits incremental scalability |
| US6467046B1 (en) * | 1996-05-06 | 2002-10-15 | Sun Microsystems, Inc. | System and method for automatically distributing copies of a replicated database in a computer system |
| US5859983A (en) * | 1996-07-01 | 1999-01-12 | Sun Microsystems, Inc | Non-hypercube interconnection subsystem having a subset of nodes interconnected using polygonal topology and other nodes connect to the nodes in the subset |
| KR980010717A (ko) * | 1996-07-24 | 1998-04-30 | 김광호 | 정전기에 의한 시스템 오동작 방지방법 |
| US5912893A (en) * | 1997-03-21 | 1999-06-15 | International Business Machines Corporation | Incidence graph based communications and operations method and apparatus for parallel processing architecture |
| US6108340A (en) * | 1997-03-21 | 2000-08-22 | International Business Machines Corporation | Incidence graph based communications and operations method and apparatus for parallel processing architecture |
| US5881304A (en) * | 1997-03-21 | 1999-03-09 | International Business Machines Corporation | Incidence graph based communications and operations method and apparatus for parallel processing architecture |
| US6456588B1 (en) * | 1997-04-21 | 2002-09-24 | At&T Corp. | Hypercube routing and restoration in telecommunications networks |
| US6055225A (en) * | 1997-06-02 | 2000-04-25 | Hewlett-Packard Company | Ring architecture for quad port bypass circuits |
| US6178522B1 (en) | 1998-06-02 | 2001-01-23 | Alliedsignal Inc. | Method and apparatus for managing redundant computer-based systems for fault tolerant computing |
| US9178784B2 (en) | 2004-04-15 | 2015-11-03 | Raytheon Company | System and method for cluster management based on HPC architecture |
| US20050235055A1 (en) * | 2004-04-15 | 2005-10-20 | Raytheon Company | Graphical user interface for managing HPC clusters |
| US7711977B2 (en) * | 2004-04-15 | 2010-05-04 | Raytheon Company | System and method for detecting and managing HPC node failure |
| US8336040B2 (en) | 2004-04-15 | 2012-12-18 | Raytheon Company | System and method for topology-aware job scheduling and backfilling in an HPC environment |
| US8190714B2 (en) * | 2004-04-15 | 2012-05-29 | Raytheon Company | System and method for computer cluster virtualization using dynamic boot images and virtual disk |
| US8335909B2 (en) * | 2004-04-15 | 2012-12-18 | Raytheon Company | Coupling processors to each other for high performance computing (HPC) |
| US7958208B2 (en) * | 2004-09-22 | 2011-06-07 | At&T Intellectual Property I, L.P. | System and method for designing a customized switched metro Ethernet data network |
| US7475274B2 (en) | 2004-11-17 | 2009-01-06 | Raytheon Company | Fault tolerance and recovery in a high-performance computing (HPC) system |
| US7433931B2 (en) * | 2004-11-17 | 2008-10-07 | Raytheon Company | Scheduling in a high-performance computing (HPC) system |
| US8244882B2 (en) * | 2004-11-17 | 2012-08-14 | Raytheon Company | On-demand instantiation in a high-performance computing (HPC) system |
| TW200712898A (en) * | 2005-09-30 | 2007-04-01 | Tyan Computer Corp | Multi-processor module |
| US7958341B1 (en) | 2008-07-07 | 2011-06-07 | Ovics | Processing stream instruction in IC of mesh connected matrix of processors containing pipeline coupled switch transferring messages over consecutive cycles from one link to another link or memory |
| US8145880B1 (en) * | 2008-07-07 | 2012-03-27 | Ovics | Matrix processor data switch routing systems and methods |
| US8327114B1 (en) | 2008-07-07 | 2012-12-04 | Ovics | Matrix processor proxy systems and methods |
| US8131975B1 (en) * | 2008-07-07 | 2012-03-06 | Ovics | Matrix processor initialization systems and methods |
| TWI410087B (zh) | 2010-12-20 | 2013-09-21 | Ind Tech Res Inst | 多核心晶片網路 |
| JP2014215914A (ja) * | 2013-04-26 | 2014-11-17 | 株式会社東芝 | 端末装置、情報処理方法及び情報処理プログラム |
| CN107018080B (zh) * | 2017-03-22 | 2020-04-07 | 上海海事大学 | 一种考虑节点能量的延迟容忍网络拓扑路由方法 |
| CN117785567B (zh) * | 2024-02-28 | 2024-05-28 | 上海特高信息技术有限公司 | 一种基于连接方向的可重构容错策略及重构控制器 |
| US12493503B2 (en) * | 2024-04-17 | 2025-12-09 | Dell Products L.P. | Hypercube topology for byzantine fault tolerant solutions to reduce network communication overhead of PBFT-based protocols |
Family Cites Families (28)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4047163A (en) * | 1975-07-03 | 1977-09-06 | Texas Instruments Incorporated | Fault-tolerant cell addressable array |
| US4051354A (en) * | 1975-07-03 | 1977-09-27 | Texas Instruments Incorporated | Fault-tolerant cell addressable array |
| US4295218A (en) * | 1979-06-25 | 1981-10-13 | Regents Of The University Of California | Error-correcting coding system |
| US4302819A (en) * | 1979-10-22 | 1981-11-24 | Hewlett-Packard Company | Fault tolerant monolithic multiplier |
| NL8002787A (nl) * | 1980-05-14 | 1981-12-16 | Philips Nv | Multiprocessor-rekenmachinesysteem voor het uitvoeren van een recursief algorithme. |
| US4507726A (en) * | 1982-01-26 | 1985-03-26 | Hughes Aircraft Company | Array processor architecture utilizing modular elemental processors |
| CA1219965A (en) * | 1983-04-11 | 1987-03-31 | Allen P. Clarke | Self repair large scale integrated circuit |
| US4605928A (en) * | 1983-10-24 | 1986-08-12 | International Business Machines Corporation | Fault-tolerant array of cross-point switching matrices |
| US4922408A (en) * | 1985-09-27 | 1990-05-01 | Schlumberger Technology Corporation | Apparatus for multi-processor communications |
| US4722084A (en) * | 1985-10-02 | 1988-01-26 | Itt Corporation | Array reconfiguration apparatus and methods particularly adapted for use with very large scale integrated circuits |
| US4783782A (en) * | 1985-12-12 | 1988-11-08 | Alcatel U.S.A. Corporation | Manufacturing test data storage apparatus for dynamically reconfigurable cellular array processor chip |
| NL8600218A (nl) * | 1986-01-30 | 1987-08-17 | Philips Nv | Netwerk van dataverwerkingsstations. |
| GB8605367D0 (en) * | 1986-03-05 | 1986-04-09 | Secr Defence | Bit-slice digital processor |
| US4791603A (en) * | 1986-07-18 | 1988-12-13 | Honeywell Inc. | Dynamically reconfigurable array logic |
| US5038386A (en) * | 1986-08-29 | 1991-08-06 | International Business Machines Corporation | Polymorphic mesh network image processing system |
| FR2606184B1 (fr) * | 1986-10-31 | 1991-11-29 | Thomson Csf | Dispositif de calcul reconfigurable |
| JP2629697B2 (ja) * | 1987-03-27 | 1997-07-09 | 日本電気株式会社 | 半導体記憶装置 |
| DE3853860D1 (de) * | 1987-09-22 | 1995-06-29 | Siemens Ag | Vorrichtung zur Herstellung einer testkompatiblen, weitgehend fehlertoleranten Konfiguration von redundant implementierten systolischen VLSI-Systemen. |
| US4868818A (en) * | 1987-10-29 | 1989-09-19 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Fault tolerant hypercube computer system architecture |
| US4907232A (en) * | 1988-04-28 | 1990-03-06 | The Charles Stark Draper Laboratory, Inc. | Fault-tolerant parallel processing system |
| US4970724A (en) * | 1988-12-22 | 1990-11-13 | Hughes Aircraft Company | Redundancy and testing techniques for IC wafers |
| US5020059A (en) * | 1989-03-31 | 1991-05-28 | At&T Bell Laboratories | Reconfigurable signal processor |
| DE3916720A1 (de) * | 1989-05-23 | 1990-11-29 | Ant Nachrichtentech | Verfahren zur erweiterung eines dreistufigen regelmaessigen koppelfeldes |
| US5088091A (en) * | 1989-06-22 | 1992-02-11 | Digital Equipment Corporation | High-speed mesh connected local area network |
| US5134690A (en) * | 1989-06-26 | 1992-07-28 | Samatham Maheswara R | Augumented multiprocessor networks |
| US5133073A (en) * | 1990-05-29 | 1992-07-21 | Wavetracer, Inc. | Processor array of N-dimensions which is physically reconfigurable into N-1 |
| US5173689A (en) * | 1990-06-25 | 1992-12-22 | Nec Corporation | Self-distributed logical channel node failure restoring system |
| US5271014A (en) | 1992-05-04 | 1993-12-14 | International Business Machines Corporation | Method and apparatus for a fault-tolerant mesh with spare nodes |
-
1991
- 1991-06-28 US US07/723,287 patent/US5280607A/en not_active Expired - Fee Related
-
1992
- 1992-04-20 JP JP4099996A patent/JP2620457B2/ja not_active Expired - Lifetime
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005539312A (ja) * | 2002-09-13 | 2005-12-22 | ドコモ コミュニケーションズ ラボラトリーズ ユー・エス・エー インコーポレーティッド | フォールトトレランススキームを動的に切換えるための方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2620457B2 (ja) | 1997-06-11 |
| US5280607A (en) | 1994-01-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH05130101A (ja) | メツシユアーキテクチヤにおける故障許容のための方法と装置 | |
| Jou et al. | Fault-tolerant matrix arithmetic and signal processing on highly concurrent computing structures | |
| US5271014A (en) | Method and apparatus for a fault-tolerant mesh with spare nodes | |
| Xu | Topological structure and analysis of interconnection networks | |
| Malluhi et al. | The hierarchical hypercube: A new interconnection topology for massively parallel systems | |
| Kuo et al. | Efficient reconfiguration algorithms for degradable VLSI/WSI arrays | |
| US5513313A (en) | Method for generating hierarchical fault-tolerant mesh architectures | |
| JPH0766718A (ja) | プログラム可能論理用ウェファ・スケール構造 | |
| Kumar et al. | Design and analysis of fault-tolerant multistage interconnection networks with low link complexity | |
| Bruck et al. | Fault-tolerant de Bruijn and shuffle-exchange networks | |
| Fernández et al. | Efficient VLSI layouts for homogeneous product networks | |
| Kothari et al. | The kappa network with fault-tolerant destination tag algorithm | |
| Shih et al. | Adding multiple-fault tolerance to generalized cube networks | |
| Siegel et al. | An introduction to the multistage cube family of interconnection networks | |
| Leu et al. | A fault-tolerant tree communication scheme for hypercube systems | |
| Ali et al. | Exact bounds on running ASCEND/DESCEND and FAN-IN algorithms on synchronous multiple bus networks | |
| Bertossi et al. | A gracefully degradable VLSI system for linear programming | |
| Dutt et al. | A local-sparing design methodology for fault-tolerant multiprocessors | |
| Ku et al. | Systematic design of fault-tolerant multiprocessors with shared buses | |
| Boubekeur et al. | A full experience of designing a wafer scale 2D array | |
| Wang et al. | A new fault-tolerant broadcast routing algorithm on mesh networks | |
| Bruck et al. | Tolerating faults in a mesh with a row of spare nodes | |
| Mazumder | Layout optimisation for yield enhancement in on-chip-VLSI/WSI parallel processing | |
| Varman et al. | A robust matrix-multiplication array | |
| Horiguchi et al. | Self-reconfiguration scheme of 3D-mesh arrays |