JPH06507744A - 大量並列プロセッサ間の、階層的プロセッサ相互間通信ネットワークのための手順決定技術 - Google Patents
大量並列プロセッサ間の、階層的プロセッサ相互間通信ネットワークのための手順決定技術Info
- Publication number
- JPH06507744A JPH06507744A JP4511818A JP51181892A JPH06507744A JP H06507744 A JPH06507744 A JP H06507744A JP 4511818 A JP4511818 A JP 4511818A JP 51181892 A JP51181892 A JP 51181892A JP H06507744 A JPH06507744 A JP H06507744A
- Authority
- JP
- Japan
- Prior art keywords
- node
- nodes
- descendant
- parent node
- buffer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/173—Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
- G06F15/17356—Indirect interconnection networks
- G06F15/17368—Indirect interconnection networks non hierarchical topologies
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
1プロセ・す日の
・プロセ・・サ 日゛ −・ −り
Ω友かγIす部且歪
本発明は、国防省高等プロジェクト局により与えられた契約第MDA972−9
0−C−0022の下に、政府の支持でなされた。政府は本発明に一定の権利を
有する。
大量並列コンピュータ・プロセッサ間の、プロセッサ相互間通信(IPC)のた
めの数多くの型の相互連結ネットワークが当該技術において公知である。これら
の内には、トリー樺構造に構成し得る階層型通信ネットワークがあり、その中で
は個別プロセッサが階層の最低レベル()まり、レベルO)に位置し、木の葉を
表している。この個別プロセッサは、レベル0クラスタのグループに編成され、
各個別レベル0クラスタの各単独プロセッサが、それ自身の通信チャンネルを通
し、階層トリーのレベル1に位置しているレベル0クラスタのためのノードに相
互連結されている。同様な手法で、レベル1ノードは、レベル1クラスタのグル
ープに編成されていても良く、その各個別レベル1クラスタの各単−ノーロよ、
それ自身の通信チャンネルを通し、階層トリーのレベル2に位置しているレベル
1クラスタのためのノードと相互連結されている0階層トリーの最高レベル(レ
ベルn)は、少なくとも二つの相互連結ノードを含み、それは、個別通信チャン
ネルを通じ(n−1)レベルのノードの各車−の一つを相互連結している。この
ノードの各々は、適当なネットワーク・ルータまたはスイッチを含み、任意の選
択された送信レベルOプロセッサが、任意の選択された受信レベルOプロセッサ
に相互連結されて、地球的IPC能力を備えるようにする。
公知の様に、大量並列プロセッサ群を採用したコンピュータは、多数命令・多数
データ(MIMD)機の形を採るか、または単一命令・多数データ(SIMD)
機の形を採っても良い、MIMDコンピュータにおいては、ネットワーク中のパ
ケットは、多くのプロセッサの一つにより独立に発生させられたrsendjま
たはrgetJ命令からである。成るMIMDコンピュータは、若し平均の手順
決定待ち時間またはパケットの遅れ時間が低ければ最適に稼働する。成るSlM
D機は、一時に只一つの未決rsendILか許容しない。ネットワーク中の全
てのパケットは、同一のrsend1命令に起源している。このrsendlは
、全てのパケットが配達されるまで完結しない。それ故、SIMDIlは、rS
endJの全てのパケットに対し、低い最悪ケースの待ち時間を要する。この特
性は、SIMDコンピコンピュータの手順決定プロトコルが、それらの寿命また
はネットワーク中で過ごした時間に従ってパケットの優先順位決定をする必要が
ないことを含蓄している。これに加えて、このネットワークは、何時でも限定さ
れた数のパケットを有することを予期することが出来る。
SIMDおよびMIMDプロセッサ相互間通信は又、期待パケット・サイズにお
いても異なる。成るMIMDシステムにおいては、プロセス同期情報を含むもの
の様な成るパケットは、もはや数バイト長さを越えるものでない、データを含む
他のものは、数キロバイト長さでも良い、SIMDシステムにおけるパケットは
、しばしば只1語長であるように短い、それらは、隣接している画素またはマト
リックス係数の値を含むことがある。
高い帯域幅の相互連結ネットワークは、高価で構築に複雑であるので、スケラビ
イテイ(達成可能性)の問題が、全ての設計の中心となる。この相互連結ネット
ワークの速度は、取り分けSlMD機の様なIPC遅れを良くマスクしないコン
ピュータにとって、性能の主要なファクタである0本発明は、SlMD機の階層
プロセッサ相互間通信のための改良された手順決定技術に向けられ、それはロー
コストおよび低い待ち時間(つまり、低いIPC遅れを挿入すること)の両観点
から、ネットワークの動作を改良するのに効率的である。
発朋■概要
本発明は、単一命令・多数データ(SIMD)並列プロセッサ・コンピュータに
おいて、アドレス情報を含むデータのパケットを、コンピュータの引き続く手順
決定サイクルの間、コンピュータの並列プロセッサの任意の一つとコンピュータ
の並列プロセッサの他の任意の一つとの間で手順決定するための手順決定方法に
向けられている。この並列プロセッサ群は、ノードの少なくとも二つの階層レベ
ルと一つの相互連結チャンネルのネットワークとを有する階層プロセッサ相互連
結トリー構造の葉を形成している。この階層プロセッサ相互連結トリー構造の最
高レベルは、少なくとも二つのノードを含み、且つノードの第一の階層レベルの
上位の階層レベルの各ノードは、次に低い階層レベルの複数の子孫ノードの親ノ
ードである。第一レベル・ノードの各々は、ネットワークのチャンネルによって
、並列プロセッサ群の別々の一つと個別に相互連結されており、且つ各子孫ノー
ドは、ネットワークのチャンネルによって、その親ノードと相互連結されている
。加えて、成る共通の親ノードの各子孫ノードは、ネットワークのチャンネルに
よって、その共通の親ノードの少なくとも一つの他の子孫ノードと相互連結され
ており、且つ最高階層レベルの各ノードは、ネットワークのチャンネルによって
、最高階層レベルの他のノードの少なくとも一つと相互連結されている。更に全
てのネットワーク・チャンネルは二重の単方向性リンクで、二つのパケットの反
対方向への同時伝送を可能としており、且つ、各ノードは、(1)そのレベルに
おけるネットワーク・チャンネルの合計数より一つ多いパケットを記憶する記憶
容量を有するバッファ、および(2)前記並列プロセッサ群の送信する一つでそ
のノードから起源し、ネットワーク・チャンネルを通じ前記並列プロセッサ群の
受信する一つに向かう接続を、そのノードのバッファに記憶されたパケットに含
まれたアドレス情報に従って、延長するためのルータ−を含むものである。
本発明の手順決定方法は、コンピュータの引き続く手順決定サイクルの間に、次
のステップを含む:
(a)階層プロセッサ相互連結トリー構造の各親ノードにおいて、その親ノード
のバッファに記憶され、送信プロセッサから受信プロセッサに向かう接続を延長
するために、その子孫ノードに送られるべきことを要求するアドレス情報を含む
パケットを、チャンネル・ダウン・リンクを通じ、その子孫ノードの各々に、そ
の親ノードのバッファが、一つの空き記憶スペースを有するようになるか、その
子孫ノードがそれに送られるべきパケットを有しなくなる迄、伝送するステップ
;
(b)成る親ノードのバッファが、一つの空き記憶スペースを有するようになる
か、その子孫ノードがそれに送られるべきパケットを有しなくなることに応じて
、その子孫ノードにその親ノードから、その子孫ノードの各々がそれに、その子
孫ノードのバッファに前原て記憶されていた、そのパケットが送信プロセッサか
ら受信プロセッサに向かう接続を延長するために、その親ノードから送られるべ
きことを要求するアドレス情報を含むパケットを、チャンネル・アップ・リンク
を通し、送ることを試みても良いと合図するステップ;および(c)ステップ(
b)に述べられた試みが、その親ノードの子孫ノードの与えられた一つによる現
行手順決定サイクルの間に、成るパケットがその時、その親ノードにその子孫ノ
ードの他のバッファから送られてきたために、達成出来ない場合、その現行手順
決定サイクルの間、その親ノードの子孫ノードの、その与えられた一つのバッフ
ァからのパケットを、その親ノードの子孫ノードのその他のバッファに記憶させ
るために伝送するステップ。
区血少旦単猛説所
図1は、4096個のプロセッサ群間のプロセッサ相互間通信のための階層間接
ネットワークを示すダイヤグラム表示;図2は、8個のキャビネットに収められ
、各キャビネットあたり8枚の回路ボード、各回路ボードあたり64個のプロセ
ッサがある、4096個のプロセッサ群の相互連結に所要の各数を、相互連結ネ
ットワークの幾つかの異なる型に対して示す表;および
図3は、本発明の手順決定技術を図解する簡単化した機能ダイヤグラム図である
。
しい の な量゛
本発明の記述における図解の目的だけに限るが、4096個のプロセッサ群は、
図1に示すように、64個のプロセッサの各クラスタが、8個のキャビネットの
別々の一つに収められた8枚の回路ボードの別々の一つに置かれて、成る階層プ
ロセッサ相互間通信ネットワーク中に相互連結されているものと仮定する。この
階層のレベルOのクラスタの64個のプロセッサの各々が、この階層のレベルl
のそれ自身の個別ノードに相互連結され、そのクラスタの回路ボードに位置して
いる64個のレベル1ノードをもたらしている。各個別キャビネット内に収めら
れた8枚の回路ボードに対応する、この階層の64個のレベル1ノードの8個の
各クラスタが、この階層のレベル2における個別ノードに相互連結され、合計で
8レベル2ノードをもたらしている。8個の個別キャビネットに対応する、この
階層のレベル2ノードの全8個はこの階層のレベル3において他の一つと相互連
結されている。
合計して64枚の回路ボードの各々は、64個のプロセッサの関連するクラスタ
を含むことに加えて、その関連したクラスタの個別のレベル1ノードを含むオン
ボード・ルータ集積回路も含んでいて良い、8個のキャビネットの任意の与えら
れた一つに収められた8枚の回路ボードに関連するレベル2ノードは、それが関
連しているキャビネットの背面に配置されたルータ集積回路を設けられていて良
い、これは、8個のキャビネットのクラスタに関連し、集積回路だけに限らない
手段で装備されるべき、単一レベル3ノード・ルータのみを与える。
上述の4096便のプロセッサ群のための階層プロセンサ相互間通信ネットワー
クが、より精巧な地球的通信を必要とする応用を裏付けることが出来ることは望
ましい。例えば、急速フーリエ変換(FFTs)、ラスタ・マツピング、および
パラレル・データ・シフトの様なコンパイラ作業は、全て不規則なパターンにあ
る遠隔プロセッサ間で、データを移動させることを必要とする。また、多くの応
用は、手順決定パターンが実行時まで知られていない通信のための裏付けを必要
とする。かような必要性が、手順決定制御のためにプロセッサ群自身に依存せず
、少しの空間的局在性で、手順決定パターンを扱うことの出来るIVCシステム
への研究を促進した。更に、階層ネットワークは、ネットワーク・レベルの数に
加えて、各レベルにおけるクラスタのトポロジー(位相幾何学)の様に、無数の
パラメータを有している。実際上、これらのパラメータの最適な選択は、自然ま
たは予期した手順決定パターンに依存する。
地球的[PCのための相互連結ネットワークは、かなりの研究活動の話題であっ
て来た。相互連結ネットワークの二つの主要なりラス:直接および間接、が提案
されている0間接ネットワークの例は、オメガ(Omega)、ベネス(Ben
es)およびパーフェクト・シ+7フル(perfect 5huff le)
矛ノドワークである0間接ネットワークは、BBNバタフライ(Butterf
ly)およびIBM RP3に装備されて来た。直接またはスタティック・ネッ
トワークは、リング、二次元的メツシュまたはトーラス(円形隆起)、直接ケー
ーアレー(k−ary)、ハイパーキューブに例示されるn−キューブ、および
完全接続またはクロスバ−の様な種々のトポロジーを用いる。テラ(Tera)
コンピユーテイング・システム、アイワープ(iWarp)およびコスミック・
キューブ(Cosmic Cube)は二次元的トーラスを用いる。十三次元的
ハイパーキューブはコネクション・マシーン(Connection Mach
ine)に装備されている。
これらの相互連結ネットワークの各々の記述および議論の中心には、ネットワー
ク装備のコストおよび、そのコストが性能をもって発揮する機能がある。コスト
は、コントローラの複雑性、接続の長さ、または接続の数で測定出来る。大きな
SIMDシステムに関して、接続の数は、そのシステムが数千のプロセッサ群に
成長し、多数のボードおよびキャビネットにおよぶので、臨界的なコストである
。接続の数またはコストを制限することはシステム性能を制限することになり得
る。
階層ネットワーク(それ自身は新規でない)は、このコスト・パーフォーマンス
・トレイドオフ(かねあい)問題に一つの解決を提供する0例えば、階層ネット
ワークは、過去においてヘクター(Hector)、シーエム(Cm*)および
シダー(Cedar)システムに装備されて来た。大量並列システムの着実な成
長および成熟とともに、階層ネットワークは、高速通信に特別の嘱望を維持して
いる。
再び図1を参照すると、上で議論した仮定の4096個のプロセッサ階層ネット
ワークの機能的ブロック・ダイヤグラムが示されている0図1に示すように、こ
の階層ネットワークは、トリ一様構造を有している。木の葉はプロセッサで、内
部ノードはネットワーク・ルータまたはスイッチである。共通の親を有するノー
ドのグループはクラスタと呼ばれ、成るクラスタの各ノードは、その共通の親の
子孫と呼ばれる。成るトリー・レベル内の全てのクラスタは、同一のトポロジー
で相互連結されるが、異なるトリー・レベルは、場合により、二次元的トリ、ハ
イパーキューブまたはクロスバ−の欅な異なるトポロジーを存し得る。
ネットワーク・レベルの数、およびクラスタのサイズおよびトポロジーは、ハー
ドウェアの複雑性およびネットワーク性能の両者に深い影響を及ぼす、これらの
パラメータは、ボード間およびキャビネット間接続の様なオフチップ・ハードウ
ェアの量を最小限にするように選ぶべきである。これらの接続は、インボードま
たはインチツブ接続より高価で低速なので、避けるべきである。
この点に関し、図2は、上述の4096個のプロセッサ相互連結ネットワークの
ためのオフチップ・ハードウェア・コストにおける差を示す表で、そこでは、完
成コンピュータが1枚に64個のプロセッサを有する8枚の回路ボードを8個の
キャビネットに収められているものと仮定し、採用した特定のトポロジーに依存
している。試験したトポロジーは、バイナリ−・ハイパーキューブ、二次元的ト
ーラス、および二つの階層ネットワークである。この階層ネットワークのための
クラスタ・サイズの選択は、先に示したハードウェア・レイアウトに直接対応す
る。各最低レベル・クラスタは、単一のICに装備されたルータを用いてボード
の64個のプロセッサを相互連結する。第2レベル・クラスタは、共通のキャビ
ネ、トの8枚のボードを相互連結し、第3レベルの単一のクラスタは、8個のキ
ャビネット全てを相互連結する。
図2は、この階層トポロジーが、単一レベル・トポロジーよりかなり低い接続の
数を有することを示している。取り分は重要なことは、この階層ネットワークの
キャビネット間接続の数における節約である。
SIMD階層ネ階層ラントワークの本発明の新規な手順決定技術を徒示する前に
、この手順決定技術により利用されてるSIMDコンピコントローラるIPCの
幾つかの特徴を指摘することは価値がある。この手順決定技術において、パケッ
トは、送信プロセッサから受信プロセッサへ、一連のrホップ1により中間のノ
ードを通して発送される。このパケットは、各ノードにおいて「ホラ11間でバ
ッファされる。この「ホップJは、ネットワークを通しるパケットの経路を構成
する。この経路は、伝統的なトリー横断アルゴリズムを用いて発生させられる、
成るパケットは、その転送先に達するのに必要な最低限可能なりラスタまで上昇
し、そのクラスタを横断し、その後、その転送先プロセッサまで下降する。
加えて、当該技術において公知の強制または自棄的手順決定のバージョンがクラ
スタ横断のために使用される。各クラスタ・ノードは、そのイン・クラスタ・チ
ャンネルの各々のためのバッファ・スペースを有している。各手順決定サイクル
において、全てのバケ7)は、これらのチャンネルの一つに送り出され、「古い
jパケットのバッファ欠所を残す、各パケットは、それが必要としているチャン
ネル上に伝送されるべき他のものと競い合う、若し成るパケットが、それが必要
としているチャンネルを得られないならば、それは強制的に、使用されていない
イン・クラスタ・チャンネルに発送される。成るパケツトは、1サイクル間に各
イン・クラスタ・チャンネルに達し得るので、入って来るパケットの最大数は、
チャンネルの数に等しいか、或いはノードのバッファ・スペースと同等である、
バッファのオーバーフローの可能性は無い。
強制的手順決定は、そこに恐ら(その長さが変化しており、ノードの各対の間に
存在しているクロスバ−またはハイパーキューブの様な多数の経路があるトポロ
ジーについて効果的である。かような場合において、成る特定のチャンネルのた
めに並んで待っているパケットは、より長い経路を採ることによりより早く進行
出来る。クロスバ−の場合、その転送先までのバケット経路は、若しそれが強制
的に発送されるならば、長くなることは無い0代わりの経路を使用することによ
り、強制的手順決定は、ホット・スボント・トラフィック混雑を軽減し、それ故
、手順決定時間を低下させる。
ここで、本発明の手順決定技術により採用された手順決定経路の型の単純化した
ダイヤグラムである図3を参照する0図解の目的で、三しベル階層構造が図3に
仮定されており、そのレベル3は、クラスタ・ノードN311およびN312を
含んでいる。レベル2は、親ノードN311の子孫であるクラスタ・ノードN2
11およびN212並びに親ノードN312の子孫であるクラスタ・ノードN2
21およびN222を含んでいる。レベル1は、親ノードN211の子孫である
クラスタ・ノードN111、N112およびN113i親ノードN212の子孫
であるクラスタ・ノードN121.N122およびN123;親ノードN221
の子孫であるクラスタ・ノードN131、N132およびN133i並びに親ノ
ードN222の子孫であるクラスタ・ノードN141.、N142およびN14
3を含んでいる。
図3に示した樺に、レベル1ノードの各々は、個別の専用チャンネルを通してレ
ベルOプロセッサの対応する一つと相互連結されている。取り分け、プロセッサ
PO12はノードNl 12と、それ自身の専用チャンネルCI2を通して相互
連結され、且つ、プロセッサPO43は)〜ドN112と、それ自身の専用チャ
ンネルC43を通して相互連結されている。更に、図3に示した様に、発送され
たデータ・パケットに割当られたネットワーク・チャンネルは、次に高しルベル
における共通の親ノードの子孫であり、且つこれらの子孫ノードの各々をその共
通の親ノードに相互連結している、同一レベルの全てのクラスタ・ノードに相互
連結されている。
図3に示した階層構造は、全てのネットワーク・チャンネルが、二つのパケット
の反対方向への同時伝送を可能とする二重の一方向性リンクであることを仮定し
ている。それは又、各リンクが、クラスタ内またはレベル間のいずれにあっても
、コンピュータ・マシーンの1サイクルにつき正確に1個のパケットを配送出来
ることも仮定している。更に、各クラスタ・ノードが、パケット・データ(手順
決定アドレス情報を含む)を記憶するための与えられたサイズのバッファ、およ
び各コンピュータ・マシーン・サイクルの間、そのコンピュータ・マシーン・サ
イクルの間、チャンネルを通じる接続を延長する目的で、その手順決定アドレス
情報により制御される適当なスイッチング手段を含む。
本発明の手順決定技術の次の説明において、rnochans)は、与えられた
階層レベルにおける与えられたクラスタのノードを、その与えられた階層レベル
の直ぐ上または下の階層レベルにおけるクラスタ・ノードに、または、レベル1
の場合、レベル0における個別プロセッサに相互連結するチャンネルの合計数を
指示するものである。各バッファのサイズは、rnochans+IJに等しい
。
本発明の手順決定技術によれば、各手順決定サイクルの間、各クラスタ・ノード
において、送信プロセッサがら、手順決定アドレス情報により同定された受信プ
ロセッサに向かう接続を延長する為に、次のプロセス・ステップが起こる:(1
)各クラスタの親ノードの各々につき、チャンネル・ダウン・リンクにわたりそ
の子孫ノードに、その親ノードのバッファに記憶されていた、そのパケットが、
送信プロセッサがら受信プロセッサに向かう接続を、その親ノードのバッファが
一つの空きの記憶空間を有するようになるが、又はその子孫ノードがそこに送ら
れるべきパケットをもはや持たなくなるまで、延長するために、そのパケットが
その子孫ノードに送られるべきことを要求するアドレス情報を含むパケットが送
られる。
(2)成る親ノードのバッファが一つの空きの記憶空間を有するようになるか又
はその子孫ノードがそこに送られるべきパケットをもはや持たなくなった時は何
時でも、その親ノードはその子孫ノードに、その子孫ノードの各々が、そこに「
古い1送信プロセンサから受信プロセンサに向かう接続を延長するために、その
パケットがその親ノードから伝送されるべきことを要求するアドレス情報を含む
パケット(つまり、現行の手順決定サイクルの開始に先立ってその子孫ノードの
バッファに記憶されていたパケット)を、チャンネル・アップ・リンクにわたり
送るように試みても良いと合図する。
(3)ステップ(2)に述べられた試みが、成るパケットがその時、その親ノー
ドにその子孫ノードの他のバッファから送られてきたために、その親ノードの子
孫ノードの与えられた一つによる現行手順決定サイクルの間に達成出来ない場合
、その現行手順決定サイクルの間、その親ノードの子孫ノードの、その与えられ
た一つのバッファからのパケットを、その親ノードの子孫ノードのその他のバッ
ファに記憶させるように伝送する(つまり、これらの場合には、強制的または自
棄的手順決定が鯨りにされる)。
図3に戻ると、そこには、送信プロセッサP012が受信プロセッサPO43と
、図3に実線で示した相互連結チャンネルを通じ相互連結されるべきこと、一方
、−以上の他の送信プロセッサが一以上の他の受信プロセッサと、図3に破線で
示した相互連結チャンネルを通じ相互連結されることをめていて良いことが仮定
されている。最初の手順決定サイクルの間、所望の手順決定アドレス情報ととも
に受信プロセッサPO43により使われるためのデータを含む与えられたパケッ
トが、ノードNlI2まで、その間の相互連結専用チャンネルCI2を通じ上昇
し、そのバッファ内に記憶される。第2の手順決定サイクルの間、その親ノード
N211が、それにその子孫ノードN112からそのチャンネルを割当るのに成
る理由、例えば親ノードN211のバッファがその時完全に満たされ、あるいは
親ノードN211のルータ−がその時他のパケットで塞がっていたと言う様なこ
とで、自由でないと仮定すると、その与えられたパケットをノードN112のバ
ッファからノードN11lのバッファに移送するために強制的手順決定が採用さ
れる。再び、強制的手順決定が、第3の手順決定サイクルの間に必要であると仮
定され、そしてノードN111のバッファからのその与えられたパケットは、ノ
ードN113のバッファに移送される。しかしながら、第4の手順決定サイクル
に際しては、親ノードN211は最終的に、それをその子孫ノードN113に相
互連結するチャンネルを割当て、そしてその与えられたパケットは、ノードN2
11のバッファまで上昇し、そこで記憶される。同様な手法で、パケットは、第
5ないし第8の各手順決定サイクルの間、引き続いて、子孫ノードN211から
その親ノードN311に上向きに動がされ、ノードN312を横切り、次いで、
親ノードN312の子孫ノードN222を通過し、親ノードN222の子孫ノー
ドN】43に下る、そして第9の手順決定サイクルの間に、最終的に、受信プロ
セッサPO43まで専用のチャンネルC43を通じて下る。
上述の手順決定プロセスにおいて、上向きの動きは明示のフロー制御を必要とす
る。上昇を望む各パケットは、その親が占有されていないバッファ・スペースを
持つ迄待たなければならない、他方、下向きの動きは、何らのフロー制御を必要
としない。下降を望むパケットは、若しそのノードにある他のパケットが、その
チャンネルに対する権利を与えられているならば、進行を許されない、この下向
きの動きに対する制約は、下向きプロッヶージと呼ばれる。ある与えられたレベ
ルのクラスタを横断することを望むか、あるいはより高いレベルへの上昇または
より低いレベルへの下降を待っている全てのパケットは、強制的手順決定を用い
て発送される。
かように、上述の手順決定プロセスは、レベル間のデッドロック及びバッファ・
オーバーフローの防止を保証している。成るレベルは常に成る固定された数のパ
ケットをより低いレベルへ送ることを許されている。それ故、成るレベルにおけ
るパケツトは、決して完全にはトラップされることは無い、それらが去った時、
それらは、より低いレベルから上昇するパケットのためのスペースを作る。
各ノード・バッファが、rnochans+11パケットのためのスペースを有
している条件で、バッファ・オーバーフローが無いように保証されている。クラ
スタ内で使用される強制的手順決定プロトコルは、クラスタ内で動いているパケ
ラトがrnochansJバッファ・スペース以上を消費しないことを保証して
いる。余分のスペースが、成るパケットが次に高いレベルから下降してくる場合
のためにリザーブされている0次の手順決定サイクルの間のその下向きの動きは
、若しクラスタからの他のパケットにより阻止されるならば、損なわれる。若し
そのパケットが阻止されるならば、それは、それを損なったパケットのバッファ
・スペースを取ることが出来る。いずれの場合でも、サイクルの終わりではこの
特別のバッファ・スペースは常に空いている。それ故、クラスタを横断し下向き
に動くパケットは、決してバッファ・オーバーフローを生じることは無い。
更に、上述の手順決定プロセスは、フロー制御ラインの数を殆ど除去することに
よりハードウェア?3[9111性を減少させる。それは、合計の手順決定待ち
時間を、ネットワーク内に存在しているパケットの数を常に最大限にすることに
より、最小化するように試みる。バッファを出来るだけ満たすように維持するこ
とにより、パケットの多数のものが進行出来る。かような戦略は、クラスタ・ノ
ードが、冗長な経路を僅かだけしか含まない場合に限り失敗に終わる。この場合
において、若し強制(自棄)的手順決定が大量に生じるならば、前向きの進行の
量は、必ずしもかような強制的手順決定により失われた進行を越えることは無い
。
前述の事柄から、手順決定順列における局在性の量が知られているなら、コスト
・エフエクテイブなネットワークを見出し得ることは明らかである。成る手順決
定順列およびレベルに対しては、高いピーク帯域幅およびそれに対応する高いハ
ードウェア・コストを有するトポロジーは、成る経済的なより遅いトポロジーよ
り良い性能を与えないことがある。成る三レベル階層に対して、レベル1のため
のリング(トロイド)トポロジー構造、およびレベル2および3の各々のための
クロスバ−・トポロジー構造が、レベル1.2および3の全てのためのクロスバ
−・トポロジー構造に殆ど匹敵する性能を発揮するが、装備するのは有意により
容易である0期待された手順決定パターンが、その性質において一般的に地球的
であるような場合においては、最高のトポロジーが、クロスバ−のように高い程
度の接続性を有する一つであるべきである。より低いトポロジーも、性能に有意
に影響するものでないので、リング、バイナリ−・ハイパーキューブおよびクロ
スバ−・トポロジー構造が、各階層レベル1.2および3に対する良い候補であ
る。
上述の手順決定プロセスを採用した階層ネットワークは、SIMDコンピュータ
に対する高速、低コストのプロセッサ相互間通信を提供する。シミュレーション
は、この階層ネットワークがハードウェアのために仕立てられた時、このコスト
潜在製品は成る単一レベル・トポロジーに匹敵するが、成る場合にはより低いこ
とを示している。
一旦ネノドワーク構造が決定されると、クラスタ・トポロジーは、各レベルの実
際の処理能力がそのトラフィック負荷とバランスするように選ばれなければなら
ない。適切なバランスをもって、ネットワークのチャンネルは高い利用率で動作
し、ネットワーク性能がネットワーク・コストを正当化することを保証する。
l:Io Oc’−t 寸
へや−へ 寸
Claims (2)
- 1.単一命令・多数データ(SIMD)並列プロセッサ・コンピュータにおいて 、アドレス情報を含むデータのパケットを、前記コンピュータの引き続く手順決 定サイクルの間、前記コンピュータの並列プロセッサの任意の一つと前記コンピ ュータの並列プロセッサの他の任意の一つとの間で手順決定するための手順決定 方法であって;そこでは前記並列プロセッサ群が、ノードの少なくとも二つの階 層レベルと一つの相互連結チャンネルのネットワークとを有する階層プロセッサ 相互連結トリ−構造の葉を形成しており;前記階層プロセッサ相互連結トリ−構 造の前記最高レベルは、少なくとも二つのノードを含み、そこで、ノードの第一 の階層レベルの上位の階層レベルのノードの各々は、次に低い階層レベルの複数 の子孫ノードの親ノードであり;前記第一レベル・ノードの各々は、前記ネット ワークのチャンネルによって、前記並列プロセッサ群の別々の一つと個別に相互 連結されており、各子孫ノードは、前記ネットワークのチャンネルによって、そ の親ノードと相互連結されており、或る共通の親ノードの各子孫ノードは、前記 ネットワークのチャンネルによって、その共通の親ノードの少なくとも一つの他 の子孫ノードと相互連結されており、且つ最高階層レベルの各ノードは、前記ネ ットワークのチャンネルによって、最高階層レベルの少なくとも一つの他のノー ドと相互連結されており;更に、全ての前記ネットワーク・チャンネルは二重の 単方向性リンクで、二つのパケットの反対方向への同時伝送を可能としており; 且つ各ノードは、(1)そのレベルにおけるネットワーク・チャンネルの合計数 より一多いパケットを記憶する記憶容量を有するバッファ、および(2)前記並 列プロセッサ群の送信する一つでそのノードから起源し、前記ネットワーク・チ ャンネルを通じ前記並列プロセッサ群の受信する一つに向かう接続を、そのノー ドのバッファに記憶されたパケットに含まれたアドレス情報に従って、延長する ためのルーターを含むものであり;更に前記手順決定方法は、前記コンピュータ の前記引き続く手順決定サイクルの各々の間に、次のステップを含んでいる:( a)階層プロセッサ相互連結トリ−構造の名親ノードにおいて、その親ノードの バッファに記憶され、送信プロセッサから受信プロセッサに向かう接続を延長す るために、その子孫ノードに送られるべきことを要求するアドレス情報を含むパ ケットを、チャンネル・ダウン・リンクを通じ、その子孫ノードの各々に、その 親ノードのバッファが、一つの空き記憶スペースを有するようになるか、その子 孫ノードがそれに送られるべきパケットを有しなくなる迄、伝送するステップ; (b)或る親ノードのバッファが、一つの空き記憶スペースを有するようになる か、その子孫ノードがそれに送られるべきパケットを有しなくなることに応じて 、その子孫ノードにその親ノードから、その子孫ノードの各々がそれに、その子 孫ノードのバッファに前以て記憶されていた、そのパケットが送信プロセッサか ら受信プロセッサに向かう接続を延長するために、その親ノードから送られるべ きことを要求するアドレス情報を含むパケットを、チャンネル・アップ・リンク を通じ、送ることを試みても良いと合図するステップ;および(c)ステップ( b)に述べられた試みが、その親ノードの子孫ノードの与えられた一つによる現 行手順決定サイクルの間に、或るパケットがその時、その親ノードにその子孫ノ ードの他のバッファから送られてきたために、達成出来ない場合、その現行手順 決定サイクルの間、その親ノードの子孫ノードの、その与えられた一つのバッフ ァからのパケットを、その親ノードの前記子孫ノードのその他のバッファに記憶 させるために伝送するステップ。
- 2.単一命令・多数データ(SIMD)大量並列プロセッサ・コンピュータにお いて、アドレス情報を含むデータのパケットを、前記コンピュータの引き続く手 順決定サイクルの間、前記コンピュータの並列プロセッサの任意の一つと前記コ ンピュータの並列プロセッサの他の任意の一つとの間で手順決定するための手順 決定方法であって;そこでは前記コンピュータが、4096個の並列プロセッサ 群を含み、それらが、ノードの三つの階層レベルと一つの相互連結チャンネルの ネットワークとを有する、階層プロセッサ相互連結トリ−構造の葉を形成してお り;前記階層プロセッサ相互連結トリ−構造の前記第三レベルは、8個のノード を含み、そこで前記第三階層レベルの前記8個のノードの各々は、第二階層レベ ルにおける8個の子孫ノードのクラスタの親ノードであり、且つ前記第二階層レ ベルにおける8個の子孫ノードの前記クラスタの各々は、第一階層レベルにおけ る64個の子孫ノードのクラスタの親ノードであり;前記第一レベル・ノードの 各々は、前記ネットワークのチャンネルによって、前記4096個の並列プロセ ッサ群の別々の一つと個別に相互連結されており、第一階層レベルにおける子孫 ノードの各クラスタは、前記ネットワークのチャンネルによって、第二階層レベ ルにあるその親ノードと相互連結されており、第二階層レベルにおける子孫ノー ドの各クラスタは、前記ネットワークのチャンネルによって、第三階層レベルに あるその親ノードと相互連結されており、且つ第三階層レベルのノードの各々は 、前記ネットワークのチャンネルによって、第三階層レベルの他のノードと相互 連結されている;更に、全ての前記ネットワーク・チャンネルは二重の単方向性 リンクで、二つのパケットの反対方向への同時伝送を可能としており;且つ各ノ ードは、(1)そのノードで終結するネットワーク・チャンネルの合計数より一 多いパケットを記憶する記憶容量を有するバッファ、および(2)前記並列プロ セッサ群の送信する一つでそのノードから起源し、前記ネットワーク・チャンネ ルを通じ前記並列プロセッサ群の受信する一つに向かう接続を、そのノードのバ ッファに記憶されたパケットに含まれたアドレス情報に従って、延長するための ルーターを含むものであり;更に前記手順決定方法は、前記コンピュータの前記 引き続く手順決定サイクルの各々の間に、次のステップを含んでいる:(a)階 層プロセッサ相互連結トリ−構造の各親ノードにおいて、その親ノードのバッフ ァに記憶され、送信プロセッサから受信プロセッサに向かう接続を延長するため に、その子孫ノードに送られるべきことを要求するアドレス情報を含むパケット を、チャンネル・ダウン・リンクを通じ、その子孫ノードの各々に、その親ノー ドのバッファが、一つの空き記憶スペースを有するようになるか、その子孫ノー ドがそれに送られるべきパケットを有しなくなる迄、伝送するステップ; (b)或る親ノードのバッファが、一つの空き記憶スペースを有するようになる か、その子孫ノードがそれに送られるべきパケットを有しなくなることに応じて 、その子孫ノードにその親ノードから、その子孫ノードの各々がそれに、その子 孫ノードのバッファに前以て記憶されていた、そのパケットが送信プロセッサか ら受信プロセッサに向かう接続を延長するために、その親ノードから送られるべ きことを要求するアドレス情報を含むパケットを、チャンネル・アップ・リンク を通じ、送ることを試みても良いと合図するステップ;および(c)ステップ( b)に述べられた試みが、その親ノードの子孫ノードの与えらたに一つによる現 行手順決定サイクルの間に、或るパケットがその時、その親ノードにその子孫ノ ードの他のバッファから送られてきたために、達成出来ない場合、その現行手順 決定サイクルの間、その親ノードの子孫ノードの、その与えられた一つのバッフ ァからのパケットを、その親ノードの前記子孫ノードのその他のバッファに記憶 させるために伝送するステップ。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US697,556 | 1991-05-09 | ||
| US07/697,556 US5224100A (en) | 1991-05-09 | 1991-05-09 | Routing technique for a hierarchical interprocessor-communication network between massively-parallel processors |
| PCT/US1992/002668 WO1992020177A1 (en) | 1991-05-09 | 1992-04-09 | Routing technique for a hierarchical interprocessor-communication network between massively-parallel processors |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06507744A true JPH06507744A (ja) | 1994-09-01 |
Family
ID=24801589
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4511818A Pending JPH06507744A (ja) | 1991-05-09 | 1992-04-09 | 大量並列プロセッサ間の、階層的プロセッサ相互間通信ネットワークのための手順決定技術 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5224100A (ja) |
| EP (1) | EP0583400A4 (ja) |
| JP (1) | JPH06507744A (ja) |
| WO (1) | WO1992020177A1 (ja) |
Families Citing this family (96)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2572522B2 (ja) * | 1992-05-12 | 1997-01-16 | インターナショナル・ビジネス・マシーンズ・コーポレイション | コンピューティング装置 |
| JPH06325005A (ja) * | 1993-05-14 | 1994-11-25 | Fujitsu Ltd | 再構成可能なトーラス・ネットワーク方式 |
| DE69331054T2 (de) * | 1993-07-30 | 2002-06-20 | International Business Machines Corp., Armonk | Verfahren und Gerät zur automatischen Verteilung einer Netztopologie in Haupt- und Nebentopologie |
| US5481673A (en) * | 1993-08-20 | 1996-01-02 | Bell Communications Research Inc. | Method for cluster routing in direct link using two associated routing tables at node or signaling transfer point |
| US5519694A (en) * | 1994-02-04 | 1996-05-21 | Massachusetts Institute Of Technology | Construction of hierarchical networks through extension |
| US5418779A (en) * | 1994-03-16 | 1995-05-23 | The Trustee Of Columbia University Of New York | High-speed switched network architecture |
| US5453978A (en) * | 1994-04-04 | 1995-09-26 | International Business Machines Corporation | Technique for accomplishing deadlock free routing through a multi-stage cross-point packet switch |
| US5603044A (en) * | 1995-02-08 | 1997-02-11 | International Business Machines Corporation | Interconnection network for a multi-nodal data processing system which exhibits incremental scalability |
| US5745703A (en) * | 1995-07-18 | 1998-04-28 | Nec Research Institute, Inc. | Transmission of higher-order objects across a network of heterogeneous machines |
| JP3698761B2 (ja) * | 1995-07-19 | 2005-09-21 | 富士通株式会社 | 情報転送方法及び情報転送装置 |
| US5996020A (en) * | 1995-07-21 | 1999-11-30 | National Security Agency | Multiple level minimum logic network |
| DE59510586D1 (de) * | 1995-12-21 | 2003-04-17 | Siemens Ag | Verfahren zum Bilden von Leitweginformation in einem ATM-Kommunikationsnetz |
| EA199900007A1 (ru) * | 1996-06-10 | 1999-08-26 | Ипок Коммьюникейшнз Корпорейшн | Цифровая сеть связи |
| US5781546A (en) * | 1996-06-25 | 1998-07-14 | International Business Machines Corporation | Route restrictions for deadlock free routing with increased bandwidth in a multi-stage cross point packet switch |
| US5812549A (en) * | 1996-06-25 | 1998-09-22 | International Business Machines Corporation | Route restrictions for deadlock free routing with increased bandwidth in a multi-stage cross point packet switch |
| US6031835A (en) * | 1997-04-04 | 2000-02-29 | International Business Machines Corporation | Method for deadlock free and and reliable routing in a packet switched network |
| US5884090A (en) * | 1997-07-17 | 1999-03-16 | International Business Machines Corporation | Method and apparatus for partitioning an interconnection medium in a partitioned multiprocessor computer system |
| US5887184A (en) * | 1997-07-17 | 1999-03-23 | International Business Machines Corporation | Method and apparatus for partitioning an interconnection medium in a partitioned multiprocessor computer system |
| US6021442A (en) * | 1997-07-17 | 2000-02-01 | International Business Machines Corporation | Method and apparatus for partitioning an interconnection medium in a partitioned multiprocessor computer system |
| JP3973298B2 (ja) * | 1998-07-31 | 2007-09-12 | 富士通株式会社 | 網の経路制御方法及び装置 |
| WO2001001219A2 (en) * | 1999-06-25 | 2001-01-04 | Massively Parallel Computing, Inc. | Massive collective network processing system and methods |
| US7743074B1 (en) * | 2000-04-05 | 2010-06-22 | Microsoft Corporation | Context aware systems and methods utilizing hierarchical tree structures |
| US7096029B1 (en) | 2000-04-05 | 2006-08-22 | Microsoft Corporation | Context aware computing devices having a common interface and related methods |
| US7213048B1 (en) * | 2000-04-05 | 2007-05-01 | Microsoft Corporation | Context aware computing devices and methods |
| US7076255B2 (en) | 2000-04-05 | 2006-07-11 | Microsoft Corporation | Context-aware and location-aware cellular phones and methods |
| US7421486B1 (en) | 2000-04-05 | 2008-09-02 | Microsoft Corporation | Context translation methods and systems |
| US8325761B2 (en) * | 2000-06-26 | 2012-12-04 | Massivley Parallel Technologies, Inc. | System and method for establishing sufficient virtual channel performance in a parallel computing network |
| US7418470B2 (en) * | 2000-06-26 | 2008-08-26 | Massively Parallel Technologies, Inc. | Parallel processing systems and method |
| US7493565B2 (en) | 2000-12-22 | 2009-02-17 | Microsoft Corporation | Environment-interactive context-aware devices and methods |
| US7072956B2 (en) * | 2000-12-22 | 2006-07-04 | Microsoft Corporation | Methods and systems for context-aware policy determination and enforcement |
| US6944679B2 (en) * | 2000-12-22 | 2005-09-13 | Microsoft Corp. | Context-aware systems and methods, location-aware systems and methods, context-aware vehicles and methods of operating the same, and location-aware vehicles and methods of operating the same |
| US6704301B2 (en) * | 2000-12-29 | 2004-03-09 | Tropos Networks, Inc. | Method and apparatus to provide a routing protocol for wireless devices |
| US7856543B2 (en) * | 2001-02-14 | 2010-12-21 | Rambus Inc. | Data processing architectures for packet handling wherein batches of data packets of unpredictable size are distributed across processing elements arranged in a SIMD array operable to process different respective packet protocols at once while executing a single common instruction stream |
| GB2410350B (en) * | 2001-02-14 | 2005-11-09 | Clearspeed Technology Plc | Data processing architectures |
| CA2437661A1 (en) * | 2001-02-24 | 2002-09-06 | International Business Machines Corporation | A global tree network for computing structures |
| US8086738B2 (en) | 2007-05-24 | 2011-12-27 | Russell Fish | Distributed means of organizing an arbitrarily large number of computers |
| US20030009509A1 (en) * | 2001-06-22 | 2003-01-09 | Fish Russell H. | Distributed means of organizing an arbitrarily large number of computers |
| US7532750B2 (en) * | 2002-04-17 | 2009-05-12 | Sony Corporation | Image processing apparatus and method, program, and image processing system |
| US7436775B2 (en) * | 2003-07-24 | 2008-10-14 | Alcatel Lucent | Software configurable cluster-based router using stock personal computers as cluster nodes |
| US7356594B2 (en) * | 2003-10-03 | 2008-04-08 | Motorola, Inc. | Interprocessor communication protocol providing intelligent targeting of nodes |
| US7486619B2 (en) * | 2004-03-04 | 2009-02-03 | International Business Machines Corporation | Multidimensional switch network |
| US7366956B2 (en) * | 2004-06-16 | 2008-04-29 | Hewlett-Packard Development Company, L.P. | Detecting data races in multithreaded computer programs |
| US7757237B2 (en) * | 2004-06-16 | 2010-07-13 | Hewlett-Packard Development Company, L.P. | Synchronization of threads in a multithreaded computer program |
| US20050283770A1 (en) * | 2004-06-18 | 2005-12-22 | Karp Alan H | Detecting memory address bounds violations |
| US7853774B1 (en) * | 2005-03-25 | 2010-12-14 | Tilera Corporation | Managing buffer storage in a parallel processing environment |
| US7856579B2 (en) * | 2006-04-28 | 2010-12-21 | Industrial Technology Research Institute | Network for permutation or de-permutation utilized by channel coding algorithm |
| US7797615B2 (en) * | 2005-07-07 | 2010-09-14 | Acer Incorporated | Utilizing variable-length inputs in an inter-sequence permutation turbo code system |
| US20070011557A1 (en) * | 2005-07-07 | 2007-01-11 | Highdimension Ltd. | Inter-sequence permutation turbo code system and operation methods thereof |
| US8194690B1 (en) * | 2006-05-24 | 2012-06-05 | Tilera Corporation | Packet processing in a parallel processing environment |
| US8108512B2 (en) * | 2006-09-01 | 2012-01-31 | Massively Parallel Technologies, Inc. | System and method for accessing and using a supercomputer |
| US7958194B2 (en) * | 2008-08-25 | 2011-06-07 | Massively Parallel Technologies, Inc. | System and method for parallel processing using a Type I Howard Cascade |
| US10022468B2 (en) * | 2009-02-02 | 2018-07-17 | Kimberly-Clark Worldwide, Inc. | Absorbent articles containing a multifunctional gel |
| US20100251259A1 (en) * | 2009-03-31 | 2010-09-30 | Howard Kevin D | System And Method For Recruitment And Management Of Processors For High Performance Parallel Processing Using Multiple Distributed Networked Heterogeneous Computing Elements |
| US10216692B2 (en) * | 2009-06-17 | 2019-02-26 | Massively Parallel Technologies, Inc. | Multi-core parallel processing system |
| CN102577278B (zh) * | 2009-10-19 | 2016-01-20 | 国际商业机器公司 | 用于分布式集群存储网络的动态资源分配 |
| US8718070B2 (en) | 2010-07-06 | 2014-05-06 | Nicira, Inc. | Distributed network virtualization apparatus and method |
| US9680750B2 (en) | 2010-07-06 | 2017-06-13 | Nicira, Inc. | Use of tunnels to hide network addresses |
| US9262201B2 (en) * | 2011-07-13 | 2016-02-16 | International Business Machines Corporation | Performing collective operations in a distributed processing system |
| DE102012112676A1 (de) * | 2012-12-19 | 2014-06-26 | Universität Regensburg | Hochleistungsnetzwerk mit Nächster-Nachbar-Kommunikation |
| US9448966B2 (en) | 2013-04-26 | 2016-09-20 | Futurewei Technologies, Inc. | System and method for creating highly scalable high availability cluster in a massively parallel processing cluster of machines in a network |
| US9432215B2 (en) | 2013-05-21 | 2016-08-30 | Nicira, Inc. | Hierarchical network managers |
| US9282019B2 (en) | 2013-07-12 | 2016-03-08 | Nicira, Inc. | Tracing logical network packets through physical network |
| US9197529B2 (en) | 2013-07-12 | 2015-11-24 | Nicira, Inc. | Tracing network packets through logical and physical networks |
| US9407580B2 (en) | 2013-07-12 | 2016-08-02 | Nicira, Inc. | Maintaining data stored with a packet |
| US9432204B2 (en) | 2013-08-24 | 2016-08-30 | Nicira, Inc. | Distributed multicast by endpoints |
| US9264330B2 (en) | 2013-10-13 | 2016-02-16 | Nicira, Inc. | Tracing host-originated logical network packets |
| US10193771B2 (en) | 2013-12-09 | 2019-01-29 | Nicira, Inc. | Detecting and handling elephant flows |
| US9967199B2 (en) | 2013-12-09 | 2018-05-08 | Nicira, Inc. | Inspecting operations of a machine to detect elephant flows |
| US9602385B2 (en) | 2013-12-18 | 2017-03-21 | Nicira, Inc. | Connectivity segment selection |
| US9602392B2 (en) | 2013-12-18 | 2017-03-21 | Nicira, Inc. | Connectivity segment coloring |
| US9419889B2 (en) | 2014-03-07 | 2016-08-16 | Nicira, Inc. | Method and system for discovering a path of network traffic |
| US9419874B2 (en) | 2014-03-27 | 2016-08-16 | Nicira, Inc. | Packet tracing in a software-defined networking environment |
| US9794079B2 (en) | 2014-03-31 | 2017-10-17 | Nicira, Inc. | Replicating broadcast, unknown-unicast, and multicast traffic in overlay logical networks bridged with physical networks |
| US9553803B2 (en) | 2014-06-30 | 2017-01-24 | Nicira, Inc. | Periodical generation of network measurement data |
| US9379956B2 (en) | 2014-06-30 | 2016-06-28 | Nicira, Inc. | Identifying a network topology between two endpoints |
| US10469342B2 (en) | 2014-10-10 | 2019-11-05 | Nicira, Inc. | Logical network traffic analysis |
| JP6464739B2 (ja) * | 2014-12-26 | 2019-02-06 | 富士通株式会社 | 情報処理システムの制御プログラム,情報処理装置,及び情報処理システム |
| US9552327B2 (en) | 2015-01-29 | 2017-01-24 | Knuedge Incorporated | Memory controller for a network on a chip device |
| US10061531B2 (en) | 2015-01-29 | 2018-08-28 | Knuedge Incorporated | Uniform system wide addressing for a computing system |
| US10027583B2 (en) | 2016-03-22 | 2018-07-17 | Knuedge Incorporated | Chained packet sequences in a network on a chip architecture |
| US10346049B2 (en) | 2016-04-29 | 2019-07-09 | Friday Harbor Llc | Distributed contiguous reads in a network on a chip architecture |
| US10805239B2 (en) | 2017-03-07 | 2020-10-13 | Nicira, Inc. | Visualization of path between logical network endpoints |
| US10608887B2 (en) | 2017-10-06 | 2020-03-31 | Nicira, Inc. | Using packet tracing tool to automatically execute packet capture operations |
| US10740155B1 (en) * | 2018-09-28 | 2020-08-11 | Cavium, Llc | Methods and systems for load balancing in network devices |
| US10778457B1 (en) | 2019-06-18 | 2020-09-15 | Vmware, Inc. | Traffic replication in overlay networks spanning multiple sites |
| US11283699B2 (en) | 2020-01-17 | 2022-03-22 | Vmware, Inc. | Practical overlay network latency measurement in datacenter |
| GB2594478A (en) * | 2020-04-28 | 2021-11-03 | Cogniscience Ltd | On chip router |
| US11196628B1 (en) | 2020-07-29 | 2021-12-07 | Vmware, Inc. | Monitoring container clusters |
| US11570090B2 (en) | 2020-07-29 | 2023-01-31 | Vmware, Inc. | Flow tracing operation in container cluster |
| US11558426B2 (en) | 2020-07-29 | 2023-01-17 | Vmware, Inc. | Connection tracking for container cluster |
| US11736436B2 (en) | 2020-12-31 | 2023-08-22 | Vmware, Inc. | Identifying routes with indirect addressing in a datacenter |
| US11336533B1 (en) | 2021-01-08 | 2022-05-17 | Vmware, Inc. | Network visualization of correlations between logical elements and associated physical elements |
| US11784922B2 (en) | 2021-07-03 | 2023-10-10 | Vmware, Inc. | Scalable overlay multicast routing in multi-tier edge gateways |
| US11687210B2 (en) | 2021-07-05 | 2023-06-27 | Vmware, Inc. | Criteria-based expansion of group nodes in a network topology visualization |
| US11711278B2 (en) | 2021-07-24 | 2023-07-25 | Vmware, Inc. | Visualization of flow trace operation across multiple sites |
| US11855862B2 (en) | 2021-09-17 | 2023-12-26 | Vmware, Inc. | Tagging packets for monitoring and analysis |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0162970B1 (en) * | 1984-06-01 | 1989-01-25 | BELL TELEPHONE MANUFACTURING COMPANY Naamloze Vennootschap | Multiple memory loading system |
| CA1245327A (en) * | 1985-09-06 | 1988-11-22 | Northern Telecom Limited | Path oriented routing system and method for packet switching networks |
| GB2201066B (en) * | 1986-11-14 | 1991-08-21 | Fuji Xerox Co Ltd | Storage star network |
| US4740954A (en) * | 1986-12-31 | 1988-04-26 | Bell Communications Research, Inc. | Multicast routing algorithm |
| US4809362A (en) * | 1987-03-13 | 1989-02-28 | Center For Innovative Technology | Fiber-optic star tree network |
| DE3838945A1 (de) * | 1987-11-18 | 1989-06-08 | Hitachi Ltd | Netzwerksystem mit lokalen netzwerken und mit einer hierarchischen wegewahl |
| US5105424A (en) * | 1988-06-02 | 1992-04-14 | California Institute Of Technology | Inter-computer message routing system with each computer having separate routinng automata for each dimension of the network |
| WO1989012861A1 (en) * | 1988-06-20 | 1989-12-28 | United States Department Of Energy | Interconnection networks |
| US5088091A (en) * | 1989-06-22 | 1992-02-11 | Digital Equipment Corporation | High-speed mesh connected local area network |
| US5117430A (en) * | 1991-02-08 | 1992-05-26 | International Business Machines Corporation | Apparatus and method for communicating between nodes in a network |
-
1991
- 1991-05-09 US US07/697,556 patent/US5224100A/en not_active Expired - Fee Related
-
1992
- 1992-04-09 JP JP4511818A patent/JPH06507744A/ja active Pending
- 1992-04-09 EP EP92912852A patent/EP0583400A4/en not_active Withdrawn
- 1992-04-09 WO PCT/US1992/002668 patent/WO1992020177A1/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| EP0583400A1 (en) | 1994-02-23 |
| US5224100A (en) | 1993-06-29 |
| WO1992020177A1 (en) | 1992-11-12 |
| EP0583400A4 (en) | 1995-02-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH06507744A (ja) | 大量並列プロセッサ間の、階層的プロセッサ相互間通信ネットワークのための手順決定技術 | |
| US5797035A (en) | Networked multiprocessor system with global distributed memory and block transfer engine | |
| EP0334954B1 (en) | Layered network | |
| US5566342A (en) | Scalable switch wiring technique for large arrays of processors | |
| US20050044195A1 (en) | Network topology having nodes interconnected by extended diagonal links | |
| JPH05324590A (ja) | 並列処理のための相互接続網、コンピュータ・システム及び方法 | |
| EP0239618A1 (en) | Mesh-based switching network | |
| JPS62500902A (ja) | パケット・スイッチド・マルチポ−ト・メモリn×mスイッチ・ノ−ド及び処理方法 | |
| Premkumar et al. | Design and implementation of the banyan interconnection network in TRAC | |
| Xie et al. | Mesh-of-Torus: a new topology for server-centric data center networks: P. Xie et al. | |
| US20210342284A1 (en) | Networked Computer With Multiple Embedded Rings | |
| Sakai et al. | Design and implementation of a circular omega network in the EM-4 | |
| US20160285741A1 (en) | Efficient High-Radix Networks for Large Scale Computer Systems | |
| JP4613296B2 (ja) | スケーラブルな多重経路ワームホール相互接続網 | |
| JP2936868B2 (ja) | アレイプロセッサのメッセージパケットルーティング方法 | |
| US7751344B2 (en) | Computer system and method using a kautz-like digraph to interconnect computer nodes and having control back channel between nodes | |
| Davis IV et al. | The performance analysis of partitioned circuit switched multistage interconnection networks | |
| Wilkinson | Overlapping connectivity interconnection networks for shared memory multiprocessor systems | |
| Alleyne et al. | Lowest common ancestor interconnection networks | |
| Jahanshahi et al. | Interconnection Networks | |
| Yang et al. | Adaptive wormhole routing in k-ary n-cubes | |
| Swartzlander et al. | A routing algorithm for signal processing networks | |
| Li et al. | Mirrored K‐Ary N‐Tree and its efficiency of fault tolerance | |
| Smitley et al. | Comparative analysis of hill climbing mapping algorithms | |
| Ganesan | The hyper-deBruijn topology: a new scalable versatile fault-tolerant architecture for multicomputers |