JPH03186963A - 計算機の結合方法 - Google Patents
計算機の結合方法Info
- Publication number
- JPH03186963A JPH03186963A JP1325559A JP32555989A JPH03186963A JP H03186963 A JPH03186963 A JP H03186963A JP 1325559 A JP1325559 A JP 1325559A JP 32555989 A JP32555989 A JP 32555989A JP H03186963 A JPH03186963 A JP H03186963A
- Authority
- JP
- Japan
- Prior art keywords
- links
- pes
- hypercube
- distance
- aggregate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、複数の処理要素(以下、PEと呼ぶ)をリン
クにより相互に結合して成るいわゆるメツセージパッシ
ング型の並列計算機結合網に係り、特にPE間の結合数
(リンクの数)を少なく保つま た上で高性能化するのに好適な計算機の結合方法に関す
る。
クにより相互に結合して成るいわゆるメツセージパッシ
ング型の並列計算機結合網に係り、特にPE間の結合数
(リンクの数)を少なく保つま た上で高性能化するのに好適な計算機の結合方法に関す
る。
従来、PE間を一対一緒合であるリンクにより相互に結
合する形態の並列計算機結合網には、PEを2進本状に
結合したトリー結合、2次元格子状に結合した2次元ア
レイ結合、PEの番号を2進表示したときそのピントパ
ターンが1ビツトだけ異なるPE同志を全て結合するい
わゆるハイパキューブ結合等がある。
合する形態の並列計算機結合網には、PEを2進本状に
結合したトリー結合、2次元格子状に結合した2次元ア
レイ結合、PEの番号を2進表示したときそのピントパ
ターンが1ビツトだけ異なるPE同志を全て結合するい
わゆるハイパキューブ結合等がある。
このような結合網においては、直接リンクにより結合さ
れていないPEに対する通信はいくつかのPEを中継し
て行われるため、この中継数が少ない事が要求される。
れていないPEに対する通信はいくつかのPEを中継し
て行われるため、この中継数が少ない事が要求される。
又、更に結合が対称形であり、通信が特定のリンクに集
中しないことが要求される。こういった要求から、最近
はハイパキューブ結合が注目され、いくつかのマシンが
実用化されてきている。第4図にPE数が8のときのハ
イパキューブ結合を示す。
中しないことが要求される。こういった要求から、最近
はハイパキューブ結合が注目され、いくつかのマシンが
実用化されてきている。第4図にPE数が8のときのハ
イパキューブ結合を示す。
ハイパキューブ結合では、PE数をNとしたとき、各P
Eはlog2N個のPEと直接リンクで結合され、又、
Pu間通信における中継数の最大値である最大I) E
開路HD (直径とも呼ばれる)も]、og2Nとなる
。このように、ハイパキューブ結合は、比較的少ないリ
ンク数(PE当りlog2N本)で最大PE間距離りを
小さくできる特徴を有する。
Eはlog2N個のPEと直接リンクで結合され、又、
Pu間通信における中継数の最大値である最大I) E
開路HD (直径とも呼ばれる)も]、og2Nとなる
。このように、ハイパキューブ結合は、比較的少ないリ
ンク数(PE当りlog2N本)で最大PE間距離りを
小さくできる特徴を有する。
しかし、PE数Nが例えば103〜104あるいはそれ
以上といった高並列計算機では、PE当りのリンク数し
、最大PE間距離り共に小さいとは言えなくなる。すな
わち、リンク数の増加により実装上のPE間の接続処理
が難しくなり、また最大PE間距離の増大により通信遅
延がシステム全体の性能を制限することになるという問
題がある。
以上といった高並列計算機では、PE当りのリンク数し
、最大PE間距離り共に小さいとは言えなくなる。すな
わち、リンク数の増加により実装上のPE間の接続処理
が難しくなり、また最大PE間距離の増大により通信遅
延がシステム全体の性能を制限することになるという問
題がある。
尚、これに対し、 K、Hwang等はHyperne
tと呼ばれる結合構成を提案しく K 、Hwang、
et al、 : “Hypernet : A
Communjcation−Effjcient A
rchj、tecture For Construc
tingMassively Parallel Co
mputers”、 I E E E Trans、
Comput。
tと呼ばれる結合構成を提案しく K 、Hwang、
et al、 : “Hypernet : A
Communjcation−Effjcient A
rchj、tecture For Construc
tingMassively Parallel Co
mputers”、 I E E E Trans、
Comput。
Vol、C−36,N[112,PP、1450−14
663 (上987))、また、F、 P 、 Prepara
ta等はCCCと呼ばれる結合構成を提案しているが(
F。
663 (上987))、また、F、 P 、 Prepara
ta等はCCCと呼ばれる結合構成を提案しているが(
F。
P 、 Praparata+ at al−、: “
’I’he Cube−Connected Cycl
es : A Versatile Network
for Parallel Computations
、 Commum、 ACM、 pp。
’I’he Cube−Connected Cycl
es : A Versatile Network
for Parallel Computations
、 Commum、 ACM、 pp。
300−309 (1981))、これらは共にリンク
数を削減しているものの最大PE間距離については削減
できていない。
数を削減しているものの最大PE間距離については削減
できていない。
このように従来技術では、一般にリンク数、最大PE間
距離を同時に小さくすることは困難であり、これらが比
較的小さいハイパキューブ結合でもPE数が大きい場合
にはこれらが充分小さいとは言えず、システム実現上あ
るいはシステム性能」二問題があった。
距離を同時に小さくすることは困難であり、これらが比
較的小さいハイパキューブ結合でもPE数が大きい場合
にはこれらが充分小さいとは言えず、システム実現上あ
るいはシステム性能」二問題があった。
本発明の目的は、より少ないリンク数でより小さな最大
PE間距離を達成できる並列計算機のPE間結合方法を
提供することにある。
PE間距離を達成できる並列計算機のPE間結合方法を
提供することにある。
上記l」的を達成するために、本発明では、複数のPE
をリンクによりハイパキューブ状に結合す− ると共に、その最大PE間距離を有するPE間同志にリ
ンクを付加したPE群を−っのPE集合体として、該P
E集合体を複数配置し、各PE集合体間を相互に完全結
合して並列計算機を構成する。
をリンクによりハイパキューブ状に結合す− ると共に、その最大PE間距離を有するPE間同志にリ
ンクを付加したPE群を−っのPE集合体として、該P
E集合体を複数配置し、各PE集合体間を相互に完全結
合して並列計算機を構成する。
このような並列計算機結合網では、最大PE間距111
1Dは、ベースとなるハイパキューブ結合でのPE数を
Mとすると、全PE数Nには依存せず、D = 1 +
log、M (log2Mが奇数のときは、D=2+
log2M )となる。又、PE当りに必要なリンク数
りは、L = 2 +log2Mとなる。すなわち、従
来の単なるハイパキューブ結合の最大PE間距離および
リンク数に比べ大幅に小さな値にすることができる。
1Dは、ベースとなるハイパキューブ結合でのPE数を
Mとすると、全PE数Nには依存せず、D = 1 +
log、M (log2Mが奇数のときは、D=2+
log2M )となる。又、PE当りに必要なリンク数
りは、L = 2 +log2Mとなる。すなわち、従
来の単なるハイパキューブ結合の最大PE間距離および
リンク数に比べ大幅に小さな値にすることができる。
以下、本発明の一実施例について図面により説明する。
第1図は本発明による並列計算機結合網の一実施例の概
略構成を示したものである。第1図中、1はPE集合体
、2はPE集合体間結合用リンク− である。実施例では、一つのPE集合体は8個のPEで
構成されるとする。第1図は、このようなPE集合体1
を9個配置し、相互にPE集合体間結合用リンク2によ
り完全結合して並列計算機結合網を構成したものである
。従って、該並列計算機結合網は合計72個のPEから
なる。
略構成を示したものである。第1図中、1はPE集合体
、2はPE集合体間結合用リンク− である。実施例では、一つのPE集合体は8個のPEで
構成されるとする。第1図は、このようなPE集合体1
を9個配置し、相互にPE集合体間結合用リンク2によ
り完全結合して並列計算機結合網を構成したものである
。従って、該並列計算機結合網は合計72個のPEから
なる。
第2図は第1図中の一つのPE集合体1の詳細構成図で
、8個のPEIIをリンクエ2によりハイパキューブ状
に結合し、更に、最大PE間isを有するPE間同志に
、バイパス用すンク王3を付加した構成となっている。
、8個のPEIIをリンクエ2によりハイパキューブ状
に結合し、更に、最大PE間isを有するPE間同志に
、バイパス用すンク王3を付加した構成となっている。
第2図において、(OOO)〜(111)は8個のPE
の番号を2進表示で示したもので、バイパス用リンク1
3は(000)と(111)、(001)と(110)
、(010)と(101)、(olz)と(100)の
PE間に設けられる。すなわち、あるPEの番号を2進
表示したとき(ao+ alr a2+・・・an−1
)とすると、このPEは(a 01 a 11 a 2
1 ”’ a n−0)の番号のPEにバイパス用リン
クで結合される。
の番号を2進表示で示したもので、バイパス用リンク1
3は(000)と(111)、(001)と(110)
、(010)と(101)、(olz)と(100)の
PE間に設けられる。すなわち、あるPEの番号を2進
表示したとき(ao+ alr a2+・・・an−1
)とすると、このPEは(a 01 a 11 a 2
1 ”’ a n−0)の番号のPEにバイパス用リン
クで結合される。
第3図は一つのPEの概略構成であり、CPU6−
1 ]、 1、メモリ112、及び複数の入出力(Il
o)ポートエ1−3よりなる。本例の場合、入出力ボー
ト113は5つ必要となる。
o)ポートエ1−3よりなる。本例の場合、入出力ボー
ト113は5つ必要となる。
第2図に示すように、ベースとなるPE集合体のハイパ
キューブにバイパス用リンクを付加すると、各PEのリ
ンクの数は1本増加するが、そのハイパキューブの最大
PE間距離は1/2に削減され、一般にはハイパキュー
ブ内のPE数をMとすると(]、og2M ) / 2
となる(]、og2Mが奇数のときは、 (1+log
2M) / 2となる)。なぜなら、通信元PEと通信
先PEとのPE間距離(それらを2進表示したとき異な
るビットの数に等しい)が(LogzM ) / 2以
下であれば、ハイパキューブのリンクを使って順に中継
していけば良く、それ以」二のときにはバイパス用リン
クを用いて一担最遠のPEを中継し、それから順次ハイ
パキューブ用のリンクを用いて中継すればよいからであ
る。
キューブにバイパス用リンクを付加すると、各PEのリ
ンクの数は1本増加するが、そのハイパキューブの最大
PE間距離は1/2に削減され、一般にはハイパキュー
ブ内のPE数をMとすると(]、og2M ) / 2
となる(]、og2Mが奇数のときは、 (1+log
2M) / 2となる)。なぜなら、通信元PEと通信
先PEとのPE間距離(それらを2進表示したとき異な
るビットの数に等しい)が(LogzM ) / 2以
下であれば、ハイパキューブのリンクを使って順に中継
していけば良く、それ以」二のときにはバイパス用リン
クを用いて一担最遠のPEを中継し、それから順次ハイ
パキューブ用のリンクを用いて中継すればよいからであ
る。
例えば、16個のPEからなるハイパキューブで(00
00)のP Eから(01−1,1)のPEに通信する
場合には、(OOOO)のPEつバイパスリング→(1
工11)のPE−>ハイパキューブのリンク−>(01
41)のPE、というルートで通信でき、最大PE間距
離は(1,ogz工6)/2=2となる。第2図の場合
には、M、=8でLogzMが奇数なので、PE集合体
内の最大PE間距離は2である。すなわち、本発明では
、PE集合体内では各PEはいずれのPEとも距Ml
(1,ogzM) / 2(または(1+log2M)
/ 2)で通信でき、ベースとしたハイパキューブの
最大■〕E間距離を1/2に削減している。
00)のP Eから(01−1,1)のPEに通信する
場合には、(OOOO)のPEつバイパスリング→(1
工11)のPE−>ハイパキューブのリンク−>(01
41)のPE、というルートで通信でき、最大PE間距
離は(1,ogz工6)/2=2となる。第2図の場合
には、M、=8でLogzMが奇数なので、PE集合体
内の最大PE間距離は2である。すなわち、本発明では
、PE集合体内では各PEはいずれのPEとも距Ml
(1,ogzM) / 2(または(1+log2M)
/ 2)で通信でき、ベースとしたハイパキューブの
最大■〕E間距離を1/2に削減している。
以上のように構成したPE集合体を複数個配置し、第1
図に示すように、各々のPE集合体を一つのPEとみな
したとき、それらが完全結合を構成するように結合する
。この完全結合を実現するため、第2図に示すように、
PE集合体内の各PEt1にはP E集合体間結合用リ
ンク2を設けておく。
図に示すように、各々のPE集合体を一つのPEとみな
したとき、それらが完全結合を構成するように結合する
。この完全結合を実現するため、第2図に示すように、
PE集合体内の各PEt1にはP E集合体間結合用リ
ンク2を設けておく。
このように構成することにより、あるPE集合体から他
の全てのPE集合体へ距離上で到達できる。従って、I
? E間の通信は最悪でも、通信元PEが属するPE集
合体内での中継、PE集合体間の中継、通信先PEが属
するPE集合体内での中継の組合せで実現される。すな
わち、本発明による結合網の最大PE間開路lIDは、
PE集合体内の各PE間の距離が最大(log、 M
) / 2であるから、D= (LogzM)/2+1
+ (LogzM)/2=1(logzM (Logz
Mが奇数のときは2 十]、og、 M )となる。例
えば、第工図および第2図の実施例ではD=5となる。
の全てのPE集合体へ距離上で到達できる。従って、I
? E間の通信は最悪でも、通信元PEが属するPE集
合体内での中継、PE集合体間の中継、通信先PEが属
するPE集合体内での中継の組合せで実現される。すな
わち、本発明による結合網の最大PE間開路lIDは、
PE集合体内の各PE間の距離が最大(log、 M
) / 2であるから、D= (LogzM)/2+1
+ (LogzM)/2=1(logzM (Logz
Mが奇数のときは2 十]、og、 M )となる。例
えば、第工図および第2図の実施例ではD=5となる。
又、PE当りのリンク数りはベースとなるハイパキュー
ブにおけるPEのリンク数、バイパス用のリンク数、P
E集合体間結合用のリンク数の合計であり、L = l
og7M十王+↓=2+log2Mとなる。例えば、実
施例の場合にはL=5となる。すなわち、第1図および
第2図の実施例では、72個をPEt−PE当り5本の
リンクにより最大PE間距離5で結合している。これは
64個のPEからなるハイパキューブの場合のリンク数
6、最大PE間開路6と比べ小さな値である(実施例で
PE集合体の数を8個にすれば64個のシステムを9 構成でき、この時のDとLはやはり5である)。
ブにおけるPEのリンク数、バイパス用のリンク数、P
E集合体間結合用のリンク数の合計であり、L = l
og7M十王+↓=2+log2Mとなる。例えば、実
施例の場合にはL=5となる。すなわち、第1図および
第2図の実施例では、72個をPEt−PE当り5本の
リンクにより最大PE間距離5で結合している。これは
64個のPEからなるハイパキューブの場合のリンク数
6、最大PE間開路6と比べ小さな値である(実施例で
PE集合体の数を8個にすれば64個のシステムを9 構成でき、この時のDとLはやはり5である)。
尚、以上の実施例では、P E集合体の数を、ベースと
なるハイパキューブのPE集合体間結合用リンクが全て
使われるように設定したが(PE集合体の数=ベースと
なるハイパキューブのIJ E数+1)、一般にPE集
合体の数はこれ以下でも以上(尚、以上とするときには
各PE当りのPE集合体結合用リンクは一本でなく複数
にする必要がある)でも良いことは言うまでもない、但
し、その場合には全PE間の結合が完全な対称形とはな
らない事になる。
なるハイパキューブのPE集合体間結合用リンクが全て
使われるように設定したが(PE集合体の数=ベースと
なるハイパキューブのIJ E数+1)、一般にPE集
合体の数はこれ以下でも以上(尚、以上とするときには
各PE当りのPE集合体結合用リンクは一本でなく複数
にする必要がある)でも良いことは言うまでもない、但
し、その場合には全PE間の結合が完全な対称形とはな
らない事になる。
以上説明したように、本発明によれば、複数のPEから
なるハイパキューブ結合にバイパス用リンクを付加して
1つのPE集合体を構成し、このPE集合体を複数個設
け、その間を完全結合して並列PE結合網を構成するた
め、PE当りのリンク数を少なく保ったうえで最大PE
間距離を小さくできる。この効果は、PE数が多いシス
テム程顕著である。例えば、4096個のPEからなる
0 並列計算機は、ハイパキューブ結合の場合にはPE当り
のリンク数、最大PE間距離はともに12であるが、本
発明では1つのPE数を64、PE集合体の数を64と
すると、PE当りのリンク数は8、最大PE間距離は7
となる。
なるハイパキューブ結合にバイパス用リンクを付加して
1つのPE集合体を構成し、このPE集合体を複数個設
け、その間を完全結合して並列PE結合網を構成するた
め、PE当りのリンク数を少なく保ったうえで最大PE
間距離を小さくできる。この効果は、PE数が多いシス
テム程顕著である。例えば、4096個のPEからなる
0 並列計算機は、ハイパキューブ結合の場合にはPE当り
のリンク数、最大PE間距離はともに12であるが、本
発明では1つのPE数を64、PE集合体の数を64と
すると、PE当りのリンク数は8、最大PE間距離は7
となる。
すなわち1本発明によれば、ハイパキューブ結合より少
ないリンク数で最大PE間距離をそれ以下にできる利点
があり、ひいては高並列計算機の実現性を高め、かつそ
の通信遅延を小さくできることになる。
ないリンク数で最大PE間距離をそれ以下にできる利点
があり、ひいては高並列計算機の実現性を高め、かつそ
の通信遅延を小さくできることになる。
第1図は本発明による並列計算機結合網の一実施例の概
略構成図、第2図は第1図における1つのPE集合体の
詳細構成図、第3図は1つのPEの概要を示す図、第4
図はハイパキューブ結合の構成例を示す図である。 l・・・PE集合体、 2・・・PE集合体間結合用リンク、 11・・・PE(処理要素)。 12・・・ハイパキューブ用リンク、 11− 13・・・バイパス用リンク。 =12=
略構成図、第2図は第1図における1つのPE集合体の
詳細構成図、第3図は1つのPEの概要を示す図、第4
図はハイパキューブ結合の構成例を示す図である。 l・・・PE集合体、 2・・・PE集合体間結合用リンク、 11・・・PE(処理要素)。 12・・・ハイパキューブ用リンク、 11− 13・・・バイパス用リンク。 =12=
Claims (1)
- (1)複数の処理要素(以下、PEと呼ぶ)をリンクに
よりハイパキューブ状に結合すると共に、その最大PE
間距離を有するPE間同志にリンクを付加したPE群を
一つのPE集合体として、該PE集合体を複数配置し、
各PE集合体間を、各々のPE集合体を一つのPEとみ
なしたとき相互に完全結合を構成するように結合し、該
完全結合を実現するリンクは各PE集合体内のPEに均
一に結合することを特徴とする計算機の結合方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1325559A JPH03186963A (ja) | 1989-12-15 | 1989-12-15 | 計算機の結合方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1325559A JPH03186963A (ja) | 1989-12-15 | 1989-12-15 | 計算機の結合方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03186963A true JPH03186963A (ja) | 1991-08-14 |
Family
ID=18178250
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1325559A Pending JPH03186963A (ja) | 1989-12-15 | 1989-12-15 | 計算機の結合方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03186963A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010079912A (ja) * | 1997-10-10 | 2010-04-08 | Altera Corp | プロセッサアレイ及びその形成方法 |
| WO2012056547A1 (ja) * | 2010-10-28 | 2012-05-03 | 富士通株式会社 | 情報処理システム、ルーティング方法及びプログラム |
-
1989
- 1989-12-15 JP JP1325559A patent/JPH03186963A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010079912A (ja) * | 1997-10-10 | 2010-04-08 | Altera Corp | プロセッサアレイ及びその形成方法 |
| JP2012133793A (ja) * | 1997-10-10 | 2012-07-12 | Altera Corp | プロセッサアレイ及びその形成方法 |
| WO2012056547A1 (ja) * | 2010-10-28 | 2012-05-03 | 富士通株式会社 | 情報処理システム、ルーティング方法及びプログラム |
| JPWO2012056547A1 (ja) * | 2010-10-28 | 2014-03-20 | 富士通株式会社 | 情報処理システム、ルーティング方法及びプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4676463B2 (ja) | 並列計算機システム | |
| US10409766B2 (en) | Computer subsystem and computer system with composite nodes in an interconnection structure | |
| US5170482A (en) | Improved hypercube topology for multiprocessor computer systems | |
| GB2140589A (en) | An array of a plurality of processing elements | |
| JPH0877128A (ja) | スケーラブル並行処理ネットワーク及びノードの相互接続方法 | |
| Finkel | Processor interconnection strategies | |
| EP3973406A1 (en) | Embedding rings on a toroid computer network | |
| US5765015A (en) | Slide network for an array processor | |
| JPH03186963A (ja) | 計算機の結合方法 | |
| CN110210102A (zh) | 仿生自修复硬件分布式全局动态布线系统 | |
| CN108768864B (zh) | 一种易拓展高容错的数据中心网络拓扑系统 | |
| JPH05233566A (ja) | アレイプロセッサのルーティング方法 | |
| JP3532102B2 (ja) | 間接ローテータグラフネットワーク及び間接ローテータグラフネットワークにおける伝送経路の設定方法 | |
| Li | Multicast router with fault tolerance mechanism for large-scale neuromorphic computing system | |
| CN120017616B (zh) | 一种互连系统 | |
| KR0170496B1 (ko) | 병렬처리 컴퓨터 시스템에서 크로스바 스위치를 사용한 클러스터 연결구조 | |
| CN119945970B (zh) | 基于3-元n-立方体的互连网络上数据的并行传输方法 | |
| JPH07114515A (ja) | 同期通信用ネットワークを有する分散メモリ計算機 | |
| CN110445574A (zh) | 一种基于超图结构的光网络传输方法及系统 | |
| Chalasani et al. | Fault-tolerance with multimodule routers | |
| CN114185832B (zh) | 一种加速组件、加速装置以及电子设备 | |
| JPS60175175A (ja) | 並列デ−タ処理装置 | |
| Soviš | Uniform theory of the shuffle-exchange type permutation networks | |
| Kim et al. | On a class of concatenated (2log/sub 2/N-1)-stage interconnection networks | |
| CN116795768A (zh) | 一种存算一体智能计算架构高并行通信规划方法 |