JPH01147767A

JPH01147767A - 双カスケード型並列処理方式

Info

Publication number: JPH01147767A
Application number: JP30561987A
Authority: JP
Inventors: Ikuo Yoshihara; 郁夫吉原; Akira Muramatsu; 晃村松; Kazuo Nakao; 中尾　和夫
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1987-12-04
Filing date: 1987-12-04
Publication date: 1989-06-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、電子計算機を用いる演算処理方式に係り、特
に、多数の要素プロセッサ（ＰＥ：Ｐｒｏｃｅｓｓｏｒ
　Ｅｌｅｍｅｎｔ）から成る並列計算機に於いて、各Ｐ
Ｅに分散記憶されたデータを参照する演算を。

効率よく処理する方法に関するものである。

〔従来の技術〕

多数の要素プロセッサから成る並列計算機のプロセッサ
間結合方式としては、・格子状結合方式・ハイパーキューブ（超立方格子）結合方式・行列クロ
スバ・スイッチ結合方式（たとえば、特願昭６１−２６
９６５５号参府）などがある。偏微分方程式を離散化して並列計算機で解
く場合、解析対象とする空間を複数の部分空間に分け、
各ＰＥに部分空間（これは１個又は複数個の格子点を含
む）に含まれる格子点の処理をさせるのが一般的である
。従って、データ（変数の値）は、各ＰＥに付随する記
憶装置に、少しずつ分散的に記憶させるのが自然である
。このようなデータ割当は、偏微分方程式の求解に限ら
ず、画像処理など多量のデータ処理を行う問題でしばし
ば生ずる。

ところで計算の過程では、全部又は一部のＰＥに分散さ
れたデータを参照するため、計算順序が可換であるにも
拘らず、逐次処理せざるを得ない計算がしばしば現われ
る９代表的な例として、・総和計算　　Ｘｓｕｍ＝Σｉ
　Ｘ　１・内積計算　　＜ｘ、ｙ＞＝Σ１ｘ１ｙｔ・最
大値探索　Ｘｍａｘ＝ｍａｘ（ｘｉｈ＝１ｙ２＋−−）
・最大値探索　Ｘｍｉｎ＝ｍｉｘ（ｘ　＊　ｌ　ｉ＝　
ｌ　ｅ　２　＋・・・・・・）がある。ただし、Σ１は
ｉに関する和である。ここでは、これらを総称して「総
和型計算」と呼ぶ。

並列計算機で総和型計算を行なう代表的な方法に、カス
ケード・サム（Ｃａｓｃａｄｅ　Ｓｕｍ）がある、たと
えば、Ｒ，Ｗ、ホツキニー、Ｃ，Ｒ，ジエソツペ著：　
「並列計算機」（共立出版（１９８４）ｐ、ｐ。

２０３〜２０７）参照。これは、次の手順で総和をとる
方法である。即ち、■２個ずつのデータの部分和をとる
。次に■２個ずつの部分和に対して再び部分和をとる。

以下、■の操作を繰返すと総和が得られる。

カスケード・サムによれば、Ｎ個のデータの総和は、ｎ
ステップの演算で処理することが出来る（ｎ　＝　ｌ　
１ｏｇｚＮ　ｌ↑で、１・・・ｌ↑は切り上げの記号、
ステップとは１対の部分和をとる操作を言う）。

従って、すべて逐次処理する場合に比べ、計算時間はｎ
　／　Ｎに短縮され効率的である（／は除算の記号）。

例えば、Ｎ＝２１０＝１０２４台のとき。

計算時間は０．９８％に短縮されたことになる。

〔発明が解決しようとする問題点〕

しかし、カスケード・サムは、２個ずつの部分和をとる
操作を繰り返すため、使用しないＰＥが多数発生する。

即ち、第１ステツプでは全体の１／２のＰＥが働かず、
第２ステツプでは全体の３／４のＰＥが働かず、第３ス
テツプでは全体の７／８のＰＥが働かない・・・・・・
と言う状況が生じ、ＰＥの稼働率は（Ｎ−１）／（ｎ申
Ｎ）となる（申は乗算の記号）。例えば、Ｎ＝２１０＝
１０２４台のとき、ＰＥの稼働率は、９．９９％に過ぎ
ない。

数値シミュレーションでは、総和型計算がたびたび現わ
れるから、稼働率の向上が望まれる。

〔問題を解決するための手段及び作用〕現実の問題では
、総和型計算が、複数個同時に必要なことが屡々ある。

本発明では、複数個の総和型計算を、同時に進行させる
ことにより、ＰＥの稼動率向上を図る。

例えば、２組の総和Ｘ　８１１１１１　：ΣｒＸｉ　と
Ｙｓｕｍ＝Σｉｙｔを求める場合、隣同士のＰＥのデー
タを対にして番号の大きい方のＰＥを使ってＸｓｕｍ＝
Σ１ｘ１の部分和を求める。一方、同じ隣同士のＰＥの
データを対にして出発し、常に番号の小さい方のＰＥを
使って、Ｙｓｕｍ＝Σｔｙｔ　を求める・このようにす
ると、Ｘ　ｓｕｍを求める計算とＹ　ｓｕｍを求める計
算とを、同時に進行させることが出来る。

〔実施例〕

以下１本発明の一実施例を第１図〜第３図により説明す
る。第３ｒＭは、本発明の処理方式を適用する、行列ク
ロスバ・スイッチ結合方式の並列計算機の構成図である
。

ホスト計算機１は、アレイ・コントローラ２を介して、
ＰＥ３へのプログラムのロード、データの転送、スカラ
ー演算処理、演算の進行管理を行なう。アレイ・コント
ローラ２は、上記機能のほか、ＰＥ３からホスト計算機
１へのデータ転送、ＰＥ３から周辺装置７へのデータ転
送（例えば、磁気ディスクへの書き込み）の制御を行う
。ＰＥ３は、数値演算、及びＰＥへのデータの送信と受
信を行なう要素プロセッサであり、記憶装置も内蔵して
いる。ＰＥは横方向にＬ＝２ＡＱ台、縦方向にＭ＝２Ａ
ｍ台、合計Ｎ＝Ｌ傘Ｍ台並んでいる（′は巾乗の記号、
Ｑ、ｍは正整数）。第３図に示したのは、Ｑ＝ｍ＝２で
１６台のＰＥからなる並列計算機の構成の例である。個
々のＰＥは２次元的に付された番号（ｉｔ　ｊ）により
識別される。

ただし、ｉ＝１．２．・・・・・・ｅ　Ｌ、ｊ＝１−＋
　２・・・・・・。

Ｍ。行うロスバ・スイッチ４は、横方向に並んだＰＥ間
のデータ転送路であり、それぞれのチャンネルに対し入
力ポート出力ポートを持ち、並列度りである。即ち、同
じ行に属するＬ台のＰＥは、それぞれ同時にデータを受
ける取ることが出来る。

ただし、１台のＰＥが同時に２力所以上からデータを受
は取ることはできない。列クロスバ・スイッチ５は、縦
方向に並んだＰＥ間のデータ転送路であり、並列度Ｍで
ある。即ち、同じ列に属するＭ台のＰＥは、それぞれ同
時にデータを受は取ることが出来る。クラスタ・メモリ
６は、縦並びのＰ’Ｅ３毎に共有する外部記憶装置であ
る。周辺装置７は、入出力装置、外部記憶装置などであ
る。

上記並列計算機を用いて、各ＰＥに付随する記憶装置に
入っているデータを参照する。一対の総和計算を並列に
実行する方法を説明する。ＰＲ（＋、ａ）に付随する記
憶装置に入っているデータをｘ（ｔ＊ＪＬｙ（ｉｔａ）
と記す。各ＰＥの持っＸｐＶは高々１個とする。もしＰ
Ｅが複数個のＸまたはｙを持つ場合は、各ＰＥごとに、
自ＰＥが受は持つデータについての部分和を求め、それ
を改めて！（１，Ｊ）。

ｙ（ｉ、ａ）と置けばよい。また、Ｐ　Ｅ　（ｉｙＪ）
にデータがないときは、値がＯのデータがあると見做す
。

Ｘｓｕｍ＝：ΣｔＪｘ（ｔｔａ）＝ΣＪ（Σ、Ｘ（、、
、））の様に考え、初めにｉについての和をとり１次に
ｊについての和をとる。ΣＩＪはｉとｊに関する二重布
である。ｉについての和は、ＰＥの横方向の並びの和で
あり、「賃料」と呼ぶ。ｊについての和を「死相」と呼
ぶ。

賃料をとるため、まずデータを横方向に転送する。ｉが
奇数番のＰＥはデータＸを右隣のＰＥに送り、ｉが偶数
番のＰＥはデータＸを左隣のＰＥに送る。即ち、Ｐ　Ｅ
　（ｘ、Ｊ）はＰ　Ｅ　（ｚ、−）に！（１，Ｊ）を送
り、Ｐ　Ｅ　（ｓｅａ）はｐ　Ｅ（ａｔａ）にＸ（Ｊｌ
、Ｊ）　　を送る。　Ｐ　Ｅ　（ｚ、Ｊ）はＰＥ（１ｅ
ａ）にｙ（ａｅａ）を送り、Ｐ　Ｅ　（４？　Ｊ）はＰ
　Ｅ　（８，））にｙ（ａｅａ）を送る。ただし、ｊは
１，２，３，４すべてにわたる。

■横方向第１ステップ・・・・・・ｉが偶数番のＰＥは
左隣のＰＥデータＸを受は取り、自ＰＥの持っＸに加え
込みを行ない、２つ右隣のＰＲへデータを送る。ｉが奇
数番のＰＥは右隣のＰＥからｙを受は取り、自ＰＥの持
つｙに加え込みを行ない、２つ左隣のＰＥへデータを送
る。

即ち、Ｐ　Ｅ　（ｘｔＪ）は！（１＃Ｊ）を受は取り、
ｘ　（ｚｅａ）　＋　ｘ　（ｚｗＪ）を算出し、その値
をｘ（ｚ、ａ）に代入する。ＰＥ（ｚｔＪ）は！（２１
Ｊ）の値をＰＥ（４ｈＪ）に送るｓ　ｉ＝３．４のＰＥ
についても同様。

ＰＥ（１，Ｊ）はｙ（２，））を受は取り−ｙ（１，Ｊ
）＋ｙ（ｚｔａ）を算出し、その値をｙ（ｔｅａ）に代
入する。

ＰＥ（３，Ｊ）はＸ（ＩＩＩＪ）の値をＰＥ（ｔｅＪ）
に送る。

ｉ＝３．４のＰＥについても同様。ただし、ｊは、１．
２，３．４すべてにわたる。

■横方向第２ステップ・・・・・・上記■と同様、Ｘは
右方のＰＥに送って加え込み、ｙは左方のＰＥに送って
加え込む。即ち、ＰＥ（４，Ｊ）がＸ（２，ａ）＋Ｘ（
４，Ｊ）を算出し、その値を！（４，Ｊ）に代入する。

Ｐ　Ｅ　（ｘｔＪ）がｙ　（１，ａ）　＋　ｙ　（ａｙ
ａ）を算出し、その値をｙ（ＬｔＪ）に代入する。ただ
し、ｊは、１，２゜３．４すべてにわたる。

このようにして、ｉ＝４のＰＥ上にＸに関する賃料が求
まり、ｉ＝１のＰＥ上にｙに関する賃料が求まる。次に
、ｉ＝４．ｉ＝１のデータの死相をとることによりＸｇ
ｕｍ、　Ｙｓｕｍが求まる口死相をとるため、まずデー
タ転送を行なう。

Ｘ（４，１）をＰ　Ｅ　（４ｔｚ）に、Ｘ（４，１１）
をＰ　Ｅ　（４１４）に、ｙ（ｔ、ｚ）をＰ　Ｅ　（ｔ
ｔ工）に、ｙ（ｔｔａ）をＰ　Ｅ　（ｚ、ａ）に送る。

死相を求めるのにも、次の２ステツプが必要である６ ■縦カ行第１ステップ・・・・・・Ｐ　Ｅ　（ａ　ｅ　
ｚ）は、Ｘ（４，１）を受取りｘ　（ａ、ｚ）　＋　ｘ
　（ａ、ｚ）を算出し、その値をｘ（ａ、ｚ）に代入す
る。とおく。Ｐ　Ｅ　（４９４）は、Ｘ（番、８）を受
取りｘ　（ａ、−ａ）　＋　ｘ　（４９４）を算出し、
その値をｘ（ｔｔｔ）に代入する。Ｐ　Ｅ　（４＋ｚ）
は、Ｐ　Ｅ　（ａ、ａ）にｘ（ａｐｔ）を送る。

同様に、ＰＥ（工、ｉ）　、　Ｐ　Ｅ　（ｘ、ｓ）もｙ
に関する加え込み計算を行ない、Ｐ　Ｒ（ｚｔａ）はＰ
　Ｅ　（ｔ、ｚ）にｙ（ａｙａ）　を送る。

■縦カ行第２ステップ・・・・・・Ｐ　Ｅ　（４１４＞
がｘ（ａ、ｚ）＋！　（４，４）を算出し、その値を！
（４１４）に代入する。また、Ｐ　Ｅ　（ｘ、１）がｙ
（工ｐｓ）　＋　ｙ　（工、８）を算出し、その値をｙ
　（ｘｔｔ）に代入する。

このようにして、求まった！　（４１４）がＸ　ｓｕｎ
であり、　ｙ（ｔ、ｔ）がＹ　ｓｕｍである。

以上の計算に於ける、データの転送順を、第１図のデー
タ経路図に示す。同図で０印で示した１６台のＰＥは、
第３図に示す並列計算機のＰＥを、データ経路を表示し
やすくするため、左端縦に１次元的に並べ直したもので
ある。また同図で、Ｏ印はデータ、→印はＸ（ｉｅＪ）
に関するデータの経路１０８１．〉印はｙ（ｔｅｌ）に
関するデータの経路を表わす。

Ｌ＝Ｍ＝４の場合は上記の通りであるが、一般の場合に
は次のようにＱ＋ｍステップで、Ｘｓｕｍ　ｔＹ　ｓｕ
＋ａを同時に求めることができる。即ち、総和Ｘｓｕｍ
＝Σ１ＪＸ（ｉｔＪ）を求めるには、まず各行ごとに、
右方向にカスケード・サムを取り、一番右側のＰＥ上に
η相、即ちＸ　ｉ　”ΣｌＸＣ１ｔＪ）を作る。

ただし、ｊ＝１，２ｙ・・・・・・２Ｍである。第り列
上のＭ台のＰＥにあるデータ（η相Ｘｔ　）について、
上方向にカスケード・サムを取ることにより、−番上側
のＰＥ　（Ｌ、Ｍ）上に総和Ｘｓｕｍ＝ΣｊＸ　Ｊを得
る。

上記総和計算と同時に、データｙ（ｔ、ａ）の総和Ｙｓ
ｕｍを求める。それにはまず、各行ごとに左方向にカス
ケード・サムを取り、一般左側のＰＥ上に賃料、即ちＹ
　ｔ　＝Σｔｙ（ｉｓＪ）を作る。ただしｊ＝１．２．
・・・・・・２Ｍである。第１列上のＭ台のＰＥに求ま
ったη相について、下方向にカスケード・サムを取るこ
とにより、一番下側のＰ　Ｅ　（ｚ、ｔ）上に総和Ｙｓ
ｕｍ＝！ΣＪＹ□を得る。

上記処理手順は、全ＰＥに共通なプログラムとして、統
一的に表わすことが出来る。第２図は、並列計算機用の
擬似フォートラン言語で記述した例である。まず、サブ
プログラムと変数について説明する。同図に於いて、文
番号００１０のＭＹＮＵＭＢ（Ｉ、Ｊ）は自ＰＥ番号を
求めるサブプログラムであり、■に横方向の番号、Ｊに
縦方向の番号が与えられる。文番号００３０他の５ＥＮ
Ｄ（Ｘ、　（Ｉ、Ｊ））は、データＸ３ＰＥ（Ｉ、Ｊ）
に送るサブプログラムであり１文番号００６０他のＲＥ
ＣＥＩＶ（Ｘ、　（Ｉ、Ｊ））はＰＥ（Ｉ、Ｊ）からデ
ータを受は取り、それをＸに代入するサブプログラムで
ある。文番号００４０他（７１ＦＵＮＣＯ（Ｉ、ＩＮＡ
Ｘ）は、■を２，４．−・・・、ＩＭＡＸで割ったとき
の余りがＯとなる回数を求める関数サブプログラムであ
り、この値は昇順にカスケード・サムをとるとき、自Ｐ
Ｅが第何ステップまで演算を行なうかを与えるものであ
る０文番号０１２０他＋７）ＦＵＮＣＩ（Ｉ、ＩＮＡＸ
）は、■を２，４．・旧・・、工ＭＡＸで割ったときの
余りが１となる回数を求める関数サブプログラムであり
、この値は降順にカスケー□ド・サムをとるとき、自Ｐ
Ｅが第何ステップまで演算を行なうかを与えるものであ
る。また、変数の意味はＩＭＡＸ、ＪＭＡＸは、それぞ
れ横方向。

縦方向のＰＥ台数である。

次に、処理の概要を説明する。まずＭＹＮＵＭＢを用い
て自ＰＥの番号を求める（文番号００１０）。

第３図に基づ〈実施例と同様、カスケード・サムは横方
向、縦方向の順に行なう。横方向カスケード・サムは、
工が偶数のとき、文番号００３０〜００９０の処理を行
なう。即ち、左隣のＰＥにデータｙを送り（文番号００
３０）−データＸを左方のＰＥから受は取り、Ｘに加え
込む操作をＮ。

回数繰り返す（文番号００５０〜ＯＯ８０）。各ＰＥは
最後の加え込みを終了後、その値を右方のＰＥへ送る（
文番号００９０）。但し、ＰＥが１番右端にあるときは
送らない。以上の処理を、全ＰＥが同時に行なうと、右
端のＰＥ上にη相か求まる。一方、■が奇数のときは、
文番号０１１０〜０１７０の処理に従い、ｙについてカ
スケード・サムを降順に行ない、最後に左端のＰＥ上に
η相が求まる。

縦方向の和に関しても同様に、Ｉ＝ＩＭＡＸ＝ＬのＰＥ
がＸのカスケード・サムを昇順に行ない、１＝１のＰＥ
がｙのカスケード・サムを降順に行なうと、Ｘｓｕｍは
Ｘ（Ｌ、Ｍ）、ＹｓｕｍはＸ（１、１）として求まる。

これら２つの総和計算のためのデータ転送は、第１．第
Ｑステップに於いて、右方向へＬ／２゜Ｌ／２”　、−
−・−・−，１個、左方向ヘモＬ　／　２　、　Ｌ　／
２２、・・・・・・、１個であり、縦方向への転送は無
い。

横方向のデータ転送並列度はＬであり、データを受は取
るＰＥは必ず異なっているから、同時に転送可能である
。第Ω＋１〜第Ｑ＋ｍステップに於いては、横方向のデ
ータ転送はなく、上方向へＭ／２．Ｍ／２”　、・・・
川、１個、下方向へもＭ／２゜Ｍ／２２．・・・・・・
、１個であり、これらも同時に転送可能である。また、
Ｘの加算に使うＰＥとｙの加算に使うＰＥは、必ず異な
っている。以上のことから、Ｘとｙに関する２つの総和
計算は、同時に実行可能である。

〔発明の効果〕

このようにすると、ｘ鬼の総和計算に必要なＰＥは、７
ｘの総和計算に必要なＰＥと重複しないから、Ｘ　ｓｕ
ｍを求める計算とＹ　ｓｕｍを求める計算は、並列に実
行可能である。本発明の方式は、単一のカスケード・サ
ムを行う従来法に比べ、ＰＥの稼働率が約２倍に向上す
る。例えば、Ｎ＝２”０＝１０２４台のとき、ＰＥの稼
働率は、１９．９％に向上する。

本発明は、総和型計算２つを対にし、それぞれを処理す
るＰＥが異なる様に、仕分けしていることが本質である
。それ故、総和と内積のように異種の計算の組合せにも
適用できるし、第３図と異なる結合方式の並列計算機に
適用しても、効率的である。以下、これらの応用に就い
て述べる。

〔変形例〕

１、総和だけ出なく、他の演算も同様に、対にして計算
できる。例えば、内積＜ｘ、ｘ＞と内積＜ＸＩ　ｙ＞、
あるいは最大値Ｘｍａｘと最小値Ｘ　ｍｉｎを同時に求
めることが出来る。この組み合わせは、総和と内積、内
積と最大（小）値。

最大（小）値と内積など異積のものでも構わない。

２、また本発明は、他の結合方式の並列計算機にも容易
に適用できる。例えば、第４図に例示する格子結合方式
の並列計算機でも、第３図の行列クロスバ・スイッチ結
合方式の並列計算機と同様のデータ経路で、対になった
計算が可能である。ただし、格子結合方式の並列計算機
において直接データ転送できるのは、上下左右方向に隣
接するＰＥだけであり、隣接していないＰＥヘデータを
送るには中間のＰＥを経由しなければならない。従って
、ＰＥ（１−Ｊ）からＰ　Ｅ　（１’　、Ｊ’　）への
データ転送と同時に。

Ｐ　Ｅ　（ｔ’　、、＋　）からＰ　Ｅ　（ｉ、Ｊ）へ
のデータ転送が必要な場合、一方のデータ転送が待たさ
れることが生じ得る。しかし、演算に必要なＰＥは決し
て重複しないので、演算は常に並列に実行できる。

３、また、ハイパー・キューブ結合方式の並列計算機で
も、本発明の方式による計算は可能である。例えば、第
５図に示す８台のＰＥからなるハイパー・キューブ結合
方式の並列計算機での実行方法を例示する。同図で、Ｐ
Ｅに付された３桁の数字は、２進表現のＰＥ番号である
。第３図の行列クロスバ・スイッチ結合方式の並列計算
機上で実行する場合に現われるプロセッサ番号（ｉ、ｊ
）を、ｎ　＝　ｉ　＋　Ｑ傘（ｊ−１）なる変換規則で
１次元表現し、第５図のハイパー・キューブ結合方式の
並列計算機のＰＥ番号に対応させる。こうすることによ
り、第３図の並列計算機と同様に、対になった計算が可
能である。

前例と同様２つの総和Ｘｓｕｍ　、　ＹＳｕｍを求める
場合を考える。片方の演算Ｘ　ｓｕｍに関するデータ経
路は、次の通りである。

■第１ステップ・・・・・・全ＰＥに関して、第１ビツ
ト（ここでは、ビットの位置は右から第１．第２・・・
・・・と数える）が０のＰＥから第１ビツトが１のＰＥ
へデータを送り、後者のＰＥが部分和を算出する。

■第２ステップ・・・・・・第１ビツトが１のＰＥに関
して、第２ビツトが０のＰＥから第２ビツトが１のＰＥ
ヘデータを送り、後者のＰＥが部分和を算出する。

■第３ステップ・・・・・・第１ビツト及び第２ビツト
が１のＰＥに関して、第３ビツトが０のＰＥから第３ビ
ツトが１のＰＥヘデータを送り、後者のＰＥが部分和を
算出する。

本例ではＰＥ台数が８＝２８なので、第３ステツプにて
、一番番号の大きい１１１番（１〜８番の１０進表現で
は８番になる）のＰＥ上に総和が求まり、計算は終了す
る。

一方Ｙ　ｓｕｍを求める計算は、各ステップにおいて、
ビットが１のＰＥからビットが０のＰＥへデータを送っ
て進める。

■第１ステップ・・・・・・全ＰＥに関して、第１ビツ
トが１のＰＥから第１ビツトがＯのＰＥヘデータを送り
、後者のＰＥが部分和を算出する。

■第２ステップ・・・・・・第１ビツトが０のＰＥに関
して、第２ビツトが１のＰＥから第２ビツトがＯのＰＥ
へデータを送り、後者のＰＥが部分和を算出する。

■第３ステップ・・・・・・第１ビツト及び第２ビツト
がＯのＰＥに関して、第３ビツトが１のＰＥから第３ビ
ツトがＯのＰＥへデータを送り、後者のＰＥが部分和を
算出する。

このようにして、一番番号の若い０００番（１〜８番の
１０進表現では１番になる）のＰＥ上に総和が求まる。

第１ステツプにおいて１対のＰＥ、例えば０００番のＰ
Ｅと００１番のＰＥは互いにデータＸ、データｙを送る
が、通信路は１本しかないため、いずれかの通信が待た
される。第２ステツプ以降は、データの送受関係に干渉
はなく、演算２通信とも並列に処理できる。

以上説明した通り、本発明は第３図の並列計算機におい
て、２種の総和型計算を、完全に並列に実行できる。第
４〜５図の並列計算機では、通信の１部は並列処理でき
ないものの、演算は完全に並列処理可能で、その分の効
率向上が望める。

【図面の簡単な説明】

第１図は本発明を用いた計算のデータ経路図、第２図は
並列計算機による総和計算のプログラム例を示す図、第
３図は行列クロスバ・スイッチ結合方式の並列計算機の
構成図、第４図は格子結合方式の並列計算機の構成図、
第５図はハイパー・キューブ結合方式の並列計算機の構
成図である。１・・・ホスト計算機、２・・・アレイ・コントローラ
。３・・・要素プロセッサ、４・・・行うロスバ・スイッ
チ、５・・・列クロスバ・スイッチ、６・・・クラスタ
・メモ第２凹００１０　　　　　　　　　　　　Ｃ＾ししζＹリリＭ
Ｒ（Ｔ、Ｊ）Ｃ−−−−−一項方句カス階−ｙすムーー
ーーーーーーーーーーーーーー−Ｃ−−−−一挨ｊ句カ
スケード・ナムーーーーーーーーーーーーーーー第　３
Ｉ￥１

Claims

【特許請求の範囲】

１、複数の要素プロセッサから成り、複数組の隣接して
いない要素プロセッサ間の通信が同時に可能な並列計算
機を用いて、同素プロセッサに付随する記憶装置に分散
記憶されたデータを参照する逐次演算処理を、カスケー
ド型に行う場合、演算途中で空きが生じる要素プロセッ
サを用いて、他の逐次演算処理をカスケード型に行なわ
せることにより、逐次演算処理を複数組同時に実行する
ことを特徴とする双カスケード型並列処理方式。