JPH01147767A - 双カスケード型並列処理方式 - Google Patents

双カスケード型並列処理方式

Info

Publication number
JPH01147767A
JPH01147767A JP30561987A JP30561987A JPH01147767A JP H01147767 A JPH01147767 A JP H01147767A JP 30561987 A JP30561987 A JP 30561987A JP 30561987 A JP30561987 A JP 30561987A JP H01147767 A JPH01147767 A JP H01147767A
Authority
JP
Japan
Prior art keywords
data
sum
pes
cascade
parallel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP30561987A
Other languages
English (en)
Inventor
Ikuo Yoshihara
郁夫 吉原
Akira Muramatsu
晃 村松
Kazuo Nakao
中尾 和夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP30561987A priority Critical patent/JPH01147767A/ja
Publication of JPH01147767A publication Critical patent/JPH01147767A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、電子計算機を用いる演算処理方式に係り、特
に、多数の要素プロセッサ(PE:Processor
 Element)から成る並列計算機に於いて、各P
Eに分散記憶されたデータを参照する演算を。
効率よく処理する方法に関するものである。
〔従来の技術〕
多数の要素プロセッサから成る並列計算機のプロセッサ
間結合方式としては、 ・格子状結合方式 ・ハイパーキューブ(超立方格子)結合方式・行列クロ
スバ・スイッチ結合方式(たとえば、特願昭61−26
9655号参府) などがある。偏微分方程式を離散化して並列計算機で解
く場合、解析対象とする空間を複数の部分空間に分け、
各PEに部分空間(これは1個又は複数個の格子点を含
む)に含まれる格子点の処理をさせるのが一般的である
。従って、データ(変数の値)は、各PEに付随する記
憶装置に、少しずつ分散的に記憶させるのが自然である
。このようなデータ割当は、偏微分方程式の求解に限ら
ず、画像処理など多量のデータ処理を行う問題でしばし
ば生ずる。
ところで計算の過程では、全部又は一部のPEに分散さ
れたデータを参照するため、計算順序が可換であるにも
拘らず、逐次処理せざるを得ない計算がしばしば現われ
る9代表的な例として、・総和計算  Xsum=Σi
 X 1・内積計算  <x、y>=Σ1x1yt・最
大値探索 Xmax=max(xih=1y2+−−)
・最大値探索 Xmin=mix(x * l i= 
l e 2 +・・・・・・)がある。ただし、Σ1は
iに関する和である。ここでは、これらを総称して「総
和型計算」と呼ぶ。
並列計算機で総和型計算を行なう代表的な方法に、カス
ケード・サム(Cascade Sum)がある、たと
えば、R,W、ホツキニー、C,R,ジエソツペ著: 
「並列計算機」(共立出版(1984)p、p。
203〜207)参照。これは、次の手順で総和をとる
方法である。即ち、■2個ずつのデータの部分和をとる
。次に■2個ずつの部分和に対して再び部分和をとる。
以下、■の操作を繰返すと総和が得られる。
カスケード・サムによれば、N個のデータの総和は、n
ステップの演算で処理することが出来る(n = l 
1ogzN l↑で、1・・・l↑は切り上げの記号、
ステップとは1対の部分和をとる操作を言う)。
従って、すべて逐次処理する場合に比べ、計算時間はn
 / Nに短縮され効率的である(/は除算の記号)。
例えば、N=210=1024台のとき。
計算時間は0.98%に短縮されたことになる。
〔発明が解決しようとする問題点〕
しかし、カスケード・サムは、2個ずつの部分和をとる
操作を繰り返すため、使用しないPEが多数発生する。
即ち、第1ステツプでは全体の1/2のPEが働かず、
第2ステツプでは全体の3/4のPEが働かず、第3ス
テツプでは全体の7/8のPEが働かない・・・・・・
と言う状況が生じ、PEの稼働率は(N−1)/(n申
N)となる(申は乗算の記号)。例えば、N=210=
1024台のとき、PEの稼働率は、9.99%に過ぎ
ない。
数値シミュレーションでは、総和型計算がたびたび現わ
れるから、稼働率の向上が望まれる。
〔問題を解決するための手段及び作用〕現実の問題では
、総和型計算が、複数個同時に必要なことが屡々ある。
本発明では、複数個の総和型計算を、同時に進行させる
ことにより、PEの稼動率向上を図る。
例えば、2組の総和X 811111 :ΣrXi と
Ysum=Σiytを求める場合、隣同士のPEのデー
タを対にして番号の大きい方のPEを使ってXsum=
Σ1x1の部分和を求める。一方、同じ隣同士のPEの
データを対にして出発し、常に番号の小さい方のPEを
使って、Ysum=Σtyt を求める・このようにす
ると、X sumを求める計算とY sumを求める計
算とを、同時に進行させることが出来る。
〔実施例〕
以下1本発明の一実施例を第1図〜第3図により説明す
る。第3rMは、本発明の処理方式を適用する、行列ク
ロスバ・スイッチ結合方式の並列計算機の構成図である
ホスト計算機1は、アレイ・コントローラ2を介して、
PE3へのプログラムのロード、データの転送、スカラ
ー演算処理、演算の進行管理を行なう。アレイ・コント
ローラ2は、上記機能のほか、PE3からホスト計算機
1へのデータ転送、PE3から周辺装置7へのデータ転
送(例えば、磁気ディスクへの書き込み)の制御を行う
。PE3は、数値演算、及びPEへのデータの送信と受
信を行なう要素プロセッサであり、記憶装置も内蔵して
いる。PEは横方向にL=2AQ台、縦方向にM=2A
m台、合計N=L傘M台並んでいる(′は巾乗の記号、
Q、mは正整数)。第3図に示したのは、Q=m=2で
16台のPEからなる並列計算機の構成の例である。個
々のPEは2次元的に付された番号(it j)により
識別される。
ただし、i=1.2.・・・・・・e L、j=1−+
 2・・・・・・。
M。行うロスバ・スイッチ4は、横方向に並んだPE間
のデータ転送路であり、それぞれのチャンネルに対し入
力ポート出力ポートを持ち、並列度りである。即ち、同
じ行に属するL台のPEは、それぞれ同時にデータを受
ける取ることが出来る。
ただし、1台のPEが同時に2力所以上からデータを受
は取ることはできない。列クロスバ・スイッチ5は、縦
方向に並んだPE間のデータ転送路であり、並列度Mで
ある。即ち、同じ列に属するM台のPEは、それぞれ同
時にデータを受は取ることが出来る。クラスタ・メモリ
6は、縦並びのP’E3毎に共有する外部記憶装置であ
る。周辺装置7は、入出力装置、外部記憶装置などであ
る。
上記並列計算機を用いて、各PEに付随する記憶装置に
入っているデータを参照する。一対の総和計算を並列に
実行する方法を説明する。PR(+、a)に付随する記
憶装置に入っているデータをx(t*JLy(ita)
と記す。各PEの持っXpVは高々1個とする。もしP
Eが複数個のXまたはyを持つ場合は、各PEごとに、
自PEが受は持つデータについての部分和を求め、それ
を改めて!(1,J)。
y(i、a)と置けばよい。また、P E (iyJ)
にデータがないときは、値がOのデータがあると見做す
Xsum=:ΣtJx(tta)=ΣJ(Σ、X(、、
、))の様に考え、初めにiについての和をとり1次に
jについての和をとる。ΣIJはiとjに関する二重布
である。iについての和は、PEの横方向の並びの和で
あり、「賃料」と呼ぶ。jについての和を「死相」と呼
ぶ。
賃料をとるため、まずデータを横方向に転送する。iが
奇数番のPEはデータXを右隣のPEに送り、iが偶数
番のPEはデータXを左隣のPEに送る。即ち、P E
 (x、J)はP E (z、−)に!(1,J)を送
り、P E (sea)はp E(ata)にX(Jl
、J)  を送る。 P E (z、J)はPE(1e
a)にy(aea)を送り、P E (4? J)はP
 E (8,))にy(aea)を送る。ただし、jは
1,2,3,4すべてにわたる。
■横方向第1ステップ・・・・・・iが偶数番のPEは
左隣のPEデータXを受は取り、自PEの持っXに加え
込みを行ない、2つ右隣のPRへデータを送る。iが奇
数番のPEは右隣のPEからyを受は取り、自PEの持
つyに加え込みを行ない、2つ左隣のPEへデータを送
る。
即ち、P E (xtJ)は!(1#J)を受は取り、
x (zea) + x (zwJ)を算出し、その値
をx(z、a)に代入する。PE(ztJ)は!(21
J)の値をPE(4hJ)に送るs i=3.4のPE
についても同様。
PE(1,J)はy(2,))を受は取り−y(1,J
)+y(zta)を算出し、その値をy(tea)に代
入する。
PE(3,J)はX(IIIJ)の値をPE(teJ)
に送る。
i=3.4のPEについても同様。ただし、jは、1.
2,3.4すべてにわたる。
■横方向第2ステップ・・・・・・上記■と同様、Xは
右方のPEに送って加え込み、yは左方のPEに送って
加え込む。即ち、PE(4,J)がX(2,a)+X(
4,J)を算出し、その値を!(4,J)に代入する。
P E (xtJ)がy (1,a) + y (ay
a)を算出し、その値をy(LtJ)に代入する。ただ
し、jは、1,2゜3.4すべてにわたる。
このようにして、i=4のPE上にXに関する賃料が求
まり、i=1のPE上にyに関する賃料が求まる。次に
、i=4.i=1のデータの死相をとることによりXg
um、 Ysumが求まる口死相をとるため、まずデー
タ転送を行なう。
X(4,1)をP E (4tz)に、X(4,11)
をP E (414)に、y(t、z)をP E (t
t工)に、y(tta)をP E (z、a)に送る。
死相を求めるのにも、次の2ステツプが必要である6 ■縦カ行第1ステップ・・・・・・P E (a e 
z)は、X(4,1)を受取りx (a、z) + x
 (a、z)を算出し、その値をx(a、z)に代入す
る。とおく。P E (494)は、X(番、8)を受
取りx (a、−a) + x (494)を算出し、
その値をx(ttt)に代入する。P E (4+z)
は、P E (a、a)にx(apt)を送る。
同様に、PE(工、i) 、 P E (x、s)もy
に関する加え込み計算を行ない、P R(zta)はP
 E (t、z)にy(aya) を送る。
■縦カ行第2ステップ・・・・・・P E (414>
がx(a、z)+! (4,4)を算出し、その値を!
(414)に代入する。また、P E (x、1)がy
(工ps) + y (工、8)を算出し、その値をy
 (xtt)に代入する。
このようにして、求まった! (414)がX sun
であり、 y(t、t)がY sumである。
以上の計算に於ける、データの転送順を、第1図のデー
タ経路図に示す。同図で0印で示した16台のPEは、
第3図に示す並列計算機のPEを、データ経路を表示し
やすくするため、左端縦に1次元的に並べ直したもので
ある。また同図で、O印はデータ、→印はX(ieJ)
に関するデータの経路1081.〉印はy(tel)に
関するデータの経路を表わす。
L=M=4の場合は上記の通りであるが、一般の場合に
は次のようにQ+mステップで、Xsum tY su
+aを同時に求めることができる。即ち、総和Xsum
=Σ1JX(itJ)を求めるには、まず各行ごとに、
右方向にカスケード・サムを取り、一番右側のPE上に
η相、即ちX i ”ΣlXC1tJ)を作る。
ただし、j=1,2y・・・・・・2Mである。第り列
上のM台のPEにあるデータ(η相Xt )について、
上方向にカスケード・サムを取ることにより、−番上側
のPE (L、M)上に総和Xsum=ΣjX Jを得
る。
上記総和計算と同時に、データy(t、a)の総和Ys
umを求める。それにはまず、各行ごとに左方向にカス
ケード・サムを取り、一般左側のPE上に賃料、即ちY
 t =Σty(isJ)を作る。ただしj=1.2.
・・・・・・2Mである。第1列上のM台のPEに求ま
ったη相について、下方向にカスケード・サムを取るこ
とにより、一番下側のP E (z、t)上に総和Ys
um=!ΣJY□を得る。
上記処理手順は、全PEに共通なプログラムとして、統
一的に表わすことが出来る。第2図は、並列計算機用の
擬似フォートラン言語で記述した例である。まず、サブ
プログラムと変数について説明する。同図に於いて、文
番号0010のMYNUMB(I、J)は自PE番号を
求めるサブプログラムであり、■に横方向の番号、Jに
縦方向の番号が与えられる。文番号0030他の5EN
D(X、 (I、J))は、データX3PE(I、J)
に送るサブプログラムであり1文番号0060他のRE
CEIV(X、 (I、J))はPE(I、J)からデ
ータを受は取り、それをXに代入するサブプログラムで
ある。文番号0040他(71FUNCO(I、INA
X)は、■を2,4.−・・・、IMAXで割ったとき
の余りがOとなる回数を求める関数サブプログラムであ
り、この値は昇順にカスケード・サムをとるとき、自P
Eが第何ステップまで演算を行なうかを与えるものであ
る0文番号0120他+7)FUNCI(I、INAX
)は、■を2,4.・旧・・、工MAXで割ったときの
余りが1となる回数を求める関数サブプログラムであり
、この値は降順にカスケー□ド・サムをとるとき、自P
Eが第何ステップまで演算を行なうかを与えるものであ
る。また、変数の意味はIMAX、JMAXは、それぞ
れ横方向。
縦方向のPE台数である。
次に、処理の概要を説明する。まずMYNUMBを用い
て自PEの番号を求める(文番号0010)。
第3図に基づ〈実施例と同様、カスケード・サムは横方
向、縦方向の順に行なう。横方向カスケード・サムは、
工が偶数のとき、文番号0030〜0090の処理を行
なう。即ち、左隣のPEにデータyを送り(文番号00
30)−データXを左方のPEから受は取り、Xに加え
込む操作をN。
回数繰り返す(文番号0050〜OO80)。各PEは
最後の加え込みを終了後、その値を右方のPEへ送る(
文番号0090)。但し、PEが1番右端にあるときは
送らない。以上の処理を、全PEが同時に行なうと、右
端のPE上にη相か求まる。一方、■が奇数のときは、
文番号0110〜0170の処理に従い、yについてカ
スケード・サムを降順に行ない、最後に左端のPE上に
η相が求まる。
縦方向の和に関しても同様に、I=IMAX=LのPE
がXのカスケード・サムを昇順に行ない、1=1のPE
がyのカスケード・サムを降順に行なうと、Xsumは
X(L、M)、YsumはX(1、1)として求まる。
これら2つの総和計算のためのデータ転送は、第1.第
Qステップに於いて、右方向へL/2゜L/2” 、−
−・−・−,1個、左方向ヘモL / 2 、 L /
22、・・・・・・、1個であり、縦方向への転送は無
い。
横方向のデータ転送並列度はLであり、データを受は取
るPEは必ず異なっているから、同時に転送可能である
。第Ω+1〜第Q+mステップに於いては、横方向のデ
ータ転送はなく、上方向へM/2.M/2” 、・・・
川、1個、下方向へもM/2゜M/22.・・・・・・
、1個であり、これらも同時に転送可能である。また、
Xの加算に使うPEとyの加算に使うPEは、必ず異な
っている。以上のことから、Xとyに関する2つの総和
計算は、同時に実行可能である。
〔発明の効果〕
このようにすると、x鬼の総和計算に必要なPEは、7
xの総和計算に必要なPEと重複しないから、X su
mを求める計算とY sumを求める計算は、並列に実
行可能である。本発明の方式は、単一のカスケード・サ
ムを行う従来法に比べ、PEの稼働率が約2倍に向上す
る。例えば、N=2”0=1024台のとき、PEの稼
働率は、19.9%に向上する。
本発明は、総和型計算2つを対にし、それぞれを処理す
るPEが異なる様に、仕分けしていることが本質である
。それ故、総和と内積のように異種の計算の組合せにも
適用できるし、第3図と異なる結合方式の並列計算機に
適用しても、効率的である。以下、これらの応用に就い
て述べる。
〔変形例〕
1、総和だけ出なく、他の演算も同様に、対にして計算
できる。例えば、内積<x、x>と内積<XI y>、
あるいは最大値Xmaxと最小値X minを同時に求
めることが出来る。この組み合わせは、総和と内積、内
積と最大(小)値。
最大(小)値と内積など異積のものでも構わない。
2、また本発明は、他の結合方式の並列計算機にも容易
に適用できる。例えば、第4図に例示する格子結合方式
の並列計算機でも、第3図の行列クロスバ・スイッチ結
合方式の並列計算機と同様のデータ経路で、対になった
計算が可能である。ただし、格子結合方式の並列計算機
において直接データ転送できるのは、上下左右方向に隣
接するPEだけであり、隣接していないPEヘデータを
送るには中間のPEを経由しなければならない。従って
、PE(1−J)からP E (1’ 、J’ )への
データ転送と同時に。
P E (t’ 、、+ )からP E (i、J)へ
のデータ転送が必要な場合、一方のデータ転送が待たさ
れることが生じ得る。しかし、演算に必要なPEは決し
て重複しないので、演算は常に並列に実行できる。
3、また、ハイパー・キューブ結合方式の並列計算機で
も、本発明の方式による計算は可能である。例えば、第
5図に示す8台のPEからなるハイパー・キューブ結合
方式の並列計算機での実行方法を例示する。同図で、P
Eに付された3桁の数字は、2進表現のPE番号である
。第3図の行列クロスバ・スイッチ結合方式の並列計算
機上で実行する場合に現われるプロセッサ番号(i、j
)を、n = i + Q傘(j−1)なる変換規則で
1次元表現し、第5図のハイパー・キューブ結合方式の
並列計算機のPE番号に対応させる。こうすることによ
り、第3図の並列計算機と同様に、対になった計算が可
能である。
前例と同様2つの総和Xsum 、 YSumを求める
場合を考える。片方の演算X sumに関するデータ経
路は、次の通りである。
■第1ステップ・・・・・・全PEに関して、第1ビツ
ト(ここでは、ビットの位置は右から第1.第2・・・
・・・と数える)が0のPEから第1ビツトが1のPE
へデータを送り、後者のPEが部分和を算出する。
■第2ステップ・・・・・・第1ビツトが1のPEに関
して、第2ビツトが0のPEから第2ビツトが1のPE
ヘデータを送り、後者のPEが部分和を算出する。
■第3ステップ・・・・・・第1ビツト及び第2ビツト
が1のPEに関して、第3ビツトが0のPEから第3ビ
ツトが1のPEヘデータを送り、後者のPEが部分和を
算出する。
本例ではPE台数が8=28なので、第3ステツプにて
、一番番号の大きい111番(1〜8番の10進表現で
は8番になる)のPE上に総和が求まり、計算は終了す
る。
一方Y sumを求める計算は、各ステップにおいて、
ビットが1のPEからビットが0のPEへデータを送っ
て進める。
■第1ステップ・・・・・・全PEに関して、第1ビツ
トが1のPEから第1ビツトがOのPEヘデータを送り
、後者のPEが部分和を算出する。
■第2ステップ・・・・・・第1ビツトが0のPEに関
して、第2ビツトが1のPEから第2ビツトがOのPE
へデータを送り、後者のPEが部分和を算出する。
■第3ステップ・・・・・・第1ビツト及び第2ビツト
がOのPEに関して、第3ビツトが1のPEから第3ビ
ツトがOのPEへデータを送り、後者のPEが部分和を
算出する。
このようにして、一番番号の若い000番(1〜8番の
10進表現では1番になる)のPE上に総和が求まる。
第1ステツプにおいて1対のPE、例えば000番のP
Eと001番のPEは互いにデータX、データyを送る
が、通信路は1本しかないため、いずれかの通信が待た
される。第2ステツプ以降は、データの送受関係に干渉
はなく、演算2通信とも並列に処理できる。
以上説明した通り、本発明は第3図の並列計算機におい
て、2種の総和型計算を、完全に並列に実行できる。第
4〜5図の並列計算機では、通信の1部は並列処理でき
ないものの、演算は完全に並列処理可能で、その分の効
率向上が望める。
【図面の簡単な説明】
第1図は本発明を用いた計算のデータ経路図、第2図は
並列計算機による総和計算のプログラム例を示す図、第
3図は行列クロスバ・スイッチ結合方式の並列計算機の
構成図、第4図は格子結合方式の並列計算機の構成図、
第5図はハイパー・キューブ結合方式の並列計算機の構
成図である。 1・・・ホスト計算機、2・・・アレイ・コントローラ
。 3・・・要素プロセッサ、4・・・行うロスバ・スイッ
チ、5・・・列クロスバ・スイッチ、6・・・クラスタ
・メモ第2凹 0010            C^ししζYリリM
R(T、J)C−−−−−一項方句カス階−yすムーー
ーーーーーーーーーーーーーー−C−−−−一挨j句カ
スケード・ナムーーーーーーーーーーーーーーー第 3
I¥1

Claims (1)

    【特許請求の範囲】
  1. 1、複数の要素プロセッサから成り、複数組の隣接して
    いない要素プロセッサ間の通信が同時に可能な並列計算
    機を用いて、同素プロセッサに付随する記憶装置に分散
    記憶されたデータを参照する逐次演算処理を、カスケー
    ド型に行う場合、演算途中で空きが生じる要素プロセッ
    サを用いて、他の逐次演算処理をカスケード型に行なわ
    せることにより、逐次演算処理を複数組同時に実行する
    ことを特徴とする双カスケード型並列処理方式。
JP30561987A 1987-12-04 1987-12-04 双カスケード型並列処理方式 Pending JPH01147767A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30561987A JPH01147767A (ja) 1987-12-04 1987-12-04 双カスケード型並列処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30561987A JPH01147767A (ja) 1987-12-04 1987-12-04 双カスケード型並列処理方式

Publications (1)

Publication Number Publication Date
JPH01147767A true JPH01147767A (ja) 1989-06-09

Family

ID=17947317

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30561987A Pending JPH01147767A (ja) 1987-12-04 1987-12-04 双カスケード型並列処理方式

Country Status (1)

Country Link
JP (1) JPH01147767A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738891B2 (en) 2000-02-25 2004-05-18 Nec Corporation Array type processor with state transition controller identifying switch configuration and processing element instruction address
US7350054B2 (en) 2001-08-31 2008-03-25 Nec Corporation Processor having array of processing elements whose individual operations and mutual connections are variable
JP2008524691A (ja) * 2004-12-17 2008-07-10 エヌエックスピー ビー ヴィ 算術/論理演算ツリーの計算

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738891B2 (en) 2000-02-25 2004-05-18 Nec Corporation Array type processor with state transition controller identifying switch configuration and processing element instruction address
US7350054B2 (en) 2001-08-31 2008-03-25 Nec Corporation Processor having array of processing elements whose individual operations and mutual connections are variable
JP2008524691A (ja) * 2004-12-17 2008-07-10 エヌエックスピー ビー ヴィ 算術/論理演算ツリーの計算
US8326909B2 (en) 2004-12-17 2012-12-04 Nxp B.V. Arithmetic or logical operation tree computation

Similar Documents

Publication Publication Date Title
Jonsson et al. Recursive blocked algorithms for solving triangular systems—Part II: Two-sided and generalized Sylvester and Lyapunov matrix equations
CN109165732B (zh) 神经网络处理装置及其执行向量乘加指令的方法
Gupta Numerical methods for engineers
Ma et al. Multiplier policies for digital signal processing
RU2139564C1 (ru) Устройство для выполнения операций умножения-сложения с упакованными данными
CN109074516A (zh) 计算处理装置和计算处理方法
CN110516810B (zh) 一种量子程序的处理方法、装置、存储介质和电子装置
MacKenzie The influence of the Los Alamos and Livermore National Laboratories on the development of supercomputing
JPWO2019088072A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP3985797B2 (ja) プロセッサ
CN109740115A (zh) 一种实现矩阵乘法运算的方法、装置及设备
CN101980182A (zh) 基于矩阵运算的并行计算方法
EP4024206A1 (en) Computing device and method for reusing data
CN106933777B (zh) 基于国产申威26010处理器的基2一维fft的高性能实现方法
JP7251354B2 (ja) 情報処理装置、情報処理プログラム、及び情報処理方法
JPH01147767A (ja) 双カスケード型並列処理方式
CN115033843B (zh) 基于三角脉动阵列的协方差矩阵计算的电路实现方法
Voigt Where are the parallel algorithms?
Prokhorov Computers in Russia: science, education, and industry
Shriver Microprogramming and numerical analysis
JP2580501B2 (ja) 並列デ−タ処理装置
Lescrenier et al. Large-scale unconstrained optimization on the FPS 164 and Cray X-MP vector processors
US20170031621A1 (en) Grid Processing Electronic Memory
Min et al. A flexible and customizable architecture for the relaxation labeling algorithm
SU1260951A1 (ru) Матричное устройство дл извлечени квадратного корн