JPH04111165A - 方程式解析装置 - Google Patents

方程式解析装置

Info

Publication number
JPH04111165A
JPH04111165A JP22825890A JP22825890A JPH04111165A JP H04111165 A JPH04111165 A JP H04111165A JP 22825890 A JP22825890 A JP 22825890A JP 22825890 A JP22825890 A JP 22825890A JP H04111165 A JPH04111165 A JP H04111165A
Authority
JP
Japan
Prior art keywords
matrix
circuit
approximate
backward substitution
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP22825890A
Other languages
English (en)
Other versions
JP2870161B2 (ja
Inventor
Takashi Doi
俊 土肥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP22825890A priority Critical patent/JP2870161B2/ja
Publication of JPH04111165A publication Critical patent/JPH04111165A/ja
Application granted granted Critical
Publication of JP2870161B2 publication Critical patent/JP2870161B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野] 本発明は、方程式解析装置に関するものであり、例えば
差分法による偏微分方程式解析のための高速演算装置に
関するものである。
〔従来の技術] 方程式の解を求める場合、従来の技術としてはf=L+
cmによる再グループ化を行わずに上三角行列と上三角
行列への近似分解を行う方法(ハイパープレーン法)が
あった。
更に詳しく述べるに、解くべき連立一次方程式Au=f と表すと、上三角行列りと上三角行列しによる計算は、
Aの近似分解 M=LU=AtR を用いて、k (k、=o、  1.、 2.  ・・
・)による繰り返し計算 M u fk−1f−Ru(k+ 士fにより近似解u
0°1′ を求めることであり、ここで必要となるLと
Uの逆行列計算が前進代入 後退代入と呼ばれるもので
ある。
ハイパープレーン法による前進代入L−’の計算は1−
i + j +にの格子点について同時並列に行うこと
ができ、複数の演算回路を持つ装置を有効に活用できる
。この方法は例えば「スーパーコンピューター科学技術
計算への応用−」村田健部他(丸善)に更に詳しく述べ
られている。
もう一つの従来法としては、直方体格子上の格子点を、
格子座標(i、j、k)の和が奇数の点と偶数の点に分
け、各グループに対して上三角行列と上三角行列への近
似分解を行う方法(Odd−Even法)があった。0
dd−Even法における計算順序を第3図に示す。
なお、反復計算回路においては共役勾配法などのよく知
られた方法を用いて、複数の演算回路を生かした計算が
容易に実現できる。これS:ついては例えば、前記「ス
ーパーコンピューター科学技術計算への応用−Jに詳し
く述べられている。
〔発明が解決しようとする課題] 一般に前記構成からなる方程式解析装置では近似行列前
進後退代入回路が演算時間の大部分を費やし、その高速
化が重要であると同時に、近似の精度、即ち誤差行列R
の要素値が小さいことが重要である。上述したハイパー
プレーン法にあっては、f=i+j+にの格子点につい
て同時計算できるが、その数は平均するとN 2/ 3
 (N = n x=l’l、 =n2のとき)であり
、さらに多数の独立な演算回路を持つ前進後退代入回路
を利用することができない。
また0dd−Even法は半数、即ちN:l/2の格子
点に関する計算が同時に行えるため、複数の演算回路を
持つ前進後退代入回路を利用できる反面、近似行列Mの
近似精度か高(ないことが知られており、ハイパープレ
ーン法と同じ精度の近似解を得るのに数倍の計算を必要
とするため、複数回路を用いることにより高速化のノリ
ノドか打ち消されてしまう。
本発明の目的は、複数の演算回路を用いた高速並列計算
が可能な方程式解析装置を提供することにある。
〔課題を解決するための手段] 本発明は、直方体領域で定義された偏微分方程式を直交
格子点(i、j、k)(1≦j≦nx、1≦J≦ny、
l≦k≦nz)上で離散近似して得られる連立一次方程
弐の係数行列と係数へ、クトルを入力データとし、 係数行列を近似行列に分解する係数行列分解回路と、反
復計算回路と、係数行列分解回路で生成された近似行列
の逆行列を反復計算回路から入力したベクトルデータに
掛け反復計算回路に出力する前進後退代入回路とを備え
、 前記連立一次方程弐の近似解を出力とする方程式解析装
置において、 係数行列分解回路は、前記直交格子点をff−1+j−
1−にの値によってグループ分けし、与えられたmに対
して、ff−L+−cm (cは任意の整数)となるL
によってさらにこれらをグループ分けして得られるm個
のグループについて、Lの若い順に各直交格子点に関す
る係数行列を上三角行列と上三角行列に分割し、それら
の積の形で近似し、前進後退代入回路は、反復計算回路
から入力したベクトルデータに各々のグループについて
前記上三角行列と上三角行列による前進後退代入を行う
ことによって近似行列の逆行列計算を行うことを特徴と
している。
〔作用〕
簡単のため、2次元長方形格子を例に説明する。
第2図は2次元の長方形格子である。前進後退代入計算
は格子によって直接つながっている隣接格子点において
同時に行うことはできないという制約がある。ハイパー
プレーン法は格子の端点より斜めの線上の格子点につい
て並列に計算する方法であり、この方法では最大m I
 n (nXny、n、n。
nznx)格子点についてしか並列例算できない。
0dd−EVen法は、第3回で示される○の点につい
で計算したあと、・の点について計算を行う。○同士(
・同士)は互いにつながっていないので同時計算が可能
である。しかしながら、前記のように近似精度が低いた
め、ハイパープレーン法と同し精度の解を得るために非
常に多くの反復計算を要し、並列化のメリットが生かせ
ない。
第4図は本発明による計算の順序(m−3の場合)を表
している。mおきの複数のハイパープレーン内に含まれ
る格子点の計算が同時に行われる。
すなわち、同じ番号のハイパープレーンが同時処理され
る。ここでmを領域の2辺の長さの和とすると、この手
法は従来のハイパープレーン法となる。また0dd−E
ven法は、mが2の場合に相当する。
格子のサイズをnXn、同一グループに含まれるハイパ
ープレーン間隔をmとすると、n 27 mの独立な計
算となり、それに相当する独立な演算器による計算が可
能となる。例えばnを128 、mを16とすると12
8X (128/16) −1024個の演算器による
並列計算が可能となる。
一方、Mの近似精度について、mを小さくすると精度が
低下することが確かめられる。例えばm=2とすると独
立な演算数は増えるが、近似精度の点で問題が生しる。
m=2n−川とすると前記ハイパープレーン法となり、
収束精度は良好であるが、複数の演算器を有効利用でき
ない。
即ち、本発明は与えられた個数の演算器をフルに生かし
ながら、最小限の近イ以精度の低下で計算を行うことを
可能とするものである。さらに、mが適当に大きい場合
、近似精度の低下は極めて僅かであることが確かめられ
ている。従って、実際にはほとんど近似精度の低下を起
こさずに複数の演算器により並列計算ができ、高速化が
達成できる。
〔実施例〕
次に、本発明の実施例について図面を参照して説明する
第1図は本発明の一実施例である方程式解析装置の構成
を示す。この方程式解析装置は、プロセッサから構成さ
れ、入力データ(行列A、ヘクトルf)11が供給され
る係数行列分解回路1と、係数行列分解回路1からAの
近似行列Mの分解された行列12が与えられる前進後退
代入回路2と、前進後退代入回路2に接続された反復計
算回路3から成っている。
反復計算回路3には、入力データ11が供給される。ま
た、反復計算回路3は、前進後退代入回路2に対し、ベ
クトル13(ベクトルg)を与えるようになっていると
共に、前進後退代入回路2からベクトル14(ベクトル
v=M−’g)が与えられるようになっている。
係数行列分解回路1は、偏微分方程式の離散近似により
得られる連立一次方程式の係数行列と係数ベクトルを入
力データとし、係数行列を反転が容易な近似行列に分解
する回路であって、更に、係数行列を小直方体に対応す
る複数の下三角行列と上三角行列に分解し、それらの積
で近似する処理を行う。
前進後退代入回路2は、係数行列分解回路1で生成され
る近似行列の反転行列を反復計算回路3から入力したベ
クトルデータに掛け反復計算回路3へ出力し、反復計算
回路3から入力したへクトルデータに前記上三角行列と
下三角行列による前進後退代入計算を行うことによって
近似行列の反転を行う。
方程式Au=fの近憤解u15は、反復計算回路3から
取り出される。
このように、連立一次方程式の係数行列と係数ベクトル
を入力データとし、係数行列を近似行列に分解する係数
行列分解回路1と、係数行列分解回路1で生成された近
イ以行列の反転行列を反復計算回路3から入力したベク
トルデータに掛け反復計算回路3に出力する前進後退代
入回路2と、これに接続される反復計算回路から成り、
前記連立一次方程式の近似解を出力とする連立一次方程
式解析装置であって、係数行列分解回路1は前記係数行
列を複数のハイパープレーンに対応する複数の下三角行
列と上三角行列とSこ分解し、それるの積で近似し、前
進後退代入回路2は反復計算回路3かる入力しター・ク
トルデータに前記下三角行列上上三角行列二二よる前進
後退代入を行うこと二こよって近似行列の反転を行うよ
うにする。このようにすると各ハイパープレーン及びハ
イパーブレーン内の格子点5+対応する前進後退代入計
算が複数の演算回路で互いに独立乙こ実行でき、高速化
が達成できる。
〔発明の効果〕
以上説明したように、本発明によれば複数の演算回路を
用いた高速並列演算が可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示す図、第2図、第
3回は従来技術における計算格子の例を示す図、 第4図は本発明における計算格子の例を示す図である。 1・・・・・係数行列分解回路 2・・・・・前進後退代入回路 ■ ;入力データ(行列A、’<’クトルf)Aの近イ以イ
1列MのLUつ1Rさt″Uだ行列13、へ゛クトル9 4、穴′クトルv (:M−’g ) 15、方!:X、Au :f(D近イ以角eAX゛クト
ルU第 図 ・反復計算回路

Claims (1)

    【特許請求の範囲】
  1. (1)直方体領域で定義された偏微分方程式を直交格子
    点(i、j、k)(1≦i≦n_x、1≦j≦n_y、
    1≦k≦n_z)上で離散近似して得られる連立一次方
    程式の係数行列と係数ベクトルを入力データとし、 係数行列を近似行列に分解する係数行列分解回路と、反
    復計算回路と、係数行列分解回路で生成された近似行列
    の逆行列を反復計算回路から入力したベクトルデータに
    掛け反復計算回路に出力する前進後退代入回路とを備え
    、 前記連立一次方程式の近似解を出力とする方程式解析装
    置において、 係数行列分解回路は、前記直交格子点をl=i+j+k
    の値によってグループ分けし、与えられたmに対して、
    l=L+cm(cは任意の整数)となるLによってさら
    にこれらをグループ分けして得られるm個のグループに
    ついて、Lの若い順に各直交格子点に関する係数行列を
    下三角行列と上三角行列に分割し、それらの積の形で近
    似し、前進後退代入回路は、反復計算回路から入力した
    ベクトルデータに各々のグループについて前記下三角行
    列と上三角行列による前進後退代入を行うことによって
    近似行列の逆行列計算を行うことを特徴とする方程式解
    析装置。
JP22825890A 1990-08-31 1990-08-31 方程式解析装置 Expired - Fee Related JP2870161B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22825890A JP2870161B2 (ja) 1990-08-31 1990-08-31 方程式解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22825890A JP2870161B2 (ja) 1990-08-31 1990-08-31 方程式解析装置

Publications (2)

Publication Number Publication Date
JPH04111165A true JPH04111165A (ja) 1992-04-13
JP2870161B2 JP2870161B2 (ja) 1999-03-10

Family

ID=16873652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22825890A Expired - Fee Related JP2870161B2 (ja) 1990-08-31 1990-08-31 方程式解析装置

Country Status (1)

Country Link
JP (1) JP2870161B2 (ja)

Also Published As

Publication number Publication date
JP2870161B2 (ja) 1999-03-10

Similar Documents

Publication Publication Date Title
Wu et al. Parallel solution of large sparse matrix equations and parallel power flow
EP4095719A1 (en) Sparse matrix multiplication in hardware
EP0523544A2 (en) Calculating equipment for solving systems of linear equation
Cheng et al. Hardware efficient fast DCT based on novel cyclic convolution structures
Lin et al. Parallel solution of sparse algebraic equations
Chionh et al. Fast computation of the Bezout and Dixon resultant matrices
KR20220158768A (ko) 기계 학습 가속을 위한 전력 감소
Grinberg et al. The n body matrix and its determinant
JPH04111165A (ja) 方程式解析装置
Göttfert An acceleration of the Niederreiter factorization algorithm in characteristic 2
Ohno et al. A quadrature-based eigensolver with a Krylov subspace method for shifted linear systems for Hermitian eigenproblems in lattice QCD
Omar et al. Parallel two-point explicit block method for solving high-order ordinary differential equations
Annaratone et al. Using Warp as a supercomputer in signal processing
Yamazaki et al. Analyzing performance of bicgstab with hierarchical matrix on gpu clusters
JPH03266173A (ja) 方程式解析装置
EP0438119A2 (en) Numerical processing of optical wavefront data
Huang et al. A parallel FFT algorithm for transputer networks
Yamazaki et al. Performance of hierarchical-matrix BiCGStab solver on GPU clusters
JPH0477961A (ja) 方程式解析装置
Taniguchi et al. Enumeration algorithm for genus-4 superspecial hyperelliptic curves with automorphism group Q8
Wyrzykowski Processor arrays for matrix triangularisation with partial pivoting
JPH0328961A (ja) 高速演算装置
Ghouse 2D grid architectures for the DFT and the 2D DFT
JP3648286B2 (ja) 並列機向け固有ベクトル求解方法及びこれを用いた構造解析シミュレーション方法
Stetsyura Combining computation and data transmission in the systems with switches

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees