JPS60120472A

JPS60120472A - 多重ル−プのベクトル処理方式

Info

Publication number: JPS60120472A
Application number: JP22797583A
Authority: JP
Inventors: Masaki Aoki; 正樹青木; Toshihiro Hirabayashi; 平林　俊弘; Morie Sagawa; 佐川　守江; Shinya Miura; 信也三浦; Kazuhiko Suzuki; 一彦鈴木
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-12-02
Filing date: 1983-12-02
Publication date: 1985-06-27
Also published as: JPH0316666B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は、ベクトル処理装置をそなえた計算機において
、ループ処理をベクトル命令化して実行する処理方式に
関し、特に、多重ループ処理の場合にベクトル命令の並
行処理率を向上させるベクトル処理方式に関する。

〔技術の背景〕

たとえば行列演算や図形処理では、多数のデータに同一
処理を繰シ返して実行するループ処理が中心となり、こ
のような場合、ベクトル処理装置を利用することによっ
て、処理の高速化を図ることができる。このため、ソー
ス中のループ処理をベクトル命令に変換するためには特
別のコン・ぞイブが使用される。しかし、従来のこの稲
のコンパイラでは、多重ループの場合に、外側のループ
で前後の処理に同じメモリ領域へのアクセスが行なわれ
るとき、内側のループのみをベクトル命令化し、外側の
ループは逐次化処理を行なっていた。

たとえば１次のような２重ループ処理Ｄｏ　ＩＯＪ　＝　ｌ、　ＬＤＯｌｏｉ　＝　ｌ、　ＮＡ（ｉ、Ｊ＋１）＝Ａ（ｉ、Ｊ）十Ｂ（Ｌ、Ｊ）ｌＯＣ
ＯＮＴＬＮＵＥはｌ　Ｊ＝１．　２ｔ　・・・、Ｌで変化する外側のル
ープのそれぞれに対して、１＝＝１．２．・・・、Ｎの
内側のループを計算するものであり、コンパイラのベク
トル命令化処理フェーズで。

Ｄｏ　１０Ｊ＝−１，ＬＡ（茜、Ｊ＋１）＝Ａ（舛、Ｊ）＋Ｂ（≠、Ｊ）１ｏ　
ｃｏＮＴｉＮｕａのように変換される。式中のに印は、ベクトル処理を表
わしている。しかし、左辺のＡと右辺のＡとは、Ｊの回
転において、同一メモリ領域をアクセスすることになる
ため、すなわち任意のＪでストアしたメモリ領域のＡを
９次のＪの値でロードしなければならないため９次に、
コンパイラの最適化処理フェーズで、Ｊの各々の処理の
間の並行処理を禁止し、逐次化する操作が行なわれる。

このようにして９次のようなオブジェクトが生成される
。

（１）　ＶＬＶＬ　ＧＲ。

（２）α　ＶＰＴ（３）　ＶＷＴ（４）　ＶＬ　ＶＲｌ、　Ａ（＋、１　）（５）　ＶＬ
　Ｖ１’ｔ２．　Ｂ（＋、１）（６）　ＶＡＤＤ　ＶＢ
２．　ＶＲｌ、ＶＢ２（力　ＶＳＴ　ＶＢ２．　Ａ、（
−Ｘ、２）（８）　ＶＰＴ（９）　ＶＷＴＱｌ）　ＢＣＴ　α （１）はベクトル長の設定を表わし、まだ（４）はメモ
リ領域ＡのＪ＝１のベクトルデータをベクトルレジスタ
ＶＲＩにロードすること、（５）はメモリ領域ＢのＪ＝
１のベクトルデータをベクトルレジスタＶＲ２にロード
すること、（６）は上記ＶＲ１とＶＢ２のベクトルデー
タをベクトル加算して、結果をベクトルレジスタＶＲ３
に格納すること、（７）はＶＢ２のベクトルデータをメ
モリ領域ＡＫＪ＝２のベクトルデータとしてストアする
ことをそれぞれ表わしている。

またＱ［）はループを表わす。

そして、　（２）　、　（３）　、　（８）　、　（９
）はそれぞれ逐次化のだめの命令であり、ベクトルポス
ト（ｖＥＣＴＯＲＰＯ８Ｔ）命令ＶＰＴとベクトルウェ
イト（ｖＥｃＴｏＲＷＡ　Ｉ　Ｔ　）命令ＶＷＴとが使
用される。この２種類の命令を用いて、ベクトルポスト
命令ＶＰＴよシ以前の処理が終了するまでベクトルウェ
イト命令ＶＷＴの後の処理の開始を待たせることができ
る。

第１図は上記したオブジェクトをベクトル処理装置で実
行した場合のパイプライン動作のタイミング図であＪ）
　Ｓ　Ｊ　＝ｌ　ｌ　２までの処理を示したものである
。図示のようにＪ＝ｌとＪ＝２の処理とは、逐次化命令
ＶＰＴおよびＶＷＴにょシ逐次化されている。

しかし、ベクトル処理装置に、ベクトルレジスタとメモ
リ間でのストア、ロードを実行するアクセスパイプライ
ンが複数本設けられている場合には、たとえば第１図に
おいて、Ｊ＝１の“Ａ　（’　＊２）へのストア１とＪ
＝２の°Ｂ（誉、２）のロード″とは並行処理が可能で
あシ、またＪ＝２０“Ａ（芹、２）のロード″もＪ＝１
の“Ａ（誉、２）へのストア″に続けて処理することが
可能である。

このように、従来のベクトル処理方式では、多重ループ
の場合、内側ループの上端、下端にある命令の並列処理
が可能であっても考慮されることがなく、また、各ルー
プごとにＶＰＴ、ＶＷＴ　の命令実行が必要となるため
、処理効率が上らないという問題があった。

〔発明の目的および構成〕

本発明の目的は、多重ループのベクトル命令化処理にお
いて、逐次化不要のスカラ命令あるいはベクトル命令が
ある場合には逐次化命令で逐次化せず、対象命令ごとに
逐次化あるいは並行化できるようにする手段を提供する
ことにある。

本発明の構成はそれにより、ベクトル処理装置を有する
計算機において、実行すべきパイプラインを指定するパ
イプライン識別子を有するベクトル命令手段と、ベクト
ル命令実行時に上記・ぞイブライン識別子を復号化して
実行すべきパイプラインを選択する制御手段とをそなえ
、多重ループ処理においてベクトル命令同士の逐次化が
必要な場合に、それら各ベクトル命令のパイプライン識
別子に同一パイブラインの識別コードを設定することを
特徴としている。

〔発明の実施例〕

以下に９本発明の詳細を実施例にしたがって説明する。

第２図は９本発明の１実施例であるデータ処理装置の構
成図である。図中、１はメモリ、２はベクトル処理部、
３はスカラー演算部、４は命令制御部、５はアクセスパ
イプラインＡ、６はアクセスノぞイブラインＢ、７はベ
クトルレジスタ、８は演算パイプラインＡ′、９は演算
ノセイブラインＢ′を示すＯ各ノゼイプラインは識別子Ａ、Ｂをもち、ベクトル命令
は、これらの識別子を指定して、実行すべきパイプライ
ンを選択することができる。これによシ、たとえば相続
く２つのベクトル命令が並行処理を禁じられるべき場合
９両命令で同一パイブラインの識別コードを指定してお
くことによシ。

先行命令の実行が終了するまで後行命令の実行開始は不
可能となシ、自動的に逐次化処理を行なわせることがで
きる。

第３図は、命令制御部４における命令デコーダの一部を
示したもので、１０は命令レジスタ。

１１は識別子、１２はデコーダを示す。上記したパイプ
ライン識別子１１は命令フィールドの一部に設定されて
いる。命令制御部４は、この識別子のコードをデコーダ
により復号化して、パイプライン指定の有無、および指
定されたパイプラインを識別し、それにしたがってパイ
プラインの選択制御を行なう。

第４図は１本発明方式を使用する場合のコンノイブの最
適化処理フェーズを示したものである。

■　まず、外側ループから見て、ループ内の命令間での
オはランドの引用関係を把掴する。

■　外側ループ内の逐次化が不要な場合、すなわち、内
側ループ両端にある命令が同一のメモリ領域を使用しな
い場合には並行処理が可能であるから、不要な逐次化命
令ＶＰＴ、　ＶＶＶＴ　をループの外側へ移す■。

■　外側ループ内の逐次化が必要である場合には。

さらにベクトル命令同土間での逐次化が必要なのか、ス
カラー命令とベクトル命令との間での逐次化が必要なの
かを調べる。

■　スカラー命令とベクトル命令間での逐次化処理の場
合には、ループ内で逐次化を行なう。すなわち逐次化命
令ＶＰＴ、ＶＷＴ　はそのまま使用する。

■　ベクトル命令間での逐次化処理の場合には。

関連する各ベクトルと命令のパイプライン識別子を、適
当な同一のパイプラインを指定する値に設定する。

■　逐次化命令は不要となったので、ループから外へ移
す。

以上のようにして、逐次化命令の使用は、必要最小限に
抑えることができる。

第５図は、第１図に示した従来方式によるループ処理の
例に本発明方式を適用した場合のタイミング図である。

図中、矢印はパイプライン識別子による制御を示す。第
１図の場合と異なシ、逐次化命令ＶＰＴ、ＶＷＴは使用
されず、それにょシ＠Ｂ（誉、２）のロード″、゛Ａ（
舛、２）のロード”および“Ａ（誉、３）へのストア１
の実行を早めることができる。なお、上述した例は２重
ループ処理に関するものであるが、多重ループの任意の
レベルに適用できることはいうまでもない。

〔発明の効果〕

以上のように１本発明によれば、従来の多重ループのベ
クトルにおいて画一的な逐次化が行なわれていたものを
、ループ内での命令間のメモリアクセス関係の競合を把
掴して、必要に応じて命令ごとに個々に対処することに
より、並行処理の割合いを増加させることができ、処理
の高速化を図ることができる。

【図面の簡単な説明】

第１図は、従来のループのベクトル命令化処理における
パイプラインのタイミング図、第２図は本発明の１実施
例装置の構成図、第３図は命令デコーダの一部の説明図
、第４図はコンパイラの最適化処理フェーズの手順説明
図、第５図は本発明実施例におけるループのベクトル命
令化処理のパイブラインのタイミング図である。図中、１はメモリ、２はベクトル処理部、３はスカラー
演算部、４は命令制御部、５，６はそれぞれアクセスパ
イプラインＡ、Ｂ、γはベクトルレジスタ、８，９はそ
れぞれ演算パイプラインＡ’ＨＢ’、１０は命令レジス
タ、１１はパイプライン識別子、１２はデコーダを示す
。特許出願人　富士通株式会社代理人弁理士　長谷用　文　廣（外１名）１嘉 ↓ 第　５　図第　４　図

Claims

【特許請求の範囲】

ベクトル処理装置を有する計算機において、実行すべき
パイプラインを指定するーぐイブライン識別子を有する
ベクトル命令手段と、ベクトル命令実行時に上記パイプ
ライン識別子を復号化して実行すべきパイプラインを選
択する制御手段とをそなえ、多重ループ処理においてベ
クトル処理装置の逐次化が必要な場合に、それら各ベク
トル命令のパイプライン識別子に同一パイブラインの識
別コードを設定することを特徴とする多重ループのベク
トル処理方式。