JPS63285668A

JPS63285668A - ベクトルロ−ド処理方法

Info

Publication number: JPS63285668A
Application number: JP12151787A
Authority: JP
Inventors: Hideo Serizawa; 芹澤　英夫; Masaki Aoki; 正樹青木
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-05-19
Filing date: 1987-05-19
Publication date: 1988-11-22

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（概　要〕計算機のコンパイラの処理で、ベクトルレジスタの所要
数を減少する最適化のための、ベクトルロードの処理方
法である。

翻訳処理過程の中間コード列から、ベクトルロード命令
を検出し、ロードされたベクトルデータを参照する命令
のうち、先頭の参照命令の直前に該ベクトルロード命令
を移動し、その他の参照命令の直前には、同じベクトル
データのベクトルロード命令を生成して挿入し、それら
のロード先のベクトルレジスタと参照命令の参照ベクト
ルレジスタとが一致するように参照命令を修正する。

この方法により、ロードされたベクトルデータを保持す
るためにベクトルレジスタを占有している期間が短縮さ
れ、所要ベクトルレジスタ数を減少できる。

〔産業上の利用分野〕

本発明は、計算機プログラムを翻訳するコンパイラの処
理方法に係り、特に所要のベクトルレジスタ数を減少す
るための、ベクトルロードの処理方法に関する。

〔従来の技術〕

第３図は計算機の構成例を示すブロック図である。処理
装置１はコンパイラ２のプログラムを実行することによ
り、記憶装置３に格納されている原始プログラム４を翻
訳して目的プログラム５を記憶装置６へ出力する。

原始プログラム４は例えばＦＯＲＴＲＡＮプログラミン
グ言語で記述されたプログラムであり、コンパイラ２は
、この原始プログラムからいわゆるベクトルプロセッサ
で実行するようにベクトル化した目的プログラムを生成
することができる。

このために、コンパイラ２において、中間コード生成部
７が原始プログラム４を読み込んでプログラム文を解析
し、中間コード列１０を生成して記憶装置１１に出力す
る。

中間コード列の生成においてコンパイラはデータに記憶
領域を割り付け、又ベクトルデータの処理部分等でベク
トルプロセッサによる並列実行可能な部分を検出して、
ベクトルプロセッサで実行されるベクトル命令に対応さ
せるための、いわゆるベクトル化を行い、それらを所定
の中間コード列で表現する。

この中間コード列１０について、中間コード最適化部８
は、目的プログラムの実行効率等を改善するようにプロ
グラムを変更する最適化処理を実行し、その結果を目的
プログラム生成部９によって処理して、いわゆる機械語
のスカラ命令及びベクトル命令からなる目的プログラム
を生成し、目的プログラム５として出力する。

第４図に、公知のＦＯＲＴＲＡＮ言語で記述された原始
プログラム、及びそれから生成される中間コード列の一
例を示す。

図の原始プログラム１７は公知のように、ＤＯ文とラベ
ル「１０」のＣｏＮＴＩＮＵＥ文とに挟まれた２個の代
人文を、添字「■」の値を１から１００まで１づつ増加
させて、繰り返し実行することを指定する内容である。

従って、代入文のオペランドにあるＡ（Ｉ）、Ｂ（１）
、Ｃ（Ｉ）、−・−・のデータは、典型的なベクトルデ
ータであるので、このプログラムはベクトル化されて２
、中間コード列１８が生成される。

中間コード列１８ニおイテ、ｒＶＬＥＮＧ＝１００　Ｊ
　ハ＋れに続く中間コードで処理するベクトルデータの
ベクトル長（ベクトルの要素数）を示し、Ｂ（＊）、Ｃ
（＊）等の形式で指定の要素数の各ベクトルデータを示
す。

ｖｔｌ　、ｖｔ２等はベクトルプロセッサから割り当て
るべきベクトルレジスタを示し、従って例えばｒｖｔｌ
＝８（本）」等で示されるベクトルロード命令の中間コ
ード（以下では、単にベクトルロード命令というものと
し、その他の中間コードについても同様とする）は、ベ
クトルデータＢの１００個の要素データをベクトルレジ
スタνｔ１にロードするベクトル命令に対応する。

又ｒｖｔ３＝ｖｔｌ＋ｖｔ２　Ｊのような中間コードは
、それ以前のベクトルロード等の処理でベクトルレジス
タｖｔｌ及びｖｔ２にロードされているベクトルデータ
の要素間の加算結果のベクトルデータを、ベクトルレジ
スタｖｔ３に格納することを示す。

公知のように、ベクトルプロセッサは、いわゆるパイプ
ライン方式の演算機構によって多数の同種の演算を並列
に実行することによって高速処理を実現する処理装置で
あり、その特徴を有効に活用するには、なるべく大きな
味クトル長のベクトルデータの演算を行うようにベクト
ル化することが必要である。

そのためには、ＶＬＨＮＧで指定する必要な要素数のベ
クトルデータを格納できるベクトルレジスタを必要個数
膜けなければならないが、ベクトルプロセッサのパード
ウ亙ア構成上から、例えば８１９２要素のデータを格納
できる記憶装置を使用して、８分割して８個までの各１
０２４要素データを保持するベクトルレジスタとし、８
個で不足の場合は１６分割して、１６個までの各５１２
要素データを保持するベクトルレジスタとし、このよう
にして、３２個のベクトルレジスタに分割した場合は、
各保持できるデータ要素数は２５６に、６４個のベクト
ルレジスタにすればデータ要素数は１２８に減少するよ
うに構成される。

一般に、複雑な演算を要するプログラムになると、ＶＬ
ＥＮＧで指定された所要ベクトル長を有し、同時に必要
になるベクトルレジスタの個数は増加する。その結果、
必要なベクトルレジスタ数を得るために、可能なベクト
ル長が短くなる場合には、一連の演算の途中でベクトル
レジスタの内容を入れ換える等の処理が必要になり、そ
の結果前記パイプライン演算機構の処理効率を落さざる
を得ない状況が生じる。

従って、常に所要ベクトルレジスタ数をできるだけ減少
させる処置をとることが望ましく、このための中間コー
ド最適化処理の方式が、本出願人の特許願（特願昭６１
−３９６７３号）の明細書に開示されている。

即ち、第５図に示す最適化処理において、処理ステップ
２０で１つのＶＬＥＮＧで指定されたベクトル長の有効
範囲で、同時に必要になるベクトルレジスタ個数の状況
を把握し、処理ステップ２１で中間コード列を走査して
ベクトルロード命令の１つを検出する。

処理ステップ２２で、検出したベクトルロード命令に続
く中間コードを走査して、そのベクトルロード命令でロ
ードされたベクトルレジスタを参照しているベクトル演
算命令（以下において参照命令という）を検出し、処理
ステップ２３でベクトルロード命令を参照命令の前のな
るべく近傍、通常は直前の位置、に移動することによっ
て、ベクトルレジスタの所要数を減少できるが識別し、
可能であれば処理ステップ２４でベクトルロード命令を
その位置へ移動する。

この処理により、例えば第６図（ａ）の中間コード列１
２の例のベクトルロード命令１３と参照命令１４との場
合のように、ベクトルロード命令でロードされたベクト
ルレジスタ（図の例ではｖｔｌ）をはじめて参照するベ
クトル演算命令が、ベクトルロード命令から離れた位置
にある場合に、ら）の中間コード列１５に示すように、
そのベクトルロード命令１３を、参照命令１４の直前の
位置に移動することにより、中間コード列１３のプログ
ラム区間１６において必要となるベクトルレジスタの個
数を減少することができる。

〔発明が解決しようとする問題点〕

ベクトル化される原始プログラムの前記００文によるル
ープが大規模になると、その中間コード列の１つのベク
トルロード命令に対応する参照命令が複数存在し、それ
らがプログラム中に分散している場合がしばしば生じ、
そのような場合には、前記の最適化処理による、１参照
命令に関するベクトルロード命令の移動のみでは、ベク
トルレジスタ数を減少する効果が局限され、十分な効果
を期待出来ないという問題がある。

〔問題点を解決するための手段〕

第１図は、本発明の構成を示す処理の流れ図である。

図はコンパイラにおける所要ベクトルレジスタ数を減少
するための最適化処理の流れを示し、３０〜３８は処理
ステップを示す。

〔作　用〕

コンパイラは中間コード列について、所要ベクトルレジ
スタ数を減少するための最適化処理を、第１図の処理ス
テップ３０〜３４において、従来のようにベクトルロー
ド命令を検出し、それに対応する参照命令を検索して、
最適化できるなら参照命令のなるべく近傍にベクトルロ
ード命令を移動するように実行する。

次に処理ステップ３５で、後続の中間コード列から更に
参照命令を検索し、参照命令があれば処理ステップ３６
〜３８で、最適化ができる場合には前記ベクトルロード
命令と等価なベクトルロード命令を生成して参照命令の
近傍に挿入するための処理を行い、所要の範囲の中間コ
ード列について以上の処理を続ける。

以上の処理方法により、１つのベクトルロード命令に対
応する複数の参照命令が分散している場合にも、所要ベ
クトルレジスタ数を減少する最適化の効果を上げること
ができる。

〔実施例〕

第１図の処理の流れにおいて、処理ステップ３０〜３４
は前記従来の処理ステップ２０〜２４の各処理と同様と
し、その結果ベクトルレジスタ数を減少する最適化が可
能な場合には、ベクトルロード命令が参照命令の近傍に
移動される。

次に本発明により、処理ステップ３５で上記参照命令に
後続する中間コード列について、更に参照命令の検索を
続ける。

検索の結果、参照命令があった場合には、処理゛　ステ
ップ３６において、検出しであるベクトルロード命令と
等価なベクトルロード命令を生成して、その参照命令の
前の適当な近傍に挿入することにより、検出しであるベ
クトルロード命令でロードされたベクトルレジスタを、
その前の参照命令の後も引き続いて占有する必要がない
ようにすることによって、ベクトルレジスタ所要数の減
少が得られるか判定する。

その結果ベクトルレジスタ数減少効果があれば処理ステ
ップ３７で上記のようなベクトルロード命令の挿入を行
う。

ニーで、検出したベクトルロード命令と等価なベクトル
ロード命令とは、前者と同一のベクトルデータをロード
するが、ロード先とするベクトルレジスタは必ずしも同
一ではないベクトルロード命令を意味するものとし、挿
入するために生成するベクトルロード命令のロード先ベ
クトルレジスタには、使用状況を考慮して適当なベクト
ルレジスタを割り当てる。

その結果、参照命令の修正が一般に必要になり、処理ス
テップ３８において参照命令の参照オペランドに指定し
である、該当のベクトルレジスタ塩を、挿入したベクト
ルロード命令で割り当てたベクトルレジスタ塩に変更す
る。

その後処理ステップ３５に戻り、以上の処理ステップ３
５〜３８の処理を参照命令がある間反復し、処理ステッ
プ３５でＶＬ［！ＮＧ命令の有効範囲の中間コード列の
残りの範囲を検索して、参照命令が無かったことにより
処理を終わる。

第２図の中間コード列４０はベクトルロード命令４１に
対応する参照命令が４２〜４４のように複数個分散して
いる例を示し、中間コード列４５は、中間コード列４０
から前記の最適化処理によって更新された結果の例であ
る。

この例は、何れの参照命令についても最適化処理が有効
と判定された場合とし、中間コード列４５において、ベ
クトルロード命令４１は参照命令４２の直前に移動され
、参照命令４３及び４４の直前にはベクトルロード命令
と等価なベクトルロード命令４６及び４７がそれぞれ挿
入される。

挿入されるベクトルロード命令４６．４７のロード先ベ
クトルレジスタには、それぞれ適当に割り当てたベクト
ルレジスタｖｔＸ　％　Ｖｊｙが指定されるので、それ
に応じて参照命令４３．４４の参照オペランドの１つが
、それぞれ参照命令４８．４９として示すように、それ
ぞれｖｔ、及びｖｔ、に変更される。

〔発明の効果〕

以上の説明から明らかなように本発明によれば、ベクト
ル化した目的プログラムを生成するコンパイラにおいて
、同時に必要になるベクトルレジスタの個数を減少する
最適化の効果を向上することができるので、より実行効
率の良い目的プログラムの生成が可能になるという著し
い工業的効果がある。

【図面の簡単な説明】

第１図は本発明の構成を示す処理の流れ図、第２図は本
発明の詳細な説明する図、第３図は計算機の構成例ブロック図、第４図は中間コード列の説明図、第５図は従来の処理の流れ図、第６図は従来の処理例を説明する図である。図において、１は処理装置、　　　　　２はコンパイラ、３．６．１
１は記憶装置、４．１７は原始プログラム、５は目的プ
ログラム、　７は中間コード生成部、８は中間コード最
適化部、９は目的プログラム生成部、１０．１２．１５．１８．４０．４５は中間コード列、
２０〜２４．３０〜３８は処理ステップ本発明の構成を
示す処理の流れ図第１図本発明の詳細な説明する図第２図計算機の構成例ブロック図第３図中間コード列の説明図第４図従来の処理の流れ図第５図

Claims

【特許請求の範囲】原始プログラムを翻訳して、ベクトル化された中間コー
ド列を生成し、該中間コード列を最適化処理して目的プ
ログラムを生成するコンパイラにおいて、該中間コード列から、ベクトルデータをベクトルレジス
タにロードするベクトルロード命令を検出し（３０、３
１）、該ベクトルレジスタによって該ベクトルデータを参照す
る命令のうちの、先頭の該参照命令の近傍に該ベクトル
ロード命令を移動し（３２〜３４）、該先頭の参照命令
以外の各該参照命令の近傍に、該ベクトルデータをロー
ドするベクトルロード命令をそれぞれ挿入し（３５〜３
７）、各該参照命令の参照するベクトルレジスタを、各該挿入
されたベクトルロード命令がロードするベクトルレジス
タと一致するように変更する（３８）ことを特徴とする
ベクトルロード処理方法。