JPH0256065A

JPH0256065A - 多重ループ最適化処理方法

Info

Publication number: JPH0256065A
Application number: JP63206774A
Authority: JP
Inventors: Masaki Aoki; 正樹青木; Yasuhiro Fukushima; 康博福島
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1988-08-20
Filing date: 1988-08-20
Publication date: 1990-02-26

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概、要〕計算機における、原始プログラムの多重ループをベクト
ル化目的プログラムに最適化する処理に関し、実行効率の良いベクトル化目的プログラムを得ることの
できる多重ループ最適化処理方法を目的とし、計算機の原始プログラムを翻訳して目的プログラムを生
成するための、該原始プログラムの多重ループの解析処
理において、該多重ループが最内のループ以外のループ
に実行文を有する場合に、該実行文を有するループのう
ちの最外側のループが所定の条件を満足する場合には、
すべての該実行文を該最内ループの中に組込み、該最外
側のループを最内ループとするように多重ループの構成
を変更し、新たな該最内ループの制御変数に基づいて各
該実行文をベクトル化し、各該ベクトル化した実行文を
、該実行文に残存する制御変数に関与しないループの外
側に移すように構成する。

〔産業上の利用分野〕

本発明は、計算機における、原始プログラムの多重ルー
プをベクトル化目的プログラムに最適化する処理方法に
関する。

ベクトル処理装置は、配列データに関する演算をいわゆ
るパイプライン制御方式によって連続的に処理すること
により高速化される処理装置であり、ベクトル処理装置
を利用するシステムでは、コンパイラによる原始プログ
ラムの翻訳処理において、所要の部分のプログラムをベ
クトル処理装置で実行するように、ベクトル命令で構成
した目的プログラムにするベクトル化を行う。

この場合にベクトル処理装置の処理効率を考慮して、な
るべく長いベクトルについて同じ処理が連続するような
構成にプログラムを最適化することが望まれる。

〔従来の技術と発明が解決しようとする課題〕ベクトル
処理装置で処理されるべきプログラムは、例えばＦＯＲ
ＴＲＡＮプログラミング言語で記述された原始プログラ
ムにおいて、公知のいわゆるＤＯループとして示される
部分であり、このループの繰り返しを制御する制御変数
であるＤｏ変数によって識別されるループ内のデータを
、各要素とするようにベクトルデータを構成することに
よりベクトル化が行われる。

このような００ループの中に更にＤＯループが入れ子に
なっている構成の、いわゆる多重ＤＯループのプログラ
ムの場合には、最内側のループの中のみにプログラムの
実行文があるように多重ループの構成を変更して（この
処理を多重ループのタイトリー化という）、その最内ル
ープのＤＯ変数によってベクトル化する。

第３図は従来からタイトリー化処理に使用されているル
ープ分割法による、タイトリー化処理例の説明図である
。

第３図（ａ）はＤｏ変数■のＤＯループ（矢印１で範囲
を示す）の中に、Ｄｏ変数ＪのＤＯループ（矢印２で範
囲を示す）がある例であり、この２重ループでは、２で
示される最内ループの外にも実行文３があるので、最内
ループのみに実行文があるように変更するために、（ｂ
）に示すようにループを分割することによって、それぞ
れのループでは最内ループのみに実行文があるようにす
る。

次に例えば各分割部分に共通なりＯ変数のループが最内
ループになるように内外ループを入れ換えて、（Ｃ）に
示すように最内ループのＤｏ変数によりベクトル化する
。なお、図において＊は、別に指定される範囲の当該デ
ータを、ベクトル命令のオペランドのベクトルデータと
することを示すものとする。

これから生成される目的プログラムは、最初のベクトル
実行文について、例えば、［相］ロード命令により、浮動少数点レジスタＦＲＯに
定数１．０をロードし、 ■ベクトルロード命令により、ベクトル処理装置のベク
トルレジスタＶＲＩにＦＲＯの内容をロードし、＠ベクトルストア命令により、ＶＲＩの内容を主記憶の
ベクトルＡ（＊）の領域ヘスドアする。

又、次のループについて、例えば次のプログラム［相］
〜ＯをＪ＝１からＮまで繰り返すループになるように構
成する。即ち、［相］ベクトルロード命令により、ベクトルレジスタＶ
ＲＩに、主記憶からベクトルＡをロードし、■ベクトル
ロード命令により、ベクトルレジスタＶＲ２に、主記憶
からベクトルＣ（＊、Ｊ）をロードし、■ベクトル加算
命令により、ＶＲＩとＶＲ２を加算して結果をベクトル
レジスタＶＲ３に置き、◎ベクトルストア命令により、
ＶＲ３の内容を主記憶のベクトルＢ（ネ１Ｊ）の領域ヘ
スドアする。

以上のように生成したプログラムについて、ベクトルロ
ード命令［相］の実行結果はループ内で変化しないので
、ループの外に出すことによりループを短くして高速化
する。

しかし、プログラム＠１〜０と＠１〜０とを通して見れ
ば明らかなように、ベクトルストア命令０でＶＲＩ　と
ベクトルＡ（＊）の内容が同一にされるので、ＶＲＩの
内容をそのま＼使用してベクトル加算命令◎を実行する
ことにすればベクトルロード命令［相］を削除して更に
高速化できるが、ループ分割によりベクトル化の解析範
囲が分割されているので、これを検出することができな
い。

又、第４図（ａ）に示すように、第３図（ａ）と同等の
処理について、単純変数Ｘを仲介してデータ受は渡しを
行うように記述されたプログラムの場合には、第４図（
ｂ）に示すように、そのま＼ループ分割したのでは元の
処理論理と異なってしまうので、ループ分割に当たって
単純変数を配列化（図の例は配列ＤＶＴを設ける）しな
ければならず、更にその場合に図の例のようにループの
繰り返し数が実行時に動的に定まる場合には、ＤＶＴの
領域を動的に確保し、解放する処理（図のＡＬＬＯＣＡ
ＴＥ及びＦＲＥＥ文）を挿入するためにオーバヘッドを
増加する。

本発明は、多重ループのベクトル化における従来の前記
問題点を解決して、実行効率の良いベクトル化目的プロ
グ、ラムを得ることのできる多重ループ最適化処理方法
を目的とする。

〔課題を解決するための手段〕

第１図は、本発明の構成を示す処理の流れ図である。

図は原始プログラムを翻訳して目的プログラムを生成す
るコンパイラのベクトル化処理における、多重ループ最
適化の処理の流れを示し、１０〜１７は処理ステップで
ある。

〔作　用〕

計算機の原始プログラムを翻訳して目的プログラムを生
成するために、原始プログラムの多重ループを解析する
場合に、処理ステップ１０で多重ループを検出し、処理
ステップ１１でその多重ループが最内のループ以外のル
ープに実行文を有することを識別すると以下の処理を行
う。

処理ステップ１２〜１３において、最内ループ以外の実
行文を有するループのうちの最外側のループが所定の条
件を満足するか識別し、条件を満足する場合は処理ステ
ップ１４ですべての該実行文を最内ループの中に組込む
。

次に処理ステップ１５で前記の最外側ループを最内ルー
プとするように多重ループの構成を変更し、処理ステッ
プ１６で最内ループの制御変数に基づいて各実行文をベ
クトル化し、処理ステップ１７でそれらの実行文を、実
行文に残存する制御変数に関与しないループの外側に移
す。

以上の処理方法により、実行効率の良いベクトル化目的
プログラムを得る多重ループの最適化が可能になる。

〔実施例〕ベクトル処理装置で実行する目的プログラムを生成する
ためのコンパイラの処理で、原始プログラムの多重ルー
プを解析して最適化する場合に、コンパイラは第１図の
処理ステップ１０でプログラムを走査して多重ループを
取り出すと、処理ステップ１１でその多重ループがタイ
トリーか、即ち最内ループにのみ実行文のある多重ルー
プか判別し、もしタイトリーな場合は本発明の処理を必
要としないので次の処理に分岐する。

タイトリーでない場合には、処理ステップ１２で最内ル
ープ以外にある実行文を含む最も外側のループを検出し
、処理ステップ１３でその検出したループが、そのルー
プの制御変数によってベクトル化した場合に最も効率の
良いベクトル化ができるループか判定する。

この判定は、例えばそのループの繰り返し回数が最も多
い場合、又はその制御変数が、多次元配列データの第１
次元目の添字になっている（その場合には、ベクトル化
したとき主記憶上で連続する番地のデータがベクトルデ
ータなるので、一定の間隔でデータを拾う場合より効率
よく処理できる）場合等を条件とする。

以上の判定条件を何れも満足しない場合には、本発明の
処理に適さない多重ループとして、例えば従来のループ
分割法による処理に分岐する。又判定条件を満足した場
合には処理ステップ１４に進み、この多重ループのすべ
ての実行文を最内ループに組み込む。

次に処理ステップ１５で、処理ステップ１２で検出した
ループを最内ループとするようにループを入れ換え、処
理ステップ１６でこの新たな最内ループの制御変数によ
って最内ループ内の実行文をベクトル化する。

その後、処理ステップ１７でベクトル化した各実行文に
ついて、実行文に残存するループの制御変数に着目して
、その制御変数に関係しない最も外側のループの外に、
その実行文を移す。即ち、ループの繰り返しに亙って実
行結果が不変な実行文をそのようなループの外に移すこ
とにより、不必要な繰り返し実行を削減する。

第２図は、以上の処理をプログラム例によって説明する
図である。第２図（ａ）は第４図で説明したと同様の原
始プログラムであり、外側にある実行文ｒＸ＝Ａ　（Ｉ
）Ｊを最内ループに組み込んで（ｂ）のようにし、外側
のループを最内ループにするようにループを入れ換えて
（Ｃ）にし、この最内ループの制御変数Ｉによってベク
トル化して（ｄ）を得る。

こ−でｖｔはベクトルレジスタを示す。

次にベクトル化した実行文を検査すると、最初の実行文
ｒｖｔ＝Ａ　（＊）　Ｊはループの制御変数Ｊに関係無
く、このループの繰り返し中不変であるので、このルー
プの外に移して（ｅ）を得る。

〔発明の効果〕

以上の説明から明らかなように本発明によれば、計算機
の原始プログラムの多重ループをベクトル化目的プログ
ラムに最適化する処理において、実行効率の良いベクト
ル化目的プログラムを得ることができるという著しい工
業的効果がある。

【図面の簡単な説明】

第１図は本発明の構成を示す処理の流れ図、第２図は本
発明による処理例の説明図、第３図は従来の処理例の説
明図、第４図は従来の処理例の説明図である。図において、１０〜１７は処理ステップ本発明の構成を示す処理の流れ図第１図本発明の詳細な説明図第２図

Claims

【特許請求の範囲】計算機の原始プログラムを翻訳して目的プログラムを生
成するための、該原始プログラムの多重ループの解析処
理において、該多重ループが最内のループ以外のループに実行文を有
する場合に（１０、１１）、該実行文を有するループの
うちの最外側のループが所定の条件を満足する場合には
（１２〜１３）、すべての該実行文を該最内ループの中
に組込み（１４）、該最外側ループを最内ループとするように多重ループの
構成を変更して（１５）該最内ループの制御変数に基づ
いて各該実行文をベクトル化し（１６）、各該ベクトル
化した実行文を、該実行文に残存する制御変数に関与し
ないループの外側に移す（１７）ように構成されている
ことを特徴とする多重ループ最適化処理方法。