JPH0142019B2

JPH0142019B2 -

Info

Publication number: JPH0142019B2
Application number: JP5548183A
Authority: JP
Inventors: Koichiro Hotsuta; Yukio Kamya; Masaaki Takiuchi; Toshihiro Hirabayashi; Masaki Aoki
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-03-31
Filing date: 1983-03-31
Publication date: 1989-09-08
Also published as: JPS59180668A

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は、複数の並列演算部を備えてベクトル
命令を処理するベクトル処理プロセツサに係り、
条件付命令の実行に際し、各エレメントに対して
命令を実行するか否かを示す情報として与えられ
たマスク情報のベクトル長単位のオンの数を基
に、マスク付命令で実行するか、データのベクト
ル長短縮処理をして実行するか、或いはスキツプ
するかを選択するようにした条件付命令の実行時
命令選択方式に関するものである。

〔従来の背景と問題点〕

第１図はベクトル処理プロセツサを有する処理
システムの１例を示す図、第２図はベクトル命令
に対応した処理を概念的に説明する図、第３図は
ベクトル処理プロセツサに対して、与えられたソ
ース・プログラムから目的プログラムを生成して
供給するコンパイラの構成例を示す図、第４図は
ソース・プログラムを中間テキストに移してゆく
態様を説明する図、第５図はソース・プログラム
をベクトル化してゆく態様を説明する図、第６図
ないし第８図はIF文を含むソース・プログラム
に対して文マスクやパス・マスクを用意して並列
実行可能な形にしてゆく態様を説明する図であ
る。

例えば、第１図Ａに示す如く、ベクトルＡに属
するエレメントa₁，a₂，……とベクトルＢに属す
るエレメントb₁，b₂，……との各エレメント相互
を加算して、エレメントc₁，c₂，……をもつベク
トルＣを生成するような、ベクトル命令を実行す
るベクトル処理プロセツサが存在している。第１
図Ａ図示の場合、第ｉ番目のエレメント相互の加
算を行なうか否かをマスク・エレメントm₁，
m₂，……にて指示するようにされており、第１
図Ｂに一般化して示す如き処理が行なわれる。

上記の如き処理を行なうベクトル処理プロセツ
サを有するデータ処理システムは、一実施例とし
て第２図図示の如きシステム構成をもつている。
図中の符号１は主記憶装置、２はメモリ制御装
置、３はベクトル処理プロセツサ、４はチヤネ
ル・プロセツサ、５は大記憶装置、６はスカラ処
理回路部、７はベクトル処理回路部、８−０、８
−１、…は夫々浮動小数点データ・レジスタ、９
−０、９−１、…は夫々複数個のデータ（エレメ
ント・データ）を格納し得るベクトル・レジス
タ、１０−０、１０−１、…は夫々複数個のマス
ク・データ（マスク・エレメント・データ）を格
納し得るマスク・レジスタ、１１はベクトル長レ
ジスタであつて各ベクトル・レジスタに格納され
るエレメントの個数情報がセツトされるもの、１
２−０、１２−１は夫々メモリ・アクセス・パイ
プライン、１３は加減算パイプライン、１４は乗
算処理パイプライン、１５は除算処理パイプライ
ン、１６はマスク処理パイプラインを表わしてい
る。

上記の如きベクトル処理プロセツサが処理を実
行するに当つて、当該プロセツサが実行するに適
した形に、与えられたソース・プログラムをコン
パイルし目的プロセツサを生成することが行なわ
れる。当該コンパイルを行なうコンパイラの構成
を示したのが第３図である。

第３図において、１７は大記憶装置に格納され
ているソース・プログラム、１８はコンパイラ、
１９はコンパイルされて大記憶装置上に格納され
る目的プログラム、２０はソース解釈部、２１は
記憶域割付け部、２２はベクトル化部、２３は中
間テキスト最適化部、２４はレジスタ使用決定
部、２５は目的プログラム出力部を表わしてい
る。

コンパイラ１８は、大記憶装置からソース・プ
ログラム１７を取込んで、所望の目的プログラム
１９を生成する。このとき図示の各部は次のよう
な処理を行う。

即ち、ソース解釈部２０はソース・プログラム
１７を大記憶装置から取込み、文解釈を行つて中
間テキストに展開する。例えばソース・プログラ
ムが第４図図示左側の如き場合に図示右側に示す
如き中間テキストに展開する。記憶域割付け部２
１はプログラム内に出現する各種データに対応し
て記憶域内番地を割当てる。ベクトル化部２２
は、プログラム中のループ構造を検出し、並列実
行可能部分を認識し、第５図図示の如く中間テキ
スト変更を行う。中間テキスト最適化部２３は、
中間テキストのレベルで、第２図図示の如きベク
トル処理プロセツサを有効に利用するための最適
化を施す。レジスタ使用決定部２４は、中間テキ
ストに現われたデータに対して、ベクトル処理プ
ロセツサ上の資源（レジスタ）を割当てる。そし
て目的プログラム出力部２５は機械命令語を大記
憶装置へ出力しかつ命令語レベルでの最適化を行
う。

ベクトル処理プロセツサを稼動させるためのコ
ンパイラは第３図図示の如き構成をもつており、
ループ構成内にIF文をもたないプログラムにつ
いては第５図に概念的に示した如く並列実行可能
な形にして処理してゆくことが可能である。しか
し第６図に示す如きソース・プログラムが与えら
れると、当該ループ構成の中に「IF（Ａ(I)．GT.
B(I)）GO TO 50」などのIF文が存在することか
ら、従来このようなループ構成については一般に
は並列実行可能な状態にないものとして処理され
ていた。しかし、当該プログラムの場合、IF文
の飛び先がループ内に止まつており、プログラム
中の個々の文について個々の処理に当つて当該文
を実行するか否かを文マスクmiにて指示する手
法を採用することによつて並列実行可能となるこ
とが判つた。その文マスクmiを与えるコンパイ
ラ処理方式は、既に本願と同一の出願人により先
行発明（特願昭57−31198号）として提案されて
いる。以下にその概要を第６図ないし第８図を参
照しつつ説明する。

第６図図示のプログラムは、概略次の如き処理
を指示している。即ち、Ｉの値が「１」から
「Ｎ」になるまで繰返して文₁₀ないし文₇₀を実行
することを指示し、その間に文₂₀によつて或るＩ
の値のときＡ(I)がＢ(I)よりも大となるならば文₅₀
に飛び、また文₄₀によつて或るＩの値のときＢ(I)
がＹよりも大となるならば文₆₀に飛ぶことを指示
している。上記文マスクは、例えば文₃₀に対応し
て「Ａ(I)．GT.B(I)」なる条件以外のとき、当該
文₃₀を実行するよう指示すれば、IF文が第８図図
示の如く消減する形となる。

第７図は、第６図図示のプログラムを構成する
各文₁₀ないし文₇₀に対して、どのような文マスク
m₁₀ないしm₇₀を与えるかを説明する説明図を示
している。

文₁₀の場合にはＩの値の如何に拘らず、すべて
のＩについて実行する必要がある。このことから
文マスクm₁₀としてφ（空）となる。文₂₀の場合も
m₂₀としてφとなる。文₂₀から文₅₀へ飛ぶルート
は文₂₀の条件「Ａ(I)．GT.B(I)」のときにとられ
るもので、当該パスに対してバス・マスクP₂₀，₅₀
として P₂₀，₅₀＝Ａ(I)．GT.B(I) が与えられ、一方同様にパス・マスクP₂₀，₃₀とし
て P₂₀，₃₀＝₂₀，₅₀ が与えられる。この結果から文₃₀に対応する文マ
スクm₃₀は m₃₀＝₂₀，₅₀ となる。

文₄₀についての文マスクm₄₀はm₃₀と同じもの
となる。同じようにして、パス・マスクP₄₀，₆₀や
P₄₀，₅₀が図示の如く与えられ、文マスクm₅₀は、
パス・マスクP₂₀，₅₀とP₄₀，₅₀との論理和をとつた
ものとなる。そして文マスクm₆₀，m₇₀はφとな
る。

このような文マスクmiを与えると、第６図図
示のプログラムは、第８図図示プログラムの如
く、IF文が存在しない形となつて、並列実行可
能な形となる。なお、第８図において、「：」を
付して示した所の「：M₂」、「：M₅」は対応する
文についての文マスクであると考えてよい。

このように一般には、(i)IF文を含むループ内
の各文に対応して文マスクを例えばｉ番目の文に
対して文マスクmiとして与え、かつ(ii)当該第ｉ
番目の文がIF文でない場合に第（ｉ＋１）番目
の文に向うパスに対しパス・マスクPi，ｉ＋１と
し値miを与え、(iii)当該第ｉ番目の文がIF文であ
る場合に当該IF文の条件をCiとするとき条件成
立によつて飛ぶ所の飛び先の第ｋ番目の文へのパ
スに対してパス・マスクPikとして mi・AND.Ci を与え、(iv)当該第ｉ番目の文がIF文である場合
に当該IF文の条件Ciの条件不成立によつて飛ぶ
所の飛び先の第ｋ番目の文へのパスに対してパ
ス・マスクRikとして mi・AND・を与え、（）上記文マスクm_iを与えるに当つ
て、上記パス・マスクを調べて第ｉ番目の文へ至
るパスに対応するパス・マスクPliについての論
理和をとる、即ち m_i＝Ｕｌ Pli（ｌ≠ｉ）で与えるようにし、IF文を含んでいる場合でも
並列実行可能な範囲を増大せしめるようにコンパ
イルする。

このようなマスク情報による条件付命令の実行
は、マスクの状態がどうであれ、ペクトル長分の
時間がかかつてしまう。ところが、マスクのオン
の数が非常に少ない命令、或いは全てのオフのマ
スクを持つ命令がある程度は現われるため、その
分の実行時間に無駄が生じるという問題がある。

〔発明の目的〕

本発明は、上記の考察に基づくものであつて、
マスクのオンの数を認識することによりオンの数
が少ない命令の実行時間を短縮することができる
条件付命令の実行時選択方式を提供することを目
的とするものである。

〔発明の構成〕

条件付命令の実行時選択方式は、複数の並列演
算部を備えてベクトル命令を処理するベクトル処
理プロセツサを有するデータ処理システムにおい
て、上記ベクトル処理プロセツサは、条件付命令
の実行に際し、各エレメントに対して命令を実行
するか否かを示すマスク情報とベクトル長単位で
マスクのオンの数とがセツトされると、上記マス
クのオンの数を調べ、マスクのオンの数が０であ
ることを条件に当該命令の実行をスキツプし、マ
スクのオンの数が所定の閾値より小さいことを条
件にベクトル長短縮処理命令を使つてマスクがオ
ンの部分のみを取出して新しいベクトル・データ
を作つてベクトル演算を行い、しかる後当該ベク
トル演算の結果をマスクがオンの部分に取り込む
ようにし、マスクのオンの数が所定の閾値より大
きいことを条件にマスク付命令を使つてマスクが
オンの要素の演算を行うように構成されたことを
特徴とするものである。

〔発明の実施例〕

以下、本発明の実施例を図面を参照しつつ説明
する。

第９図は本発明の１実施例構成を示す図、第１
０図は本発明に使用される条件付命令の実行方式
を説明する図、第１１図は第１０図に示す条件付
命令の実行方式に対応するベクトル・テキストを
示す図、第１２図は本発明が適用されるマスク・
レジスタの設定例を示す図、第１３図は本発明に
よる命令実行時の処理の流れを説明する図であ
る。図において、２６は命令バツフア・レジス
タ、２７はデコーダ、２８はマスク・レジスタ
（MR；Mask Register）、２９は一致回路、３０
は比較回路、３１は閾値設定部
（THRESHOLD）、３２と３３はインバータ、３
４はブランチ処理部、３５はマスク処理への分岐
処理部、３６は圧縮／拡散処理への分岐処理部を
示す。

第９図において、マスク・レジスタ２８は、ベ
クトル長毎のマスク情報と共にマスクのオンの数
を示す情報（MSR；Mask Status Register）が
書き込まれるものであり、命令バツフア・レジス
タ２６に格納された命令をデコーダ２７によりデ
コードされたマスク定義命令に基づいてセツトさ
れる。一致回路２９は、デコーダ２７からの実行
命令に従つて、マスク・レジスタ２８のMSRの
内容が０か否かを調べるものであり、０（Yes）
の場合にはブランチ処理部３４を作動させ、０で
ない場合にはインバータ３２を通して比較回路３
０を動作させる。ブランチ処理部３４は、命令の
実行は行わないスキツプ処理を行うものである。
即ち、ここでは、条件付命令の実行時に、MSR
の内容が０（全てオフのマスクを持つ命令）の場
合には命令の実行は行わないようにするものであ
る。比較回路３０は、マスク・レジスタ２８の
MSRの内容が閾値以上であるかを調べるもので
あり、MSRの内容が閾値以上である場合にはマ
スク処理への分岐処理部３５を動作させ、そうで
ない場合には圧縮／拡散処理への分岐処理部３６
を動作させる。マスク処理への分岐処理部３５
は、マスク付演算方式を採用した処理を行うよう
にするものであり、圧縮／拡散処理への分岐処理
部３６は、圧縮／拡散方式を採用した処理を行う
ようにするものである。次にこれらの方式につい
て説明する。

ベクトル処理プロセツサには、マスク付ベクト
ル演算の他に、IF文のような条件文を処理する
のに適した命令として、ベクトル長短縮処理命令
がある。本発明はこのベクトル長短縮処理命令を
使つて実現するものであるが、以下では代表して
その１つ圧縮／拡散命令を使つた例で説明する。
マスク付命令（条件付命令）では、例えば、 VT１←VT２ OP VT３；mt （mtは条件を示すマスク情報）とある場合に、mtの内容（オン又はオフ）によ
つて、その要素の演算を実行するかしないかを決
定する。しかし実行しない要素に対しても実行し
た時と同じ時間がかかる。一方、圧縮／拡散命令
では、例えば、 VT２′comp ←―――― VT２：mt VT３′comp ←―――― VT３：mt VT１′←――――VT２′ OP VT３′ VT１exp ←――― VT１′：mt comp ←―――― はベクトル・データの圧縮 exp ←――― はベクトル・データの拡散を示す。

とある場合に、圧縮は、mtの内容がオンの部分
のみを取り出して新しいベクトル・データ（VT
２′，VT３′）をつくり、拡散は、mtの内容がオ
ンの部分にVT１′の内容を取り込むものである。
このときの演算は、mtのオンの数をベクトル長
として実行できる。条件付の演算、例えば、 Ai＋Bi：mi：ｉ＝１，２、……８についての操作の様子を示したのが第１０図であ
る。第１０図において、Ａがマスク付命令を使つ
たマスク付演算方式について示したものであり、
Ｂが圧縮／拡散命令を使つた圧縮／拡散方式につ
いて示したものである。これらの２方式を比較す
ると、圧縮／拡散方式は、前後の圧縮及び拡散処
理が補助操作として必要になり、その分の時間が
かかるものの、演算そのものの実行はオンの数
（true率又は真率）に応じた時間でよいため、
true率が小さい時には効果がある。他方マスク付
演算方式は、演算時間はベクトル長分かかるが、
補助操作がないのでtrue率が高い場合に有効であ
る。これらの方式を採用するベクトル・テキスト
の例を示したのが第１１図である。第１１図にお
いて、Ａがマスク付演算方式の場合の例を示した
ものであり、Ｂが圧縮／拡散方式の場合の例を示
したものである。

本発明が適用されるマスク・レジスタの設定例
を示したのが第１２図である。第１２図におい
て、マスク・レジスタMR０ないしMR３は、ベ
クトル長６の場合の例を示し、マスクのオンの数
を示す情報MSR０ないしMSR３を持つている。
例えば、マスク・レジスタMR１の場合にはマス
ク付命令を使つて実行され、マスク・レジスタ
MR２の場合にはMSR２内容が０であるからス
キツプされ、マスク・レジスタMR３の場合に
は、MSR３の内容がベクトル長６に比べて非常
に小さいので圧縮／拡散命令を使つて実行され
る。

次に条件付命令の実行時の処理の流れを第１３
図を参照しつつ説明する。

マスク・レジスタ（MR、MSR）への情報
をセツトする。次にの処理を行う。

MSR＝０かどうかを調べる。

Yesの場合には実行をスキツプして処理終了
としNoの場合にはの処理を行う。

閾値をベクトル長＊γ（γ＜１）とすると、
MSRの内容が閾値より大きいか否かを調べる。

Yes（真率が高い）の場合にはの処理を行
い、No（真率が低い）場合にはの処理を行
う。

マスク付命令を使つて実行する。

圧縮／拡散命令を使つてデータの圧縮、拡散
をして実行する。

なお、先に述べたように、によればベクトル
長に比例する実行時間を要するが、によれば真
率に比例した実行時間にα（圧縮、拡散の補助操
作に必要な時間）を加えた時間を要する。

また、では、MSRへマスク・レジスタMR
中のオンのビツト数が入るが、これをマスク・レ
ジスタMRへの設定と同時に設定できないハード
ウエアの場合には、その後にマスク・レジスタ
MRのオンのビツト数を数える命令を出して、ソ
フトウエアによる代行処理を行つてもよい。

〔発明の効果〕

以上の説明から明らかなように、本発明によれ
ば、真率の低い命令及び全てのマスクがオフの命
令について実行時間を短縮することができ、デー
タ処理システムの処理効率の向上を計ることがで
きる。

【図面の簡単な説明】

第１図はベクトル処理プロセツサを有する処理
システムの１例を示す図、第２図はペクトル命令
に対応した処理を概念的に説明する図、第３図は
ベクトル処理プロセツサに対して、与えられたソ
ース・プログラムから目的プログラムを生成して
供給するコンパイラの構成例を示す図、第４図は
ソース・プログラムを中間テキストに移してゆく
態様を説明する図、第５図はソース・プログラム
をベクトル化してゆく態様を説明する図、第６図
ないし第８図はIF文を含むソース・プログラム
に対して文マスクやパス・マスクを用意して並列
実行可能な形にしてゆく態様を説明する図、第９
図は本発明の１実施例構成を示す図、第１０図は
本発明に使用される条件付命令の実行方式を説明
する図、第１１図は第１０図に示す条件付命令の
実行方式に対応するベクトル・テキストを示す
図、第１２図は本発明が適用されるマスク・レジ
スタの設定例を示す図、第１３図は本発明による
命令実行時の処理の流れを説明する図である。１……主記憶装置、２……メモリ制御装置、３
……ベクトル処理プロセツサ、４……チヤネル・
プロセツサ、５……大記憶装置、６……スカラ処
理回路部、７……ベクトル処理回路部、８−０な
いし８−ｎ……浮動小数点データ・レジスタ、９
−０ないし９−ｎ……ベクトル・レジスタ、１０
−０ないし１０−ｎ……マスク・レジスタ、１１
……ベクトル長レジスタ、１２−０と１２−１…
…メモリ・アクセス・パイプライン、１３……加
減算パイプライン、１４……乗算処理パイプライ
ン、１５……除算処理パイプライン、１６……マ
スク処理パイプライン、１７……ソース・プログ
ラム、１８……コンパイラ、１９……目的プログ
ラム、２０……ソース解釈部、２１……記憶域割
付け部、２２……ベクトル化部、２３……中間テ
キスト最適化部、２４……レジスタ使用決定部、
２５……目的プログラム出力部、２６……命令バ
ツフア・レジスタ、２７……デコーダ、２８……
マスク・レジスタ（MR：Mask Register）、２
９……一致回路、３０……比較回路、３１……閾
値設定部（THRESHOLD）、３２と３３……イ
ンバータ、３４……ブランチ処理部、３５……マ
スク処理への分岐処理部、３６……圧縮／拡散処
理への分岐処理部。

Claims

【特許請求の範囲】

１複数の並列演算部を備えてベクトル命令を処
理するベクトル処理プロセツサを有するデータ処
理プロセツサにおいて、上記ベクトル処理プロセ
ツサは、条件付命令の実行に際し、各エレメトに
対して命令を実行するか否かを示すマスク情報と
ベクトル長単位でマスクのオンの数とがセツトさ
れると、上記マスクのオンの数を調べ、マスクの
オンの数が０であることを条件に当該命令の実行
をスキツプし、マスクのオンの数が所定の閾値よ
り小さいことを条件にベクトル長短縮処理命令を
使つてマスクがオンの部分のみを取出して新しい
ベクトル・データを作つてベクトル演算を行い、
しかる後当該ベクトル演算の結果をマスクがオン
の部分に取り込むようにし、マスクのオンの数が
所定の閾値より大きいことを条件にマスク付命令
を使つてマスクがオンの要素の演算を行うように
構成されたことを特徴とする条件付命令の実行時
命令選択方式。