JPH0357499B2

JPH0357499B2 -

Info

Publication number: JPH0357499B2
Application number: JP6453485A
Authority: JP
Inventors: Hajime Fukuzawa
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1985-03-28
Filing date: 1985-03-28
Publication date: 1991-09-02
Also published as: JPS61221966A

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、ベクトル命令処理装置に関し、特に
ベクトル要素毎にマスク・ビツトによつてベクト
ル演算の実行を制御するベクトル命令処理装置に
関する。

〔従来の技術〕

従来のベクトル命令処理装置はベクトル・プロ
セサの処理能力をより高速に向上させるために、
より広範囲の種類の処理を高速に処理することが
必要で、とりわけ、FORTRANプログラムでIF
文を含むDOループをいかに高速に処理するかが
課題となつており、古くからマスク・ベクトルに
より演算を制御し、処理する方法が工夫されてい
る。

DOループのマスク・ベクトルによる演算の処
理過程の概念を第２図を参照して簡単に説明する
と、このDOループはベクトル・オペランドＣ(I)
とベクトル・オペランドＣ(I)の各ベクトル要素同
士の比較を行い、ベクトル・オペランドＤ(I)の値
より小なるベクトル・オペランドＣ(I)のベクトル
要素を、ベクトル・オペランドＡ(I)，Ｂ(I)の対応
するベクトル要素同志の加算結果に置き換えるよ
うな処理をＮ組のベクトル要素について繰返す例
である。

まずベクトル・オペランドＣ(I)とＤ(I)の各ベク
トル要素対応の比較を行い、Ｃ(I)＞Ｄ(I)の場合は
“０”、Ｃ(I)＜Ｄ(I)の場合は“１”の値を示すビツ
ト列を作成する。このビツト列がマスク・ベクト
ルであり、その各ビツトをマスク・ビツトと言
う。そして、この作成されたマスク・ベクトルに
従い、値が“１”であるマスク・ビツトに対応す
るベクトル・オペランドＡ(I)，Ｂ(I)のベクトル要
素同志を加算し、結果をＣ(I)の対応するベクトル
要素に書き込む。それ以外のベクトル・オペラン
ドＣ(I)、つまり値が“０”であるマスク・ビツト
に対応するベクトル・オペランドＣ(I)のベクトル
要素は変化させない。

以上のようにして、マスク・ベクトルによる演
算の処理が行われる訳であるが、マスク・ベクト
ルの作成にあたつては、同種の比較器を複数組用
意することにより、一括して順次高速に作成する
ことが可能である。従つて、マスク・ベクトルに
よるベクトル演算を高速に処理するためには、一
括して順次作成されたマスク・ベクトルをいかに
高速に処理し、演算処理を実行するかが重要であ
る。

このために、従来のベクトル命令処理装置は第
３図に示すようにベクトル要素の読み出しリクエ
ストを要求する時点でマスク・ビツトによつて示
された有効なベクトル要素のみを読み出し、演算
を抑止されるベクトル要素の読み出しを抑止する
ことで、無効な演算を飛ばすようにしたベクトル
命令処理装置がある。

この従来のベクトル命令処理装置においては処
理されるべきベクトル要素の要素数分に対応する
個数のマスク・ビツト列から構成されているマス
ク・ベクトルをある一定処理単位ごとに区切り、
その一定処理単位ごとに区切つたマスク・ベクト
ル（以下、マスク・ベクトル・データと呼ぶ）を
１処理単位として、順次高速に処理を行う。その
ために、マスク・ベクトルによる演算処理に先行
して一括して順次作成されるマスク・ベクトルを
一旦記憶装置に格納する。マスク・ベクトルの記
憶装置への格納が終了するか、あるいは格納動作
と並行して、ベクトル命令処理装置に対してはマ
スク・ベクトルによる演算処理開始の命令が発行
される。ベクトル命令処理装置が本命令を受付け
ると、まずベクトル・オペランド１，２及び３に
対応するベクトル・オペランド・アドレス（VH
１，２及びVH３）がそれぞれベクトル・アドレ
ス・レジスタ５１，５２及び５３に、ベクトル・
オペランド１，２及び３に対応するベクトル要素
間距離（VI１，２及び３）がそれぞれベクトル
要素間距離レジスタ５４，５５及び５６に初期設
定される。制御装置２０では、マスク・ベクト
ル・データ読み出し部３０に指令を出し、マス
ク・ベクトル・データ読み出し部３０より記憶装
置１０に対してマスク・ベクトル・データの読み
出しリクエストを出させる。マスク・ベクトル・
データの読み出しリクエストを受け取つた記憶装
置１０は該当するマスク・ベクトル・データを読
み出し、マスク・ベクトル・データ処理部４０に
送出する。マスク・ベクトル・データ処理部４０
においては、マスク・ベクトル・データをもとに
処理が行われる。

第４図は、マスク・ベクトル・データの処理過
程と演算指示ビツトに対応するベクトル要素のア
ドレス生成手順を表わしたものである。一つのベ
クトル命令内では、ベクトル・オペランド・アド
レス（VHi）に一定のベクトル要素間距離
（VIi）を加算すると、次のベクトル要素のベク
トル・オペランド・アドレスが得られる。ここ
で、第４図ａを参照すると、読み出されたビツト
長（ｎ＋１）のマスク・ベクトル・データの値
は、３ビツト、８ビツト，…，（ｎ−３）ビツト
目に演算指示ビツト“１”（その個数をｍとする）
を示しており、他の（ｎ−ｍ＋１）個のビツト全
てが演算抑止ビツト“０”を示している場合が示
されている。今ベクトル・オペランド・アドレス
（VHi，₀）はマスク・ベクトル・データの０ビツ
ト目に対応するベクトル要素のアドレスである。
このとき、マスク・ベクトル・データの３ビツト
目に対応するベクトル要素のアドレス（VHi，₃）
は VHi，₃＝VHi，₀＋３×VIi で得られる。ここで、ベクトル要素間距離
（VIi）の乗数３は、第４図ａのマスク・ベクト
ル・データの先頭（０ビツト目）より最初の演算
指示ビツト“１”が見つかるまで演算抑止ビツト
“０”の個数をカウントすることで求められる。
さらに、次に演算すべきマスク・ベクトル・デー
タの８ビツト目に対応するベクトル要素のアドレ
ス（VHi，₈）を求めるために、第４図ｂに示され
るように、第４図ａのマスク・・ベクトル・デー
タを乗数に相当する３ビツト分だけ左シフトを行
ない、それに伴い３ビツト目の演算指示ビツト
“１”を反転させて、次に用いるマスク・ベクト
ル・データとする。この時、シフト・インに論理
レベル“１”を入力させる。このようにして得ら
れた第４図ｂのマスク・ベクトル・データに対し
て、再び先頭より演算指示ビツト“１”が見つか
るまで演算抑止ビツト“０”の個数をカウントす
る操作を行うことで新たな乗数５が得られ、第４
図ａの８ビツト目に対応するベクトル要素のアド
レス（VHi，₈）は VHi，₈＝VHi，₃＋５×VIi で得られる。

以上の操作をｍ回繰返すことで、第４図ｃに示
されるような第４図ａの（ｎ−３）ビツト目の演
算指示ビツト“１”が反転を受けて先頭のビツト
位置にシフトされたマスク・ベクトル・データが
得られる。この第４図ｃのマスク・ベクトル・デ
ータに対して、もう一度同じ操作を行つて得られ
る乗数４を用いて得られるベクトル要素のアドレ
ス（VHi，₀′） VHi，₀′＝VHi，_o-3＋４×VIi は、新たに連続する次のマスク・ベクトル・デー
タの先頭ビツトに対応するベクトル要素のアドレ
スである。

以上の操作は、各々の操作で得られる乗数を毎
回加算し、得られた加算値結果が読み出されたマ
スク・ベクトル・データのビツト長（ｎ＋１）と
一致するまで繰返され、一致を検出すると、一つ
のマスク・ベクトル・データの処理を終了する。

再び、第３図を参照する。マスク・ベクトル・
データ処理部４０はこれに供給された、マスク・
ベクトル・データを上述したように演算指示ビツ
ト“１”が見つかるまで演算抑止ビツト“０”の
個数をカウントする操作が行われ、得られた値が
ベクトル要素間距離VIiの乗数として、アドレス
生成部５０に送出される。アドレス生成部５０に
送出されたベクトル要素間距離VIiの乗数は、乗
算器５７で、セレクタＳ５０によつて選択された
ベクトル・オペランドのベクトル要素間距離VIi
と乗算されて、アドレス差分が生成され、アドレ
ス加算器５８に送られる。アドレス加算器５８で
は、乗算器５７で生成されたアドレス差分と、セ
レクタＳ５４によつて選択された対応するベクト
ル・オペランドのベクトル・オペランド・アドレ
スVHiと加算されて、演算を行うべきベクトル
要素のアドレスが得られ、記憶装置１０に対し
て、ベクトル要素のオペランド・リクエストが送
出される。これと同時に、セレクタＳ５１，５
２，５３のいずれかのセレクタを通じて対応する
ベクトル・オペランドのベクトル・アドレス・レ
ジスタ（５１，５２若しくは５３）の値が更新さ
れる。ベクトル要素のオペランド・リクエストを
受け取つた記憶装置１０は、読み出しリクエスト
の場合は該当するベクトル要素を読み出し、演算
装置６０に送出する。一つのベクトル要素間距離
VIiの乗数に対して、オペランド１，２及び３に
対応するベクトル要素のオペランド・リクエスト
を記憶装置１０に対して送出し終ると、新たなベ
クトル要素間距離VIiの乗数が、マスク・ベクト
ル・データ処理部４０からアドレス生成部５０に
供給される。マスク・ベクトル・データ処理部４
０で生成されるベクトル要素間距離VIiの乗数
が、新たに連続する次のマスク・ベクトル・デー
タの先頭ビツト位置までの距離に対応することが
検出されると、制御装置２０に報告され、以上の
一連の操作が終了する。アドレス生成部５０に送
られる新たに連続する次のマスク・ベクトル・デ
ータの先頭ビツト位置までの距離に対応するベク
トル要素間距離VIiの乗数によつて生成される、
ベクトル要素のアドレスは、制御装置２０の指令
により、記憶装置１０へのオペランド・リクエス
トとしては使用されずに、ベクトル・アドレス・
レジスタ（５１，５２若しくは５３）の値を新た
に連続する次のマスク・ベクトル・データの先頭
ビツト位置に対応するベクトル要素のアドレスに
更新する目的だけに使用される。

この動作と並行して、制御装置２０は逐次処理
を実行すべく新たに連続する次のマスク・ベクト
ル・データを読み出すための指令を、マスク・ベ
クトル・データ読み出し部３０に送出し、処理の
続行を開始する。

〔発明が解決しようとする問題点〕

上述した従来のベクトル命令処理装置は、マス
ク・ベクトル・データ処理部で、一つのマスク・
ベクトル・データの処理が終了するのを待つてか
ら、次に処理すべき新たなマスク・ベクトル・デ
ータを記憶装置からフエツチしている。従つて、
マスク・ベクトル・データ処理部は、マスク・ベ
クトル・データが記憶装置から取出されマスク・
ベクトル・データ処理部に送出される迄、処理を
行えずに待たされ、これに伴い演算装置での処理
も、処理の行えない遊びの時間を生じ、記憶装置
のアクセス待ち時間による性能低下が著しくなる
という欠点がある。

〔問題点を解決するための手段〕

本発明によれば、複数のマスク・ビツト列から
構成されるマスク・ベクトルを記憶する記憶装置
と、前記マスク・ベクトルを一定処理単位毎に区
切つたマスク・ベクトル・データを処理単位とし
て順次一括して処理するマスク・ベクトル・デー
タ処理部と、前記マスク・ベクトル・データを前
記記憶装置から読み出すマスク・ベクトル・デー
タ読み出し部とを含み、ベクトル要素毎にマス
ク・ビツトによつてベクトル演算の実行を制御す
るデータ処理装置において、逐次処理される前記
マスク・ベクトル・データのアドレスを保持する
マスク・ベクトル・データ・アドレス・レジス
タ、マスク・ベクトル・データの読み出しデータ
巾値を保持するマスク・ベクトル・データ読み出
しデータ巾レジスタおよび前記マスク・ベクト
ル・データ・アドレスとマスク・ベクトル・デー
タの読み出しデータ巾値とから、前記記憶装置上
の逐次処理されるべき、先行するマスク・ベクト
ル・データのアドレスを作成するアドレス加算器
を有し、前記記憶装置から該マスク・ベクトル・
データを次々と先行フエツチする前記マスク・ベ
クトル・データ読み出し部と、前記次々と先行フ
エツチされたマスク・ベクトル・データを蓄える
マスク・ベクトル・データ・バツフアとを含み、
前記マスク・ベクトル・データ処理部がマスク・
ベクトル・データを必要とした場合に前記マス
ク・ベクトル・データ・バツフアから該当マス
ク・ベクトル・データを前記マスク・ベクトル・
データ処理部に対して供給するようにしたことを
特徴とするベクトル命令処理装置が得られる。

〔実施例〕

次に本発明の実施例について図面を参照して説
明する。

第１図は本発明の一実施例であるベクトル命令
処理装置を示す。第１図において、本実施例は複
数のマスク・ビツト列から構成されるマスク・ベ
クトルを一定処理単位毎に区切つたマスク・ベク
トル・データの組として記憶する記憶装置１０
と、該記憶装置１０から次々と先行フエツチされ
た該マスク・ベクトル・データを蓄えるマスク・
ベクトル・データ・バツフア１１と、前記マス
ク・ベクトル・データを読み出すマスク・ベクト
ル・データ読み出し部３０ａと、前記マスク・ベ
クトル・データを一括して処理するマスク・ベク
トル・データ処理部４０とを含む。

記憶装置１０は、複数のマスク・ベクトル・デ
ータで構成されるマスク・ベクトルや複数のベク
トル・オペランドのベクトル要素などが格納され
ている。マスク・ベクトル・データ・バツフア１
１は、複数のマスク・ベクトル・データの保持を
行う専用のデータ・バツフアである。マスク・ベ
クトル・データ処理部３０ａは逐次処理される先
行するマスク・ベクトル・データを読み出すため
のマスク・ベクトル・データ読み出し部であり、
セレクタＳ３０と、マスク・ベクトル・データの
アドレスを保持するマスク・ベクトル・データ・
アドレス・レジスタ３１と、マスク・ベクトル・
データの読み出しデータ巾値を保持する、マス
ク・ベクトル・データ読み出しデータ巾レジスタ
（以下読み出しデータ巾レジスタと略す）３２と、
マスク・ベクトル・データ・アドレスレジスタ３
１の出力信号と読み出しデータ巾レジスタ３２の
出力信号とを加算するアドレス加算器３３とから
構成されている。

更に本実施例は記憶装置１０に、接続される演
算装置６０と、マスク・ベクトル・データ処理部
４０に接続されるアドレス生成部５０と、マス
ク・ベクトル・データ・バツフア１１の読み出し
ポインタ（以下マスク・ベクトル・データポイン
タと略す）７０と、これらおよび各部を制御する
制御装置２０とを有している。

本実施例はマスク・ベクトルによる演算処理開
始の命令を受付けると、初期値の設定を行ない、
マスク・ベクトル・データ・アドレスレジスタ３
１にはセレクタＳ３０を通じて処理を行うべき先
頭のマスク・ベクトル・データに対応するアドレ
スが設定され、読み出しデータ巾レジスタ３２に
は初期加算値“０”が設定される。初期値が設定
されると同時に制御装置２０の指令により、マス
ク・ベクトル・データ・アドレスレジスタ３１の
初期値と読み出しデータ巾レジスタ３２の初期加
算値“０”がアドレス加算器３３で加算されて、
処理を行うべき先頭のマスク・ベクトル・データ
のアドレスが生成され、記憶装置１０に対してマ
スク・ベクトル・データの読み出しリクエストが
出される。この時、同時に制御装置２０は読み出
しデータ巾レジスタ３２にマスク・ベクトル・デ
ータの読み出しデータ巾値を設定する。以後読み
出しデータ巾レジスタ３２にはマスク・ベクト
ル・データの読み出しデータ巾値が保持される。
このマスク・ベクトル・データの読み出しデータ
巾値は、各ベクトル命令処理装置固有に、記憶装
置１０から読み出される一つのデータ長対応に任
意に設定することができる。

マスク・ベクトル・データの読み出しリクエス
トを受けた記憶装置１０は該当アドレスから目的
とするマスク・ベクトル・データを読み出し、マ
スク・ベクトル・データ・バツフア１１に送出す
る。マスク・ベクトル・データ・バツフア１１は
そのマスク・ベクトル・データをマスク・ベクト
ル・データ処理部４０が使用する時迄保持する。

このように本実施例は処理を行うべき先頭のマ
スク・ベクトル・データのフエツチ動作を終了す
る。もともと、マスク・ベクトルは記憶装置１０
上に連続に格納されており、そのマスク・ベクト
ルをある一定処理単位ごとに区切つたものがマス
ク・ベクトル・データであり、一定処理単位の大
きさはマスク・ベクトル・データの読み出しデー
タ巾値に対応させることができる。従つて一つの
マスク・ベクトル・データのアドレスに順次マス
ク・ベクトルデータの読み出しデータ巾値を足し
込んでいけば先行するマスク・ベクトル・データ
のアドレスが生成できる。処理を行うべき先頭の
マスク・ベクトル・データの読み出しリクエスト
が出されると、引続き制御装置２０は新たに連続
するマスク・ベクトル・データを記憶装置１０か
ら読み出すべく、マスク・ベクトル・データ・ア
ドレスレジスタ３１の値と読み出しデータ巾レジ
スタ３２に保持されているマスク・ベクトル・デ
ータの読み出しデータ巾値とをアドレス加算器３
３で加算を行い、新たに連続するマスク・ベクト
ル・データのアドレスを生成し、記憶装置１０に
対して新たに連続するマスク・ベクトル・データ
の読み出しリクエストを送出する。これと、同時
に制御装置２０はセレクタＳ３０を通じて、マス
ク・ベクトル・データ・アドレスレジスタ３１の
値を更新させる。

この動作を繰返し、逐次処理されるべきマス
ク・ベクトル・データのフエツチが行なわれ、マ
スク・ベクトル・データ処理部４０でマスク・ベ
クトル・データの使用要求が出される以前に、マ
スク・ベクトル・データ・バツフア１１には複数
のマスク・ベクトル・データが蓄えられる。マス
ク・ベクトル・データ処理部４０ではマスク・ベ
クトル・データの処理の為に、マスク・ベクト
ル・データが必要となつた場合には、制御装置２
０に対して、マスク・ベクトル・データの要求を
出す。この要求を受けた制御装置２０は、マス
ク・ベクトル・データ・ポインタ７０で示される
マスク・ベクトル・データ・バツフア１１内の該
当位置から、蓄えられているマスク・ベクトル・
データをマスク・ベクトル・データ処理部４０に
供給する。

該当マスク・ベクトル・データを供給し終る
と、制御装置２０はマスク・ベクトル・データ・
ポインタ７０の値をマスク・ベクトル・データ・
バツフア１１内に蓄えられている次に使用される
べきマスク・ベクトル・データを指し示すように
更新する。

マスク・ベクトル・データ処理部４０に供給さ
れたマスク・ベクトル・データは、マスク・ベク
トル・データ処理部４０内で演算抑止ビツト
“０”の個数をカウントすることで、演算指示ビ
ツト“１”に対応する演算実行を指示されたベク
トル要素のアドレスのみを生成するためのベクト
ル要素間距離VIiの乗数を算出する処理が行われ
る訳であるが、以下の動作は従来技術の説明の項
で述べた動作と同じであり、又、本発明の要旨と
する所でないので説明は簡単に留める。

マスク・ベクトル・データ処理部４０で算出さ
れたベクトル要素間距離VIiの乗数はアドレス生
成部５０に送出され、目的とするベクトル要素の
アドレスが生成されて、記憶装置１０に対してオ
ペランド・リクエストが送出される。記憶装置１
０は該当するベクトル要素を読み出し、演算装置
６０に送出する。演算装置６０は、あらかじめ出
されたオペランド・リクエストに対応する記憶装
置１０上の該当位置に演算結果を格納する。

以上の動作において、制御装置２０は、マス
ク・ベクトル・データの先行フエツチとマスク・
ベクトル・データ処理部４０に対するマスク・ベ
クトル・データの供給及び記憶装置１０に対する
演算実行を指示されたベクトル要素のオペラン
ド・リクエストの送出を互いに独立且つ並行に行
われるように制御し、又、演算結果の記憶装置１
０への格納もこれら３つの動作と独立に行われる
ように制御する。

〔発明の効果〕

以上説明したように本発明は、マスク・ベクト
ル・データのアドレスとマスク・ベクトル・デー
タの読み出しデータ巾値とから、逐次処理される
べき先行するマスク・ベクトル・データのアドレ
スを作成し、マスク・ベクトル・データ処理部が
マスク・ベクトル・データを必要とする以前に
次々とマスク・ベクトル・データの先行フエツチ
を行い、専用のマスク・ベクトル・データ・バツ
フアに蓄えておき、マスク・ベクトル・データ処
理部がマスク・ベクトル・データを必要とした場
合に、該当するマスク・ベクトル・データをマス
ク・ベクトル・データ・バツフアよりマスク・ベ
クトル・データ処理部に対して高速に供給するこ
とを可能にすることにより、マスク・ベクトル・
データ処理部に於けるマスク・ベクトル・データ
待ち時間による遊びを最小限に抑えることがで
き、マスク・ベクトル・データの高速連続処理が
可能となる効果がある。又、それに伴い演算装置
に於けるベクトル要素待ち時間による遊びも大幅
に削減でき演算装置の使用効率をより向上させる
ことが可能となる効果がある。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロツク図、
第２図はマスク・ベクトルにより演算が制御され
処理が行われるFORTRANプログラムの例を示
す図、第３図は従来の装置を示すブロツク図、第
４図はマスク・ベクトル・データの処理過程と演
算指示ビツトに対応するベクトル要素のアドレス
生成手順を示した図である。１０……記憶装置、１１……マスク・ベクト
ル・データ・バツフア、２０……制御装置、３０
ａ……マスク・ベクトル・データ読み出し部、４
０……マスク・ベクトル・データ処理部、５０…
…アドレス生成部、６０……演算装置、７０……
マスク・ベクトル・データ読み出しポインタ、３
１……マスク・ベクトル・データ・アドレスレジ
スタ、３２……マスク・ベクトル・データ読み出
しデータ巾レジスタ、５１，５２，５３……ベク
トル・アドレスレジスタ、５４，５５，５６……
ベクトル要素間距離レジスタ、３３，５８……ア
ドレス加算器、５７……乗算器、Ｓ３０，Ｓ５
０，Ｓ５１，Ｓ５２，Ｓ５３，Ｓ５４……セレク
タ。

Claims

【特許請求の範囲】

１複数のマスク・ビツト列から構成されるマス
ク・ベクトルを記憶する記憶装置と、前記マス
ク・ベクトルを一定処理単位毎に区切つたマス
ク・ベクトル・データを処理単位として順次一括
して処理するマスク・ベクトル・データ処理部
と、前記マスク・ベクトル・データを前記記憶装
置から読み出すマスク・ベクトル・データ読み出
し部とを含み、ベクトル要素毎にマスク・ビツト
によつてベクトル演算の実行を制御するデータ処
理装置において、逐次処理される前記マスク・ベ
クトル・データのアドレスを保持するマスク・ベ
クトル・データ・アドレス・レジスタ、マスク・
ベクトル・データの読み出しデータ幅値を保持す
るマスク・ベクトル・データ読み出しデータ幅レ
ジスタおよび前記マスク・ベクトル・データ・ア
ドレスとマスク・ベクトル・データの読み出しデ
ータ幅値とから前記記憶装置上に逐次処理される
べき、先行するマスク・ベクトル・データのアド
レスを作成するアドレス加算器を有し、前記記憶
装置から該マスク・ベクトル・データを次々と先
行フエツチする前記マスク・ベクトル・データ読
み出し部と、前記次々と先行フエツチされたマス
ク・ベクトル・データを蓄えるマスク・ベクト
ル・データ・バツフアとを含み、前記マスク・ベ
クトル・データ処理部がマスク・ベクトル・デー
タを必要とした場合に前記マスク・ベクトル・デ
ータ・バツフアから該当マスク・ベクトル・デー
タを前記マスク・ベクトル・データ処理部に対し
て供給するようにしたことを特徴とするベクトル
命令処理装置。