JPH01155471A - ベクトル処理装置 - Google Patents
ベクトル処理装置Info
- Publication number
- JPH01155471A JPH01155471A JP31405887A JP31405887A JPH01155471A JP H01155471 A JPH01155471 A JP H01155471A JP 31405887 A JP31405887 A JP 31405887A JP 31405887 A JP31405887 A JP 31405887A JP H01155471 A JPH01155471 A JP H01155471A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- data
- main memory
- circuit
- access
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Complex Calculations (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は科学技術計算に現れる行列計算などを高速処理
するベクトル処理装置に係シ、特に主記憶装置上の同一
アドレスに連続に複数回アクセスする場合、効率良くア
クセスするのに好適なベクトル処理装置に関する。
するベクトル処理装置に係シ、特に主記憶装置上の同一
アドレスに連続に複数回アクセスする場合、効率良くア
クセスするのに好適なベクトル処理装置に関する。
ベクトル処理装置は、主記憶(MS)と演算器との間に
MSから読み出された一連のベクトル・データや演算の
中間結果であるベクトル・データを保持するベクトル・
レジスタ(VR)を有している。VR上のベクトル−デ
ータに対しては、1要素毎に有効・無効を示すマスク・
ビットが設けられ、ベクトル・マスク・レジスタ(VM
R)に保持されている。該マスク・ビットはベクトル・
データの比較等によって生成されVMRに保持されてい
て、VRの読み出し、書き込み時に並行して参照され、
ベクトル・データの演算、ロード、ストア等の処理を要
素対応に有効化もしくは無効化する制御に用いられる。
MSから読み出された一連のベクトル・データや演算の
中間結果であるベクトル・データを保持するベクトル・
レジスタ(VR)を有している。VR上のベクトル−デ
ータに対しては、1要素毎に有効・無効を示すマスク・
ビットが設けられ、ベクトル・マスク・レジスタ(VM
R)に保持されている。該マスク・ビットはベクトル・
データの比較等によって生成されVMRに保持されてい
て、VRの読み出し、書き込み時に並行して参照され、
ベクトル・データの演算、ロード、ストア等の処理を要
素対応に有効化もしくは無効化する制御に用いられる。
従来のベクトル処理装置においては、特開昭61−12
8571号に記載のように、MS上の同一アドレスに連
続して複数回アクセスする場合、ロードの場合には最初
のアクセスによるデータを保持しておき、後続のアクセ
スに対しては、ベクトル・アドレスの一部を修飾するこ
とによってバンク競合を回避しつつアクセスを行い、読
み出されたデータを無効化するという手段によってアク
セスを高速化している。
8571号に記載のように、MS上の同一アドレスに連
続して複数回アクセスする場合、ロードの場合には最初
のアクセスによるデータを保持しておき、後続のアクセ
スに対しては、ベクトル・アドレスの一部を修飾するこ
とによってバンク競合を回避しつつアクセスを行い、読
み出されたデータを無効化するという手段によってアク
セスを高速化している。
ところがマスクによって制御されるロードもしくはスト
アの場合には、最初の有効な要素もしくは最後の有効な
要素を認識する手段がない丸めに同一アドレスへの連続
するアクセスはバンク競合によるスループット低下を避
けられなかった。
アの場合には、最初の有効な要素もしくは最後の有効な
要素を認識する手段がない丸めに同一アドレスへの連続
するアクセスはバンク競合によるスループット低下を避
けられなかった。
上記従来技術はマスクによって制御される同一アドレス
への連続するアクセスについては配慮されておらず、マ
スクによってスカシ・データを拡張してベクトル・デー
タとしてロードする処理やマスクによってベクトル・デ
ータを縮退させてストアする処理の場合にスループット
の低下が発生するという問題があった。
への連続するアクセスについては配慮されておらず、マ
スクによってスカシ・データを拡張してベクトル・デー
タとしてロードする処理やマスクによってベクトル・デ
ータを縮退させてストアする処理の場合にスループット
の低下が発生するという問題があった。
本発明の目的は、マスクによって制御されるロード・ス
トア処理について、MS上の同一アドレスに対する連続
する複数回のアクセスを一回のアクセスとすることによ
ってMSのバンク競合を回避し、効率の良いアクセスを
可能とするベクトル処理装置を実現することにある。
トア処理について、MS上の同一アドレスに対する連続
する複数回のアクセスを一回のアクセスとすることによ
ってMSのバンク競合を回避し、効率の良いアクセスを
可能とするベクトル処理装置を実現することにある。
上記目的は、ベクトル・データを要素対応に有効化もし
くは無効化するマスク・ビットから、最初の有効な要素
もしくは最後の有効な要素を認識し、該要素に関するM
8アクセスのみを実行するようにロード・ストア・パイ
プを構成することによって達成される。
くは無効化するマスク・ビットから、最初の有効な要素
もしくは最後の有効な要素を認識し、該要素に関するM
8アクセスのみを実行するようにロード・ストア・パイ
プを構成することによって達成される。
このため、(1)ベクトル・ロード・ストア命令のアド
レッシング指定及びベクトル・アドレス・レジスタの内
容に基づきアクセスがMS上の同一アドレスに対するも
のであることを認識する回路と、(2)マスク生成時に
最初の有効な要素もしくは最後の有効な要素の要素番号
を保持する回路と、(3)マスク参照時に保持された要
素番号以外のデータを無効化するように付加情報を変換
する回路と、(4)ロード処理において、最初の有効な
データを保持しておき、全ての要素に対して保持されて
いた同一のデータをVRに対して送出する回路と、(5
)ストア処理において、VRから転送されてきた全ての
有効なデータの内、最後の有効なデータを選択してMS
に書き込む回路とを設ける。
レッシング指定及びベクトル・アドレス・レジスタの内
容に基づきアクセスがMS上の同一アドレスに対するも
のであることを認識する回路と、(2)マスク生成時に
最初の有効な要素もしくは最後の有効な要素の要素番号
を保持する回路と、(3)マスク参照時に保持された要
素番号以外のデータを無効化するように付加情報を変換
する回路と、(4)ロード処理において、最初の有効な
データを保持しておき、全ての要素に対して保持されて
いた同一のデータをVRに対して送出する回路と、(5
)ストア処理において、VRから転送されてきた全ての
有効なデータの内、最後の有効なデータを選択してMS
に書き込む回路とを設ける。
ベクトル・ロード・ストア命令には、ベクトルアドレス
・レジスタ(VR几)とベクトルφインクリメント・レ
ジスタ(VI R)との内容によって、MSを線形にア
クセスする単純a−ド・ストア命令と、VR凡とインデ
ックス・レジスタ(任意のVR)とによってMSを非線
形にアクセスするインデックス付ロード・ストア命令と
がめる。
・レジスタ(VR几)とベクトルφインクリメント・レ
ジスタ(VI R)との内容によって、MSを線形にア
クセスする単純a−ド・ストア命令と、VR凡とインデ
ックス・レジスタ(任意のVR)とによってMSを非線
形にアクセスするインデックス付ロード・ストア命令と
がめる。
アクセス種別を認識する回路は、線形アクセスの場合に
はVI几−101、すなわち要素間隔値lo1の場合に
アクセスがMS上の同一アドレスであることを2識する
。またインデックス付ロード・ストア命令の場合にはイ
ンデックスがスカシ、っまル、スカシ・レジスタ(SR
)、ま九はリテラル(LIT)であることによってアク
セスがMS上の同一アドレスであることを認識する。
はVI几−101、すなわち要素間隔値lo1の場合に
アクセスがMS上の同一アドレスであることを2識する
。またインデックス付ロード・ストア命令の場合にはイ
ンデックスがスカシ、っまル、スカシ・レジスタ(SR
)、ま九はリテラル(LIT)であることによってアク
セスがMS上の同一アドレスであることを認識する。
マスク生成回路にはカウンタが設けられ、マスり・ビッ
トが1ビツト生成される毎にカウント・アップされる。
トが1ビツト生成される毎にカウント・アップされる。
マスク・ビットが最初に111となった時、該カウンタ
の値は先頭有効要素番号レジスタ(FVERと称す。)
に取少込まれ、マスク参照時まで保持される。一方マス
ク・ビットがIllとなる毎に該カウンタの値は最終有
効要素番号レジスタ(LVERと称する。)に取プ込ま
れ、マスク生成が終了した時点で最後の有効な要素の番
号が残される。
の値は先頭有効要素番号レジスタ(FVERと称す。)
に取少込まれ、マスク参照時まで保持される。一方マス
ク・ビットがIllとなる毎に該カウンタの値は最終有
効要素番号レジスタ(LVERと称する。)に取プ込ま
れ、マスク生成が終了した時点で最後の有効な要素の番
号が残される。
マスク参照回路にはアクセス種別をgRする回路からコ
ードが転送されてきて、Ma上の同一アドレスを連続し
てアクセスする場合には、MSに対して、FVERもし
くはLVER,の示す要素のみを読み出したシ、書き込
むように制御がなされる。a−ド処理の場合にはpvg
aの示す要素のみMSのアクセスを有効化する付加情報
が付加されて主記憶制御ユニット(SCU)に送出され
る。
ードが転送されてきて、Ma上の同一アドレスを連続し
てアクセスする場合には、MSに対して、FVERもし
くはLVER,の示す要素のみを読み出したシ、書き込
むように制御がなされる。a−ド処理の場合にはpvg
aの示す要素のみMSのアクセスを有効化する付加情報
が付加されて主記憶制御ユニット(SCU)に送出され
る。
SOUでは該付加情報の付いた要素についてのみMSか
らデータを読み出し、レジスタに保持してお(。該デー
タはマスク・ビットと伴にVRに転送され、有効な要素
についてのみデータが書き込まれる。ストア処理の場合
にはLVgRの示す要素のみMSのアクセスを有効化す
る付加情報が付加されてSCUに送出される。SCUで
は該付加情報の付いた要素についてのみMSへデータを
書き込む。該データはマスク・ビットと伴KvfLから
送られてきたデータの内、有効な要素についてのみレジ
スタにセットされ、最後に残されたデータである。
らデータを読み出し、レジスタに保持してお(。該デー
タはマスク・ビットと伴にVRに転送され、有効な要素
についてのみデータが書き込まれる。ストア処理の場合
にはLVgRの示す要素のみMSのアクセスを有効化す
る付加情報が付加されてSCUに送出される。SCUで
は該付加情報の付いた要素についてのみMSへデータを
書き込む。該データはマスク・ビットと伴KvfLから
送られてきたデータの内、有効な要素についてのみレジ
スタにセットされ、最後に残されたデータである。
a−ド・ストア・パイプにはロード処理の先頭有効要素
に対応するデータを保持するレジスタがメ)、上記ロー
ド処理においてマスク・ビット・11′の要素に対して
は該データをVRに対して送出する。
に対応するデータを保持するレジスタがメ)、上記ロー
ド処理においてマスク・ビット・11′の要素に対して
は該データをVRに対して送出する。
また、ロード・ストア・バイブにはストア処理の最終有
効要素に対応するデータを保持するレジスタがあり、■
几から読み出されたデータに付随するマスク・ビットが
t1+の場合、VRからの読み出しデータがセットされ
る。そして全ての要素についてVRgt、み出しが終了
した時点で最終有効要素に対応するデータが残されるの
で、該データをSCUに対して送出する。
効要素に対応するデータを保持するレジスタがあり、■
几から読み出されたデータに付随するマスク・ビットが
t1+の場合、VRからの読み出しデータがセットされ
る。そして全ての要素についてVRgt、み出しが終了
した時点で最終有効要素に対応するデータが残されるの
で、該データをSCUに対して送出する。
第1図は本発明の適用されるベクトル処理装置のVR,
周辺の構成を示す図である。第1図におい−(18はV
R,19はVM几、25は8CU、24はMSでるる。
周辺の構成を示す図である。第1図におい−(18はV
R,19はVM几、25は8CU、24はMSでるる。
本実施例では要素並列制御方式のベクトル処理装置につ
いて述べる。従って、VR18、VMRI 9はいずれ
も並列要素数4に対応して4分割されている。VR18
,VMRI 9の分割された各単位は各々64要素から
構成され全体で256要素を1括して処理可能である。
いて述べる。従って、VR18、VMRI 9はいずれ
も並列要素数4に対応して4分割されている。VR18
,VMRI 9の分割された各単位は各々64要素から
構成され全体で256要素を1括して処理可能である。
通常のベクトル・a−ド命令処理の場合、リクエスト制
御回路10は64個のメモリ・リクエストを5CU25
に対して発行する。1個のメモリ・リクエストに対して
4個のマスク・ビットが7MR19から読み出され、付
加情報変換回路20を通って8CU23に対してメモリ
・リクエスト付加情報として送出される。その際、マス
ク拳ビットfolの要素についてはメモリ・リクエスト
を無効化するオーダが付加される。8CU25は1メモ
リ・リクエスト毎に4個のマスク・ビットの内111に
対応する要素についてのみ読み出し要求t−Ms 24
に送出する。Maから読み出されたデータ(最大4個)
は5CU23を通シ、レジスタ25にセットされる。1
メモリ・リクエストに対応するデータが全てそろった時
点でレジスタ23に保持していたデータは送出され、セ
レクタ17を通#)VR18に書き込まれる。データの
書き込み位置は要素数カウンタ(E几)2によって示さ
れる。gR2は初期値101から始めて1メモリeリク
エストごとにカウンタ3によって1ずつカウント・アッ
プされ、次のメモリ・リクエストで読み出したデータを
書き込むべきVR18上のエントリを示している。以上
の動作が64回繰り返されて256要素のロード処理が
完了する。
御回路10は64個のメモリ・リクエストを5CU25
に対して発行する。1個のメモリ・リクエストに対して
4個のマスク・ビットが7MR19から読み出され、付
加情報変換回路20を通って8CU23に対してメモリ
・リクエスト付加情報として送出される。その際、マス
ク拳ビットfolの要素についてはメモリ・リクエスト
を無効化するオーダが付加される。8CU25は1メモ
リ・リクエスト毎に4個のマスク・ビットの内111に
対応する要素についてのみ読み出し要求t−Ms 24
に送出する。Maから読み出されたデータ(最大4個)
は5CU23を通シ、レジスタ25にセットされる。1
メモリ・リクエストに対応するデータが全てそろった時
点でレジスタ23に保持していたデータは送出され、セ
レクタ17を通#)VR18に書き込まれる。データの
書き込み位置は要素数カウンタ(E几)2によって示さ
れる。gR2は初期値101から始めて1メモリeリク
エストごとにカウンタ3によって1ずつカウント・アッ
プされ、次のメモリ・リクエストで読み出したデータを
書き込むべきVR18上のエントリを示している。以上
の動作が64回繰り返されて256要素のロード処理が
完了する。
通常のベクトル・ストア命令処理の場合、同様にリクエ
スト制御回路10は64個のメモリ・リクエストを5C
U25に対して発行する。1個のメモリ自リクエストに
対して4個のマスク・ビツトがVMRI9から読み出さ
れ、付加情報変換回路20を通って8CU23に送出さ
れる。その際、マスク・ビットIglの要素については
メモリ・リクエストを無効化するオーダが付加される。
スト制御回路10は64個のメモリ・リクエストを5C
U25に対して発行する。1個のメモリ自リクエストに
対して4個のマスク・ビツトがVMRI9から読み出さ
れ、付加情報変換回路20を通って8CU23に送出さ
れる。その際、マスク・ビットIglの要素については
メモリ・リクエストを無効化するオーダが付加される。
一方ER,2の内容をデコーダ8によシブコードして得
られるVRI a上のエントリからデータが読み出され
、レジスタ21にセットされる。その後データはメモリ
・リクエストと同期して8CU25に対して送出される
。5CU23はメモリ・リクエストに基づき受は取った
データをMS24に書き込む。以上の動作が64回繰シ
返されて256要素のストア処理が完了する。
られるVRI a上のエントリからデータが読み出され
、レジスタ21にセットされる。その後データはメモリ
・リクエストと同期して8CU25に対して送出される
。5CU23はメモリ・リクエストに基づき受は取った
データをMS24に書き込む。以上の動作が64回繰シ
返されて256要素のストア処理が完了する。
検出回路9はベクトル・ロード・ストア命令がM8上の
同一アクセスする場合を検出する。単純a−ド・ストア
命令の場合、オペ2ンド・データのアドレスは、先頭要
素アドレスを示すVA几と要素間隔値を示すVI几との
和によって決定される。したがってV I R−’o’
という条件によつてM8上の同一アドレスをアクセスす
るものと認識する。インデックス付ロード拳ストアの場
合、オペランド・アドレスは先頭要素アドレスを示すV
ARと先頭要素からのオフセットを指すインデックスと
の和によって決定される。したがってインデックスとし
てSR1たはり、ITt−指定しているという条件によ
ってMS上の同一アドレスをアクセスするものと認識す
る。
同一アクセスする場合を検出する。単純a−ド・ストア
命令の場合、オペ2ンド・データのアドレスは、先頭要
素アドレスを示すVA几と要素間隔値を示すVI几との
和によって決定される。したがってV I R−’o’
という条件によつてM8上の同一アドレスをアクセスす
るものと認識する。インデックス付ロード拳ストアの場
合、オペランド・アドレスは先頭要素アドレスを示すV
ARと先頭要素からのオフセットを指すインデックスと
の和によって決定される。したがってインデックスとし
てSR1たはり、ITt−指定しているという条件によ
ってMS上の同一アドレスをアクセスするものと認識す
る。
リクエスト制御回路10は5CU25に対して送出する
メモリ・リクエストの個数を検出回路9からの指示によ
フ変える。つまシ、MS上の同一アドレスをアクセスす
る場合には、64個のリクエストを連続して送出するの
でなく、ただ1個のリクエストを送出するのでるる。ベ
クトル・ロード命令の場合には、VMRI9から送出さ
れてくるマスク拳ビット中に11“が存在した場合に、
初めてメモリ・リクエストを5CU23jC対して送出
する。先頭有効要1gに対応するメモリ・リクエストが
発行された後は、有効要素があってもメモリ・リクエス
トは送出しない。これに対してVRI8の誉き込み信号
14は要素並列毎に64回送出される。実際の曹さ込み
はVMRI9の制御を受け、有効要素についてのみデー
タが書き込まれる。ベクトル・ストア命令の場合には、
VMRI9から送出されてくるマスク・ビットの内最後
の+1+に対応してメモリーリクエストを5CU23に
対して送出する。したがって64回のVMR,読み出し
く対してメモリ・リクエストが送出されるのは最終有効
要素並列の1回のみである。一方V几18の読み出しは
要素並列毎に64回行われる。ベクトル−ロード、ベク
トル・ストアいずれの場合に4V318上のアクセスす
るエントリを示すE′BI2は要素並列毎に1ずつカウ
ント・アクプされる。
メモリ・リクエストの個数を検出回路9からの指示によ
フ変える。つまシ、MS上の同一アドレスをアクセスす
る場合には、64個のリクエストを連続して送出するの
でなく、ただ1個のリクエストを送出するのでるる。ベ
クトル・ロード命令の場合には、VMRI9から送出さ
れてくるマスク拳ビット中に11“が存在した場合に、
初めてメモリ・リクエストを5CU23jC対して送出
する。先頭有効要1gに対応するメモリ・リクエストが
発行された後は、有効要素があってもメモリ・リクエス
トは送出しない。これに対してVRI8の誉き込み信号
14は要素並列毎に64回送出される。実際の曹さ込み
はVMRI9の制御を受け、有効要素についてのみデー
タが書き込まれる。ベクトル・ストア命令の場合には、
VMRI9から送出されてくるマスク・ビットの内最後
の+1+に対応してメモリーリクエストを5CU23に
対して送出する。したがって64回のVMR,読み出し
く対してメモリ・リクエストが送出されるのは最終有効
要素並列の1回のみである。一方V几18の読み出しは
要素並列毎に64回行われる。ベクトル−ロード、ベク
トル・ストアいずれの場合に4V318上のアクセスす
るエントリを示すE′BI2は要素並列毎に1ずつカウ
ント・アクプされる。
すなわちVR18は全要素に対応してアクセスされるよ
うに制御信号26がリクエスト制御回路10から送出さ
れる。
うに制御信号26がリクエスト制御回路10から送出さ
れる。
付加情報変換回路20は、通常のベクトル・ロード・ス
トア命令処理の場合には、マスク・ピッ) 1o1の要
素に対してMSアクセスを無効化するオーダを付加する
。M8アクセスが同一アドレスに対するものである場合
には、この動作に加えて、a−ド処理では先頭有効要素
よ)後の有効要素に対してもMSアクセスするオーダを
付加する動作を行い、ストア処理では最終有効要素よシ
前の有効要素に対してもMSアクセスを無効化するオー
ダを付加する動作を行う。
トア命令処理の場合には、マスク・ピッ) 1o1の要
素に対してMSアクセスを無効化するオーダを付加する
。M8アクセスが同一アドレスに対するものである場合
には、この動作に加えて、a−ド処理では先頭有効要素
よ)後の有効要素に対してもMSアクセスするオーダを
付加する動作を行い、ストア処理では最終有効要素よシ
前の有効要素に対してもMSアクセスを無効化するオー
ダを付加する動作を行う。
マスク生成回路1は比較命令等のマスク生成命令実行時
に動作し、実行結果に基づいて得られたマスク・ビット
をVMRI 9に格納する。該動作の際、先頭有効要素
と最終有効要素とを検出することが可能であるので先頭
有効要素番号t−FVER5K、最終有効要素番号をL
VER6にそれぞれ格納する。つまシ、最初にマスクφ
ビットが111となった時点で処理中の要素番号を示す
ER2の値をFVE几5に転送し、保持する。−坦FV
ER5がセットされた後は後続のマスク・ビット11曹
に対してはセットを抑止する。マスク・ビットが111
となる毎にER12の値をLvER16に転送し、保持
する。すべての要素についてマスク生成処理が終了した
時点でI、VER6には最終有効要素の要素番号が残さ
れる。
に動作し、実行結果に基づいて得られたマスク・ビット
をVMRI 9に格納する。該動作の際、先頭有効要素
と最終有効要素とを検出することが可能であるので先頭
有効要素番号t−FVER5K、最終有効要素番号をL
VER6にそれぞれ格納する。つまシ、最初にマスクφ
ビットが111となった時点で処理中の要素番号を示す
ER2の値をFVE几5に転送し、保持する。−坦FV
ER5がセットされた後は後続のマスク・ビット11曹
に対してはセットを抑止する。マスク・ビットが111
となる毎にER12の値をLvER16に転送し、保持
する。すべての要素についてマスク生成処理が終了した
時点でI、VER6には最終有効要素の要素番号が残さ
れる。
以下、ベクトル・ロード・ストア命令がMS上の同一ア
ドレスを複数回アクセスする場合の処理について説明す
る。
ドレスを複数回アクセスする場合の処理について説明す
る。
ベクトル・ロード・ストア命令に先行してマスク生成命
令が実行され、後続のロード・ストアにて使用するマス
クを生成すると伴に先頭有効要素番号をFVffR5に
、最終有効要素番号をLYER6に格納する。
令が実行され、後続のロード・ストアにて使用するマス
クを生成すると伴に先頭有効要素番号をFVffR5に
、最終有効要素番号をLYER6に格納する。
ベクトル・a−ド命令ではFVER5を便用する。FV
ER5の値がセレクタ7を通ってデコーダ8に与えられ
先頭有効要素を含む1要素差列分のマスク4ビツトがV
MR19から読み出され、付加情報変換回路20に転送
される。付加情報変換回路20では、先頭有効要素以外
の要素に対してMSアクセスを無効化するオーダを付加
する。
ER5の値がセレクタ7を通ってデコーダ8に与えられ
先頭有効要素を含む1要素差列分のマスク4ビツトがV
MR19から読み出され、付加情報変換回路20に転送
される。付加情報変換回路20では、先頭有効要素以外
の要素に対してMSアクセスを無効化するオーダを付加
する。
例えば第2図のようにマスク・ビットが’01101で
FVER5の値が11嘗の場合、付加すべきオーダは’
1011’となる。リクエスト制御回路10は該要素並
列に対応して1回だけメ七り・リクエストを5CU25
に対して発行する。8CU25はオーダを参照し、無効
指示の付加されていない要素についてのみMS24をア
クセスし、先頭有効要素に対応するデータを読み出す。
FVER5の値が11嘗の場合、付加すべきオーダは’
1011’となる。リクエスト制御回路10は該要素並
列に対応して1回だけメ七り・リクエストを5CU25
に対して発行する。8CU25はオーダを参照し、無効
指示の付加されていない要素についてのみMS24をア
クセスし、先頭有効要素に対応するデータを読み出す。
読み出されたデータは5CU23を通シレジスタ25に
セットされる。その際データは要素並列の4要素に拡張
される。レジスタ25はセット信号2Bによって該デー
タをセットされた後は該データを保持し続ける。この間
VB制御回路11はセット信号26によってE凡2を更
新し、書き込み信号14によってVRのすべて有効な要
素に対して同一データをレジスタ25よシ書き込む。書
き込みの際にはVM几19の値が反映され、マスク・ビ
ット111の要素についてのみM8上のアクセス・アド
レスにあるのと同一のデータが書き込まれる。
セットされる。その際データは要素並列の4要素に拡張
される。レジスタ25はセット信号2Bによって該デー
タをセットされた後は該データを保持し続ける。この間
VB制御回路11はセット信号26によってE凡2を更
新し、書き込み信号14によってVRのすべて有効な要
素に対して同一データをレジスタ25よシ書き込む。書
き込みの際にはVM几19の値が反映され、マスク・ビ
ット111の要素についてのみM8上のアクセス・アド
レスにあるのと同一のデータが書き込まれる。
ベクトル・ストア命令ではLVER6を使用する。LV
ER6の直がセレクタ7を通ってデコーダ8に与えられ
最終有効要素を含む1要素差列分のマスク4ビツトがV
MR19から読み出され、付加情報変換回路20に転送
される。付加情報変換回路20では、最終有効要素以外
の要素に対してM8アクセスを無効化するオーダを付加
する。
ER6の直がセレクタ7を通ってデコーダ8に与えられ
最終有効要素を含む1要素差列分のマスク4ビツトがV
MR19から読み出され、付加情報変換回路20に転送
される。付加情報変換回路20では、最終有効要素以外
の要素に対してM8アクセスを無効化するオーダを付加
する。
例えば第3図のようにマスク・ビットが’0110’の
場合、付加すべきオーダは’1101’となる。
場合、付加すべきオーダは’1101’となる。
リクエスト制御10は該要素並列に対応して1回だけメ
モリ・リクエストを5CU25に対して発行する。8C
U23はオーダを参照し、無効指示の付加されていない
要素についてのみMS24をアクセスし、最終有効要素
に対応するデータを書き込む。該データはVMR19の
読み出しと同期してVRI 8から読み出されレジスタ
21にセットされた4個のデータの内、LVER6の示
すデータである。以上により、MS上のアクセス・アド
レスにはすべての有効要素を書き込んだ場合と同一の結
果が残されることになる。
モリ・リクエストを5CU25に対して発行する。8C
U23はオーダを参照し、無効指示の付加されていない
要素についてのみMS24をアクセスし、最終有効要素
に対応するデータを書き込む。該データはVMR19の
読み出しと同期してVRI 8から読み出されレジスタ
21にセットされた4個のデータの内、LVER6の示
すデータである。以上により、MS上のアクセス・アド
レスにはすべての有効要素を書き込んだ場合と同一の結
果が残されることになる。
本実施例によれば、(!素番号0から要素番号255ま
でのM8上の同一アドレスへのマスク付の連続的なアク
セスをただ1回のアクセスとして処理することによって
マスク付のベクトル・ロード・ストア命令のスループッ
トの低下を回避可能である。
でのM8上の同一アドレスへのマスク付の連続的なアク
セスをただ1回のアクセスとして処理することによって
マスク付のベクトル・ロード・ストア命令のスループッ
トの低下を回避可能である。
本発明によれば、マスク付のベクトル・ロード中ストア
命令の処理において、MS上の同一アドレスを連続して
複数回アクセスする場合、M8へのアクセスを一回とす
ることによって処理時間を短縮することが可能となシ、
命令処理性能が向上する。
命令の処理において、MS上の同一アドレスを連続して
複数回アクセスする場合、M8へのアクセスを一回とす
ることによって処理時間を短縮することが可能となシ、
命令処理性能が向上する。
第1図は本発明の一実施例の構成図、第2図および第5
図はマスク・ビットの一例を示す説明図である。 1・−マスク生成回路、2・−要素数レジスタ、5−先
頭有効要素レジスタ、6・・・最終有効要素レジスタ、
9・・・検出回路、10−リクエスト制御回路。 11・VR制御回路、19 ・・・ベクトル・マスク・
レジスタ、20・−付加情報変換回路。 第 1 図 9 検本可落 第 2 図 箒 3 図 手続補正書(自発) 事件の表示 昭和 62 年特許願第 314058 号発明の名
称 ベクトル処理装置 補正をする者 餠と1係 特許出願人 名 称 Cs+o+株式会社 日 立 製 作所(化
1石) 代 理 人 補正の対象 図面(全図) 補正の内容 別紙のとおシ 見1目 9−0.検伝目発 殆2図 原綿7平素 易50 ! tviyrp7TfT*素
図はマスク・ビットの一例を示す説明図である。 1・−マスク生成回路、2・−要素数レジスタ、5−先
頭有効要素レジスタ、6・・・最終有効要素レジスタ、
9・・・検出回路、10−リクエスト制御回路。 11・VR制御回路、19 ・・・ベクトル・マスク・
レジスタ、20・−付加情報変換回路。 第 1 図 9 検本可落 第 2 図 箒 3 図 手続補正書(自発) 事件の表示 昭和 62 年特許願第 314058 号発明の名
称 ベクトル処理装置 補正をする者 餠と1係 特許出願人 名 称 Cs+o+株式会社 日 立 製 作所(化
1石) 代 理 人 補正の対象 図面(全図) 補正の内容 別紙のとおシ 見1目 9−0.検伝目発 殆2図 原綿7平素 易50 ! tviyrp7TfT*素
Claims (1)
- 1、ベクトル・データを格納する主記憶と、複数の演算
器と、演算の中間結果を保持する複数のベクトル・レジ
スタと、ベクトル・データの主記憶からの読み出し、並
びに主記憶への書き込みを行う複数のロード・ストア・
パイプラインと、演算および主記憶アクセスの有効、無
効を指定する複数のマスク・レジスタと及びその生成・
参照制御回路から構成されるベクトル処理装置において
、ベクトル・ロード・ストア命令のアドレッシグ指定及
びベクトル・アドレス・レジスタの内容に基づきアクセ
スするデータが同一アドレスであることを検出する回路
と、マスク生成時に最初の有効なデータ、もしくは最後
の有効なデータを認識してその要素番号を保持する回路
と、マスク参照時に保持された要素番号以外のデータに
対して該データを無効化するように付加情報を変換する
回路と、主記憶から読み出された最初の有効なデータを
保持しておき、全ての要素に対して同一のデータをベク
トル・レジスタに対して送出する回路と、ベクトル・レ
ジスタから転送されてきた全ての要素の中から最後の有
効なデータを選択して主記憶に書き込む回路とによつて
構成され、マスク付のベクトル・ロード・ストア命令処
理における同一アドレスに対する連続した複数回の主記
憶読み出し、もしくは書き込みを一回にすることにより
ベクトル・ロード・ストア処理を高速化することを特徴
とするベクトル処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP31405887A JPH01155471A (ja) | 1987-12-14 | 1987-12-14 | ベクトル処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP31405887A JPH01155471A (ja) | 1987-12-14 | 1987-12-14 | ベクトル処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01155471A true JPH01155471A (ja) | 1989-06-19 |
Family
ID=18048715
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP31405887A Pending JPH01155471A (ja) | 1987-12-14 | 1987-12-14 | ベクトル処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01155471A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20170052382A (ko) * | 2015-11-04 | 2017-05-12 | 삼성전자주식회사 | 데이터를 병렬 처리하는 방법 및 이를 위한 장치 |
-
1987
- 1987-12-14 JP JP31405887A patent/JPH01155471A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20170052382A (ko) * | 2015-11-04 | 2017-05-12 | 삼성전자주식회사 | 데이터를 병렬 처리하는 방법 및 이를 위한 장치 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5204953A (en) | One clock address pipelining in segmentation unit | |
| EP0029517A2 (en) | Store-in-cache mode data processing apparatus | |
| JPH03108042A (ja) | 多重仮想空間アドレス制御方法および計算機システム | |
| US6381686B1 (en) | Parallel processor comprising multiple sub-banks to which access requests are bypassed from a request queue when corresponding page faults are generated | |
| JPS6341100B2 (ja) | ||
| US5226132A (en) | Multiple virtual addressing using/comparing translation pairs of addresses comprising a space address and an origin address (sto) while using space registers as storage devices for a data processing system | |
| US4924425A (en) | Method for immediately writing an operand to a selected word location within a block of a buffer memory | |
| CA1279407C (en) | Buffer storage control system | |
| US5414821A (en) | Method of and apparatus for rapidly loading addressing environment by checking and loading multiple registers using a specialized instruction | |
| CA1264200A (en) | System memory for a reduction processor evaluating programs stored as binary directed graphs employing variable-free applicative language codes | |
| JPH01155471A (ja) | ベクトル処理装置 | |
| US5506980A (en) | Method and apparatus for parallel processing of a large data array utilizing a shared auxiliary memory | |
| EP0196970B1 (en) | Buffer memory control system | |
| US5276853A (en) | Cache system | |
| US4561071A (en) | Storage system having buffer storage | |
| US4598361A (en) | Allocator for a reduction processor evaluating programs stored as binary directed graphs employing variable-free applicative language codes | |
| US5426749A (en) | Buffer control system using synonymic line address to retrieve second tag portion for fetch and store accesses while first tag portion is invalidated | |
| JP2783285B2 (ja) | 情報処理装置 | |
| JPS601655B2 (ja) | デ−タプリフェツチ方式 | |
| JPH05257807A (ja) | キャッシュメモリ制御装置 | |
| JPS6161143B2 (ja) | ||
| JPH03141444A (ja) | データ処理装置 | |
| JPS6410858B2 (ja) | ||
| WO1996006394A1 (en) | Method and system for identifying common data element in data blocks for storage | |
| JPH03109656A (ja) | 多重仮想アドレス空間アクセス方法およびデータ処理装置 |