JPS61279976A - ベクトル処理装置 - Google Patents

ベクトル処理装置

Info

Publication number
JPS61279976A
JPS61279976A JP12047885A JP12047885A JPS61279976A JP S61279976 A JPS61279976 A JP S61279976A JP 12047885 A JP12047885 A JP 12047885A JP 12047885 A JP12047885 A JP 12047885A JP S61279976 A JPS61279976 A JP S61279976A
Authority
JP
Japan
Prior art keywords
vector
data
sorter
elements
sorted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP12047885A
Other languages
English (en)
Inventor
Koichi Ishii
石井 幸一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP12047885A priority Critical patent/JPS61279976A/ja
Publication of JPS61279976A publication Critical patent/JPS61279976A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8053Vector processors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、ベクトル処理装置に係り、特にベクトル形式
のソート処理に好適なベクトル処理装置に関する。
〔発明の背景〕
汎用スカラ演算を行うデータ処理装置に、ベクトル計算
の進行を管理するエレメントカウンタと、ベクトルエレ
メント間の演算を行う演算D(これは上記データ処理装
置と共有する場合もある)とを付加し、ベクトルオペラ
ンドデータのメモリアクセスは上記データ処理装置の記
憶制御回路を用い、メモリ上のベクトルデータ間の演算
をパイプラインで実行することのできるベクトル処理装
置は、既に実用化されている(例えば特願昭52−15
23号、特願昭52−2396号、特願昭52−240
3号)。
従来、このようなベクトル処理装置では、データの演算
結果によらず、各ベクトルオペランドのインデクスが一
様に増加するタイプのベクトル演算を行うのを原則とし
ていた。従って、エレメントカウンタは1本あれば制御
が可能であり、ベクトルオペランドレジスタの更新もあ
らかじめ予測可能であった。
ところが、各ベクトルオペランドレジスタのインデクス
の増加が、データの演算結果に依存する形式のベクトル
演算を考えた場合、従来のベクトル処理装置では、この
ようなタイプのベクトル演算は、ベクトル化して高速化
することができなかった。その理由の1つとして、エレ
メントカウンタがオペランド毎に独立にないことがあげ
られる。
また、従来のベクトル処理装置はデータの比較を並列に
行って一定要素ブロック内でソート済のベクトルデータ
を出力するような並列比較回路も持っていないため、ベ
クトル形式データのソート処理を効率的に行うことがで
きなかった。
〔発明の目的〕
本発明の目的は、ベクトル形式のソート処理を高速化す
ることを可能とするベクトル処理装置を提供することに
ある。
〔発明の概要〕
本発明のベクトル処理装置は、併合式ソート方式により
ソート処理を行う機構と並列比較ソート方式によりソー
ト処理を行う機構とを合せ持つ構成としたことを特徴と
する。
併合式ソート方式とは、ある一定値数の要素内ごとにソ
ートされたベクトルデータを2つ入力し、当該ソート済
要素ブロック2つのデータをソートし、ソート済要素ブ
ロックは入力の2倍でベクトル長は入力ベクトル長の和
になるようなベクトルデータを出力する方式である。こ
の方式を用いた場合、入力ベクトル内のソート済要素ブ
ロック長をmとした場合、出力ベクトル中のソート済要
素ブロック長はmX2になる。一方、並列比較ソート方
式は、ベクトルデータを順次レジスタ(1つのレジスタ
に1つの要素が入る)内に取り入れた後、レジスタ内デ
ータを並列に比較し、比較結果に基いて順次出力する方
式であるが、この方式によると、レジスタの数をnとし
た場合に、出力ベクトル中のソート済要素ブロック長は
nになる。
従って、1回のベクトルデータ処理によりソート済とな
る要素ブロック長に着目すると明らかなように、n)m
X2の場合には、並列比較ソート方式の方が、併合式ソ
ート方式よりも効率がよい。
たゾし、物理的制約のために、並列比較ソート方式で、
nをいくらでも大きくするという訳にもいかない。
本発明は、このような考えに基づくものであり。
ベクトルデータのソート処理のうちの初めの処理(n>
mx2となる場合)を並列比較ソート方式で行い、しか
る後に併合式ソート方式により順次ソート済要素ブロッ
ク長を大きくしていって、最後に所望のソート済ベクト
ルデータを得ることにより、ソート処理全体の処理時間
を短くするものである。
〔発明の実施例〕
以下、本発明の一実施例を第1図乃至第3回により説明
する。
第1図は本発明によるベクトル処理装置の全体構成図で
あり、2は並列比較式ソータ、3は併合式ソータ、5は
メモリ制御ユニット、6はメモリである。1と11と1
6はデータ読出しパス、7〜10および12〜15は並
列比較式ソータ2から併合式ソータ3へのデータ転送パ
ス、4は併合式ソータ3からメモリ6へのデータ格納パ
スである。17〜19はデータ転送制御信号である。
メモリ6からメモリ制御ユニット5の制御下でパス1に
読み出されたベクトルデータは、並列比″′ゞ′−“°
1°“1”3°t=”、r−t、rtb’t:’   
 。
パ8″〜”°2”′〜”1°161′−′   13に
送られる。併合式ソータ3はこれら4要素と     
 1□ との2組のデータを併合しながらソートし、8要素内で
ソートされたベクトルデータをパス4から出力する。こ
のようにして、8個の要素内ごとにソートされたベクト
ルデータは、メモリ制御ユニット5を通しメモリ6に格
納される。次に、このベクトルデータを2つに分けてパ
ス11とパス16により併合式ソータ3に入力し、併合
式ソートを行うことにより、パス4から16個の要素内
ととにソートされたベクトルデータが作られる。後は、
併合式ソータ3を繰り返し用いることによって、ソート
済要素ブロック長を大きくしていき、これがベクトル長
以上になれば処理が完了する。
第2図は並列比較式ソータ2の構成例である。
第2図において、1はデータ入力パス、20は入力デー
タバッファ、21はストリーム識別情報付加回路、22
−1〜22−4はベクトルデータの要素を1つづつ入れ
るレジスタ、23−1〜23−6は比較回路、24は比
較結果に基づく動作制御回路、25および26は出力デ
ータバッファである。27は出力データセレクト信号、
28−1〜28−4はレジスタのセット信号、29−1
〜29−2は出力データバッファのセット信号である。
17は並列比較式ソータ2から併合式ソータ3へのデー
タ送出を通知する制御信号である。
バス1により並列比較式ソータ2に入ってきたデータは
、入力データバッファ20に入った後。
ストリーム識別情報付加回路21によってストリーム識
別情報を付けられてレジスタ22−1〜22−4のいず
れかにセットされる。一番最初の4要素は22−1から
22−2.22−3.22−4というようにレジスタに
順次入り、ストリーム識別情報はすべて0が付加される
。この4要素が大小比較回路23−1〜23−4で比較
され、その比較結果とストリーム識別情報を用いて、動
作制御回路24はセレクタ制御信号27と出力バッファ
へのデータのセット信号29−1を送出する。
この結果、レジスタ22−1〜22−4のうちの1つの
データが出力バッファ25の左端に入る。
第5番目の要素は入力バッファ20を通った後、出力バ
ッファ25へ移動したデータの入っていたレジスタ(2
2−1〜22−4のいずれか)に入る。この際、ストリ
ーム識別情報は1が付けられる。つまり、ストリーム識
別情報付加回路21は第5番目から第8番目までの要素
に対してはストリーム識別情報1を付加し、次の4要素
は、iた0を付加するというように、4要素ごとにスト
リーム識別情報をOから1.1から0と切りかえる。
また、ストリーム指示信号21−1によって、動作制御
回路24に対し、比較回路23−1〜23−6による比
較結果のうちのどれを用いて判定を行えばよいかを指示
する。この結果、レジスタ22−1〜22−4の中にス
トリーム識別情報が0のデータと1のデータが混在して
も、動作制御回路24で正しい判定をすることができ、
レジスタ22−1〜22−4の有効活用がはかれる。
このようにして最初の8要素の処理が終ると、入力ベク
トルデータの1番目の要素から4番目の要素までが、ソ
ートされて出力バッファ25に入っている。また、第5
番目の要素から第8目の要素もソートされて出力バッフ
ァ26に入っている。
この時点で動作制御回路24から制御信号線17により
併合式ソータ3に対しデータの退出信号を送る。
第3図は併合式ソータ3の構成例である。制御信号線1
7によりデータ送出信号を受は取ると、セレクタ切り換
え信号31およびセット信号32゜33の送出によって
入力データバッファ(オペランドバッファ)34.35
に8要素分のデータを取り込む、第3図において、36
.37はそれぞれオペランドバッファ34.35のアウ
トポインタであり、39はアウトポインタ35の指して
いるオペランドデータの比較回路である。38は比較回
路39への2つの入力オペランド各々に対応するエレメ
ントカウンタおよび、バス4から出力する出力オペラン
ドに対応するエレメントカウンタからなるカウンタ群で
ある。41は比較回路39による比較結果とカウンタ群
38からの制御情報40をもとにアウトポインタ36.
37の更新指示信号および出力データバッファ43にセ
ットするデータのセレクト信号42を出力する判定回路
である。比較回路39の比較結果によって、オペランド
バッファ34または35のうちのどちらかの一要素が出
力バッファ43にセットされ、当該要素の入っていたオ
ペランドバッファのアウトポインタはl増加される。な
お、オペランドバッファ34または35のうちの一方の
データがすべて出力データバッファ43に移動されると
、制御情報40によってそれを通知された判定回路41
は、以降データの残っている方のオペランドバッファの
データのみ選択するように制御線42により制御し、ま
た、データの残っている方のオペランドバッファのアウ
トポインタのみ1づつ増加させる。
このようにしてソートされた8要素すべてが出力パス4
から出力されると、次に入力データパス7〜10.12
〜15によって次の8要素が送られくる。なお、これと
同時に制御線17を用いた指示によってアウトポインタ
36.37およびエレメントカウンタ群38の初期化が
行われる。
以上のような処理により、8個の要素毎にソート済みと
なったベクトルデータはメモリ制御回路5を経由してメ
モリ6へ格納される。
次に、当該ベクトルデータのベクトル長をN、[N/2
)をN/2を越えない最小の整数としたとき、第1番目
の要素から第(N/2)番目の要素までを第1オペラン
ド・ベクトル、第〔N/2)番目の要素から第N番目の
要素までを第2オペランド・ベクトルとしてメモリ6か
ら読み出し、バス11.16によってオペランドバッフ
ァ34゜35に順次取り込む、オペランドバッファにデ
ータが入り次第、比較とデータの出力を開始するが、一
方の入力オペランドバッファ中のデータをすべて出力す
ると、判定回路41からの制御信号18の指示により次
のデータがメモリ制御回路5からバス11または16を
通って併合式ソータ3へ送られる。アウトポインタ36
.37のイニシャライズおよびエレメントカウンタの再
設定は制御線19の指示によって判定回路41が行う。
オペランド別カウンタ群38で出力バス4から出力され
る要素数をカウントしており、ベクトル長Nの要素数だ
け出力した時点で処理を終了する。この結果できたベク
トルデータは16要素のブロック毎にソートされたもの
になっている。
このように併合式ソータ3を1回通すと、ソート済要素
のブロック長が2倍になるので、ソート済ブロック長が
ベクトル長Nになるまで繰り返しソータ3を通すことに
より、全体がソート済のベクトルデータがメモリ6上に
得られる。
こぎで、−例として128要素のソートを行う場合を考
える。従来は、■データの比較、■ムーブ、■インデク
スの更新、■終了条件判定と1要素処理するのに4マシ
ンサイクルか5っていた。
一方、併合式ソート処理を1回施すごとにソート済要素
ブロック長が1.2,4,8.・・・となることを考え
ると、併合式ソート処理を7回施せば(2’ =128
) 、全体がソート済となる。従って、処理全体に要す
る時間は、4X128X7=3584マシン・サイクル
となる。
これをすべて併合式ソータのみを用いて処理すると、1
要素あたり1マシンサイクルで処理できるから、lX1
28X7=896マシン・サイクルとなる。さらに、並
列比較式ソータを用いると。
128マシン・サイクルで8要素ブロツク内のソートが
完了し、その後4回の併合式ソータによるベクトル処理
でソートが完了する。従って、全部で128+lX12
8X4=640マシン・サイクルで処理を完了すること
ができる。これは従来方式の3584マシン・サイクル
に対して5分の1以下の時間である。
〔発明の効果〕
本発明によれば、ベクトルデータのソート処理において
、ソート済要素ブロック長が小さい最初の処理は並列比
較式ソータを用い、その後併合式ソータにより順次ソー
ト済要素ブロック長を大きくしていくため、ソート処理
全体の処理時間を短くすることができる。
【図面の簡単な説明】
第1図は本発明の一実施例の全体構成図、第2図は第1
図の並列式ソータ部の詳細を示す図、第3図は第1図の
併合式ソータ部の詳細を示す図である。 2・・・並列比較式ソータ部、 31併合式ソータ部、
  5・・・メモリ制御ユニット、  6・・・メモリ
。 第2図

Claims (1)

    【特許請求の範囲】
  1. (1)1組ないし複数組のベクトルオペランドの要素を
    順次読出し、演算結果を順次ベクトルオペランドに格納
    するベクトル処理装置において、ベクトル形式データの
    ソート処理を行うため、オペランドレジスタと比較回路
    を複数個具備した並列比較式ソータと、オペランド毎に
    エレメントカウンタを持ち複数組のベクトルオペランド
    を入力して1組のベクトルオペランドを出力する併合式
    ソータとを設けたことを特徴とするベクトル処理装置。
JP12047885A 1985-06-05 1985-06-05 ベクトル処理装置 Pending JPS61279976A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12047885A JPS61279976A (ja) 1985-06-05 1985-06-05 ベクトル処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12047885A JPS61279976A (ja) 1985-06-05 1985-06-05 ベクトル処理装置

Publications (1)

Publication Number Publication Date
JPS61279976A true JPS61279976A (ja) 1986-12-10

Family

ID=14787166

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12047885A Pending JPS61279976A (ja) 1985-06-05 1985-06-05 ベクトル処理装置

Country Status (1)

Country Link
JP (1) JPS61279976A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116225364A (zh) * 2022-12-30 2023-06-06 深圳云天励飞技术股份有限公司 一种矢量排序装置、方法及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5922138A (ja) * 1982-07-27 1984-02-04 Sumitomo Electric Ind Ltd ソ−ト・マ−ジ回路
JPS59189442A (ja) * 1983-04-13 1984-10-27 Nippon Telegr & Teleph Corp <Ntt> ソ−テイング処理方式
JPS6081640A (ja) * 1983-10-11 1985-05-09 Nippon Telegr & Teleph Corp <Ntt> ソ−ト処理装置
JPS60128529A (ja) * 1983-12-16 1985-07-09 Fujitsu Ltd マ−ジ処理器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5922138A (ja) * 1982-07-27 1984-02-04 Sumitomo Electric Ind Ltd ソ−ト・マ−ジ回路
JPS59189442A (ja) * 1983-04-13 1984-10-27 Nippon Telegr & Teleph Corp <Ntt> ソ−テイング処理方式
JPS6081640A (ja) * 1983-10-11 1985-05-09 Nippon Telegr & Teleph Corp <Ntt> ソ−ト処理装置
JPS60128529A (ja) * 1983-12-16 1985-07-09 Fujitsu Ltd マ−ジ処理器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116225364A (zh) * 2022-12-30 2023-06-06 深圳云天励飞技术股份有限公司 一种矢量排序装置、方法及存储介质

Similar Documents

Publication Publication Date Title
US4766564A (en) Dual putaway/bypass busses for multiple arithmetic units
JP3026733B2 (ja) データ処理装置、処理方法及び制御方法
JPH0731669B2 (ja) ベクトル・プロセツサ
US5274777A (en) Digital data processor executing a conditional instruction within a single machine cycle
US4734877A (en) Vector processing system
EP0164995B1 (en) Parallel register transfer mechanism for a reduction processor evaluating programs stored as binary directed graphs employing variable-free applicative language codes
JPS61279976A (ja) ベクトル処理装置
US4644464A (en) Graph manager for a reduction processor evaluating programs stored as binary directed graphs employing variable-free applicative language codes
US4615003A (en) Condition concentrator and control store for a reduction processor evaluating programs stored as binary directed graphs employing variable-free applicative language codes
RU2198422C2 (ru) Асинхронная синергическая вычислительная система
Colavita et al. A novel sorting algorithm and its application to a gamma-ray telescope asynchronous data acquisition system
JPS6324325A (ja) デ−タ項目を分類する方法および分類装置
JPS6162974A (ja) ベクトルプロセツサ
JP2760649B2 (ja) 情報処理装置
Kuhl et al. A multicode single transition-time state assignment for asynchronous sequential machines
JPH0519736B2 (ja)
JPS59123048A (ja) ソ−ト処理装置
SU1734100A1 (ru) Векторно-потоковое операционное устройство
Narasimhan et al. Performance modelling of three parallel sorting algorithms on a pipelined transputer network
SU864340A1 (ru) Устройство дл сдвига информации
JPH0250258A (ja) ベクトル処理装置
Wen et al. Efficient computing methods for parallel processing: An implementation of the Viterbi algorithm
JPS62154140A (ja) マ−ジ処理装置
JPH0320864A (ja) ファジィ計算用ベクトル命令セットを有する情報処理装置
Lun et al. A pipeline design for the realization of the prime factor algorithm using the extended diagonal structure