JPH0241563A

JPH0241563A - ベクトル処理方式

Info

Publication number: JPH0241563A
Application number: JP19383388A
Authority: JP
Inventors: Yoshihiro Fujita; 藤田　善弘
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1988-08-02
Filing date: 1988-08-02
Publication date: 1990-02-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、ベクトル・データを高速に処理する処理装置
に関する。

（従来の技術）従来の技術について図を用いて説明する。

第３図に示すようなりｏループの計算、すなわち線形漸
化式の計算においては、第４図に示すように、Ａ（３）
の計算にＡ（２）を必要とし、また、その結果を使って
Ａ（４）を計算するというように、計算が逐次的にしか
実行できない。

従って、本来ベクトル演算器では実行できないものであ
る。しかし、この処理を高速に実行するため、ベクトル
漸化式命令というベクトル命令が用意されている。

このベクトル漸化式命令の従来の方式による処理手順を
第５図を用いて説明する。第５図は、従来の方式で第３
図に示した漸化式を処理する、多重化されていないベク
トル処理装置のブロック図である。ただし、ここには第
３図に示した漸化式の計算に必要なデータ・パスのみが
示されている。

第５図において、５１〜５３はベクトル・レジスタ、５
４はパイプライン乗算器、５５はパイプライン加算器で
ある。

このような処理装置において、先の第３図に示した演算
をおこなうには、ベクトル・レジスタ５２にベクトル・
データＢ（Ｉ）を、ベクトル・レジスタ５３にベクトル
・データＣ（Ｉ）をロードした後、データＡ（１）をス
カシ・レジスタから取り出して、パイプライン乗算器５
４に入力する。パイプライン乗算器５４はそのＡ（１）
とベクトル・レジスタ５２から取り出したデータＢ（２
）とを掛は合わせ、その結果をパイプライン加算器５５
に送る。パイプライン加算器５５はそのデータとベクト
ル・レジスタ５３から取り出したデータＣ（２）とを足
し合わせ、その結果をパイプライン乗算器５４に送ると
ともにベクトル、レジスタ５１に格納する。この処理を
Ｄｏループの回数だけ繰り返す。

このような漸化式の処理をスカシ。プロセッサで実行す
る場合には、途中にデータのロードｌセーブが必要で、
また１ループ処理毎に条件分岐命令が必要であるが、ベ
クトル・プロセッサで処理することによって条件分岐を
含まず連続的に実行でき、またベクトルレジスタへの結
果の格納はその次の演算と同時に実行できるため、スカ
シ・プロセッサの数倍の処理性能が得られている。

また、ベクトル・プロセッサが多重化されている場合の
処理手順を、４多重の場合を例にとり、第６図を用いて
説明する。

第６図は、従来の方式で第３図に示した漸化式を処理す
るためのベクトル漸化式命令を実行する、４多重ベクト
ル処理装置のブロック図である。以下では、多重化され
ている各ベクトル処理ユニットをＶＰＵ（ベクトル・プ
ロセシング・ユニット）と呼び、４つのＶＰＵをそれぞ
れＶＰＵＯ〜ＶＰＵ３と呼ぶ。

第６図において６０〜６３はＶＰＵＯ〜３である。また
、６１０〜６２１はベクトル、レジスタ、６３０〜６３
３はパイプライン乗算器、６４０〜６４３はパイプライ
ン加算器である。この場合、漸化式を計算する処理手順
は次のようになる。

第６図において、第３図に示した演算をおこなうには、
ベクトルレジスタ６１１，６１４，６１７，６２０にベ
クトル・データＢ（Ｉ）をベクトル・レジスタ６１２．
６１５゜６１８．６２１にベクトル・データＣ（Ｉ）を
分配してロードした後、データＡ（１）をスカシ・レジ
スタから取り出し、パイプライン乗算器６３０に入力す
る。パイプライン乗算器６３０はそのＡ（１）とベクト
ル・レジスタ６１１から取り出したデータＢ（２）とを
掛は合わせ、その結果をパイプライン加算器６４０に送
る。パイプライン加算器６４０はそのデータとベクトル
、レジスタ６１２から取り出したデータＣ（２）とを足
し合わせ、その結果をパイプライン乗算器６３１に送る
とともにベクトルレジスタ６１３に格納する。このよう
にして、ＶＰＵＯ−＋ＶＰＵ１−＋ＶＰＵ２−＋ＶＰＵ
３−＋ＶＰＵＯという順に、ＤＯループの回数だけ演算
を繰り返す。このとき、ＶＰＵＯ（６０）ハＡ（２）、
Ａ（６）、・・・・を処理し、ＶＰＵＩ（６１）は、Ａ
（３）、Ａ（７）　、・・・・、ＶＰＵ２（６２）は、
Ａ（４）、　Ａ（８）・・・・・ＶＰＵ３（６３）は、
Ａ（５）、Ａ（９）・・・・をツレぞれ処理する。

（発明が解決しようとする問題点）このような従来の方式では、ベクトル・プロセッサでベ
クトル漸化式命令を実行することにより、スカシ・プロ
セッサの数倍の性能は得られているのであるが、それで
も演算の逐次性のための十分な性能が得られていない。

また、本来ベクトル・プロセッサをｎ多重化するのは、
各ＶＰＵを同時に動作させ、ベクトル計算実行速度をｎ
倍にするためであるが、従来のベクトル漸化式命令の場
合、その演算の逐次性のために多重化されていることに
よる効果はない。

（問題を解決するための手段）上で説明したように、ベクトル漸化式命令の実行時には
各パイプライン演算器はほんの一部の期間しか処理を行
わず、他のほとんどの期間は空いている。そこで、まず
与えられた線形漸化式に対して、数値計算の分野でよく
知られている次のような変形をほどこす。

例えば、Ａ（Ｉ）＝　Ｂ（Ｉ）Ａ（Ｉ−１）＋　Ｃ（Ｉ
ＸＩ　＝　１〜ｎ）の計算について考えると、Ａ（Ｉ−１）＋Ｂ（Ｉ−１）Ａ（Ｉ−２）＋Ｃ（Ｉ−１
）　　　　・・・■Ａ（Ｉ）　＝　Ｂ（Ｉ）Ａ（Ｉ　−
１）Ｃ（Ｉ）　　　　　　　　　　・・・■であるので
、式■を式■に代入すると、Ａ（Ｉ）　＝　Ｂ（Ｉ）Ｂ
（Ｉ　−１）Ａ（Ｉ　−２）＋Ｂ（Ｉ）Ｃ（Ｉ−１）十
〇（Ｉ）となる。こうするとＡ（１−２）からＡ（Ｉ）を求める
ことができ、またＡ（Ｉ−７１）からＡ（Ｉ＋１）を求
めることができる。すなわち次のようになる。

Ａ（Ｉ）　＝　（Ｂ（Ｉ）Ｂ（Ｉ　−１））Ａ（Ｉ　−
２）＋（Ｂ（Ｉ）Ｃ（Ｉ−１）＋Ｃ（Ｉ））Ａ（Ｉ　＋
１）　＝　（Ｂ（Ｉ　＋　１）Ｂ（Ｉ））Ａ（Ｉ−１）
＋（Ｂ（Ｉ＋１）Ｃ（Ｉ）十〇（Ｉ＋１））ここで、Ｐ（Ｉ）＝　Ｂ（Ｉ）Ｂ（Ｉ−１）　　　　　　　　　
　　　・・・■Ｑ（Ｉ）＝　Ｂ（Ｉ）Ｃ（Ｉ−１）＋　
Ｃ（Ｉ）　　　　　　　　・・・■とすると、■、■式
はＡ（Ｉ）　＝　Ｐ（Ｉ）Ａ（Ｉ　−２）　＋　Ｑ（Ｉ）
　　　　　　　　　・・・■Ａ（Ｉ＋１）＝Ｐ（Ｉ＋１
）Ａ（Ｉ−１）＋Ｑ（Ｉ＋１）　　　　　・・・■とな
る。これらの２つの式のうち、弐〇でＡ（１）、Ａ（３
）、Ａ（５）・・・を計算し、弐〇でＡ（２）、　Ａ（
４）。

Ａ（６）・・・を計算すると、それらの２つの計算は同
時に実行できる。同様に代入して行くと、漸化式Ａ（Ｉ
）　＝　Ｂ（Ｉ）Ａ（Ｉ−１）　十〇（Ｉ）は、並列に
実行できるｎ個のｎとびの漸化式に分解できる。

例えば　上で述べたようにＡ（Ｉ）＝　Ｂ（Ｉ）Ａ（１−１）　十〇（ＩＸｉ　＝
　１−ｎ）を２個の２とびの漸化式に分解した場合につ
いて第７図に示す。２個の２とびの漸化式が並列に実行
可能であることが分かる。また、４個の４とびの漸化式
に分解した場合について第８図に示す。４個の４とびの
漸化式が並列に実行可能であることがわかる。

このようにして、代入を続ければ続けるほど、漸化式の
並列度は上がる。そして、ベクトル処理装置において、
空いている演算器を利用することにより、複数の漸化式
の計算を並列に処理することができ、全体の処理時間は
減少する。さらに、式■■に示したＰ（Ｉ）Ｑ（Ｉ）の
ような係数の計算も、同時に実行することが可能である
。

このように、本発明によれば漸化式を二つ以上の漸化式
に分け、それらの漸化式を同時に計算するベクトル漸化
式命令演算回路を持つことによって、従来のベクトル漸
化式命令の数倍の処理性能を得ることができる。

（実施例１）以下、本発明の一実施例について図面を用いて説明する
。

第１図は、本発明の方式番こよって、先に式■■に示し
た２つの２とびの漸化式を処理する命令を実行する、４
多重ベクトル処理装置のブロック図である。

第１図において１０〜１３はＶＰＵＯ〜３である。また
、１００〜１１１はベクトル・レジスタ、１２０〜１２
３はパイプライン乗算器、１３０〜１３３はパイプライ
ン加算器である。

このような構成のベクトル処理装置において、Ａ（Ｉ）
＝Ａ（Ｉ−１）Ｂ（Ｉ）＋Ｃ（Ｉ）という漸化式を、さ
きに説明した式０〜式■を利用して処理する。

まず、通常のベクトル乗算命令とベクトル加算命令を用
いて、式■■に従ってベクトル、データＰ（Ｉ）、Ｑ（
Ｉ）を計算し、それぞれベクトル、レジスタ１０１．１
０４，１０７，１１０およびベクトル、レジスタ１０２
．１０５，１０８，１１１に格納する。

次に、２つの２とびの漸化式を並列に実行する本発明に
よる命令が発行されると、弐〇〇に従って、以下のよう
に処理を進める。

まず、データＡ（１）、Ａ（２）をスカラルジスタから
取り出し、それぞれパイプライン乗算器１２０および１
２１に人力する。

そして、ＶＰＵＯとＶＰＵ２テＡ（３）、Ａ（５）、Ａ
（７）−・・を計算し、ＶＰＵＩとＶＰＵ３テＡ（２）
、Ａ（４）、Ａ（６）・・・を計算する。

このようにして、並列に２つの漸化式の計算を行う。

その結果、ベクトル・レジスタ１００にはＡ（２）、Ａ
（６）、・・・・が得られ、ベクトル・レジスタ１０３
にはＡ（３）、Ａ（７）、・・・　ベクトル・レジスタ
１０６にはＡ（４）、Ａ（８）・・・、ベクトル・レジ
スタ１０９にはＡ（５）、Ａ（９）・・・が得られる。

このように処理することによって、２つの式０式％れ同時に計算されるため、従来の方式の半分の時間で処
理される。

ただし、本発明の方式に、式■■の処理は含まれていな
い。しかし、これらの２式はベクトル化され、通常のベ
クトル乗算命令、ベクトル加算命令によって高速に処理
される。

このため、本方式によれば、第９図に示すようにＰ（Ｉ
）、Ｑ（Ｉ）の計算時間を合わせても、式■■の計算が
同時に実行されるため、従来の方式よりも高速に線形漸
化式の計算が出来る。

次に、ベクトル、プロセッサが多重化されていない場合
の処理手順を第１０図を用いて説明する。

第１０図において３０〜３２はベクトル・レジスタ、３
３はパイプライン乗算器、３４はパイプライン加算器で
ある。３０１〜３０４はデータ・バスである。

このような構成のベクトル処理装置において、４多重の
場合と同じ漸化式を処理する。

まず、通常のベクトル乗算命令とベクトル加算命令を用
いて、式■■に従ってベクトル・データＰ（Ｉ）、Ｑ（
Ｉ）を計算し、ベクトル、レジスタ３１および３２に格
納する。

次に、２つの漸化式を並列に実行する命令が発行される
と、式■■に従って、以下のように処理を進める。

まず、データＡ（１）をスカシ・レジスタから取り出し
、パイプライン乗算器３３に人力する。パイプライン乗
算器３３はそのＡ（１）とベクトル・レジスタ３１から
取り出したデータＰ（３）とを掛は合わせ、その結果を
パイプライン加算器３４に送る。パイプライン加算器３
４は、そのデータとベクトルレジスタ３２から取り出し
たデータＱ（３）とを足し合わせ、その結果得られたＡ
（３）をパイプライン乗算器３３に送るとともにベクト
ルレジスタ３０に格納する。

また、上の処理によってＡ（３）がパイプライン乗算器
３３に送られる前に、データＡ（２）をスカシ・レジス
タから取り出し、パイプライン乗算器３３に入力する。

パイプライン乗算器３３はそのＡ（２）とベクトルレジ
スタ３１から取り出したデータＰ（４）とを掛は合わせ
、その結果をパイプライン加算器３４に送る。パイプラ
イン加算器３４は、そのデータとベクトルルジス゛り３
２から取り出したデータＱ（４）とを足し合わせ、その
結果得られたＡ（４）をパイプライン乗算器３３に送る
とともにベクトルレジスタ３０に格納する。

この処理の全てのＡ（Ｉ）が求められるまで繰り返す。

このようにして、４多重の場合と同様の処理性能が得ら
れる。

以上、式■〜■に従って、漸化式を２つの２とびの漸化
式に分けた場合について説明したが、２つ以上の漸化式
に分けた場合も同様にして処理でき、高速に実行できる
。

一例として、さきに示した２とびの漸化式を利用して、
４とびの漸化式にすると次のようになる。

Ａ（Ｉ）＝（ＰＣＩ）Ｐ（Ｉ−１））Ａ（Ｉ−４）＋　
（Ｐ（Ｉ）Ｑ（Ｉ−１）＋　Ｑ（Ｉ））Ａ（Ｉ＋１）＝
（Ｐ（Ｉ＋１）Ｐ（Ｉ））Ａ（Ｉ−３）＋（Ｐ（Ｉ＋１
）Ｑ（Ｉ）＋Ｑ（Ｉ＋１））Ａ（Ｉ＋２）＝（Ｐ（Ｉ＋
２）Ｐ（１＋１））Ａ（Ｉ−２）＋（Ｐ（Ｉ＋２）Ｑ（
Ｉ＋１）＋Ｑ（Ｉ＋２））Ａ（Ｉ　＋　３）　＝　（Ｐ
（Ｉ　＋　３）ＰＣＩ　＋　２））Ａ（Ｉ　−１）＋　
（Ｐ（Ｉ　＋　３）Ｑ（Ｉ　＋　２）＋　Ｑ（Ｉ　＋　
３））ここで、Ｒ（Ｉ）＝　Ｐ（Ｉ）Ｐ（Ｉ−１）Ｓ（Ｉ）　＝　Ｐ（Ｉ）Ｑ（Ｉ−１）　＋　Ｑ（Ｉ）と
すると、Ａ（Ｉ）　＝　Ｒ（Ｉ）Ａ（Ｉ　−４）＋５（Ｉ）Ａ（
Ｉ＋１）＝Ｒ（Ｉ＋１）Ａ（Ｉ−３）＋Ｓ（Ｉ＋１）Ａ
（Ｉ＋２）＝Ｒ（Ｉ＋２）Ａ（Ｉ−２）＋Ｓ（Ｉ＋２）
Ａ（Ｉ＋３）＝Ｒ（Ｉ＋３）Ａ（Ｉ−１）＋Ｓ（Ｉ＋３
）となる。

係数ベクトルＲ（Ｉ）、５（Ｉ）が、先に通常のベクト
ル乗算命令、ベクトル加算命令で計算され、すでにベク
トルレジスタに格納されているとした場合、この処理を
実行するベクトル処理装置のブロック図を第１１図に示
す。この場合、４つの４とびの漸化式が並列に実行され
る。このため、本方式によれば第１２図に示すようにＲ
（Ｉ）、５（Ｉ）の計算時間を合わせても、２つの２と
びの漸化式の計算よりも高速に処理されることが期待で
きる。

（実施例２）以下、本発明の一実施例について図面を用いて説明する
。

実施例１の場合は、複数漸化式ベクトル処理命令が発行
されるときには、係数ベクトルＰ（Ｉ）、Ｑ（Ｉ）がす
でにベクトル・レジスタに格納されているとしていた。

しかし、本発明によれば、前もってＰ（Ｉ）、Ｑ（Ｉ）
を計算しておかなくても、パイプライン演算器の空いて
いるタイム・スロットを利用して、第３図で示したＰ（
Ｉ）、Ｑ（Ｉ）が読み出されるのと同じタイミングでＰ
（Ｉ）、Ｑ（Ｉ）をＡ（Ｉ）、Ｂ（Ｉ）から計算して演
算器に与えることにより、式■〜■の計算は同時に実行
することが出来る。

第２図は、本発明の方式によって、式■〜■に示した計
算、即ち線形漸化式を２つの２とびの漸化式に分解しそ
れらを並列に処理する、４多重ベクトル処理装置のブロ
ック図である。

第２図において２０〜２３はＶＰＵＯ〜３である。また
、２００〜２１１はベクトルルジスタ、２２０〜２２３
はパイプライン乗算器、２３０〜２３３はパイプライン
加算器、２４０〜２４３はデイレイ・バッファ、２５０
〜２６９はマルチプレクサである。

ベクトルルジスタ２０１，２０４，２０７，２１０には
Ｂ（Ｉ）が、ベクトルルジスタ２０２，２０５，２０８
，２１１にはＣ（Ｉ）がロードされている。そして、ベ
クトル漸化式命令が発行されると、スカラルジスタから
Ａ（１）、Ａ（３）を読みだした後、ベクトルルジスタ
からデータＢ（Ｉ）、Ｃ（Ｉ）を適当なタイミングで読
みだし、まだ適当なタイミングでマルチプレクサを切り
替えることによって処理を進め、演算の結果得られたＡ
（Ｉ）をベクトルルジスタ２００，２０３，２０６，２
０９に格納する。

デイレイ・バッファ２４０〜２４３は、前段の演算によ
って得られたデータを、適当なタイミングに次の演算器
に供給するために、−時的にデータを保持する。コノと
き、ＶＰＵＯとＶＰＵ２　テＡ（３）、　Ａ（５）。

Ａ（７）・・・を、ＶＰＵＩとＶＰＵ３でＡ（４）、　
Ａ（６）、　Ａ（８）・・・を計算することにより、そ
れらは並列に処理される。

つぎに、このような構成の処理装置における処理の内容
について、第１３図〜第１７図を用いて説明する。

まず、Ｐ（Ｉ）を計算するためのデータの流れを第１３
図に、Ｑ（Ｉ）を計算するためのデータの流れを第１４
図に示す。ただし、ここでは得られたＰ（Ｉ）、Ｑ（Ｉ
）を−旦ベクトル・レジスタに格納している。また、ベ
クトル・レジスタに格納されたＰ（Ｉ）、Ｑ（Ｉ）を使
ってＡ（Ｉ）を計算するためのデータの流れを第１５図
に示す。第１５図に示した処理は、実施例１に示したも
のと同じである。

次に、これらのＰ（Ｉ）の計算、Ｑ（Ｉ）の計算、そし
てＡ（Ｉ）の計算を同時に行うときのデータの流れを第
１６図に示す。

ただし、この場合はＰ（Ｉ）、Ｑ（Ｉ）をベクトルルジ
スタに格納していない。

第１６図において、縦に３の演算器が並んでいるのは、
１つのパイプライン演算器の異なったタイム・スロット
を示す。第１６図に示したような経路でデータを処理す
ることによってＰ（Ｉ）、Ｑ（Ｉ）そしてＡ（Ｉ）を同
時に計算することが出来る。

次に第１６図の演算がどの様なタイミングで行われてい
るかを第１７図を用いて説明する。

第１７図は、パイプライン乗算器、パイプライン加算器
のパイプライン段数を各々４段としたときの、ＶＰＵＩ
とＶＰＵ３でＡ（４ｎ）とＡ（４ｎ＋２）を計算する時
の動作の一例である。

図中の■〜［株］は、その演算が第１６図中の■〜［株
］の演算と対応していることを示す。Ａ（４ｎ）の計算
をするために、ＶＰＵＩでまず■が始まり、次のクロッ
クで■が始まる。そして■が終了するとデイレイＤによ
って１クロック遅らされ、■が終了すると同時に■と■
が実行される。この■の演算にはＡ（４ｎ−２）が必要
であるが、これはＶＰＵ３から送られてくる。そして■
と■が同時に終わるとその結果を使って■が実行されＡ
（４ｎ）が得られる。また、ＶＰＵ３では同様にして■
そして■が実行され、■の結果を１クロック遅らせて■
を実行し、■の結果とＶＰＵＩの■の結果を用いて■が
実行され、■■の結果を用いて■が実行されＡ（４ｎ＋
２）が得られる。このようにＶＰＵＩとＶＰＵ３の処理
が繰り返されＡ（４）、Ａ（６）、Ａ（８）、Ａ（１０
）、・・・が得られ、同様＆：ＶＰＵＯとＶＰＵ２テＡ
（３）、Ａ（５）、Ａ（７）、Ａ（９）、・・・が得ら
れる。

以上のように、空いている演算器を利用することにより
、ＶＰＵＯ，ＶＰＵ２　テ（７）処理とＶＰＵＩ、ＶＰ
Ｕ３　テの処理とが同時に実行できるようになり、また
Ｐ（Ｉ）、Ｑ（Ｉ）の計算も並列に処理出来るため、処
理時間は従来の方式の半分になる。これを、第１８図に
示す。

以上の説明は、漸化式を二つの漸化式に分解して処理し
たものであるが、さらに多くの漸化式に分解して並列度
を上げることが出来る。このようにして、演算器のパイ
プライン段数が多いときや演算器の多重度が大きいとき
で、空いている演算器が多ければ、本発明の方式を用い
て並列度を上げることにより線形漸化式の処理時間を短
くすることができる。

（発明の効果）以上述べた通り、本発明によれば、複数のパイプライン
演算器と、複数のベクトル処理装置とを有するベクトル
処理装置上で線形漸化式を計算するときに、複数の線形
漸化式を並列に実行することが出来ること、及び１つの
線形漸化式を複数の線形漸化式に分解し、それらを並列
に計算することが出来るという特徴がある。

【図面の簡単な説明】

第１図は本発明１の方式で２つの２とびの漸化式を処理
する４多重のベクトル処理装置のブロック図、第２図は
本発明２の方式で１つの漸化式を２つの２とびの漸化式
に分解しそれらを並列に処理する４多重のベクトル処理
装置のブロック図、第３図は本発明が対象とする線形漸
化式の一例を示す図、第４図は従来の方式による処理の
進み方を説明するための図、第５図は従来の方式でベク
トル漸化式命令を実行する多重化されていないベクトル
処理装置のブロック図、第６図は従来の方式でベクトル
漸化式命令を実行する４多重のベクトル処理装置のブロ
ック図、第７図は２つの２とびの漸化式による処理の進
み方を説明するための図、第８図は４つの４とびの漸化
式による処理の進み方を説明するための図、第９図は漸
化式の処理を本発明１の方式で２の漸化式に分解して処
理するときと従来の方式で１つの漸化式のまま処理する
ときの処理時間の違いを説明するための図、第１０図は
本発明１の方式で２つの２とびの漸化式を処理する多重
化されていないベクトル処理装置のブロック図、第１１
図は本発明１の方式で４つの４とびの漸化式を処理する
４多重のベクトル処理装置のブロック図、第１２図は漸
化式の計算を本発明１の４つの漸化式に分解して処理す
るときと従来の方式で１つの漸化式のまま処理するとき
の処理時間の違いを説明するための図、第１３図〜第１
５図は本発明２の方式でベクトル漸化式命令を実行する
ときの処理内容を説明するための図、第１６図は、本発
明２の方式でベクトル漸化式命令を実行するときのデー
タの流れを説明するための図、第１７図は、本発明の方
式でベクトル漸化式命令を実行するときの演算の実行さ
れるタイミングを説明するための図、第１８図は漸化式
の計算を本発明２の方式で２つの漸化式に分解して処理
するときと従来の方式で１つの漸化式のまま処理すると
きの処理時間の違いを説明するための図である。３０〜３２．５１〜５３，１００〜１１１，２００〜２
１１，６１０〜６２１・・・ベクトル・レジスタ、３３
．５４．１２０〜１２３．２２０〜２２３゜６３０〜６
３３・・・パイプライン乗算器、３４．５５．１３０〜
１３３゜２３０〜２３３，６４０〜６４３・・・パイプ
ライン加算器、１０〜１３．２０〜２３．６０〜６３・
ＶＰＵ（ベクトル・プロセシング・ユニット）、２４０
〜２４３・・・デイレイ・バッファ、２５０〜２６９・
・・マルチプレクサ、３０１〜３０４・・・データバス
。

Claims

【特許請求の範囲】

（１）複数のパイプライン演算器と、複数のベクトル・
レジスタとを有するベクトル処理装置において、ｎ個の
ｎとびの線形漸化式を処理する複数漸化式ベクトル処理
命令を有し、その複数漸化式ベクトル処理命令を実行す
る手段として、パイプライン演算器、ベクトル・レジス
タ、およびそれらの間のデータ・パスを組み合わせるこ
とにより計算を行う手段と、ｎ個のｎとびの線形漸化式
を並列に計算する手段とを備えることを特徴とするベク
トル処理方式。
（２）複数のパイプライン演算器と、複数のベクトル・
レジスタとを有するベクトル処理装置において、１つの
線形漸化式を処理する単一漸化式ベクトル処理命令を有
し、その単一漸化式ベクトル処理命令を実行する手段と
して、パイプライン演算器、ベクトル・レジスタ、バッ
ファおよびそれらの間のデータ・パスを切り替えながら
計算を行う手段と、ベクトル処理装置内で１つの線形漸
化式をｎ個のｎとびの線形漸化式に分解する手段と、１
つの線形漸化式を分解して得られたｎ個のｎとびの線形
漸化式を並列に計算する手段とを備えることを特徴とす
るベクトル処理方式。