JP2000339283A - 並列演算処理装置 - Google Patents
並列演算処理装置Info
- Publication number
- JP2000339283A JP2000339283A JP11158480A JP15848099A JP2000339283A JP 2000339283 A JP2000339283 A JP 2000339283A JP 11158480 A JP11158480 A JP 11158480A JP 15848099 A JP15848099 A JP 15848099A JP 2000339283 A JP2000339283 A JP 2000339283A
- Authority
- JP
- Japan
- Prior art keywords
- processing
- input data
- arithmetic
- input
- arithmetic unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 79
- 239000000872 buffer Substances 0.000 claims abstract description 25
- 230000005540 biological transmission Effects 0.000 claims description 17
- 230000002093 peripheral effect Effects 0.000 claims description 11
- 230000000737 periodic effect Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000003111 delayed effect Effects 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 1
- 238000000034 method Methods 0.000 description 13
- 238000012937 correction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000011161 development Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000007257 malfunction Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
Landscapes
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】
【課題】 多数の演算プロセッサを効率的に高速並列演
算処理する装置 【解決手段】 この並列演算処理装置は、パイプライ
ン処理とフィードバック処理の並列処理構成を持ってい
る。パイプライン処理構成では、1演算ユニットの処理
レイテンシの数+1が演算ユニットの個数Nに一致する
基本構成を持っている。この構成により、処理量が増え
たときには、それに比例して演算ユニットの個数Nを増
やすことで、実行効率を落とすこと無く対応出来る。フ
ィードバック処理構成では、各演算ユニットの出力結果
を複数の演算ユニットの入力バッファにブロードキャス
トでき、様々な形式の演算処理に対応できる。また、不
具合の演算ユニットを予備のものに切替えて実行の継続
が出来る機能を具備している。
算処理する装置 【解決手段】 この並列演算処理装置は、パイプライ
ン処理とフィードバック処理の並列処理構成を持ってい
る。パイプライン処理構成では、1演算ユニットの処理
レイテンシの数+1が演算ユニットの個数Nに一致する
基本構成を持っている。この構成により、処理量が増え
たときには、それに比例して演算ユニットの個数Nを増
やすことで、実行効率を落とすこと無く対応出来る。フ
ィードバック処理構成では、各演算ユニットの出力結果
を複数の演算ユニットの入力バッファにブロードキャス
トでき、様々な形式の演算処理に対応できる。また、不
具合の演算ユニットを予備のものに切替えて実行の継続
が出来る機能を具備している。
Description
【0001】
【発明の属する技術分野】本発明は、並列演算処理装置
に関する。
に関する。
【0002】
【従来の技術】従来の高速並列演算処理装置は、スーパ
・コンピュータ、パソコン・ネットワークおよび専用機
がそれに該当する。 スーパ・コンピュータは、価格、
使用環境、可鍛性に問題がある。パソコン・ネットワー
クは、スペース、使い勝手、可鍛性にやはり使い難さが
ある。一方、専用機は、特定用途に限定しているため、
多目的使用に対応出来ないという状況にある。
・コンピュータ、パソコン・ネットワークおよび専用機
がそれに該当する。 スーパ・コンピュータは、価格、
使用環境、可鍛性に問題がある。パソコン・ネットワー
クは、スペース、使い勝手、可鍛性にやはり使い難さが
ある。一方、専用機は、特定用途に限定しているため、
多目的使用に対応出来ないという状況にある。
【0003】
【発明が解決しようとする課題】マイクロ・プロセッサ
の進化、高速化は、ハードウエアであるランダム・ロジ
ックの置き換えから始まった。 ソフトウエア・ロジッ
クおよびアルゴリズム化することによって、ハードウエ
アの画一化、汎用化が進み、ソフトウエアで記述される
機能はより高度化、多機能化することが出来るようにな
った。
の進化、高速化は、ハードウエアであるランダム・ロジ
ックの置き換えから始まった。 ソフトウエア・ロジッ
クおよびアルゴリズム化することによって、ハードウエ
アの画一化、汎用化が進み、ソフトウエアで記述される
機能はより高度化、多機能化することが出来るようにな
った。
【0004】また物理的な対応では、プロセッサの高速
性は、オンライン・リアルタイム化を促進し、ハードウ
エアの介在の余地をより小さくする。 演算速度のさら
なる超高速化はハードウエアのほとんど介在しないfu
ll programmableの世界となる。
性は、オンライン・リアルタイム化を促進し、ハードウ
エアの介在の余地をより小さくする。 演算速度のさら
なる超高速化はハードウエアのほとんど介在しないfu
ll programmableの世界となる。
【0005】即ち、演算処理の超高速化は、full
programmableによる仮想環境(simul
atedenvironment)を作り出し、現実の
装置、物理現象、動作、制御をオンライン・リアルタイ
ムで高速演算処理装置の上で実験出来るようになる。本
発明は多数の高性能演算プロセッサを並列処理すること
によって、高速演算処理装置を構成するものである。
programmableによる仮想環境(simul
atedenvironment)を作り出し、現実の
装置、物理現象、動作、制御をオンライン・リアルタイ
ムで高速演算処理装置の上で実験出来るようになる。本
発明は多数の高性能演算プロセッサを並列処理すること
によって、高速演算処理装置を構成するものである。
【0006】この方式では以下に示す項目が課題とな
る。 効率が高く簡易な並列処理の構成 データ入力方式により異なった並列処理の構成がとれ
る 入出力の高速化に必要なバス・ネックの解消 シミュレーションを含むソフトウエア開発の容易化 周期的な演算実行では、演算処理がばらついても、周
期性を保証する。 演算ユニットの故障等の不具合に対応出来る。
る。 効率が高く簡易な並列処理の構成 データ入力方式により異なった並列処理の構成がとれ
る 入出力の高速化に必要なバス・ネックの解消 シミュレーションを含むソフトウエア開発の容易化 周期的な演算実行では、演算処理がばらついても、周
期性を保証する。 演算ユニットの故障等の不具合に対応出来る。
【0007】
【課題を解決するための手段】本装置は、full p
rogrammableによる仮想環境(simula
ted environment)を作り出し、オンラ
イン・リアルタイムでの現実の装置、物理現象、動作、
制御をシミュレーションし、ソフトウエアのアルゴリズ
ムの開発、検討、評価を行うものである。 また、開発
完成後は、機器に組込み使用も可能となる。
rogrammableによる仮想環境(simula
ted environment)を作り出し、オンラ
イン・リアルタイムでの現実の装置、物理現象、動作、
制御をシミュレーションし、ソフトウエアのアルゴリズ
ムの開発、検討、評価を行うものである。 また、開発
完成後は、機器に組込み使用も可能となる。
【0008】本発明では、効率が高く簡易な並列処理の
構成として、多数の演算ユニットを入力データとシステ
ム・バスでサンドイッチ状にバス結合し、入出力バスを
分離したことによって、バス・ネックを解消している。
構成として、多数の演算ユニットを入力データとシステ
ム・バスでサンドイッチ状にバス結合し、入出力バスを
分離したことによって、バス・ネックを解消している。
【0009】また、演算の種類によって、これらの演算
ユニットへのデータの供給の方法を変えて対応出来る。
本発明の並列演算処理装置では、次の2種類の演算処理
構成に対応している。 パイプライン処理構成 フィードバック処理構成
ユニットへのデータの供給の方法を変えて対応出来る。
本発明の並列演算処理装置では、次の2種類の演算処理
構成に対応している。 パイプライン処理構成 フィードバック処理構成
【0010】(1)パイプライン処理構成 パイプライン処理による並列処理を行うときには、入力
データの入力周期を単位として、1演算ユニットの処理
レイテンシの数+1が演算ユニットの個数Nに一致する
基本構成にする。
データの入力周期を単位として、1演算ユニットの処理
レイテンシの数+1が演算ユニットの個数Nに一致する
基本構成にする。
【0011】入力データは入力周期毎に順次異なった演
算ユニットに入力処理され、最初の演算ユニットの処理
が終った後は、各演算ユニットからの出力結果が入力周
期に同期して連続的に得られ、演算ユニット毎のパイプ
・ラインを構成している。この構成により、処理量が増
えたときには、それに比例して演算ユニットの個数Nを
増やすことで、実行効率を落とすこと無く対応出来る。
算ユニットに入力処理され、最初の演算ユニットの処理
が終った後は、各演算ユニットからの出力結果が入力周
期に同期して連続的に得られ、演算ユニット毎のパイプ
・ラインを構成している。この構成により、処理量が増
えたときには、それに比例して演算ユニットの個数Nを
増やすことで、実行効率を落とすこと無く対応出来る。
【0012】また、ソフトウエアの開発は、処理が1個
の演算ユニットの中に閉じて独立していることが条件と
なるが、1個の演算ユニットの開発だけで済み、このた
め、処理の記述も容易である。1個の演算ユニットのソ
フトウエア開発とシミュレーションができれば、他の演
算ユニットも同一のソフトウエアによって実行されるの
で、ソフトウエアの開発はきわめて容易となり、ソフト
ウエア開発費の大幅な節減が可能となる。
の演算ユニットの中に閉じて独立していることが条件と
なるが、1個の演算ユニットの開発だけで済み、このた
め、処理の記述も容易である。1個の演算ユニットのソ
フトウエア開発とシミュレーションができれば、他の演
算ユニットも同一のソフトウエアによって実行されるの
で、ソフトウエアの開発はきわめて容易となり、ソフト
ウエア開発費の大幅な節減が可能となる。
【0013】また、各演算ユニットが、入力データバス
あるいはシステム・バスからの入力データを周期的に入
力して実行する場合、演算処理の遅延あるいは演算ユニ
ットの故障時にはCPUによってそれを検出し、その不
具合演算ユニットを予備の演算ユニット(N+1、N+
2…)に切替え、周期的実行を保証するように工夫され
ているため、装置の信頼性が大幅に向上する。
あるいはシステム・バスからの入力データを周期的に入
力して実行する場合、演算処理の遅延あるいは演算ユニ
ットの故障時にはCPUによってそれを検出し、その不
具合演算ユニットを予備の演算ユニット(N+1、N+
2…)に切替え、周期的実行を保証するように工夫され
ているため、装置の信頼性が大幅に向上する。
【0014】(2)フィードバック処理構成 この処理は外部入力データバスを使わず、バック・ドラ
イバから各演算ユニットにデータを供給する方式であ
る。通常、各演算ユニットの出力データ、およびCPU
のバッファメモリの内容をCPU経由でバック・ドライ
バから演算ユニットの入力にフィードバックする。ニュ
ーラル・ネットワークの学習や適応制御のシステム・パ
ラメータの計算に都合のよい構成となっている。
イバから各演算ユニットにデータを供給する方式であ
る。通常、各演算ユニットの出力データ、およびCPU
のバッファメモリの内容をCPU経由でバック・ドライ
バから演算ユニットの入力にフィードバックする。ニュ
ーラル・ネットワークの学習や適応制御のシステム・パ
ラメータの計算に都合のよい構成となっている。
【0015】各演算ユニットに別々にバック・データを
供給することができ、また複数の演算ユニットに同時に
ブロードキャストすることもできる。同時ブロードキャ
ストにより、演算ユニットに高速なデータ供給が可能と
なる。本発明によれば、同時ブロードキャストは、演算
ユニットの入力バッファのアドレスを同一に設定するこ
とにより、容易に実現することができる。
供給することができ、また複数の演算ユニットに同時に
ブロードキャストすることもできる。同時ブロードキャ
ストにより、演算ユニットに高速なデータ供給が可能と
なる。本発明によれば、同時ブロードキャストは、演算
ユニットの入力バッファのアドレスを同一に設定するこ
とにより、容易に実現することができる。
【0016】高速伝送ポート(9)は、複数ポートを、
具備し、様々な周辺機器および装置に接続出来、演算ユ
ニットにデータを送信したり、演算結果を受信すること
が出来る。さらに、高速伝送ポートに接続された端末
(11)により、並列演算処理装置のプログラム開発、
実行結果の記憶、表示等を行うことが出来るようになっ
ている。
具備し、様々な周辺機器および装置に接続出来、演算ユ
ニットにデータを送信したり、演算結果を受信すること
が出来る。さらに、高速伝送ポートに接続された端末
(11)により、並列演算処理装置のプログラム開発、
実行結果の記憶、表示等を行うことが出来るようになっ
ている。
【0017】
【発明の実施の形態】発明の実施の形態を実施例に基づ
き図を参照して説明する。図1には、N個の演算ユニッ
トを持つ並列演算処理装置(1)の構成例を示す。
き図を参照して説明する。図1には、N個の演算ユニッ
トを持つ並列演算処理装置(1)の構成例を示す。
【0018】(1)パイプライン処理の場合 入力データバス(3)には、バック・ドライバ(12)
および、外部入力データ・バッファ(13)から外部入
力データが入力される。A/D変換器等の外部入力デー
タ(2)は、入力データバス(3)を経由して、定めら
れたデータの周期毎に各演算ユニットに配布される。演
算ユニットには、入力データバス(3)あるいは演算ユ
ニット内の2ポートRAMを経由して入力データを供給
することができる。
および、外部入力データ・バッファ(13)から外部入
力データが入力される。A/D変換器等の外部入力デー
タ(2)は、入力データバス(3)を経由して、定めら
れたデータの周期毎に各演算ユニットに配布される。演
算ユニットには、入力データバス(3)あるいは演算ユ
ニット内の2ポートRAMを経由して入力データを供給
することができる。
【0019】(2)フィードバック処理の場合 入力データバス(3)には、外部入力データ・バッファ
(13)ではなく、バック・ドライバ(12)を経由し
てCPU(6)からのデータが与えられる。供給される
データは、各演算ユニットの出力結果の場合もあれば、
CPUに付属するバッファ・メモリ(7)からの場合も
ある。
(13)ではなく、バック・ドライバ(12)を経由し
てCPU(6)からのデータが与えられる。供給される
データは、各演算ユニットの出力結果の場合もあれば、
CPUに付属するバッファ・メモリ(7)からの場合も
ある。
【0020】入力データバス(3)には、アドレス、デ
ータ、制御信号を含んでいる。入力データバスに接続さ
れた各演算ユニットは、あらかじめ設定された自己のア
ドレスに一致したアドレス時の入力データを入力バッフ
ァ(23)に取り込み、演算処理を行う。
ータ、制御信号を含んでいる。入力データバスに接続さ
れた各演算ユニットは、あらかじめ設定された自己のア
ドレスに一致したアドレス時の入力データを入力バッフ
ァ(23)に取り込み、演算処理を行う。
【0021】演算ユニットからの出力結果は、システム
・バス(5)を通してCPU(6)に回収される。
システム・バスにはVMEバス,Compact PC
Iバス等の標準バスを用いる事も出来る。 CPUで
は、後処理、データのバッファリング、端末(11)と
のデータ転送、周辺機器(10)とのデータアクセス等
の処理が行われる。
・バス(5)を通してCPU(6)に回収される。
システム・バスにはVMEバス,Compact PC
Iバス等の標準バスを用いる事も出来る。 CPUで
は、後処理、データのバッファリング、端末(11)と
のデータ転送、周辺機器(10)とのデータアクセス等
の処理が行われる。
【0022】CPUと端末および周辺機器との高速伝送
は、高速イーサネットを使用することもできるが、本例
では、IEEE1394シリアル・ポートの使用例を示
す。IEEE1394は現状では400Mbpsの伝送
速度があり、かつ、アイソクロノス転送と呼ばれる同期
伝送の機能もあるので、本例のような周辺機器を含めた
高速伝送には適している。IEEE1394のアクセス
のために、IEEE1394ポート3個(9)とIEE
E1394コントローラ(8)が設けられている。
は、高速イーサネットを使用することもできるが、本例
では、IEEE1394シリアル・ポートの使用例を示
す。IEEE1394は現状では400Mbpsの伝送
速度があり、かつ、アイソクロノス転送と呼ばれる同期
伝送の機能もあるので、本例のような周辺機器を含めた
高速伝送には適している。IEEE1394のアクセス
のために、IEEE1394ポート3個(9)とIEE
E1394コントローラ(8)が設けられている。
【0023】端末(11)には通常、パソコンを用い
る。端末は、並列演算処理装置のプログラム開発、プロ
グラムの演算ユニットへのダウンロード、データ転送、
表示、監視、外部ネットワークとの通信等の役割を持
つ。
る。端末は、並列演算処理装置のプログラム開発、プロ
グラムの演算ユニットへのダウンロード、データ転送、
表示、監視、外部ネットワークとの通信等の役割を持
つ。
【0024】端末をLAN,WAN等の通信回線に接続
すると、並列演算処理装置のネットワーク多重使用も可
能となる。
すると、並列演算処理装置のネットワーク多重使用も可
能となる。
【0025】周辺機器接続にIEEE1394を用いる
と、IEEE1394直結のディジタル・カメラ等の周
辺機器が使用出来、アイソクロノス同期伝送を用いた将
来のAV高速周辺機器等の接続が期待出来る。
と、IEEE1394直結のディジタル・カメラ等の周
辺機器が使用出来、アイソクロノス同期伝送を用いた将
来のAV高速周辺機器等の接続が期待出来る。
【0026】図2には演算ユニットの内部構成例を示
す。演算ユニット(21)は、演算処理を行う基本構成
ユニットであり、アドレス・デコーダ(22)、入力バ
ファ(23)、演算プロセッサ(24)、メモリ(2
5)、2ポートRAM(26)およびこれらのデバイス
を接続する内部バス(27)からなる。
す。演算ユニット(21)は、演算処理を行う基本構成
ユニットであり、アドレス・デコーダ(22)、入力バ
ファ(23)、演算プロセッサ(24)、メモリ(2
5)、2ポートRAM(26)およびこれらのデバイス
を接続する内部バス(27)からなる。
【0027】メモリには、SRAM,SDRAM,フラ
ッシュ・メモリ等が用いられる。演算プロセッサに接続
されるCPU側の入出力インタフェースには、2ポート
RAM(26)が用いられる。 2ポートRAMはC
PUに接続され、演算プロセッサとの間で、プログラム
のダウン・ロード、演算結果の出力、割込み等の処理を
行う。 さらに、2ポートRAMを通して、プログラム
のダウン・ロードが出来るため、ソフトウエアの開発の
他に実行上、様々なコントロールが可能となる。
ッシュ・メモリ等が用いられる。演算プロセッサに接続
されるCPU側の入出力インタフェースには、2ポート
RAM(26)が用いられる。 2ポートRAMはC
PUに接続され、演算プロセッサとの間で、プログラム
のダウン・ロード、演算結果の出力、割込み等の処理を
行う。 さらに、2ポートRAMを通して、プログラム
のダウン・ロードが出来るため、ソフトウエアの開発の
他に実行上、様々なコントロールが可能となる。
【0028】アドレス・デコーダ(22)の例を図3に
示す。入力バファとして、本例では、多数のFIFOを
機能的に使用する例を示す。FIFO群の番号付けおよ
びエネーブル/ディスエーブルは、CPUがシステム・
バスを経由するか、あるいは演算プロセッサ(24)が
内部バス(27)を経由して、I/Oラッチ(30)に
そのデータを出力することによって行われる。入力デー
タバス(3)のアドレスとこのI/Oラッチの値が一致
した番号のFIFOが選択され、その時の入力データバ
スのデータがそこに入力される。
示す。入力バファとして、本例では、多数のFIFOを
機能的に使用する例を示す。FIFO群の番号付けおよ
びエネーブル/ディスエーブルは、CPUがシステム・
バスを経由するか、あるいは演算プロセッサ(24)が
内部バス(27)を経由して、I/Oラッチ(30)に
そのデータを出力することによって行われる。入力デー
タバス(3)のアドレスとこのI/Oラッチの値が一致
した番号のFIFOが選択され、その時の入力データバ
スのデータがそこに入力される。
【0029】本発明の特徴であるこのメカニズムによっ
て、複数の演算ユニットへの同時ブロードキャストが実
行でき、また演算ユニットの処理タイムオーバや故障発
生時に予備の演算ユニットに切替えて、予定された運転
を継続実行出来るようになる。割込みは、FIFOのデ
ータ入力完了等の指示を演算プロセッサに与えるのに用
いられる。
て、複数の演算ユニットへの同時ブロードキャストが実
行でき、また演算ユニットの処理タイムオーバや故障発
生時に予備の演算ユニットに切替えて、予定された運転
を継続実行出来るようになる。割込みは、FIFOのデ
ータ入力完了等の指示を演算プロセッサに与えるのに用
いられる。
【0030】図4にはバック・ドライバ(12)の構成
例を示す。バス・インタフェース(41)はシステム・
バスに接続される。バス・インタフェースからアドレス
・ドライバ(42)、データ・ドライバ(43)そして
制御回路(44)が生成され、それぞれ入力データバス
のアドレス、データ、制御信号に接続される。
例を示す。バス・インタフェース(41)はシステム・
バスに接続される。バス・インタフェースからアドレス
・ドライバ(42)、データ・ドライバ(43)そして
制御回路(44)が生成され、それぞれ入力データバス
のアドレス、データ、制御信号に接続される。
【0031】また、制御回路からは外部入力データバス
の選択信号/EXTENが出力され、内部回路と外部入
力データ・バッファに接続されている。 この信号によ
り、入力データバス(3)に接続されるバスのソース
が、外部入力データ・バッファかバック・ドライバかの
選択が行われる。
の選択信号/EXTENが出力され、内部回路と外部入
力データ・バッファに接続されている。 この信号によ
り、入力データバス(3)に接続されるバスのソース
が、外部入力データ・バッファかバック・ドライバかの
選択が行われる。
【0032】図5には、パイプライン処理構成における
周期的なラン・タイム・データの並列演算処理の例を示
す。1個の演算ユニットは、1周期の入力データを入力
し、演算処理に3周期(レイテンシ3)かかっている。
演算処理は演算ユニット内に閉じられて独立しているも
のとする。請求項6に従い、この時の演算ユニットの基
本個数Nは4となる。3(レイテンシの数)+1=4デ
ータ入力は1周期づつずらして演算ユニット1から4に
順次行われ、レイテンシ3の後、演算結果が入力データ
に同期して周期毎に得られる。演算ユニット5は予備と
して、不測の事態に備えて設けられている。
周期的なラン・タイム・データの並列演算処理の例を示
す。1個の演算ユニットは、1周期の入力データを入力
し、演算処理に3周期(レイテンシ3)かかっている。
演算処理は演算ユニット内に閉じられて独立しているも
のとする。請求項6に従い、この時の演算ユニットの基
本個数Nは4となる。3(レイテンシの数)+1=4デ
ータ入力は1周期づつずらして演算ユニット1から4に
順次行われ、レイテンシ3の後、演算結果が入力データ
に同期して周期毎に得られる。演算ユニット5は予備と
して、不測の事態に備えて設けられている。
【0033】
【発明の効果】本発明によれば、演算ユニットという同
じハードウエアを多数並べる並列演算処理装置のため、
ハードウエアの画一化、汎用化が進み、装置の製造コス
トを大幅に下げることができる。また、パイプライン処
理とフィードバック処理という並列処理構成により、様
々な演算処理の応用にフレキシブルに対応することがで
きる。
じハードウエアを多数並べる並列演算処理装置のため、
ハードウエアの画一化、汎用化が進み、装置の製造コス
トを大幅に下げることができる。また、パイプライン処
理とフィードバック処理という並列処理構成により、様
々な演算処理の応用にフレキシブルに対応することがで
きる。
【0034】先ず、パイプライン処理では、ソフトウエ
アの開発は1演算ユニット分のみでよく、しかも、他の
演算ユニットに関係しないので、プログラムの記述も簡
単となる。 これによって、シミュレーションを含むソ
フトウエアの開発が容易となり、ソフトウエアの開発期
間、コストを大幅に低下出来る。
アの開発は1演算ユニット分のみでよく、しかも、他の
演算ユニットに関係しないので、プログラムの記述も簡
単となる。 これによって、シミュレーションを含むソ
フトウエアの開発が容易となり、ソフトウエアの開発期
間、コストを大幅に低下出来る。
【0035】また、フィードバック処理構成では、演算
ユニットの出力結果やCPUのバッファ・メモリの情報
を各演算ユニットの入力バッファに同時にブロードキャ
ストすることができ、高速な入力処理とともに、様々な
形式の演算処理に対応することができる。
ユニットの出力結果やCPUのバッファ・メモリの情報
を各演算ユニットの入力バッファに同時にブロードキャ
ストすることができ、高速な入力処理とともに、様々な
形式の演算処理に対応することができる。
【0036】さらに、演算処理量が増えても、演算ユニ
ットの数:Nを増やすことによって、実行効率を落とす
ことなく容易に能力的な対応が出来る。
ットの数:Nを増やすことによって、実行効率を落とす
ことなく容易に能力的な対応が出来る。
【0037】CPUによる演算ユニットの不具合検出と
入力データバファのアドレス設定により、演算処理の遅
延、演算ユニットの故障時には、予備の演算ユニットに
切替えて、継続実行が出来ることで、装置の高信頼性運
転が出来る。
入力データバファのアドレス設定により、演算処理の遅
延、演算ユニットの故障時には、予備の演算ユニットに
切替えて、継続実行が出来ることで、装置の高信頼性運
転が出来る。
【0038】また、本発明では、次の点で高速性に工夫
をこらしている。A/D変換器等の外部入力データ用の
入力データバスとCPUに接続されるシステム・バスを
分離してバス・ネックの解消し、スループットの向上を
図っている。 周辺機器と端末に高速伝送ポートを設
け、並列演算処理装置との高速データ伝送ができる。
をこらしている。A/D変換器等の外部入力データ用の
入力データバスとCPUに接続されるシステム・バスを
分離してバス・ネックの解消し、スループットの向上を
図っている。 周辺機器と端末に高速伝送ポートを設
け、並列演算処理装置との高速データ伝送ができる。
【0039】このように、本発明によれば、経済的な並
列演算処理装置により、fullprogrammab
leな仮想環境(simulated environ
ment)を作り出し、現実の装置、現象の動作、制御
をオンライン・リアルタイムで並列演算処理装置上で、
種々の条件をかえて簡単に実験出来るようになる。その
産業界におよぼす経済的なメリットは、計り知れない大
きなものがある。
列演算処理装置により、fullprogrammab
leな仮想環境(simulated environ
ment)を作り出し、現実の装置、現象の動作、制御
をオンライン・リアルタイムで並列演算処理装置上で、
種々の条件をかえて簡単に実験出来るようになる。その
産業界におよぼす経済的なメリットは、計り知れない大
きなものがある。
【図1】並列演算処理装置の構成を示す図である。
【図2】演算ユニットの内部構成を示す図である。
【図3】アドレス・デコーダの内部構成を示す図であ
る。
る。
【図4】バック・ドライバの内部構成を示す図である。
【図5】周期的なラン・タイム・データの並列演算処理
の例を示す図である。
の例を示す図である。
1 並列演算処理装置 2 A/D変換器等の外部入力データ 3 入力データバス 4 演算ユニット 5 システム・バス 6 CPU 7 バファ・メモリ 8 高速伝送コントローラ 9 高速伝送ポート 10 周辺機器 11 端末 12 バック・ドライバ 13 外部入力データ・バッファ
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成11年5月10日(1999.5.1
0)
0)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0039
【補正方法】変更
【補正内容】
【0039】
【発明の効果】このように、本発明によれば、経済的な
並列演算処理装置により、fullprogramma
bleな仮想環境(simulated enviro
nment)を作り出し、現実の装置、現象の動作、制
御をオンライン・リアルタイムで並列演算処理装置上
で、種々の条件をかえて簡単に実験出来るようになる。
その産業界におよぼす経済的なメリットは、計り知れな
い大きなものがある。
並列演算処理装置により、fullprogramma
bleな仮想環境(simulated enviro
nment)を作り出し、現実の装置、現象の動作、制
御をオンライン・リアルタイムで並列演算処理装置上
で、種々の条件をかえて簡単に実験出来るようになる。
その産業界におよぼす経済的なメリットは、計り知れな
い大きなものがある。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】追加
【補正内容】
【図面の簡単な説明】
【図1】並列演算処理装置の構成を示す図である。
【図2】演算ユニットの内部構成を示す図である。
【図3】アドレス・デコーダの内部構成を示す図であ
る。
る。
【図4】バック・ドライバの内部構成を示す図である。
【図5】周期的なラン・タイム・データの並列演算処理
の例を示す図である。
の例を示す図である。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】符号の説明
【補正方法】追加
【補正内容】
【符号の説明】 1 並列演算処理装置 2 A/D変換器等の外部入力データ 3 入力データバス 4 演算ユニット 5 システム・バス 6 CPU 7 バファ・メモリ 8 高速伝送コントローラ 9 高速伝送ポート 10 周辺機器 11 端末 12 バック・ドライバ 13 外部入力データ・バッファ 21 演算ユニット 22 アドレス・デコーダ 23 入力バッファ 24 演算プロセッサ 25 メモリ 26 2ポートRAM 27 内部バス 30 I/Oラッチ 31 コンパレータ 41 バス・インタフェース 42 アドレス・ドライバ 43 データ・ドライバ 44 制御回路
Claims (8)
- 【請求項1】並列演算処理装置(1)は、A/D変換器
等の外部入力データ(2)を入力する外部入力データ・
バッファ(13),入力データバス(3)、複数の演算
ユニット(4)、CPU(6)、演算ユニットとCPU
を接続するシステム・バス(5)、バッファ・メモリ
(7)、高速伝送コントローラ(8),複数の高速伝送
ポート(9)それにバック・ドライバ(12)で構成さ
れることを特徴とする装置であること。 - 【請求項2】入力データバス(3)は、A/D変換器等
の外部入力データバス(2)に接続される外部入力デー
タ・バッファ(13)あるいはバック・ドライバ(1
2)のいづれか一方によって駆動され、演算ユニットの
番号を指定するアドレス・バスとデータ・バスを持って
おり、アドレス・バスの指定した演算ユニットの入力バ
ファ(23)に入力データを配布することができる機能
を備えた装置であること。 - 【請求項3】高速伝送ポート(9)は、複数ポートを持
ち、様々な周辺機器および装置に接続出来、演算ユニッ
トにデータを送信したり、演算結果を受信することが出
来る手段を備えた装置であること。 - 【請求項4】高速伝送ポートに接続された端末(11)
により、並列演算処理装置(1)のプログラム開発、実
行結果の記憶、表示、外部ネットワークとの通信等を行
うことが出来る機能を具備する装置であること。 - 【請求項5】演算ユニット(21)の内部には、演算プ
ロセッサ(24)とメモリ(25)の他に、入力データ
バスを通して入力する入力バッファ(23)と、CPU
とのデータ転送を行うための共有メモーリ(26)を備
え、CPUとの間でプログラムのダウンロード、演算結
果およびステイタス・ワードの出力そして割込み等の処
理を行う手段を備えた装置であること。 - 【請求項6】入力データの入力周期を単位として、一つ
の演算ユニットの処理レイテンシの数+1が演算ユニッ
トの個数Nに一致する基本構成を持ち、入力データは入
力周期毎に順次異なった演算ユニットに入力処理され、
最初の演算ユニットの処理が終った後は、各演算ユニッ
トからの出力結果が入力周期に同期して連続的に得られ
る並列演算処理方式を備えることを特徴とした装置であ
ること。 - 【請求項7】各演算ユニットは、入力データバスあるい
はシステム・バスからの入力データを周期的に入力し、
所定のレイテンシの後、正しい演算処理結果の時はシス
テム・バスにその結果を出力し、演算処理の遅延あるい
は演算ユニットの故障時にはCPUによってそれを検出
し、その不具合演算ユニットを予備の演算ユニット(N
+1、N+2、…)に切替え、周期的実行を保証する手
段を備えた装置であること。 - 【請求項8】各演算ユニットからの出力データをシステ
ム・バス(5)を経由してCPU(6)に取込み、その
データをバック・ドライバ(12)を経由して、選択さ
れた演算ユニットの入力バッファに入力できる手段、あ
るいは複数の演算ユニットの入力バッファに同時にブロ
ードキャストすることができる手段を備えることを特徴
とした装置であること。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11158480A JP2000339283A (ja) | 1999-03-23 | 1999-04-27 | 並列演算処理装置 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11845799 | 1999-03-23 | ||
| JP11-118457 | 1999-03-23 | ||
| JP11158480A JP2000339283A (ja) | 1999-03-23 | 1999-04-27 | 並列演算処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000339283A true JP2000339283A (ja) | 2000-12-08 |
Family
ID=26456393
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11158480A Pending JP2000339283A (ja) | 1999-03-23 | 1999-04-27 | 並列演算処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000339283A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101226560B (zh) * | 2007-11-20 | 2011-11-30 | 北京中星微电子有限公司 | 一种实现dsp功能验证的算法设计系统及方法 |
-
1999
- 1999-04-27 JP JP11158480A patent/JP2000339283A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101226560B (zh) * | 2007-11-20 | 2011-11-30 | 北京中星微电子有限公司 | 一种实现dsp功能验证的算法设计系统及方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2770603B2 (ja) | 並列計算機 | |
| CN109997113A (zh) | 数据处理 | |
| JP2012080379A (ja) | 半導体データ処理装置及びデータ処理システム | |
| US5734927A (en) | System having registers for receiving data, registers for transmitting data, both at a different clock rate, and control circuitry for shifting the different clock rates | |
| JPH0552989B2 (ja) | ||
| JP2008282314A (ja) | シミュレータ、シミュレーション方法 | |
| US11467836B2 (en) | Executing cross-core copy instructions in an accelerator to temporarily store an operand that cannot be accommodated by on-chip memory of a primary core into a secondary core | |
| JP2000339283A (ja) | 並列演算処理装置 | |
| JPH11272627A (ja) | パイプライン型マルチプロセッサシステム | |
| US6418540B1 (en) | State transfer with throw-away thread | |
| CN1318958C (zh) | 包含多个处理电路和存储电路的数据处理装置 | |
| JP5803721B2 (ja) | データ処理装置 | |
| JP2594562B2 (ja) | プログラマブル・コントローラ | |
| JP7771697B2 (ja) | プロセッサ、情報処理装置及び情報処理方法 | |
| US20080288952A1 (en) | Processing apparatus and device control unit | |
| JP2016110220A (ja) | プログラマブル・ロジック・コントローラおよびその制御方法 | |
| KR970008189B1 (ko) | 메모리 공간 제어방법 및 메모리 장치 | |
| JP3887989B2 (ja) | プログラマブルコントローラ、及びその入出力制御方法 | |
| JPS6315628B2 (ja) | ||
| JP2001014266A (ja) | Dma転送回路およびdma転送方法 | |
| JP2002073351A (ja) | データ処理ユニット、データ処理装置および制御方法 | |
| JP2000241527A (ja) | レーダ信号処理装置 | |
| JPS6352240A (ja) | デ−タ処理装置 | |
| JP2000242317A (ja) | プログラマブルコントローラ | |
| JPS63204322A (ja) | 情報処理装置 |