JPH02201695A - 並列処理装置開発システム - Google Patents

並列処理装置開発システム

Info

Publication number
JPH02201695A
JPH02201695A JP1021700A JP2170089A JPH02201695A JP H02201695 A JPH02201695 A JP H02201695A JP 1021700 A JP1021700 A JP 1021700A JP 2170089 A JP2170089 A JP 2170089A JP H02201695 A JPH02201695 A JP H02201695A
Authority
JP
Japan
Prior art keywords
data
trace
input
tracer
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1021700A
Other languages
English (en)
Other versions
JPH0740259B2 (ja
Inventor
Soichi Miyata
宗一 宮田
Satoshi Matsumoto
敏 松本
Kenji Shima
憲司 嶋
Takeshi Fukuhara
福原 毅
Nobufumi Komori
伸史 小守
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Sharp Corp
Original Assignee
Mitsubishi Electric Corp
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, Sharp Corp filed Critical Mitsubishi Electric Corp
Priority to JP1021700A priority Critical patent/JPH0740259B2/ja
Priority to US07/471,204 priority patent/US5165036A/en
Publication of JPH02201695A publication Critical patent/JPH02201695A/ja
Publication of JPH0740259B2 publication Critical patent/JPH0740259B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、並列処理装置開発システムに関し、特にデ
ータ駆動形(データフロー)プロセッサの開発における
ハードウェア、ソフトウェアのデバッグを容易化、迅速
化できる開発支援環境(開発支援ツール)を有する並列
処理装置開発システムに関するものである。
〔従来の技術〕
第11図は従来のデータ駆動形プロセッサの開発システ
ムの構成を示す図であり、図において、90はホストパ
ソコン、91はタイマ、92はメモリアドレスジェネレ
ータ、93はデータ駆動形プロセッサ、94はグラフィ
ックデイスプレィコントローラ、95はイメージメモリ
、96はCRT197はシステムハス、98はイメージ
メモリバスである。
この構成において、初期化、ブレークポイントの設定、
メモリ各部のダンプ表示・ロード・設定移動、入力、出
力、オブジェクトプログラムロードなどを行なう。
次に動作について説明する。
初期化、オブジェクトロード、各部メモリの設定・ロー
ドなどは、ホストパソコン90からのコマンドに基づい
て、各部へホストパソコン90からデータを書き込むこ
とにより行なわれる。逆に、ダンプ表示は各部からホス
トパソコン90ヘデータを読み出すことにより行ない、
移動はこれらの組み合わせによって行なう。演算用デー
タの投入もホストパソコン90から行なうことができる
〔発明が解決しようとする課題〕
従来の並列処理装置開発システムは以上のように構成さ
れ、ホストパソコンからのコマンドによって上記の処理
を行なうが、メモリの値を実行途中や、終了の段階で表
示できるのみで、データ駆動形プロセッサにおける処理
をトレースして、その結果によって、データ駆動形プロ
セッサを用いた応用システムの開発におけるデバッグの
能率化を図ることが可能な開発支援環境ではなく、デー
タ駆動形プロセッサの応用システムの効率的開発が行な
えないという問題点があった。
この発明は上記の問題点を解消するためになされたもの
で、データ駆動形プロセッサの応用システム開発におけ
るハードウェア及びソフトウェアのデバッグを能率よく
、高速に実施できる開発支援環境を有する並列処理装置
開発システムを得ることを目的とする。
〔課題を解決するための手段〕
この発明に係る並列処理装置開発システムは、1111
1卸コンピユータからマルチプロセッサ並列処理装置に
、該並列処理装置の実応用の処理速度に対応して高速に
処理用入力データを投入する、専用の投入パケットメモ
リを具備したデータ入力部と、上記並列処理装置の機能
部名部分のデータ転送状況を時刻情報とともに処理実行
状態でトレースする、トレースメモリを具備したトレー
ス部とを備えるとともに、該トレース部によるトレース
結果をファイル化し、データフローグラフを作成表示す
るようにしたものである。
〔作用〕
この発明においては、専用の投入パケットメモリを具備
したデータ入力部によって処理用入力データの投入を実
応用の処理速度に対応して高速に行なうとともに、トレ
ースメモリを具備したトレーサによってプロセッサ各機
能におけるデータ転送状況を実行状態のままトレースし
、さらにこのトレース結果をファイル化し、データフロ
ーグラフ化するようにしたから、並列処理装置の開発に
おけるハードウェア及びソフトウェアのデバッグを能率
よく、高速に実施できる。
C実施例〕 以下、この発明の一実施例を図について説明する。
第1図は本発明の一実施例による並列処理装置開発シス
テムの構成を示す図である。
図において、1は開発支援環境、10はデータ駆動形プ
ロセッサを含んで成るプロセシングエレメント(PE)
、20はデータ駆動形プロセッサ本体部、21は拡張プ
ログラム記憶部(ExtendedProgram S
tore: E P S ) 、2 2は拡張データ記
憶部、(Extended Data Store:E
 D S) 、2 3は外部カラー/スタック処理部(
External Color/Stack Proc
ess: E C S) 、3 1はパソコンなどの制
御コンピュータ、40はインタフェース部、60はトレ
ーサ部である。
第2図はプロセシングエレメント10の構成ヲ示す図で
、図において、11はキャシュプログラム記憶(Cac
he Program Store: C P S) 
、1 2は発火処理(Firing Control:
 F C) 、1 3は演算処理(Functiona
l Process: F P) 、1 4は合流分岐
機能(Junction & Branct+: J 
&B ) 、1 5はキューバソファ (Queuin
g Buffer: QB)である。
第3図はデータ駆動形プロセッサのパケットを示す図で
あり、図において、各フィールドは図中に示している通
りの機能を有するものである。
第4図はインターフェース部40の構成図であリ、41
はインターフェース部40とトレーサ部60を管理する
従来形(ノイマン)マイクロプロセッサユニットであり
、42はマイクロプロセッサユニット41のプログラム
とデータを記憶するROM及びRAM、43は制御コン
ピュータ31と接続するシリアルI10コントローラ、
44はプロセシングエレメント10のデータ駆動形プロ
セッサにデータパケットを投入するための出力ポート、
45は投入パケットメモリにデータ書き込みするための
書込みアドレスカウンタ、46は投入パケットメモリか
らデータ読み出しするための読出しアドレスカウンタ、
47はデータパケットの出力ポート44からの出力を終
了するときに用いられるパケット出力を停止するための
停止アドレスラッチ、48aは投入パケットメモリのア
ドレスマルチプレクサ、48bは投入パケットメモリの
データマルチプレクサ、49は出力ポートの出力ドライ
バ、50は4kX64bitsの投入パケットメモリ、
51はデータパケット投入時に投入パケットメモリ50
のアドレスを停止アドレスラッチ47の内容と比較する
アドレス比較器、52はデータパケット投入状態を示す
フリップフロップ、53はデータパケット投入開始トリ
ガ発生器、54はデータパケット投入の際のパケット間
隔を記憶する投入間隔ラッチ、55はデータパケット投
入間隔測定のための投入間隔カウンタ、56はデータパ
ケット投入の出力制御部である。
第5図はトレーサ部60の構成図であり、図において、
61はトレースポート、62はタイマ、63は入力ラッ
チ、64は同期化回路、65はデマルチプレクサ、66
はモード制御部、67はアドレスカウンタ、68は4k
x96bitのトレースメモリ、69はリード/ライト
コントローラ、70はブレークポイントラッチ、71は
比較器、72はブレークポイントアドレスランチである
次にこの実施例の動作について説明する。
データ駆動プロセッサ10はCPSII、FCl2、F
P13を基本要素とし、J&B14、QB15を合わせ
て第2図のように巡回パイプラインを構成している。E
PS21はCPSIIO外部拡張プログラムを格納する
機能部、EDS22は配列データなどを格納する機能部
、EC323はカラー管理と外部キューの機能部である
第3図のようなフォーマットを有する入力パケットはJ
&B14の合流部を経て、CPSllに入力される。C
PSIIはEPS21を持ち、FCl2を通過したパケ
ットの次位行先をトリガに、EPSから次に必要となる
プログラムデータを取り出し、CPSIIに格納する。
単項演算の場合はそのまま、二項演算の場合にはオペラ
ンド対を形成した後、FCl2から出力される。この演
算パケットはFP13に送られ命令コード(OPC: 
0peration Code)により演算され、J&
B14の分岐機能により出力されるか否かが判定され、
出力されない場合には再びCPSIIに戻って以下同様
の処理を繰り返す。
プログラムはループを除いて、基本的に若いノード番号
から実行されることを前提とし、FCl2のマツチング
メモリはハツシュされ、マツチングメモリでハツシュ衝
突した時には、世代が小さいもの、ノード番号の小さい
ものを保存し、そうでないものを巡回パイプラインある
いはEC323へ送出し、常に優先度の高いものから順
に処理を実行して、チップ内の巡回パイプラインが溢れ
ることなく処理実行がなされることを可能とするもので
ある。
また、CPSIIとFCl2の間は巡回パイプラインの
他の部分のデータバス2本分を有し、CPSIIにおけ
るC0PY処理時にもデータ転送路に隘路のない構成と
なっている。
開発支援環境1は制御コンピュータ31によってその動
作が制御される。ハードウェアは、インターフェース部
40及びトレーサ部60を含み、最小6枚構成である。
そのうち、データ駆動形プロセッサを含んで成るプロセ
シングエレメント10はデータ駆動形プロセッサ本体部
20、拡張プロセッサ記憶部EPS21、拡張データ記
憶部EDS22、外部カラー・スタック処理部EC32
3の4枚で構成されている。
開発支援環境1全体の制御は制御コンピュータ31によ
って行なわれる。制御コンピュータ31の開発支援環境
制御プログラムによってデータの投入・収集を行なう。
同制御プログラムによる処理機能を以下に示す。
■ 投入のモード プログラム・データのロード、入力データパケットのロ
ード、入力データパケット数の設定、入力データパケッ
トの投入、ダンプ用バケットの投入。
■ 収集のモード ブレークポイント比較値の設定、ブレークポイントマス
ク値の設定、トレース開始するトレーサの起動、トレー
スアドレスカウンタのプリセット、トレースメモリのフ
ァイルへの書き込み、ブレーポイント発生アドレス読み
出し。
メモリのダンプはプロセシングエレメント10のPE#
毎にEDS21.FCl2.EPS21に対してスター
トアドレス、エンドアドレスを指定してそれぞれのメモ
リから出力されるダンプバケットを、トレーサに収集す
るものである。この他に、初ル]化、所定時間の待機、
制御プログラムからの復帰などが行なえるものとなって
いる。
第4図及び第5図はそれぞれインターフェース部及びト
し−ス部の機能構成図である。制御コンピュータ:31
とデζ−タ駆動形プロセソザを含む開発支援環境1との
)〜・−夕の転送は、インターフェース部40を介して
行なわれる。
以下に両機能部の動作を詳述する。インターフェース部
40は・シリアルボー1〜43を持ち、制御コンピュー
タ31と接続される。、MPU41はシリアルボーI・
43からのコマンドにより、上記の投入モー ドと収集
モ・−ドの機能を実行する。インターフェース部40は
電源供給と同時に開発支援環境l全体の初期化を行な2
つだ後、制御コンピュータからのコマンド4待つ。プロ
グラム、データのロードは、1パケット当り第3図の様
なタグ領域とデータ32ビツトを−まとめにして、投入
バケットメモリ50の2ワードへの書き込みを行ない出
力ポート44からバケット毎に出力することにより行う
。入力データパケットの投入は高速に行うことが不可欠
であるので、投入バケットメモリ50を用いている。投
入バケットメモリ50は書き込みアドレスカウンタ45
を用いて最大4にワード分までロードし、入力データパ
ケット数に対応した情報を停止アドレスラッチ47に設
定した後、投入間隔を指定した投入コマンドにより読出
しアドレスカウンタ46が停止アドレスラッチ47 に
設定された値に一致するまで一気に投入する。
更に、インターフェース部40のアドレス・データバス
はトレーサ部60へ接続され、トレーサ部60の制御も
併せて行われる。
トレーサ部60は4kX95bitのトレースメモリ6
8を持ち、プロセシングエレメント10のいずれの端子
にも接続してそのトレースを行うことができる。トレー
サ部60はインターフェース部40のアドレス・データ
バスと接続され、インターフェース部40から直接制御
される。必要に応じて、ブレークポイントの比較値、マ
スクデータの設定を行うことが可能である。インターフ
ェース部40からトレーサ番号、トレースモードの設定
の後、トレースの開始が指示される。その後トレーサ部
60はトレースポート61から入って来るデータパケッ
トを内部クロックと同期化してランチし、時間情報とと
もにトレースメモリ68内に貯えて行く。ブレークポイ
ントランチ70にブレークポイントを設定した時には、
比較器71の出力で一致の採れたバケットを検出した後
停止するが、停止にあたっては直ちに停止、メモリ容量
の1/2のトレースの後停止、メモリ容量分のトレース
の後停止の3つのトレースモードを選択でき、トレース
履歴を有効に記憶する。
トレース終了後、ブレークポイントアドレスラッチ72
からブレークポイント発生アドレスを読み出し、トレー
スモードとアドレスカウンタ6フ値から有効データを決
定できる。
このトレースメモリ68内のトレース結果は、インター
フェース部40により、ダンプし、ファイル化すること
ができ、このファイルをリスト表示することができる。
トレース部60は複数接続可能で1インターフェース部
40当り15個のトレース部60を用いて15点を同時
計測可能である。演算パケットや結果パケットなど機能
部との接続点でトレースを行い、同時に記憶されるトレ
ース時刻情報と共にシステム全体の動作を捕捉できる。
本実施例ではトレーサ部60によって収集されたプロセ
シングエレメント10の各部のデータを表示することが
可能である。第6図はトレース結果の表示の様子の一例
を示す図であり、第6図fa)はFP13出力表示、第
6図(b)はEC323出力表示を示している。
データ駆動形プロセッサは言語処理系と併せて開発して
いるが、言語処理系のコンパイラ出力形式ファイルと、
マツパ出力であるオブジェクトコード、及び実行トレー
ス結果については、そのプログラムを図式表記・修正す
るツールを備えている。これはマルチプロセッサ実行環
境においてもプロセッサ毎のオブジェクトコードと実行
トレース結果の図的表示を可能とするものである。これ
らを比較することによって、未処理ノードや未投入デー
タパケット、未アクセスメモリなどが極めて簡単に発見
でき、マルチプロセッサのデバッグが容易である。実行
時の最大並列度、平均並列度、実行ランク数、実行時間
などが時刻情報と併せて表示でき、シミュレータ実行結
果と同様に稼動率の評価も簡単に行なえる。
この表示にあたっては、例えば特願昭6.2−5440
6「連想記憶装置及びデータ駆動形計算機」に記載され
たデータ入れ換え方式におけるノード番号付与に必要な
ランク解析結果を用いて表示し、アークについても、重
なりを減少するアルゴリズムを導入して視認性を向上さ
せている。
コンパイラ出力形式ファイルの図的表示は関数単位で行
なえるもので、複数の関数が展開されたマツパ出力(オ
ブジェクトコード)の図的表示に比較すると一般に見易
いものである。
第7図は3次多項式演算プログラムのデータフローグラ
フのマツパ出力のグラフインク表示例を示す図、第8図
はトレース結果の表示例を示す図である。
このように本実施例では、投入パケットメモリ50を備
えたインタフェース部40を介して制御コンピュータ3
1からの処理実行のためのデータパケットを高速に並列
処理装置のプロセシングエレメント10に投入するとと
もに、プロセシングエレメント10の複数の端子にトレ
ースポートが接続された、各々トレースメモリ68を備
えた複数のトレーサ部60により上記トレースポートに
入ってくるデータパケットをシステムの内部クロックと
同期して共通の時刻情報とともにトレースし、さらに該
複数のトレーサ部60のトレースメモリに貯えられたト
レース結果を収集してファイル化し、データフローグラ
フ化して表示するようにしたから、並列処理装置の開発
におけるハードウェアあるいはソフトウェアのデバッグ
を極めて容易化、迅速化できる。
なお、上記実施例では、データ駆動形プロセッサの開発
支援環境として述べてきたが、他の並列処理計算機ある
いはプロセッサにおいても同様の方式で実現が可能であ
る。
また、第1図の実施例において、プロセッサエレメント
10の接続方法については特に明記していないが、第9
図のような、シャツフルネット接続や、第10図のよう
なデイジ−チェーン接続など、その他の様々のものが可
能である。
〔発明の効果〕
以上のように、この発明によれば、専用の投入パケット
メモリを具備したデータ入力部を介して制御コンピュー
タより処理用入力データをプロセッサに実応用の処理速
度に対応して高速に投入するとともに、トレースメモリ
を具備したトレーサ部によってプロセッサの各機能部に
おけるデータ転送状況を実行状態のまま時刻情報ととも
にトレースし、さらにこのトレース結果をファイル化し
、データフローグラフ化して表示するようにしたから、
並列処理装置の開発におけるハードウェア及びソフトウ
ェアのデバッグを能率よく、高速に実施できる効果があ
る。
【図面の簡単な説明】
第1図は本発明の一実施例による並列処理装置開発シス
テムの構成を示す図、第2図はプロセシングエレメント
の構成を示す図、第3図はデータ駆動形プロセッサのバ
ケットを示す図、第4図はインターフェース部の構成図
、第5図はトレーサ部の構成図、第6図はトレース結果
の一例を示す図、第7図はデータフローグラフであるマ
ツパ出力のグラフインク表示例を示す図、第8図はトレ
ース結果の表示例を示す図、第9図はデータ駆動形プロ
セッサのシャツフルネット接続を示す図、第10図はデ
ータ駆動形プロセッサのデイジ−チェーン接続を示す図
、第11図は従来の並列処理装置開発システムの構成を
示す図である。 1は開発支援環境、10はデータ駆動形プロセッサから
成るプロセシングエレメント、20はデータ駆動形プロ
セッサ本体、40はインタフェース部、60はトレーサ
部である。 なお図中同一符号は同−又は相当部分を示す。

Claims (1)

    【特許請求の範囲】
  1. (1)単数あるいは複数のマルチプロセッサからなる並
    列処理装置と、 該並列処理装置を駆動する制御コンピュータと、該制御
    コンピュータからの処理実行のためのパケットを複数個
    記憶するためのメモリ手段と、該メモリ手段に記憶され
    たパケットを設定可能な投入間隔で上記並列処理装置の
    マルチプロセッサに入力するための計測手段とを備えた
    データパケット入力部と、 上記マルチプロセッサの複数の機能部の所望の箇所に設
    けられた入出力ポート及びデータ転送用ポートに接続さ
    れ、上記ポートのデータパケットが、共通の時刻情報と
    ともに内部クロックに同期して取り込まれ貯えられる内
    部トレースメモリを備えたトレーサ部とを具備し、かつ
    、 上記トレーサ部のトレースメモリに取り込まれた処理実
    行結果であるデータパケットを処理順に表示する機能、
    およびこれを実行プログラムと比較する機能を有するこ
    とを特徴とする並列処理装置開発システム。
JP1021700A 1989-01-31 1989-01-31 並列処理装置開発システム Expired - Lifetime JPH0740259B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1021700A JPH0740259B2 (ja) 1989-01-31 1989-01-31 並列処理装置開発システム
US07/471,204 US5165036A (en) 1989-01-31 1990-01-29 Parallel processing development system with debugging device includes facilities for schematically displaying execution state of data driven type processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1021700A JPH0740259B2 (ja) 1989-01-31 1989-01-31 並列処理装置開発システム

Publications (2)

Publication Number Publication Date
JPH02201695A true JPH02201695A (ja) 1990-08-09
JPH0740259B2 JPH0740259B2 (ja) 1995-05-01

Family

ID=12062340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1021700A Expired - Lifetime JPH0740259B2 (ja) 1989-01-31 1989-01-31 並列処理装置開発システム

Country Status (1)

Country Link
JP (1) JPH0740259B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0214333A (ja) * 1988-07-01 1990-01-18 Sharp Corp データフロープログラムのデバッグ装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0214333A (ja) * 1988-07-01 1990-01-18 Sharp Corp データフロープログラムのデバッグ装置

Also Published As

Publication number Publication date
JPH0740259B2 (ja) 1995-05-01

Similar Documents

Publication Publication Date Title
US5165036A (en) Parallel processing development system with debugging device includes facilities for schematically displaying execution state of data driven type processor
CN110214309B (zh) 可重新配置专用计算机加速器
KR100422491B1 (ko) 내장형 프로세서 복합체, 네트워크 프로세싱 시스템 및인스트럭션 실행 제어 방법
US7653716B2 (en) Determining a bisection bandwidth for a multi-node data communications network
JP2006509306A (ja) 関係アプリケーションへのデータ処理システム相互参照用セルエンジン
JPS60101644A (ja) ノイマン型コンピュータプログラムを実行するコントロールフローコンピュータ
JP3990332B2 (ja) データ処理システム
Martín Álvarez et al. Efficient data redistribution for malleable applications
JPH02201695A (ja) 並列処理装置開発システム
US10410713B1 (en) Content addressable memory modeling in emulation and prototyping
US20090043540A1 (en) Performance Testing of Message Passing Operations in a Parallel Computer
JP3696625B2 (ja) データ駆動型情報処理装置
JPH08180094A (ja) アーキテクチャ・シミュレータ
JP2006515446A (ja) 関連アプリケーションを相互参照するカルテシアンコントローラを有するデータ処理システム
Haralick et al. Proteus: a reconfigurable computational network for computer vision
Haralick et al. Proteus: a reconfigurable computational network for computer vision
KR950703177A (ko) 거대병렬 컴퓨터 장치(advanced massively-parallel computer apparatus)
JPS6049464A (ja) マルチプロセッサ計算機におけるプロセッサ間通信方式
JP2657947B2 (ja) データ処理装置
JPH05150943A (ja) コンピユータ装置
JPS63204322A (ja) 情報処理装置
JPH02260083A (ja) 並列処理装置および開発支援装置
JPS63197264A (ja) シミユレ−タ
JPH01102645A (ja) タスクレベルデータ駆動型計算機
Meiko The Meiko computing surface: an example of a massively parallel system

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090501

Year of fee payment: 14

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090501

Year of fee payment: 14