JPH0773162A - Performance monitor of information processor - Google Patents

Performance monitor of information processor

Info

Publication number
JPH0773162A
JPH0773162A JP5218480A JP21848093A JPH0773162A JP H0773162 A JPH0773162 A JP H0773162A JP 5218480 A JP5218480 A JP 5218480A JP 21848093 A JP21848093 A JP 21848093A JP H0773162 A JPH0773162 A JP H0773162A
Authority
JP
Japan
Prior art keywords
memory
cpu
sent
request
memory units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5218480A
Other languages
Japanese (ja)
Inventor
Koji Kinoshita
耕二 木下
Hiroyuki Kasai
洋行 河西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Computertechno Ltd
Original Assignee
NEC Corp
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Computertechno Ltd filed Critical NEC Corp
Priority to JP5218480A priority Critical patent/JPH0773162A/en
Publication of JPH0773162A publication Critical patent/JPH0773162A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Complex Calculations (AREA)

Abstract

PURPOSE:To facilitate the tuning up of a program by quantitatively grasping a memory access load which owes much to the intuition of a program preparing person in a super computer, etc. CONSTITUTION:Memory units 3-0 to 3-3 can simultaneously be accessed through a memory control part 2 from CPU 1. The memory access control part 2 decodes memory access requirement from CPU 1 so as to judge to which one of the memory units 3-0 to 3-3 a request to be sent in accordance with the kind and the address of the request to be accessed. Counters 6-0 to 6-3 counting access to the memory units 3-0 to 3-3 and a counter 5 counting a signal obtained by ORing request signals to the memory units 3-0 to 3-3 are provided and all these counters can be referred to from CPU 1.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は情報処理装置の性能評
価,性能測定のための性能モニタに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a performance monitor for performance evaluation and performance measurement of an information processing device.

【0002】[0002]

【従来の技術】近年、配列計算を主たる処理対象とす
る、いわゆるベクトル計算機が多く使われ始めている。
ベクトル計算機を有効に使いこなすためには、その特徴
を熟知し、場合によってはベクトル計算機が最大性能を
発揮できるようにプログラムを書き換える必要がある。
その熟知すべき特徴の一つに、プログラムのメモリに対
する負荷が挙げられる。
2. Description of the Related Art In recent years, so-called vector computers, which mainly deal with array calculations, have begun to be used.
In order to effectively use the vector computer, it is necessary to be familiar with its characteristics and rewrite the program so that the vector computer can maximize its performance.
One of the characteristics to be familiar with is the load on the program memory.

【0003】特に、最近の傾向として高速化のために、
メモリを共有したマルチプロセッサ構成をとることが多
いが、このようなメモリ共有型のマルチプロセッサ構成
のシステムでは、メモリ競合により深刻な処理性能定価
を来すことがあることが知られている。この性能定価を
回避するには、十分なメモリスループットを確保するこ
とも一つの方法ではあるが、そのためには開発,製造共
に莫大な費用がかかり、価格性能比で必ずしも優位に立
てるとは限らない。
Particularly, as a recent tendency, for speeding up,
In many cases, a multiprocessor configuration in which a memory is shared is adopted, but it is known that in such a system of a memory sharing type multiprocessor configuration, a serious processing performance fixed price may be caused due to memory competition. One way to avoid this performance fixed price is to secure sufficient memory throughput, but this requires enormous cost in both development and manufacturing, and it does not always lead to a superior price-performance ratio. .

【0004】したがって、プログラムをメモリ競合が生
じにくいように変更することにより性能定価を避ける方
が実現する上有利となる。しかしながら、そのために
は、プログラムのどの部分でメモリ競合が生じ易いかを
プログラム作成者に知らしめる必要があるが、従来、こ
のような情報を知るしめる手段がなかった。
Therefore, it is advantageous in terms of realization to avoid the fixed price of the performance by changing the program so that the memory competition does not easily occur. However, in order to do so, it is necessary to let the program creator know in which part of the program the memory contention is likely to occur, but heretofore, there has been no means for knowing such information.

【0005】[0005]

【発明が解決しようとする課題】上述したように、従来
はプログラムのどの部分でメモリ競合が生じ易い情報を
プログラム作成者に知らしめる手段がなく、プログラム
作成者の勘に頼っていることが多いため、対応の費用で
処理性能の定価を回避することができないという問題点
がある。
As described above, conventionally, there is no means for notifying the program creator of information in which part of the program the memory contention is likely to occur, and the program creator often relies on the intuition of the program creator. Therefore, there is a problem that the fixed price of the processing performance cannot be avoided with the corresponding cost.

【0006】[0006]

【課題を解決するための手段】本発明の性能モニタは、
同時に独立して動作可能な複数のメモリユニットから成
るメモリ装置と、1台以上の演算処理装置を具備する情
報処理装置の性能モニタであって、前記演算処理装置か
らの前記メモリ装置へのアクセス要求を、該当する前記
メモリユニットに送出するように制御するメモリアクセ
ス制御手段と、いずれかの前記メモリユニットに要求信
号が送出されると歩進する前記演算処理装置対応の計数
手段とを含むことを特徴とする。
The performance monitor of the present invention comprises:
A performance monitor of an information processing apparatus including a memory device including a plurality of memory units that can operate independently at the same time, and an information processing device including one or more arithmetic processing devices, the access request to the memory device from the arithmetic processing device. To a corresponding memory unit, and a counting unit corresponding to the arithmetic processing unit that advances when a request signal is sent to any of the memory units. Characterize.

【0007】[0007]

【実施例】本発明の第1の実施例を示す図1を参照する
と、本実施例はCPU1と、メモリアクセス制御部2
と、4つのメモリユニット3−0,3−1,3−2およ
び3−3と、オア回路4と、5つのカウンタ5,6−
0,6−1,6−2および6−3とから構成されてい
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Referring to FIG. 1 showing a first embodiment of the present invention, the present embodiment has a CPU 1 and a memory access control unit 2.
, Four memory units 3-0, 3-1, 3-2 and 3-3, an OR circuit 4, and five counters 5, 6-
It is composed of 0, 6-1, 6-2 and 6-3.

【0008】CPU1は命令を解釈し実行する演算処理
装置であり、メモリを参照する命令を実行する場合およ
び命令をメモリからフェッチする場合に結線101を介
してメモリアクセス制御部2にメモリアクセス要求を送
出する。
The CPU 1 is an arithmetic processing unit that interprets and executes instructions, and issues a memory access request to the memory access control unit 2 via a connection 101 when executing an instruction that refers to a memory and when fetching an instruction from the memory. Send out.

【0009】メモリアクセス制御部2はCPU1からメ
モリアクセス要求を受取ると、CPU1からの要求アド
レスに対応したメモリユニット3−0〜3−3にそれぞ
れ結線102−0〜102−3を介して要求信号を送出
する。
When the memory access control unit 2 receives a memory access request from the CPU 1, the memory access control unit 2 requests the memory units 3-0 to 3-3 corresponding to the request address from the CPU 1 via connection lines 102-0 to 102-3, respectively. Is sent.

【0010】CPU1からのメモリアクセス要求にはス
カラデータのアクセス要求とベクトルデータのアクセス
要求とがある。スカラデータのアクセス要求の場合に
は、CPU1から送られるてくるアドレスをそのまま用
いて、アクセスするメモリユニットを選択し、該当する
メモリユニットに要求信号およびアドレスを送出する。
Memory access requests from the CPU 1 include scalar data access requests and vector data access requests. In the case of a scalar data access request, the address sent from the CPU 1 is used as it is, the memory unit to be accessed is selected, and the request signal and address are sent to the corresponding memory unit.

【0011】一方、ベクトルデータのアクセス要求の場
合には、CPU1から供給される先頭アドレスと要素間
間隔をもとにしてメモリアクセス制御部2でベクトルデ
ータを構成している各要素のアドレスを生成し、生成さ
れたアドレスに対応するメモリユニットに対して要求信
号およびアドレスを送出する。もっとも、スカラデータ
の場合とベクトルデータの場合とを問わず、メモリに対
する書込みの場合には書込みデータも送出する。要求信
号は要素毎に送出され、要素間間隔により最大4要素同
時に送出される。
On the other hand, in the case of a vector data access request, the memory access control unit 2 generates the address of each element forming the vector data based on the start address and the inter-element spacing supplied from the CPU 1. Then, the request signal and the address are sent to the memory unit corresponding to the generated address. However, regardless of whether it is scalar data or vector data, the write data is also sent when writing to the memory. The request signal is sent for each element, and up to four elements are sent at the same time depending on the inter-element spacing.

【0012】メモリユニット3−0〜3−3は、メモリ
アクセス制御部2からそれぞれ102−0〜102−3
を介して送られてくる指示に基いて動作する。CPU1
からみた番地付けは図3に示されるようにされており、
メモリアクセス制御装置2は、この番地付けを前提とし
てアクセスするメモリユニットを決定している。また、
図3から明らかなように、メモリ上連続したアドレスに
配置されたベクトルデータがアクセスされる場合は同時
に4要素アクセスできる。
The memory units 3-0 to 3-3 are connected to the memory access control unit 2 by 102-0 to 102-3, respectively.
It operates based on the instructions sent via. CPU1
The addressing as seen is as shown in Fig. 3,
The memory access control device 2 determines the memory unit to be accessed on the premise of this addressing. Also,
As is clear from FIG. 3, when vector data arranged at consecutive addresses on the memory are accessed, four elements can be simultaneously accessed.

【0013】結線102−1〜102−3を介してメモ
リユニット3−0〜3−3に送出される要求信号は、ま
たオア回路4にも供給され、オア回路4から結線103
を介してカウンタ5に入力し結線103が論理‘1’に
なるとカウンタ5は歩進される。すなわち、結線102
−0〜102−3のいずれかを介してメモリユニット3
−0〜3−3に要求信号が送出されたタイミングでカウ
ンタ5は歩進される。カウンタ5の値は結線104を介
してCPU1に供給され、CPU1がカウンタ5の値を
参照することができる。
The request signal sent to the memory units 3-0 to 3-3 via the wirings 102-1 to 102-3 is also supplied to the OR circuit 4, and the OR circuit 4 connects to the wiring 103.
Is input to the counter 5 and the connection 103 becomes logic "1", the counter 5 is incremented. That is, the connection 102
Memory unit 3 via any one of −0 to 102-3
The counter 5 is incremented at the timing when the request signal is sent to -0 to 3-3. The value of the counter 5 is supplied to the CPU 1 via the connection 104, and the CPU 1 can refer to the value of the counter 5.

【0014】結線102−0〜102−4はまた、それ
ぞれカウンタ6−0〜6−3にも供給され、カウンタ6
−0〜6−3はそれぞれ結線102−0〜102−3が
論理‘1’になった時歩進される。カウンタ6−0〜6
−3はそれぞれ結線105−0〜105−3を介してC
PU1に供給され、CPU1がカウンタ6−0〜6−3
の値を参照することができる。
The connections 102-0 to 102-4 are also supplied to the counters 6-0 to 6-3, respectively.
-0 to 6-3 are stepped when the connections 102-0 to 102-3 become logic "1". Counter 6-0 to 6
-3 is C via connection 105-0 to 105-3, respectively
It is supplied to PU1, and CPU1 causes counters 6-0 to 6-3.
You can refer to the value of.

【0015】CPU1は図示されない毎クロックサイク
ルに歩進されるタイマを内蔵しており、このタイマによ
って規定される一定時間でのカウンタ5および6−0〜
6−3の値を参照することにより、そのプログラムによ
るメモリ負荷を算定することができる。プログラム作成
者は、こうして得られたメモリ負荷を基にしてメモリ負
荷を減らすようにプログラムを検討することができる。
The CPU 1 has a timer (not shown) that is incremented in every clock cycle, and the counters 5 and 6-0 at fixed time intervals defined by this timer.
The memory load of the program can be calculated by referring to the value of 6-3. The program creator can consider the program so as to reduce the memory load based on the memory load thus obtained.

【0016】次に、図2は本発明の第2の実施例を示す
ブロック図である。本実施例は、2つのCPU11−0
および11−1と、メモリアクセス制御部12と、4つ
のメモリユニット13−0,13−1,13−2および
13−3と、オア回路14と、2つのアンド回路15−
0および15−1と、2つのカウンタ16−0および1
6−1とで構成される。
Next, FIG. 2 is a block diagram showing a second embodiment of the present invention. This embodiment has two CPUs 11-0.
And 11-1, a memory access control unit 12, four memory units 13-0, 13-1, 13-2 and 13-3, an OR circuit 14, and two AND circuits 15-.
0 and 15-1 and two counters 16-0 and 1
6-1 and 6-1.

【0017】CPU11−0および11−1は第1の実
施例におけるCPU1と同等の機能を有する演算処理装
置であり、それぞれ結線201−0および201−1を
介してメモリアクセス制御部12にメモリアクセス要求
を送出する。
The CPUs 11-0 and 11-1 are arithmetic processing units having the same functions as the CPU 1 in the first embodiment, and access the memory access controller 12 via the connections 201-0 and 201-1 respectively. Send the request.

【0018】メモリアクセス制御部2は、CPU11−
0およひCPU11−1から送られてきたメモリアクセ
ス要求を調停して結線202−0〜202−3を介して
メモリユニット13−0〜13−3にそれぞれ要求信号
を送出する。メモリユニット13−0〜13−3は、第
1の実施例におけるメモリユニット3−0〜3−3と同
様に図3に示されるような番地付けがなされており、メ
モリアスケス制御部12は、この番地付けがCPU11
−0と11−1に共通であるとの前提としてアクセスす
るメモリユニットを決定する。
The memory access control unit 2 includes a CPU 11-
0 and the memory access request sent from the CPU 11-1 are arbitrated and a request signal is sent to each of the memory units 13-0 to 13-3 via the connections 202-0 to 202-3. The memory units 13-0 to 13-3 are assigned addresses as shown in FIG. 3 similarly to the memory units 3-0 to 3-3 in the first embodiment. Address is CPU11
The memory unit to be accessed is determined on the assumption that the memory unit is common to 0 and 11-1.

【0019】メモリアクセス制御部12は、CPU11
−0または1からのリクエストのいずれか一方を処理
し、同時にはメモリユニット13−0〜3に要求信号を
送出しない。要求信号送出元CPU番号は結線203−
0〜1を介して出力されそれぞれアンド回路15−0お
よび15−1に供給される。CPU11−0のアクセス
要求に対する要求信号が送出された時は203−0が論
理‘1’に、CPU11−1のアクセス要求に対する要
求信号が送出された時は203−1が論理‘1’にな
り、それぞれアンド回路15−0,15−1を活性化す
る。
The memory access control unit 12 has a CPU 11
Either one of the requests from 0 or 1 is processed, and no request signal is sent to the memory units 13-0 to 13-3 at the same time. The request signal transmission source CPU number is the connection 203-
It is output via 0 to 1 and supplied to AND circuits 15-0 and 15-1, respectively. When the request signal for the access request of the CPU 11-0 is sent, 203-0 becomes the logic "1", and when the request signal for the access request of the CPU 11-1 is sent, the logic 203-1 becomes the logic "1". , AND circuits 15-0 and 15-1 are activated, respectively.

【0020】結線202−0〜202−3を介してメモ
リユニット13−0〜13−3に供給される要求信号
は、第1の実施例と同様にしてオア回路14にも供給さ
れ、4つの信号の論理和がとられて結線204を介して
アンド回路15−0および15−1に供給される。アン
ド回路15−0および15−1はメモリユニットへの要
求信号の要求元CPU番号を示す203−0および20
3−1と、メモリユニット13−0〜13−3のいずれ
かにアクセス要求があったことを示す204の論理積を
とり、それぞれカウンタ16−0および16−1にそれ
ぞれ結線205−0および205−1を介して供給され
る。カウンタ16−0および16−1はそれぞれ205
−0および205−1が論理‘1’になると歩進される
カウンタで、それぞれCPU11−0およびCPU11
−1によるメモリアクセス要求によりメモリユニット1
3−0〜13−3に対して要求信号を送出した回数を示
している。
The request signal supplied to the memory units 13-0 to 13-3 via the connections 202-0 to 202-3 is also supplied to the OR circuit 14 in the same manner as in the first embodiment, and four request signals are supplied. The signals are ORed and supplied to the AND circuits 15-0 and 15-1 via the connection 204. AND circuits 15-0 and 15-1 indicate the request source CPU numbers of the request signals to the memory units 203-0 and 20-3.
3-1 and the logical product of 204 indicating that there is an access request to any of the memory units 13-0 to 13-3 are taken and connected to the counters 16-0 and 16-1, respectively, by connecting wires 205-0 and 205. -1 is supplied. Counters 16-0 and 16-1 are each 205
-0 and 205-1 are counters that are incremented when they become logic "1".
-1 by the memory access request by the memory unit 1
It shows the number of times the request signal is sent to 3-0 to 13-3.

【0021】カウンタ16−0および16−1はそれぞ
れ結線206−0および206−1を介してCPU11
−0および11−1に供給され、CPU11−0および
11−1から16−0および16−1の値を参照するこ
とができる。CPU11−0および11−1は、図示さ
れない内蔵タイマと、カウンタ16−0および16−1
からそれぞれが実行しているプログラムのメモリ負荷を
算定することができる。
The counters 16-0 and 16-1 are connected to the CPU 11 via connections 206-0 and 206-1, respectively.
The values of the CPUs 11-0 and 11-1 to 16-0 and 16-1 can be referred to. The CPUs 11-0 and 11-1 have built-in timers (not shown) and counters 16-0 and 16-1.
It is possible to calculate the memory load of the programs executed by each.

【0022】以上述べた2つの実施例は本発明の望まし
い例であり、本発明がこれらの実施例に限定されるもの
ではないことはいうまでもない。
Needless to say, the two embodiments described above are preferable examples of the present invention, and the present invention is not limited to these embodiments.

【0023】[0023]

【発明の効果】以上説明したように、本発明はメモリに
対して、アクセス要求を送出する毎に計数する計数手段
を有することにより、プログラムのメモリ負荷状態を知
らしめることができ、プログラム修正に供することがで
き、結果としてベクトル計算機の性能を引出すことが可
能になる。
As described above, according to the present invention, the memory load state of the program can be notified by having the counting means for counting each time an access request is sent to the memory, so that the program can be corrected. It is possible to obtain the performance of the vector computer as a result.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例のブロック図である。FIG. 1 is a block diagram of a first embodiment of the present invention.

【図2】本発明の第2の実施例のブロック図である。FIG. 2 is a block diagram of a second embodiment of the present invention.

【図3】本発明におけるメモリの番地付けの一例を示す
図である。
FIG. 3 is a diagram showing an example of addressing of a memory according to the present invention.

【符号の説明】[Explanation of symbols]

1,11−0,11−1 CPU 2,12 メモリアクセス制御部 3−1〜3−3,13−0〜13−3 メモリユニッ
ト 4,14 オア回路 5,6−0〜6−3,16−0〜16−1 カウンタ 15 アンド回路。
1, 11-0, 11-1 CPU 2, 12 Memory access control unit 3-1 to 3-3, 13-0 to 13-3 Memory unit 4, 14 OR circuit 5, 6-0 to 6-3, 16 -0 to 16-1 Counter 15 AND circuit.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 同時に独立して動作可能な複数のメモリ
ユニットから成るメモリ装置と、1台以上の演算処理装
置を具備する情報処理装置の性能モニタであって、 前記演算処理装置からの前記メモリ装置へのアクセス要
求を、該当する前記メモリユニットに送出するように制
御するメモリアクセス制御手段と、 いずれかの前記メモリユニットに要求信号が送出される
と歩進する前記演算処理装置対応の計数手段とを含むこ
とを特徴とする情報処理装置の性能モニタ。
1. A performance monitor for an information processing apparatus comprising a memory device comprising a plurality of memory units that can operate independently at the same time, and one or more arithmetic processing devices, wherein the memory from the arithmetic processing devices is a memory device. Memory access control means for controlling an access request to the device to be sent to the corresponding memory unit, and counting means corresponding to the arithmetic processing device, which advances when a request signal is sent to one of the memory units. A performance monitor of an information processing apparatus, comprising:
【請求項2】 前記メモリユニットに要求信号が送出さ
れると歩進する前記メモリユニット対応の計数手段を設
けたことを特徴とする請求項1記載の情報処理装置の性
能モニタ。
2. The performance monitor for an information processing apparatus according to claim 1, further comprising: counting means corresponding to the memory unit, which advances when a request signal is sent to the memory unit.
JP5218480A 1993-09-02 1993-09-02 Performance monitor of information processor Pending JPH0773162A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5218480A JPH0773162A (en) 1993-09-02 1993-09-02 Performance monitor of information processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5218480A JPH0773162A (en) 1993-09-02 1993-09-02 Performance monitor of information processor

Publications (1)

Publication Number Publication Date
JPH0773162A true JPH0773162A (en) 1995-03-17

Family

ID=16720593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5218480A Pending JPH0773162A (en) 1993-09-02 1993-09-02 Performance monitor of information processor

Country Status (1)

Country Link
JP (1) JPH0773162A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339107A (en) * 2004-05-26 2005-12-08 Nec Electronics Corp Performance monitor circuit

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339107A (en) * 2004-05-26 2005-12-08 Nec Electronics Corp Performance monitor circuit

Similar Documents

Publication Publication Date Title
EP3896574B1 (en) System and method for computing
US5016167A (en) Resource contention deadlock detection and prevention
US5606520A (en) Address generator with controllable modulo power of two addressing capability
CN100414535C (en) reconfigurable integrated circuit device
EP1196842B1 (en) Method and apparatus for combining a plurality of memory access transactions
US5682551A (en) System for checking the acceptance of I/O request to an interface using software visible instruction which provides a status signal and performs operations in response thereto
US5515516A (en) Initialization mechanism for symmetric arbitration agents
WO1994003860A1 (en) Massively parallel computer including auxiliary vector processor
EP0512685B1 (en) Quadrature bus protocol for carrying out transactions in a computer system
US6954873B2 (en) Implementation of wait-states
JP2831083B2 (en) Multiprocessor system and interrupt controller
JPH0773162A (en) Performance monitor of information processor
JPH11163970A (en) Intra-device substrate control system
JP2670397B2 (en) Contention minimized processor and system bus system
US6009482A (en) Method and apparatus for enabling cache streaming
JPH07508611A (en) Symmetric multiprocessing system with unified environment and distributed system functionality
JPS63310060A (en) multiprocessor system
JP3525771B2 (en) Bus snoop control circuit
JPS61114341A (en) Processing system
JPS6014435B2 (en) Storage device
JP2876909B2 (en) Interrupt emulator
JP3038257B2 (en) Electronic computer
JP3449156B2 (en) Module device
JPH05324455A (en) Bus linking system for multiprocessor and memory
Jackson An experimental multi-processor architecture for small business applications

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990323