JPH09330302A - 計算機システムの性能モニタリング方法およびシステム - Google Patents
計算機システムの性能モニタリング方法およびシステムInfo
- Publication number
- JPH09330302A JPH09330302A JP9029951A JP2995197A JPH09330302A JP H09330302 A JPH09330302 A JP H09330302A JP 9029951 A JP9029951 A JP 9029951A JP 2995197 A JP2995197 A JP 2995197A JP H09330302 A JPH09330302 A JP H09330302A
- Authority
- JP
- Japan
- Prior art keywords
- performance data
- computer
- display
- receiving
- performance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Debugging And Monitoring (AREA)
- Multi Processors (AREA)
Abstract
性能データを複数の計算機からネットワークを介してモ
ニタ可能にする。 【解決手段】並列計算機1の各ノード2上で起動された
採取プロセス4が性能データを採取し、特定のノード上
で起動された収集プロセス3がこれらの性能データを集
めて、モニタ用計算機11上の受信プロセス15へ送信
する。受信プロセス15は、同じかまたは異なるモニタ
用計算機11上にすでに起動された表示プロセス16や
蓄積プロセス17があれば、それらにその性能データを
分配する。表示プロセス16は表示装置12にその性能
データに含まれた複数の項目別性能データの一部を表示
する。蓄積プロセス17は記憶装置13へその性能デー
タを全て蓄積していく。
Description
ットワークで接続した計算機システムにおける性能デー
タの採取ならびにその表示をおこなう性能モニタリング
方法、そのための計算機システムおよびプログラム記憶
媒体に係り、特に並列計算機あるいは分散システムに好
適な性能モニタリング方法に関する。
を構成するノードと呼ばれる計算機が複数個協調して並
列に稼働するため、それらのノードの動作は、ノード間
通信に例示されるように、他のノードの動作に依存す
る。したがって、逐次型計算機に比較してその動作は非
常に複雑なものとなる。
な性能を引き出すためには、ノード単体の動作のみなら
ず、ノード間の動作の因果関係や負荷のバランスなども
含めた複雑な稼働状況を正確に把握し、それらの情報を
実行中のプログラムのチューニングに役立てていくこと
が必要となる。
術としては、主に次の2通りの方法が用いられてきた。
第1は、Hewlett−Packard社が販売して
いるPerfViewなどで用いられている方法で、分
散システムの各ノード毎にCPUの稼働状況やメモリの
使用状況、ネットワークの通信頻度などといったそのノ
ードの稼働状況に関する性能データを計測し、磁気ディ
スク記憶装置などの、そのノードに含まれた記憶装置に
蓄積する。各ノードに蓄積された性能データを、その分
散システムに接続された一つの計算機内に集積し、グラ
フ表示などによって視覚的に理解できるよう表示する。
ion Toolに代表される方法で、並列計算機の各
ノード上に性能データを採取するプロセスを起動し、ネ
ットワークを介してその並列計算機に接続された制御用
計算機上に起動された表示プロセスが、各ノード上のプ
ロセスからリアルタイムに性能データを受信し、表示を
行う。たとえば、米国International B
usiness Machines Corp.発行
の、“IBM Parallel Environme
nt for AIX Operation and
Use Version 2.1.0,”pp.263
−265,1995(資料番号GC23−3891−0
0)参照。
いは分散システムは複数の利用者により共有して使用さ
れるようになっている。したがって、このような計算機
の性能データをネットワークを介してリアルタイムに複
数の利用者がモニタリングできることが望ましい。
能データを記憶装置に蓄積することができるが、性能デ
ータの測定を一度終えてからデータの解析ならびに表示
を行うため、リアルタイムに稼働状況の把握をすること
ができない。
らリアルタイムに性能データを受信し表示することがで
きるが、上記参考文献は、複数の利用者が同じ監視対象
の計算機の性能データをモニタリングする方法を具体的
には示していない。
算機の性能データのモニタリングを行う場合、利用者の
数が増加するに従ってそのモニタリング対象の計算機に
対する、そのモニタリングのための負荷が増大しないこ
とがさらに望ましい。
なる計算機の負荷の増大を抑えつつ、リアルタイムに性
能データを複数の利用者がモニタリングするのに適した
計算機性能モニタリング方法、そのための計算機システ
ムおよびプログラム記憶媒体を提供することにある。
め、本発明では、監視対象の計算機により性能データを
繰り返し採取し、稼働状況モニタ用の計算機にネットワ
ークを通じて送信する。このモニタ用の計算機に受信プ
ロセスを起動し、このプロセスは、送信された性能デー
タを受信し、その計算機と同じかまたは異なる複数の計
算機上に起動された一つまたは複数の利用プロセスにそ
の受信した性能データを分配する。測定された性能デー
タは、複数の測定項目に対する複数の性能データを含
む。それらの利用プロセスは、例えば、複数の表示プロ
セスあるいは複数の蓄積プロセスである。
スにより転送された性能データを受信したときには、そ
の表示プロセスは、転送された性能データの内、一部の
測定項目に対する性能データを、その表示プロセスが起
動されている計算機に接続された表示装置上に表示す
る。いずれかの蓄積プロセスが上記受信プロセスにより
転送された性能データを受信したときには、その蓄積プ
ロセスは、転送された性能データを全て、その蓄積プロ
セスが起動されている計算機に接続された記憶装置に記
憶する。
は、監視対象の計算機が並列計算機である場合には、そ
の並列計算機の各ノード上に起動した採取プロセスが採
取した性能データを、上記ネットワークに接続された、
並列計算機内の所定の一つのノード上に起動された収集
プロセスにより収集し、上記受信プロセスに転送する。
ング方法を図面に示したいくつかの実施の形態を参照し
てさらに詳細に説明する。なお、以下においては、同じ
参照番号は同じものもしくは類似のものを表わすものと
する。また、第2の実施の形態以降では、第1の実施の
形態との相違点を主に説明する。
並列計算機1は、それぞれ少なくとも一つのプロセッサ
2Aとメモリ2Bなどで構成される複数のノード2と、
それらのノード間を接続する内部ネットワーク5とから
なる。各ノードのメモリ2Bは、そのノードのプロセッ
サ2Aが実行するプログラムおよびデータを保持する。
各ノードあるいは一部のノードはさらに磁気記憶装置等
の周辺装置を有するが、ここでは簡単化のために図示し
ていない。並列計算機1の特定の1個のノードは外部ネ
ットワーク21と接続されており、外部ネットワーク2
1には複数の計算機11が接続され、上記一つのノード
およびこれらの計算機はこのネットワーク21を介して
相互に通信可能になっている。並列計算機1が監視対象
の計算機であり、外部ネットワーク21に接続された二
つの計算機11がモニタリングに使用される計算機の例
である。ネットワーク21に接続された他の計算機は、
簡単化のために図示されていない。各計算機11は、プ
ロセッサ11Aやメモリ11Bにより構成され、その計
算機11には、ディスプレイ装置とキーボードなどを含
む入出力装置12と磁気ディスク記憶装置などの記憶装
置13が接続されている。各プロセッサは、適当なO
S、たとえば、X/Open Company Lim
itedにより開発され、ライセンスされているUNI
Xにより制御される。
ングシステムを構成する5種類のプロセスとそれらの間
の関連を示す。これらのプロセスは、適当なプログラム
記録媒体に記録された5つのプログラムが、並列計算機
1に組み込まれて、それぞれプロセスとして実行された
ものである。並列計算機1の各ノード2には採取プロセ
ス4がおかれる。この採取プロセス4はそれぞれのノー
ド2の性能データを一定の時間間隔で繰り返し採取する
機能を持つ。収集プロセス3は並列計算機1の複数のノ
ード2のうち、外部ネットワーク21に接続されている
特定のノード上におかれ、各ノード上の採取プロセス4
が採取した各ノードの性能データを収集し、いずれか一
つのモニタ用の計算機11へ送信する。
受信プロセス15、表示プロセス16そして蓄積プロセ
ス17が起動される。受信プロセス15は複数のモニタ
用計算機の内の1つのみに起動され、収集プロセス3と
1対1でデータの送受信を行う。表示プロセス16なら
びに蓄積プロセス17は、一人または複数の利用者によ
って必要な数だけ起動され、受信プロセス15から性能
データの分配を受ける。表示プロセス16は、その性能
データ内の一部の項目別性能データを入出力装置12内
のディスプレイ装置上に表示する。蓄積プロセスは、そ
の性能データの全体を記憶装置13へ蓄積したりする。
この表示プロセス16および蓄積プロセス17は、必ず
しも受信プロセス15の起動されたモニタ用計算機11
上で起動される必要はなく、そのモニタ用の計算機とネ
ットワーク21で接続されている他の計算機上でもそれ
らのプロセスを起動することもできる。また、いずれか
一つのモニタ用計算機11上に複数の表示プロセス16
を起動することもできる。同様にその計算機上に複数の
蓄積プロセス17を起動することも可能である。
スがどのように連携をとりながら動作するかを、図6
(a),(b)のフローチャートならびに図2から図5
に示された上記5つのプロセスの内部構成図を用いて説
明する。
21に接続された上記特定のノード2上に収集プロセス
3を起動する(ステップ521(図6(a)))。通常
の運用では、この収集プロセス3の起動はシステム管理
者が並列計算機1に対して収集プロセス起動コマンドを
投入することによって行う。収集プロセス3は、起動さ
れると、まず初期化処理を実行する。たとえば、ノード
数、各ノードの属性や性能データを取得するノードの数
など、並列計算機1の構成が記述された構成定義ファイ
ル208(図3)を読み込む。本実施の形態では、全て
のノードが性能データを取得すると仮定する。各ノード
の属性には、そのノードのアドレス、磁気ディスク記憶
装置など周辺機器がそのノードに付属しているか否かの
周辺装置付属状況などの情報が含まれる。初期化処理が
終わったら、この収集プロセス3はいずれか一つのモニ
タ用計算機11上に起動されるであろう受信プロセス1
5からの接続要求を待つ。
1上に受信プロセス15を起動する(ステップ54
1)。通常の運用では、受信プロセス15の起動は、シ
ステム管理者がモニタ用計算機11から受信プロセス起
動コマンドを投入することによって行う。この受信プロ
セス15は並列計算機1に対してネットワークにより接
続された任意の計算機上に起動することが可能である。
しかし、本プロセスは複数の利用者が異なる計算機上で
起動した複数の表示プロセスから接続される可能性があ
るため、並列計算機の管理用ワークステーションなど複
数の利用者からのアクセスが可能な特定の計算機上で起
動するのが一般的である。システム管理者はこの受信プ
ロセス15の起動コマンドの引数として、収集プロセス
3へ接続要求を出す際に必要となる並列計算機1のIP
アドレス情報(あるいはホスト名)、性能データ採取の
時間間隔などのパラメータを入力する。
続処理ルーチン305により、収集プロセス3に対して
接続要求を行う(ステップ542)。本接続要求は、U
NIXにおけるconnectシステムコールで実装す
ることができる。この時、接続要求を出す相手である収
集プロセス3の識別情報として、起動の際に引数として
与えられた並列計算機のIPアドレス情報を用いる。接
続要求を受け取った収集プロセス3では、接続処理ルー
チン202が、受信プロセス15内の接続処理ルーチン
305(図4)のとの接続処理を行い、これにより収集
プロセス3が受信プロセス15との間でデータの送受信
を行うのを可能にする(ステップ522)。
構成定義ファイル208から読み込んだ並列計算機1の
構成定義情報を受信プロセス15へ送信する(ステップ
523)。さて、本システムでは、システムを構成する
プロセス間でメッセージを授受することにより、要求の
伝達やデータの送受信を行う。本実施の形態では、メッ
セージは可変長のバイト列であり、先頭1バイトはメッ
セージの種類を表す識別子を格納する識別子フィールド
であり、それに続くデータフィールドにデータを格納す
る。メッセージは、データフィールドを伴わず、識別子
フィールドのみから成る場合もある。上記ステップ52
3での、上記構成定義情報の伝達のためには、収集プロ
セス3において、内部処理ルーチン207(図3)が受
信プロセス15に対応して設けられた入出力バッファ2
03上にその構成定義情報を含むメッセージを構成す
る。すなわち、識別子フィールドに本メッセージが構成
定義情報を含むことを示す1バイトの識別子を格納し、
データフィールドに、上記監視用の計算機11のIPア
ドレスを格納する。このように構成されたメッセージを
UNIXのsendシステムコールを用いて受信プロセ
ス15へネットワーク21を介して送る。
らこのメッセージ受信すると、入力解析ルーチン306
(図4)にてその識別子からメッセージ内容が並列計算
機1の構成定義情報であることを検知する。さらに、構
成定義情報に含まれたノード数から、性能データの転送
に必要な入出力バッファ301,302のサイズを算出
する。算出されたサイズは後にそれらの入出力バッファ
が確保されるときに使用される。各入出力バッファ30
1または302は、後に起動される表示プロセス16あ
るいは蓄積プロセス17の一つに対応して確保される。
これらの入出力バッファのサイズは、1時間ステップに
一つの採取プロセス4により採取される性能データの長
さを並列計算機内のノード数倍した長さ以上確保すれば
よい。次いで、受信プロセス15は、収集プロセス3に
対して各ノードの採取プロセス4の起動を要求する(ス
テップ543)。具体的には、上記計算機構成定義情報
の授受と同様に、採取プロセス4は、起動要求であるこ
とを示す要求識別子を含んだメッセージを収集プロセス
3へ送信し、それを受信した収集プロセス3が入力解析
ルーチン205でその識別子から要求の内容を識別す
る。
動を要求された収集プロセス3は、先に受信した構成定
義情報内のノードアドレスを使用して、各ノード2上に
採取プロセス4を起動する(ステップ524)。起動に
はUNIXのリモートシェル機能を用いる。採取プロセ
ス4は起動されると(ステップ501)、UNIXのc
onnectシステムコールを用いて接続処理ルーチン
100(図2)により収集プロセス3との接続処理を実
行するなどの初期処理を行い、収集プロセス3からモニ
タリング開始が要求されるのを待つ。このようにして採
取プロセス4の起動および採取プロセスによる収集プロ
セス3との接続処理が終了すると、収集プロセス3は受
信プロセス15に対して起動処理終了を通知する。それ
を受けた受信プロセス15は収集プロセス3に対してモ
ニタリング開始を要求する(ステップ544)。この
時、受信プロセスがモニタリング開始要求のために送信
するメッセージには、要求の内容を示す識別子の他、性
能データ採取時間間隔についての情報が含まれる。
ス3は、該当する採取プロセス4へ開始要求メッセージ
を転送する(ステップ525)。採取プロセス4が起動
されると、カウンタ制御/読み出しルーチン104がs
electシステムコールを発行し、採取プロセス4は
メッセージ到着待ち状態になる。採取プロセス4は、s
electシステムコールに対するリターンの値によ
り、メッセージ到着を検出すると、この採取プロセス4
の処理は入力解析ルーチン102に移る。入力解析ルー
チン102ではreceiveシステムコールを発行し
てメッセージを入出力バッファ101に読み込む。メッ
セージの先頭の識別子がモニタリング開始要求識別子で
あることを確認し、メッセージに含まれる性能データ採
取時間間隔を取り出し、これを戻り値として使用してカ
ウンタ制御/読み出しルーチン104に戻る。こうして
採取要求を受けた採取プロセス4は、要求に含まれてい
る採取時間間隔を読みとり、カウンタ制御/読み出しル
ーチン104は、この採取時間間隔をクロック107に
セットし、クロック107はセットされた時間間隔ごと
にカウンタ制御/読み出しルーチン104に割り込みを
発生する。
は、クロックからの割り込みを受けると、その都度、U
NIXの性能データ採取のためのシステムコールである
rstatなどの関数を発行してOS105から性能デ
ータを採取する(ステップ502)。性能データは複数
の項目別性能データからなり、採取可能な項目別性能デ
ータの数と種類は、上記関数の仕様によって予め決まっ
ている。通常、単位時間内でのCPU利用率、メモリ利
用率、磁気ディスク記憶装置アクセス回数、ネットワー
クによる通信回数(すなわち、送信回数と受信回数)な
どの項目別性能データを得ることができる。OSは、こ
れらの性能データを、カーネル内のソフトウエアカウン
タ106、またはそのノード内のハードウエアカウンタ
108より読み出し、rstatの出力引数として返
す。
プロセス4のカウンタ制御、読み出しルーチン104
は、その性能データを入出力バッファ101に格納し、
出力制御ルーチン103に制御を移す。出力制御ルーチ
ン103は、sendシステムコールを発行し、それに
より入出力バッファ101の内容を内部ネットワーク5
を介して収集プロセス3へ送信する(ステップ50
3)。収集プロセス3では、いずれかの採取プロセス4
からの性能データを含むメッセージの到着を、内部処理
ルーチン207(図3)がOSのシステムコールである
select関数を用いて監視する。メッセージの到着
を確認すると、内部処理ルーチン207は、入力解析ル
ーチン205を起動する。入力解析ルーチン205は、
receiveシステムコールを発行して、そのメッセ
ージ内の性能データを入出力バッファ201へ読み込
む。入力解析ルーチン205は、その性能データの読み
込みが終了すると、送信元の採取プロセスを記憶し、全
ての採取プロセス4から性能データが送信されてきたか
を確認し、処理を内部処理ルーチン207に戻す。
い採取プロセス4がある場合は、内部処理ルーチン20
7はselectシステムコールを発行して性能データ
を含むメッセージ到着の監視を続ける。全ての採取プロ
セス4からの性能データが到着した場合は、内部処理ル
ーチン207はそれらの採取プロセス4からの性能デー
タを、それぞれの採取プロセスに対応して設けられた入
出力バッファ201から、受信プロセス15に対する入
出力バッファ203へコピーし、さらに、それらのコピ
ーされた各ノードに関する性能データを一つのメッセー
ジに組み立てる。メッセージは、識別子に続いて、各採
取プロセスから送られた性能データを連ねた性能データ
からなる。次いで内部処理ルーチン207は、出力制御
ルーチン206を起動する。出力制御ルーチン206
は、UNIXのsendシステムコールを発行し、この
性能データを含むメッセージを受信プロセス15に送信
する(ステップ526)。
308がUNIXのselectシステムコールを発行
し、収集プロセス3からのメッセージ到着を待つ。収集
プロセス3からのメッセージの到着を検出すると、内部
処理ルーチン308は、入力解析ルーチン306に処理
を移す。入力解析ルーチン306は、UNIXのrec
eiveシステムコールを発行して、そのメッセージ内
の性能データを収集プロセス3に対応して設けられた入
出力バッファ304へ読み込む(ステップ545)。性
能データを受信した後、受信プロセス15は、表示プロ
セス16または蓄積プロセス17が接続されているかを
確認する。表示プロセスが1つも接続されていない場合
には、以下の性能データの転送処理は行わない。少なく
とも一つの表示プロセス16が接続されていた場合に
は、受信プロセス15は入出力バッファ304に到着し
たメッセージをその表示プロセス16に対して1対1に
設けられた入出力バッファ301にコピーし、それによ
りそのメッセージをその入出力バッファ301に接続さ
れた表示プロセス16に分配する。もし複数の表示プロ
セス16が接続されている入出力バッファ301がある
ときには、全ての表示プロセス16にその性能データを
全く同じ方法で分配する。蓄積プロセス17が接続され
ている場合には、その蓄積プロセスに接続して設けられ
た入出力バッファ301を利用する。本分配処理の詳細
に関しては後述する。
ロセス3、受信プロセス15がシステム管理者によって
起動された後、本システムの使用者は表示プロセス16
あるいは蓄積プロセス17を起動すれば、これらのプロ
セスを使用して性能データをモニタリングをすることが
可能となる。この場合、図示された他のモニタ用の計算
機11は、並列計算機1の一人の利用者が使用する机上
の計算機でもよい。こうして、システム管理者が管理す
る計算機11からもあるいはそれから隔たった、利用者
が管理する個人用の汎用の計算機11からも並列計算機
1の性能データをモニタ可能になる。なお、本明細書で
はこのように、性能データのモニタリング専用でない汎
用の計算機でも性能データのモニタリングに使用される
計算機をモニタ用の計算機と呼んでいる。
計算機に起動可能にするとともに、性能データを使用す
る表示プロセスあるいは蓄積プロセスも任意の計算機に
起動可能になっている。さらに、個々の表示プロセスが
要求する項目別性能データに依らないで、予め定めた複
数の項目別性能データを採取し、表示プロセスはその中
から項目別性能データを選択して利用する。これらの予
め定められた複数の項目が十分多ければ、利用者が他の
項目別性能データを要求した場合でも、通常は上の方法
によっても利用者の要求を満たすことができる。
では利用者が後で利用する項目別性能データを選択でき
るように、採取された全ての項目別性能データを記憶装
置に保持するようになっている。このためにも、利用者
の要求する項目別性能データが何であるかに依らないで
予め定めた一定数の項目別性能データを採取している。
信プロセスは、表示プロセスあるいは蓄積プロセスの起
動とは独立に起動され、その後の表示プロセスあるいは
蓄積プロセスの起動に応じて採取した性能データをそれ
らのプロセスに分配している。これにより、起動された
表示プロセスの有無あるいはその数が変化しても、受信
プロセスと収集プロセス、採取プロセスは同じ処理を実
行すればよいことになる。
る。表示プロセス16はモニタリングシステムの使用者
が自分の使用するモニタ用計算機11上で起動する(ス
テップ561(図6(b)))。この時、使用者は受信
プロセス15が起動された計算機のIPアドレスをあら
かじめ確認しておき、その表示プロセス16の起動時の
引数として指定する。
利用する場合には、通常は、利用者毎に異なるモニタ用
計算機を用いる。例えば、二人の利用者が、図1に示さ
れる2台のモニタ用計算機11のそれぞれを用いる。本
実施の形態では、同一の利用者が同じ計算機11上に複
数の表示プロセスを起動することができる。少なくとも
一つの表示プロセス(第1種の表示プロセス)は、後に
例示するように、その表示プロセスに対して定まった項
目別性能データを、その表示プロセスにより定められた
図形もしくはグラフでもって表示するように構成されて
いる。その他の表示プロセス(第2種の表示プロセス)
は利用者が選んだ項目別性能データを、その表示プロセ
スに対してあらかじめ定められたグラフにより表示する
ように構成される。後者の種類の表示プロセスとして、
それぞれ異なるグラフに対応して準備された複数の表示
プロセスが同一のモニタ用の計算機上に起動可能に構成
されている。さらにいずれの種類の表示プロセスも、起
動された後、利用者の指示により受信プロセスに性能デ
ータの転送を要求するように構成されている。このよう
に、表示可能なグラフごとに表示プロセスを起動するよ
うに表示プロセスを構成してあるので、各表示プロセス
の構造が簡単である。
を同じ計算機上に表示するには、利用者は最小限一つの
表示プロセスを起動する必要があるが、一般には利用者
は複数の項目別性能データの表示を希望するので、同一
の利用者が同一の計算機上に複数の第2種の表示プロセ
スを起動することになる。その際、どのグラフで性能デ
ータを表示するかに応じて、起動すべき第2種の表示プ
ロセスを選択し、その選択された第2種の表示プロセス
を起動後に、その表示プロセスで表示すべき項目別性能
データを指示するようになっている。
ーチン403が表示画面の初期化や受信プロセス15へ
接続するための初期化処理を行った後、接続処理ルーチ
ン406に処理を移して受信プロセス15へ接続要求を
発行する(ステップ562)。
接続処理ルーチン303は、その表示プロセス用に入出
力バッファ301ならびに要求フラグ302を生成し、
上記表示プロセスに対して接続処理を行う(ステップ5
46)。上記受信プロセスに対する接続処理が終了し、
そのプロセスに対してデータの送受信が可能となった
ら、受信プロセス15は今接続した表示プロセス16に
対して、受信プロセス15が先に収集プロセス3から受
信した、並列計算機1の構成定義情報を送信する。
は、その情報を参照して性能データを蓄積するための送
受信バッファ404の確保や全ノードの性能データを表
示するためのグラフのレイアウトの計算などを行った上
で、ウィンドウを表示装置上に表示する(ステップ56
3)。図7は、表示プロセス(第1種の表示プロセス)
により予め定められた複数の項目別性能データを表示す
るウィンドウの例である。二つの直方体および一組の矢
印(601,602,603)によって一つのノードの
稼働状況を表す。このような図形を複数のノードに対応
して複数個配置することによって並列計算機全体の稼働
状況を表す。2つの直方体601,602の高さはそれ
ぞれ一つのノードでのCPU利用率とメモリ利用率に対
応し、一組の矢印603の長さはネットワーク21への
そのノードからの送信回数と送受信回数に対応する。表
示ウィンドウ610は、表示エリア620と制御エリア
630から構成され、使用者は制御エリア630に配置
されたボタン640,650などのオブジェクトを利用
して表示プロセスの制御を行う。ボタン640を操作す
ることによりデータ表示が開始され、ボタン650を操
作することにより表示が停止される。
項目別性能データを表示する他の表示プロセス(第2種
の表示プロセス)により表示されるウィンドウの例であ
る。表示エリア620には棒グラフが表示される。グラ
フの横軸1711は異なるノードに対応し、縦軸171
2に一つの項目別性能データがマッピングされる。利用
者は、制御エリア630に与えられた性能データのリス
ト1704から、棒グラフの縦軸にマッピングしたい性
能データを選択する。ボタン640,650は図7の場
合と同様である。図7あるいは図8のいずれの表示プロ
セスの場合でも、使用者が表示ウィンドウ610または
1700内のボタン640の操作によりデータ表示の開
始を指示すると、表示プロセス16は受信プロセス15
に対して性能データの転送要求メッセージを送信する
(ステップ564)。
処理ルーチン308においてselectシステムコー
ルを発行し、入出力バッファ301および304へのメ
ッセージ到着待ちの状態にある。表示プロセス16から
のデータ転送要求メッセージの到着によりselect
システムコールはリターンし、内部処理ルーチン308
は、このメッセージの到着を検出すると、入力解析ルー
チン306に処理を移す。入力解析ルーチン306はr
eceiveシステムコールを発行して要求メッセージ
を当該表示プロセスと接続された入出力バッファ301
に読み込む。次いで、出力制御ルーチン307は要求メ
ッセージの識別子をチェックし、メッセージがデータ転
送要求であることを判定して、その入出力バッファ30
1に付随する要求フラグ302をセットする。なお、同
じ使用者または異なる使用者によって複数の表示プロセ
ス16または蓄積プロセス17が起動された場合には、
受信プロセス15は上記の処理を繰り返し、それら全て
のプロセスと接続操作を行う。
ス15に接続され、使用者の画面操作によって表示が開
始された後の装置動作について説明する。前述の手順に
より採取プロセス4から収集プロセス3を経由して受信
プロセス15へ性能データの転送が行われる(ステップ
504,527,548)。このとき、受信プロセス1
5は内部処理ルーチン308においてselectシス
テムコールを発行し、入出力バッファ301,305へ
のメッセージ到着待ち状態にある。収集プロセス3から
の性能データを含むメッセージの到着を契機としてse
lectシステムコールは内部処理ルーチン308にリ
ターンし、さらに内部処理ルーチン308は入力解析ル
ーチン306に制御を移す。入力解析ルーチン306は
receiveシステムコールを発行して到着したメッ
セージを入出力バッファ304に読み込み、メッセージ
の識別子をチェックしてこれが性能データを含むメッセ
ージであることを確認して内部処理ルーチン308に処
理を戻す。内部処理ルーチン308は表示プロセス16
と接続された入出力バッファ301に付随する要求フラ
グ302を順次確認する(ステップ547)。
随する要求フラグ302がセットされていれば性能デー
タを含むメッセージを入出力バッファ304からその一
つの入出力バッファ301にメモリコピーし、出力制御
ルーチン307を起動する。出力制御ルーチン307は
sendシステムコールを発行して入出力バッファに格
納された上記メッセージをその入出力バッファ301に
接続された表示プロセスへ転送し、その入出力バッファ
301に付随する要求フラグ302をクリアする(ステ
ップ549)。この処理を全ての接続されている表示プ
ロセス16に対して設けられている全ての要求フラグ3
02について繰り返すことにより、受信プロセス15は
全ての表示プロセス16に対して性能データを分配す
る。蓄積プロセスが入出力バッファ301に接続されて
いる場合も全く同様である。このように複数の表示プロ
セス16に対して性能データを分配する処理を、モニタ
用計算機11上にある受信プロセス15が行うため、起
動された表示プロセス16の数が増えた場合でも並列計
算機1上にある採取プロセス4や収集プロセス3にはそ
の影響はなく、監視対象の並列計算機の負荷が増加しな
い。
受けた表示プロセス16は、受信した全てのデータのう
ち表示に必要な項目別性能データを参照して表示画面を
作成し、入出力装置12に描画する(ステップ56
6)。表示に必要なデータとは、図7のウィンドウを持
つ表示プロセスの場合には、CPU利用率、メモリ利用
率、通信回数という、その表示プロセスで定められた3
つの項目別性能データであり、図8のウィンドウを持つ
表示プロセスの場合には、その表示プロセスに対して利
用者が指示した一つの項目別性能データである。
566までの表示動作を繰り返すことによって、次々に
送られてくる性能データを表示していく。すなわち、表
示プロセス16の制御ルーチン403は、データ転送要
求を受信プロセス15に送信する(ステップ564)。
そのときの具体的な動作は後に説明するとおりである。
制御ルーチン403は、その後、利用者のウィンドウ操
作あるいは受信プロセスからの性能データを含むメッセ
ージの到着のいずれかを検出するための待ち状態にな
る。性能データを含むメッセージが到着すると、制御ル
ーチン403はreceiveシステムコールを発行し
てメッセージを送受信バッファ404に読み込む(ステ
ップ565)、処理を入力解析ルーチン401に移す。
入力解析ルーチン401は、受信プロセス15から送ら
れたメッセージの識別子が、性能データを含むメッセー
ジの識別子であることを確認する。次いで描画処理ルー
チン402を起動し、描画処理ルーチン402は、ウィ
ンドウ上のグラフの高さを性能データに応じて変化させ
る(ステップ566)。描画が終了すると処理は制御ル
ーチン403に戻り、制御ルーチン403は、次の時間
ステップの性能データに対するデータ転送要求メッセー
ジを送受信バッファ404に作成し、sendシステム
コールを発行してこのメッセージを受信プロセス15に
送信する(ステップ564)。送信後、制御ルーチン4
03は再び上記待ち状態に戻る。
する性能データの描画の後に送信している性能データ転
送要求メッセージの送信を中止することにより実現され
る。使用者が表示ウインド610内のボタン605を操
作すると、制御ルーチン403は上記待ち状態から抜け
て入力解析ルーチン401に制御を移す。入力解析ルー
チン401がその要求を解析し、押されたボタンが停止
ボタン650であることを制御ルーチン403に伝え
る。制御ルーチン403は、この状態が検出されると、
その後、受信プロセス15に対して性能データ転送要求
メッセージの送信を行わない。データ転送要求が行われ
ない表示プロセス16は対応する要求フラグ302をセ
ットしない。したがって、受信プロセス15はそのよう
な表示プロセス16には性能データを送信しない。した
がって、その表示プロセス16の表示は停止する。
ンド610のメニュー操作により実行される。停止処理
の場合と同様に、終了処理の場合も利用者のウィンドウ
操作を制御ルーチン403が検出して上記待ち状態から
抜け、入力解析ルーチン401に処理を移す。入力解析
ルーチン401はメニューから停止が選ばれたことを検
出し、制御ルーチン403に伝える。制御ルーチン40
3は送受信バッファ404に終了通知メッセージを形成
し、sendシステムコールによりこれを受信プロセス
15に送出する(ステップ567)。
15は、その表示プロセス16との接続状態を解消し、
割り当てていた入出力バッファならびに要求フラグを解
放する(ステップ550)。接続が解消されたら、表示
プロセス16は終了処理(ステップ568)を行ったう
えで終了する(ステップ569)。全ての表示プロセス
16との接続が解消されたら、システム管理者は、受信
プロセス15の終了処理を開始することが可能となる。
受信プロセス15の終了処理を開始するには、受信プロ
セス15が起動されている計算機11を制御するOSが
提供する割り込み機能を利用して受信プロセス15に対
して割り込み信号を入力する。割り込み信号を受け取っ
た受信プロセス15は収集プロセス3に対して終了要求
を発行する(ステップ551)。終了要求を受けた収集
プロセス3は、全ての採取プロセス4に対して終了要求
を発行し(ステップ528)、それを受けた採取プロセ
ス4は終了処理を行う(ステップ505)。全ての採取
プロセス4に対する接続が解消されたら、収集プロセス
3は受信プロセス15との接続を解消する。その後、収
集プロセス3および受信プロセス15は、各々独立に終
了処理を行い、本モニタリングシステム内の全てのプロ
セスが終了する(ステップ529,552)。
性能データを蓄積し、その蓄積したデータを表示プロセ
ス16で表示する方法について説明する。図5に示す蓄
積プロセス17は、表示プロセス16と同様に、使用者
によって起動される。蓄積プロセス17が起動される
と、接続処理ルーチン455が受信プロセス15へ接続
要求を発行し、表示プロセス16が実行したのと同様の
手順で受信プロセス15と接続し、その蓄積プロセス1
7の動作を使用者に制御させるための制御ウィンドウ
(図示せず)を表示する。制御ウィンドウは、表示プロ
セス16の表示ウィンドウ、たとえば610(図7)と
同様であるが、表示エリア620はなく、制御エリア6
30のみで構成される。制御エリア630で使用者が制
御できるのは、蓄積するデータ項目の選択、蓄積するフ
ァイル名の指定、蓄積の開始ならびに終了である。制御
エリア上の操作で蓄積するデータ項目ならびに蓄積する
ファイル名を設定した後、データ蓄積開始の操作を行う
と、蓄積プロセス17は表示プロセス16と同様に性能
データの受信を行う。入力解析ルーチン451は、受信
プロセス15から送られたメッセージの識別子が、性能
データを含むメッセージの識別子であることを確認す
る。この性能データは送受信バッファ452に格納さ
れ、その後、この性能データは、データ整形ルーチン4
53で蓄積用のデータ形式に整形され、出力ルーチン4
54によって磁気ディスク記憶装置などの記憶装置13
へ蓄積される。
(d)に示すように、まず最初に並列計算機のノード総
数、前述した各ノードの属性、データを採取したノード
一覧などといった並列計算機の構成定義情報を格納す
る。その情報の後に、複数のブロックが記憶される。各
ブロックは、複数のノードの一つと、複数の時間ステッ
プの一つに対応する。各ブロックは、複数のデータレコ
ードからなり、各データレコードは、同じ時間ステップ
に同じノードから取得された、異なる測定項目に対する
性能データを含む。ブロックの最初と最後には、それぞ
れ図9(a)のヘッダレコード1001および図9
(b)のブロック終了レコード1003が置かれ、ブロ
ックの境界を示す。ヘッダレコードには、ブロック全体
の長さを示すブロック長やそのブロックに属する複数の
データレコードを生成したノードの番号およびそれらの
データレコードに含まれる性能データが取得された時間
ステップを表す時刻情報等が含まれている。さらに、全
てのレコードの先頭にはレコードの種類を示すタイプコ
ードおよびそのレコードの長さを示すレコード長があ
る。ブロックの並ぶ順は、まず、特定のノードと特定の
時間ステップに対応する一つのブロックが記憶され、次
に同じ時間ステップに対する他のノードに対する他の複
数のノードが記憶される。同じ時間ステップに対する全
てのノードに対する複数のブロックが蓄積された後に、
後続の複数の時間ステップに対する複数のブロックが並
ぶ。
積されたデータは、いずれかの表示プロセス16で表示
することが可能となる。この表示に使用する表示プロセ
スは、すでに起動され、図7または図8に示す表示ウイ
ンドウに性能データを表示している表示プロセスでもよ
く、まだ起動されていない表示プロセスを使用してもよ
い。以下では、すでに起動され、性能データの表示に使
用されている表示プロセスを使用する場合について説明
する。
6が蓄積データを読み込んで表示を行う手順を示したも
のである。まず、利用者が事前に入出力装置12から表
示をする蓄積データが格納されたファイル名を入力する
(ブロック1101)。その後、利用者が表示プロセス
16に対して蓄積データ表示モードへの切り替えの要求
を入力すると、表示プロセス16は蓄積データ表示モー
ドへ切り替える(ステップ1102)。この時、表示プ
ロセス16は、受信プロセスへのデータ転送要求の送信
を停止し、入力先切替ルーチン405(図5)がデータ
入力先を受信プロセス15から記憶装置13上の指定し
たファイルへ切り替える。
ンすると(ステップ1104)、表示プロセス16はフ
ァイルの先頭にある並列計算機の構成定義情報を読み込
む(ステップ1105)。この時、それまで使用してい
た構成定義情報をバッファ(図示せず)へ退避し、ファ
イルから読み込んだ構成定義情報をもとにグラフのレイ
アウト等を計算し直し、そのグラフを表示画面に表示す
る。次に、ファイルを最後まで読んでブロック数を数
え、先に読み込んだ構成定義情報のノード数でこのブロ
ック数を割ることにより、蓄積されている複数のブロッ
クが測定された時間ステップ数を計算する(ステップ1
106)。そして、蓄積データ表示機能の制御画面を表
示する(ステップ1107)。
名表示欄902には、現在読み込みを行っているファイ
ル名が表示され、データ数表示欄903には処理ブロッ
ク1106で計算した蓄積データの時間ステップ数が表
示される。表示範囲入力欄904,905,906に
は、それぞれ表示する時間ステップ範囲の最初、最後お
よび何時間ステップおきにデータを表示するかという読
み飛ばす時間ステップ数を入力する。スライダ907
は、現在何番目の時間ステップのデータを表示している
かを示すもので、この位置を動かすことによって、表示
データを変更することが可能である。ボタン908,9
09,910,911は、それぞれ一つ前の時間ステッ
プへのコマ送り、連続表示の停止、連続表示の開始、一
つ先の時間ステップへのコマ送りを指定するためのボタ
ンである。
901により、利用者が表示時刻、すなわち表示すべき
データの時間ステップを指定すると、表示プロセス16
はファイルの内容を読み込んで、該当する時間ステップ
のデータを検索する(ステップ1110)。そして、そ
のデータを表示装置へ描画する(ステップ1111)。
また、ステップ1109で、制御画面901のボタン9
10を押して連続表示を開始させると、表示範囲入力欄
905で指定された表示範囲の最後の時間ステップに到
達するか、表示ボタン909により連続表示の停止が指
定されるまで(ステップ1112)、現在読み込んでい
るデータの次から1時間ステップ分のデータを読み込み
(ステップ1113)、表示することを繰り返す(ステ
ップ1114)。表示を繰り返す時間間隔は、ファイル
に蓄積しているヘッダレコード1001内の時刻情報か
ら算出する方法や、あらかじめ指定する方法などが考え
られるが、いずれにしても図5における表示プロセス1
6内のクロック生成ルーチン407によって時刻を計測
し、指定時間が経過したら描画処理を行う。
機能の終了が利用者により指示されると(ステップ11
08)、終了処理を実行し、それにより、入力先切替ル
ーチン405が受信プロセスへと入力先を切り替え、こ
の表示プロセス16は、通常のデータ表示モードへ戻る
(ステップ1115)。この時、表示プロセス16はフ
ァイルから読み込まれた構成定義情報を破棄し、バッフ
ァへ退避させておいた以前の構成定義情報を復活させ、
表示エリア上のグラフを蓄積データ表示モードに切り替
える以前のリアルタイム表示の状態に戻す。これによ
り、蓄積プロセス17と表示プロセス16を起動してお
くことにより、現在のデータをリアルタイムで表示して
いる最中に、過去のデータを表示し直すことが可能にな
る。また、事前に蓄積しておいたデータを用いて、並列
計算機の稼働状況を事後解析することも可能となる。な
お、蓄積プロセス17はそれぞれのモニタ用の計算機1
1上に並行して起動し、それぞれの蓄積プロセスにより
それぞれが起動された計算機に含まれた記憶装置13に
性能データを並行して蓄積することができる。
15から見ると表示プロセス16と特に区別されるもの
ではないため、1つの受信プロセス15に対して複数の
表示プロセス16が起動可能であるということは、複数
の蓄積プロセス17の起動が可能であることを意味す
る。したがって、複数の使用者がそれぞれ互いに異なる
蓄積プロセス17を同時に起動することによりデータ蓄
積機能を同時に利用することが可能となり、しかもそれ
らの蓄積プロセスの起動により並列計算機の負荷が増大
することはない。
施の形態で使用した並列計算機とは異なるものにも適用
可能である。上記実施の形態では、並列計算機の内の特
定のノードのみが外部ネットワークに接続されていた。
しかし、すでに開発されている並列計算機の中には、複
数の特定のノードがこの外部ネットワークに接続されて
いるものもある。そのような並列計算機においては、そ
れらの特定のノードの各々に、収集プロセスを配置し、
並列計算機内に性能データの収集および受信プロセスへ
の転送をそれらの複数の収集プロセスにより分割して実
行させることができる。
に起動された収集プロセスとの間の通信を使用して、そ
の収集プロセスがその特定のノードを含む一部の複数の
ノードの性能データの収集を指示し、それらのノードが
採取した性能データをその収集プロセスが収集し、上記
受信プロセスに転送する。このことを各特定のノードに
起動された収集プロセスが行う互いに並行に行う。こう
することにより、先の実施の形態における、全てのノー
ドが採取した複数の性能データを収集する特定の一つの
ノードの負荷よりは、この実施の形態2における各特定
のノードの負荷が減少する。このような並列計算機にお
いても、複数のユーザが、この並列計算機に性能データ
をモニタしようとする場合でも、並列計算機の負荷が増
大することはない。
いる他の並列計算機では、それぞれが複数のノードを含
むような複数のパーティションに分割されている。この
場合には、各パーティションごとに、その中の複数のノ
ードによりいずれかの一つジョブを並列に実行させるこ
とができる。もちろん各パーティションで複数のジョブ
を実行させることも可能である。しかし、一人の利用者
が一つのパーティションを占有して使用するのに適して
いる。このような計算機システムではそれぞれのパーテ
ィションごとに稼動状況をモニタリングすることが有効
である。
のパーティション1、パーティション2(100A,1
00B)に分割されている。各パーティションに含まれ
た複数のノードの内、予め定められた一つのノードが外
部ネットワーク21に接続されている。この場合、採取
プロセス4を各ノード上で起動し、かつ収集プロセス3
を各パーティションの、外部ネットワーク21に接続さ
れた特定のノード2上に起動する。パーティション1の
性能データを監視するために、第1の受信プロセス15
Aを第1のモニタ用計算機11上に起動し、第1のパー
ティションの特定のノードに起動された、収集プロセス
3と交信させる。さらに表示プロセス16Aあるいは蓄
積プロセス17Aをそのモニタ用計算機上11に起動
し、上記第1の受信プロセスと15Aに接続する。実施
の形態1の場合と同様にして、表示プロセス16Aある
いは蓄積プロセス17Aはこの受信プロセス15Aから
パーティション1の性能データの分配を受ける。さらに
他の図示しない表示プロセスあるいは蓄積プロセスを他
の図示しない計算機に起動された場合、その表示プロセ
スあるいは蓄積プロセスもこの第1の受信プロセスを介
して性能データの分配を受ける。
も第2の受信プロセス15B、表示プロセス16Bある
いは蓄積プロセス17Bあるいはさらに他の図示しない
表示プロセスあるいは蓄積プロセスを起動する。この実
施の形態においては、各パーティションごとに性能デー
タを他のパーティションとは独立に採取することができ
る。さらに、同じパーティションの性能データをモニタ
する表示プロセスと蓄積プロセスの両方が同じモニタ用
の計算機に上に起動された場合にもあるいは同じパーテ
ィションの性能データをモニタする複数の表示プロセス
を異なるモニタ用のp計算機上に起動した場合にも、並
列計算機の負荷は増えない。
も極端な場合は、並列計算機の全てのノードが外部ネッ
トワークに接続されている場合である。この場合には、
各ノードに上記採取プロセスと収集プロセスの機能を兼
ねたプロセスを起動し、上記受信プロセスが、各ノード
のこのプロセスと交信してそのノードの性能データを受
信させればよい。この場合には、各ノードに性能データ
の採取のための同じプロセスが起動されるので、実施の
形態1に比べて、異なるノード間で性能モニタのための
負荷の偏りが少ない。
ットワークで結合された複数の計算機からなる分散型の
計算機システムに対しても同様に適用が可能である。こ
の場合には、この分散型のシステムに属する複数の計算
機の各々に、採取プロセスを配置し、それらの計算機の
内の一つ、たとえば、ネットワークを管理する計算機に
収集プロセスを配し、さらに、それらの計算機の内の、
監視対象となる複数の計算機のうちの一つに受信プロセ
スを配し、それらの監視対象となる複数の計算機の一部
あるいはそれらの監視対象となる複数の計算機とは異な
るいずれか一つの計算機に表示プロセスあるいは蓄積プ
ロセスを配置すればよい。なお、受信プロセスを監視対
象となる複数の計算機とは異なるものに起動することも
可能である。この結果、各採取プロセスと上記収集プロ
セスの間の通信あるいは収集プロセスと受信プロセスの
間の通信は外部ネットワークを介して行われる点で、実
施の形態1と異なる。しかし、複数の表示プロセスある
いは蓄積プロセスにこの受信プロセスから性能データを
分配できることは実施の形態1と同じである。
態に限定されるものではなく、以下に例示する複数の変
形例を含めいろいろの変形例を含むものである。 (1)並列計算機内部の高速通信手順の利用 実施の形態では、並列計算機内部の通信、すなわち採取
プロセス4と収集プロセス3との間の性能データの受け
渡しにTCP/IPによる通信を用いるとして説明を行
った。しかし、並列計算機によっては、内部ネットワー
クが複数のデータを異なるパスを経由して並列に転送可
能なものを使用するものが多い。そのような内部ネット
ワークを介したノード間の通信には、TCP/IPより
も軽量、高速な内部通信手順を利用しているものも多
い。そのような計算機においては、上記実施の形態1,
2,3のごとく、その計算機内の一つもしくは一部の複
数のノードに起動された収集プロセスに他のノードで採
取された性能データを転送する方法を採用した場合に
は、そのノード間通信には、並列計算機固有の高速内部
通信プロトコルを使用することが性能データの転送の高
速化の点で有効である。
は、入力解析ルーチン205ならびに出力制御ルーチン
206に代えて、内部通信に対応した入力解析ルーチン
および出力制御ルーチンの組、ならびに外部通信に対応
した入力解析ルーチンと出力制御ルーチンの組とがが用
意され、内部通信と外部通信のいずれを行うかにより、
これらの組の一方が使用される。入出力バッファ201
は前者により使用され、入出力バッファ203は後者に
より使用される。例えば、採取プロセス4から高速内部
通信手順によって入出力バッファ201に送られてきた
データは、採取プロセス4用の、高速内部通信に対応し
た入力解析ルーチンによって受信され、一度、内部処理
ルーチン207へ渡される。内部処理ルーチン207は
受信プロセス15と通信するための、外部ネットワーク
通信に対応した出力制御ルーチン206を呼び出し、デ
ータを引き渡す。その出力制御ルーチン206はTCP
/IPなどの、モニタ用計算機11と通信が可能なプロ
トコルによって受信プロセス15へデータを送信する。
本変形により、並列計算機の全てのノードがTCP/I
Pなどといった比較的負荷の重い通信プロトコルを使用
する場合より、並列計算機1にかかる、モニタリングに
よる負荷を減らすことが可能となる。
指定 実施の形態1では、採取プロセスが採取する項目別性能
データは予め決まっていたが、受信プロセスからこれら
の項目を指定させてもよい。このためには、システム管
理者が受信プロセスを起動するときに、その受信プロセ
スを起動する計算機11にこれらのデータを指定する情
報を入力させればよい。
データの選択 上記実施の形態1では、採取プロセスにて採取された複
数の項目別性能データ(例えばCPU利用率、メモリ利
用率、磁気ディスク記憶装置アクセス回数、通信回数)
が、収集プロセス3、受信プロセス15を経由してつね
に表示プロセス16にまで転送された。これに対し、受
信プロセス15にて表示に必要な項目のみを選択して表
示プロセス16に転送させると、転送されるデータ量を
低減できる。これを実現するためには、表示プロセス1
6が利用者によって起動され、受信プロセス15に対し
て接続が確立した(ステップ562(図6(b)))直
後に、表示プロセス16から受信プロセス15に対して
表示すべき性能データの通知を行う。受信プロセス15
はどの表示プロセスがどの項目別性能データを必要とす
るかを記憶する。受信プロセス15において内部処理ル
ーチン308が性能データを入出力バッファ304か
ら、いずれかの表示プロセスに接続された入出力バッフ
ァ301へメモリコピーする際に、受信した性能データ
全体をコピーするのではなく、必要と記憶された項目別
性能データのみを選択してコピーする。
起動とは独立に、性能データの収集を受信プロセスから
収集プロセスに要求した。しかし、いずれかの表示プロ
セスまたは蓄積プロセスが起動されてから、この要求を
発行するように受信プロセスを構成することもできる。
その際、利用者が要求する項目別性能データを表示プロ
セスあるいは蓄積プロセスから受信プロセスに通知さ
せ、受信プロセスにより起動されたそれらのプロセスが
通知した項目別性能データを採取することを監視対象の
計算機に要求させることもできる。この方法を採ると、
新たに表示プロセスあるいは蓄積プロセスが起動された
場合に、その新たに起動されたプロセスが要求する項目
別性能データが追加して採取されるように、受信プロセ
スが採取を要求する項目別性能データを更新することが
望ましい。こうすることにより、必要最小限の項目別性
能データのみを採取することになるので、採取する性能
データの量が少なくなる。
データの一括転送 実施の形態1は、データを採取する時間ステップ毎に採
取プロセス4から表示プロセス16までデータを送信す
るものであったが、変形例として採取プロセス4におい
て複数の時間ステップの性能データを蓄積しておき、そ
れらをまとめて1回のデータ送信で送り出す方式が考え
られる。以下その変形例について説明する。図2におい
て、採取プロセス4の出力制御ルーチン103は、カウ
ンタ制御/読み出しルーチン104からデータを受け取
ると、入出力バッファ101中のその時点での最後尾へ
格納し、入出力バッファ101へ格納したレコード数を
記憶しておく。入出力バッファ101内のレコード数が
所定値に達したら、出力制御ルーチン103はそれまで
格納したデータをまとめて一つのデータとして収集プロ
セス3へ送信する。収集プロセス3ならびに受信プロセ
ス15については、前述の実施の形態1と同様の動作を
する。このデータを最終的に受信した表示プロセス16
は、図5において、内部のクロック407を参照して、
一定時間毎に送受信バッファ404内のデータから一時
刻分のデータを読み出し、表示を行う。送受信バッファ
404内のデータを全て処理し終えたら、表示プロセス
16は受信プロセス15へデータ要求を送信する。な
お、蓄積プロセス17に関しては、動作に変更はなく、
前述の実施の形態1の通りデータを蓄積する。これによ
り、採取したデータの転送回数を少なくすることが可能
となり、通信負荷を減少することが可能となる。
採取された性能データを利用するモニタ用のプロセス
(表示プロセスあるいは蓄積プロセス)の数が増大して
も、監視対象の計算機自体の負荷はほとんど増加するこ
とがない。
テムの全体構成図。
採取プロセスのモジュール関連図。
収集プロセスのモジュール関連図。
受信プロセスのモジュール関連図。
表示プロセス/蓄積プロセスのモジュール関連図。
算機性能モニタリング方法の処理手順の一部を示すフロ
ーチャート。(b)は、図1のシステムで採用される並
列計算機性能モニタリング方法の処理手順の他の一部を
示すフローチャート。
ブロックのヘッダレコードの形式の例を示す図。(b)
は、蓄積プロセスが記憶装置へ蓄積するブロックの通常
のデータレコードの形式の例を示す図。(c)は、蓄積
プロセスが記憶装置へ蓄積するブロックのブロック終了
レコードの形式の例を示す図。(d)は、蓄積プロセス
が記憶装置へ蓄積するファイルの形式の例を示す図。
ローチャート。
ための制御画面の一例を示す図。
る並列計算機の全体構成図。
る他の並列計算機の全体構成図。
ニタリング方法の処理手順を示すフローチャート。
Claims (26)
- 【請求項1】監視対象の計算機システムを含む複数の計
算機と、それらを接続するための計算機接続ネットワー
クとを有する計算機ネットワークにおいて、 上記監視対象の計算機システムによりその計算機システ
ムの性能データを複数のタイミングで繰り返し採取する
ごとに、上記監視対象の計算機システムが採取した性能
データを、上記複数の計算機の内の、上記監視対象の計
算機システム以外の一つの計算機上に起動された受信プ
ロセスにより、上記監視対象の計算機システムから上記
計算機接続ネットワークを介して受信し、 上記複数の計算機の内の、上記一つの計算機と等しいか
または異なる、上記監視対象の計算機システム以外の複
数の計算機上に起動された、性能データを利用するため
の複数の利用プロセスの各々に、上記受信した性能デー
タを上記受信プロセスにより転送するステップを有する
計算機性能モニタリング方法。 - 【請求項2】上記複数の利用プロセスは、それらの利用
プロセスが起動されている上記複数の計算機に接続され
た表示装置に性能データを表示するための複数の表示プ
ロセスを有する請求項1記載の計算機性能モニタリング
方法。 - 【請求項3】上記性能データは、複数の項目別の性能デ
ータを含み、 上記方法は、各表示プロセスに分配された性能データに
含まれた複数の項目別性能データの内の一部の項目別性
能データを、その表示プロセスが起動されている計算機
に接続された表示装置に、その表示プロセスにより表示
するステップをさらに有する請求項2記載の計算機性能
モニタリング方法。 - 【請求項4】各表示プロセスから送出された、性能デー
タの転送要求を上記受信プロセスにより受信するステッ
プをさらに有し、 上記受信プロセスから各表示プロセスへの性能データの
上記転送するステップは、その表示プロセスから送出さ
れた上記転送要求に応答して実行される請求項3記載の
計算機性能モニタリング方法。 - 【請求項5】各表示プロセスへの性能データを転送する
ステップは、 上記受信プロセスが、性能データを上記監視対象の計算
機システムから受信するごとに、性能データの転送要求
をその受信プロセスにすでに送出した表示プロセスがあ
るか否かを判別し、 性能データの転送要求をすでに送出した一つの表示プロ
セスが検出されたときに、その受信した性能データをそ
の検出された表示プロセスに転送し、 性能データの転送要求をすでに送出した複数の表示プロ
セスが検出されたときに、その受信した性能データをそ
れらの検出された複数の表示プロセスの各々に転送する
ステップからなる請求項4記載の計算機性能モニタリン
グ方法。 - 【請求項6】上記複数の表示プロセスの一つにより表示
される一部の項目別性能データは、その表示プロセスの
利用者が選択した項目別性能データである請求項4記載
の計算機性能モニタリング方法。 - 【請求項7】上記複数の表示プロセスの一つにより表示
される一部の項目別性能データは、その表示プロセスに
対して予め定められた項目別性能データである請求項4
記載の計算機性能モニタリング方法。 - 【請求項8】上記複数の表示プロセスの一つにより表示
される一部の項目別性能データは、その表示プロセスの
利用者が選択した項目別性能データである請求項3記載
の計算機性能モニタリング方法。 - 【請求項9】上記複数の表示プロセスの一つにより表示
される一部の項目別性能データは、その表示プロセスに
対して予め定められた項目別性能データである請求項3
記載の計算機性能モニタリング方法。 - 【請求項10】各表示プロセスに性能データを転送する
ステップは、 一部の項目別性能データの転送を要求する、各表示プロ
セスから送出された転送要求を上記受信プロセスにより
受信し、 その転送要求の送出の後に性能データを上記監視対象の
計算機システムから上記受信プロセスが受信するごと
に、その受信された性能データに含まれた複数の項目別
性能データの内、上記転送要求により要求された上記一
部の項目別性能データをその受信プロセスにより選択
し、 選択された一部の項目別性能データをその表示プロセス
に上記受信プロセスにより転送するステップを有する請
求項2記載の計算機性能モニタリング方法。 - 【請求項11】上記受信プロセスから上記監視対象の計
算機システムに性能データの転送要求を送出するステッ
プをさらに有し、 上記受信するステップは、上記転送要求の送出後に、上
記監視対象の計算機システムにから送出される性能デー
タを受信するステップからなる請求項2記載の計算機性
能モニタリング方法。 - 【請求項12】上記性能データの転送要求を送出するス
テップは、上記複数の表示プロセスのいずれかが起動さ
れているか否かに依らないで実行される請求項11記載
の計算機性能モニタリング方法。 - 【請求項13】上記性能データの転送要求を送出するス
テップは、上記複数の表示プロセスのいずれかが起動さ
れた後に実行される請求項11記載の計算機性能モニタ
リング方法。 - 【請求項14】上記複数の表示プロセスのいずれかが起
動される前に、採取すべき複数の項目別性能データを上
記監視対象の計算機システムに上記受信プロセスより通
知するステップをさらに有する請求項2記載の計算機性
能モニタリング方法。 - 【請求項15】採取すべき複数の項目別性能データを決
定するための情報を操作者により上記受信プロセスが起
動された上記一つの計算機に入力するステップをさらに
有し、 上記通知するステップは、上記入力された情報に依存し
て実行される請求項14記載の計算機性能モニタリング
方法。 - 【請求項16】上記複数の表示プロセスの一つが最初に
起動されたときに、その受信プロセスが送出する、転送
すべき複数の項目別性能データを指定する転送要求を、
上記受信プロセスにより受信し、 その転送要求が指定する上記複数の項目別性能データの
採取を上記監視対象の計算機システムに上記受信プロセ
スより要求するステップをさらに有する請求項2記載の
計算機性能モニタリング方法。 - 【請求項17】上記受信するステップは、上記監視対象
の計算機システムが、それぞれ少なくとも一つのプロセ
ッサを含む複数のノードを含み、少なくとも一つのノー
ドが上記計算機接続ネットワークに接続されている場合
に、上記一つのノードから性能データを受信するステッ
プを有し、 ここで、各ノード上に起動された採取プロセスが、その
ノードの性能データを採取し、上記一つのノードの上に
起動された収集プロセスが該複数のノードのそれぞれに
起動された採取プロセスが採取した性能データを収集す
るように、上記監視対象の計算機システムがプログラム
されている請求項1記載の計算機性能モニタリング方
法。 - 【請求項18】上記監視対象の計算機システムは、上記
複数のノードを接続するための、上記計算機接続ネット
ワークと異なる内部ネットワークをさらに有し、 上記収集プロセスから、各ノード上に起動された上記採
取プロセスから、そのノードで採取した性能データの上
記収集プロセスへの転送は、上記内部ネットワークを介
して行われる請求項17記載の計算機性能モニタリング
方法。 - 【請求項19】上記各ノードの上記採取プロセスから、
そのノードで採取した性能データを上記収集プロセスへ
転送することは、上記内部ネットワークを介して、か
つ、その監視対象の計算機システム用に定められた内部
通信手順に従って行われ、 上記内部通信手順は、上記複数の計算機を相互に接続す
る上記計算機接続ネットワーク用に定められた通信手順
とは異なる請求項18記載の計算機性能モニタリング方
法。 - 【請求項20】上記受信するステップは、上記複数のノ
ードがそれぞれ複数のノードを含む複数のパーティショ
ンに区分され、各パーティションに含まれた複数のノー
ドの内の少なくとも一つが上記計算機接続ネットワーク
に接続されている場合に、上記複数のパーティションの
一つに含まれた一つのノードから、その一つのパーティ
ションに含まれた複数のノードの性能データをまとめて
受信するステップからなり、 ここで、各パーティションに属する複数のノードの各々
上に起動された採取プロセスが、そのノードの性能デー
タを採取し、各パーティションの上記一つのノードの上
に起動された収集プロセスが、そのパーティションに属
する該複数のノードのそれぞれに起動された採取プロセ
スが採取した性能データを収集するように、上記監視対
象の計算機システムがプログラムされている請求項17
記載の計算機性能モニタリング方法。 - 【請求項21】上記複数のパーティションの他の一つの
性能データを受信するための他の受信プロセスを、上記
複数の計算機の内のいずれか一つに起動し、 上記他のパーティションの性能データを表示するための
他の複数の表示プロセスの各々を上記複数の計算機の内
の一つに起動し、 上記他のパーティションの性能データを上記他の受信プ
ロセスにより受信し、 上記他のパーティションの上記性能データを、上記他の
受信プロセスにより、上記複数の他の表示プロセスの各
々に転送するステップをさらに有する請求項20記載の
計算機性能モニタリング方法。 - 【請求項22】上記受信するステップは、上記監視対象
の計算機システムが、上記計算機接続ネットワークで接
続された上記複数の計算機から選択された複数の計算機
からなる分散計算機システムであり、上記複数のノード
の各々は、上記複数の選択された計算機の一つを含む場
合に、上記複数の選択された計算機の一つから、上記複
数の選択された計算機のそれぞれに対する複数の性能デ
ータをまとめて受信するステップからなり、 上記分散計算機システムは、上記採取プロセスが、上記
選択された複数の計算機の各々上に起動され、上記収集
プロセスが、上記複数の選択された計算機の内の上記一
つの計算機上に起動され、上記収集プロセスが、上記複
数の選択された計算機の上に起動された上記採取プロセ
スが採取したその計算機の性能データを収集するように
プログラムされている請求項1記載の計算機性能モニタ
リング方法。 - 【請求項23】上記受信ステップは、上記監視対象の計
算機システムは複数のノードを含む計算機システムであ
り、各ノードが上記計算機接続ネットワークに接続され
ている場合に、上記受信するステップは、各ノードから
そのノードの性能データを受信するステップを有し、 上記監視対象の計算機システムが、各ノード上に起動さ
れた採取プロセスが、そのノードの性能データを採取す
るようにプログラムされている請求項1記載の計算機性
能モニタリング方法。 - 【請求項24】上記監視対象の計算機システムは、相互
に接続された複数のプロセッサを含み、上記複数のプロ
セッサの少なくとも一つが上記計算機接続ネットワーク
に接続されている場合に、上記受信するステップは、上
記複数のプロセッサのそれぞれの性能データをまとめ
て、それらのプロセッサの内の上記一つから受信するス
テップを有し、 上記複数のプロセッサの各々上に起動された採取プロセ
スにより、そのプロセッサの性能データを採取し、上記
各プロセッサの上記採取プロセスが採取した性能データ
を、上記一つのプロセッサ上に起動された収集プロセス
により収集するように、上記計算機システムがプログラ
ムされている請求項1記載の計算機性能モニタリング方
法。 - 【請求項25】上記複数の利用プロセスは、それらの利
用プロセスが起動されている上記複数の計算機に接続さ
れた記憶装置に性能データを記憶するための複数の蓄積
プロセスを有する請求項1記載の計算機性能モニタリン
グ方法。 - 【請求項26】監視対象の計算機システムを計算機接続
ネットワークを介して監視するための計算機モニタリン
グシステムであって、 上記計算機接続ネットワークに接続された一つの計算機
と、 該一つの計算機上で起動された受信プロセスとを有し、 上記受信プロセスは、上記監視対象の計算機システムに
よりその計算機システムの性能データを異なるタイミン
グで繰り返し採取するごとに、採取された性能データを
上記監視対象の計算機システムから受信し、受信した性
能データを性能データを表示するための第1,第2の表
示プロセスの各々に転送するようにプログラムされ、 上記第1の表示プロセスは、上記一つの計算機と等しい
かまたは異なる、上記計算機接続ネットワークに接続さ
れた第1の計算機上に起動され、 上記第2の表示プロセスは、上記第1の計算機と異な
る、上記計算機接続ネットワークに接続された第2の計
算機上に起動されているもの。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP02995197A JP3881739B2 (ja) | 1996-02-14 | 1997-02-14 | 計算機システムの性能モニタリング方法およびシステム |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2643796 | 1996-02-14 | ||
| JP8-26437 | 1996-02-14 | ||
| JP02995197A JP3881739B2 (ja) | 1996-02-14 | 1997-02-14 | 計算機システムの性能モニタリング方法およびシステム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH09330302A true JPH09330302A (ja) | 1997-12-22 |
| JP3881739B2 JP3881739B2 (ja) | 2007-02-14 |
Family
ID=26364224
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP02995197A Expired - Fee Related JP3881739B2 (ja) | 1996-02-14 | 1997-02-14 | 計算機システムの性能モニタリング方法およびシステム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3881739B2 (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000267891A (ja) * | 1999-03-16 | 2000-09-29 | Internatl Business Mach Corp <Ibm> | ディジタル・コンピュータ内の処理の実行を監視するための装置および方法 |
| JP2008084009A (ja) * | 2006-09-27 | 2008-04-10 | Toshiba Corp | マルチプロセッサシステム |
| JP2008527514A (ja) * | 2005-01-06 | 2008-07-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | グリッド・アクティビティのモニタリングおよび振り分けによる総合的グリッド環境管理を促進する方法、システム、およびコンピュータ・プログラム |
| JP2009157944A (ja) * | 2009-04-02 | 2009-07-16 | Nippon Telegr & Teleph Corp <Ntt> | 監視制御システム |
| JP2013045399A (ja) * | 2011-08-26 | 2013-03-04 | Takazono Technology Inc | 調剤システムおよび調剤装置 |
| JP2017076440A (ja) * | 2017-01-18 | 2017-04-20 | 株式会社タカゾノテクノロジー | 調剤システム、ホストコンピュータおよび調剤装置 |
-
1997
- 1997-02-14 JP JP02995197A patent/JP3881739B2/ja not_active Expired - Fee Related
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000267891A (ja) * | 1999-03-16 | 2000-09-29 | Internatl Business Mach Corp <Ibm> | ディジタル・コンピュータ内の処理の実行を監視するための装置および方法 |
| JP2008527514A (ja) * | 2005-01-06 | 2008-07-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | グリッド・アクティビティのモニタリングおよび振り分けによる総合的グリッド環境管理を促進する方法、システム、およびコンピュータ・プログラム |
| JP2008084009A (ja) * | 2006-09-27 | 2008-04-10 | Toshiba Corp | マルチプロセッサシステム |
| JP2009157944A (ja) * | 2009-04-02 | 2009-07-16 | Nippon Telegr & Teleph Corp <Ntt> | 監視制御システム |
| JP2013045399A (ja) * | 2011-08-26 | 2013-03-04 | Takazono Technology Inc | 調剤システムおよび調剤装置 |
| JP2017076440A (ja) * | 2017-01-18 | 2017-04-20 | 株式会社タカゾノテクノロジー | 調剤システム、ホストコンピュータおよび調剤装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3881739B2 (ja) | 2007-02-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5961596A (en) | Method of monitoring a computer system, featuring performance data distribution to plural monitoring processes | |
| US6078955A (en) | Method for controlling a computer system including a plurality of computers and a network processed as a user resource | |
| US6629124B1 (en) | Multimedia data transferring method | |
| US5774656A (en) | Information processing system and method and service supplying method for use within a network | |
| US5146561A (en) | Communication network data manager system | |
| US7075568B2 (en) | Digital camera, system, and method for capturing and storing an image, and using an event signal to indicate a change in the content stored in a memory | |
| US5802303A (en) | Monitor data collecting method for parallel computer system | |
| EP0280020A2 (en) | Operator access to monitoring applications | |
| JPH05197568A (ja) | コンピュータ・システムおよびイベント管理方法 | |
| JPH1185662A (ja) | 通信制御方法及び装置及び通信システム | |
| JP3327306B2 (ja) | シスプレックスおよびデータを報告する方法 | |
| JPH09330302A (ja) | 計算機システムの性能モニタリング方法およびシステム | |
| US5734918A (en) | Computer system with an input/output processor which enables direct file transfers between a storage medium and a network | |
| JP3945521B2 (ja) | 分散処理システム及びその性能モニタリング方法 | |
| CN116962413A (zh) | 接口异常处理方法、终端设备及存储介质 | |
| JPH09160847A (ja) | クライアント・サーバ型分散処理システム | |
| JP3384911B2 (ja) | 複合計算機システムにおける状態監視システム | |
| JP2000322278A (ja) | プロセス実行制御方法 | |
| US6032176A (en) | Data-independent type computer system: processing machine, data machine and man-machine interface therein | |
| JPH04213126A (ja) | ソフトウェアテスト方式 | |
| JPH113230A (ja) | ジョブ情報問合せ・表示システム | |
| JPH09171468A (ja) | マルチメディアデータの転送方法及びその計算機システム | |
| JPH02118841A (ja) | 入力待ち行列管理方式 | |
| JPH04223547A (ja) | 分散処理装置 | |
| KR20010038970A (ko) | 콤팩 비에스씨 시스템의 기능 통합 장치 및 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040209 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20040209 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040209 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060622 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060711 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060908 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060908 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061017 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061113 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101117 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101117 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111117 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111117 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121117 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121117 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131117 Year of fee payment: 7 |
|
| LAPS | Cancellation because of no payment of annual fees |