JPH0497445A - Diagnostic system for information processor - Google Patents
Diagnostic system for information processorInfo
- Publication number
- JPH0497445A JPH0497445A JP2216078A JP21607890A JPH0497445A JP H0497445 A JPH0497445 A JP H0497445A JP 2216078 A JP2216078 A JP 2216078A JP 21607890 A JP21607890 A JP 21607890A JP H0497445 A JPH0497445 A JP H0497445A
- Authority
- JP
- Japan
- Prior art keywords
- test
- error log
- error
- information processing
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 claims description 19
- 238000002405 diagnostic procedure Methods 0.000 claims description 9
- 230000002950 deficient Effects 0.000 abstract 3
- 238000005070 sampling Methods 0.000 abstract 2
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000008439 repair process Effects 0.000 description 3
- 238000010998 test method Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、情報処理装置の診断方式に関し、特にパトロ
ールJOBと呼ばれる試験プログラムを用いた情報処理
装置の診断方式に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a method for diagnosing an information processing device, and particularly to a method for diagnosing an information processing device using a test program called Patrol JOB.
従来、パトロールJOBを用いた情報処理装置の診断に
おいて、比較エラーか検出されると、システムを停止後
エラーログの採取を行い、人手でエラーログ情報から故
障箇所の指摘をおこなっていた。Conventionally, when a comparison error is detected in diagnosing an information processing device using a patrol job, the system is stopped, an error log is collected, and a failure location is manually pointed out from the error log information.
上述したように従来の情報処理装置の診断方式では、人
手により故障箇所の指摘を行っていたため、エラーが発
生したことは検出されるが、故障箇所を指摘するまでに
時間を要し、修理が長引くという問題があった。As mentioned above, in the conventional diagnostic method for information processing equipment, the location of the failure was manually pointed out. Although it is possible to detect the occurrence of an error, it takes time to point out the location of the failure, making repairs difficult. The problem was that it lasted a long time.
本発明の目的は、障害発生時に、容易に故障箇所がわか
り短時間で修理に対応することができる情報処理装置の
診断方式を提供することにある。SUMMARY OF THE INVENTION An object of the present invention is to provide a diagnostic method for an information processing device that can easily identify the location of a failure and repair it in a short time when a failure occurs.
本発明の情報処理装置の診断方式は、OS実行中に試験
プログラムを実行して故障を検出する情報処理装置の診
断方式において、前記情報処理装置の最小限のハードウ
ェアで試験を行い順次試験範囲を広げていくスタートス
モール試験手段と、前記試験プログラムの各試験実行前
に該当の試験番号をソフトウェアビジブルレジスタに設
定する試験ID設・定手段と、前記試験で比較エラーを
検出したとき前記情報処理装置と診断パスを介して接続
されるサービスプロセッサに対してエラーログ採取要求
を出すログアウト要求手段とを前記情報処理装置に備え
、
前記ログアウト要求手段から要求があったときにエラー
ログをエラーログファイルに採取するエラーロギング手
段と、前記試験IDをもとに故障部品名を表示するエラ
ーロギング手段とを前記サービスプロセッサに備える精
成である。A diagnostic method for an information processing device according to the present invention is a diagnostic method for an information processing device in which a test program is executed while an OS is running to detect a failure, in which a test is performed using the minimum hardware of the information processing device and the test range is sequentially determined. a start small test means for expanding the test program; a test ID setting/setting means for setting a corresponding test number in a software visible register before executing each test of the test program; The information processing device includes logout request means for issuing an error log collection request to a service processor connected to the device via a diagnostic path, and when a request is received from the logout request means, the error log is converted into an error log file. This is a refinement in which the service processor is equipped with an error logging means for collecting data on the test ID, and an error logging means for displaying the name of the failed part based on the test ID.
次に本発明について図面を参照して詳細に説明する。 Next, the present invention will be explained in detail with reference to the drawings.
第1図は、本発明の一実施例を示す情報処理装置の診断
方式のシステム構成図であり、情報処理装置1と保守制
御を行うサービスプロセ・ソサ(SVP)3とか診断パ
ス2で接続されていることを示している。情報処理装置
1の主記憶部11には、スタートスモール試験手段11
11と試験ID設定手段1112とログアウト要求手段
IJ13とを含むパトロールJOB 111の試験プロ
グラムが格納されており、オペレーテインクソフトウェ
ア(O3)112の制御のもとて一定時間毎に起動され
、情報処理装置1の試験を行う。更に第1図は、5VP
3にエラーロギング手段311とエラーロギング手段3
12とを有することを示している。第2図はスタートス
モール実行による試験プログラムの各試験とハードウェ
アとの対応を示す図である。第3図はパトロールJOB
の試験方法の一例を示す流れ図である。第4図は保守診
断のD I AG命令の処理を示す図である。第5図は
エラーロギング手段311とエラーロギング手段312
とから成る保守プログラムの処理の一例を示す流れ図で
ある。第6図は部品の取替単位解析のためのFRU解析
テーブルの一例を示す図である。FIG. 1 is a system configuration diagram of a diagnostic method for an information processing device showing an embodiment of the present invention. It shows that The main storage unit 11 of the information processing device 1 includes a start small test means 11.
11, a test ID setting means 1112, and a logout requesting means IJ13. Perform test 1. Furthermore, Figure 1 shows 5VP
3, error logging means 311 and error logging means 3
12. FIG. 2 is a diagram showing the correspondence between each test of the test program by start small execution and the hardware. Figure 3 is a patrol job
2 is a flowchart showing an example of a test method. FIG. 4 is a diagram showing the processing of the DIAG command for maintenance diagnosis. FIG. 5 shows an error logging means 311 and an error logging means 312.
2 is a flowchart showing an example of processing of a maintenance program consisting of. FIG. 6 is a diagram showing an example of an FRU analysis table for analyzing parts replacement units.
次に第2図を用いて、試験プログラムの各試験と試験対
象ハードウェア(HW)との対応を説明する。試験プロ
グラムの各試験は、おのおの試験番号を持っており、実
行は試験番号の1番から順次行うものとする。試験番号
は、番号が増すにつれ、試験対象装置の試験対象ハード
ウェアが増えるように並んでいる。まず、第2図の試験
#1を実行すると、試験#1はハードウェアAの試験を
実行する。次に、試験#2を実行すると、試験#2はハ
ードウェアAとハードウェアBの試験を実行する。試験
#2が実行された時に比較エラーが検出されると、ハー
ドウェアB(斜線部の範囲)て比較エラーか検出された
ことがわかる。このように、スタートスモールに111
6次試験を実行することによって、故障箇所を指摘する
ことができる。Next, using FIG. 2, the correspondence between each test of the test program and the hardware (HW) to be tested will be explained. Each test in the test program has its own test number, and the tests are executed sequentially starting from test number 1. The test numbers are arranged in such a way that as the number increases, the number of pieces of hardware to be tested in the device under test increases. First, when test #1 in FIG. 2 is executed, test #1 executes a test of hardware A. Next, when test #2 is executed, test #2 tests hardware A and hardware B. If a comparison error is detected when test #2 is executed, it can be seen that a comparison error has been detected by hardware B (the shaded area). In this way, start small with 111
By executing the 6th test, it is possible to point out the location of the failure.
なお、パトロールJOBIIIは、○5112の立ち上
げ時に起動され、試験#1がら順次試験し、試験#5ま
て正常に実行したときは、1時間後に再度同一パトロー
ルJOB 111を起動する様に○5112に依頼する
。以後、1時間毎にパトロールJOB141が実行され
ることになる。In addition, Patrol JOB III is started when ○5112 is started up, tests are performed sequentially from test #1, and when test #5 is successfully executed, the same patrol JOB 111 is started again after 1 hour.○5112 request. From then on, patrol JOB 141 will be executed every hour.
次に、パトロールJOBI 11の試験方法を第3図の
フローに従って説明する。パトロールJOBIIIは、
○5112がら起動をがけられると、まず、試験番号#
1を意味する“°1゛°をSWビジプルレジスタ(VR
)12に格納しく処理61)、試験#1を実行する(処
理62)。試験#1は、期待値をもっており試験実行後
に、この期待値と実際値を比較しく処理63)、比較エ
ラーが検出されると、パトロールJOBI 11は、ロ
グアウト要求をおこなうDIAG命令を実行するく処理
66)。比較エラーが検出されない場合、パトロールJ
OBIIIはすべての試験を実行したか判断しく処理6
4)、まだ実行していない試験があれば処理61に戻り
次に実行する試験番号をVR12に格納する処理から繰
り返す。すべての試験を実行したときは03112に1
時間後に再度起動するように依頼する(処理65)。Next, a test method for Patrol JOBI 11 will be explained according to the flowchart shown in FIG. Patrol JOB III is
○When it is started from 5112, the test number # is displayed first.
The SW visible register (VR
) 12 (process 61) and execute test #1 (process 62). Test #1 has an expected value, and after the test is executed, the expected value and the actual value are compared (63). When a comparison error is detected, the Patrol JOBI 11 executes the DIAG command to request logout. 66). If no comparison error is detected, Patrol J
OBIII determines whether all tests have been performed or not.6
4) If there is a test that has not been executed yet, the process returns to step 61 and repeats the process of storing the next test number to be executed in the VR 12. 1 at 03112 when all tests are run
A request is made to restart the device after a certain period of time (process 65).
第4図は、DIAG命令のハードウェアの実行フローを
示している。パトロールJOB 111でDIAG命令
が実行されると、ハードウェアはエラー表示フリップフ
ロップ(EIF)13のビットに1をセットし、比較エ
ラーが起こったことを示す(処理71)。ハードウェア
は、EIFlBのビットに1がセットされるとクロック
を停止しく処理72)、診断パス2を通して5VPB上
の保守プログラム31を起動する(処理73)。FIG. 4 shows the hardware execution flow of the DIAG instruction. When the DIAG instruction is executed in the patrol JOB 111, the hardware sets the bit of the error indicating flip-flop (EIF) 13 to 1, indicating that a comparison error has occurred (processing 71). When the bit of EIFlB is set to 1, the hardware stops the clock (process 72) and starts the maintenance program 31 on the 5VPB through diagnostic path 2 (process 73).
保守プログラム31は、起動をかけられると第5図のフ
ローに従ってFRUの解析を行い、エラーログを出力す
る。まず最初に、保守プログラム31は、EIFlBの
ビットに1がセットされているか判断しく処理81)、
1がセットされているとEIFlBとVR12の内容を
エラーログ情報とともに5VPBからディスク4のエラ
ーロギングファイル41上に出力する(処理82)。更
に、保守プログラム31は、VR12から試験番号を取
り出して、ティスフ4上のFRU解析テーブル42をも
とにFRTJの解析をおこなう(処理83)。ここで、
V R12に番号2か入っていたとすると、試験対象と
なるハードウェアは、第6図よりNW AとHW
Bとなる。HW Aは試験番号1の試験で試験済みな
のて、比較エラーのおこったハードウェアは、HW
Bであることがわかる。FRUが解析されると、保守プ
ログラム31は、FRTJをコンソール5上に出力する
(処理84)。When the maintenance program 31 is activated, it analyzes the FRU according to the flow shown in FIG. 5 and outputs an error log. First, the maintenance program 31 determines whether the bit of EIFlB is set to 1 (81),
If 1 is set, the contents of EIFlB and VR12 are output from 5VPB to the error logging file 41 of disk 4 along with error log information (process 82). Furthermore, the maintenance program 31 extracts the test number from the VR 12 and analyzes the FRTJ based on the FRU analysis table 42 on the TIF 4 (processing 83). here,
Assuming that VR12 contains number 2, the hardware to be tested is NW A and HW from Figure 6.
It becomes B. Since HW A has been tested in test number 1, the hardware that caused the comparison error is HW
It turns out that it is B. When the FRU is analyzed, the maintenance program 31 outputs the FRTJ on the console 5 (process 84).
このようにして、本発明である情報処理装置の診断方式
は、パトロールJOBを用いて故障箇所を指摘すること
ができる。In this manner, the information processing apparatus diagnostic method according to the present invention can point out the failure location using the patrol job.
以上説明したように、本発明はパトロールJOBを用い
た、情報処理装置の診断において、故障箇所を自動的に
指摘する手段を設けることにより、障害発生時に、容易
に故障箇所がわがり短時間で修理に対応することができ
る。As explained above, the present invention provides a means for automatically pointing out a failure point in diagnosis of an information processing device using patrol JOB, so that when a failure occurs, the failure point can be easily identified in a short time. Able to handle repairs.
第1図は本発明の一実施例を示す情報処理装置の診断方
式のシステム構成図、第2図はスタートスモール実行に
よる試験プログラムの各試験とハードウェアとの対応を
示す図、第3図はパトロールJOBの試験方法の一例を
示す流れ図、第4図はDIAG命令の処理を示す図、第
5図は保守プログラムの処理の一例を示す流れ図、第6
図はFRU解析テーブルの一例を示す図である。
1・・・情報処理装置、11・・・主記憶部、111・
・・パトロールJOB、1111・・・スタートスモー
ル試験手段、1112・・・試験iD設定手段、111
3・・・ログアウト要求手段、112・・・OS,12
・・・SWビジプルレジスタ、13・・・EIF、2・
・・診断パス、3・・・SVP、31・・・保守プログ
ラム、311・・・エラーロギング手段、312・・・
エラーロギング手段、4・・・ディスク、41・・・エ
ラーロギングファイル、42・・・FRU解析テーブル
、5・・・コンソール。FIG. 1 is a system configuration diagram of a diagnostic method for an information processing device showing an embodiment of the present invention, FIG. 2 is a diagram showing the correspondence between each test of a test program by start small execution and hardware, and FIG. FIG. 4 is a flowchart showing an example of a patrol JOB test method; FIG. 4 is a flowchart showing DIAG command processing; FIG. 5 is a flowchart showing an example of maintenance program processing;
The figure is a diagram showing an example of an FRU analysis table. 1... Information processing device, 11... Main storage unit, 111.
... Patrol JOB, 1111 ... Start small test means, 1112 ... Test ID setting means, 111
3...Logout request means, 112...OS, 12
...SW visible register, 13...EIF, 2.
...Diagnostic path, 3...SVP, 31...Maintenance program, 311...Error logging means, 312...
Error logging means, 4... Disk, 41... Error logging file, 42... FRU analysis table, 5... Console.
Claims (1)
情報処理装置の診断方式において、前記情報処理装置の
最小限のハードウェアで試験を行い順次試験範囲を広げ
ていくスタートスモール試験手段と、前記試験プログラ
ムの各試験実行前に該当の試験番号をソフトウェアビジ
ブルレジスタに設定する試験ID設定手段と、前記試験
で比較エラーを検出したとき前記情報処理装置と診断パ
スを介して接続されるサービスプロセッサに対してエラ
ーログ採取要求を出すログアウト要求手段とを前記情報
処理装置に備え、 前記ログアウト要求手段から要求があったときにエラー
ログをエラーログファイルに採取するエラーロギング手
段と、前記試験IDをもとに故障部品名を表示するエラ
ーログ解析手段とを前記サービスプロセッサに備えたこ
とを特徴とする情報処理装置の診断方式。[Claims] In a diagnostic method for an information processing device that detects a failure by executing a test program while an OS is running, a test is started with the minimum amount of hardware of the information processing device and the scope of the test is gradually expanded. a small test means; a test ID setting means for setting a corresponding test number in a software visible register before executing each test of the test program; The information processing device includes a logout requesting means for issuing an error log collection request to a connected service processor, and an error logging means for collecting an error log into an error log file when a request is received from the logout requesting means. , an error log analysis means for displaying a failed component name based on the test ID, the service processor comprising: a diagnostic method for an information processing device;
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2216078A JPH0497445A (en) | 1990-08-16 | 1990-08-16 | Diagnostic system for information processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2216078A JPH0497445A (en) | 1990-08-16 | 1990-08-16 | Diagnostic system for information processor |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0497445A true JPH0497445A (en) | 1992-03-30 |
Family
ID=16682912
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2216078A Pending JPH0497445A (en) | 1990-08-16 | 1990-08-16 | Diagnostic system for information processor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0497445A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06348537A (en) * | 1993-06-11 | 1994-12-22 | Nec Corp | Diagnostic system for input/output device |
| JP2007102781A (en) * | 2005-09-30 | 2007-04-19 | Intel Corp | Apparatus, system and method for persistent user level threads |
| US7642689B2 (en) | 2007-06-26 | 2010-01-05 | Minebea Co., Ltd. | Rotor structure |
-
1990
- 1990-08-16 JP JP2216078A patent/JPH0497445A/en active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06348537A (en) * | 1993-06-11 | 1994-12-22 | Nec Corp | Diagnostic system for input/output device |
| JP2007102781A (en) * | 2005-09-30 | 2007-04-19 | Intel Corp | Apparatus, system and method for persistent user level threads |
| US8028295B2 (en) | 2005-09-30 | 2011-09-27 | Intel Corporation | Apparatus, system, and method for persistent user-level thread |
| US8479217B2 (en) | 2005-09-30 | 2013-07-02 | Intel Corporation | Apparatus, system, and method for persistent user-level thread |
| US7642689B2 (en) | 2007-06-26 | 2010-01-05 | Minebea Co., Ltd. | Rotor structure |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0827738B2 (en) | Online test method | |
| US20030074605A1 (en) | Computer system and method for program execution monitoring in computer system | |
| US20100251029A1 (en) | Implementing self-optimizing ipl diagnostic mode | |
| JPH0497445A (en) | Diagnostic system for information processor | |
| JPH05224995A (en) | Information processor test system | |
| JPH07334385A (en) | How to verify the maintenance diagnostic function | |
| CN121301114B (en) | BMC-based service fault positioning system and method | |
| JPS6014351A (en) | Automatic test system | |
| JPH05298204A (en) | Test circut for input/output processor | |
| JP2004341652A (en) | Automatic test method and automatic tester | |
| JP2544416B2 (en) | Test data generation processing method | |
| JPS62139050A (en) | Instruction test system by control of maintenance and diagnosis processor | |
| CN118227505A (en) | Method and device for processing automatic playback flow of departure business and electronic equipment | |
| JPH07334383A (en) | Computer with monitoring and diagnostic function | |
| JPS6250858B2 (en) | ||
| JP2549690B2 (en) | Pseudo-fault test method for channel processor | |
| CN119917413A (en) | Method, device, equipment, storage medium and program product for automatic test and positioning of vehicle computer instantaneous startup abnormality | |
| JPS6289144A (en) | Trouble diagnosing system for logical device | |
| JP3069321B2 (en) | Database processor diagnosis method | |
| JPH07105045A (en) | Debugging method of information processing equipment functional test program | |
| JPH07319730A (en) | Test / debug method | |
| JPH0322657A (en) | Test system for electronic exchange | |
| JPS62100844A (en) | Test system for information processor | |
| JPH09219747A (en) | Failure information analysis method | |
| JPH1040132A (en) | Program inspection system |