JPH0365743A - 主記憶装置の故障発見方法 - Google Patents
主記憶装置の故障発見方法Info
- Publication number
- JPH0365743A JPH0365743A JP1201727A JP20172789A JPH0365743A JP H0365743 A JPH0365743 A JP H0365743A JP 1201727 A JP1201727 A JP 1201727A JP 20172789 A JP20172789 A JP 20172789A JP H0365743 A JPH0365743 A JP H0365743A
- Authority
- JP
- Japan
- Prior art keywords
- main storage
- storage device
- microprogram
- error
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 12
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000001514 detection method Methods 0.000 claims abstract description 4
- 238000012937 correction Methods 0.000 claims description 9
- 238000009825 accumulation Methods 0.000 abstract description 2
- 238000011084 recovery Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は電子計算機の故障の発見方法に関し、特に主記
憶装置の故障発見方法に関する。
憶装置の故障発見方法に関する。
従来の誤り訂正符号を使用した主記憶装置の障害対策に
ついて説明する前に、まず誤り訂正符号について簡潔に
説明する。
ついて説明する前に、まず誤り訂正符号について簡潔に
説明する。
誤り訂正符号(Error Correcting C
ode、 ECC)は、符号に冗長度を持たせることに
より、符号の一部に誤りが発生した場合でも、その誤り
が軽微なものである場合には、誤りの発生を検出し、誤
りの影響を除去して元の正しい符号に修正できるように
構成された符号のことであり、一般には冗長度を大きく
する程、訂正可能な誤りの範囲も大きくなる。
ode、 ECC)は、符号に冗長度を持たせることに
より、符号の一部に誤りが発生した場合でも、その誤り
が軽微なものである場合には、誤りの発生を検出し、誤
りの影響を除去して元の正しい符号に修正できるように
構成された符号のことであり、一般には冗長度を大きく
する程、訂正可能な誤りの範囲も大きくなる。
誤り訂正符号の記憶装置への応用としては、たとえば、
1個の符号を多数のメモリ素子に分割して記憶し、1個
のメモリ素子の故障があれば他のメモリ素子の内容から
元の内容を再現できるような誤り訂正符号を使用すれば
、同時に複数のメモリ素子が故障しない限り故障の影響
を除去することができる。
1個の符号を多数のメモリ素子に分割して記憶し、1個
のメモリ素子の故障があれば他のメモリ素子の内容から
元の内容を再現できるような誤り訂正符号を使用すれば
、同時に複数のメモリ素子が故障しない限り故障の影響
を除去することができる。
次に、従来の誤り訂正符号を使用した主記憶装置の障害
対策について説明する。
対策について説明する。
まず、システムの立ち上げ時に全メモリに対してデータ
の書き込みと読み出しを行い、異常がないことを確認す
る。
の書き込みと読み出しを行い、異常がないことを確認す
る。
以後は、主記憶装置がアクセスされ、メモリ素子からデ
ータの読み出しが行われたときに、訂正可能な誤りが検
出されれば、自動訂正されたデータを使用することによ
り、障害の回避を行っていた。システムによっては自動
訂正されたデータの再書き込みを行い、障害が累積する
ことによって致命的な障害に発展する確率を減少させて
いるものもある。また、ソフトウェアにより、定期的に
メモリの読み出し試験を行うものもある。
ータの読み出しが行われたときに、訂正可能な誤りが検
出されれば、自動訂正されたデータを使用することによ
り、障害の回避を行っていた。システムによっては自動
訂正されたデータの再書き込みを行い、障害が累積する
ことによって致命的な障害に発展する確率を減少させて
いるものもある。また、ソフトウェアにより、定期的に
メモリの読み出し試験を行うものもある。
上述した従来の誤り訂正符号を使用した主記憶装置の障
害対策は、故障の検出がシステム立ち上げ時か、主記憶
装置がアクセスされてメモリ素子からのデータの読み出
しが行われた時に限られているので、−度システムを立
ち上げると長期的に亘って運転を継続するシステムにお
いて、はとんどアクセスされないかまたはほとんど書き
込み処理しか行われないメモリエリアが存在する場合に
は、該エリアに故障が発生しても直ぐには発見されず、
長期間経過するうちに故障が累積し訂正不能障害に発展
するという欠点がある。
害対策は、故障の検出がシステム立ち上げ時か、主記憶
装置がアクセスされてメモリ素子からのデータの読み出
しが行われた時に限られているので、−度システムを立
ち上げると長期的に亘って運転を継続するシステムにお
いて、はとんどアクセスされないかまたはほとんど書き
込み処理しか行われないメモリエリアが存在する場合に
は、該エリアに故障が発生しても直ぐには発見されず、
長期間経過するうちに故障が累積し訂正不能障害に発展
するという欠点がある。
特に、上記メモリエリアがシステムのリカバリ情報エリ
ア等であった場合には、システムダウンすることにな9
システム利用者への影響は大きなものになる。
ア等であった場合には、システムダウンすることにな9
システム利用者への影響は大きなものになる。
また、ソフトウェアによるメモリの読み出し試験では、
ソフトウェアの負担が増加するため、システム性能を低
下させるという欠点がある。
ソフトウェアの負担が増加するため、システム性能を低
下させるという欠点がある。
本発明の主記憶装置の故障発見方法は、誤り訂正符号を
使用した主記憶装置と、マイクロプログラムによって制
御される中央処理装置とを持つ電子計算機において、マ
イクロプログラムから主記憶装置の診断読出しを行う第
1の手段と、主記憶装置からの読出しデータに訂正可能
な誤りが検出された場合には、外部に誤り検出を報告す
る第2の手段とを有し、マイクロプログラムの処理が一
定以上の持ち時間が見込まれる持ち合せとなった場合に
、持ち時間を利用して前記第1および第2の手段を実行
して構成される。
使用した主記憶装置と、マイクロプログラムによって制
御される中央処理装置とを持つ電子計算機において、マ
イクロプログラムから主記憶装置の診断読出しを行う第
1の手段と、主記憶装置からの読出しデータに訂正可能
な誤りが検出された場合には、外部に誤り検出を報告す
る第2の手段とを有し、マイクロプログラムの処理が一
定以上の持ち時間が見込まれる持ち合せとなった場合に
、持ち時間を利用して前記第1および第2の手段を実行
して構成される。
次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例の構成を示す流れ図である。
まず、ここでは主記憶装置のリカバリ情報エリアのメモ
リ素子1個に故障1oが発生したが即座には検出されな
かったとする。
リ素子1個に故障1oが発生したが即座には検出されな
かったとする。
一方、中央処理装置のマイクロプログラムは、コプロセ
ッサにメッセー′ジを送出し、コプロセッサからの応答
メツセージを待つ一連の処理11の実行を開始したとす
る。コプロセッサにメツセージを送出する処理12の後
、応答メツセージを待つ処理14を実行する前に、主記
憶装置の診断読み出し処理13(すなわち第1の手段l
)を実行する。処理13によって主記憶の故障10の発
生している部分を読み出すと、主記憶装置により訂正可
能な誤り15が検出され、自動訂正されるとともに障害
が発生したことが保守センタに報告16される。すなわ
ち第2の手段2が実行される。
ッサにメッセー′ジを送出し、コプロセッサからの応答
メツセージを待つ一連の処理11の実行を開始したとす
る。コプロセッサにメツセージを送出する処理12の後
、応答メツセージを待つ処理14を実行する前に、主記
憶装置の診断読み出し処理13(すなわち第1の手段l
)を実行する。処理13によって主記憶の故障10の発
生している部分を読み出すと、主記憶装置により訂正可
能な誤り15が検出され、自動訂正されるとともに障害
が発生したことが保守センタに報告16される。すなわ
ち第2の手段2が実行される。
保守センタは報告16を受信すると、主記憶装置のメモ
リ素子を交換保守を行う(処理17)。
リ素子を交換保守を行う(処理17)。
これにより故障10は即座には検出されないが、長期間
経過することなく2発見され保守されることになる。
経過することなく2発見され保守されることになる。
その後リカバリ情報エリアの故障10とは別のメモリ素
子1個に故障20が発生したとする。
子1個に故障20が発生したとする。
ここで、磁気ディスク装置に障害21が発生すると、シ
ステム制御ソフトウェアは、リカバリ情報にもとすいて
システムを復旧させるために、リカバリ情報エリアの読
み出し処理22を行う。処理22が故障200発生して
いる部分を読み出すと、主記憶装置では訂正可能な誤り
23が検出されるが自動訂正24により復旧作業25は
成功し、システムはダウンすることなく継続運転するこ
とができる。
ステム制御ソフトウェアは、リカバリ情報にもとすいて
システムを復旧させるために、リカバリ情報エリアの読
み出し処理22を行う。処理22が故障200発生して
いる部分を読み出すと、主記憶装置では訂正可能な誤り
23が検出されるが自動訂正24により復旧作業25は
成功し、システムはダウンすることなく継続運転するこ
とができる。
以上説明したように本発明は、マイクロプログラムの持
ち時間を利用して主記憶の診断読み出しを行うことによ
り、主記憶装置での故障を早期に発見することができ、
長期に亘る故障の累積によって訂正不能な誤りに発展す
ることを抑止できるという効果がある。
ち時間を利用して主記憶の診断読み出しを行うことによ
り、主記憶装置での故障を早期に発見することができ、
長期に亘る故障の累積によって訂正不能な誤りに発展す
ることを抑止できるという効果がある。
また、マイクロプログラムの持ち時間を使用するため、
ソフトウェアの負担の増加とならず、システム性能を低
下させることなく主記憶装置の診断ができるという効果
もある。
ソフトウェアの負担の増加とならず、システム性能を低
下させることなく主記憶装置の診断ができるという効果
もある。
第1図は本発明の一実施例の構成を示す流れ図である。
1・・・・・・第1の手段、2・・・・・・第2の手段
。
。
Claims (1)
- 誤り訂正符号を使用した主記憶装置と、マイクロプログ
ラムによって制御される中央処理装置とを持つ電子計算
機において、マイクロプログラムから主記憶装置の診断
読出しを行う第1の手段と、主記憶装置からの読出しデ
ータに訂正可能な誤りが検出された場合には、外部に誤
り検出を報告する第2の手段とを有し、マイクロプログ
ラムの処理が一定以上の持ち時間が見込まれる持ち合せ
となった場合に、持ち時間を利用して前記第1および第
2の手段を実行して成ることを特徴とする主記憶装置の
故障発見方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1201727A JPH0365743A (ja) | 1989-08-02 | 1989-08-02 | 主記憶装置の故障発見方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1201727A JPH0365743A (ja) | 1989-08-02 | 1989-08-02 | 主記憶装置の故障発見方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0365743A true JPH0365743A (ja) | 1991-03-20 |
Family
ID=16445935
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1201727A Pending JPH0365743A (ja) | 1989-08-02 | 1989-08-02 | 主記憶装置の故障発見方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0365743A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06324953A (ja) * | 1993-05-10 | 1994-11-25 | Mita Ind Co Ltd | 書換可能なメモリのメモリチェック方法、その装置及び該装置を有するデータ自動復旧装置 |
| KR100463752B1 (ko) * | 2002-05-16 | 2004-12-29 | 권순갑 | 스크류 앵커를 이용한 옹벽의 시공방법 |
-
1989
- 1989-08-02 JP JP1201727A patent/JPH0365743A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06324953A (ja) * | 1993-05-10 | 1994-11-25 | Mita Ind Co Ltd | 書換可能なメモリのメモリチェック方法、その装置及び該装置を有するデータ自動復旧装置 |
| KR100463752B1 (ko) * | 2002-05-16 | 2004-12-29 | 권순갑 | 스크류 앵커를 이용한 옹벽의 시공방법 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5274646A (en) | Excessive error correction control | |
| US7139942B2 (en) | Method and apparatus for memory redundancy and recovery from uncorrectable errors | |
| US7346812B1 (en) | Apparatus and method for implementing programmable levels of error severity | |
| JPH1049448A (ja) | 冗長化メモリのエラー訂正機構 | |
| JPH0365743A (ja) | 主記憶装置の故障発見方法 | |
| WO2010011217A1 (en) | Data storage method, apparatus and system for interrupted write recovery | |
| JPH06175934A (ja) | 1ビットエラー処理方式 | |
| JPS59148954A (ja) | 制御記憶パトロ−ル方式 | |
| JPH0314054A (ja) | 電子ディスク装置 | |
| JPS6356751A (ja) | メモリパトロ−ル制御方式 | |
| JP2606431B2 (ja) | 制御メモリの障害回復方式 | |
| JPS61131050A (ja) | メモリエラ−処理方式 | |
| JPH0135369B2 (ja) | ||
| JPH05210597A (ja) | 記憶装置のパトロール回路 | |
| JPH03273344A (ja) | フォールトトレラントシステム | |
| JPH05341921A (ja) | ディスクアレイ装置 | |
| CN119597527A (zh) | 一种ddr控制器异常处理方法、装置及存储介质 | |
| JP2924732B2 (ja) | 情報処理装置の自己診断方法 | |
| JPH0793171A (ja) | メモリアクセスにおける障害処理方法 | |
| JPS61143833A (ja) | 磁気デイスク制御装置 | |
| JPH04630A (ja) | 記憶制御装置 | |
| JPS60205640A (ja) | エラ−ログ方式 | |
| JPH0327433A (ja) | 電子ディスク装置 | |
| JPH04287237A (ja) | 情報処理装置 | |
| JPS6142033A (ja) | 情報処理装置 |