JP2000276308A - ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法 - Google Patents
ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法Info
- Publication number
- JP2000276308A JP2000276308A JP11085205A JP8520599A JP2000276308A JP 2000276308 A JP2000276308 A JP 2000276308A JP 11085205 A JP11085205 A JP 11085205A JP 8520599 A JP8520599 A JP 8520599A JP 2000276308 A JP2000276308 A JP 2000276308A
- Authority
- JP
- Japan
- Prior art keywords
- data
- magnetic disk
- disk device
- restored
- spare
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
必要なデータが障害の発生していない磁気ディスク装置
から読み出せないことに起因してディスクサブシステム
が使用不能になることを防止するディスクサブシステム
を提供することを目的とする。 【解決手段】RAIDを構成したディスクサブシステム
において、障害の発生した磁気ディスク装置のデータを
前記予備の磁気ディスク装置に復元する際に、前記障害
の発生した磁気ディスク装置から読み出せるデータは、
そのデータを前記予備の磁気ディスク装置に格納し、前
記障害の発生した磁気ディスク装置から読み出せないデ
ータは、前記RAIDを構成する複数の磁気ディスク装
置の内、障害が発生していない磁気ディスク装置に格納
されているデータから演算により復元し、この復元した
データを前記予備の磁気ディスク装置に格納するデータ
復元手段を設けたことを特徴とする。
Description
ーバ計算機において、高信頼性が要求される外部記憶装
置として使用されるRAID技術を使用したディスクサ
ブシステムの改良に関する。特に信頼性を更に高くする
RAID技術を使用したディスクサブシステムに関す
る。
ays of Inexpensive Disks)
技術は、David A.Patterson,Gar
thA.Gribson,Randy H.Katsに
より1987年に発表された論文「A Case fo
r Redundant Arrays of Ine
xpensive Disks 」で紹介されて実用化
されている。
ル1からレベル5に分類され、高信頼性が要求されるP
Cサーバ等のサーバ計算機のディスクサブシステムに使
用されている。
クサブシステムの一例を図8を用いてその概要を説明す
る。図8において、ディスクサブシステムは、3台の磁
気ディスク装置DR1、DR2、DR3と一台の予備磁
気ディスク装置DRSとから構成されている。この図に
おいては、サーバ計算機やRAIDコントローラの図示
を省略している。
記録しているデータを所定単位のブロックに分割し、こ
れを3台の磁気ディスク装置DR1、DR2、DR3に
分散して記録する。この際に、冗長データとしてパリテ
ィを作成し、このパリティも分散して記録する。
れる。パリティP1は、データDaとデータDbとの排
他的論理和演算を行うことで生成される。同様にパリテ
ィP2はデータDcとデータDdとの排他的論理和演算
で、パリティP3はデータDeとデータDfとの排他的
論理和演算で、パリティP4はデータDgとデータDh
との排他的論理和演算で生成される。
ムにおいて、サーバ計算機からデータDbのリード要求
があった場合に、磁気ディスク装置DR2のデータDb
が記録されているメディア(磁気ディスク)の記録面の
障害又は磁気ディスク装置DR2全体の障害のため、デ
ータDbの読み出しができないときには、再度データリ
ードを試みてリトライを実施し、それでも読み出しがで
きない場合には、RAIDコントローラがデータDaと
パリティP1とのの排他的論理和演算を行いデータDb
を復元してサーバ計算機にリードデータとして出力して
サーバ計算機にはディスクサブシステムに障害が発生し
たことを認識させずに対応している。
コントローラは障害が発生した磁気ディスク装置DR2
をRAID構成から切り離して磁気ディスク装置DR1
とDR3の2台の構成による縮退状態にする。
に故障が発生すると、ディスクサブシステムからのデー
タの読み出しができなくなり、RAIDコントローラは
サーバ計算機に対してディスクサブシステムに障害が発
生したと通知することになる。
ク装置に故障が発生してディスクサブシステムに障害が
発生させないように、RAIDを正常な状態に回復する
必要がある。
備の磁気ディスク装置DRSに切り離した磁気ディスク
装置DR2のデータを復元することで行われる。この予
備の磁気ディスク装置DRSに切り離した磁気ディスク
装置DR2のデータを復元するには、磁気ディスク装置
DR1とDR3のそれぞれに対応するブロックのデータ
どうしの排他的論理和演算を行うことで実現できる。例
えばデータDeを復元するには、パリティP3とデータ
Dfとの排他的論理和演算で復元できる。
ディスクサブシステムの回復処理では、障害の発生した
磁気ディスク装置を別の正常な磁気ディスク装置と交換
し、この交換した磁気ディスク装置にデータを上記と同
様に排他的論理和演算により復元する。
術を使用したディスクサブシステムにおいては、次のよ
うな問題点があった。障害が発生しRAID構成から切
り離した磁気ディスク装置のデータを予備の又は交換し
た磁気ディスク装置に復元する際に、上記切り離した磁
気ディスク装置の障害の内容がメディア(磁気ディス
ク)の記録面の場合には、障害の発生していないメディ
アからはそこに記録されているデータの読み出しが可能
にもかかわらず、読み出しが可能なデータも含めて全て
のデータを排他的論理和演算により求めるため、データ
の復元処理に大幅な時間を要していた。
に、排他的論理和演算のためにRAID構成している障
害の発生していない磁気ディスク装置からデータを読み
出す際に、障害が発生してデータの読み出しができない
場合がある。このとき、この時点でデータの復元処理は
不可能になるばかりでなく、ディスクサブシステム自体
が使用不可になってしまっていた。このようにデータの
復元処理の際に障害が見つかるデータは、普段アクセス
がされていないあまり重要なデータではないと推測され
る。このようなあまり重要でないデータが読み出せない
ことに起因して、障害の発生した磁気ディスク装置のデ
ータの復元ができなくなるとともに、ディスクサブシス
テム自体が使用不能になることは大きな問題であった。
ためになされたもので、障害が発生した磁気ディスク装
置のデータの復元処理を高速化できるディスクサブシス
テムを提供することを目的とする。
スク装置のデータの復元処理の際に、データの復元処理
に必要なデータが障害の発生していない磁気ディスク装
置から読み出せないことに起因してRAIDが再構成で
きなくなり、ディスクサブシステムが使用不能になるこ
とを防止しするディスクサブシステムを提供することを
目的とする。
ィスク装置と複数の磁気ディスク装置とでRAIDを構
成したディスクサブシステムにおいて、障害の発生した
磁気ディスク装置のデータを前記予備の磁気ディスク装
置に復元する際に、前記障害の発生した磁気ディスク装
置から読み出せるデータは、そのデータを前記予備の磁
気ディスク装置に格納し、前記障害の発生した磁気ディ
スク装置から読み出せないデータは、前記RAIDを構
成する複数の磁気ディスク装置の内、障害が発生してい
ない磁気ディスク装置に格納されているデータから演算
により復元し、この復元したデータを前記予備の磁気デ
ィスク装置に格納するデータ復元手段を設けたことを特
徴とする。
理を高速化できる。また、本発明は、予備の磁気ディス
ク装置と複数の磁気ディスク装置とでRAIDを構成し
たディスクサブシステムにおいて、障害の発生した磁気
ディスク装置のデータを前記予備の磁気ディスク装置に
復元する際に、前記障害の発生した磁気ディスク装置か
ら読み出せるデータは、そのデータを前記予備の磁気デ
ィスク装置に格納し、前記障害の発生した磁気ディスク
装置から読み出せないデータは、前記RAIDを構成す
る複数の磁気ディスク装置の内、障害が発生していない
磁気ディスク装置に格納されているデータから演算によ
り復元し、この復元したデータを前記予備の磁気ディス
ク装置に格納するデータ復元手段を設け、更に前記演算
によりデータを復元する際、その演算に用いられるデー
タが前記障害が発生していない磁気ディスク装置から読
み出せない場合には、その復元対象のデータがECCエ
ラーであると前記予備の磁気ディスク装置に登録するこ
とを特徴とする。
理を高速化できるとともに障害が発生した磁気ディスク
装置のデータの復元処理の際に、データの復元処理に必
要なデータが障害の発生していない磁気ディスク装置か
ら読み出せないことに起因してRAIDが再構成できな
くなり、ディスクサブシステムが使用不能になることを
防止できる。
と複数の磁気ディスク装置とでRAIDを構成したディ
スクサブシステムにおいて、障害の発生した磁気ディス
ク装置のデータを前記予備の磁気ディスク装置に復元す
る際に、前記RAIDを構成する複数の磁気ディスク装
置の内、障害が発生していない磁気ディスク装置に格納
されているデータから演算により復元し、この復元した
データを前記予備の磁気ディスク装置に格納するととも
に、前記演算によりデータを復元するとき、その演算に
用いられるデータが前記障害が発生していない磁気ディ
スク装置から読み出せない場合には、その復元対象のデ
ータがECCエラーであると前記予備の磁気ディスク装
置に登録するデータ復元手段を設けたことを特徴とす
る。
磁気ディスク装置のデータの復元処理の際に、データの
復元処理に必要なデータが障害の発生していない磁気デ
ィスク装置から読み出せないことに起因してRAIDが
再構成できなくなり、ディスクサブシステムが使用不能
になることを防止できる。
でRAIDが構成され、一つの磁気ディスク装置に障害
が発生した場合にはその障害が発生した磁気ディスク装
置を新しい磁気ディスク装置に交換するディスクサブシ
ステムにおいて、前記障害の発生した磁気ディスク装置
のデータを前記交換した新しい磁気ディスク装置に復元
する際に、前記RAIDを構成する複数の磁気ディスク
装置の内、障害が発生していない磁気ディスク装置に格
納されているデータから演算により復元し、この復元し
たデータを前記交換した新しい磁気ディスク装置に格納
するとともに、前記演算によりデータを復元するとき、
その演算に用いられるデータが前記障害が発生していな
い磁気ディスク装置から読み出せない場合には、その復
元対象のデータがECCエラーであると前記交換した新
しい磁気ディスク装置に登録するデータ復元手段を設け
たことを特徴とする。
磁気ディスク装置のデータの復元処理の際に、データの
復元処理に必要なデータが障害の発生していない磁気デ
ィスク装置から読み出せないことに起因してRAIDが
再構成できなくなり、ディスクサブシステムが使用不能
になることを防止できる。
1の実施形態について説明する。図1は本発明の第1の
実施形態に関わるシステムの概略構成を説明する図であ
る。図1には、PCサーバなどのサーバ計算機100と
ディスクサブシステム110とからなる計算機システム
の概略構成を図示している。
1が設けられており、このシステムバス101にCPU
102が接続されている。また、システムバス101に
はSCSIインタフェース(I/F)111を介してデ
ィスクサブシステム110が接続されている。尚、SC
SIは、Small Computer System
Interfaceの省略語である。
12、ROM113、RAM114、SCSIインタフ
ェース(I/F)111とSCSIインタフェース(I
/F)116がバス115を介して相互に接続されてい
るRAID制御部とSCSIバス117を介してSCS
Iインタフェース(I/F)116に接続された4台の
磁気ディスク装置HD1、HD2、HD3、HDSとか
ら構成されている。
たファームウェアに基づいて、ディスクサブシステム1
10の全体を制御する。RAM114には、サーバ計算
機100からディスクサブシステム110に対するデー
タのリード又はライトの命令が出された際のアドレス情
報を実際の磁気ディスク装置に記録されているアドレス
情報に変換する変換テーブルが設けられている。また、
RAM114は、CPU112の動作に伴う各種データ
が保存される。磁気ディスク装置HD1と磁気ディスク
装置HD2と磁気ディスク装置HD3とでレベル5のR
AIDを構成している。そして、磁気ディスク装置HD
Sは、予備の磁気ディスク装置として設けられている。
論理的にディスクサブシステム110に記録されている
データの配置の構成と実際にRAIDを構成する個々の
磁気ディスク装置に記録されているデータとの関係を図
示している。
スクサブシステム110に記録されているデータ200
は、所定サイズの6つのブロックに分割されたデータD
1〜D6に分割されている。この6つのデータD1〜D
6は、図示のように3台の磁気ディスク装置HD1、H
D2、HD3に記録されている。磁気ディスク装置HD
1には、パリティデータP1、データD3、データD5
とが記録されている。同様に、磁気ディスク装置HD2
には、データD2、パリティデータP2、データD6と
が記録されている。また、磁気ディスク装置HD3に
は、データD2、データD4、パリティデータP3とが
記録されている。磁気ディスク装置HDSは、予備の磁
気ディスク装置であるため、現時点では何も記録されて
いない。パリティP1は、データD1とデータD2との
排他的論理和演算により求められたデータである。同様
にパリティP2は、データD3とデータD4との排他的
論理和演算により求められたデータである。また、パリ
ティP3は、データD5とデータD6との排他的論理和
演算により求められたデータである。
ートに基づいて、本発明の第1の実施形態におけるデー
タの復元動作について説明する。尚、データの復元動作
中においても、並行してサーバ計算機100からのディ
スクサブシステム110へのデータの書き込み及び読み
出しの命令を受け付け、その処理を行うものとする。復
元動作中にサーバ計算機100からデータの書き込み又
は読み出しの命令を受け付けた場合の処理は、以下の動
作説明の中で説明する。
図1に図示したディスクサブシステム110において、
メディアの障害により磁気ディスク装置HD3からデー
タD2の読み出しができなくなり、RAID制御装置の
CPU112が磁気ディスク装置HD3をRAID構成
から切り離して縮退状態とし、予備の磁気ディスク装置
HDSに磁気ディスク装置HD3に格納されていたデー
タを復元する場合のCPU112の制御に基づく動作を
説明する。
ていたデータを予備の磁気ディスク装置HDSに復元す
るに際して、CPU112はRAM114上に図6に示
すようなデータ変更/復元マップ300を作成する(ス
テップS1)。このデータ変更/復元マップ300は、
データ301、状態ビット302、復元ビット303の
3行から構成されており、データを復元する磁気ディス
ク装置HD3の復元動作中におけるデータの変更及び復
元の状態を管理するために設けられている。従って、デ
ータ301としては、D2、D4、P3が登録される。
また、この初期時には状態ビット302と復元ビット3
03は、「0」に設定される。復元ビット303は、以
下に説明するデータの復元処理が終了した状態をデータ
(ブロック)毎に表すものである。このビットが「1」
に設定されているということは、その対応するデータが
予備の磁気ディスク装置HDSに復元されたことを意味
する。また、状態ビット302は、この復元動作中にサ
ーバ計算機100からの書き込み命令により、対応する
ブロックのデータが変更された場合にセットされる。
S2)。この変数Bは、磁気ディスク装置HD3の何番
目のブロックのデータを復元動作するかを示すものであ
る。次にフラグ情報である変数SETを「1」を設定す
る(ステップS3)。この変数SETが「1」にセット
されている場合は、CPU112が磁気ディスク装置H
D3のブロック単位のデータを予備の磁気ディスク装置
HDSに復元動作中であることを示す。次にB番目のブ
ロックのデータの復元処理を行う(ステップS4)。即
ち、1番目のブロック(データD1が格納されているブ
ロック)のデータ(データD1)の復元処理を行う。
チャートを用いて説明する。まず、該当する1番目のブ
ロックの状態ビットに「1」が設定されているかどうか
をデータ変更/復元マップ300を参照してチェックす
る(ステップS50)。このチェックの結果、状態ビッ
トに「1」が設定されている場合には、ステップS52
へ進む。現時点では、状態ビットに「0」が設定されて
いるため、ステップS51に進む。
害の発生した磁気ディスク装置HD3から読み出せるか
をチェックする(ステップS51)。読み出せる場合に
は、磁気ディスク装置HD3からデータD2を読み出
し、予備の磁気ディスク装置HDSの対応するブロック
にコピーして復元する(ステップS53)。そして、復
元動作を終了する。もし、読み出せない場合には、ステ
ップS52に進む。
的論理和演算で復元できるかをチェックする。換言する
と、この排他的論理和演算をするためのデータであるパ
リティP1とデータD1とが、それぞれ磁気ディスク装
置HD1及び磁気ディスク装置HD2から読み出せるか
をチェックする(ステップS52)。読み出せる場合に
は、ステップS54へ進み、パリティP1とデータD1
との排他的論理和演算を行い、データD2を復元し、予
備の磁気ディスク装置HDSの対応するブロックにコピ
ーする(ステップS54)。そして、復元動作を終了す
る。また、読み出せない場合には、ステップS55へ進
む。
いるブロックのデータが、障害の発生した磁気ディスク
装置HD3から読み出せず、更に排他的論理和演算によ
っても復元できない状態のため、予備の磁気ディスク装
置HDSの対応するブロックにECC(Error C
hecking and Correcting )エ
ラーが発生したとして、予備の磁気ディスク装置HDS
のメディアの特定エリアに設定した図示しないエラー状
態マップに該当するブロックにECCエラーが発生した
ことのフラグを登録する。この様な一連の動作でデータ
の復元処理を行い、図3のステップS4のデータの復元
処理が終了する。
S5では、ステップS4においてデータD2が復元され
たので、図6に示すデータD2に対応する復元ビットを
「1」にセットする。
インクリメントする。続いてステップS7において、変
数SETを「0」を設定する。この変数SETを「0」
にセットすることで、、CPU112が磁気ディスク装
置HD3のブロック単位のデータを予備の磁気ディスク
装置HDSに復元する動作が終了したことを意味する。
元したブロックのデータがサーバ計算機100からのデ
ータの書き込み命令により変更されていないかをチェッ
クする。具体的には、図6に示したデータ変更/復元マ
ップ300において、復元ビット303が「1」に設定
されているデータの内、状態ビット302が「1」に設
定されているデータの有無をチェックする。このチェッ
クの結果、復元ビット303と状態ビット302の双方
が「1」に設定されているデータがある場合には、その
データが既にデータが復元されたもので、且つその後の
サーバ計算機100からのデータの書き込み命令により
変更されているものであると判断されステップS10へ
進む。また、復元ビット303と状態ビット302の双
方が「1」に設定されているデータがない場合には、ス
テップS9に進む。以下、ステップS9に進む場合の動
作を説明し、ステップS10へ進む場合の動作は、後に
説明する。
タが復元されたかを変数Bの値を見ることでチェックす
る。全てのブロックのデータが復元された場合には、全
ての復元処理が終了する。全てのブロックのデータが復
元されていない場合には、ステップS3へ戻り以上説明
した動作を繰り返す。
処理を繰り返している間にサーバ計算機100からディ
スクサブシステム110へのデータの書き込み又は読み
出しの命令をCPU112がSCSIインタフェース1
11を介して受理した場合には、以上説明したデータの
復元処理動作を中断して、そのデータの書き込み又は読
み出し処理を実行し、その後復元処理動作を再開する。
からデータの読み出し命令を受理した場合について説明
する。RAIDを構成する正常な磁気ディスク装置から
のデータの読み出しであれば、そのデータを読み出す。
もし、障害が発生しRAID構成から切り離した磁気デ
ィスク装置HD3からのデータの読み出しの場合には、
もしそのデータが磁気ディスク装置HD3から読み出せ
る場合には、そのまま読み出し、読み出せない場合に
は、他の正常な磁気ディスク装置から読み出した対応す
るブロックのデータの排他的論理和演算により求めたデ
ータを読み出しデータとしてサーバ計算機100からへ
転送する。ただし、このように説明したいずれの読み出
しの場合においても、メディアの障害が原因によりにデ
ータが読み出せないときには、上述したようにECCエ
ラーとして登録し、サーバ計算機100からにその旨を
通知する。
らデータの書き込み命令を受理した場合について説明す
る。まず、上記変数SETが「0」であることを確認す
る。もし、上記変数SETが「1」の場合には、「0」
になるまで、その処理を待機させる。変数SETが
「0」であることを確認できた場合には、以下の処理を
行う。RAIDを構成する正常な磁気ディスク装置に記
録されているデータの書き込みであれば、そのまま書き
込み処理を実施する。この際、パリティの変更をするこ
とは説明するまでもない。
離した磁気ディスク装置HD3へのデータの書き込みの
場合、例えばデータD4の書き込みの場合には、次のよ
うに行う。まず、この新しい書き込みデータD4と磁気
ディスク装置HD1に書き込まれているデータD3とで
排他的論理和演算を行い得られたパリティデータを新し
いパリティP2として磁気ディスク装置HD2に書き込
む。そして、新しい書き込みデータD4を実際に書き込
む代わりに図6に示したデータ変更/復元マップ300
のデータD4に対応する状態ビット302を「1」にセ
ットする。この様な処理をすることで書き込み処理を実
施する。
ット303と状態ビット302の双方が「1」に設定さ
れており、既にそのデータが復元されたもので、且つそ
の後サーバ計算機100からのデータの書き込み命令に
より変更されているデータがあると判断されステップS
10へ進む場合の動作を説明する。以下の説明ではデー
タ変更/復元マップ300が図4に示した状態になって
いる場合を例にして説明する。
数SETを「1」を設定する。続いて、ステップS11
では、ステップS8において復元ビット303と状態ビ
ット302の双方が「1」に設定されていると判断され
たデータD2の復元処理を再度実行する。この復元処理
は、図7で示したルーチンに基づき行われるもので、既
に説明したので、ここではその説明を省略する。
変更/復元マップ300におけるデータD2に対応する
状態ビット302を「0」に設定する。続いてステップ
S13において、変数SETを「0」を設定しステップ
S8に戻る。この様に復元ビット303と状態ビット3
02の双方が「1」に設定されているデータが無くなる
まで、ステップS8→S10→S11→S12→S13
の処理を続ける。
する。第1の実施形態との違いは、図7に示した復元処
理の動作が異なり、他の動作は、第1の実施形態と同一
である。
図8に示したフローチャートを用いて説明する。動作説
明の前提としては、第1の実施形態と同様にレベル5の
RAIDを構成している図1に図示したディスクサブシ
ステム110において、メディアの障害により磁気ディ
スク装置HD3からデータD2の読み出しができなくな
り、RAID制御装置のCPU112が磁気ディスク装
置HD3をRAID構成から切り離して縮退状態とし、
予備の磁気ディスク装置HDSに磁気ディスク装置HD
3に格納されていたデータを復元する場合のCPU11
2の制御に基づく動作を説明する。
他的論理和演算で復元できるかをチェックする。換言す
ると、この排他的論理和演算をするためのデータである
パリティP1とデータD1とが、それぞれ磁気ディスク
装置HD1及び磁気ディスク装置HD2から読み出せる
かをチェックする(ステップS60)。読み出せる場合
には、ステップS61へ進み、パリティP1とデータD
1との排他的論理和演算を行い、データD2を復元し、
予備の磁気ディスク装置HDSの対応するブロックにコ
ピーする(ステップS61)。そして、復元動作を終了
する。
62へ進む。ステップS62では、1番目のブロックの
データD2が障害の発生した磁気ディスク装置HD3か
ら読み出せるかをチェックする(ステップS62)。読
み出せる場合には、磁気ディスク装置HD3からデータ
D2を読み出し、予備の磁気ディスク装置HDSの対応
するブロックにコピーして復元する(ステップS6
3)。そして、復元動作を終了する。
64に進む。ステップS64では、現在復元処理をして
いるブロックのデータが、排他的論理和演算によっても
復元できず、更に障害の発生した磁気ディスク装置HD
3から読み出せない状態のため、予備の磁気ディスク装
置HDSの対応するブロックにECCエラーが発生した
として、予備の磁気ディスク装置HDSのメディアの特
定エリアに設定した図示しないエラー状態マップに該当
するブロックにECCエラーが発生したことのフラグを
登録する。この様な一連の動作でデータの復元処理を行
い、図3のステップS4のデータの復元処理が終了す
る。
をする。第1の実施形態との違いは、図7に示した復元
処理の動作が異なることと、ディスクサブシステム11
0に予備の磁気ディスク装置を持たず、RAIDを構成
する磁気ディスク装置に障害が発生した場合には、その
磁気ディスク装置を新しい正常な磁気ディスク装置と交
換することである。その他の動作は、第1の実施形態と
同一である。
図9に示したフローチャートを用いて説明する。動作説
明の前提としては、第1の実施形態と同様にレベル5の
RAIDを構成している図1に図示したディスクサブシ
ステム110において、メディアの障害により磁気ディ
スク装置HD3からデータD2の読み出しができなくな
り、磁気ディスク装置HD3を新しい正常な磁気ディス
ク装置と交換し、この交換した新しい磁気ディスク装置
(図示せず)に磁気ディスク装置HD3に格納されてい
たデータを復元する場合のCPU112の制御に基づく
動作を説明する。
他的論理和演算で復元できるかをチェックする。換言す
ると、この排他的論理和演算をするためのデータである
パリティP1とデータD1とが、それぞれ磁気ディスク
装置HD1及び磁気ディスク装置HD2から読み出せる
かをチェックする(ステップS70)。読み出せる場合
には、ステップS71へ進み、パリティP1とデータD
1との排他的論理和演算を行い、データD2を復元し、
交換した新しい磁気ディスク装置の対応するブロックに
コピーする(ステップS71)。そして、復元動作を終
了する。
72へ進む。ステップS72では、現在復元処理をして
いるブロックのデータが、排他的論理和演算によっても
復元できないため、交換した新しい磁気ディスク装置の
対応するブロックにECCエラーが発生したとして、交
換した新しい磁気ディスク装置のメディアの特定エリア
に設定した図示しないエラー状態マップに該当するブロ
ックにECCエラーが発生したことのフラグを登録す
る。この様な一連の動作でデータの復元処理を行い、図
3のステップS4のデータの復元処理が終了する。
ックのデータが、復元できないため、ECCエラーが発
生したとして、データの復元をしている磁気ディスク装
置にECCエラーが発生したことのフラグを登録すると
説明した。しかし、その後、その復元できなかったデー
タがサーバ計算機100により新たにデータが書き込ま
れた場合には、そのフラグの登録を削除すればよい。
とのフラグが登録されるデータは、従来技術の説明で述
べたように、普段アクセスがされていないあまり重要な
データではないと推測される。従って、データが復元で
きなくてRAIDの再構成ができなくなり、ディスクサ
ブシステム自体が使用不能になることに比べて、復元で
きないデータにECCエラーが発生したと登録する処理
の方が、システム全体から見れば、より良い対策であ
る。
ータの復元処理を高速化できるとともに、障害が発生し
た磁気ディスク装置のデータの復元処理の際に、データ
の復元処理に必用なデータが障害の発生していない磁気
ディスク装置から読み出せないことに起因してRAID
が再構成できなくなり、ディスクサブシステムが使用不
能になることを防止できる。
略構成を示す図である。
システムに記録されているデータの配置の構成と実際に
RAIDを構成する個々の磁気ディスク装置に記録され
ているデータとの関係を示す図。
動作を説明するためのフローチャート図。
動作を説明するためのフローチャート図。
動作を説明するためのフローチャート図。
ためのフローチャート図。
理の詳細を説明するためのフローチャート図。
理の詳細を説明するためのフローチャート図。
ら見える論理的にディスクサブシステムに記録されてい
るデータの配置の構成と実際にRAIDを構成する個々
の磁気ディスク装置に記録されているデータとの関係を
示す図。
Claims (8)
- 【請求項1】予備の磁気ディスク装置と複数の磁気ディ
スク装置とでRAIDを構成したディスクサブシステム
において、 障害の発生した磁気ディスク装置のデータを前記予備の
磁気ディスク装置に復元する際に、前記障害の発生した
磁気ディスク装置から読み出せるデータは、そのデータ
を前記予備の磁気ディスク装置に格納し、前記障害の発
生した磁気ディスク装置から読み出せないデータは、前
記RAIDを構成する複数の磁気ディスク装置の内、障
害が発生していない磁気ディスク装置に格納されている
データから演算により復元し、この復元したデータを前
記予備の磁気ディスク装置に格納するデータ復元手段を
具備したことを特徴とするディスクサブシステム。 - 【請求項2】前記データ復元手段は、演算によりデータ
を復元する際、その演算に用いられるデータが前記障害
が発生していない磁気ディスク装置から読み出せない場
合には、その復元対象のデータがECCエラーであると
前記予備の磁気ディスク装置に登録すること特徴とする
請求項1記載のディスクサブシステム。 - 【請求項3】予備の磁気ディスク装置と複数の磁気ディ
スク装置とでRAIDを構成したディスクサブシステム
において、 障害の発生した磁気ディスク装置のデータを前記予備の
磁気ディスク装置に復元する際に、前記RAIDを構成
する複数の磁気ディスク装置の内、障害が発生していな
い磁気ディスク装置に格納されているデータから演算に
より復元し、この復元したデータを前記予備の磁気ディ
スク装置に格納するとともに、前記演算によりデータを
復元するとき、その演算に用いられるデータが前記障害
が発生していない磁気ディスク装置から読み出せない場
合には、その復元対象のデータがECCエラーであると
前記予備の磁気ディスク装置に登録するデータ復元手段
を具備したことを特徴とするディスクサブシステム。 - 【請求項4】複数の磁気ディスク装置でRAIDが構成
され、一つの磁気ディスク装置に障害が発生した場合に
はその障害が発生した磁気ディスク装置を新しい磁気デ
ィスク装置に交換するディスクサブシステムにおいて、 前記障害の発生した磁気ディスク装置のデータを前記交
換した新しい磁気ディスク装置に復元する際に、前記R
AIDを構成する複数の磁気ディスク装置の内、障害が
発生していない磁気ディスク装置に格納されているデー
タから演算により復元し、この復元したデータを前記交
換した新しい磁気ディスク装置に格納するとともに、前
記演算によりデータを復元するとき、その演算に用いら
れるデータが前記障害が発生していない磁気ディスク装
置から読み出せない場合には、その復元対象のデータが
ECCエラーであると前記交換した新しい磁気ディスク
装置に登録するデータ復元手段を具備したことを特徴と
するディスクサブシステム。 - 【請求項5】予備の磁気ディスク装置と複数の磁気ディ
スク装置とでRAIDを構成したディスクサブシステム
において、 障害の発生した磁気ディスク装置のデータを前記予備の
磁気ディスク装置に復元する際に、前記障害の発生した
磁気ディスク装置から読み出せるデータは、そのデータ
を前記予備の磁気ディスク装置に格納し、前記障害の発
生した磁気ディスク装置から読み出せないデータは、前
記RAIDを構成する複数の磁気ディスク装置の内、障
害が発生していない磁気ディスク装置に格納されている
データから演算により復元し、この復元したデータを前
記予備の磁気ディスク装置に格納することを特徴とする
ディスクサブシステムにおけるデータ復元方法。 - 【請求項6】前記演算によりデータを復元するとき、そ
の演算に用いられるデータが前記障害が発生していない
磁気ディスク装置から読み出せない場合には、その復元
対象のデータがECCエラーであると前記予備の磁気デ
ィスク装置に登録すること特徴とする請求項5記載のデ
ィスクサブシステムにおけるデータ復元方法。 - 【請求項7】予備の磁気ディスク装置と複数の磁気ディ
スク装置とでRAIDを構成したディスクサブシステム
において、 障害の発生した磁気ディスク装置のデータを前記予備の
磁気ディスク装置に復元する際に、前記RAIDを構成
する複数の磁気ディスク装置の内、障害が発生していな
い磁気ディスク装置に格納されているデータから演算に
より復元し、この復元したデータを前記予備の磁気ディ
スク装置に格納するとともに、前記演算によりデータを
復元するとき、その演算に用いられるデータが前記障害
が発生していない磁気ディスク装置から読み出せない場
合には、その復元対象のデータがECCエラーであると
前記予備の磁気ディスク装置に登録することを特徴とす
るディスクサブシステムにおけるデータ復元方法。 - 【請求項8】複数の磁気ディスク装置でRAIDが構成
され、一つの磁気ディスク装置に障害が発生した場合に
はその障害が発生した磁気ディスク装置を新しい磁気デ
ィスク装置に交換するディスクサブシステムにおいて、 前記障害の発生した磁気ディスク装置のデータを前記交
換した新しい磁気ディスク装置に復元する際に、前記R
AIDを構成する複数の磁気ディスク装置の内、障害が
発生していない磁気ディスク装置に格納されているデー
タから演算により復元し、この復元したデータを前記交
換した新しい磁気ディスク装置に格納するとともに、前
記演算によりデータを復元するとき、その演算に用いら
れるデータが前記障害が発生していない磁気ディスク装
置から読み出せない場合には、その復元対象のデータが
ECCエラーであると前記交換した新しい磁気ディスク
装置に登録することを特徴とするディスクサブシステム
におけるデータ復元方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11085205A JP2000276308A (ja) | 1999-03-29 | 1999-03-29 | ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11085205A JP2000276308A (ja) | 1999-03-29 | 1999-03-29 | ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000276308A true JP2000276308A (ja) | 2000-10-06 |
Family
ID=13852113
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11085205A Withdrawn JP2000276308A (ja) | 1999-03-29 | 1999-03-29 | ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000276308A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100463841B1 (ko) * | 2002-02-25 | 2004-12-29 | 한국전자통신연구원 | 레이드 서브 시스템과 이를 이용한 디스크 에러 모드에서데이터 입출력 및 복구 방법 |
| KR100489044B1 (ko) * | 2000-11-21 | 2005-05-11 | 엘지전자 주식회사 | 복수 패키지 관리 방법 |
| JP2005293119A (ja) * | 2004-03-31 | 2005-10-20 | Toshiba Solutions Corp | ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム |
| US7398459B2 (en) | 2003-01-20 | 2008-07-08 | Samsung Electronics Co., Ltd. | Parity storing method and error block recovering method in external storage subsystem |
| CN119847425A (zh) * | 2024-12-05 | 2025-04-18 | 苏州元脑智能科技有限公司 | 数据管理方法、装置、计算机设备及存储介质 |
-
1999
- 1999-03-29 JP JP11085205A patent/JP2000276308A/ja not_active Withdrawn
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100489044B1 (ko) * | 2000-11-21 | 2005-05-11 | 엘지전자 주식회사 | 복수 패키지 관리 방법 |
| KR100463841B1 (ko) * | 2002-02-25 | 2004-12-29 | 한국전자통신연구원 | 레이드 서브 시스템과 이를 이용한 디스크 에러 모드에서데이터 입출력 및 복구 방법 |
| US7398459B2 (en) | 2003-01-20 | 2008-07-08 | Samsung Electronics Co., Ltd. | Parity storing method and error block recovering method in external storage subsystem |
| JP2005293119A (ja) * | 2004-03-31 | 2005-10-20 | Toshiba Solutions Corp | ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム |
| CN119847425A (zh) * | 2024-12-05 | 2025-04-18 | 苏州元脑智能科技有限公司 | 数据管理方法、装置、计算机设备及存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3184171B2 (ja) | ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体 | |
| JP4767139B2 (ja) | ストレージ管理プログラム、ストレージ管理装置、およびストレージ管理方法 | |
| US7849356B2 (en) | Parity data management system apparatus and method | |
| JPWO2006123416A1 (ja) | ディスク故障復旧方法及びディスクアレイ装置 | |
| KR100711165B1 (ko) | 기억 제어 장치, 제어 방법 및 기록 매체 | |
| JP2001337792A (ja) | ディスクアレイ装置 | |
| JP2001344076A (ja) | ディスクアレイ装置 | |
| US20060190683A1 (en) | Disk array apparatus and backup method of data | |
| CN118708130A (zh) | 数据卷远程复制方法、装置、计算机设备及存储介质 | |
| KR100463841B1 (ko) | 레이드 서브 시스템과 이를 이용한 디스크 에러 모드에서데이터 입출력 및 복구 방법 | |
| US20190354433A1 (en) | Parity log with by-pass | |
| US20050246576A1 (en) | Redundant system utilizing remote disk mirroring technique, and initialization method for remote disk mirroring for in the system | |
| JP2000276308A (ja) | ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法 | |
| JP2001142650A (ja) | アレイディスク制御方法及び装置 | |
| JP3155836B2 (ja) | ディスクアレイ装置 | |
| CN101828189A (zh) | 用于中断写入恢复的数据存储方法、设备和系统 | |
| US10809940B1 (en) | Multilevel resiliency | |
| JPH08190461A (ja) | ディスクアレイシステム | |
| CN113625950A (zh) | 一种独立冗余磁盘阵列的初始化方法、系统、设备及介质 | |
| CN115373600B (zh) | 一种raid卡配置数据保存的方法、装置、设备及可读介质 | |
| JP2002123372A (ja) | キャッシュメモリ付きディスクアレイ装置及びそのエラー制御方法並びにその制御プログラムを記録した記録媒体 | |
| JPH09101866A (ja) | ディスクアレイシステムとその運用方法 | |
| JP2000293320A (ja) | ディスクサブシステム、ディスクサブシステムの検査診断方法及びディスクサブシステムのデータ復元方法 | |
| JPH11154058A (ja) | ディスクアレイ装置及びデータ保守方法 | |
| JPH08147112A (ja) | ディスクアレイ装置のエラー回復装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050414 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050606 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060216 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060221 |
|
| A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20060406 |