JP2000276308A - ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法 - Google Patents

ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法

Info

Publication number
JP2000276308A
JP2000276308A JP11085205A JP8520599A JP2000276308A JP 2000276308 A JP2000276308 A JP 2000276308A JP 11085205 A JP11085205 A JP 11085205A JP 8520599 A JP8520599 A JP 8520599A JP 2000276308 A JP2000276308 A JP 2000276308A
Authority
JP
Japan
Prior art keywords
data
magnetic disk
disk device
restored
spare
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11085205A
Other languages
English (en)
Inventor
Shuichi Abe
秀一 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11085205A priority Critical patent/JP2000276308A/ja
Publication of JP2000276308A publication Critical patent/JP2000276308A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

(57)【要約】 【課題】本発明は、障害が発生したデータの復元処理に
必要なデータが障害の発生していない磁気ディスク装置
から読み出せないことに起因してディスクサブシステム
が使用不能になることを防止するディスクサブシステム
を提供することを目的とする。 【解決手段】RAIDを構成したディスクサブシステム
において、障害の発生した磁気ディスク装置のデータを
前記予備の磁気ディスク装置に復元する際に、前記障害
の発生した磁気ディスク装置から読み出せるデータは、
そのデータを前記予備の磁気ディスク装置に格納し、前
記障害の発生した磁気ディスク装置から読み出せないデ
ータは、前記RAIDを構成する複数の磁気ディスク装
置の内、障害が発生していない磁気ディスク装置に格納
されているデータから演算により復元し、この復元した
データを前記予備の磁気ディスク装置に格納するデータ
復元手段を設けたことを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、PCサーバ等のサ
ーバ計算機において、高信頼性が要求される外部記憶装
置として使用されるRAID技術を使用したディスクサ
ブシステムの改良に関する。特に信頼性を更に高くする
RAID技術を使用したディスクサブシステムに関す
る。
【0002】
【従来の技術】RAID(Redundant Arr
ays of Inexpensive Disks)
技術は、David A.Patterson,Gar
thA.Gribson,Randy H.Katsに
より1987年に発表された論文「A Case fo
r Redundant Arrays of Ine
xpensive Disks 」で紹介されて実用化
されている。
【0003】そしてこのRAID技術は、一般的にレベ
ル1からレベル5に分類され、高信頼性が要求されるP
Cサーバ等のサーバ計算機のディスクサブシステムに使
用されている。
【0004】レベル5のRAID技術を使用したディス
クサブシステムの一例を図8を用いてその概要を説明す
る。図8において、ディスクサブシステムは、3台の磁
気ディスク装置DR1、DR2、DR3と一台の予備磁
気ディスク装置DRSとから構成されている。この図に
おいては、サーバ計算機やRAIDコントローラの図示
を省略している。
【0005】サーバ計算機が管理し磁気ディスク装置に
記録しているデータを所定単位のブロックに分割し、こ
れを3台の磁気ディスク装置DR1、DR2、DR3に
分散して記録する。この際に、冗長データとしてパリテ
ィを作成し、このパリティも分散して記録する。
【0006】このパリティは、次のような方法で生成さ
れる。パリティP1は、データDaとデータDbとの排
他的論理和演算を行うことで生成される。同様にパリテ
ィP2はデータDcとデータDdとの排他的論理和演算
で、パリティP3はデータDeとデータDfとの排他的
論理和演算で、パリティP4はデータDgとデータDh
との排他的論理和演算で生成される。
【0007】このように構成されたディスクサブシステ
ムにおいて、サーバ計算機からデータDbのリード要求
があった場合に、磁気ディスク装置DR2のデータDb
が記録されているメディア(磁気ディスク)の記録面の
障害又は磁気ディスク装置DR2全体の障害のため、デ
ータDbの読み出しができないときには、再度データリ
ードを試みてリトライを実施し、それでも読み出しがで
きない場合には、RAIDコントローラがデータDaと
パリティP1とのの排他的論理和演算を行いデータDb
を復元してサーバ計算機にリードデータとして出力して
サーバ計算機にはディスクサブシステムに障害が発生し
たことを認識させずに対応している。
【0008】このように障害が発生した場合、RAID
コントローラは障害が発生した磁気ディスク装置DR2
をRAID構成から切り離して磁気ディスク装置DR1
とDR3の2台の構成による縮退状態にする。
【0009】この縮退状態で更に別な磁気ディスク装置
に故障が発生すると、ディスクサブシステムからのデー
タの読み出しができなくなり、RAIDコントローラは
サーバ計算機に対してディスクサブシステムに障害が発
生したと通知することになる。
【0010】このように縮退状態で更に別な磁気ディス
ク装置に故障が発生してディスクサブシステムに障害が
発生させないように、RAIDを正常な状態に回復する
必要がある。
【0011】この回復処理は、上記縮退状態において予
備の磁気ディスク装置DRSに切り離した磁気ディスク
装置DR2のデータを復元することで行われる。この予
備の磁気ディスク装置DRSに切り離した磁気ディスク
装置DR2のデータを復元するには、磁気ディスク装置
DR1とDR3のそれぞれに対応するブロックのデータ
どうしの排他的論理和演算を行うことで実現できる。例
えばデータDeを復元するには、パリティP3とデータ
Dfとの排他的論理和演算で復元できる。
【0012】また、予備の磁気ディスク装置を持たない
ディスクサブシステムの回復処理では、障害の発生した
磁気ディスク装置を別の正常な磁気ディスク装置と交換
し、この交換した磁気ディスク装置にデータを上記と同
様に排他的論理和演算により復元する。
【0013】
【発明が解決しようとする課題】このようなRAID技
術を使用したディスクサブシステムにおいては、次のよ
うな問題点があった。障害が発生しRAID構成から切
り離した磁気ディスク装置のデータを予備の又は交換し
た磁気ディスク装置に復元する際に、上記切り離した磁
気ディスク装置の障害の内容がメディア(磁気ディス
ク)の記録面の場合には、障害の発生していないメディ
アからはそこに記録されているデータの読み出しが可能
にもかかわらず、読み出しが可能なデータも含めて全て
のデータを排他的論理和演算により求めるため、データ
の復元処理に大幅な時間を要していた。
【0014】また、このようなデータの復元処理の際
に、排他的論理和演算のためにRAID構成している障
害の発生していない磁気ディスク装置からデータを読み
出す際に、障害が発生してデータの読み出しができない
場合がある。このとき、この時点でデータの復元処理は
不可能になるばかりでなく、ディスクサブシステム自体
が使用不可になってしまっていた。このようにデータの
復元処理の際に障害が見つかるデータは、普段アクセス
がされていないあまり重要なデータではないと推測され
る。このようなあまり重要でないデータが読み出せない
ことに起因して、障害の発生した磁気ディスク装置のデ
ータの復元ができなくなるとともに、ディスクサブシス
テム自体が使用不能になることは大きな問題であった。
【0015】本発明は、これら従来の問題点を解決する
ためになされたもので、障害が発生した磁気ディスク装
置のデータの復元処理を高速化できるディスクサブシス
テムを提供することを目的とする。
【0016】また、本発明は、障害が発生した磁気ディ
スク装置のデータの復元処理の際に、データの復元処理
に必要なデータが障害の発生していない磁気ディスク装
置から読み出せないことに起因してRAIDが再構成で
きなくなり、ディスクサブシステムが使用不能になるこ
とを防止しするディスクサブシステムを提供することを
目的とする。
【0017】
【課題を解決するための手段】本発明は、予備の磁気デ
ィスク装置と複数の磁気ディスク装置とでRAIDを構
成したディスクサブシステムにおいて、障害の発生した
磁気ディスク装置のデータを前記予備の磁気ディスク装
置に復元する際に、前記障害の発生した磁気ディスク装
置から読み出せるデータは、そのデータを前記予備の磁
気ディスク装置に格納し、前記障害の発生した磁気ディ
スク装置から読み出せないデータは、前記RAIDを構
成する複数の磁気ディスク装置の内、障害が発生してい
ない磁気ディスク装置に格納されているデータから演算
により復元し、この復元したデータを前記予備の磁気デ
ィスク装置に格納するデータ復元手段を設けたことを特
徴とする。
【0018】このような構成によれば、データの復元処
理を高速化できる。また、本発明は、予備の磁気ディス
ク装置と複数の磁気ディスク装置とでRAIDを構成し
たディスクサブシステムにおいて、障害の発生した磁気
ディスク装置のデータを前記予備の磁気ディスク装置に
復元する際に、前記障害の発生した磁気ディスク装置か
ら読み出せるデータは、そのデータを前記予備の磁気デ
ィスク装置に格納し、前記障害の発生した磁気ディスク
装置から読み出せないデータは、前記RAIDを構成す
る複数の磁気ディスク装置の内、障害が発生していない
磁気ディスク装置に格納されているデータから演算によ
り復元し、この復元したデータを前記予備の磁気ディス
ク装置に格納するデータ復元手段を設け、更に前記演算
によりデータを復元する際、その演算に用いられるデー
タが前記障害が発生していない磁気ディスク装置から読
み出せない場合には、その復元対象のデータがECCエ
ラーであると前記予備の磁気ディスク装置に登録するこ
とを特徴とする。
【0019】このような構成によれば、データの復元処
理を高速化できるとともに障害が発生した磁気ディスク
装置のデータの復元処理の際に、データの復元処理に必
要なデータが障害の発生していない磁気ディスク装置か
ら読み出せないことに起因してRAIDが再構成できな
くなり、ディスクサブシステムが使用不能になることを
防止できる。
【0020】また、本発明は、予備の磁気ディスク装置
と複数の磁気ディスク装置とでRAIDを構成したディ
スクサブシステムにおいて、障害の発生した磁気ディス
ク装置のデータを前記予備の磁気ディスク装置に復元す
る際に、前記RAIDを構成する複数の磁気ディスク装
置の内、障害が発生していない磁気ディスク装置に格納
されているデータから演算により復元し、この復元した
データを前記予備の磁気ディスク装置に格納するととも
に、前記演算によりデータを復元するとき、その演算に
用いられるデータが前記障害が発生していない磁気ディ
スク装置から読み出せない場合には、その復元対象のデ
ータがECCエラーであると前記予備の磁気ディスク装
置に登録するデータ復元手段を設けたことを特徴とす
る。
【0021】このような構成によれば、障害が発生した
磁気ディスク装置のデータの復元処理の際に、データの
復元処理に必要なデータが障害の発生していない磁気デ
ィスク装置から読み出せないことに起因してRAIDが
再構成できなくなり、ディスクサブシステムが使用不能
になることを防止できる。
【0022】更に、本発明は、複数の磁気ディスク装置
でRAIDが構成され、一つの磁気ディスク装置に障害
が発生した場合にはその障害が発生した磁気ディスク装
置を新しい磁気ディスク装置に交換するディスクサブシ
ステムにおいて、前記障害の発生した磁気ディスク装置
のデータを前記交換した新しい磁気ディスク装置に復元
する際に、前記RAIDを構成する複数の磁気ディスク
装置の内、障害が発生していない磁気ディスク装置に格
納されているデータから演算により復元し、この復元し
たデータを前記交換した新しい磁気ディスク装置に格納
するとともに、前記演算によりデータを復元するとき、
その演算に用いられるデータが前記障害が発生していな
い磁気ディスク装置から読み出せない場合には、その復
元対象のデータがECCエラーであると前記交換した新
しい磁気ディスク装置に登録するデータ復元手段を設け
たことを特徴とする。
【0023】このような構成によれば、障害が発生した
磁気ディスク装置のデータの復元処理の際に、データの
復元処理に必要なデータが障害の発生していない磁気デ
ィスク装置から読み出せないことに起因してRAIDが
再構成できなくなり、ディスクサブシステムが使用不能
になることを防止できる。
【0024】
【発明の実施の形態】以下、図面を参照して本発明の第
1の実施形態について説明する。図1は本発明の第1の
実施形態に関わるシステムの概略構成を説明する図であ
る。図1には、PCサーバなどのサーバ計算機100と
ディスクサブシステム110とからなる計算機システム
の概略構成を図示している。
【0025】サーバ計算機100にはシステムバス10
1が設けられており、このシステムバス101にCPU
102が接続されている。また、システムバス101に
はSCSIインタフェース(I/F)111を介してデ
ィスクサブシステム110が接続されている。尚、SC
SIは、Small Computer System
Interfaceの省略語である。
【0026】ディスクサブシステム110は、CPU1
12、ROM113、RAM114、SCSIインタフ
ェース(I/F)111とSCSIインタフェース(I
/F)116がバス115を介して相互に接続されてい
るRAID制御部とSCSIバス117を介してSCS
Iインタフェース(I/F)116に接続された4台の
磁気ディスク装置HD1、HD2、HD3、HDSとか
ら構成されている。
【0027】CPU112は、ROM113に格納され
たファームウェアに基づいて、ディスクサブシステム1
10の全体を制御する。RAM114には、サーバ計算
機100からディスクサブシステム110に対するデー
タのリード又はライトの命令が出された際のアドレス情
報を実際の磁気ディスク装置に記録されているアドレス
情報に変換する変換テーブルが設けられている。また、
RAM114は、CPU112の動作に伴う各種データ
が保存される。磁気ディスク装置HD1と磁気ディスク
装置HD2と磁気ディスク装置HD3とでレベル5のR
AIDを構成している。そして、磁気ディスク装置HD
Sは、予備の磁気ディスク装置として設けられている。
【0028】図2には、サーバ計算機100から見える
論理的にディスクサブシステム110に記録されている
データの配置の構成と実際にRAIDを構成する個々の
磁気ディスク装置に記録されているデータとの関係を図
示している。
【0029】サーバ計算機100から見て論理的にディ
スクサブシステム110に記録されているデータ200
は、所定サイズの6つのブロックに分割されたデータD
1〜D6に分割されている。この6つのデータD1〜D
6は、図示のように3台の磁気ディスク装置HD1、H
D2、HD3に記録されている。磁気ディスク装置HD
1には、パリティデータP1、データD3、データD5
とが記録されている。同様に、磁気ディスク装置HD2
には、データD2、パリティデータP2、データD6と
が記録されている。また、磁気ディスク装置HD3に
は、データD2、データD4、パリティデータP3とが
記録されている。磁気ディスク装置HDSは、予備の磁
気ディスク装置であるため、現時点では何も記録されて
いない。パリティP1は、データD1とデータD2との
排他的論理和演算により求められたデータである。同様
にパリティP2は、データD3とデータD4との排他的
論理和演算により求められたデータである。また、パリ
ティP3は、データD5とデータD6との排他的論理和
演算により求められたデータである。
【0030】以下、図3、図4、図5に示すフローチャ
ートに基づいて、本発明の第1の実施形態におけるデー
タの復元動作について説明する。尚、データの復元動作
中においても、並行してサーバ計算機100からのディ
スクサブシステム110へのデータの書き込み及び読み
出しの命令を受け付け、その処理を行うものとする。復
元動作中にサーバ計算機100からデータの書き込み又
は読み出しの命令を受け付けた場合の処理は、以下の動
作説明の中で説明する。
【0031】以下、レベル5のRAIDを構成している
図1に図示したディスクサブシステム110において、
メディアの障害により磁気ディスク装置HD3からデー
タD2の読み出しができなくなり、RAID制御装置の
CPU112が磁気ディスク装置HD3をRAID構成
から切り離して縮退状態とし、予備の磁気ディスク装置
HDSに磁気ディスク装置HD3に格納されていたデー
タを復元する場合のCPU112の制御に基づく動作を
説明する。
【0032】まず、磁気ディスク装置HD3に格納され
ていたデータを予備の磁気ディスク装置HDSに復元す
るに際して、CPU112はRAM114上に図6に示
すようなデータ変更/復元マップ300を作成する(ス
テップS1)。このデータ変更/復元マップ300は、
データ301、状態ビット302、復元ビット303の
3行から構成されており、データを復元する磁気ディス
ク装置HD3の復元動作中におけるデータの変更及び復
元の状態を管理するために設けられている。従って、デ
ータ301としては、D2、D4、P3が登録される。
また、この初期時には状態ビット302と復元ビット3
03は、「0」に設定される。復元ビット303は、以
下に説明するデータの復元処理が終了した状態をデータ
(ブロック)毎に表すものである。このビットが「1」
に設定されているということは、その対応するデータが
予備の磁気ディスク装置HDSに復元されたことを意味
する。また、状態ビット302は、この復元動作中にサ
ーバ計算機100からの書き込み命令により、対応する
ブロックのデータが変更された場合にセットされる。
【0033】次に変数Bを「1」を設定する(ステップ
S2)。この変数Bは、磁気ディスク装置HD3の何番
目のブロックのデータを復元動作するかを示すものであ
る。次にフラグ情報である変数SETを「1」を設定す
る(ステップS3)。この変数SETが「1」にセット
されている場合は、CPU112が磁気ディスク装置H
D3のブロック単位のデータを予備の磁気ディスク装置
HDSに復元動作中であることを示す。次にB番目のブ
ロックのデータの復元処理を行う(ステップS4)。即
ち、1番目のブロック(データD1が格納されているブ
ロック)のデータ(データD1)の復元処理を行う。
【0034】この復元処理の詳細は、図7に示すフロー
チャートを用いて説明する。まず、該当する1番目のブ
ロックの状態ビットに「1」が設定されているかどうか
をデータ変更/復元マップ300を参照してチェックす
る(ステップS50)。このチェックの結果、状態ビッ
トに「1」が設定されている場合には、ステップS52
へ進む。現時点では、状態ビットに「0」が設定されて
いるため、ステップS51に進む。
【0035】次に、1番目のブロックのデータD2が障
害の発生した磁気ディスク装置HD3から読み出せるか
をチェックする(ステップS51)。読み出せる場合に
は、磁気ディスク装置HD3からデータD2を読み出
し、予備の磁気ディスク装置HDSの対応するブロック
にコピーして復元する(ステップS53)。そして、復
元動作を終了する。もし、読み出せない場合には、ステ
ップS52に進む。
【0036】次に1番目のブロックのデータD2が排他
的論理和演算で復元できるかをチェックする。換言する
と、この排他的論理和演算をするためのデータであるパ
リティP1とデータD1とが、それぞれ磁気ディスク装
置HD1及び磁気ディスク装置HD2から読み出せるか
をチェックする(ステップS52)。読み出せる場合に
は、ステップS54へ進み、パリティP1とデータD1
との排他的論理和演算を行い、データD2を復元し、予
備の磁気ディスク装置HDSの対応するブロックにコピ
ーする(ステップS54)。そして、復元動作を終了す
る。また、読み出せない場合には、ステップS55へ進
む。
【0037】ステップS55では、現在復元処理をして
いるブロックのデータが、障害の発生した磁気ディスク
装置HD3から読み出せず、更に排他的論理和演算によ
っても復元できない状態のため、予備の磁気ディスク装
置HDSの対応するブロックにECC(Error C
hecking and Correcting )エ
ラーが発生したとして、予備の磁気ディスク装置HDS
のメディアの特定エリアに設定した図示しないエラー状
態マップに該当するブロックにECCエラーが発生した
ことのフラグを登録する。この様な一連の動作でデータ
の復元処理を行い、図3のステップS4のデータの復元
処理が終了する。
【0038】次に図3のステップS5に進む。ステップ
S5では、ステップS4においてデータD2が復元され
たので、図6に示すデータD2に対応する復元ビットを
「1」にセットする。
【0039】次にステップS6では、変数Bを+1して
インクリメントする。続いてステップS7において、変
数SETを「0」を設定する。この変数SETを「0」
にセットすることで、、CPU112が磁気ディスク装
置HD3のブロック単位のデータを予備の磁気ディスク
装置HDSに復元する動作が終了したことを意味する。
【0040】続いて処理はステップS8に進み、既に復
元したブロックのデータがサーバ計算機100からのデ
ータの書き込み命令により変更されていないかをチェッ
クする。具体的には、図6に示したデータ変更/復元マ
ップ300において、復元ビット303が「1」に設定
されているデータの内、状態ビット302が「1」に設
定されているデータの有無をチェックする。このチェッ
クの結果、復元ビット303と状態ビット302の双方
が「1」に設定されているデータがある場合には、その
データが既にデータが復元されたもので、且つその後の
サーバ計算機100からのデータの書き込み命令により
変更されているものであると判断されステップS10へ
進む。また、復元ビット303と状態ビット302の双
方が「1」に設定されているデータがない場合には、ス
テップS9に進む。以下、ステップS9に進む場合の動
作を説明し、ステップS10へ進む場合の動作は、後に
説明する。
【0041】ステップS9では、全てのブロックのデー
タが復元されたかを変数Bの値を見ることでチェックす
る。全てのブロックのデータが復元された場合には、全
ての復元処理が終了する。全てのブロックのデータが復
元されていない場合には、ステップS3へ戻り以上説明
した動作を繰り返す。
【0042】次に以上説明したステップS3からS9の
処理を繰り返している間にサーバ計算機100からディ
スクサブシステム110へのデータの書き込み又は読み
出しの命令をCPU112がSCSIインタフェース1
11を介して受理した場合には、以上説明したデータの
復元処理動作を中断して、そのデータの書き込み又は読
み出し処理を実行し、その後復元処理動作を再開する。
【0043】まず、CPU112がサーバ計算機100
からデータの読み出し命令を受理した場合について説明
する。RAIDを構成する正常な磁気ディスク装置から
のデータの読み出しであれば、そのデータを読み出す。
もし、障害が発生しRAID構成から切り離した磁気デ
ィスク装置HD3からのデータの読み出しの場合には、
もしそのデータが磁気ディスク装置HD3から読み出せ
る場合には、そのまま読み出し、読み出せない場合に
は、他の正常な磁気ディスク装置から読み出した対応す
るブロックのデータの排他的論理和演算により求めたデ
ータを読み出しデータとしてサーバ計算機100からへ
転送する。ただし、このように説明したいずれの読み出
しの場合においても、メディアの障害が原因によりにデ
ータが読み出せないときには、上述したようにECCエ
ラーとして登録し、サーバ計算機100からにその旨を
通知する。
【0044】次にCPU112がサーバ計算機100か
らデータの書き込み命令を受理した場合について説明す
る。まず、上記変数SETが「0」であることを確認す
る。もし、上記変数SETが「1」の場合には、「0」
になるまで、その処理を待機させる。変数SETが
「0」であることを確認できた場合には、以下の処理を
行う。RAIDを構成する正常な磁気ディスク装置に記
録されているデータの書き込みであれば、そのまま書き
込み処理を実施する。この際、パリティの変更をするこ
とは説明するまでもない。
【0045】また、障害が発生しRAID構成から切り
離した磁気ディスク装置HD3へのデータの書き込みの
場合、例えばデータD4の書き込みの場合には、次のよ
うに行う。まず、この新しい書き込みデータD4と磁気
ディスク装置HD1に書き込まれているデータD3とで
排他的論理和演算を行い得られたパリティデータを新し
いパリティP2として磁気ディスク装置HD2に書き込
む。そして、新しい書き込みデータD4を実際に書き込
む代わりに図6に示したデータ変更/復元マップ300
のデータD4に対応する状態ビット302を「1」にセ
ットする。この様な処理をすることで書き込み処理を実
施する。
【0046】次に図4のステップS8において、復元ビ
ット303と状態ビット302の双方が「1」に設定さ
れており、既にそのデータが復元されたもので、且つそ
の後サーバ計算機100からのデータの書き込み命令に
より変更されているデータがあると判断されステップS
10へ進む場合の動作を説明する。以下の説明ではデー
タ変更/復元マップ300が図4に示した状態になって
いる場合を例にして説明する。
【0047】ステップS10では、フラグ情報である変
数SETを「1」を設定する。続いて、ステップS11
では、ステップS8において復元ビット303と状態ビ
ット302の双方が「1」に設定されていると判断され
たデータD2の復元処理を再度実行する。この復元処理
は、図7で示したルーチンに基づき行われるもので、既
に説明したので、ここではその説明を省略する。
【0048】次にステップS12で図6に示したデータ
変更/復元マップ300におけるデータD2に対応する
状態ビット302を「0」に設定する。続いてステップ
S13において、変数SETを「0」を設定しステップ
S8に戻る。この様に復元ビット303と状態ビット3
02の双方が「1」に設定されているデータが無くなる
まで、ステップS8→S10→S11→S12→S13
の処理を続ける。
【0049】次に本発明の第2の実施形態について説明
する。第1の実施形態との違いは、図7に示した復元処
理の動作が異なり、他の動作は、第1の実施形態と同一
である。
【0050】第2の実施形態における復元処理の動作を
図8に示したフローチャートを用いて説明する。動作説
明の前提としては、第1の実施形態と同様にレベル5の
RAIDを構成している図1に図示したディスクサブシ
ステム110において、メディアの障害により磁気ディ
スク装置HD3からデータD2の読み出しができなくな
り、RAID制御装置のCPU112が磁気ディスク装
置HD3をRAID構成から切り離して縮退状態とし、
予備の磁気ディスク装置HDSに磁気ディスク装置HD
3に格納されていたデータを復元する場合のCPU11
2の制御に基づく動作を説明する。
【0051】まず、1番目のブロックのデータD2が排
他的論理和演算で復元できるかをチェックする。換言す
ると、この排他的論理和演算をするためのデータである
パリティP1とデータD1とが、それぞれ磁気ディスク
装置HD1及び磁気ディスク装置HD2から読み出せる
かをチェックする(ステップS60)。読み出せる場合
には、ステップS61へ進み、パリティP1とデータD
1との排他的論理和演算を行い、データD2を復元し、
予備の磁気ディスク装置HDSの対応するブロックにコ
ピーする(ステップS61)。そして、復元動作を終了
する。
【0052】また、読み出せない場合には、ステップS
62へ進む。ステップS62では、1番目のブロックの
データD2が障害の発生した磁気ディスク装置HD3か
ら読み出せるかをチェックする(ステップS62)。読
み出せる場合には、磁気ディスク装置HD3からデータ
D2を読み出し、予備の磁気ディスク装置HDSの対応
するブロックにコピーして復元する(ステップS6
3)。そして、復元動作を終了する。
【0053】もし、読み出せない場合には、ステップS
64に進む。ステップS64では、現在復元処理をして
いるブロックのデータが、排他的論理和演算によっても
復元できず、更に障害の発生した磁気ディスク装置HD
3から読み出せない状態のため、予備の磁気ディスク装
置HDSの対応するブロックにECCエラーが発生した
として、予備の磁気ディスク装置HDSのメディアの特
定エリアに設定した図示しないエラー状態マップに該当
するブロックにECCエラーが発生したことのフラグを
登録する。この様な一連の動作でデータの復元処理を行
い、図3のステップS4のデータの復元処理が終了す
る。
【0054】次に本発明の第3の実施形態について説明
をする。第1の実施形態との違いは、図7に示した復元
処理の動作が異なることと、ディスクサブシステム11
0に予備の磁気ディスク装置を持たず、RAIDを構成
する磁気ディスク装置に障害が発生した場合には、その
磁気ディスク装置を新しい正常な磁気ディスク装置と交
換することである。その他の動作は、第1の実施形態と
同一である。
【0055】第3の実施形態における復元処理の動作を
図9に示したフローチャートを用いて説明する。動作説
明の前提としては、第1の実施形態と同様にレベル5の
RAIDを構成している図1に図示したディスクサブシ
ステム110において、メディアの障害により磁気ディ
スク装置HD3からデータD2の読み出しができなくな
り、磁気ディスク装置HD3を新しい正常な磁気ディス
ク装置と交換し、この交換した新しい磁気ディスク装置
(図示せず)に磁気ディスク装置HD3に格納されてい
たデータを復元する場合のCPU112の制御に基づく
動作を説明する。
【0056】まず、1番目のブロックのデータD2が排
他的論理和演算で復元できるかをチェックする。換言す
ると、この排他的論理和演算をするためのデータである
パリティP1とデータD1とが、それぞれ磁気ディスク
装置HD1及び磁気ディスク装置HD2から読み出せる
かをチェックする(ステップS70)。読み出せる場合
には、ステップS71へ進み、パリティP1とデータD
1との排他的論理和演算を行い、データD2を復元し、
交換した新しい磁気ディスク装置の対応するブロックに
コピーする(ステップS71)。そして、復元動作を終
了する。
【0057】また、読み出せない場合には、ステップS
72へ進む。ステップS72では、現在復元処理をして
いるブロックのデータが、排他的論理和演算によっても
復元できないため、交換した新しい磁気ディスク装置の
対応するブロックにECCエラーが発生したとして、交
換した新しい磁気ディスク装置のメディアの特定エリア
に設定した図示しないエラー状態マップに該当するブロ
ックにECCエラーが発生したことのフラグを登録す
る。この様な一連の動作でデータの復元処理を行い、図
3のステップS4のデータの復元処理が終了する。
【0058】以上の説明では、復元処理をしているブロ
ックのデータが、復元できないため、ECCエラーが発
生したとして、データの復元をしている磁気ディスク装
置にECCエラーが発生したことのフラグを登録すると
説明した。しかし、その後、その復元できなかったデー
タがサーバ計算機100により新たにデータが書き込ま
れた場合には、そのフラグの登録を削除すればよい。
【0059】尚、このようにECCエラーが発生したこ
とのフラグが登録されるデータは、従来技術の説明で述
べたように、普段アクセスがされていないあまり重要な
データではないと推測される。従って、データが復元で
きなくてRAIDの再構成ができなくなり、ディスクサ
ブシステム自体が使用不能になることに比べて、復元で
きないデータにECCエラーが発生したと登録する処理
の方が、システム全体から見れば、より良い対策であ
る。
【0060】
【発明の効果】以上説明した通り、本発明によれば、デ
ータの復元処理を高速化できるとともに、障害が発生し
た磁気ディスク装置のデータの復元処理の際に、データ
の復元処理に必用なデータが障害の発生していない磁気
ディスク装置から読み出せないことに起因してRAID
が再構成できなくなり、ディスクサブシステムが使用不
能になることを防止できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に関わるシステムの概
略構成を示す図である。
【図2】サーバ計算機から見える論理的にディスクサブ
システムに記録されているデータの配置の構成と実際に
RAIDを構成する個々の磁気ディスク装置に記録され
ているデータとの関係を示す図。
【図3】本発明の第1の実施形態におけるデータの復元
動作を説明するためのフローチャート図。
【図4】本発明の第1の実施形態におけるデータの復元
動作を説明するためのフローチャート図。
【図5】本発明の第1の実施形態におけるデータの復元
動作を説明するためのフローチャート図。
【図6】データ変更/復元マップを示す図。
【図7】図3におけるデータ復元処理の詳細を説明する
ためのフローチャート図。
【図8】本発明の第2の実施形態におけるデータ復元処
理の詳細を説明するためのフローチャート図。
【図9】本発明の第3の実施形態におけるデータ復元処
理の詳細を説明するためのフローチャート図。
【図10】従来技術を説明するための、サーバ計算機か
ら見える論理的にディスクサブシステムに記録されてい
るデータの配置の構成と実際にRAIDを構成する個々
の磁気ディスク装置に記録されているデータとの関係を
示す図。
【符号の説明】
100‥‥サーバ計算機 110‥‥ディスクサブシステム 111‥‥SCSIインタフェース 112‥‥CPU 113‥‥ROM 114‥‥RAM 115‥‥バス 116‥‥SCSIインタフェース 117‥‥SCSIバス 118‥‥磁気ディスク装置HD1 119‥‥磁気ディスク装置HD2 120‥‥磁気ディスク装置HD3 121‥‥磁気ディスク装置HD4
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 12/16 320 G06F 12/16 320L

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】予備の磁気ディスク装置と複数の磁気ディ
    スク装置とでRAIDを構成したディスクサブシステム
    において、 障害の発生した磁気ディスク装置のデータを前記予備の
    磁気ディスク装置に復元する際に、前記障害の発生した
    磁気ディスク装置から読み出せるデータは、そのデータ
    を前記予備の磁気ディスク装置に格納し、前記障害の発
    生した磁気ディスク装置から読み出せないデータは、前
    記RAIDを構成する複数の磁気ディスク装置の内、障
    害が発生していない磁気ディスク装置に格納されている
    データから演算により復元し、この復元したデータを前
    記予備の磁気ディスク装置に格納するデータ復元手段を
    具備したことを特徴とするディスクサブシステム。
  2. 【請求項2】前記データ復元手段は、演算によりデータ
    を復元する際、その演算に用いられるデータが前記障害
    が発生していない磁気ディスク装置から読み出せない場
    合には、その復元対象のデータがECCエラーであると
    前記予備の磁気ディスク装置に登録すること特徴とする
    請求項1記載のディスクサブシステム。
  3. 【請求項3】予備の磁気ディスク装置と複数の磁気ディ
    スク装置とでRAIDを構成したディスクサブシステム
    において、 障害の発生した磁気ディスク装置のデータを前記予備の
    磁気ディスク装置に復元する際に、前記RAIDを構成
    する複数の磁気ディスク装置の内、障害が発生していな
    い磁気ディスク装置に格納されているデータから演算に
    より復元し、この復元したデータを前記予備の磁気ディ
    スク装置に格納するとともに、前記演算によりデータを
    復元するとき、その演算に用いられるデータが前記障害
    が発生していない磁気ディスク装置から読み出せない場
    合には、その復元対象のデータがECCエラーであると
    前記予備の磁気ディスク装置に登録するデータ復元手段
    を具備したことを特徴とするディスクサブシステム。
  4. 【請求項4】複数の磁気ディスク装置でRAIDが構成
    され、一つの磁気ディスク装置に障害が発生した場合に
    はその障害が発生した磁気ディスク装置を新しい磁気デ
    ィスク装置に交換するディスクサブシステムにおいて、 前記障害の発生した磁気ディスク装置のデータを前記交
    換した新しい磁気ディスク装置に復元する際に、前記R
    AIDを構成する複数の磁気ディスク装置の内、障害が
    発生していない磁気ディスク装置に格納されているデー
    タから演算により復元し、この復元したデータを前記交
    換した新しい磁気ディスク装置に格納するとともに、前
    記演算によりデータを復元するとき、その演算に用いら
    れるデータが前記障害が発生していない磁気ディスク装
    置から読み出せない場合には、その復元対象のデータが
    ECCエラーであると前記交換した新しい磁気ディスク
    装置に登録するデータ復元手段を具備したことを特徴と
    するディスクサブシステム。
  5. 【請求項5】予備の磁気ディスク装置と複数の磁気ディ
    スク装置とでRAIDを構成したディスクサブシステム
    において、 障害の発生した磁気ディスク装置のデータを前記予備の
    磁気ディスク装置に復元する際に、前記障害の発生した
    磁気ディスク装置から読み出せるデータは、そのデータ
    を前記予備の磁気ディスク装置に格納し、前記障害の発
    生した磁気ディスク装置から読み出せないデータは、前
    記RAIDを構成する複数の磁気ディスク装置の内、障
    害が発生していない磁気ディスク装置に格納されている
    データから演算により復元し、この復元したデータを前
    記予備の磁気ディスク装置に格納することを特徴とする
    ディスクサブシステムにおけるデータ復元方法。
  6. 【請求項6】前記演算によりデータを復元するとき、そ
    の演算に用いられるデータが前記障害が発生していない
    磁気ディスク装置から読み出せない場合には、その復元
    対象のデータがECCエラーであると前記予備の磁気デ
    ィスク装置に登録すること特徴とする請求項5記載のデ
    ィスクサブシステムにおけるデータ復元方法。
  7. 【請求項7】予備の磁気ディスク装置と複数の磁気ディ
    スク装置とでRAIDを構成したディスクサブシステム
    において、 障害の発生した磁気ディスク装置のデータを前記予備の
    磁気ディスク装置に復元する際に、前記RAIDを構成
    する複数の磁気ディスク装置の内、障害が発生していな
    い磁気ディスク装置に格納されているデータから演算に
    より復元し、この復元したデータを前記予備の磁気ディ
    スク装置に格納するとともに、前記演算によりデータを
    復元するとき、その演算に用いられるデータが前記障害
    が発生していない磁気ディスク装置から読み出せない場
    合には、その復元対象のデータがECCエラーであると
    前記予備の磁気ディスク装置に登録することを特徴とす
    るディスクサブシステムにおけるデータ復元方法。
  8. 【請求項8】複数の磁気ディスク装置でRAIDが構成
    され、一つの磁気ディスク装置に障害が発生した場合に
    はその障害が発生した磁気ディスク装置を新しい磁気デ
    ィスク装置に交換するディスクサブシステムにおいて、 前記障害の発生した磁気ディスク装置のデータを前記交
    換した新しい磁気ディスク装置に復元する際に、前記R
    AIDを構成する複数の磁気ディスク装置の内、障害が
    発生していない磁気ディスク装置に格納されているデー
    タから演算により復元し、この復元したデータを前記交
    換した新しい磁気ディスク装置に格納するとともに、前
    記演算によりデータを復元するとき、その演算に用いら
    れるデータが前記障害が発生していない磁気ディスク装
    置から読み出せない場合には、その復元対象のデータが
    ECCエラーであると前記交換した新しい磁気ディスク
    装置に登録することを特徴とするディスクサブシステム
    におけるデータ復元方法。
JP11085205A 1999-03-29 1999-03-29 ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法 Withdrawn JP2000276308A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11085205A JP2000276308A (ja) 1999-03-29 1999-03-29 ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11085205A JP2000276308A (ja) 1999-03-29 1999-03-29 ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法

Publications (1)

Publication Number Publication Date
JP2000276308A true JP2000276308A (ja) 2000-10-06

Family

ID=13852113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11085205A Withdrawn JP2000276308A (ja) 1999-03-29 1999-03-29 ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法

Country Status (1)

Country Link
JP (1) JP2000276308A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100463841B1 (ko) * 2002-02-25 2004-12-29 한국전자통신연구원 레이드 서브 시스템과 이를 이용한 디스크 에러 모드에서데이터 입출력 및 복구 방법
KR100489044B1 (ko) * 2000-11-21 2005-05-11 엘지전자 주식회사 복수 패키지 관리 방법
JP2005293119A (ja) * 2004-03-31 2005-10-20 Toshiba Solutions Corp ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム
US7398459B2 (en) 2003-01-20 2008-07-08 Samsung Electronics Co., Ltd. Parity storing method and error block recovering method in external storage subsystem
CN119847425A (zh) * 2024-12-05 2025-04-18 苏州元脑智能科技有限公司 数据管理方法、装置、计算机设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100489044B1 (ko) * 2000-11-21 2005-05-11 엘지전자 주식회사 복수 패키지 관리 방법
KR100463841B1 (ko) * 2002-02-25 2004-12-29 한국전자통신연구원 레이드 서브 시스템과 이를 이용한 디스크 에러 모드에서데이터 입출력 및 복구 방법
US7398459B2 (en) 2003-01-20 2008-07-08 Samsung Electronics Co., Ltd. Parity storing method and error block recovering method in external storage subsystem
JP2005293119A (ja) * 2004-03-31 2005-10-20 Toshiba Solutions Corp ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム
CN119847425A (zh) * 2024-12-05 2025-04-18 苏州元脑智能科技有限公司 数据管理方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
JP3184171B2 (ja) ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
JP4767139B2 (ja) ストレージ管理プログラム、ストレージ管理装置、およびストレージ管理方法
US7849356B2 (en) Parity data management system apparatus and method
JPWO2006123416A1 (ja) ディスク故障復旧方法及びディスクアレイ装置
KR100711165B1 (ko) 기억 제어 장치, 제어 방법 및 기록 매체
JP2001337792A (ja) ディスクアレイ装置
JP2001344076A (ja) ディスクアレイ装置
US20060190683A1 (en) Disk array apparatus and backup method of data
CN118708130A (zh) 数据卷远程复制方法、装置、计算机设备及存储介质
KR100463841B1 (ko) 레이드 서브 시스템과 이를 이용한 디스크 에러 모드에서데이터 입출력 및 복구 방법
US20190354433A1 (en) Parity log with by-pass
US20050246576A1 (en) Redundant system utilizing remote disk mirroring technique, and initialization method for remote disk mirroring for in the system
JP2000276308A (ja) ディスクサブシステム及びディスクサブシステムにおけるデータ復元方法
JP2001142650A (ja) アレイディスク制御方法及び装置
JP3155836B2 (ja) ディスクアレイ装置
CN101828189A (zh) 用于中断写入恢复的数据存储方法、设备和系统
US10809940B1 (en) Multilevel resiliency
JPH08190461A (ja) ディスクアレイシステム
CN113625950A (zh) 一种独立冗余磁盘阵列的初始化方法、系统、设备及介质
CN115373600B (zh) 一种raid卡配置数据保存的方法、装置、设备及可读介质
JP2002123372A (ja) キャッシュメモリ付きディスクアレイ装置及びそのエラー制御方法並びにその制御プログラムを記録した記録媒体
JPH09101866A (ja) ディスクアレイシステムとその運用方法
JP2000293320A (ja) ディスクサブシステム、ディスクサブシステムの検査診断方法及びディスクサブシステムのデータ復元方法
JPH11154058A (ja) ディスクアレイ装置及びデータ保守方法
JPH08147112A (ja) ディスクアレイ装置のエラー回復装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050414

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060221

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060406