JPH11119919A - 記憶システムへのデータ書き込み方法 - Google Patents

記憶システムへのデータ書き込み方法

Info

Publication number
JPH11119919A
JPH11119919A JP10235862A JP23586298A JPH11119919A JP H11119919 A JPH11119919 A JP H11119919A JP 10235862 A JP10235862 A JP 10235862A JP 23586298 A JP23586298 A JP 23586298A JP H11119919 A JPH11119919 A JP H11119919A
Authority
JP
Japan
Prior art keywords
disk
log
data
storage
rli
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10235862A
Other languages
English (en)
Other versions
JPH11119919A5 (ja
JP4163298B2 (ja
Inventor
Douglas L Voigt
ダグラス・エル・ヴォイグト
Don L Burkes
ドン・エル・ブルケス
Kirk A Hanson
キルク・エー・ハンソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JPH11119919A publication Critical patent/JPH11119919A/ja
Publication of JPH11119919A5 publication Critical patent/JPH11119919A5/ja
Application granted granted Critical
Publication of JP4163298B2 publication Critical patent/JP4163298B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing
    • G11B19/12Control of operating function, e.g. switching from recording to reproducing by sensing distinguishing features of or on records, e.g. diameter end mark
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/002Programmed access in sequence to a plurality of record carriers or indexed parts, e.g. tracks, thereof, e.g. for editing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/40Combinations of multiple record carriers
    • G11B2220/41Flat as opposed to hierarchical combination, e.g. library of tapes or discs, CD changer, or groups of record carriers that together store one title
    • G11B2220/415Redundant array of inexpensive disks [RAID] systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 複数の記憶ディスクを有するデータ記憶シス
テムにおいて、システムの性能を改善すると共に、シス
テムの誤り又は故障時に記録を確実に回復可能にする。 【解決手段】 NVRAMマップ45はメモリマップ記
憶域の部分集合であり、ディスクマップ50はディスク
アレイに属する。RLI55に記憶されたNVRAMマ
ップ45内のインクリメンタルな変化はディスクログ6
0あるいはディスクステージングログ65にポストされ
る。“排出"/“強制引出し"ポスト要求の発生時にRL
I55からのトランザクションログデータのページがデ
ィスクログ60/ディスクステージングログ65に書き
込まれる。このポストによりNVRAMマップ45の変
化はディスクマップ50が更新前にNVRAMに損失が
生じた際にディスクアレイに確実に記憶される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一般的にはデータ記
憶システムに関し、特にディスクアレイ記憶システムの
ためのトランザクションログ( transaction log)管理
に関する。
【0002】
【従来の技術】コンピュータシステムの速度、信頼性お
よび処理能力は絶えず進歩し続けている。その結果、コ
ンピュータはより複雑で高度なアプリケーションを処理
することができる。コンピュータの改良にともなって、
大量記憶および入出力(I/O)装置の性能に対する要
求も高くなる。したがって、進歩し続けるコンピュータ
システムに性能上つりあう大量記憶システムを設計する
ことが常に必要とされている。
【0003】本発明は特にディスクアレイ型の大量記憶
装置に関する。ディスクアレイデータ記憶システムは単
一の大量記憶システムを形成するように構成され、統合
された多数の記憶ディスクドライブ装置を有する。大量
記憶システムには、コスト、性能および利用可能性とい
う3つの主要な設計評価基準がある。メガバイトあたり
のコストが低く、入出力性能が高く、データの利用可能
性が高いメモリ装置を製作することが最も望ましい。
“利用可能性"とは、記憶システムに記憶されたデータ
にアクセスする能力のことであり、またなんらかの故障
があった場合に連続動作を保証する能力のことをいう。
通常、データの利用可能性は冗長性を用いて提供され、
この場合データあるいはデータ間の関係が複数の場所に
記憶される。冗長データの記憶には、“ミラー"法およ
び“パリティ"法の2つの一般的な方法がある。
【0004】
【発明が解決しようとする課題】ディスクアレイデータ
記憶システムの設計にあたって発生する問題の1つは、
システムの誤りあるいは故障の場合における記憶された
データの正確なマッピング情報の保持の問題に関係する
ものである。これは前記の冗長データ記憶法のいずれか
あるいはその両方を用いるシステムについていえること
である。したがって、ディスクアレイマッピング情報の
管理において、誤りから回復する目的のためには、最近
変更されたマッピング情報がディスク上に確実に記憶さ
れるようにする必要がある場合が多い。このディスク書
き込みの必要性は、(i)時間に基づいた頻度状態の更
新、(ii)ログページ・フルが状態、あるいは(iii)
特定のホストによる要求等のいくつかの理由で発生す
る。一般的には、最近のマッピング情報の変更は、ディ
スクアレイ機能の性能対して最適化されたデータ構造内
におけるランダムな場所に蓄積され、さらに他のデータ
構造より高速にディスクに書き込む(ポストする( pos
t ))ことができるログに順次蓄積される。この技術は
トランザクション処理技術においては周知である。しか
し、ポストの必要性が進行中の他のディスク読み出しあ
るいは書き込み動作と同時に発生してシステム内に入出
力の競合が生じるという問題が発生する場合がある。か
かる入出力競合は、特にポストが頻繁に発生する場合に
システム上の重要な性能を阻害することが多い。これは
ディスクにログを1回ポストするには複数の入出力事象
が必然的に発生するためである。たとえば、通常、ログ
ページはまず無効と表示される(すなわち、更新が必要
である)。次に、ログページはディスクにコピーされ、
その後有効と表示される。最後に、冗長システムでは、
冗長ログページがディスクにコピーされる。
【0005】以上のことから、また増大し続ける計算速
度および管理対象となる膨大な情報量から、ディスクア
レイシステム等の性能の改善が常に必要とされている。
【0006】したがって、本発明はディスクアレイマッ
ピング情報の管理システムの性能を向上させることを目
的とする。また、複数の利用可能な記憶ディスクから選
択された任意の最も使用頻度の低いディスクへのログ書
き込みを管理および分散してログ入出力と進行中の他の
入出力との間におけるディスクアクセスの競合を低減す
ることによって、ディスクログ書き込みのシステム性能
を改善し、さらにシステムの誤り又は故障時に記録を確
実に回復可能にすることを目的とする。
【0007】
【課題を解決するための手段】一実施形態における本発
明の原理によれば、ディスクドライブ等の複数の記憶媒
体を有する記憶システムにおいて、第1メモリに記憶さ
れたトランザクションログが、2つの異なるログ領域に
選択的にポストされる。詳細には、第1メモリのトラン
ザクションログのページ・フル状態が検出されると、ポ
ストは“ディスクログ"領域に対して行なわれる。ポス
ト要求がトランザクションログのページ・フル状態が検
出される前に発生すると、ポストはただちに“ステージ
ングログ"領域の最も使用頻度の低いディスクに対して
行なわれる。
【0008】他の原理によれば、“ディスクログ"への
ポストは通常の記憶システム管理技術およびデータ冗長
性技術を用いて行なわれる。一方、“ステージングロ
グ"領域へのポストは、ステージングログのデータが記
憶媒体上で冗長な状態で保持されることのないように通
常の記憶システムデータ管理および冗長性技術を用いず
に行なわれる。冗長性はトランザクションログがステー
ジングログ領域にコピーされることに加えて第1メモリ
に残ることによって維持される。
【0009】ステージングログ領域は複数の記憶媒体の
それぞれに確保されたスペースを含み、かかる確保され
たスペースは各記憶媒体上で論理的に分離された部分に
分割される。この構成によって、ステージングログへの
ポストを確保された部分の間で“トグルする( toggle
)"ことができる。したがって、2つの連続するステー
ジングログポストによって、どのディスクが最も使用頻
度が低いかにかかわりなく確保された領域の同じ部分が
重ね書きされることはない。
【0010】他の原理によれば、記憶媒体上のログ領域
にポストされるデータ記録にシーケンス番号およびディ
スク群番号が割り当てられる。ディスクログ領域および
ステージングログ領域からのデータの回復においては、
シーケンス番号およびディスク群番号が参照されて完全
なトランザクションログが適正に再構築される。
【0011】本発明の他の目的、利点および機能は以下
の説明から明らかになるであろう。
【0012】
【発明の実施の形態】図1には、本発明の分散書き込み
ディスクログ法を用いたデータ記憶システム10のブロ
ック図を示す。図示する例では、データ記憶システム1
0は階層的ディスクアレイ11を含むディスクアレイデ
ータ記憶システムである。本発明は非階層的アレイ(図
示せず)にも適用可能である。ディスクアレイ11はR
AID(Redundant Array of Independent Disks)記憶シ
ステムを実施するための複数の記憶ディスク12を含
む。データ記憶システム10はディスクアレイ11に結
合され記憶ディスク12との間のデータ転送を調整する
ディスクアレイコントローラ14を含み、さらにRAI
D管理システム16を含む。RAID管理システム16
は本発明の分散書き込みディスクログ法を実行する手段
を含む。
【0013】本明細書においては、“ディスク"とは自
己の記憶故障を検出することのできる任意の不揮発性の
ランダムアクセス可能・書き換え可能な大量記憶装置で
ある。ディスクには、回転磁気ディスクおよび光ディス
クとソリッドステートディスクの両方あるいは(PROM、E
PROMおよびEEPROM等の)不揮発性電子記憶素子を含む。
“ディスクアレイ"という用語は、ディスクと、ディス
クを1つあるいはそれ以上のホストコンピュータに接続
するのに要するハードウエアと、物理的ディスクの動作
を制御しそれらをホスト動作環境に1つあるいはそれ以
上の仮想ディスクとして提示するのに必要な管理ソフト
ウエアの集合である。“仮想ディスク"は管理ソフトウ
エアによってディスクアレイ中に実現される抽象的存在
である。
【0014】“RAID"という用語はその物理的記憶
容量の一部が記憶容量の残りの部分に記憶されたユーザ
データに関する冗長な情報の記憶に用いられるディスク
アレイを意味する。この冗長情報によって、このアレイ
を構成するディスクの1つあるいはこのアレイへのアク
セス経路が故障した場合にユーザデータを再生すること
ができる。RAIDシステムについては、ミネソタ州Li
no LakesのREID Advisory Boardから1993年6月9日に刊
行された“The RAID Book: A Source Book forRAID Tec
hnology"に詳細に説明されている。RAIDシステムを
本発明との関係において例示するが、本発明は非RAI
Dシステムにも適用可能であることはいうまでもない。
【0015】ディスクアレイコントローラ14は、smal
l computer system interface(SCSI)等の1つあ
るいはそれ以上のインターフェースバス13を介してデ
ィスクアレイ11に結合されている。RAID管理シス
テム16はインターフェースプロトコル15によってデ
ィスクアレイコントローラ14に操作的に結合されてい
る。RAID管理システム16は図示するように別個の
要素として(すなわちソフトウエアあるいはファームウ
エアとして)実施することもでき、あるいはディスクア
レイコントローラ14内あるいはホストコンピュータ内
に構成して、ディスクの記憶および信頼性レベルの制
御、さまざまな信頼性の記憶装置レベル間でのデータ転
送、および本発明の分散書き込みディスクロギングの実
施を行なうデータ管理手段を提供することもできる。ま
た、データ記憶システム10は入出力インターフェース
バス17を介してホストコンピュータ(図示せず)に結
合されている。
【0016】図示するシステムでは、ディスクアレイコ
ントローラ14はディスクアレイコントローラ“A"1
4Aおよびディスクアレイコントローラ“B"14Bか
らなるデュアルコントローラとして実施される。デュア
ルコントローラ14Aおよび14Bは一方のコントロー
ラが動作不能となったとき連続的なバックアップと冗長
性を供給することによって信頼性を向上させる。しか
し、本発明の方法は単一のコントローラあるいは他のア
ーキテクチャで実施することができる。実際に、本発明
は完全で正確なディスクログの維持がデュアルコントロ
ーラ環境におけるよりも重要である単一コントローラア
ーキテクチャにおいて特に有益である。
【0017】階層的ディスクアレイ11は物理的記憶ス
ペースと1つあるいはそれ以上の仮想記憶スペースを含
む異なる記憶スペースとして特徴付けることができる。
たとえば、ディスクアレイ11内の記憶ディスク12
は、複数のディスク20のミラーグループ18および複
数のディスク24のパリティグループ22に構成される
ものとして概念化することができる。記憶装置のかかる
諸相はマッピング技術を用いて関係付けられる。たとえ
ば、ディスクアレイの物理的記憶スペースは記憶領域を
さまざまなデータ信頼性レベルに応じて区分した仮想記
憶スペースにマップすることができる。仮想記憶スペー
ス内の領域の一部をミラーすなわちRAIDレベル1の
第1の信頼性の記憶レベルに割り当て、他の領域をパリ
ティすなわちRAIDレベル5の第2の信頼性の記憶レ
ベルに割り当てることができる。かかる領域は同じディ
スクあるいは別々のディスク上に構成することができ、
また任意の組み合わせのディスク上に構成することもで
きる。
【0018】データ記憶システム10はディスクアレイ
11のマッピングに用いる仮想マッピング情報の永続的
な記憶を可能とするメモリマップ記憶域21を含む。こ
のメモリマップ記憶域はディスクアレイの外部にあり、
好適にはディスクアレイコントローラ14に常駐する。
メモリマッピング情報は異なるビュー( view )の間で
さまざまなマッピング構成が変化するにつれてディスク
アレイコントローラ14あるいはRAID管理システム
16によって連続的あるいは定期的に更新することがで
きる。
【0019】好適には、メモリマップ記憶域21はそれ
ぞれディスクアレイコントローラ“A"14Aおよびデ
ィスクアレイコントローラ“B"14Bに設けられた2
つの不揮発性RAM( Non-Volatile RAM )21Aおよ
び21Bとして実施される。これら2つのNVRAM2
1Aおよび21Bはメモリマッピング情報の冗長記憶を
可能とする。仮想マッピング情報はミラー冗長性技術に
よってNVRAM21AおよびNVRAM21Bの両方
に複製され記憶される。これによって、NVRAM21
Aをオリジナルのマッピング情報の記憶にのみ用い、N
VRAM21Bを冗長マッピング情報の記憶にのみ用い
ることができる。
【0020】図示するように、ディスクアレイ11は複
数の記憶ディスク12を有する。記憶ディスク12上の
冗長性の管理はRAID管理システム16によって統御
される。ユーザすなわちホストアプリケーションプログ
ラムから見た際、アプリケーションレベルの仮想ビュー
によって記憶ディスク12上の利用可能な記憶スペース
を示す1つの大きな記憶容量を表わすことができる。R
AID管理システム16はこの物理的記憶スペース上で
のRAID領域の構成を動的に変更することができる。
その結果、RAIDレベル仮想ビュー内のRAID領域
のディスクへのマッピングおよびフロントエンド仮想ビ
ューのRAIDビューへのマッピングは一般的にはある
変化の状態ということになる。NVRAM21Aおよび
NVRAM21B内のメモリマップ記憶域は、RAID
管理システム16によるRAID領域のディスクへのマ
ッピングに用いられる現在のマッピング情報および2つ
の仮想ビューの間でのマッピングに用いられる情報を保
持する。RAID管理システムはRAIDレベルのマッ
ピングを動的に変更するとき、メモリマップ記憶域のマ
ッピング情報をかかる変更を反映するように更新する。
【0021】しかし、ディスクアレイに用いられるRA
ID機構すなわちデータ記憶機構にかかわりなく、メモ
リマップ記憶域21は一般的にはシステムの使用時全体
を通じて常に変化する状態にあることは明らかである。
したがって、メモリマップログ記録がメモリに保持さ
れ、RAID管理システム16によってメモリからディ
スクに絶えずポストされ、NVRAM21の損失時にか
かる記録が確実に回復されるようにする。よって、本発
明は複数の利用可能な記憶ディスク12から選択された
任意の最も使用頻度の低いディスクへのログ書き込みを
管理および分散してログ入出力と進行中の他の入出力と
の間におけるディスクアクセスの競合を低減することに
よってディスクログ書き込みのシステム性能を改善する
ものである。一般的には、これはログの新しい部分を保
持するために各記憶ディスク12上に“ステージングロ
グ"領域を確保することによって行なわれる。そして、
トランザクションログメモリのページがいっぱいになる
前にポスト要求が発生した場合、ポストは最も使用頻度
の低いディスクに確保された“ステージングログ"領域
にほとんど即時に実行される。続いて、ログの回復が必
要である場合、すべての記憶ディスク12からの断片が
まとめられて単一の完全なイメージが形成される。
【0022】図2は、本発明の分散ログ書き込みディス
クログ法を示すブロック図である。NVRAMマップ4
5はデータ記憶システム10に用いられるデータが記憶
されるディスクアレイコントローラ14A/14B(図
1)上における不揮発性のメモリマップ記憶域21の部
分集合を表わす。ディスクマップ50はディスクアレイ
11に(冗長的に)属するNVRAMマップ45の従来
のディスクマップイメージである。ディスクマップ50
へのNVRAMマップ45の定期的記憶(ポスト)によ
って誤り訂正を行なうために、NVRAMマップ45の
内容の冗長コピーをディスクに維持する手段が提供され
る。一般的には、ディスクマップ50へのNVRAMマ
ップ45のポストは、通常のシステム処理および入出力
競合状態下で可能である際に(RAID管理システム1
6による制御のもとに)バックグラウンド処理として実
行される。よって、ディスクマップ50へのNVRAM
マップ45データのポストは、入出力およびディスクス
ペースに関する通常のシステム競合の影響を受け、した
がってポストが実際にいつ発生するかについては不確定
要素がある。
【0023】RAMログイメージ(RLI)55もまた
不揮発性メモリ21の部分集合である。あるいはこれは
別個の(好適には不揮発性の)メモリとすることもでき
る。RLI55はNVRAMマップ45内で発生するイ
ンクリメンタルな変化を迅速に記憶/記録するのに用い
られる。一実施形態では、RLI55は16(図では
N)のアドレス指定可能な64Kバイトページを含む
が、他の構成も可能である。その後RAID管理システ
ム16からの要求があった際、RLI55に記憶された
インクリメンタルな変化はディスクログ60あるいはデ
ィスクステージングログ65にポストされる。
【0024】いくつかの要因によって、RAID管理シ
ステム16にRLI55からディスクログ60あるいは
ディスクステージングログ65へのデータのポスト要求
を行なう。たとえば、一実施形態では、RLIが“ペー
ジ・フル"状態になった際、ディスクログ60への“排
出( flush)"ポスト要求が発生する。“排出"ポスト要
求が発生すると、RLI55からのトランザクションロ
グデータのフル・ページがディスクログ60に書き込ま
れる。一方、(i)時間に基づく頻度の要求が発生する
か、(ii)ある特定のホスト要求を受けた場合に、ディ
スクステージングログ65への“強制引出し"ポスト要
求が発生する。“強制引出し"ポスト要求が発生する
と、RLI55から1つあるいはそれ以上のトランザク
ションログデータのフル・ブロックがディスクステージ
ングログ65に書き込まれる。この1つあるいはそれ以
上のブロックには、前に完全に書き込まれておらず、ま
た未書き込みの1つあるいはそれ以上のトランザクショ
ンログ記録を含む(現在のページ内の)ブロックが含ま
れる。ディスクログ60に“排出"ポストで書き込みさ
れるページおよびディスクステージングログ65に“強
制引出し" ポストで書き込みされるブロックをここでは
RLI55の“未書き込み"データと称する(ただし、
“排出" ポストで書き込みされたページはそれ以前にデ
ィスクステージングログ65に“強制引出し" ポストで
書き込みされた記録を含む場合がある)。いずれの場合
にも、(ディスクログ60あるいはディスクステージン
グログ65への)かかるポストによって、(RLI55
で捕捉された)NVRAMマップ45の変化が、ディス
クマップ50が更新されていない際にNVRAM21に
損失が生じた場合においての、誤り回復目的のためにデ
ィスクアレイ11に確実に記憶されることを保証する。
【0025】ディスクログ60はディスクアレイ11
(図1)上に常駐するRLI55の従来と同様のディス
クイメージである。好適には、ディスクログ60はRL
I55と同様に多数のデータページを記憶することがで
きる。図示するように、ディスクログ60にはデータ記
憶用のNのページが示され、また従来と同様に、連続的
あるいは円形にリンクすることができる。ディスクログ
60は(図1の)通常のデータ冗長性機構を用いてディ
スクアレイ11上に記憶および管理される。したがっ
て、ディスクログ60へのRLI55における“未書き
込み"内容の“排出"ポストは通常の入出力状態で発生
し、ディスクアクセスおよびスペースのためのシステム
入出力競合の影響を受ける。ディスクログ60は一般的
にはディスクマップ50より頻繁に更新されるが、ディ
スクログ60は(RLI55中で捕捉された)NVRA
Mマップ45へのインクリメンタルな変化のみを保持す
るのに対して、ディスクマップ50は(最終更新時の)
NVRAMマップ45の完成イメージを保持する。
【0026】ディスクステージングログ65はディスク
アレイ11(図1)のディスクの各部分を表わす確保さ
れたステージング領域70、75、80、85、90、
95、100および105を含む。上述したように、一
実施形態では、ディスクステージングログ65は指定さ
れた事象の発生時あるいは“ページ・フル"状態以外の
時にRLI55の内容の記憶に用いられる。しかし、こ
のポスト基準には当業者には明らかなようにシステム設
計の変更および/またはユーザによる優先的な指示に合
わせて自由度を持たせることができる。いずれの場合に
も、(“ページ・フル"状態以外の)RAID管理シス
テム16によって要求された所定の事象が発生した場
合、RLI55はその“未書き込みの"内容をディスク
ステージングログ65のディスク1〜Mのうち最も使用
頻度の低いディスクに“強制引出し"する。最低使用頻
度のディスクはディスクアレイ11のディスク1〜Mの
入出力動作をモニターすることによって検出される。
【0027】基本的には、最低使用頻度のディスクへR
LI55を“強制引出し"することによって、時間の経
過とともにディスクアレイ全体にトランザクションログ
の分散書き込みが実行される。これは、所定の単一のデ
ィスクログ60へのRLI55のページ・フル“排出"
とは対照的である。パリティ冗長機構を用いる場合、デ
ィスクログ60は実際には複数のディスクに分散させる
ことができるが基本的には“単一の"すなわち“非分散
の"ディスクログである。これは(冗長コピーを考えな
ければ)1つのディスクドライブ上で1つの基底アドレ
スのみを用いてログ全体をアドレス指定/アクセスする
ことができるためである。
【0028】最低使用頻度のディスクが選択されるた
め、“強制引出し"ポストが(進行中の他のシステム呼
び出し/書き込み入出力動作との)入出力競合が低減さ
れた状態で発生するという利点がある。したがって、デ
ィスクマップ50あるいはディスクログ60のポストと
は異なり、ディスクステージングログ65へのこの分散
書き込みは一般的にはただちに(あるいは、少なくとも
より迅速に)完了する。さらに、“強制引出し"ポスト
は一般的には転送される未書き込みブロックが最小限で
あるため“排出"ポストより高速である。
【0029】ディスクログ60とは異なり、ディスクス
テージングログ65はRLI55のインクリメンタルな
変化をディスクアレイ11全体にわたって分散した非冗
長的な態様で保持する。これは、ディスクステージング
ログ65に発生する書き込みがRAID管理システム1
6の通常の冗長性機構から除外されることから非冗長的
である。したがって、ディスクステージングログ65へ
のポストにおいて発生する入出力ステップはディスクロ
グ60の場合に比べて少なくとも1ステップ少ない。ト
ランザクションログはステージングログ領域にコピーさ
れることに加えて第1メモリ(RLI55)にも残るた
め、“強制引出し"ポスト後にも冗長性が維持される。
【0030】一実施形態では、ディスクアレイ11のデ
ィスク1〜Mはそれぞれ分散されたログの記憶のために
確保された専用のスペース量を有する。たとえば、図示
するそれぞれのディスク上には2つの64Kバイトペー
ジ70/75、80/85、90/95および100/
105が確保される。ディスクステージングログポスト
処理中の故障の場合に発生する可能性のある有効データ
の重ね書き(および損失)を防止するために、それぞれ
のディスク上に少なくとも2つのページが確保される。
すなわち、RLI55はディスクステージングログ65
への書き込み(ポスト/強制引出し)を奇数および偶数
ページに交互に実行する(スワッピングすなわちトグ
ル)。たとえば、最初の書き込みでは、RLI55は最
低使用頻度のディスクに確保された偶数番号のページ7
0、80、90あるいは100にポストを行なう。次に
発生する書き込みにおいては、RLI55は最低使用頻
度のディスクの奇数番号ページ75、85、95あるい
は105にポストする。これによって、システムはデー
タの完全性の別のレベルを保証され、続いて発生するポ
ストにおいて最後にポストされたデータの重ね書きの可
能性(すなわち、同じ最低使用頻度ディスクが連続して
選択される場合の重ね書き)が防止される。
【0031】図3から図6は、ある時間における本発明
のディスクステージングログの状態を示すブロック図で
ある。本発明の分散書き込みディスクステージング動作
の例をさらに詳細に説明するために、RLI55のログ
イメージページ57の一部、およびディスクステージン
グログ65の各ページ70〜105の一部を示す。すな
わち、図3から図6にはそれぞれRLI55からの異な
るポストに応答してディスクステージングログ65の状
態時間における異なるスナップショットを示す。RLI
55のログイメージページ57およびディスクステージ
ングログ65の各ページ70〜105は破線によって3
つの512バイトブロック(すなわち部分)B1、B2
およびB3に(論理的に)分割されているものとして示
されている。説明を簡略化するために、それぞれの64
Kバイトページ中の全ブロックではなく3つのブロック
のみを示す。(RLI55の)ログイメージページ57
を本説明および図では“LI"で示す。さらに、ディス
クステージングログ65中の各ディスクをそれぞれ“D
1〜DM"で示し、各ディスク中に確保される2つのペ
ージをそれぞれ“P1"あるいは“P2"で示す。
【0032】図3において、論理標識である事象/時刻
T1は(図1のRAID管理システム16の要求によっ
て)ある特定の事象が発生してRLI55におけるログ
イメージページ57の未書き込みデータのディスクステ
ージングログ65への“強制引出し"ポストが開始され
るある所定の時点を反映している。事象/時刻T1はさ
らにその所定の時点においてRLIのログイメージペー
ジ57にログデータがどれだけ“フル"かを示す位置を
同定する。ポストが要求されると、論理標識である事象
/時刻T1によって同定される(RLI55におけるロ
グイメージページ57の)未書き込みデータの全ブロッ
クがポストされる。512バイトデータブロックは(こ
の例では任意のシステム設計条件に対する)最小ポスト
サイズであるため全てのブロックがポストされる。
【0033】したがって、たとえば、事象/時刻T1の
発生時にRLI55はログイメージページ57の(事象
/時刻T1で示される位置)“未書き込みの"内容をデ
ィスクステージングログ65の最低使用頻度のディスク
1〜Mにおけるページ70〜105の1つに(後に詳述
する“トグル"状態で)ポスト( post )する。すなわ
ち、ログイメージページ57のブロック“1"(LIB
1)は“未書き込み"でしかも完全にフルであるためそ
の全体がポストされ、またログイメージのブロック
“2"(LIB2)も“未書き込み"であるためこれもそ
の全体がポストされる(ただし、ログデータは事象/時
刻T1まではLIB2の一部しか満たしていない)。デ
ィスク2が最低使用頻度のディスクとして検出され、ポ
ストがディスクステージングログ65の偶数ページ番号
から開始されるものと(便宜上)仮定すると、ログイメ
ージページ57はそのブロック内容LIB1およびLI
B2をディスクステージングログ65におけるディスク
D2のページP2に対応するブロックB1およびB2
(すなわち、D2P2B1およびD2P2B2)にポス
トする。したがって、ブロックD2P2B1は(反転ビ
デオ水平線の形態で示す)すべての有効データを含み、
ブロックD2P2B2は時刻T1が示す位置までの部分
的有効データを含み、ブロックD2P2B2の残りの部
分には(クロスハッチで示す)無効データすなわち“ド
ント・ケア( don't care )"データが含まれる。
【0034】図4に示すように、第2の事象/時刻T2
はRAID管理システム16がRLI55によるそのデ
ータのポストを再度要求する時点を同定する。この例で
は、時刻T1および時刻T2の間に記憶されたログイメ
ージページ57のデータ(すなわち、“未書き込み"デ
ータ)をディスクステージングログ65にポストしなけ
ればならない(これは、まだページ・フル状態になって
いないためである)。(しかし、事象/時刻T2以前に
ログイメージページ57がすべてトランザクションデー
タで満たされている場合、RLI55はログイメージペ
ージ57の一部をディスクステージングログ65にポス
トするよりむしろその全体をディスクログ60にポスト
する。)ディスク1が最低使用頻度のディスクであり、
書き込み入出力がフルブロックサイズでのみ発生すると
仮定すると、LIB2がすべてD1P1B2に書き込ま
れる。このとき、奇数ページP1(75)が書き込ま
れ、前述したページ“トグル"(スワッピング)データ
保護技術が実行される。無効データ(すなわち、そのブ
ロックサイズ内にあって指定された時刻T2より後のデ
ータ)をここでもクロスハッチで示す。
【0035】図5にはRLI55に対してページ・フル
状態になる前にデータのポストが要求される第3の事象
/時刻T3を示す。この例では、時刻T2と時刻T3と
の間に記憶されたログイメージページ57のデータ
(“未書き込み"データ)をポストしなければならな
い。したがって、この例ではディスク3(D3)が最低
使用頻度のディスクであると仮定すると、LIB2のす
べてがD2P2B2にポストされ、LIB3のすべてが
D3P2B3にポストされる。この場合も、ページスワ
ッピングを行なうために、“偶数の"ページP2(9
0)がこのとき書き込まれる。
【0036】図6にはRLI55に対してページ・フル
状態になる前にデータのポストが再度要求される第4の
事象/時刻T4を示す。この例では、時刻T3と時刻T
4との間に記憶されたログイメージページ57の“未書
き込み"データをポストしなければならない。したがっ
て、この例ではディスク1(D1)が最低使用頻度のデ
ィスクであると仮定すると、LIB3のすべてがD1P
1B3に強制引出しされる。
【0037】図3〜図6からわかるように、最低使用頻
度のディスクに対して書き込みが行なわれるだけでなく
ディスクに対する冗長書き込みが発生しないことからシ
ステムの入出力性能に対する全体的影響が低減される。
冗長性はログデータがディスク(ディスクステージング
ログ65)上に書き込まれ、しかもRLI55にも残る
ことによって維持される。さらに、一実施形態におい
て、ディスクステージングログ65への“強制引出し"
はRLI55がページ・フル状態になる前の事象につい
て発生し、RLI55のページ・フル状態が検出された
場合、RLI55からディスクログ60(図2)への
“排出"が発生することに注意しなければならない。
【0038】図7には、分散書き込み用のデータ記録1
10の構成を示すブロック図である。RLI55(およ
びディスクログ60およびディスクステージングログ6
5)内のデータの各512バイトブロック(セクタ)は
それぞれ1つあるいはそれ以上のデータ記録110を有
し、データ記録110はブロックの境界にまたがってい
る場合もある。説明の目的上、データ記録110は簡略
化した形態で示す。すなわち、記録に用いられる可能性
のあるすべてのフィールドをここでは図示しない。しか
し、データ記録110は少なくとも記録の長さを同定す
る長さ標識115、ディスクステージングログ65から
データを回復するための記録の順序付けを同定するため
のシーケンス番号120、トランザクションログに関係
付けられたディスク群を同定するディスク群識別子12
5、記憶される実際のログデータを保持する本体13
0、およびデータ確認用のチェックサム135を含む。
【0039】シーケンス番号120はトランザクション
ログに新たな記録が追加されるたびに順次インクリメン
トされる生成番号である。チェックサム135はデータ
記録110全体のチェックサムであり、トランザクショ
ンログの回復中に記録の状態を確認するために用いられ
る。ディスク群識別子125はRLI55に関係付けら
れたディスク群の現在のインスタンス( instance )の
任意の識別子であり、トランザクションログの回復中に
“陳腐化した"(すなわち無効な)ディスクステージン
グログ65データが使用されていないことを保証するた
めに用いられる。すなわち、回復中に、記録はそのディ
スク群識別子125がディスクの現在のインスタンスに
一致する場合に有効と認識され、ディスク群識別子12
5がディスク群の現在のインスタンスに一致しない場合
無効と認識される。たとえば、他のディスク群からディ
スクドライブがスワップされた場合に陳腐化した記録あ
るいは有効な記録が発生する。この場合、各記録に関係
付けられたディスク群識別子によって、トランザクショ
ンログ回復処理はその新たなディスク関係付けられたあ
らゆる陳腐化データを認識し、その使用を避けることが
できる。つまり、記録のディスク群識別子は現在のディ
スク群インスタンスに一致しなければならない。
【0040】図8は分散書き込みディスクログの処理フ
ローを示すブロック図であり、本発明におけるログトラ
ンザクションの管理のために(図1の)RAID管理シ
ステム16内で実施される処理の相互関係を示す。これ
らの処理は、好適にはファームウエアで実行される。ア
プリケーション150(たとえば図1のRAID管理シ
ステム16)がNVRAMマップ45(図2)を操作す
る際、この操作動作を同定するデータ記録110がログ
管理155の制御に追加され、RAMログイメージ55
(図2)に記録される。記録はいくつかの鍵となる事象
の1つが発生するまで絶えず追加される。RLI55中
の現在のページがフルになると、ログ管理155がデー
タ管理160に制御を渡し、データ管理160がディス
クドライバ165とインターフェースで連結してこのフ
ルページの内容をディスクアレイ11のディスクログ6
0に冗長ポストすることによってそのフルになったペー
ジが“排出される"。RLI55中の現在のページがフ
ルではないがログ管理155がその事象をディスクアレ
イ11のディスクステージング65への“強制引出し"
ポストの要求として検出すると、ログ管理155はデー
タ管理プログラムを迂回してディスクドライバ165と
直接インターフェースで連結してそのデータをディスク
アレイに“強制引出し"する。“強制引出し"ポストの発
生後に冗長コピーは書き込まれない。
【0041】ここで、すべての図面を参照して、なんら
かのメモリ故障あるいはシステム故障のためにログの回
復が必要である場合、ディスクログ60およびディスク
ステージングログ65に記憶されたインクリメンタルな
ログデータの回復のためにいくつかのステップが発生す
る。まず、ディスクログ60のすべてのフルページがR
LI55にコピーされてログデータができるだけ多く再
構築される。しかし、ページ59のような非フルページ
の場合ディスクステージングログ65にデータが残って
いる可能性があり、これもRLI55にコピーしなけれ
ばならない。したがって、ディスク1〜M上のディスク
ステージングログ65の全ページ70〜105からのロ
グデータの断片をまとめて1つの完全なイメージにして
RLI55にコピーしなければならない。
【0042】ディスクステージングログ65からのこの
回復に備えて、RLI55を走査してディスクログ60
に書き込まれた最後の(最も新しい)記録を示すシーケ
ンス番号120を有する記録を発見する。この走査にあ
たってはログの循環性とシーケンス番号のラッピングの
両方を考慮しなければならない。ディスクステージング
ログ65内に最後に書き込まれたものに続く次のシーケ
ンス番号(記録)がある場合これを発見しなければなら
ない。したがって、ディスクステージングログ65を次
に走査して(RLI55に次に回復すべき記録を示す)
次のシーケンス番号を有する記録を発見する。ディスク
ステージングログ65内で次の記録(シーケンス番号)
が発見されると、そのディスク群識別子125をチェッ
クして、その記録がディスク群の現在のインスタンスに
属するものであることを確認する。さらに、その記録の
チェックサム135を評価してその記録の完全性を判定
する。完全である場合、その記録がRLI55にコピー
され、トランザクションログ回復処理が続行される。図
6に示す例では、ブロックD2P2B1の最初の記録は
この第1ステップの回復基準を満足する。
【0043】続いて、ディスクステージングログ65を
再度走査して、次の連続シーケンス番号を有する次の記
録を探す。前に発見された記録の長さ標識115から、
次の記録が前に発見された記録の長さ標識115によっ
て記述されるオフセットで始まることがわかる。したが
って、そのオフセットで始まり、適当な連続シーケンス
番号120を有し、適当なディスク群識別子125を有
し、チェックサム135による有効性分析を満足する次
の記録が発見されるまですべてのディスクステージング
ログ65が探索される。図6の例では、ブロックD2P
2B1内の第2の記録(視覚的には識別不能)がこの回
復基準を満足する。かかる記録が発見されると、その記
録がRLI55にコピーされる。
【0044】一般的には、(i)(次の連続シーケンス
番号によって同定される)次の連続する記録を発見し、
(ii)そのディスク群識別子を検証し、(iii)そのチ
ェックサムを検証するこの処理全体が、かかる回復基準
のそれぞれを満足するすべての記録が発見されるまでデ
ィスクステージングログ65全体に対して継続的に反復
される。さらに例を挙げれば、たとえば図6において、
D2P2B1およびD2P2B2(反転ビデオ水平線で
示される)中に同定される有効な記録のそれぞれがまず
その順序でRLI55に回復される。すると、D1P1
B2あるいはD3P2B2内で発見されるいかなる有効
な記録も次の回復ステップを満足する。たとえば、次の
有効な記録がまずD3P2B2の前にD1P1B2内で
発見された場合、D1P1B2内のすべての有効な記録
がRLI55に(順次一度に1つずつ)コピーされ、D
1P1B2内で発見されなかった残りの有効記録は続い
てD3P2B2内で発見され、D3P2B3の有効記録
に続く。一方、次の有効な記録が(D1P1B2ではな
く)D3P2B2内で発見された場合、これらの有効記
録はすべてRLI55にコピーされ、次にD3P2B3
の有効記録がRLI55にコピーされる。その後にのみ
D1P1B3内で発見された最終有効記録が処理され、
RLI55にコピーされる。この最終記録はディスクス
テージングログ65内の他のいかなる記録にも次の連続
シーケンス番号が発見されない際に、ディスクステージ
ングログ65から回復されることは明らかである。
【0045】図示する例では、ディスクログ60および
ディスクステージングログ65からRLI55へのログ
回復がこれで完了する。したがって、図8に示すよう
に、ログ管理155が(現在はRLI55にある)回復
された記録をアプリケーション150(図1のRAID
管理システム16)の制御に返して、ログ回復が完了
し、アプリケーション150がNVRAMマップ45を
トランザクションログ回復処理を開始させたシステム誤
り/故障の前の状態に戻すためにRLI55に示される
ログ変更の実行に着手可能であることを示す。
【0046】ディスクアレイ内の複数のディスクに対す
る分散書き込み動作を用いてディスクログ書き込み性能
を向上させる方法および装置の実施形態を上に説明し
た。当業者には当該技術分野のさまざまなソフトウエ
ア、ファームウエアおよび/またはハードウエアのうち
任意のものを用いて容易に実施されることは明らかであ
ろう。さらに、本発明をその具体的実施形態の参照によ
り説明したが、本発明の精神と範囲から逸脱することな
く他の代替実施形態および実施方法あるいは変更形態の
使用が可能であることは明らかであろう。
【0047】以下に本発明の実施の形態を要約する。
【0048】1. 複数の記憶媒体(12)を有する記
憶システム(10)への書き込み方法であって、(a)
前記記憶システム(10)への書き込み要求を示す基準
の検出と、(b)前記複数の記憶媒体(12)から最低
使用頻度の記憶媒体の選択と、(c)前記選択された最
低使用頻度の媒体へのデータの書き込みとを含むことを
特徴とする記憶システムへのデータ書き込み方法。
【0049】2. 前記複数の記憶媒体(12)はラン
ダムアクセス記憶媒体である上記1に記載の記憶システ
ムへのデータ書き込み方法。
【0050】3. 前記最低使用頻度の記憶媒体は入出
力動作に基づいて選択される上記1または2に記載の記
憶システムへのデータ書き込み方法。
【0051】4. 前記検出される基準は前記記憶媒体
(12)へのトランザクションログ(55)の強制引出
しポスト要求を含む上記1、2または3に記載の記憶シ
ステムへのデータ書き込み方法。
【0052】5. 前記強制引出しポスト要求は前記ト
ランザクションログ(55)の指定された部分(57)
がデータで満たされていることが検出される前に発生す
る上記4記載の記憶システムへのデータ書き込み方法。
【0053】6. 前記データは前記選択された最低使
用頻度の記憶媒体に非冗長に書き込まれる請求項1に記
載の記憶システムへのデータ書き込み方法。
【0054】7. 前記データは前記書き込まれるデー
タの順序を示す標識(120)を含む上記1に記載の記
憶システムへのデータ書き込み方法。
【0055】8. 前記記憶媒体(12)はそれぞれ前
記最低使用頻度の記憶媒体が選択された際の書き込みの
ためにのみ使用されるよう確保された領域(65)を含
む上記1記載の記憶システムへのデータ書き込み方法。
【0056】9. 前記確保された領域は少なくとも2
つのサブ領域(70、75、80、85、95、10
0、105)を含み、最低使用頻度の記憶媒体を選択す
る第1の事象の発生時に前記サブ領域の1つに対して書
き込みが行なわれ、最低使用頻度記憶媒体を選択する次
の事象の発生時に他方のサブ領域への書き込みが行なわ
れ、それによって同じ最低使用頻度記憶媒体が二度連続
して選択される場合にも次の連続する書き込みにおいて
直前に書き込まれたサブ領域に対して重ね書きが生じな
いことを特徴とする上記8記載の記憶システムへのデー
タ書き込み方法。
【0057】10. 記憶システム(10)であって、
(a)データ記録(110)を保持する第1メモリ(5
5)と、(b)前記第1メモリに接続された複数の記憶
媒体(12)と、(c)前記第1メモリ(55)の状態
を検出する手段(16)と、(d)前記第1メモリにお
ける第1の検出された状態に応答して第1の記憶管理基
準にしたがって前記記憶システム(10)に前記データ
記録を書き込む手段(16)と、(e)前記第1メモリ
における第2の検出された状態に応答して第2の記憶管
理基準にしたがって前記記憶システム(10)に前記デ
ータ記録を書き込む手段(16)を含み、前記第2の記
憶管理基準は前記複数の記憶媒体における最低使用頻度
の記憶媒体への書き込みを含む記憶システム。
【0058】11. 前記第1メモリ(55)における
前記第1の検出された状態は、前記第1メモリの一部が
前記データ記録で満たされていることを示す状態を含む
上記10記載の記憶システム。
【0059】12. 前記第1の記憶管理基準は前記複
数の記憶媒体(12)上の前記データ記録の冗長性の維
持を含む上記10記載の記憶システム。
【0060】13. 前記第1メモリにおける前記第2
の検出された状態は、前記第1メモリにおいて所定の部
分が前記データ記録で満たされる前に前記第1メモリ
(55)内の前記データ記録を前記複数の記憶媒体(1
2)に強制引出し的に書き込む要求を示す状態を含む上
記10記載の記憶システム。
【0061】14. 前記第2の記憶管理基準は前記複
数の記憶媒体(12)上において前記データ記録の冗長
性を維持しないことを含む上記10記載の記憶システ
ム。
【0062】15. 前記最低使用頻度の記憶媒体は前
記データ記録の書き込みのために確保された少なくとも
2つのサブ領域(70、75、80、85、90、9
5、100、105)を含む上記10記載の記憶システ
ム。
【0063】
【発明の効果】本発明によれば、複数の利用可能な記憶
ディスクから選択された任意の最も使用頻度の低いディ
スクへのログ書き込みを管理および分散してログ入出力
と進行中の他の入出力との間におけるディスクアクセス
の競合を低減することによって、ディスクログ書き込み
のシステム性能を改善でき、且つ、システムの誤り又は
故障時に記録を確実に回復することができる。
【0064】
【図面の簡単な説明】
【図1】本発明の分散書き込みディスクログ法を用いた
データ記憶システムのブロック図である。
【図2】本発明の分散ログ書き込みディスクログ法を示
すブロック図である。
【図3】ある時間における本発明のディスクステージン
グログの状態を示すブロック図である。
【図4】図3の状態以後の、他の時間における本発明の
ディスクステージングログの状態を示すブロック図であ
る。
【図5】図4の状態以後の、他の時間における本発明の
ディスクステージングログの状態を示すブロック図であ
る。
【図6】図5の状態以後の、他の時間における本発明の
ディスクステージングログの状態を示すブロック図であ
る。
【図7】分散書き込み用のデータ記録の構成を示すブロ
ック図である。
【図8】分散書き込みディスクログの処理フローを示す
ブロック図である。
【符号の説明】
1,2,3,M ディスク 10 データ記憶システム 11 ディスクアレイ 12 記憶ディスク 14 ディスクアレイコントローラ 14A ディスクアレイコントローラA 14B ディスクアレイコントローラB 16 RAID管理システム 18 ミラーグループ 21 メモリマップ記憶域 21A,21B NVRAM 22 パリティグループ 45 NVRAMマップ 50 ディスクマップ 55 RAMログイメージ(RLI) 60 ディスクログ 65 ディスクステージングログ 110 データ記録 115 長さ標識 120 シーケンス番号 125 ディスク群識別子 130 本体 135 チェックサム 150 アプリケーション 155 ログ管理 160 データ管理 165 ディスクドライバ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 キルク・エー・ハンソン アメリカ合衆国 アイダホ,イーグル,ウ エスト・ニューフィールド・ディーアール 1129

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 複数の記憶媒体(12)を有する記憶シ
    ステム(10)への書き込み方法であって、 (a)前記記憶システム(10)への書き込み要求を示
    す基準の検出と、 (b)前記複数の記憶媒体(12)から最低使用頻度の
    記憶媒体の選択と、 (c)前記選択された最低使用頻度の媒体へのデータの
    書き込みとを含むことを特徴とする記憶システムへのデ
    ータ書き込み方法。
JP23586298A 1997-08-26 1998-08-21 記憶システムへのデータ書き込み方法 Expired - Fee Related JP4163298B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/920-120 1997-08-26
US08/920,120 US6055604A (en) 1997-08-26 1997-08-26 Forced transaction log posting using a least busy storage media without maintaining redundancy of the transaction log

Publications (3)

Publication Number Publication Date
JPH11119919A true JPH11119919A (ja) 1999-04-30
JPH11119919A5 JPH11119919A5 (ja) 2005-11-04
JP4163298B2 JP4163298B2 (ja) 2008-10-08

Family

ID=25443201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23586298A Expired - Fee Related JP4163298B2 (ja) 1997-08-26 1998-08-21 記憶システムへのデータ書き込み方法

Country Status (4)

Country Link
US (1) US6055604A (ja)
EP (1) EP0899731B1 (ja)
JP (1) JP4163298B2 (ja)
DE (1) DE69833815T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9146799B2 (en) 2012-06-29 2015-09-29 Fujitsu Limited Storage system and method for controlling storage system

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2344196B (en) * 1998-11-26 2003-03-05 Ibm Data processing apparatus,method and computer program with optimized key-pointing operation for log record storage
US6553509B1 (en) * 1999-07-28 2003-04-22 Hewlett Packard Development Company, L.P. Log record parsing for a distributed log on a disk array data storage system
US6820182B1 (en) * 2000-10-18 2004-11-16 International Business Machines Corporation Support for exhaustion recovery in a data processing system with memory mirroring
US6996580B2 (en) * 2001-06-22 2006-02-07 International Business Machines Corporation System and method for granular control of message logging
US7055056B2 (en) * 2001-11-21 2006-05-30 Hewlett-Packard Development Company, L.P. System and method for ensuring the availability of a storage system
US6782450B2 (en) * 2001-12-06 2004-08-24 Raidcore, Inc. File mode RAID subsystem
US6922752B2 (en) * 2002-08-23 2005-07-26 Hewlett-Packard Development Company, L.P. Storage system using fast storage devices for storing redundant data
JP2005157825A (ja) * 2003-11-27 2005-06-16 Hitachi Ltd 障害復旧機能を有する計算機システム、および、障害復旧方法
US7467266B2 (en) * 2003-08-05 2008-12-16 International Business Machines Corporation Snapshot management method apparatus and system
US7451167B2 (en) * 2003-10-24 2008-11-11 Network Appliance, Inc. Verification of file system log data using per-entry checksums
JP4477370B2 (ja) * 2004-01-30 2010-06-09 株式会社日立製作所 データ処理システム
US7502954B1 (en) * 2004-05-26 2009-03-10 Emc Corporation High availability data storage system
US20060257188A1 (en) * 2005-05-13 2006-11-16 Microsoft Corporation Check printing system
JP2007086972A (ja) * 2005-09-21 2007-04-05 Hitachi Ltd ストレージシステム、二重化制御方法、及びプログラム
US8123621B2 (en) * 2006-08-17 2012-02-28 Wms Gaming Inc. Storing data in wagering game systems
US7523288B2 (en) * 2006-09-06 2009-04-21 Microsoft Corporation Dynamic fragment mapping
US7765361B2 (en) * 2006-11-21 2010-07-27 Microsoft Corporation Enforced transaction system recoverability on media without write-through
US8627135B2 (en) * 2010-08-14 2014-01-07 Teradata Us, Inc. Management of a distributed computing system through replication of write ahead logs
US9507733B2 (en) 2013-06-21 2016-11-29 Microsoft Technology Licensing, Llc Cache destaging for virtual storage devices
CN105900073B (zh) 2013-08-29 2020-04-10 慧与发展有限责任合伙企业 用于维护事务日志的系统、计算机可读介质和方法
US10089013B2 (en) * 2013-11-07 2018-10-02 Datrium, Inc. System and method for managing a non-volatile storage resource as a shared resource in a distributed system
US9411695B2 (en) 2013-12-04 2016-08-09 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Provisioning memory in a memory system for mirroring
US20170262367A1 (en) * 2016-03-11 2017-09-14 Qualcomm Incorporated Multi-rank collision reduction in a hybrid parallel-serial memory system
US11171671B2 (en) * 2019-02-25 2021-11-09 Samsung Electronics Co., Ltd. Reducing vulnerability window in key value storage server without sacrificing usable capacity

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4633387A (en) * 1983-02-25 1986-12-30 International Business Machines Corporation Load balancing in a multiunit system
US5239649A (en) * 1989-10-30 1993-08-24 International Business Machines Corporation Channel path load balancing, through selection of storage volumes to be processed, for long running applications
US5481694A (en) * 1991-09-26 1996-01-02 Hewlett-Packard Company High performance multiple-unit electronic data storage system with checkpoint logs for rapid failure recovery
US5499367A (en) * 1991-11-15 1996-03-12 Oracle Corporation System for database integrity with multiple logs assigned to client subsets
US5416915A (en) * 1992-12-11 1995-05-16 International Business Machines Corporation Method and system for minimizing seek affinity and enhancing write sensitivity in a DASD array

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9146799B2 (en) 2012-06-29 2015-09-29 Fujitsu Limited Storage system and method for controlling storage system

Also Published As

Publication number Publication date
EP0899731B1 (en) 2006-03-15
DE69833815D1 (de) 2006-05-11
EP0899731A2 (en) 1999-03-03
EP0899731A3 (en) 2000-10-11
DE69833815T2 (de) 2006-12-07
US6055604A (en) 2000-04-25
JP4163298B2 (ja) 2008-10-08

Similar Documents

Publication Publication Date Title
JP4163298B2 (ja) 記憶システムへのデータ書き込み方法
US6553509B1 (en) Log record parsing for a distributed log on a disk array data storage system
EP2329361B1 (en) Aggregation of write traffic to a data store
US6738863B2 (en) Method for rebuilding meta-data in a data storage system and a data storage system
JP2557172B2 (ja) タイムゼロ・バックアップ・コピー・プロセスにおける副ファイル状態のポーリングのための方法およびシステム
US7107486B2 (en) Restore method for backup
JP2501752B2 (ja) コンピユ―タ・システムのストレ―ジ装置及びデ―タのストア方法
JP3422370B2 (ja) ディスクキャッシュ制御装置
EP1128267A1 (en) Disk storage system having redundant solid state data storage devices
US8041891B2 (en) Method and system for performing RAID level migration
US20070162513A1 (en) Methods and apparatus for point in time data access and recovery
US20070174569A1 (en) Method of managing data snapshot images in a storage system
JPH0683679A (ja) データのバックアップ・コピー中の同時アクセスの方法及びシステム
JPH0683676A (ja) タイム・ゼロ・バックアップ・コピー・プロセスにおいて終了及び再開始を自動化する方法及びシステム
KR20000022716A (ko) 로그 구조화 목표 저장장치를 사전에 구성하여 볼륨을 효율적으로 복사하는 방법 및 장치
US20130024618A1 (en) Log structure array
JP3687111B2 (ja) 記憶装置システムおよび記憶装置の制御方法
JP2005284816A (ja) ディスクアレイシステム
CN120336088A (zh) 快照回滚方法、装置、电子设备及存储介质
US11573729B2 (en) Storage device and storage control method
JPH1185589A (ja) 情報記憶装置および同装置に適用される管理データ再構築方法
JPH09265435A (ja) 記憶装置システム
JPH09282105A (ja) ディスク記憶システム及びその誤り訂正データ作成処理の回復方法
JPH0784727A (ja) ファイルシステム
JPH10320255A (ja) チェックポイント/ロールバック方式の計算機における入出力装置制御装置、及び方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050816

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080624

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080724

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees