JPH0644218B2

JPH0644218B2 - ミラー化された記憶装置の管理方法および装置

Info

Publication number: JPH0644218B2
Application number: JP3268933A
Authority: JP
Inventors: マイケル・スティーブン・ウィリアムス
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1990-10-22
Filing date: 1991-09-20
Publication date: 1994-06-08
Anticipated expiration: 2009-06-08
Also published as: JPH05134812A; EP0482853A3; EP0482853A2

Description

【発明の詳細な説明】

【０００１】本特許文書の開示内容の一部は著作権保護
を受ける題材を含む。著作権者は、特許庁の特許ファイ
ルまたは記録に現れる特許の開示のいずれかによるファ
クシミリ再生にに対しては異議申立てはしないが、他の
如何なる形態であっても全ての著作権を留保するもので
ある。

【０００２】

【産業上の利用分野】本発明は、記憶装置における物理
的格納スペースを管理するデータ処理システムにおいて
使用されるデータ処理方法に関し、特にかかる記憶装置
における冗長データを保持する改善された方法に関す
る。

【０００３】

【従来の技術】従来技術は、システムにより使用される
データを格納するディスク記憶装置を使用する多くのデ
ータ処理システムを開示している。これらの装置は、マ
イクロプロセッサが作動するオペレーティング・システ
ム、システムにより実行される異なるアプリケーション
・プログラム、および種々のアプリケーション・プログ
ラムにより生成され操作される情報の如き色々な形式の
情報を格納する。

【０００４】ディスク記憶装置は、一般に、セクターま
たはブロックに分割される複数の同心トラックを備えた
１つ以上の磁気または光ディスクを含む。一般にディス
クの各面は情報を記憶し、ディスク・ドライブは多重デ
ィスクおよび多重ヘッドで構成され、１つのアクセス機
構が複数のヘッドを幾つかの同心記録トラックの１つへ
位置決めすることを可能にする。大半の現在のディスク
・ドライブは、シリンダ番号（ＣＣ）、磁気ヘッド番号
（Ｈ）およびセクター番号（Ｓ）によって物理的記憶場
所を指定するアドレス指定規則を採用している。シリン
ダ番号はまた、多数のヘッドが用いられ、ヘッド数が多
重ディスク構成におけるディスク面に等しい場合のトラ
ック番号でもある。存在し得るどんな構成でもアドレス
指定が可能であるため、ディスク・ファイルの容量とは
独立的に「ＣＣＨＳ」アドレス指定フォーマットが使用
される。

【０００５】バイトで測定されたディスク記憶装置の容
量は、使用される記録法、トラック密度、ディスク・サ
イズおよびディスク数に依存している。その結果、ディ
スク・ドライブは、色々な容量、データ速度およびアク
セス回数で製造されている。

【０００６】多くのデータ処理システムは、一般に、デ
ータを記憶するため多数のディスク・ドライブを採用す
る。各装置は障害に対して独立の装置であるため、１つ
の大きな容量の装置を持つよりも、多数の小さな容量の
ドライブに記憶されるデータを分散することがしばしば
有利となる。このような構成は、重要なデータのコピー
を１次コピーが得られない場合にアクセス可能な他の装
置に格納することを可能にする。

【０００７】参考のため引用される「Ｍｉｒｒｏｒｉｎ
ｇｏｆＤａｔａｏｎａｐａｒｔｉｔｉｏｎ
ｂａｓｉｓ（３１５１４）」（ＲｅｓｅａｒｃｈＤｉｓ
ｃｌｏｓｕｒｅ第３１５号、１９９０年７月発行）
（データがパーティション（物理的に連続するバイト集
合）に基いてミラー処理即ち複写される）に記載される
ように、媒体の障害からの複写および復旧をサポートす
るため、ミラー操作として知られる概念を用いることが
できる。これは、複写される記憶域の定義における更に
細かな粒状性の故に、重要なデータのバックアップおよ
び復旧における更に大きな柔軟性を提供する。

【０００８】システムにおいてディスクの記憶スペース
を割付けるタスクは、一般に、オペレーティング・シス
テムの責務である。ＩＢＭ社のＲｉｓｃシステム／６０
００（ＩＢＭ社の商標）エンジニアリング・ワークステ
ーションで使用されるＩＢＭ社のＡＩＸ（ＩＢＭ社の商
標）の如きユニックス（ＵＮＩＸシステム・ラボラトリ
社の商標）型のオペレーティング・システムは、ファイ
ルを構成するための高度に開発されたシステムを有す
る。ユニックスの取決め（ｐａｒｌａｎｃｅ）において
は、「ファイル」とは、システムで使用される情報を格
納するため使用される基本的構造である。例えば、ファ
イルは、単にシステムにおける他のファイルのリストで
あるディレクトリ、またはデータ・ファイルである。各
ファイルは、一義的な識別子を持たねばならない。ユー
ザは、ファイルにネームを割当て、オペレーティング・
システムはアイノード（ｉｎｏｄｅ）番号を割当て、ネ
ームを番号に翻訳するためテーブルが保持される。ファ
イル・ネームは単なる一連の文字である。ファイルは、
同じディレクトリに関連するファイルを割当てることに
より構成することができ、このディレクトリはあるネー
ムを持つ別のファイルであることを特徴とし、このディ
レクトリに格納されたファイルのネームおよびアイノー
ド番号を単にリストする。

【０００９】ＡＩＸオペレーティング・システムはま
た、ファイル・ディレクトリをファイル・ネームを与え
られるグループに構成するが、これらディレクトリもま
たファイルと見做されるためである。結果として得る構
成は、頂部にルート・ディレクトリを持ち、ルートから
下方に多重レベルの分岐構造を有する逆ツリー構造に似
た階層的ファイル・システムとして知られる。ディレク
トリおよび非ディレクトリの両タイプのファイルが各レ
ベルに格納することができる。１つのレベルのディレク
トリにネームによりリストされるファイルは、次に低い
レベルに置かれる。ファイルは、階層的ファイル・シス
テムにおいて、ルート・レベルからネームを付したファ
イルへトレースされる経路の記述が先行するそのネーム
を指定することによって識別される。経路の記述子は、
経路がたどるディレクトリ・ネームによる。現ディレク
トリがルート・ディレクトリであるならば、完全な経路
が表記される。現ディレクトリがある中間のディレクト
リならば、経路の記述は、更に短い経路を定義するため
短縮することができる。

【００１０】オペレーティング・システムの種々のファ
イルは、それ自体階層的ファイル・システムに構成され
る。例えば、多数のサブディレクトリがルート・ディレ
クトリに帰属し、関連するファイルをリストする。サブ
ディレクトリは、ＡＩＸのカーネル・ファイルを格納す
る／、ＡＩＸユーティリティを格納する／ｂｉｎ、一時
的ファイルを格納する／ｔｍｐ、およびユーザ・ファイ
ルを格納する／ｕの如きネームを有する。

【００１１】先に述べたように、ＡＩＸファイルをディ
スク・ドライブ上の特定のアドレス指定可能な記憶ユニ
ットに割当てるタスクはオペレーティング・システムの
責務である。ファイルをディスク・ブロックに実際に割
当てる前に、各領域が同じ一般機能を持つファイルを記
憶することができるように、記憶サブシステムの使用可
能なディスク記憶スペースを多くの異なる領域に分割す
るための決定がなされる。これらの割当てられた領域
は、しばしば仮想ディスクあるいは論理ボリュームと呼
ばれる。用語「ミニディスク」はＩＢＭ社のＲＴシステ
ムにおいて用いられ、用語「Ａ−ディスク」はＩＢＭ社
のＶＭシステムにおいて用いられる。用語「論理ボリュ
ーム」はＩＢＭ社のＡＩＸシステムにおいて使用され
る。

【００１２】同じ特性を持つファイルがディスク・ドラ
イブの１つの定義された領域に格納される時、管理およ
び記憶場所の観点から幾つかの利点が得られる。例え
ば、ファイルのあるグループはある期間全く変更されな
いが、他のグループは非常に迅速に変更され、それらは
異なる時点でバックアップされ得る。管理者にとって
は、これらのファイルをその機能に従って仮想ディスク
あるいは論理ボリュームへ割当てて、１つのグループの
全てのファイルを同一に管理できることも簡単である。
これらは、仮想ディスク／論理ボリュームの提供が記憶
サブシステムにおけるファイルの格納のオペレーティン
グ・システムによる管理および制御を簡単にする多くの
ものの僅かに２例である。

【００１３】データ処理システムにおけるデータ保全性
を保護するための従来の方法は、論理ボリューム環境で
は有効でない。エンド・ユーザがデータの１つのボリュ
ームであると認識するものは、実際には多数の物理ボリ
ューム全体に分散されたデータであることもあり得る。
参考のため本文に引用されるＧａｗｌｉｃｋ等の米国特
許第４，５０７，７５１号は、従来のデータベースにお
いて使用される従来のログ先書込み法について記載して
いる。

【００１４】データ保全性を仮想ディスク・システムに
拡張するための方法は、参考のため本文に引用された共
に本願と同じ譲受人に譲渡されたＢａｋｅｒ等の米国特
許第４，４９８，１４５号、およびＥｌｌｉｏｔｔ等の
同第４，４９４５，４７４号、および参考のため本文に
引用されたＳｕｚｕｋｉ等の米国特許第４，９３０，１
２８号に示されている。しかし、これらの方法は、エラ
ー・ログおよび復旧手順を維持する際にかなりのオーバ
ーヘッドをもたらす。これらのシステムは更に、データ
における障害またはエラーが単にデータの古いバージョ
ンに復元される結果となりこれにより更新されたデータ
を失うという制約がある。

【００１５】他の方法はデータの冗長性を生じ、この場
合データの新旧のコピーが保持される。一旦データの新
しいコピーが妥当であると検証されると、これは古いコ
ピーとなり、以前に古いコピーであったものがこの時新
しいデータにより重ね書きされ得る。このため、古いコ
ピーと新しいコピーが新旧のデータを保有する役割にお
いて交替する。この方法の下では物理データ・ボリュー
ム数が増加するため、重大なオーバーヘッドがシステム
性能およびこの方法の保持における処理能力に影響を及
ぼす。

【００１６】このため、システム性能に対する影響が最
小限である、エラー回復に対するデータ冗長性を有する
仮想ディスク／論理ボリューム・データ・システムを備
えたデータ処理システムを提供することが望ましい。

【００１７】

【発明の概要】本発明は、データの多重コピーを保持す
るシステムにおいて生じる上記の性能上の問題に対する
ものである。新しいデータ処理方法によれば、複数の物
理的に連続するディスク・ブロック即ちセクターを含む
物理パーティションがスペースの割付けの基本的単位と
して確立されるが、このディスク・ブロックはディスク
・ファイルのアドレス指定可能性の基本的単位として保
持される。複数の物理パーティションが一緒にグループ
化され、物理ボリュームと呼ばれる。一緒にグループ化
される複数の物理ボリュームは、ボリューム・グループ
と呼ばれる。各物理パーティションに含まれる物理的ブ
ロックの数および各物理ボリュームにおける物理パーテ
ィションの数は、物理ボリュームがボリューム・グルー
プに組込まれる時固定される。換言すれば、１つの物理
ボリューム・グループにおける全ての物理パーティショ
ンは同じサイズである。異なるボリューム・グループ
は、異なるパーティション・サイズを持ち得る。

【００１８】ＡＩＸファイル・システム、即ち関連する
ファイルのグループがシステムに組込まれる時、ファイ
ル・システムを格納するため必要なディスク上の最小数
の物理パーティションのみを含む論理ボリュームが生成
される。更に多くのスペースがファイル・システムによ
り必要とされるため、論理ボリューム・マネージャが別
の物理パーティションを論理ボリュームに割付ける。論
理ボリュームの個々の物理パーティションが異なるディ
スク・ドライブ上にあり得る。

【００１９】ディスク・ファイルにおける実アドレスへ
の、システムにより与えられる論理アドレスの関連付け
を助けるため、装置アドレスおよび該装置上のブロック
番号に照らして各物理パーティションの初めの物理アド
レスを指定するパーティション・マップが論理ボリュー
ム・マネージャによって保持される。

【００２０】システム内に格納されるデータをミラー化
することができ、この場合データの冗長コピーは別個の
物理パーティションに格納される。ミラー化操作は、論
理ボリュームと物理パーティション間に別の構成機構を
付加することにより行われる。論理ボリュームは、先に
述べた物理パーティションの代わりにそれと同じように
機能する論理パーティションからなっている。従って、
これらの論理パーティションは、１つ以上の物理パーテ
ィションからなっている。１つ以上の物理パーティショ
ンが１つの論理パーティションと関連する時、論理パー
ティションはミラー状態にあると言われる。論理パーテ
ィションがミラー化される時、論理パーティションから
の読出し要求はどの物理パーティションからでも読出す
ことができる。これらの多数の物理パーティションは、
データの冗長コピーが格納される場所である。このた
め、論理パーティションのデータはこれと関連するどん
な数の物理パーティションにおいてもミラー状態にする
ことができる。

【００２１】論理ボリュームに対する書込み要求が受取
られると、論理パーティションの全ての物理的コピー即
ち物理パーティションの全てのコピーにおけるデータ
は、書込み要求が呼出し側即ち要求側へ戻すことができ
る前に書込まれねばならない。論理ボリュームにおける
データが更新あるいは書込みされる時は常に、システム
の誤動作あるいは物理ボリュームの使用不能により、特
定の物理的コピーが書込み障害を有することがあり得
る。この障害は、この特定の物理的コピーにおけるデー
タを不適性なものとし、同じデータの他のコピーとの同
期からの逸脱を生じる。このような状態が生じると、こ
の物理的コピーは陳腐化したとされ、以後の読出し要求
を満たすために使用することはできない。

【００２２】陳腐化データに関する状態の情報は、情報
がシステム破壊／再ブートあるいは停電中でも維持され
るように永久記憶装置に格納されなければならない。こ
の陳腐化情報は、ボリューム・グループにおける全ての
アクティブな物理ボリュームに書込まれる状況領域（Ｖ
ＧＳＡ）に記憶される。ミラー化操作においては、この
ボリューム・グループは、論理ボリュームの論理パーテ
ィションを構成するように物理パーティションが割付け
される物理ボリュームの集まりである。各物理ボリュー
ムは、ボリューム・グループにおける任意の論理ボリュ
ームに対して割付けられた任意の物理パーティションの
状態を決定するためどの物理ボリュームでも使用できる
ように、ＶＧＳＡのコピーを保有する。１つのボリュー
ム・グループは多数の物理ボリュームを含み、任意の物
理パーティションの状況の変化は各物理ボリュームにお
けるＶＧＳＡの更新をもたらす結果となる。望ましい本
実施態様においては、ボリューム・グループ当たり３２
という物理ボリュームの制限がある。

【００２３】ある物理パーティションが障害を起こした
書込み要求により陳腐化すると、開始した要求は、呼出
し側へ戻されることを許容される前に、全てのＶＧＳＡ
が新しい状況情報により更新されるのを待機しなければ
ならない。最初の要求がＶＧＳＡをアクティブに更新中
で、２番目の要求がＶＧＳＡの更新を要求するならば、
最初の要求が完了するまで待機しなければならず、シス
テム性能の低下を生じる。例えば、２番目の要求が最初
の要求の直後である最悪の場合の状況においては、最初
の要求はＮ×Ｑ時間（Ｎは更新されるＶＧＳＡの数、Ｑ
はＶＧＳＡ当たり要する時間）を要し、２番目の要求は
同様にＮ×Ｑ時間を要して、２番目の要求が要求側へ戻
るには２Ｎ×Ｑの遅れをもたらす結果となる。

【００２４】１つの可能な解決法は、ＶＧＳＡを並行し
て書込むことである。しかし、これは、書込み中の停電
の如きシステムの重大な障害により大半のＶＧＳＡを失
う可能性を許容し、全てのＶＧＳＡを損ない、従って全
ての物理パーティションに対する陳腐化状況情報を失う
おそれがある。従って、ＶＧＳＡはこのようなあり得る
損失を防止するため逐次に書込まれねばならない。

【００２５】本発明は、多数のＶＧＳＡを逐次更新する
時、以下本文において「ホイール」と呼ばれる概念を用
いることによりこのようなシステムの劣化の問題に対す
るものである。このホイールは、与えられた要求に対し
てボリューム・グループ中の全ての物理ボリュームにお
けるＶＧＳＡを維持し更新する。ホイールは、要求を受
入れ、この要求に関するＶＧＳＡのメモリー・バージョ
ンを修正し、ＶＧＳＡ書込みを開始し、全てのＶＧＳＡ
がこの要求に対して更新された時最終的にこの要求をそ
の要求側に戻す。ホイールはまた、２ＮのＶＧＳＡの書
込みに要する時間程度の長さを要し得る他の方法とは対
照的に、要求が（Ｎ＋１）のＶＧＳＡ（再び、ＮはＶＧ
ＳＡおよびボリューム・グループにおける物理ボリュー
ムの数）の書込みに要する時間より長く保持されないこ
とを保証する。

【００２６】従って、本発明の目的は、改善されたデー
タ記憶システムの提供にある。

【００２７】本発明の別の目的は、データ記憶システム
におけるシステムの処理能力を改善することにある。

【００２８】本発明の更に別の目的は、データ記憶シス
テムを管理するための記憶階層を提供することにある。

【００２９】本発明の他の目的は、冗長なデータ記憶シ
ステムを管理するための記憶階層の提供にある。

【００３０】本発明の更に目的は、エラーの回復を助け
るためデータの多くのコピーが格納されるコンピュータ
・システムにおけるシステム処理能力を改善することに
ある。

【００３１】本発明の上記および他の目的、特質および
利点については、以下に列記する図面に関して以降の本
発明の最善の実施例から更によく理解されるであろう。

【００３２】

【実施例】図１は、記憶スペースを管理するための本発
明の方法を実施する典型的なデータ処理システム１０を
機能的に示している。図１に示されるように、システム
のハードウエア１０は、マイクロプロセッサ１２と、メ
モリー・マネージャ・ユニット１３と、主システム・メ
モリー１４と、Ｉ／Ｏチャンネル・コントローラ１６
と、Ｉ／Ｏバス２１とを含む。ディスク・ドライブ１７
を含む多数の異なる機能Ｉ／Ｏユニットが、バス２１と
接続された状態で示される。システムに格納される情報
は、図１においてブロック１１により機能的に示され、
一般に多数のアプリケーション・プログラム２２、本例
においてはＡＩＸオペレーティング・システムとされる
オペレーティング・システム・カーネル２４を含んでい
る。また、他のプログラムを開発するプロセスの間プロ
グラム開発スタッフにより使用されるツールであるアプ
リケーション開発プログラムのグループ２３も示され
る。

【００３３】図１により示される市販システムの一例
は、ＡＩＸオペレーティング・システムを採用するＩＢ
Ｍ社のＲｉｓｃシステム／６０００エンジニアリング・
ワークステーションである。ＡＩＸオペレーティング・
システムは、Ｕｎｉｘタイプのオペレーティング・シス
テムであり、システム・コールおよびファイル編成を含
むその特徴の多くをもちいる。

【００３４】図２は、ＡＩＸオペレーティング・システ
ムのファイル編成構造を示している。格納される情報の
基本単位は、「ファイル」と呼ばれる。各ファイルは
「ｍｙｆｉｌｅ．００１」のようなネームを有する。複
数のファイルはグループ化することができ、グループ内
の全てのファイル・ネームのリストが生成される。この
リストはディレクトリと呼ばれ、それ自体が「ｍｙｄ
ｉｒｅｃｔ．０１０」の如きネームを有する１つのファ
イルである。図２に示される構成は、ファイル編成の根
（ルート）が頂部にあるため、逆ツリー構造と呼ばれ
る。この構成のルート・レベルは、ディレクトリ・ファ
イルおよび他のタイプのファイルを含む。図２に示され
るように、ルート・ディレクトリ・ファイルは、他のフ
ァイル００Ａ、００Ｂ、００Ｃ、００Ｄおよび００Ｅの
ネームをリストする。ディレクトリ・ファイルに１つの
レベルでリストされるファイルは、次に低いレベルのフ
ァイルとして見える。ファイル・ネームは、ユーザが割
当てたネームと経路の定義を含む。経路の定義は、ルー
ト・ディレクトリで始まり、これは通常「スラッシュ記
号」（／）により指示され、その後にネームを付したフ
ァイルに達するようにトレースされねばならない経路に
あるファイル・ネームまたはディレクトリ・ネームが続
く。

【００３５】図１のブロック１１に示される各プログラ
ム領域は、図２に示される方法で構成される多数の個々
のファイルを含む。用語「ファイル・システム」は、１
つの共通の多レベル経路またはその各々の多レベル経路
の一部を共用するファイルのグループを識別するため使
用される。

【００３６】本発明の方法は、図１のブロック１１に示
される全てのファイル、および図２に示した階層的記憶
システムに示されるファイルに対して図１に示したディ
スク・ドライブ１７における格納スペースを管理するよ
うに機能する。

【００３７】実際のディスク・ドライブ１７は、複数の
個々のディスク・ドライブを含む。このような装置の１
つは、図３に略図的に示される。図３に示される如き装
置は、モータ３２により一定速度で回転される軸３１上
に取付けられた複数の円形磁気ディスク３０を含む。デ
ィスク３０の面３３および３４の各々は、磁気材料で被
覆され、複数の同心円状の磁気トラックを有する。他の
実施態様は、データの光学的記憶を可能にする材料で被
覆されたディスク３０を有する。

【００３８】ディスク・ドライブ１７は更に、各々がキ
ャリッジ３８を移動させるため取付けられたアクチュエ
ータに対して送られるアドレス信号３９に応答して共に
同心円状に記録するトラック位置の１つに対する、１つ
の面と関連する複数のトランスジューサ３６を位置決め
する機構３５を含む。各ディスクの各面上の１つの記録
トラックは、各トラック位置に存在する複数の記録トラ
ックの仮想的なシリンダに帰属する。

【００３９】ディスク・ドライブに対する物理アドレス
は、「ＣＣＨＳ」で示される５バイトのアドレスの形態
をとり、ここでＣＣはシリンダ即ちトラック番号を表わ
し、Ｈは、１つの面当たり１つのヘッドがあるためディ
スク面とも対応する磁気ヘッド即ちトランスジューサに
割当てられた番号を表わし、Ｓはトラックの一部である
セクター番号即ちブロック番号を表わす。このブロック
は、装置においてアドレス指定され得るデータの最も小
さな単位として確立される。他の実施態様は、ディスク
構成に対する他の物理的ヘッドを支持することもでき、
依然として本発明の範囲および趣旨内にある。例えば、
各ディスク面と対応する単一のヘッド即ちトランスジュ
ーサの代わりに、所要のトラック位置に達するために必
要なシーク時間を最小限に抑えるため多数のヘッド即ち
トランスジューサを使用することができる。

【００４０】プログラミングの観点から、ディスク・ド
ライブは時に物理ボリューム（ＰＶ）と呼ばれ、一連の
ディスク・ブロックとして見做される。１つの物理ボリ
ュームは、１つの装置アドレスを有し、各装置が個々の
アクセス機構を有して一義的なアドレスを必要とするた
め、２つの個々のディスク装置は含み得ない。

【００４１】図４は、ほとんどが工業的に略々標準化さ
れているディスク・ドライブのアドレス指定アーキテク
チャに含まれる種々の記憶要素の物理的関係を示してい
る。

【００４２】各バイト位置４０は１バイトのデータを記
憶する。セクター即ちブロック４１は、普通５１２であ
る指定された複数の順次の即ち連続するバイト位置を含
み、アドレス指定可能な要素の最も低いレベルである。
セクター即ちブロック４１はトラック４２に組合わさ
れ、このトラックは面３３および３４に組合わされ、面
３３および３４は図１のディスク・ドライブ即ちディス
ク記憶装置１７に組合わされるディスク３１、３
２、、、に組合わされる。もし１つ以上のディスク記憶
装置１７が使用されるならば、２つ以上の装置の組合わ
せはディスク・ドライブの物理的ストリング即ちディス
ク・ファイルと呼ばれる。実際には、ディスクまたはデ
ィスク・トラック４２は、ブロックを使用不能にするに
充分な多くの欠陥を持つ１つ以上のセクター４１を含み
得る。

【００４３】物理ボリュームのレイアウトが図５に示さ
れる。各物理ボリューム、例えば、各個のディスク・ド
ライブは、電源が最初に投入された時システムにより使
用される情報を格納するためのボリュームの領域を留保
する。このことは、現在は当産業における標準的規則で
あり、これにおいては、例えばトラック即ちシリンダ０
〜４が特別な情報のため保留される。

【００４４】各物理ボリュームは、特別な用途のため少
なくとも２つのシリンダを保留する。診断ソフトウエア
またはオペレーティング・システムのカーネルのロード
のため使用することができるブート・コードは通常の論
理ボリュームに保持され、もはや特別な物理ボリューム
場所を必要としない。

【００４５】最初に保持されるシリンダはシリンダ０で
あり、即ち任意の物理ボリュームにおける最初のシリン
ダである。各物理ボリュームは、システムに取付けられ
る直接アクセス記憶装置（ＤＡＳＤ）についての色々な
形式の構成および作動情報を格納するため、シリンダ０
の最初の４つのトラックを使用する。この情報の幾つか
は、物理ボリュームの製造者によってシリンダ上に置か
れ、またそのあるものはオペレーティング・システムに
よってシリンダ０の最初の４トラック上に書込まれる。

【００４６】物理ボリュームの第２の保留されるシリン
ダは、カストマー・エンジニアの専用であり、ＣＥシリ
ンダと呼ばれる。これは、常に物理ボリュームにおける
最後のシリンダであり、診断目的のため使用される。Ｃ
Ｅシリンダは、ユーザのデータに使用することはできな
い。ブート・コード領域および非保留領域は、構成レコ
ードの内容のコンテキストで解釈されるＩＰＬレコード
の内容により指示される。

【００４７】１つのブロックからなるＩＰＬレコード
は、システムがブート・コード（もしあれば）を読出し
て物理ボリュームを初期化することを許す情報を含む。
このＩＰＬレコードは、４つの論理セクションへ分割す
ることができ、即ち、第１のセクションはＩＰＬレコー
ドＩＤである。第２のセクションは、物理ボリュームに
ついてのフォーマット情報を含んでいる。第３のセクシ
ョンは、ブート・コード（もしあれば）が配置される場
所およびその長さについての情報を保有する。第４のセ
クションは、物理ボリュームの非保留領域が置かれる場
所およびその長さについての情報を保有する。

【００４８】１つのトラックが、システムの初期化中メ
モリーに生成されるパワーオン・システム・テスト（Ｐ
ＯＳＴ）制御ブロックに対しても保留される。

【００４９】１つの物理ボリュームの非保留領域の第１
の部分は、論理ボリューム・マネージャ領域を保有す
る。以下本文に開示される発明は、主としてこの論理ボ
リューム・マネージャ領域の管理と関連する。図６は、
論理ボリューム・マネージャ領域の分解図であり、ボリ
ューム・グループ状況領域およびボリューム・グループ
・データ領域を有する。これらの領域の二次コピーがま
た一次コピーの直後に続く。物理ボリュームにおけるス
ペースを節減するため、この論理ボリューム・マネージ
ャ領域のサイズは可変である。これは、ボリューム・グ
ループに許される物理ボリュームの大きさおよび論理ボ
リュームの数に依存する。

【００５０】先に述べたように、各物理ボリュームは１
つのボリューム・グループ状況領域（ＶＧＳＡ）を含
む。状況領域は、物理ボリュームにおける各物理パーテ
ィションの状況を表示する。１つのボリューム・グルー
プ内の各物理ボリュームは、状況領域の同じコピーを保
有する。この状況領域は、同じ物理ボリューム上に複写
することができ、物理パーティション内には保有され
ず、図７に示されるフォーマットを有する。状況領域
は、その両方のコピーを抹消するよう単一の障害の可能
性を減少するようにＤＡＳＤ上に割付けされねばならな
い。

【００５１】状況領域の詳細が図７に示される。状況領
域内の種々のフィールドは下記の如く解釈される。即ち
「初めのタイムスタンプ」および「終りのタイムスタン
プ」は、ＶＧＳＡを検証し最新のＶＧＳＡの復元を制御
するためＶＧが変更される時使用される。各タイムスタ
ンプは８バイトの長さである。復元および検証プロセス
については後で論述する。

【００５２】「パーティション状況フラッグ」は、ＶＧ
ＳＡの残部を占める。このフラッグは、ＶＧにおいて最
大３２のＰＶに均等に分割される。このことは、各ＰＶ
が状況フラッグの１２７バイトを持つことを意味する。
これは、各ＶＧＳＡにおいて４０９６の２４バイトを不
使用のままに残す。これはまた、任意のＰＶにおけるＰ
Ｐの数を１２７×８即ち、１０１６パーティションに制
限する。これは、パーティションのサイズが因数ではな
く単なる量に過ぎないため、いずれかのディスクの部分
の使用を制限することはない。

【００５３】先に述べたように、各物理ボリュームは１
つのボリューム・グループ・データ領域（ＶＧＤＡ）を
含む。このデータ領域は、論理および物理ボリュームと
物理パーティション間の相互関係を示す。データ領域
は、同じ物理ボリューム上に複写することができ、いず
れかの物理パーティション内には含まれず、図８に示さ
れるフォーマットを有する。このデータ領域は、その両
方のコピーを抹消する単一の障害の可能性を減少するよ
うにＤＡＳＤ上に割付けられねばならない。データ領域
の詳細は図８に示される。データ領域内の種々のフィー
ルドは、この明細書の最後に添付された表１に示された
Ｃコード中の定義部分に記載されている。ＶＧＤＡは、
ボリューム・グループが生成される時にユーザが定義す
る可変サイズのオブジェクトである。

【００５４】再び図５において、ユーザ領域は、論理ボ
リューム・マネージャ領域に続き、通常のユーザ・デー
タ領域を含む。

【００５５】使用不能として診断されたユーザ領域ブロ
ックに対する代替ブロックを提供する図５の不良ブロッ
ク・プール領域もまた提供される。残りの記述において
は、ディスク上に不良ブロックがないものとし、もし存
在すれば、これらは周知の従来技術の手法のいずれかに
よって取扱われる。

【００５６】図９は、ブロック番号が１０進数である論
理ボリュームのレイアウトを示す。示された論理パーテ
ィションのサイズは６４キロバイト（１２８論理ブロッ
ク）である。

【００５７】望ましい実施態様においては、本発明の方
法は、論理ボリューム・マネージャと呼ばれる／ｄｅｖ
／ｌｕｍと名付けられたファイルによって実現される。

【００５８】論理ボリューム・マネージャ（ＬＶＭ）
は、論理ボリューム、物理ボリュームおよびボリューム
・グループを生成し、修正し、照会する能力を提供す
る。ＬＶＭは、更にスペースを必要とする時、論理ボリ
ュームを指定された最大サイズまで動的に自動的に拡張
する。論理ボリュームは、同じボリューム・グループ内
の複数の物理ボリュームにわたり得、また高い信頼度、
可用度および性能に対してミラー化が可能である。論理
ボリューム、ボリューム・グループおよび物理ボリュー
ムは全て、任意のシステムにおける形式の他の装置から
一義的に識別するＩＤを有する。

【００５９】ＬＶＭは、ＳＹＳＣＯＮＦＩＧシステム・
コールの呼出しにより行われる多くの操作を含む。これ
らのＳＹＳＣＯＮＦＩＧ呼出しは、ボリュームの状況情
報を持つ内部データ構造を生成して保持するためのプロ
セスを含む。これらのシステム・コールについては、Ｉ
ＢＭ社のマニュアル「ＲＩＳＣシステム／６０００用Ａ
ＩＸバージョン３、呼出しおよびサブルーチン・レファ
レンス・マニュアル：基本オペレーティング・システ
ム」第２巻に更に詳細に記載されており、参考のため本
文に引用する。

【００６０】論理ボリューム・マネージャ疑似デバイス
・ドライバ６４は図１０に示され、３つの概念的層から
なっている。戦略層６５は、ファイル・システムＩ／Ｏ
要求６８とインターフェースし、スケジューラ層６６に
ついては以後に述べる。物理層６７は、通常システムの
ディスク・デバイス・ドライバ６９と物理的および論理
的にインターフェースする。この疑似デバイス・ドライ
バ６４は、ディスク・デバイス・ドライバ６９に出入り
するファイル・システムＩ／Ｏ要求６８を横取りし、ミ
ラー操作、陳腐化パーティション処理、状況領域の管
理、およびミラー書込み一貫性の諸機能を行うが、これ
ら全ての操作および機能については次にのべる。

【００６１】ミラー操作ミラー操作は、媒体の障害からの回復のためデータの複
写をサポートするため使用される。通常、ユーザは不可
欠であってその喪失が重大事となる特定ファイルまたは
ファイル・システムを有する。完全にディスクのみに基
くミラー操作のサポートは、かなりの量のディスク・ス
ペースの無駄を生じて、必要以上に大きなオーバーヘッ
ドを結果として生じることがある。

【００６２】１つのパーティションは、１つのディスク
上の固定サイズの物理的に隣接するバイトの集合であ
る。図１１において、論理ボリューム７０は、１つ以上
の論理パーティション７１からなる動的に拡張可能な論
理ディスクである。各論理パーティションは、７２、７
４および７６の如き１つ以上の物理パーティションによ
りバックアップされている。論理パーティションは、パ
ーティションがミラー化されなければ１つのパーティシ
ョン（７２）により、パーティションが単独でミラー化
されるならば２つのパーティション（７２および７４）
により、またパーティションが２重ミラー化されるなら
ば３つのパーティション（７２、７４および７６）によ
ってバックアップされる。

【００６３】ミラー操作は、各論理ボリューム毎に下記
の方法で選択することができる。即ち、（ｉ）１つの論
理ボリュームにおける論理パーティションが全くミラー
化できないか、（ii）１つの論理ボリュームにおける全
ての論理パーティションがミラー化できるか、あるいは
（iii）１つの論理ボリュームにおける選択された論理
パーティションがミラー化できる。

【００６４】陳腐化パーティション処理ミラー操作が適正に機能するためには、ミラー化された
データの全ての物理パーティションのコピーが同じでな
い時を検出する方法が必要である。陳腐化した物理パー
ティション（ＰＰ）の検出および陳腐化物理パーティシ
ョン処理の開始は、図１０においてドライバ６４におけ
るスケジューラ層６６で行われる。このスケジューラ層
は、２つのＩ／Ｏ要求ポリシー、即ち、初期要求および
事後要求を有する。初期要求ポリシーは、戦略層６５か
らの要求を受取り処理し、図１５に示される。事後要求
ポリシーは、物理層６７とインターフェースし、図１６
に示される。これらのポリシー内の機能を以下に説明す
る。

【００６５】初期要求ポリシー：通常唯一のコピーを無効化し、あるいは目標ＰＰが減少しつ
つあること、あるいは目標ＰＶが無いことの要求に対し
てＥＩＯを戻す。もし要求が特別なＶＧＳＡ書込み即
ち、ｂオプションにセットされたＲＥＱＶＧＳＡで
あれば、フリー・プールからｐｂｕｆを割付ける代わり
に、ｖｏｌｇｒｐ構造に埋込まれる特別なｐｂｕｆ（ｓ
ａｐｂｕｆ）が使用される。

【００６６】逐次全てのアクティブなコピー（ミラー）を無効化する要求
に対してＥＩＯを戻す。読出し要求が、一次、二次、三
次の順序で読出すパーティションを選択する。書込み要
求が、最初のアクティブ・コピーを選択し、書込みを開
始する。残りのコピーは、前のパーティションが書込ま
れた後、逐次に、一次、二次、三次の順に書込まれる。
「逐次」は、単に最初の物理的操作を開始する。読出し
エラーのため、以降の操作または多重書込みは、事後要
求ポリシーによって取扱われる。「逐次」は、陳腐化し
たかあるいは喪失の状況でＰＶ上にあるパーティション
に対しては書込まない。

【００６７】並行全てのアクティブなコピー（ミラー）を無効化する要求
に対してＥＩＯを戻す。読出し要求は、ＰＶに対する最
後の待ち行列の要求に基くＰＶヘッド運動の最小量を要
求するアクティブなパーティションからの読出しを行
う。書込み要求は、全てのアクティブなパーティション
に対する書込みを同時に、即ち並行に生じる。「並行」
は、陳腐化したかあるいは喪失の状況でＰＶ上にあるパ
ーティションに対しては書込みを行わない。

【００６８】無効化ミラー化されたポリシーに対する無効化マスクを形成す
る。このマスクは、どのパーティションを無効化、即ち
使用しないかのスケジューリング・ポリシーを通知す
る。以下は、ミラーが無効化されるべき時の説明であ
る。

【００６９】一般：読出しおよび書込みの両要求に適応
する。

【００７０】ｉ）論理パーティションにおける存在しな
いパーティション即ち穴 ii）要求により明瞭に無効化される。（読出し要求のみ
に用いられる）コピーを明瞭に無効化する要求のｂオ
プション・フィールドにおけるビット（ＡＶＯＩＤＣ
１、２、３）が存在する。

【００７１】読出し：読出し要求のみに適応する。

【００７２】ｉ）喪失の状況でＰＶ上におかれるパーテ
ィション ii）減少あるいは排除されつつある過程にあるパーティ
ション iii）陳腐化の状況を持つパーティション書込み：書込み要求のみに適応する。

【００７３】ｉ）減少あるいは排除されつつある過程に
あるパーティション ii）陳腐化の状況を持ち、状況がアクティブから陳腐化
への過渡にないパーティション iii）パーティションの進行における再同期操作が存在
し、書込み要求が再同期操作のその時の位置の後にある
ならば、例えパーティションの状況が陳腐化であっても
書込みを許容する。

【００７４】もし要求が再同期操作あるいはミラー書込
み一貫性回復操作であれば、同期マスクもまたセットさ
れる。この同期マスクは、その時どのパーティションが
陳腐化し、従って良好なデータが使用可能なら、どれを
書込む試みを行うかの再同期ｐｐ事後要求ポリシーを通
知する。

【００７５】事後要求ポリシー：完了一般に、スケジューラ層からの出口が再び戦略層へ戻
る。与えられたｐｂｕｆからｌｂｕｆへ状況を動かす責
務がある。もしｐｂｕｆがＶＧＳＡ書込み、ｂオプショ
ンにセットされたＲＥＱＶＧＳＡと関連しなければ、
ｐｂｕｆは再びフリー・リストへ戻される。

【００７６】ミラー操作要求が読出しである時、逐次および並行の両ポリシーに
より使用される。これは、物理的操作の状況を調べる責
務を有する。１つの誤りが検出されると、これは別のア
クティブなミラーを選択する。これは、一次、二次、三
次の順序で最初に使用可能なミラーを選択する。良好な
読出しが完了し、他のミラーに読出しエラーがあった
時、「ミラー操作」は「修復」を介して修復を開始す
る。

【００７７】逐次書込み書込み要求と同時に逐次ポリシーにより使用される。こ
れは、各書込みの状況を調べて次のミラーに対する書込
み要求を開始する責務を有する。書込みは、一次、二
次、三次の順序で行われる。全てのアクティブなミラー
が書込まれると、失敗したどのミラーもＷＨＥＥＬ（以
下本文に述べる）により陳腐化とマークされる。

【００７８】並行書込み書込み要求と同時に並行ポリシーによって使用される。
初期の並行ポリシーは物理的要求を並行に全てのミラー
に対して発する。「並行書込み」は、完了した物理的要
求の各々の状況を調べる。「並行書込み」は、書込みエ
ラーが生じたか生じなかったかのみを記憶する。「並行
書込み」は、要求が完了するとｐｂｕｆを再びフリーリ
ストに置き、この状況を未済の同類にまとめる。従っ
て、最後に完了する物理的要求が、それ自体を含む全て
の同類のパス／失敗の状況を保持する。もし書込みエラ
ーが検出されると、与えられた論理的要求に対する全て
の物理的要求が完了した後にのみ、影響を受けたミラー
が（ＷＨＥＥＬによって）陳腐化とマークされる。

【００７９】修復１つの破壊したミラー、即ち一方のミラーが成功裏に読
出された後読出しエラーのある他方を修復するため使用
される。

【００８０】再同期ＰＰ論理パーティションＬＰの再同期化のため使用される。
逐次あるいは並行の如何を問わず初期ポリシーが、陳腐
化しないかあるいは喪失ＰＶにあるアクティブなミラー
を選択して最初のものから読出す。「再同期ＰＰ」は、
読出しの状況を調べる。もしエラーが検出されると、
「再同期ＰＰ」は、一方が使用可能であれば他方のミラ
ーを選択する。一旦良好な読出しが行われると、再同期
ＰＰはこのデータをＬＰの陳腐化した物理パーティショ
ンへ書込む。「再同期ＰＰ」は、破壊したミラー即ち初
期読出しを失敗したものを修復しようと試みない。「再
同期ＰＰ」はまた、ミラー書込み一貫性回復（ＭＷＣ
Ｒ）操作を行うためにも使用される。ＭＷＣＲ操作の
間、書込みがパーティションにおいて失敗するならば、
「再同期ＰＰ」は陳腐化したパーティションをマークす
る。

【００８１】ＳＥＱＮＥＸＴ既に使用されたもの、陳腐化したパーティションおよび
喪失したＰＶを勘案して次のアクティブなミラーを選択
するため使用される。

【００８２】次に図１１において、ボリューム・グルー
プで定義された各ＰＰ７２は、パーティション構造で状
況情報を有する。各ＰＰは、２つの内の１つの恒久的パ
ーティション状況になければならない。これは、全ての
Ｉ／Ｏに対して使用可能であるアクティブであるか、あ
るいは全てのＩ／Ｏに対して使用できない陳腐化であ
る。更に、減少および変更と呼ばれる２つの中間的な状
況がある。ボリューム・グループ８４における各ＰＰの
恒久的状況はまた、図１２に示されるように、状況領域
（ＶＧＳＡ）８２に保持される。ＶＧＳＡ８２のコピー
は、ボリューム・グループ８４の各物理ボリューム８０
に駐在する。

【００８３】これは、各パーティションの状況を、シス
テムの破壊の前後にわたり、またＶＧがオンラインでな
い時に保持させる。ドライバ６４は、ＶＧＳＡを維持し
て更新する責務を有する。陳腐化したＰＰの処理は、全
てのＶＧＳＡが更新されるまでは完了しない。ＶＧＳＡ
は、以下本文においてＷＨＥＥＬと呼ばれる、後で説明
される機構により更新され、表示要求が図１３に示され
るＶＧＳＡＷＨＥＥＬ９０へ進みあるいはこれから戻り
つつあることを参照する。ＶＧＳＡＷＨＥＥＬ要求の目
的は、物理的要求（ＰＲ）またはｐｂｕｆ構造である。
これは、全てのＶＧＳＡが更新された時、ＰＲに対する
ポインタを受入れて、これらを同じ構造のｐｂｓｈｅ
ｄフィールドを介して戻す。

【００８４】以下は、各ＰＰ状況の説明である。

【００８５】アクティブこのパーティションは、全てのＩ／Ｏに対して使用可能
である。ＬＰに対する読出し要求はこのＰＰから読出す
ことができる。ＬＰに対する書込みはこのＰＰに対して
書込まなければならない。

【００８６】陳腐化このパーティションは、通常のＩ／Ｏに対して使用する
ことができない。このパーティションにおけるデータ
は、その仲間のデータと一致しない。このデータは、通
常のＩ／Ｏに対して用いられるように再同期されなけれ
ばならない。これは、ＬＰから減じるかあるいは取除く
ことができる。

【００８７】減少パーティションは、構成ルーチンによりＬＰから減じる
かあるいは取除かれている。その時アクティブである読
出しあるいは書込みは、構成ルーチンがこの状況にパー
ティションを入れた後でＬＶを取除かねばならないた
め、完了することができる。ＰＰがこの状態にある時読
出し要求が受取られるならば、初期要求ポリシーはこの
ＰＰを無効にせねばならない。構成ルーチンはまた、あ
る条件下で陳腐化フラッグをオンにして、受取ることが
できる書込み要求を制御する。これらの構成ルーチンに
ついては、以下において更に記述する。

【００８８】変更パーティションは、状態をアクティブから陳腐化へ変更
し、この変更を生じた初期要求はＶＧＳＡＷＨＥＥＬ
から戻されなかった。変更中のＰＰを有するＬＰに対す
る読出し要求は、このＰＰを無効にせねばならない。こ
のＬＰに対する書込み要求は、ＷＨＥＥＬが前記状態の
変更を生じた初期要求を戻すまでは戻すことができな
い。これは、ＰＲを実際に形成することにより、次いで
これをＶＧＳＡＷＨＥＥＬへ渡すことによって行われ
る。ＷＨＥＥＬは、同じパーティションに対して複写操
作を処理し、初期要求が戻されるときこれらを戻す。

【００８９】論理的要求（ＬＲ）およびＰＰが陳腐化Ｐ
Ｐ処理に遭遇するとき、これらに適応する幾つかの一般
規則がある。第１に、一旦あるパーティションが陳腐化
すると、これは、システム破壊あるいはエラーにより偶
発的に再びアクティブ状態になることはできない。もし
ＶＧが強制定数フラッグによりオンに強制されたなら
ば、これに対して１つの例外があり、選択されたＶＧＳ
Ａは最後のＰＰの状態情報を含まない。ユーザがＶＧを
強制するならば、これらはその機会を得る。第２に、全
ての陳腐化ＰＰ処理が完了するまでは、ＬＲは戻される
ことはない。このことは、全てのＶＧＳＡが更新された
ことを意味する。

【００９０】ある論理パーティション（ＬＰ）の全ての
コピーが陳腐化とマークされるのは違法状態である。少
なくとも１つのアクティブなパーティションがなければ
ならない。この１つのアクティブなパーティションは、
無くなったＰＶ上にあり得る。このＬＰに対する全ての
書込みは、ＰＶが再びオンラインに戻されるまではでき
ない。無論、ＬＰ全体をＬＶから減じる（取除く）こと
ができる。

【００９１】もしあるＬＰの全てのコピーが書込み失敗
となるならば、ＬＲがエラーにより戻される前に、１つ
を除く全てのコピーが陳腐化としてマークされる。全て
の書込みが複数のＰＲにおける同じ相互オフセット時に
失敗したことの保証がないため、コピー間には何か不一
致が存在するとの仮定が行われなければならない。同じ
論理スペースの２つの異なる読出しが異なる結果を戻す
こと（即ち、異なるコピーを使用すること）を防止する
ため、多数のアクティブなパーティションがこのＬＰに
対して１つに減じられなければならない。これに対する
唯一の例外は、全てのコピーが失敗することの検出前に
ＰＲが発されない時であり、これはもし論理ボリューム
（ＬＶ）が以下に述べる並行書込みポリシーを用いるな
らば生じることがある。

【００９２】ＰＰが陳腐化し得る３つの仕方がある。第
１は、妥当なデータが既にこのＬＰに対する少なくとも
１つのＰＰに存在する時、あるいはＰＰが減じられ（取
除かれ）つつある時、ＬＰを水平に拡張するシステム管
理機構による。これは、構成法と呼ばれる。

【００９３】パーティションは、その各ＬＰに対する書
込みが発されてＰＰが置かれるＰＶが逸失状態となる時
に陳腐化となり得る。この種の陳腐化は、物理的要求が
ＰＶに対して発される前に検出される。これは、ミッシ
ングＰＶ法と呼ばれる。

【００９４】最後に、ＰＰに対する書込みがエラーによ
り戻される時、ＰＰは陳腐化となり得る。これは、書込
みエラー法と呼ばれる。

【００９５】各法に対する作動およびタイミングの更に
詳細な論議は以下に行う。

【００９６】構成法構成法は、スケジューラ層を通る読出しおよび書込み要
求の通常のフローから完全に外れている。ＰＰの状態が
変化しつつある時、ドライバおよび構成ルーチンが相互
に同期状態にあることが重要である。これが如何にして
行われるかを包含する１組の手順が後で定義される。

【００９７】ミッシングＰＶ法ＰＲが逸失状態にあるＰＶに対する目標となることの検
出は、図１６に示されるように、要求が発される前に行
われなければならない。全てのミラー化された書込みポ
リシー９６、１００、１２２および１２４は、より低い
レベル１０６に対するＰＲの発行前に目標ＰＶの状況を
調べなければならない。もしこの状況が検出されるなら
ば、ＰＲはＶＧＳＡＷＨＥＥＬ９０へ送られる。ＰＲ
はコード化された適正な事後ポリシー、ｂｆｌａｇフ
ィールドにリセットされたＢＤＯＮＥフラッグ、および
このＰＰを陳腐化状態であるとマークすることを要求す
るタイプ・フィールドを持たねばならない。図１６の事
後要求ポリシーは、ＶＧＳＡＷＨＥＥＬがＰＲを戻す
時どんな動作がこのＬＲに対して次にあるかを判定す
る。これに対する１つの例外は、初期要求の並行ポリシ
ーにある。もしこれが全てのアクティブなパーティショ
ンが逸失状態のＰＶにあることを検出するならば、これ
はエラーＥＩＯを持つＬＲを戻し、どのパーティション
にも陳腐化をマークしない。これは、データが依然とし
てこの要求に対する全てのコピーに対して一貫する故に
前記動作を行うことができる。

【００９８】書込みエラー法ある要求がエラーを伴って物理層１０８から図１６に示
される事後要求ポリシーへ戻される時、このポリシー
は、パーティションが陳腐化のマークを付されるかどう
かを判定しなければならない。ミラー陳腐化のマークを
判定する時に含まれる幾つかの要因がある。一部は、図
１６に関して以下に述べる。

【００９９】もし事後ポリシーが逐次９６であり、これ
がこのＬＲに対して最後のＰＲであり、他の全ての前の
ＰＲが失敗した（そのパーティションが陳腐化とマーク
された）ならば、このパーティションは陳腐化とマーク
することができない。もしこれが陳腐化とマークされる
ならば、このＬＰの全てのコピーは陳腐化とマークさ
れ、これは違法の状態である。

【０１００】再同期操作１０２は、ミラーを陳腐化とマ
ークしないが、もし再同期操作の書込み部分が失敗する
ならば、失敗したパーティションはアクティブな状態に
は入れることができない。

【０１０１】ミラー書込み一貫性回復操作は、ミラーに
対する書込みが失敗すればミラーを陳腐化とマークす
る。

【０１０２】いずれにしても、パーティションが陳腐化
とマークされるならば、ＰＲはＶＧＳＡＷＨＥＥＬへ
送られるようにセットアップされねばならない。このこ
とは、適正な事後ポリシーがコード化され、ＢＤＯＮ
Ｅフラッグが（ｂｆｌａｇフィールドで）リセットさ
れ、このＰＰが陳腐化とマークされることを要求するよ
うにタイプ・フィールドがセットされる結果を生じる。
ＰＲがＶＧＳＡＷＨＥＥＬにより戻されると、事後ポ
リシーを受取ることは、このＰＲおよび親のＬＲに対し
てどの動作が次に行われるかを判定することになる。

【０１０３】物理層１０８およびＶＧＳＡＷＨＥＥＬ
９０の双方からＰＲを受取る事後要求ポリシーは、ＰＲ
の起源を決定するためｂｆｌａｇフィールドにおける
ＢＤＯＮＥフラッグに質疑しなければならない。事後要
求ポリシーは物理層とＶＧＳＡＷＨＥＥＬの双方から
ＰＲを取扱うため、要求に対する動作のスケジューリン
グ、およびＬＲ要求が完了する時に関する全ての判定を
行う。

【０１０４】ＰＰの状態が定義されると、これらの状態
との関係における要求の取扱いのための手順が定義され
なければならない。また、構成ルーチンおよびドライバ
がシステム管理要求に応答して状態を変更するために従
う手順が定義される。

【０１０５】ドライバ専用手順１）状態はアクティブである読出し要求はパーティションから読出すことができる。

【０１０６】初期要求ポリシーにおける書込み要求はパ
ーティションに対して書込まねばならない。

【０１０７】エラーにより戻される図１６における事後
要求ポリシーにおける書込み要求は、次のように作用さ
れねばならない。即ち、ｉ）変更フラッグおよび陳腐化フラッグをオンにしなけ
ればならない。パーティションは状態を変更したばかり
である。

【０１０８】ii）ＰＲが失敗したことを記憶する。

【０１０９】iii）ＰＲをＶＧＳＡＷＨＥＥＬ９０へ
渡す。

【０１１０】iv）ＰＲがＷＨＥＥＬ９０から戻される
時、変更フラッグはオフにされねばならない。パーティ
ションは再び状態を変更したばかりである。

【０１１１】２）状態は陳腐化状態である初期要求ポリシーにおける読出し要求は、パーティショ
ンを無効化しなければならない。

【０１１２】初期要求ポリシーにおける書込み要求は、
パーティションを無効化することになる。

【０１１３】エラーにより戻される事後要求ポリシーに
おける書込み要求は、ｉ）ＰＲが障害を生じたことを記憶しなければならな
い。変化状態フラッグがオンでないため、これがこの時
点で必要な全ての動作である。パーティションが既に陳
腐化とマークされているため、この要求をＷＨＥＥＬ９
０へ送る必要がない。この条件は、要求がディスク・デ
バイス・ドライバへ渡された時パーティションがアクテ
ィブ状態にあったが、別の要求が既に障害を生じて戻さ
れた時、ＶＧＳＡＷＨＥＥＬを介してパーティション
を陳腐化としてマークし、ＷＨＥＥＬから戻されている
故に生じ得る。従って、この要求は陳腐化したＰＰ処理
に関して行うべきことがない。

【０１１４】３）アクティブ状態から陳腐化状態へ変化
する状態図１５の初期要求ポリシーにおける読出し要求は、パー
ティション全てを無効化せねばならない。

【０１１５】図１５の初期要求ポリシーにおける書込み
要求は、あたかもパーティションが状態を変えなかった
如くデバイス・ドライバへ送られねばならない。図１６
の事後要求ポリシーは、戻される時要求を取扱うことに
なる。

【０１１６】エラーにより戻される図１６の事後要求ポ
リシーにおける書込み要求は、次のように処理されねば
ならない。即ち、ｉ）ＰＲが障害を生じたことを記憶する。

【０１１７】ii）ＰＲをＶＧＳＡＷＨＥＥＬに渡す。

【０１１８】iii）ＰＲがＷＨＥＥＬから戻される時、
変化フラッグがオフにされていなければならない。この
要求はこの時進行できる。

【０１１９】注：読出し要求が失敗したことを見出す事
後要求ポリシーは、ただ別のアクティブ状態のパーティ
ションを選択して読出しを再試行する。読出しエラーは
通常データの不一致を生じないが、通例の如く１つの例
外がある。修復１００と呼ばれる事後要求ポリシーがあ
る。このポリシーは、破壊したミラー即ち読出しエラー
を持ったものを修復しようと試みる。このポリシーは、
別のミラーからの成功した読出しが一旦完了すると、こ
れらの破壊したミラーを再び書込むことにより修復す
る。破壊したミラーの再書込みが失敗すると、このパー
ティションは、データがミラー間で不一致となり得るた
め、陳腐化としてマークされねばならない。

【０１２０】構成−ドライバ手順１）陳腐化を生じたパーティション既に有効データを含むＬＰが水平に拡張されると、結果
として生じるドライバ構造およびＶＧＳＡは、パーティ
ションが陳腐化していることを表示しなければならな
い。これは、構成操作が完了したと見做される前に、Ｖ
ＧＳＡが全て更新されねばならないことを意味する。更
に詳細な手順は、以降のＶＧＳＡの論議において見出す
ことができる。

【０１２１】ｉ）構成ルーチンが、ＶＧＳＡＷＨＥＥ
Ｌを介して割付けられる各ＰＰの恒久的状態をセットア
ップする。このステップでなされねばならないものの更
に詳細な内容についてはＶＧＳＡの論議を参照された
い。

【０１２２】ii）構成ルーチンが、ドライバ構造をセッ
トアップして、これらを存在するドライバ情報へリンク
する。もしパーティションがアクティブ状態であれば、
これは直ちに使用することができる。もし陳腐化状態な
らば、これは使用される前に再同期されねばならない。
このステップは、構成ルーチンがドライバ構造に関わる
間どの新しい要求もスケジュールされることを禁止され
るように、ＩＮＴＩＯＤＯＮＥに使用不能化されねばな
らない。

【０１２３】２）アクティブ状態または陳腐化状態のパ
ーティションの減少以下の手順が、アクティブ状態のパーティションおよび
陳腐化状態のパーティションの双方を減じるために働
く。これは非常に高いレベルである。更に詳細な手順
は、ＶＧＳＡの論議において見出すことができる。

【０１２４】ｉ）構成ルーチンが減じられ（排除され）
つつある各ＰＰ毎に状態フラッグをセットして、ＶＧＳ
Ａの更新を開始する。これは、構成／ＶＧＳＡＷＨＥ
ＥＬインターフェースを介して行われる。

【０１２５】注：減じられつつある全てのＰＰがすでに
陳腐化状態ならば、これは不必要である。

【０１２６】ii）各パーティションの状態がその時陳腐
化状態であり恒久的に記録されると、ＬＶは捨てられね
ばならない。ＬＶの廃棄は、その時のＬＶ作業待ち行列
の全ての要求が完了するのを待つことを意味する。注：
減じられつつある全てのＰＰがすでに陳腐化状態である
ならば、これは不要となる。

【０１２７】iii）ＩＮＴＩＯＤＯＮＥに使用不能化さ
れると、構成ルーチンはこの時排除されつつあるＰＰと
関連するドライバ構造を取除くことができる。

【０１２８】３）陳腐化状態のＰＰの再同期化これまでは、論議はパーティションの陳腐化のマーキン
グに集中した。この問題には別の面がある。データが全
てのコピー間でどのように一致させられて使用可能とな
るのか、また再びアクティブ状態になるのか？この操
作は、再同期操作と呼ばれる。ＬＰ全体の再同期化は、
ＬＶの文字デバイス・ノードを介して、ＬＰの初めで開
始する多くの再同期化要求を生じ逐次その終りに進むア
プリケーション・プロセスによって行われる。これは、
ｓｙｓ／ｌｖｄｄ．ｈ．で定義される如きＲＥＳＹＮＣ
ＯＰと等価のｅｘｔパラメータをもつｒｅａｄｘシス
テム・コールを生じることにより行われなければならな
い。各要求は、論理的トラック・グループ（ＬＴＧ）境
界上で始動し、１つのＬＴＧの長さを持たねばならな
い。１つのＬＴＧは１２８Ｋバイトの長さである。従っ
て、１メガバイトＬＰを再同期させるには、一連の８つ
のこれらの要求がなされなければならない。８番目の再
同期操作の後、再同期または通常の書込みのいずれの操
作によってもパーティションに書込みエラーが存在しな
ければ、ＶＧＳＡが更新されて新たに同期されたパーテ
ィションがこの時新しくなりアクティブ状態であること
を表示する。

【０１２９】各再同期要求は、幾つかの物理的操作から
なっている。最初の操作は読出しであり、これは図１５
の初期要求ポリシーによって開始される。図１６の再同
期ＰＰの事後要求ポリシーは、読出しがエラーなしに行
われたことを検証する。もしエラーが戻されると、別の
アクティブ状態のミラーが読出しのため選択される。他
のアクティブ状態のミラーがなければ、再同期要求がエ
ラーと共に戻され、ＬＰの再同期が打切られる。これ
は、最初から再起動されなければならない。

【０１３０】再同期要求の次の操作は、ちょうど読出さ
れたばかりのデータを、逐次の書込みタイプ・ポリシー
を用いて陳腐化パーティションへ書込むことである。も
しエラーが戻されると、パーティションの状況が更新さ
れてパーティションが同期エラーを持つことを表示す
る。

【０１３１】全ての陳腐化パーティションが同期エラー
の状況を有するならば、ＬＰの再同期は打切られる。も
し１つのＰＰの全てのＬＴＧが成功裏に再同期されるな
らば、このＰＰは状況を陳腐化状態からアクティブ状態
へ変更することになる。

【０１３２】下記は、ＬＰの再同期に関わる動作および
判定のリストである。

【０１３３】ｉ）ＬＰの同期は、パーティションの最初
のＬＴＧにおいて再同期要求を発して開始され、逐次に
パーティションにおける最後のＬＴＧまで進行する。Ｌ
Ｐは陳腐化したミラーを持つか、あるいはこの初期要求
はエラーにより戻される。各ＰＰの同期エラー状態はク
リアされ、ドライバにより保持される内部の再同期位置
（ＬＴＧ番号）が０にセットされることになる。この内
部再同期位置は、同期トラックと呼ばれる。ＯｘＦＦＦ
Ｆでない同期トラック値は、このＬＰが再同期されつつ
あること、およびどのトラックがその時操作中である
か、あるいは最後に操作されたかを表示する。同期トラ
ック値を識別するフラッグがＰＰ状態フィールドに存在
し、これはＲｅｓｙｎｃ−Ｉｎ−Ｐｒｏｃｅｓｓ（ＲＩ
Ｐ）フラッグと呼ばれる。ＲＩＰフラッグがオンである
と、同期トラック値はその時操作中であるＬＴＧを表わ
す。もしＲＩＰフラッグがリセットされると、同期トラ
ック値は操作されるべき次のＬＴＧを表わす。これは、
どのようにドライバが再同期プロセスの位置を記憶して
いるか、また通常の読出し／書込み操作をＬＰの再同期
と同時に進行させるかを示す。

【０１３４】ii）パーティションが陳腐化しているなら
ばＬＴＧが再同期され、同期エラー・フラッグがリセッ
トされる。

【０１３５】iii）再同期されているＬＴＧにおける書
込みエラーは、このパーティションに同期エラーの状況
を生じさせることになる。同期トラックの後に生じたＬ
Ｐにおける書込みは、例えこれらが陳腐化していても、
全てのＰＰに対して書込みを行う。この操作の例外は、
パーティションの同期エラー・フラッグがオンである場
合である。その結果、書込みエラーは、コピーを再び不
一致にさせる。従って、これらの書込みエラーは、誤り
がその後このパーティションに生じたことを再同期プロ
セスに知らせるため、同期エラー・フラッグをオンにし
なければならない。

【０１３６】iv）その時再同期されつつあるＬＴＧの少
なくとも１つがエラーなく完了するならば、個々の再同
期要求は成功したと見做される。

【０１３７】ｖ）ＬＰにおける全ての陳腐化状態のパー
ティションが同期エラーの状況を生じるならば、ＬＰの
再同期は打切られる。これは、ＬＰの初めから再始動し
なければならない。

【０１３８】ＶＧのｖａｒｙｏｎ時間におけるＶＧＳＡ
の回復は、ＶＧＳＡおよびＶＧＳＡＷＨＥＥＬの論議に
より処理される。

【０１３９】ボリューム・グループの状況領域（ＶＧＳ
Ａ）ボリューム・グループ（ＶＧ）における各物理パーティ
ション（ＰＰ）は２つの恒久的状態、即ちアクティブ状
態または陳腐化状態を有する。これらの状態は、状況領
域（ＶＧＳＡ）に保持される。ＶＧの各ＰＶには、図１
２に示される如くＶＧＳＡのコピーがある。幾つかのＰ
Ｖは１つ以上のコピーを持ち得る。全てのＰＶにおける
ＶＧＳＡコピーは、メモリー・バージョンと共に、図１
０においてスケジューラ層６６で作動するドライバ６４
のソフトウエアにより維持される。このソフトウエア
は、図１５および図１６のスケジューリング・ポリシー
からの要求を受入れ、あるいは構成ルーチンを受入れて
パーティションの陳腐化またはアクティブ状態をマーク
する。このソフトウエアは、これがＶＧのアクティブ状
態のＶＧＳＡを制御して更新る方法の故にＷＨＥＥＬと
呼ばれる。ＷＨＥＥＬについての以降の論議は図１３を
参照されたい。

【０１４０】ＷＨＥＥＬの基本的目的は、ＶＧにおける
全てのＶＧＳＡが与えられたＷＨＥＥＬ要求に対する新
しい状態情報で更新されることを保証することである。
全てのＶＧＳＡに対して同時に書込み要求を発すること
は容易であり、かつ比較的早い。しかし、これはまた、
この方法によりＶＧにおける全てのＶＧＳＡの喪失の原
因となる重大エラーを生じることがあり得るため、非常
に危険でもある。これは、ＷＨＥＥＬの一般規則の最初
の規則をもたらす。

【０１４１】一般規則１）一時に唯１つのＶＧＳＡ書込
みが実行可能である。

【０１４２】図１３においては、ＷＨＥＥＬにより要求
が受取られると、ＶＧＳＡのメモリー・バージョンが要
求により更新される。次いで、ＶＧＳＡ１が書込まれ
る。この書込みが完了すると、ＶＧＳＡ２に対する書
込みが出される。この状態は、ＶＧＳＡ８が書込まれ
るまで続行する。そこで、ＷＨＥＥＬはこれが開始した
ＶＧＳＡ１に戻る。この時、図１６に示されるよう
に、要求はドライバの通常フローへ戻され、その次のス
テップに続くことができるようにする。第２の一般規則
は、一般規則２）ＶＧにおける全てのＶＧＳＡが要求の
操作により更新されるまでは戻すことができない。

【０１４３】これが何故ＷＨＥＥＬと呼ばれるかは明ら
かであろう。ＷＨＥＥＬ上の要求が暫時滞留することも
同様に明らかであろう。上記の事例においては、要求が
８つの完全なディスク操作を待たねばならなかった。も
しＶＧが３２のＰＶを含むならば、要求は３２のディス
ク操作を待たねばならないことになる。次に、要求がＶ
ＧＳＡ１に対する書込みを完了するのを待つ間に別の
要求が生じてＶＧＳＡを更新することを欲したものとし
よう。もし第２の要求が最初の要求がＷＨＥＥＬから離
れるのを待たねばならなかったならば、これは継続し得
る前に１６回のディスク操作を待たねばならないことに
なる。８回の操作は最初の要求に対するものであり、８
回はそれ自体に対するものである。この待機時間は、Ｖ
Ｇが多数のＰＶを含むならば非常に大きくなり得る。幸
運にも、ＷＨＥＥＬはこの待機を短縮する幾つかの最適
化を有する。

【０１４４】ＷＨＥＥＬは、これが受取る要求を管理し
て、望むならば要求がＶＧにおけるＶＧＳＡの合計数プ
ラス１を書込むのに要する時間より長く待機する、即ち
ＷＨＥＥＬ上に滞留する必要がないようにする。これ
は、要求がＶＧＳＡ書込みの間にＷＨＥＥＬに達するこ
とを可能にすることにより行われ。その時、ＷＨＥＥＬ
が要求がＷＨＥＥＬに達した場所へ戻るまで、要求はＷ
ＨＥＥＬ上に滞留する。一旦ＷＨＥＥＬが始動すると、
これは回転していると言われる。一旦回転すると、どれ
だけ多くの要求がＷＨＥＥＬをオン／オフしたか、ある
いはどれだけ多くの回転を要したかの如何に拘わらず、
ＶＧの全てのＶＧＳＡが同じ情報を保持するまで、ＷＨ
ＥＥＬは次のＶＧＳＡを書込み続けることになる。これ
は、時にフリーホイーリングと呼ばれる。

【０１４５】上記の２つの要求の事情に関して、下記の
ことが生起する。要求＃１は、図１５および図１６に示
されるように、初期要求ポリシーまたは事後要求ポリシ
ーから生じ、ＶＧＳＡ１に対して書込むことによりＷ
ＨＥＥＬの回転を開始させる。要求＃２が生じて、ＶＧ
ＳＡ１への書込みが完了するのを待つ。この書込みが
完了すると、要求＃２がＶＧＳＡのメモリー・バージョ
ンを更新する。これが行われると、ＶＧＳＡ２が書込
まれる。これが完了すると、ＶＧＳＡ３が書込まれ
る。これは、ＶＧＳＡ１が次に書込まれるものとなる
まで継続する。この時、全てのＶＧＳＡが要求＃１によ
り要求される状況の変化を反映するため、要求＃１はド
ライバ６４の通常のフローへ戻される。この時、このＶ
ＧＳＡがＶＧＳＡ８のイメージと一致しないため、Ｖ
ＧＳＡ１への書込みが開始される。この書込みが完了
すると、要求＃２がドライバの通常のフローへ戻され
る。これは、ＷＨＥＥＬが要求＃２がオンとなった場所
へ戻るよう回転した故に行われる。次に、次に書込まれ
るべきＶＧＳＡ２および最後に書込まれたＶＧＳＡ１
が同じものであるため、ＷＨＥＥＬが停止する。次の要
求が、ＶＧＳＡ２においてＷＨＥＥＬを始動する。

【０１４６】１つの他の主なＷＨＥＥＬの最適化が存在
する。これは、ピギーバックと呼ばれる。ディスク・ド
ライブの性格が与えられ、幾つかのディスク要求が同じ
パーティションにおいて失敗することが非常によく生じ
る。このことは、その全てが前記パーティションの状態
を変えようと欲する結果となる。これらの同様な失敗の
間の時間長さに応じて、これらの同様な状態変更が種々
の位置においてＷＨＥＥＬに入ることを要求することが
あり得る。これが、ピギーバックが生じる場合である。
要求がＷＨＥＥＬに置かれる前に、同様な要求が既にＷ
ＨＥＥＬ上にあるかどうかを知るため検査が行われる。
もし要求が見出されれば、新しい要求が既にそこにある
ものに対してピギーバック状に相乗りされる。最初の要
求がＷＨＥＥＬからオフする時間となると、相乗りされ
た要求もまたオフとなる。このため、同様な状態変更が
要求を早くオフに変えて、ＷＨＥＥＬが不必要な書込み
を行わないようにする。

【０１４７】このことは、第２の一般規則が全てのＶＧ
ＳＡが戻される前に要求の情報で更新されなければなら
ないことを記載するため、第２の一般規則に矛盾しな
い。全てのピギーバック状況の要求が同じことを行う故
に、ピギーバック操作はこの要求を満たす。従って、オ
ンとなった場所の如何に拘わらず、これらは全て同じ場
所においてＷＨＥＥＬからオフとなることができる。し
かし、初期要求ポリシーおよび事後要求ポリシーは、状
態を変更しつつあるＰＰを知っていなければならない。
さもなければ、これらのポリシーは、実際には実行中の
以前の要求がＷＨＥＥＬ上にある時パーティションが既
に陳腐化としてマークされたと考えて、要求を早期に戻
すこともある。この第２の要求は、その時ＷＨＥＥＬ上
にあるものに相乗りされねばならない。このような別の
中間的状態は比較的長くなり得る。ＰＰは、要求がＷＨ
ＥＥＬからオフとなる時間まで、状態を変化させる決定
が行われた時から変化状態にあると考えられる。この
間、状態を変化しつつあるパーティションの目標とされ
るＩ／Ｏ要求は、陳腐化したＰＰ処理の論議において述
べた規則に従わねばならない。

【０１４８】如何にしてＷＨＥＥＬが１つのパーティシ
ョンの状態を変化させつつある個々のＰＲを取扱うかを
調べた。しかし、パーティションの状態の方法論につい
ては別の主要な特質が存在する。これは、構成ルーチン
である。これらのルーチンは、ＬＶが開かれて使用中に
拡張されるか縮減される時、多くのパーティションの状
態をセットしようと欲する。これを行うためには、構成
ルーチンが下記の動作を行うことを許容する使用可能な
機構および定義された手順がなければならない。即ち、ｉ）回転中ならばＷＨＥＥＬを停止させ、さもなけれ
ば、始動しないようにする。

【０１４９】ii）多数のパーティションの状態をセット
する。

【０１５０】iii）ＷＨＥＥＬを再び始動して、全ての
ＶＧＳＡが更新されるのを待機する。

【０１５１】これは全て、例えシステムの破壊の後で
も、作動の継続中ＬＶの保全性を維持する方法で行われ
なければならない。

【０１５２】次に、下記のＷＨＥＥＬ手順について図１
７を参照する。

【０１５３】ボリューム・グループの状況領域ＳＴＡＲＴパーティションの状態を変化させるため呼出される。こ
れは、２つの異なる機構によって生起され得る。第１
は、ミラーの論理パーティションＬＰにおける書込み失
敗。第２に、現在のＬＰが拡張され、広げられ、有効デ
ータがオリジナルに存在する。この場合、新たに生成さ
れたパーティションがオリジナルとの関係において陳腐
化状態となる。ＳＴＡＲＴは常に、新しい要求を保持リ
ストＳＡＨＬＤＬＳＴに置く。次いで、ＷＨＥＥＬが
回転中でなければ、これを始動する。

【０１５４】ＳＡＣＯＮＴこのブロックは、幾つかの責務を有する。第１に、構成
動作が未済であるかどうかを知るため検査する。一旦始
動されると、ＶＧＳＡＷＨＥＥＬがフリーホイール動
作中であるため、構成動作は、ＶＧＳＡのメモリー内バ
ージョンに対する変更が可能になる前にＷＨＥＥＬが停
止点に達するまで待機しなければならない。物理ボリュ
ームに対する書込みの間の修正のための停止点が存在す
る。ＷＨＥＥＬは、構成プロセスによりＶＧＳＡのメモ
リー・バージョンに対する更新が完了するまで再び始動
されない。その後、構成プロセスはＷＨＥＥＬを再始動
する。第２の主な機能は、保持リストＳＡＨＬＤＬ
ＳＴに対する要求を取除き、同様な操作に対して、アク
ティブ状態のリストＳＡＡＣＴＬＳＴを走査するこ
とである。もし同様な操作が見出されると、この要求を
前の要求と関連させる。これにより、既にアクティブ状
態のリストにある要求と同じ時点で新しい要求をＷＨＥ
ＥＬからオフにさせる。もし同様な操作がアクティブ・
リストに見出されなければ、この要求によりＶＧＳＡの
メモリー・バージョンを更新する。もし（以下に述べ
る）定数の喪失が検出されれば、ＷＨＥＥＬ上の全ての
要求をフラッシュする。

【０１５５】ＷＨＬＡＤＶＷＨＥＥＬを次のＶＧＳＡへ進める。

【０１５６】ＲＥＱＳＴＯＰアクティブ・リストＳＡＡＣＴＬＳＴの初めから開
始し、このリストにちょうどなかった各要求を調べる。
もしこれが要求がＷＨＥＥＬに置かれたＷＨＥＥＬ位置
であれば、これをアクティブ・リストから取除いてこれ
をその通常の経路へ戻す。アクティブ・リストが完了し
た要求に対して走査された後、ＶＧＳＡのメモリー・バ
ージョンがＰＶ上の目標ＶＧＳＡへ書込まれたかどうか
を調べるため検査する。もしメモリーＶＧＳＡシーケン
ス番号がＰＶＶＧＳＡシーケンス番号と一致しなけれ
ば、ＶＧＳＡに対する書込みが開始される。

【０１５７】注：一旦ＷＨＥＥＬが始動されると、メモ
リーＶＧＳＡシーケンス番号が次に書込まれるＰＶＶ
ＧＳＡと一致するまでＶＧＳＡの書込みを続行する。ま
た、もし次に書込まれるＶＧＳＡが見失ったＰＶ上にあ
るならば、ＷＨＥＥＬが次のＶＧＳＡへ進められ、アク
ティブ・リストが再び走査される。アクティブ状態のＶ
ＧＳＡが最後に見出されると、このＶＧＳＡのＷＨＥＥ
Ｌ位置がＳＡＣＯＮＴによりアクティブ・リストに置
かれた新しい要求に入れられる。これは、ＷＨＥＥＬが
この場所付近に戻る時新しい要求がオフにされる場所を
示す。従って、アクティブでないＶＧＳＡにおいてはＷ
ＨＥＥＬに要求が置かれることはない。しかし、要求は
ＷＨＥＥＬ上にある間アクティブでなくなった位置でオ
フとなることができる。

【０１５８】ＷＲＩＴＥＳＡ要求バッファを構成し、ＶＧＳＡをＰＶに書込むため通
常ポリシーを呼出す（図１５）。

【０１５９】ＳＡＩＯＤＯＮＥＷＲＩＴＥＳＡにより生成される要求に対する戻る
点。もし書込みが失敗すると、ＰＶが見失われた旨宣言
され、定数検査が行われる。もし書込み失敗により定数
が失われるならば、ＳＡＩＯＤＯＮＥのみがフラッグ
をセットする。ＷＨＥＥＬを停止しアクティブ・リスト
をフラッシュする実際の作業は、ＳＡＣＯＮＴにおい
て行われる。

【０１６０】ＬＯＳＴＱＵＯＲＵＭボリューム・グループ（ＶＧ）がＶＧＳＡの定数を失っ
ている。ＶＧを介してフラッグをセットしてＩ／Ｏを遮
断する。ＷＨＥＥＬ上の全ての要求をエラーとして戻
す。

【０１６１】先に述べた望ましい実施態様の詳細におい
て、本発明の趣旨および頭書の特許請求の範囲から逸脱
することなく種々の変更を行うことができる。

【０１６２】以下は、種々の構成管理機能がＷＨＥＥＬ
と共働する時、ＶＧを維持するため使用されるこれら機
能に対する高レベルの手順である。

【０１６３】ＥＸＴＥＮＤＩＮＧＡＬＶＬＶの拡張の際、例えＬＰにミラーが存在しない場合で
も、恒久的な状態はＶＧＳＡにおいて初期化されなけれ
ばならない。ＬＶを拡張する時、割付けされるパーティ
ションがその時使用中でないこと、またＶＧＳＡがこの
パーティションがその時割付けされることを表示するた
め更新されなかったという一般的前提がある。更にま
た、事故の復旧が必要とされる場合ＬＶが保全状態を維
持するように、ＶＧＤＡの書込みが全操作の略々終りで
あることが前提とされる。この手順に対して行うことが
できる幾つかの最適化があり、これらについて記述す
る。

【０１６４】ｉ）ＷＨＥＥＬの制御を取得する。これ
は、ＷＨＥＥＬが回転中ならばこれを停止することを意
味する。もしＷＨＥＥＬが回転中でなければ、これが始
動することを禁止する。

【０１６５】ii）ＶＧＳＡのメモリー・バージョンを修
正する。

【０１６６】iii）ＷＨＥＥＬの再始動または始動。完
全な１回転を完了するまで待機する。

【０１６７】注：ＷＨＥＥＬが回転中でなく、ＶＧＳＡ
のメモリー・バージョンに状態の変化がなければ、ＷＨ
ＥＥＬを再始動してこれが完全な１回転を完了するのを
待機する必要はない。

【０１６８】注：ＷＨＥＥＬが回転中であり、ＶＧＳＡ
のメモリー・バージョンに状態の変更がなければ、ＷＨ
ＥＥＬを再始動するが、これが１回転を完了するのを待
機する必要はない。

【０１６９】iv）ＩＮＴＩＯＤＯＮＥ禁止。新しいパー
ティション構造をドライバの階層にリンクする。割込み
レベルを再び使用可能にする。この時、読出し／書込み
操作はＰＰがアクティブ状態にあればこれに進むことが
できる。

【０１７０】注：新しいパーティション構造がＶＧＳＡ
においてちょうど初期化されたものと同じ恒久的状態を
含むものとする。

【０１７１】ＲＥＤＵＣＩＮＧＡＬＶアクティブ状態のＬＶを減じることは注意して行わなけ
ればならない。対応されねばならない保全性問題に加え
て、取除かれるＰＰにおいてその時アクティブ状態のＩ
／Ｏが存在する可能性がある。

【０１７２】ｉ）ＷＨＥＥＬの制御を取得する。このこ
とは、もしＷＨＥＥＬが回転中ならばこれを停止するこ
とを意味する。もし回転中でなければ、ＷＨＥＥＬが始
動することを禁止する。

【０１７３】ii）ＩＮＴＩＯＤＯＮＥの禁止。減少され
る全てのＬＰに対して、ＬＰの減少が進行し得る前に、
少なくとも１つのアクティブ状態のＰＰがＬＰに残され
ることを保証するため検査を行わなければならない。こ
れに対する唯一の例外は、もし全てのＰＰがＬＰから減
少されつつあり、これによりこれを排除する場合であ
る。もしアクティブでないＰＰにＬＰが残されるなら
ば、ＬＶ減少操作全体はできないはずである。減少され
る各ＰＰがに対して、その各パーティション構造におけ
る減少フラッグをオンにする。また、これは大掛かりで
あり、また事故復旧面における保全性とも関係があるた
め、もしＰＰが多数のコピーを持つＬＰの一部であり、
このＬＰの全てのＰＰが除去されるのではなく、除去さ
れるＰＰが陳腐化状態になければ、変更および陳腐化フ
ラッグもまたオンにされねばならない。もし陳腐化フラ
ッグがオンにされると、ＶＧＳＡのメモリー・バージョ
ンもまた更新されねばならない。従って、割込みレベル
を再び可能状態にする。

【０１７４】これはやや複雑であるが、ＶＧＤＡが破壊
前に更新されなければ、システム破壊後にＰＰが再びア
クティブ状態にならないこと、また破壊前に書込みがＬ
Ｐにおいて生じたことを保証するような方法で行わなけ
ればならない。もしＬＰの全てのＰＰが除去されるなら
ば、減少フラッグが新しい要求をＬＰ外に保つようにす
る。システムが破壊しても、回復と同時にデータは依然
として全てのコピー間で一致することになる。

【０１７５】iii）もしＶＧＳＡのメモリー・バージョ
ンが修正されたならば、ＷＨＥＥＬを始動／再始動し
て、これが１回転を完了するのを待つ。ＶＧＳＡのメモ
リー・バージョンが修正されなければ、ＷＨＥＥＬにお
ける禁止を解除し、これが始めに回転中であったならば
再始動する。

【０１７６】iv）ＬＶを廃棄する。これは、その時ＬＶ
作業待ち行列にある全ての要求が完了するのを待つこと
を意味する。

【０１７７】ｖ）ＩＮＴＩＯＤＯＮＥの禁止。この時、
パーティション構造を除去されるＰＰに対するドライバ
階層から除去する。割込みレベルを再び可能状態にす
る。

【０１７８】vi）ＶＧＤＡは書込み可能である。

【０１７９】注：ＶＧＤＡが書込みできず、減少操作が
失敗ならば、ＰＰはその時の減少状態のままあるいはド
ライバ階層から除去され、従って、Ｉ／Ｏに使用できな
い。

【０１８０】ＡＤＤＩＮＧＡＰＶＴＯＡＮＥ
ＸＩＳＴＩＮＧＶＧＰＶがＶＧに加えられると、ＰＶ上のＶＧＳＡはＷＨＥ
ＥＬに加えられねばならない。加えられるＰＶがアクテ
ィブ状態のＰＰを持ち得ないため、ＶＧＳＡの活動化は
容易となる。唯一の実際問題は事故復旧であり、これさ
えも簡素化される。

【０１８１】ｉ）構成ルーチンは、活動化されるディス
クＶＧＳＡを初期化しなければならない。構成ルーチン
は、２進数０の内容を持つＶＧＳＡを定めることがで
き、あるいはＩＯＣＴＬを介してＶＧＳＡのメモリー・
バージョンのその時のイメージを得ることができる２つ
の選択肢を有する。唯一の重大な問題は、ＰＶの付加が
完了する前にシステムが破壊するならば、この新しいＶ
ＧＳＡがｖａｒｙｏｎｖｇにより使用されないことを保
証するためタイムスタンプがゼロでなければならないこ
とである。

【０１８２】ii）ＷＨＥＥＬの制御取得。これは、もし
ＷＨＥＥＬが回転中ならばこれを停止することを意味す
る。もし回転中でなければ、これが始動することを禁止
する。

【０１８３】iii）ＩＮＴＩＯＤＯＮＥの禁止。物理ボ
リューム構造をボリューム・グループ構造に挿入する。

【０１８４】ＷＨＥＥＬが回転中ならば、少なくともこ
れを加えられた位置まで戻すように回転させる。これ
は、既にその時のＶＧＳＡを有するＰＶに対するある余
分な書込みを生じるが、これは顕著な遅れを生じるほど
頻繁ではない。

【０１８５】もしＷＨＥＥＬが回転中でなければ、ＷＨ
ＥＥＬの制御を新たに加えられた位置の直前の位置へ戻
す。これは、ＷＨＥＥＬを完全に１回転させることにな
らない。この制御は、ＷＨＥＥＬに新しい位置がこの回
転と同時に書込まれた最後の位置であると信じさせるよ
うにセットアップされねばならない。これは、新しいＶ
ＧＳＡが書込まれ、その時ＷＨＥＥＬ上にある他の全て
が既に持っている同じデータで再書込みされない唯一の
方法である。ＶＧＳＡのメモリー・バージョンが加入に
より変更されることがないため、その時のバージョンが
新しいディスクへ書込まれることが唯一の重要事であ
る。同じ情報を他の全てのディスクのＶＧＳＡに再び書
込むことは重要ではない。

【０１８６】iv）割込みレベルの再可能化ＷＨＥＥＬの始動／再始動注：ＷＨＥＥＬが停止するか、あるいは構成ルーチンか
らの要求がＷＨＥＥＬからオフにされる時、ＶＧＳＡが
アクティブ状態となり、ＰＰが状態を変化させるならば
更新されることになる。ＶＧＳＡが活動化されたやや後
にＶＧＤＡが書込まれるものとする。例え新しいＰＶに
おけるＶＧＤＡの書込みが失敗しても、ＬＶＭのカーネ
ル部分まで戻ってこれを取除く規定された機構がなけれ
ば、ＶＧＳＡはアクティブ状態を維持することになる。

【０１８７】ｖ）ボリューム・グループ構造における定
数カウントの増加ＤＥＬＥＴＩＮＧＡＰＶＦＲＯＭＡＮＥＸＩ
ＳＴＩＮＧＶＧＷＨＥＥＬからのＶＧＳＡの削除は、おそらくはその全
ての最も簡単な操作である。これは、ＰＶがアクティブ
なＰＰを持たないという事実による。

【０１８８】i)ＶＧＤＡは、ＰＶがもはやＶＧにないこ
とを表示するため更新されなければならない。

【０１８９】ii）ＷＨＥＥＬの制御を取得。これは、Ｗ
ＨＥＥＬが回転中であればこれを停止することを意味す
る。もしＷＨＥＥＬが回転中でなければ、始動を禁止す
る。

【０１９０】iii）ＩＮＴＩＯＤＯＮＥの禁止。ＷＨＥ
ＥＬの位置を検査する。もしＷＨＥＥＬが除去される位
置に静止するならば、制御を進めて物理ボリューム構造
をボリューム・グループ構造から取除く。もしＷＨＥＥ
Ｌが回転中であり、書込まれる次の位置が除去される位
置であるならば、これをスキップするようにＷＨＥＥＬ
の制御を調整して、物理ボリューム構造をボリューム・
グループ構造から除去する。もしＷＨＥＥＬが回転中で
ないか、あるいは位置が上記の状態のいずれでもなけれ
ば、物理ボリューム構造をボリューム・グループ構造か
ら除去する。

【０１９１】iv）もしＷＨＥＥＬが回転中だったなら
ば、これを再始動する。ＷＨＥＥＬが回転中でなかった
ならば、禁止を解除する。

【０１９２】ＶＧＳＡにおける情報が変更されないた
め、ＷＨＥＥＬの１回転を待つ必要はない。逸失の状況
を持つＰＶを削除する時、この同じ手順に従う。

【０１９３】ＲＥＡＣＴＩＶＡＴＩＮＧＡＰＶＰＶの再付勢は、実際に規定されたＰＶが逸失状態から
アクティブ状態へ状態を変えつつあることを意味する。
これは、ＰＶが戻されるかあるいはｒｅ−ｖａｒｙｏｎ
ｖｇ操作によって時に生じる。ＰＶの追加に使用される
同じ手順がここでも使用することができる。ここでは、
この条件が存在すること、およびＶＧＳＡの再付勢のた
め規定されたＰＶ追加手順の他に何ら特別な処理を必要
としないことを認識するため述べるに止める。

【０１９４】ＶＡＲＹＩＮＧＯＮＡＶＧＶＧにおける変更は、ＷＨＥＥＬに関する限り実際には
構成および復旧操作である。これら両操作については以
後に論述する。しかし、ここでＶＧにおいて通常のＬＶ
が開かれるまで、ＷＨＥＥＬがアクティブ状態にならな
いことに注意することが重要である。このことは、ｖａ
ｒｙｏｎｖｇ操作が完了した後までＷＨＥＥＬがアクテ
ィブ状態にならないことを意味する。

【０１９５】ＶＡＲＹＩＮＧＯＦＦＡＶＧＶＧをｖａｒｙｏｆｆする唯一の方法があるが、通常お
よび強制の２つのモードがある。これらの間の唯一の実
際の相違は、強制モードがＶＧＦＯＲＣＥＤフラッグを
セットすることである。このフラッグは、ドライバに対
してこのＶＧが強制的に遮断されることを知らせる。強
制オフが新しいＩ／Ｏが始動することを停止する。更
に、ＷＨＥＥＬが回転中ならば、次のＶＧＳＡ書込みの
完了時に停止し、ＷＨＥＥＬ上の全ての要求をエラーと
して戻す。もしＷＨＥＥＬが回転中でなければ、始動を
禁止される。通常のｖａｒｙｏｆｆに対しては同じ手順
に従うが、如何なる問題にも遭遇しない。これは、継続
する前に通常のｖａｒｙｏｆｆがＶＧにおいてＮＯＯ
ＰＥＮＬＶ戦略を実行する故である。そのため、もし
ＶＧに開いたＬＶが存在しなければ、ＶＧにはＩ／Ｏが
存在し得ない。もしＶＧにＩ／Ｏが存在しなければ、Ｗ
ＨＥＥＬは回転中ではあり得ない。両方の事例の取扱い
のため唯１つの手順が設計されている。

【０１９６】ｉ）もしこれが通常のｖａｒｙｏｆｆであ
れば、ＮＯＯＰＥＮＬＶを実行する。もしこれが強
制オフであれば、ＶＧＦＯＲＣＥＤフラッグをセットす
る。

【０１９７】ii）ＶＧを静止状態にする。これは、全て
のその時アクティブ状態の要求が戻されるまで待機する
ことになる。これはＶＧにおいてその時アクティブなＩ
／Ｏを有するかもしれないため、実際には、強制オフ・
モードに適用するに過ぎない。

【０１９８】注：この時間中、例え１つのパーティショ
ンが正しく働いても、任意のミラー化されたＬＰパーテ
ィションにおける失敗を有する任意の書込み要求がエラ
ーとして戻されねばならない。これは、ＰＰがこの時陳
腐化状態であることを示すためＶＧＳＡが更新され得な
い故である。ＶＧが強制オフされるため、ミラー書込み
の一貫性キャッシュ（以下本文で記述する）がちょうど
ＶＧＳＡのように凍結されている。従って、ミラー書込
み一貫性キャッシュのディスク・バージョンは、この書
込みがアクティブ状態であったことを記憶する。ＶＧが
再びオンに変更される時、ミラー書込み一貫性復元操作
が、ＶＧが強制オフされた時未済の書込みを持つＬＴＧ
を再同期させようと試みる。ミラー書込み一貫性復元操
作がマスターとなるミラーを選択するため、強制された
ｖａｒｙｏｆｆの時点で失敗したものを拾うことがあ
る。もしそうであり、かつこれが読出し可能であるなら
ば、この書込みの目標領域におけるデータは書込み以前
の状態に戻ることになる。従って、ＶＧがオフに強制さ
れる時各々の物理的操作のいずれかにおけるエラーを得
る論理的要求のためエラーが戻され、ＶＧＳＡはその時
ＰＰが陳腐化状態にあることを表示するため更新するこ
とができない。正確性対一貫性に関するこれ以上の詳細
については、ミラー書込み一貫性に関する論議を参照さ
れたい。

【０１９９】iii）このＶＧに対するドライバの階層は
この時除去することができ、システムの資源をシステム
に戻すことができる。

【０２００】ＶＧＳＡに関してまだ言及すべき僅かな領
域がある。これらは、初期構成、ＶＧＳＡ回復、および
最後にＶＧＳＡの定数である。初期構成に最初に言及す
る。

【０２０１】ドライバは、構成ルーチンがＶＧＳＡのメ
モリー・コピーのためメモリーの割付けを行い、これに
対するポインタをボリューム・グループ構造に置くと仮
定する。構成ルーチンは、有効ＶＧＳＡを選択して、ミ
ラー操作されたＬＶが開かれる前に選択されたＶＧＳＡ
のイメージを前記メモリーＶＧＳＡへロードする。更
に、ボリューム・グループ構造に保留されたｂｕｆ構造
およびｐｂｕｆ構造が組込まれているため、ボリューム
・グループ構造には初期化される必要がある幾つかの他
のフィールドがある。これらの構造は、ＶＧＳＡのＩ／
Ｏ操作のためにのみ保留されている。これは、ＶＧＳＡ
操作に対して論理的要求により使用されるｂｕｆ構造お
よび物理的要求により使用されるｐｂｕｆ構造があるこ
とを保証し、従って、汎用プールからｐｂｕｆ構造が使
用できない場合にあり得るデッドロック状態を排除す
る。構成ルーチンはまた、どのＰＶがアクティブなＶＧ
ＳＡを有するか、またこれらがＰＶに置かれる場所を制
御する。これらのフィールドは、物理ボリューム構造に
あり、これもセットアップされなければならない。

【０２０２】ＶＧＳＡに関する次のトピックは、その回
復および（または）ＶＧｖａｒｙｏｎ時間における妥当
性である。ＶＧ中のＰＶで得られるものから１つのＶＧ
ＳＡを選択することは、構成ルーチンの責務である。こ
の選択プロセスは、ちょうど有効ＶＧＤＡを選択するた
めの選択プロセスの如くである。これは、ＶＧＳＡの初
めおよび終りに存在する図７のタイムスタンプを使用す
る。ＶＧＳＡのメモリー・バージョンが変化される毎
に、これらタイムスタンプはシステム時間を反映するよ
うに更新される。構成ルーチンは、初めと終りのタイム
スタンプが一致しかつ他の使用可能なＶＧＳＡより時間
的に後であるＶＧＳＡを選択しなければならない。ＶＧ
ＳＡ全体がエラーなしに読出されねばならないことは言
うまでもないことである。一旦ＶＧＳＡが選択される
と、構成ルーチンはドライバのパーティション構造を初
期化するため状態フラッグを使用しなければならない。
もし構成ルーチンが選択されたものと比して古いＶＧＳ
Ａを見出すか、あるいは読出しエラーがあるならば、Ｖ
Ｇが通常のＩ／Ｏアクティビティを行うことを許される
前に、構成ルーチンはＶＧＳＡを書直す（復旧する）こ
とになる。もしＶＧＳＡがエラーなしに書直すことがで
きなければ、ＰＶは使用されずに逸失と宣言される。

【０２０３】最後のＶＧＳＡが当面する問題は、ＶＧＳ
Ａの定数である。ＶＧＤＡと同様に、ボリューム・グル
ープがオンライン上であるためのＶＧＳＡ定数がなけれ
ばならない。もしＶＧＳＡ書込みが失敗するならば、Ｐ
Ｖは逸失と宣言され、従って、このＰＶ上の全てのアク
ティブなＶＧＳＡもまた逸失する。この時、その時の全
てのアクティブなＶＧＳＡについてカウントが行われ、
もしこのカウントが構成ルーチンによりセットアップさ
れた定数カウントより小さければ、ＶＧは強制的にオフ
ラインとされる。もしＶＧがオフラインに強制される
と、その時ＷＨＥＥＬ上の全ての要求は、もしこれらが
既にエラーを持たなかったならば、エラー（ＳＩＯ）と
して戻される。ＷＨＥＥＬは停止され、新しい要求を受
入れない。ＶＧを再び活動化するためには、このＶＧは
オフに変更され、次いで再びオンラインに変更されねば
ならない。

【０２０４】ＷＨＥＥＬを構成する可能なコードについ
ては、この明細書の末尾に添付した表１を参照された
い。

【０２０５】ミラー書込みの一貫性異なる位置における同じデータの多数のコピーを有する
システムにおけるはるかに大きな問題は、これらコピー
が相互にミラー・イメージを呈することを保証すること
である。望ましい実施態様においては、ＬＶＭでは１
つ、２つあるいは更に３つの物理ボリュームにわたって
延びた同じデータの３つまでのコピーがあり得る。そこ
で、特定の論理的書込みが開始される時、全てのコピー
が書込まれる前にシステムが破壊するならば、この時点
から各々の下にあるコピーが相互に一致しないことがほ
とんど確実である。不都合にも、非同期なディスク操作
の場合にはこの問題を阻止する方法がない。好都合なこ
とには、基礎的な全ての物理的操作が完了するまでＬＶ
Ｍが論理的要求を戻さないため、全てが失われることは
ない。これは、不良ブロックの置換や陳腐化ＰＰ処理を
含む。従って、ユーザは、特定の書込みの要求がエラー
・フラッグをオンにすることなく戻されるまでは、この
書込みが成功したと解釈することはできない。この時、
またこの時にのみ、ユーザは読出しが書込まれたデータ
そのものを読出すものと見做すことができる。これが意
味することは、ＬＶＭがミラー間のデータの一貫性に集
中し、データの正しさには集中しないことである。この
ことは更に、システム破壊後に復旧すると同時に、シス
テムが停止した時論理的書込みが書込みつつあったデー
タはＬＰの物理的コピーに反映されたりされなかったり
することを意味する。ＬＶＭは、システム破壊後に、Ｌ
Ｐの全てのアクティブなＰＰ間のデータが一致すること
を保証する。これは古いデータであったり新しいデータ
であり得るが、全てのコピーは同じデータを含むことに
なる。これが、ミラー書込み一貫性即ちＭＷＣと呼ばれ
る。

【０２０６】一貫性の保証には１つの制約がある。ボリ
ューム・グループは、定数なしではオンラインにするこ
とができない。ユーザは、例えＶＧＤＡおよびＶＧＳＡ
の定数が得られなくても、ＶＧオンラインを強制する能
力を有する。この強制された定数が使用されるならば、
ユーザは、１つのＬＰの複数のコピー間にデータの不一
致が存在し得る事実を受入れる。

【０２０７】ＰＰが陳腐化してないかもしれないため、
通常の再同期を用いることができない。その代わりに、
全てのコピーの一貫性を生じるためには、同じ論理アド
レスに対する書込みが直後に続くＬＰからの単純な読出
し機能で充分である。これはバックグラウンドあるいは
フォアグラウンドで実行することができるが、いずれの
場合も時間がかかる。

【０２０８】ミラー書込み一貫性は、書込みが開始され
たこと、およびこれが書込みつつある場所を記憶するこ
とによって達成される。書込みが開始したこと、および
これが書込みつつあった場所を記憶することは非常に重
要であるが、これが完了するときはそれほど重要ではな
い。この情報は、ミラー書込み一貫性キャッシュ即ちＭ
ＷＣＣに記憶される。そのため、もしシステムが破壊す
ると、書込まれつつあるＬＰ内のＰＰの復旧は、ＭＷＣ
Ｃにおけるエントリの解釈、およびＬＶ文字デバイス・
ノードを介してＬＰの影響を受けた領域に対してミラー
書込み一貫性回復（ＭＷＣＲ）Ｉ／Ｏ操作を発生する機
能となる。これらのＭＷＣＲ操作は、ＬＶが通常のＩ／
Ｏに対して使用可能となる前に行われなければならな
い。ＭＷＣＣの詳細にについては以下に記述する。

【０２０９】ＶＧ当たり１つのＭＷＣＣが存在し、これ
は２つの部分からなっている。時にディスク部分、また
時には単に部分１と呼ばれる第１の部分は、物理ボリュ
ームに対して書込まれる部分である。従って、復旧の間
ＭＷＣＲ操作を制御するため使用されるのはこの部分で
ある。部分１の詳細は、後で論述される。ＭＷＣＣの第
２の半部はメモリー部即ち部分２である。ＭＷＣＣの部
分２は、メモリーにのみ駐在する。これは、ＶＧがオン
ラインに置かれる時生じる。ミラーにおけるデータの復
元とは関係のない、従って、ディスクあるいは永久記憶
装置に対して書込む必要がないハッシュ操作、順序付
け、エントリの解放、等の如きキャッシュの制御に対す
る多くのものが存在する。これが、ＭＷＣＣに対して２
つの部分がある理由である。部分１即ちディスク部は、
ディスクに対して書込まれるが部分２はそうでない。各
ＰＶは、ＭＷＣＣの１つのコピーを保持する。ＭＷＣＣ
の各部分の更に詳細な内容は下記の如くである。即ち、部分１−ディスク部ＭＷＣＣの部分１は、長さが５１２バイトのディスク・
ブロックである。ＰＶディスク・ブロック２は、コピー
のため保留されている。部分１は３つの基本的部分を有
する。

【０２１０】ｉ）初めのタイムスタンプ ii）キャッシュ・エントリ iii）終りのタイムスタンプこのタイムスタンプは、ＭＷＣＣを検証して、ＶＧにお
いて使用可能な全てのＰＶから最後のコピーを選択する
ため復元中に使用される。タイムスタンプは、それぞれ
長さが８バイトである。全てがＶＧによりアクティブ状
態で使用されることはないだろうが、タイムスタンプの
間には６２のキャッシュ・エントリが存在する。アクテ
ィブ状態のキャッシュの大きさは、１エントリと６２エ
ントリ間で変化し得る。アクティブ状態のキャッシュの
大きさは、システム破壊後にＶＧの復元のため要する時
間長さと正比例する。この復元時間については、後で論
述する。このシステムは、現在は３２のキャッシュ・エ
ントリを使用するように構成されている。別の実施態様
は、調整可能なようにコマンド・ライン・オプションを
提供する。

【０２１１】各々の部分１のキャッシュ・エントリは２
つのフィールドを有する。

【０２１２】ｉ）論理トラック・グループ（ＬＴＧ）番
号キャッシュ・ラインのサイズは１つのＬＴＧ、即ち１２
８Ｋバイトである。これは、ＬＴＧ境界に整列される。
例えば、ＭＷＣＣにおけるアクティブ状態のキャッシュ
・エントリの数が３２であるとすれば、ＶＧにおける任
意の時点において書込まれる３２以下の異なるＬＴＧが
あり得る。

【０２１３】ii）少数のＬＶＬＴＧが帰属する少数のＬＶ部分２−メモリー部ＭＷＣＣの部分２のエントリの各々は、幾つかのフィー
ルドからなっている。部分２はメモリーに駐在するた
め、そのサイズはここでは重要ではない。部分１のキャ
ッシュ・エントリと直接１対１の対応が存在することを
知ることが重要である。従って、部分１で３２のキャッ
シュ・エントリが使用されるならば、部分２もまた３２
のエントリを有する。

【０２１４】ｉ）ハッシュ待ち行列ポインタこのハッシュ待ち行列における次のキャッシュ・エント
リに対するポインタ。現在、ボリューム・グループ構造
には、８つのハッシュ待ち行列アンカーが存在する。

【０２１５】ii）状態フラッグ変化なし−最後のキャッシュ書込み操作以後、キャッシ
ュ・エントリが変化しない。

【０２１６】変更した−最後のキャッシュ書込み操作以
後、キャッシュ・エントリが変化した。

【０２１７】クリーン−最後のクリーンアップ操作以
後、エントリが使用されなかった。

【０２１８】iii）対応する部分１のエントリに対する
ポインタこの部分２のエントリと対応する部分１のエントリに対
するポインタ。

【０２１９】iv）Ｉ／Ｏカウントこのキャッシュ・エントリが存在するＬＴＧにおけるア
クティブ状態のＩ／Ｏ要求の数のカウント。

【０２２０】ｖ）次の部分２エントリに対するポインタチェーン上の次の部分２エントリに対するポインタ。

【０２２１】vi）前の部分２エントリに対するポインタチェーン上の前の部分２エントリに対するポインタ。

【０２２２】各キャッシュ・エントリに対して２つの部
分が存在するが、この点から、キャッシュ・エントリへ
の参照が部分１からのエントリにより形成される実体
（エンティティ）および部分２からの対応するエントリ
を意味することを知ることが重要である。

【０２２３】ＭＷＣＣの概念は一見簡単であるが、その
構成および復元はそうでない。この複雑さの一部は、Ｖ
Ｇがその全てのＰＶなしにオンラインに置くことができ
るという事実によって生じる。実際に、システム破壊の
後、システムが停止した時存在したＰＶなしにＶＧを置
くことができる。

【０２２４】ＭＷＣＣに関する論議には２つの主な領域
がある。ドライバが種々のシステム構成要素から要求を
受取る時、キャッシュの保守、更新および書込みの機能
が存在する。これは操作の前面である。これは、ＬＴＧ
がある任意の時点において不一致であるかも知れないこ
とが知られているので行われる。従って、操作の裏面が
存在する。これは、システムの破壊が生じた時、または
不規則な停止があった時であり、ＰＶに駐在するＭＷＣ
キャッシュは、事物を再び一致させるために使用されな
ければならない。そこで、本論の焦点を、最初のステッ
プとしても生じる操作の前面に置く。

【０２２５】ドライバは、メモリーの割付けを行い、こ
れを最初のＬＶがＶＧにおいて開かれる時、キャッシュ
の両方の部分に対して初期化する。ドライバは、ＬＴＧ
を一致させるためディスク上に駐在するＭＷＣＣが既に
復元プロセスにより使用され、またこれらのディスク・
ブロックがデータを失うことなく重ね書きすることがで
きるものと仮定する。ＭＷＣＲ（ミラー書込み一貫性回
復）操作は、実際には書込みが後に続く読出しである。
ＭＷＣＣが書込みを監視するため、ＭＷＣＲ操作は、Ｍ
ＷＣＣのディスク・コピーを修正することなくｖａｒｙ
ｏｎタイムスリップで行われる。

【０２２６】ＭＷＣＣは要求が受取られる時管理されね
ばならないエンティティであるため、ミラー書込み一貫
性管理（ＭＷＣＭ）が存在する。ＭＷＣＭは、スケジュ
ーラ層と戦略層間のスケジューラ層の頂部に位置してい
る。このＭＷＣＭは、その唯一の問題がミラー化された
パーティション要求に関するためそれ自体で層全体は持
たないが、そこに置けば理解が更に容易である。

【０２２７】初期要求ポリシーが要求を受取ると、この
要求がＭＷＣＭへ渡されるべきかどうかを調べるため幾
つかの初期検査を行う。下記は、要求をＭＷＣＭへ渡さ
せない条件のリストである。これは、ＭＷＣＭへ渡され
る要求が要求毎にキャッシュされることを意味しない。
用語キャッシュは、本文ではそれほど厳密でなく使用さ
れる。要求は従来の意味ではキャッシュされず、要求が
継続することを許される前に永久記憶に書込まれるその
操作に関する情報を待たねばならないという意味におい
てキャッシュされる。そこで、ＭＷＣＭは要求をポリシ
ーへ戻してこの要求が進行し得ることを表示する。

【０２２８】ｉ）要求が読出しである。

【０２２９】ii）ＬＶオプションは、ミラー書込み一貫
性フラッグをオンにしない。

【０２３０】iii）要求は、拡張パラメータを介してミ
ラー書込み一貫性を特に要求しない。

【０２３１】iv）このＬＰには唯一のアクティブなパー
ティションが存在し、再同期はこのパーティションでは
進行中でない。これは、唯一のコピーが存在し、あるい
は他の全てが陳腐化状態であることを意味し得る。

【０２３２】先に述べたように、各ＰＶはＭＷＣＣに対
して保留されたブロックを有する。しかし、これらが全
て異なるものであり得ることも述べた。ＭＷＣＣのメモ
リー・イメージは、その時アクティブな書込みを有する
ＶＧにおけるＬＴＧの全体的な展開である。しかし、Ｍ
ＷＣＣのディスク・コピーは実際には、前記ＰＶにＰＰ
を持つＬＰに対する書込みに関するキャッシュにおける
情報のみと関連する。与えられた論理的書込み要求で
は、ＭＷＣＣはこの論理的書込み要求に対するＰＰが割
付けられたＰＶに対して書込まれる。

【０２３３】一例として、もしＬＰが異なるＰＶに１つ
ずつ３つのコピーを持つならば、ＭＷＣＣのコピーは、
実際のデータ書込みが開始される前に各ＰＶへ書込まれ
ることになる。ＭＷＣＣのディスク・コピーに対する全
ての書込みは、並行して行われる。例えＰＰの１つが陳
腐化していても、アクティブなパーティションで書込み
が進行することを許される前に、このディスクにおける
ＭＷＣＣが書込まれねばならない。アクティブなミラー
を含むＰＶがｖａｒｙｏｎの間失ったことが判る場合、
ＭＷＣＣは陳腐化したミラーによりＰＶに対して書込ま
れねばならない。無論、ＰＶが失われたならば、ＭＷＣ
Ｃをこれに書込むことはできない。これは復元以上の問
題であり、以降において論議される。

【０２３４】一旦ＭＷＣＣが要求を受取ると、要求の最
終的な処理前に行われねばならない他の幾つかのテスト
が存在する。ＭＷＣＣは、要求毎に下記の１つを実施す
る。即ち、注：これらの判定はＬＴＧのキャッシュ・ラ
インのサイズ即ち１２８Ｋに基くものであり、物理パー
ティションのサイズに基くものではない。また、本文の
用語キャッシュは、専らメモリー・バージョンに関する
もので、従ってＶＧにおけるＬＶに対して大域的なもの
である。

【０２３５】（目標ＬＴＧがキャッシュにはない）か、
あるいは（目標ＬＴＧがキャッシュにあり、かつ変化し
つつある）ならば、ｉ）キャッシュの修正−要求をキャッシュへ加えるか、
あるいはＩ／Ｏカウントをバンプ（ｂｕｍｐ）する ii）キャッシュ・エントリを、使用されたリストの先頭
に移動する iii）必要に応じて、ＰＶに対するキャッシュの書込み
を開始する iv）要求をキャッシュ書込みの完了を待つ待ち行列に置
くｖ）この要求に対する全てのキャッシュ書込みが完了す
ると、要求をスケジューリング・ポリシーへ戻す。

【０２３６】（目標ＬＴＧがキャッシュにあり、かつ変
化しつつない）ならば、ｉ）Ｉ／Ｏカウントをバンプする ii）キャッシュ・エントリを、使用されたリストの先頭
へ移動する iii）要求をスケジューリング・ポリシーへ戻す。

【０２３７】しかし、上記のロジックに対して幾つかの
例外がある。キャッシュは有限のエンティティであるた
め、これが一杯になることがある。この状態が生じる
と、キャッシュ・エントリが可能となるまで要求は保留
待ち行列へ行く。ドライバの非同期性、およびＭＷＣＣ
書込みを含むディスクのＩ／Ｏ操作の冗長性の故に、問
題を取除くのではなく避けるため特別な特徴がディスク
・ドライバに加えられる。この特徴は、ドライバがディ
スク・ドライバに対してページを隠さないように通知す
ることを可能にする。これは、例えハードウエアがその
時データをメモリーから得ていてもドライバがＭＷＣＣ
を参照できることを意味する。この故に、ＭＷＣＣが任
意のＰＶに対して移動中、ドライバはハードウエア・メ
モリー・キャッシュのコヒーレンス性を維持するため注
意しなければならない。

【０２３８】従って、第１のテストにおいて、いずれか
一方の条件が真でありＭＷＣＣが移動中で書込まれつつ
あるならば、要求はＭＷＣＣがもはや移動中でなくなる
まで保留待ち行列へ進まねばならない。最後のＭＷＣＣ
書込みが完了すると、即ちＭＷＣＣがもはや移動中でな
くなると、この保留待ち行列上の要求はＭＷＣＭを介し
て進行することができる。実際の書込みが生起するより
もはるか前にハードウエアがＭＷＣＣデータをアダプタ
・ハードウエア・バッファへ転送することを想起された
い。このハードウエア転送後およびデータが書込まれた
ことの確認の受取り前にキャッシュにおける情報が変更
されるならば、ディスク上にあると確認されるものが実
際にあるものと異なることを示すウインドウが現れる。
この場合、要求が継続するならば、ＭＷＣＣのディスク
・バージョンが、この書込みがアクティブであることを
知っているかどうか判らない。このような不確実さは許
されない。

【０２３９】最初のテストにおいて第２の条件が真であ
り、ＭＷＣＣが進行中であるならば、何故Ｉ／Ｏカウン
トをバンプしないか、また要求をキャッシュ書込みを待
つ待ち行列に置かないか不審に思うであろう。この条件
は、依然としてアクティブである変化状態により示され
る如く、以前の要求がエントリをキャッシュに置きこれ
がキャッシュ書込みを始動したがその全てが完了しなか
った故に生じる。問題は、第１の要求がキャッシュ書込
みを開始した時、それと、それらのキャッシュが更新さ
れるため必要な全てのＰＶとの間に関連が生じたことで
ある。第２の要求がＭＷＣＭに入る時点においては、存
在するにしてもこれらキャッシュ書込みが幾つ完了した
かを知る方法がない。従って、これらのキャッシュ書込
みが完了する時この要求が進行できるように、この第２
の要求に対してどれだけの関連がなされたかが判らな
い。そのため、この要求はキャッシュ保留待ち行列にも
入れられる。これは、全てのキャッシュ書込みが完了し
た時、この保留待ち行列が再び調べられる故に、要求に
多くの時間を浪費させることがない。これが行われる
と、この要求はキャッシュにこれを取らせて、直ちにス
ケジュールされるように進行することになる。

【０２４０】上記の２つのテスト条件において、ステー
トメントがキャッシュ・エントリがリストの先頭へ移動
されることを表示した。全てのキャッシュ・システムに
おける如く、事物を取扱うためのアルゴリズムがキャッ
シュにある。ＭＷＣＣは、最近使用頻度／最低使用頻度
（ＭＲＵ／ＬＲＵ）アルゴリズムを使用する。ＭＷＣＣ
が初期化されると、キャッシュ・エントリは部分２にお
けるポインタを介して一緒にリンクされる。これらのポ
インタは、次および前のキャッシュ・エントリを指示す
る。これは、ボリューム・グループ構造にアンカーを有
する、２重にリンクされた循環リストである。このアン
カーは、最初のキャッシュ・エントリ、即ち最近使用ま
たは修正されたものを指す。このエントリの次ポインタ
は、最初のエントリの前に修正されたエントリを指す。
このことは、キャッシュにおける最低使用または修正頻
度の最後のエントリに達するまで継続し、その次ポイン
タが再び最初のエントリ即ちアンカーが指示する同じも
のを指す。前ポインタが同じことを逆の順序で行う。そ
のため、最初のエントリの前ポインタは、リストにおけ
る最後のエントリ、即ち最低使用頻度のエントリを指示
する。

【０２４１】この形式の機構を用いることにより、幾つ
かのことが得られる。第１に、フリー・リストが存在し
ない。キャッシュ・エントリが必要な時、リストにおけ
る最後のもの（ＬＲＵ）が採られる。もしそのＩ／Ｏカ
ウントがゼロでなければ、ＬＲＵチェーンを介してキャ
ッシュ・エントリを走査してゼロのＩ／Ｏカウントを持
つエントリを見出す。もし見出されなければ、キャッシ
ュは一杯である。これは、カウンタがその時使用してい
るエントリの数を保持する必要を無くす。

【０２４２】しかし、Ｉ／ＯカウントがＬＲＵエントリ
においてゼロでない時、キャッシュが一杯であるとする
ことができないことに注意されたい。ＬＲＵエントリが
キャッシュにおいて最長であることは判るが、判るのは
これが全てである。もしシステムが多数のディスク・ア
ダプタを持つか、あるいはディスク・ドライバがその待
ち行列の先頭の最適化を行うならば、要求はどんな順序
にも戻り得る。従って、ＬＲＵエントリ後に始められた
要求は、ＬＲＵ要求前に終了し得、これによりＬＲＵチ
ェーンの中間においてキャッシュ・エントリを使用でき
るようにする。従って、一杯であるキャッシュのために
書込み要求を保持しなければならない回数をカウントす
る変数を持つことが望ましい。

【０２４３】キャッシュが一杯である時ＭＷＣＭが保留
待ち行列を走査しつつあるならば、ＭＷＣＭは、保留待
ち行列から加えられたばかりの要求と同じＬＴＧにある
かも知れない要求を探して保留待ち行列を走査し続けな
ければならない。もし何かが見出されれば、これらは保
留待ち行列から取除いて適当なＩ／Ｏカウントを増加し
た後キャッシュ書込み待ち行列へ移動することができ
る。

【０２４４】先に述べたように、ボリューム・グループ
構造にはハッシュ待ち行列アンカー（８）がある。キャ
ッシュ探索時間を短縮するため、要求のＬＴＧによりエ
ントリはこれらのアンカーに対してハッシュされる。こ
のハッシュ動作は、従来技術において公知の方法によっ
て行われる。特定のハッシュ待ち行列におけるエントリ
は、キャッシュ・エントリの部分２におけるハッシュ・
ポインタを介して前方向にリンクされる。

【０２４５】キャッシュのクリーンアップ操作が行われ
ねばならない時がある。最も明らかなのは、ＬＶ閉鎖時
である。この時、キャッシュはゼロのＩ／Ｏカウントを
有するエントリに対して走査されねばならない。エント
リが見出されると、これはクリアされてＬＲＵチェーン
の終りへ移動されねばならない。一旦全キャッシュがが
走査されると、このエントリが帰属するＰＶもまた書込
まれねばならない。キャッシュのクリーンアップ操作の
別の時期は、ＩＯＣＴＬを介するシステム管理の要求時
である。

【０２４６】本文に述べるに値する他の１つのことがあ
る。もしディスク上のＭＷＣＣブロックが媒体の欠陥に
より不良となるとどうなるか？もしこの条件が見出され
ると、ＭＷＣＭはこのブロックのハードウエアの置換え
を行おうと試みる。もしこの置換えが失敗するか、ある
いはＭＷＣＣにおいて媒体でない種類のエラーに遭遇す
るならば、ＰＶが逸失を宣言される。

【０２４７】ＭＷＣＣの復元次に、ＭＷＣＣの前面がどのように働くかを検討しよ
う。ＭＷＣＣの全目的が、システム破壊の事象におい
て、書込み要求がアクティブなミラー状態のＬＴＧを見
出し一致させることができるように、充分な要素を残す
ことであることを想起しよう。この論議は、ＭＷＣＣの
裏面あるいは復元措置に向けられる。

【０２４８】復元は初期のｖａｒｙｏｎ操作によっての
み行われる。これは、復元措置の進行中に、ＶＧにおけ
る通常のユーザＩ／Ｏを禁止する必要による。

【０２４９】この復元操作は、ＶＧのｖａｒｙｏｎ操作
の最終の局面である。これは、例え移動中の全てのＬＴ
Ｇが一致させられるまでＶＧにおける通常のＩ／Ｏを許
容しないように注意しねばならない復元操作中でも、Ｉ
／Ｏが生じる前にＶＧ全体がまとめてカーネルに構成さ
れねばならない故である。

【０２５０】復元プロセスにおける最初ステップは、使
用可能な全てのＰＶから最後のＭＷＣＣを選択すること
である。一旦これが行われると、選択されたＭＷＣＣに
おけるＬＴＧの復元は、キャッシュにおけるエントリを
有するＬＶ／ＬＰ／ＬＴＧに対してミラー書込み一貫性
復元（ＭＷＣＲ）Ｉ／Ｏ要求を発するという簡単なタス
クとなる。この方法は、復元操作の最大数がＭＷＣＣの
大きさに制限される故に、高速経路法と呼ばれる。これ
は、作用において、ＶＧに対する最大復元時間がどれだ
けかをセットする。換言すれば、親のＬＰが１つ以上の
陳腐化しないＰＰコピーを有するならば、選択されたＭ
ＷＣＣを用いることがＬＴＧにおける復元を行う。

【０２５１】これらのＭＷＣＲ要求の間、もしミラーが
書込み失敗となるか、あるいは逸失ＰＶ上にあるなら
ば、これはドライバによりＷＨＥＥＬを介して陳腐化状
態とマークされることになる。

【０２５２】ＰＶを失うことがｖａｒｙｏｎ時間におけ
る復元操作の時間を増すことはないが、ミラーを後でＰ
Ｖがオンラインに戻る時再同期される必要がある陳腐化
状態にすることができる。３つのタイプの逸失ＰＶがあ
る。第１のタイプは、ＶＧＳＡにおいて逸失としてマー
クされるＰＶである前に失ったＰＶである。これらの前
に失ったＰＶは、最後のｖａｒｙｏｎで失われ得るか、
あるいはＶＧがオンラインにある間ドライバが見出して
これらを失ったと宣言し得る。第２のタイプの失われた
ＰＶは、新たに発見された逸失ＰＶである。これらのＰ
Ｖは、この時使用できないｖａｒｙｏｎ操作により見出
されが、ＶＧＳＡにおけるＰＶの状態は、ＶＧがオンラ
インにあった最後にこれらがオンラインにあったことを
示している。これは、定数の喪失を生じてＶＧが強制的
にオフラインにされた、ドライブまたはアダプタの障害
によって生じ得る。新たに発見された逸失ＰＶの別の原
因は、ｖａｒｙｏｎｖｇ指令が出された時にＰＶがｖａ
ｒｙｏｎに対するＰＶのリストに含まれなかった時であ
る。ＰＶが新たに発見された逸失カテゴリに該当する別
の１つの方法があり、これは何らかの種類の読出しエラ
ーによりＭＷＣＣが読出すことができないが、ＰＶがＶ
ＧＤＡ読出しおよび書込みに応答する時である。

【０２５３】前に失われたＰＶと新たに発見された逸失
ＰＶは最後のタイプの逸失ＰＶ、現在失われているＰＶ
に合成される。現在失われているＰＶは、本論にとって
重要なものである。復元のシナリオの最初の局面、即ち
得られるＰＶからＭＷＣＣを選択して高速経路法の復元
を行った後、第２の局面が行われる。この第２の局面
は、現在失われているＰＶが生じる場合にのみ行われ
る。

【０２５４】逸失ＰＶにおけるＬＴＧの実際の復元は、
幾つかの理由から不可能である。この理由の最も大きな
理由は、ＰＶが失われたことであり、従って如何なるＩ
／Ｏも受入れられないことである。逸失ＰＶの別の問題
は、ＬＰ／ＬＴＧの全てのコピーが逸失ＰＶに完全に含
まれる時である。これは、復元プロセスで使用可能なこ
れらのＬＴＧについての情報が一切ない故に問題であ
る。書込みＩ／ＯがこれらＬＰ／ＬＴＧに対して進行過
程にあったかどうかについては判らない。

【０２５５】従って、未済のＩ／Ｏが存在することが仮
定されねばならず、ＰＶが再びオンラインに戻される
時、復元プロセスがデータの一貫性を保証するため然る
べきことを行わねばならない。この場合にするべき正し
いことは、１つを除く全ての陳腐化状態でないミラーを
陳腐化としてマークすることであり、即ち、ＶＧ内の各
ＬＰに対して、もしＬＰが現在失われているＰＶに完全
に含まれるならば、１つを除く全てのミラーを陳腐化状
態とマークする。ＰＶが再びオンラインに戻る時、生じ
たＬＰは再同期されねばならない。

【０２５６】尚、次に示すのは図１４に示したＰＢＵＦ
データ構造中の各データの説明である。

【０２５７】フラッグ−基本的情報−読出し／書込み、
バッファ使用中、エラー識別子ポインタ−これらＰＢＵＦを種々のチェーンにリンクし
てフロー制御のため使用するＩＯＤＯＮＥ−要求が完了する時、ＰＢＵＦを渡す機能
に対するＰＴＲ、即ち、低いレベルのディスク・デバイ
ス・ドライバがこのフィールドにより指示された機能を
呼出して、それらが要求を終了した時要求をＬＶＭへ戻
すデバイス番号−転送が行われる物理デバイス番号ディスク・ブロック番号−転送が開始するディスク・ブ
ロック番号メモリー・アドレス−データがやり取りされるメモリー
・アドレス転送カウント−転送するバイト数。ＬＶＭの場合、ディ
スク・ブロック（５１２バイト）の倍数でなければなら
ない。

【０２５８】エラー・タイプ−エラー表示子がフラッグ
・フィールドにおいてオン（真）である時、このフィー
ルドはエラーのタイプを表示する。事例：媒体エラー、
不当要求、、、残留転送カウント−転送にエラーが生じ
ると、このフィールドは転送されなかったバイト数を含
む。

【０２５９】元の要求に対するＰＴＲ−ＬＶＭが戦略層
より上の層から要求を受取る。これら論理的要求は１つ
以上の物理的要求（ＰＢＵＦ）に変換される。与えられ
た論理的要求に対する全ての物理的要求が完了する時、
論理的要求はその起源へ戻すことができる。これは、論
理的要求の起源に対する逆戻りリンクである。

【０２６０】スケジューリング・ルーチンに対するＰＲ
Ｔ−物理的要求がディスク・ドライバからＩＯＤＯＮＥ
フィールドを介してＬＶＭの物理層へ戻される。この物
理層は不良ブロック処理に対する責務を有する。もし要
求が完了すると、物理層は要求をこのポインタを介して
スケジューリング層へ戻す。スケジューリング層・は、
論理的要求の計算のため次に何をしなければならないか
の判定を行う。

【０２６１】ミラー−このＰＢＵＦ、０、１または２と
関連するミラー番号無効ミラー−どのミラーが無効化されるべきか、即ち論
理的要求を満たすため使用されないか、即ちミラーが破
壊されるか、あるいは使用できない物理ボリューム上に
あるか、を表示するビット・マスク（３ビット）不良ミラー−どのミラーが故障したか、あるいは破壊し
たかを表示するビット・マスク（３ビット）完了ミラー−どのミラーが転送を完了したかを表示する
ビット・マスク（３ビット）ＳＷ再試行−ソフトウエア再試行カウント；このブロッ
クが何回ソフトウエア置換えを試みたか、１回または２
回タイプ−ＰＢＵＦのタイプ、ＷＨＥＥＬによるエラー処
理および不良ブロック処理において使用される。ＷＨＥ
ＥＬに対してこれがＰＰ要求陳腐化、ＰＶ逸失マーク、
あるいはＰＰ再生のいずれであるかを通知する。

【０２６２】不良ブロック状況−全ての物理ボリューム
の保留領域に駐在する不良ブロック・ディレクトリの更
新を制御するため使用される。

【０２６３】ＷＨＥＥＬ停止−このＰＢＵＦがＷＨＥＥ
Ｌ上にある時、ＷＨＥＥＬからオフとなる位置

【０２６４】

【表１】

【０２６５】

【０２６６】

【０２６７】

【０２６８】

【０２６９】

【０２７０】

【０２７１】

【０２７２】

【０２７３】

【０２７４】

【０２７５】

【０２７６】

【０２７７】

【０２７８】

【０２７９】

【０２８０】

【０２８１】

【０２８２】

【０２８３】

【０２８４】

【０２８５】

【０２８６】

【０２８７】

【０２８８】

【０２８９】

【０２９０】

【０２９１】

【０２９２】

【０２９３】

【０２９４】

【０２９５】

【０２９６】

【０２９７】

【０２９８】

【０２９９】

【０３００】

【０３０１】

【０３０２】

【０３０３】

【０３０４】

【０３０５】

【０３０６】

【０３０７】

【０３０８】

【０３０９】

【０３１０】

【０３１１】

【０３１２】

【０３１３】

【０３１４】

【０３１５】

【０３１６】

【０３１７】

【０３１８】

【０３１９】

【０３２０】

【０３２１】

【０３２２】

【０３２３】

【０３２４】

【０３２５】

【０３２６】

【０３２７】

【０３２８】

【０３２９】

【０３３０】

【０３３１】

【０３３２】

【０３３３】

【０３３４】

【０３３５】

【０３３６】

【０３３７】

【０３３８】

【０３３９】

【０３４０】

【０３４１】

【０３４２】

【０３４３】

【０３４４】

【０３４５】

【０３４６】

【０３４７】

【０３４８】

【０３４９】

【０３５０】

【０３５１】

【０３５２】

【０３５３】

【０３５４】

【０３５５】

【０３５６】

【０３５７】

【０３５８】

【０３５９】

【０３６０】

【０３６１】

【０３６２】

【０３６３】

【０３６４】

【０３６５】

【０３６６】

【０３６７】

【０３６８】

【０３６９】

【０３７０】

【０３７１】

【０３７２】

【０３７３】

【０３７４】

【０３７５】

【０３７６】

【０３７７】

【０３７８】

【０３７９】

【０３８０】

【０３８１】

【０３８２】

【０３８３】

【０３８４】

【０３８５】

【０３８６】

【０３８７】

【０３８８】

【０３８９】

【０３９０】

【０３９１】

【０３９２】

【０３９３】

【０３９４】

【０３９５】

【０３９６】

【０３９７】

【０３９８】

【０３９９】

【０４００】

【０４０１】

【０４０２】

【０４０３】

【０４０４】

【０４０５】

【０４０６】

【０４０７】

【０４０８】

【０４０９】

【０４１０】

【０４１１】

【０４１２】

【０４１３】

【０４１４】

【０４１５】

【０４１６】

【０４１７】

【０４１８】

【０４１９】

【０４２０】

【０４２１】

【０４２２】

【０４２３】

【０４２４】

【０４２５】

【０４２６】

【０４２７】

【０４２８】

【０４２９】

【０４３０】

【０４３１】

【０４３２】

【０４３３】

【０４３４】

【０４３５】

【０４３６】

【０４３７】

【０４３８】

【０４３９】

【０４４０】

【０４４１】

【０４４２】

【０４４３】

【０４４４】

【図面の簡単な説明】

【図１】本発明の方法が有効に使用できるデータ処理シ
ステムを示す機能ブロック図である。

【図２】図１に示されるシステムに格納される情報を含
むファイルの階層的なファイル・システム構成を示す概
略図である。

【図３】図１に機能的に示されるディスク・ファイル記
憶装置を示す概略図である。

【図４】ディスク・ファイルの実アドレス指定アーキテ
クチャにおいて使用される種々の物理的記憶構成要素の
物理的関係を示す図である。

【図５】物理ボリュームの全体的レイアウトを示す図で
ある。

【図６】論理ボリューム・マネージャ領域の全体的レイ
アウトを示す図である。

【図７】ボリューム・グループ状況領域構造の詳細を示
す図である。

【図８】ボリューム・グループ・データ領域構造の詳細
を示す図である。

【図９】論理ボリュームのレイアウトを示す図である。

【図１０】論理ボリューム・マネージャ疑似デバイス・
ドライバとのシステムの関係を示す図である。

【図１１】論理ボリューム、論理パーティションおよび
物理パーティション間相互の関係を示す図である。

【図１２】物理パーティション、物理ボリュームおよび
ボリューム・グループ間相互の関係を示す図である。

【図１３】ボリューム・グループ状況領域のホイール概
念を示す図である。

【図１４】ＰＢＵＦデータ構造を示す図である。

【図１５】論理ボリューム・デバイス・ドライバ・スケ
ジューラの初期要求ポリシーを示す図である。

【図１６】論理ボリューム・デバイス・ドライバ・スケ
ジューラの事後要求ポリシーを示す図である。

【図１７】論理ボリューム・デバイス・ドライバのボリ
ューム・グループ状況領域の処理を示す図である。

【符号の説明】

１０陰極線管（ＣＲＴ）１１ブロック（２２アプリケーション・プログラ
ム、２３アプリケーション開発プログラム、２４オ
ペレーティング・システム・カーネル）１２マイクロプロセッサ１３メモリー・マネージャ・ユニット１４主システム・メモリー（ＲＡＭ）１５バス１６Ｉ／Ｏチャンネル・コントローラ１７ディスク記憶装置１８表示ターミナル１９コプロセッサ２０他のＩ／Ｏ２１Ｉ／Ｏバス３０磁気ディスク３１軸３２モータ３３、３４ディスク面３５位置決め機構３６トランスジューサ３７アクチュエータ３８移動キャリッジ３９アドレス４０バイト位置４１セクター（ブロック）４２ディスク・トラック６４論理ボリューム・マネージャ疑似デバイス・ドラ
イバ６５戦略層６６スケジューラ層６７物理層６８ファイル・システムＩ／Ｏ要求６９ディスク・デバイス・ドライバ７０論理ボリューム７１論理パーティション７２、７４、７６物理ボリューム

Claims

【特許請求の範囲】

【請求項１】第１の物理ボリュームおよび後続の複数
の物理ボリュームを有し、１つ以上の論理ボリュームに
仕切られる複数の記憶装置を管理する方法であって、該
論理ボリュームの各々が更に、各々が前記記憶装置の１
つ以上の物理パーティションを含む１つ以上の論理パー
ティションに仕切られる方法において、コンピュータ・メモリーに前記物理パーティションの各
々に対する状況情報を保持し、前記状況情報を前記記憶装置の各々に存在する状況領域
に記録し、前記物理パーティションのいずれかに対して書込み要求
が生成される時、更新された状況情報を生成し、前記第１の物理ボリュームにおける前記状況領域を、前
記更新された状況情報で更新し、前記記憶装置内の各後続物理ボリュームの前記状況領域
を、前記更新された状況情報で順次更新することを含
み、以前の書込み要求の結果として前記記憶装置の状況
領域の各々の更新を完了する前に、第２の即ち次の書込
み要求が受取られるならば、前記状況情報が前記コンピ
ュータ・メモリーにおいて即時更新されて、前記次に続
く物理ボリュームの状況領域の更新において使用される
ことを特徴とする方法。
【請求項２】与えられた論理パーティションと対応す
る前記物理パーティションの各々が、複写のデータ情報
を含むことを特徴とする請求項１記載の方法。
【請求項３】第１の物理ボリュームおよび後続の複数
の物理ボリュームとを有し、１つ以上の論理ボリューム
に仕切られる複数の記憶装置を管理する装置であって、
該論理ボリュームの各々が更に、各々が前記記憶装置の
１つ以上の物理パーティションを含む１つ以上の論理パ
ーティションに仕切られる装置において、コンピュータ・メモリーに前記物理パーティションの各
々に対する状況情報を保持する保持手段と、前記状況情報を前記記憶装置の各々に存在する状況領域
に記録する記録手段と、前記物理パーティションのいずれかに対して書込み要求
が生成される時、更新された状況情報を生成する生成手
段と、前記第１の物理ボリュームにおける前記状況領域を、前
記更新された状況情報で更新する第１の更新手段と、前記記憶装置内の各後続物理ボリュームの前記状況領域
を、前記更新された状況情報で順次更新する後続更新手
段とを設け、以前の書込み要求の結果として前記記憶装
置の状況領域の各々の更新を完了する前に、第２の即ち
次の書込み要求が受取られるならば、前記状況情報が前
記コンピュータ・メモリーにおいて即時更新されて、前
記次に続く物理ボリュームの状況領域の更新において使
用されることを特徴とする装置。
【請求項４】第１の物理ボリュームおよび後続する複
数の物理ボリュームとを有し、１つ以上の論理ボリュー
ムに仕切られる複数の記憶装置を管理するシステムであ
って、該論理ボリュームの各々が更に、各々が前記記憶
装置の１つ以上の物理パーティションを含む１つ以上の
論理パーティションに仕切られるシステムにおいて、プロセッサと、メモリー管理ユニットと、ランダム・アクセス・メモリーと、Ｉ／Ｏチャンネル・コントローラと、表示ターミナルと、ディスク・ドライブと、コンピュータ・メモリーに前記物理パーティションの各
々に対する状況情報を保持する保持手段と、前記状況情報を前記記憶装置の各々に存在する状況領域
に記録する記録手段と、前記物理パーティションのいず
れかに対して書込み要求が生成される時、更新された状
況情報を生成する生成手段と、前記第１の物理ボリュームにおける前記状況領域を、前
記更新された状況情報で更新する第１の更新手段と、前記記憶装置内の各後続物理ボリュームの前記状況領域
を、前記更新された状況情報で順次更新する後続更新手
段とを設け、以前の書込み要求の結果として前記記憶装
置の状況領域の各々の更新を完了する前に、第２の即ち
次の書込み要求が受取られるならば、前記状況情報が前
記コンピュータ・メモリーにおいて即時更新されて、前
記次に続く物理ボリュームの状況領域の更新において使
用されることを特徴とするシステム。
【請求項５】第１の物理ボリュームおよび後続の複数
の物理ボリュームを有する複数の記憶装置に状況情報を
保持する方法であって、前記記憶装置の各々が状況領域
に記録された前記状況情報の同一のコピーを有する方法
において、前記記憶装置のいずれかにおける状況変化に応答して、
前記第１の物理ボリュームにおける前記状況情報を修正
し、前記記憶装置内の前記各後続物理ボリュームにおける前
記状況領域における前記状況情報を前記状況の変化を反
映するように順次に修正することを含み、以前の状況の
変化の結果として前記記憶装置の状況領域の各々の更新
を完了する前に、次の状況変化が受取られるならば、前
記以前の状況変化の結果生じる状況情報を記録する間前
記次の状況変化が記録されることを特徴とする方法。