JP2003131900A - サーバシステム運用管理方式 - Google Patents
サーバシステム運用管理方式Info
- Publication number
- JP2003131900A JP2003131900A JP2001325904A JP2001325904A JP2003131900A JP 2003131900 A JP2003131900 A JP 2003131900A JP 2001325904 A JP2001325904 A JP 2001325904A JP 2001325904 A JP2001325904 A JP 2001325904A JP 2003131900 A JP2003131900 A JP 2003131900A
- Authority
- JP
- Japan
- Prior art keywords
- logical system
- production
- logical
- standby
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/203—Failover techniques using migration
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2043—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share a common memory address space
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2051—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant in regular structures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2041—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2046—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Abstract
セス不可及びレスポンス不良時間をより短縮し、可用性
の高いサーバシステムを構築する。 【解決手段】 主記憶共有型マルチプロセッサにおい
て、構成管理処理部101が本番系論理システム102
と待機系論理システム103を定義し、また両論理シス
テムからアクセス可能な情報保持空間106を用意し、
本番系論理システム102が、自身が管理する主記憶領
域104上のメモリ領域を指すアドレス情報を当該情報
保持空間106に登録し、フェールオーバまたはクロー
ニングが必要になったとき待機系論理システム103
が、当該アドレス情報を参照し、さらに当該アドレス情
報から本番系論理システム102が管理する主記憶領域
104上の情報を参照して、本番系論理システム102
と同じ処理環境および状態を形成し、その後本番系論理
システム102の処理全部または一部を引き継ぐ。
Description
クラスの計算機システムの運用管理方法に係わり、特
に、同システムの信頼性、可用性を高めるための障害時
フェールオーバや高負荷時クローニングといった処理を
高速に実施するためのサーバシステム運用管理方法に関
する。
を支えるインフラとしてのサーバシステムにおいては、
システムダウンに伴うアクセス不可時間や、急激なアク
セス量の増加に伴うレスポンス不良時間がビジネスチャ
ンスの喪失に直結するため、それらの時間を出来る限り
短縮する手段として、フェールオーバ、クローニングな
どの可用性向上機能が既に提案されている。ここで、フ
ェールオーバとは、本番系システムにおける処理におい
て障害が発生したとき、本番系システムから待機系シス
テムに切り替え、待機系システムに処理を引き継ぐこと
であり、クローニングとは、本番系システムにおける処
理において高負荷状態等が発生し、本番系システムにお
ける処理が滞る時、待機系システムに処理の一部を引き
継ぐことである。その具体的な事例は、Sun Mic
rosystems、 Inc.が発行するwhite
paperの“Sun(TM) Enterpris
e(TM)Cluster Failover”で紹介
されている。
ム構成を示す。本図において、202は通常本システム
での処理を受け持つ本番系サーバシステムであり、20
3は本番系サーバシステム202に異常が発生した場合
にその処理を引き継ぐ待機系サーバシステムである。2
04は、本番系サーバシステム202および待機系サー
バシステム203で共有して使用される共有ディスク、
205は、LANあるいはインターネットなどのネット
ワークである。また、201は、同ネットワーク205
を介してサーバシステムにアクセスし処理の要求を行う
クライアント端末である。本図に示したように、従来、
上記フェールオーバ、クローニングなどの可用性向上機
能は、クラスタ構成のシステムにおける本番系202と
待機系203間での共有ディスク204による情報共有
を前提として実現されている。
けるフェールオーバ処理の様子を図3を用いて説明す
る。図3では、同処理に係わる構成要素としてのクライ
アント端末201、本番系サーバシステム202、待機
系サーバシステム203、共有ディスク204の相互関
係を上から下への時間の流れに沿って示している。ま
ず、処理要求および正常レスポンス301で示すとお
り、正常時にはクライアント端末201からの処理要求
に応じて本番系サーバシステム202が相当する処理を
行い、その結果などをレスポンスとしてクライアント端
末201に返している。本処理は、クライアント端末2
01からの処理要求発生に応じてオンデマンドで繰り返
される。本番系処理状態保存処理302も正常時におけ
る動作である。ハードウェアやOS/ソフトウェアの障
害などによって本番系サーバシステム202がいかなる
問合せに対しても応答不能となり、その主記憶上に存在
する状態情報が参照不能となるケースに備えて、本番系
サーバシステム202は、共有ディスク204に対して
所定のタイミング毎に必要な自身の状態情報を書きこ
む。なお、本処理動作に関しては、状態変化のイベント
発生毎に常に行うという形も考えられるが、ディスクア
クセス処理のオーバヘッドは一般に大きく、本番系サー
バシステム202の処理性能上問題があるため、そのよ
うな解は現実的ではない。次に、本番系動作状態チェッ
クの問い合わせ(以下、本番系動作状態チェックとい
う)および正常応答303の動作は、待機系サーバシス
テム203による本番系サーバシステム202の動作監
視処理動作であり、これも正常時の動作である。このよ
うに待機系サーバシステム203から所定のタイミング
毎に動作状態をチェックするための通信を本番系サーバ
システム202に対して行い、それに対して本番系サー
バシステム202が異常無く応答することで本番系サー
バシステム202が正常に動作しているのを確認でき
る。
おいて障害が発生したポイントを示している。動作30
5は、障害発生後初めての待機系サーバシステム203
による本番系サーバシステム202の動作状態チェック
により、該障害発生を待機系サーバシステム203が検
出したことを示す。ここで、異常応答とは、全く応答し
ない、あるいは、異常に応答が遅れるなどのケースを指
す。一方、動作306は、障害発生後、待機系サーバシ
ステム203によってフェールオーバ処理が行われ、本
番系サーバシステム202の処理が待機系サーバシステ
ム203によって引き継がれるまでの間に発生したクラ
イアント端末201からの処理要求に対する動作を示
す。ここで異常レスポンスとは、所定の時間内にレスポ
ンスが返らないようなケースを指す。動作305によっ
て本番系サーバシステム202における障害発生を検出
した待機系サーバシステム203は、動作307に示す
とおりフェールオーバ処理を開始し、その処理の過程で
本番系サーバシステム202の処理状態を復元すべく、
本番系サーバシステム202が動作302で共有ディス
ク204に保存した状態情報を動作308によって共有
ディスク204から読み出す。待機系サーバシステム2
03は、その状態情報を用いて、本番系サーバシステム
202の処理状態を可能な範囲で復元し、本番系サーバ
システム202からの処理の引継ぎに対する準備を行っ
た後、動作309にてフェールオーバ処理を完了させ
る。以降、待機系サーバシステム203は本番系サーバ
システムとして処理を開始し、動作310に示すような
形で、動作306の結果としてのクライアント端末20
1からの再処理要求や別の処理要求等に応答していく。
下の問題点が存在し、より高い可用性を求めるユーザの
要請に応えられない。 (1)待機系サーバシステム203による本番系サーバ
システム202の処理状態復元が共有ディスク204の
アクセスを伴うため、処理に時間がかかる。 (2)障害発生時点で本番系サーバシステム202の主
記憶上に存在する最新情報が共有ディスク204に反映
されず、またその読み出しも不可能であるため、状態回
復に限度がある。 本発明の目的は、上記の問題を解決し、システムの異常
状態の発生により生じるアクセス不可及びレスポンス不
良時間をより短縮して可用性の高いサーバシステムを構
築することにある。
複数個のプロセッサ、主記憶装置、外部記憶装置、およ
びそれらを相互に接続する接続手段を有する単一の主記
憶共有型マルチプロセッサシステムにおいて、任意数の
プロセッサおよび主記憶装置の一部からなる論理的なシ
ステム単位を複数個定義し、さらに、そのうち2つ以上
の論理的なシステム単位について、1つを本番系論理シ
ステム、その他を待機系論理システムと定義し、本番系
論理システムおよび待機系論理システムの双方からアク
セス可能な主記憶装置上のメモリセグメントを用意し、
該メモリセグメントに本番系論理システムから待機系論
理システムへの制御引継ぎ用の情報を格納する制御引継
ぎ用の情報保持空間を設け、本番系論理システムはその
制御の引継ぎに必要な情報を該情報が作成される度に該
制御引継ぎ用の情報保持空間に登録し、待機系論理シス
テムは、本番系論理システムから待機系論理システムへ
の制御引継ぎの要求を受けた時点で、制御引継ぎ用の情
報保持空間に格納された情報を参照し、本番系論理シス
テムと同じ処理環境および状態を形成し、その後該本番
系論理システムの処理全部または一部を引き継ぐように
している点である。また、別の特徴は、待機系論理シス
テムによる本番系論理システムからの制御引継ぎに関し
て、待機系論理システムは、本番系論理システムから待
機系論理システムへの制御引継ぎの要求を受けた時点
で、前記制御引継ぎ用の情報保持空間に格納された情報
を参照した後、さらに、該参照の結果得られた情報を元
に、本番系論理システムが管理する主記憶資源をアクセ
スして該主記憶資源を待機系論理システムが管理する主
記憶装置に格納することにより本番系論理システムと同
じ処理環境および状態を形成し、その後本番系論理シス
テムの処理全部または一部を引き継ぐようにしている点
である。また、本番系論理システムは、本番系論理シス
テムが管理する主記憶領域上に存在して、本番系論理シ
ステムから待機系論理システムへの処理引継ぎ時に待機
系論理システムが管理する主記憶領域に複製する必要の
ある本番系論理システムの環境および処理状態情報が含
まれる複数個のメモリ領域について、該メモリ領域の確
保あるいは該メモリ領域の所在変更の際に、前記制御引
継ぎ用の情報保持空間に対して、その主記憶アドレスを
登録あるいは更新し、待機系論理システムは、該本番系
論理システムからの処理引継ぎ時に、該制御引継ぎ用の
情報保持空間から該複数個のメモリ領域に対する主記憶
アドレスを順次参照し、該主記憶アドレスを元に、本番
系論理システムが管理する主記憶領域上の情報を得るよ
うにしている。また、主記憶共有型マルチプロセッサシ
ステムにおいてその論理的な構成を管理する構成管理処
理部を定義し、該構成管理処理部は、前記論理的なシス
テム単位を複数個定義し、さらに、そのうち2つ以上の
論理的なシステム単位について、1つを本番系論理シス
テム、その他を待機系論理システムと定義し、本番系論
理システムおよび待機系論理システムの双方からアクセ
ス可能な主記憶上のメモリセグメントを用意し、該メモ
リセグメントに前記制御引継ぎ用の情報保持空間を設
け、これを維持・管理し、また、本番系論理システムの
運用状態を監視し、該監視の結果本番系論理システムに
異常を検出した場合に、その異常の状態に応じて前記制
御引継ぎの要求を該待機系論理システムに発し、待機系
論理システムに対して、本番系論理システムの処理全部
または一部を引き継ぐように指示するようにしている。
また、前記定義された構成管理処理部を、前記主記憶共
有型マルチプロセッサシステムを構成する複数個のプロ
セッサの内の1つとし、あるいは、前記主記憶共有型マ
ルチプロセッサシステムに対して用意される外部管理端
末とするようにしている。また、本番系論理システムが
管理する主記憶領域に対して、他の論理的なシステム単
位からのアクセスに対するプロテクト制御が施されてい
る場合、構成管理処理部が待機系論理システムからの本
番系論理システムが管理する主記憶領域へのアクセス要
求を受け、該アクセスを処理し、該アクセスによって得
た情報を待機系論理システムに引き渡すようにしてい
る。また、本番系論理システムの運用状態を監視し、該
監視の結果本番系論理システムに異常を検出した場合、
その異常の状態が障害発生である場合には本番系論理シ
ステムの処理全部の引き継ぎを、その異常の状態が高負
荷状態の発生である場合には本番系論理システムの処理
の一部の引き継ぎを待機系論理システムが実施するよう
にしている。また、待機系論理システムによる本番系論
理システムの処理引継ぎに際して、待機系論理システム
で実行されることになるプログラムコードに関して、待
機系論理システムは、本番系論理システムが管理する主
記憶領域から待機系論理システムが管理する主記憶領域
へ該プログラムコードを複写するようにし、あるいは、
本番系論理システムが管理する主記憶領域に既に存在し
ているものを直接使用するようにしている。
がら説明する。図4ならびに図5は、本発明に係わるサ
ーバシステム運用管理方式を実装するプラットフォーム
として想定している主記憶共有型のマルチプロセッサシ
ステムの構成を示す。図4ならびに図5に示す構成は既
に公知である。図4のシステム構成は、一般にSymm
etric Multi−Processor(SM
P)と呼ばれる。本システムは、主に複数のCPU40
1、相互接続ネットワーク402、共有主記憶403、
ストレージ(外部記憶装置)404で構成される。複数
のCPU401、共有主記憶403、ストレージ404
は、相互接続ネットワーク402で互いに結合される。
共有主記憶403については、図では論理的に1個の構
成要素として示しているが、物理的には複数のセグメン
トから構成され、それぞれのセグメントが相互接続ネッ
トワーク402に結合する形態が一般的である。また、
相互接続ネットワーク402については、バスやクロス
バスイッチなど種々の構成方法が存在する。このような
構成によって、本システムでは、総てのCPU401か
ら共有主記憶403およびストレージ404といった資
源を均質にアクセスできる。
niform Memory Access(NUM
A)方式と呼ばれる。本システムは、複数のCPU40
1、第一レベル相互接続ネットワーク502、ローカル
主記憶503、ローカルストレージ504などからなる
基本構成ブロック505を複数個、第二レベル相互接続
ネットワーク506で結合した形態を取る。基本構成ブ
ロック505は、図4で示したSMP型のシステムと等
価である。第二レベル相互接続ネットワーク506は、
各基本構成ブロック505の第一レベル相互接続ネット
ワーク同士を結合する。このような構成によって、シス
テム中のローカル主記憶503およびローカルストレー
ジ504は、基本構成ブロック505の枠を越えてシス
テム中のどのCPU401からもアクセスが可能にな
る。例えば、図中右側の基本構成ブロック505中のC
PU401から左側の基本構成ブロック505中のロー
カル主記憶503あるいはローカルストレージ504を
アクセスする際には、当該CPU401から当該CPU
401が属する基本構成ブロック505内の第一レベル
相互ネットワーク502、第二レベル相互接続ネットワ
ーク506、さらに、アクセス先のローカル主記憶50
3あるいはローカルストレージ504が属する基本構成
ブロック505内の第一レベル相互ネットワーク502
を介して当該ローカル主記憶503あるいはローカルス
トレージ504をアクセスする。このシステム構成にお
いて、複数の第一レベル相互接続ネットワーク502と
第二レベル相互接続ネットワーク506からなる階層的
な相互接続ネットワークを論理的に1個のネットワーク
として見れば、図4と図5の論理的な構成は等しくな
る。その意味で、図4と図5の物理的な構成の違いは、
本発明に係わるサーバシステム運用管理方式を実装する
にあたって特に影響を及ぼさない。本発明に係わるサー
バシステム運用管理方式を実装するにあたって、プラッ
トフォームが満たすべき必要最低限の要件は、「主記憶
共有型」のマルチプロセッサである点である。
型マルチプロセッサの運用形態のひとつとして、同シス
テム内の任意の複数CPU401および共有主記憶40
3(あるいはローカル主記憶503群)の一部を組み合
わせて論理パーティションという論理的な運用管理単位
を定義し、これを仮想的に独立した1個の論理システム
として運用する手法が既に存在する。この手法によっ
て、本来物理的に複数のサーバシステムで構成されるト
ータルシステムを物理的に1個のシステムに統合でき、
これによってトータルシステムの運用管理コストの削減
が図れる。本発明に係わるサーバシステム運用管理方式
は、本運用手法による複数の論理システムの存在を前提
とする。
バシステム運用管理方式の詳細を説明する。システム基
本構成は図4に準じており、上述の複数個の論理システ
ムとして、論理システムA102および論理システムB
103の2つを示している。論理システムA102およ
び論理システムB103は、それぞれ複数のCPU40
1と共有主記憶403の一部を有している。その論理シ
ステムA102が管理する共有主記憶403の一部を主
記憶領域A104、論理システムB103が管理する共
有主記憶403の一部を主記憶領域B105とする。さ
らに、本システムにおいては、CPU401の1つであ
る構成管理CPU101と共有主記憶403上の一領域
である制御引継ぎ用情報保持空間106が存在する。
定義および管理、システムの信頼性・可用性向上機能と
してのフェールオーバ、クローニングを実現するための
論理システム間での本番系−待機系関係の定義、本番系
論理システムの動作監視と、異常検出時の待機系論理シ
ステムへの処理引継ぎ指令、制御引継ぎ用情報保持空間
106の作成・管理などを受け持つ構成要素である。一
方、制御引継ぎ用情報保持空間106は、上記フェール
オーバ、クローニングといった処理の引継ぎを共有主記
憶403を活用して処理するために必要な情報を保持す
るためのメモリ領域である。
論理システムA102が本番系論理システムとして定義
されている場合の制御引継ぎ用情報保持空間106およ
び主記憶領域A104の様子を示している。制御引継ぎ
用情報保持空間106中には、制御引継ぎ関係定義表7
07や、本番系論理システム毎に用意されるポインタ表
708、709といった各種管理テーブルが存在する。
制御引継ぎ関係定義表707を構成するエントリ710
は、図8に示すとおり、本番系論理システム識別子フィ
ールド801、待機系論理システム識別子フィールド8
02、本番系論理システム用ポインタ表へのポインタフ
ィールド803からなる。各エントリ710は、構成管
理CPU101がフェールオーバ、クローニングを実現
するための論理システム間での本番系−待機系関係の定
義を行う毎に構成管理CPU101によって消費され、
その本番系論理システムの識別子と待機系論理システム
の識別子がそれぞれフィールド801、802に登録さ
れる。さらに、構成管理CPU101は、本番系論理シ
ステム用にポインタ表(708あるいは709など)の
領域を確保し、当該ポインタ表の先頭アドレスを上述の
本番系論理システムの識別子と待機系論理システムの識
別子を登録したエントリ710のフィールド803に登
録する。論理システムA用ポインタ表708を構成する
エントリ711は、図9に示すとおり、プロセス識別子
フィールド901、プロセス内識別子フィールド90
2、アドレスポインタフィールド903からなる。各エ
ントリ711は、本番系論理システムがそのオペレーテ
ィングシステム(OS)を含めて信頼性・可用性保証が
必要なプロセスを立ち上げる毎に、基本的に当該プロセ
スの比較的初期の段階で当該プロセスによって消費され
る。その際、プロセス識別子フィールド901には当該
プロセスの識別子(例えばプロセスID)が登録され、
プロセス内識別子フィールド902には当該プロセスが
自身のアドレス空間に定義する複数のデータ領域を区別
するための識別子が登録され、さらに、アドレスポイン
タフィールド903に当該データ領域の先頭アドレスが
登録される。
は、本発明に係わるサーバシステムにおいて、本番系論
理システムとして少なくとも論理システムA102およ
び論理システムCが登録されている。さらに、論理シス
テムA102においては既にOSが起動され、信頼性・
可用性保証が必要なアプリケーションとして少なくとも
アプリケーションAおよびアプリケーションBが実行中
である。これに伴って、論理システムA102が管理す
る主記憶領域A104中にはOSが使用するOS管理情
報領域701、OS処理ワーク領域702、アプリケー
ションAが使用する管理情報領域703、ワーク領域7
04、アプリケーションBが使用する管理情報領域70
5、ワーク領域706が存在している。この状態で、本
番系論理システムとして論理システムA102および論
理システムCが登録されているのに対応してそれぞれ論
理システムA用ポインタ表708および、論理システム
C用ポインタ表709が制御引継ぎ用情報保持空間10
6に確保され、その所在場所が制御引継ぎ関係定義表7
07の本番系論理システムとして自身の識別子が本番系
論理システム識別子フィールド801に登録されている
それぞれのエントリ710の本番系論理システム用ポイ
ンタ表へのポインタフィールド803に登録されてい
る。図中エントリ710から出ている矢印線は当該ポイ
ンタフィールド803の値が何処を指し示しているかを
明示している。また、OSが使用するOS管理情報領域
701、OS処理ワーク領域702、アプリケーション
Aが使用する管理情報領域703、ワーク領域704、
アプリケーションBが使用する管理情報領域705、ワ
ーク領域706が主記憶領域A104に存在しているの
に対応して、その所在場所が論理システムA用ポインタ
表708のそれぞれのデータ領域に対応するエントリ7
11のアドレスポインタフィールド903に登録されて
いる。図中エントリ711から出ている矢印線は当該ア
ドレスポインタフィールド903の値が何処を指し示し
ているかを明示している。なお、図7で示した主記憶領
域A104上のデータ領域の定義はあくまで一例であ
る。より具体的なイメージとしては、OSのプロセス管
理テーブルや、トランザクション処理応用の処理トラン
ザクション管理テーブル、各トランザクションの状態ヒ
ープもしくはプール、データベース応用におけるオンメ
モリデータベースキャッシュなどのようなものが考えら
れる。
てフェールオーバ、クローニングといった可用性向上機
能がどのように実現されるかを図6の処理フロー図を用
いて説明する。まず、サーバシステム立ち上げに際し
て、構成管理CPU101は、論理システムの定義など
と並行して、動作601に示すとおり、制御引継ぎ用情
報保持空間106を作成し、以後これを管理する。さら
に、定義した論理システムのうち可用性向上機能を実現
するための本番系論理システム、待機系論理システム、
および、その本番系−待機系の関係を定義する。先述し
たとおり、構成管理CPU101はまた、制御引継ぎ用
情報保持空間106の管理動作の一環として、制御引継
ぎ関係定義表707を作成し、そのエントリ710に上
述の本番系−待機系の関係を登録する。また、本番系論
理システムのそれぞれに対応してポインタ表(708あ
るいは709など)の領域を確保し、当該ポインタ表の
先頭アドレスを上述の本番系−待機系の関係を登録した
エントリ710のフィールド803に登録する。これら
の初期動作が完了した後、構成管理CPU101は、こ
の例では論理システムA102に対して動作602によ
って本番系としての稼動を指示し、動作603によって
論理システムB103に対して待機系としての稼動を指
示する。この際、構成管理CPU101は、論理システ
ムA102に対して論理システムA用ポインタ表708
の先頭アドレスを伝える。論理システムB103に対し
ては、動作603の段階で論理システムA用ポインタ表
708の先頭アドレスを伝えても良いし、あるいは後述
する動作609の処理引継ぎ指示時に伝えても良い。
A102は、まずそのOSを起動した際に、動作604
によって、図7を用いて説明したOS管理情報領域70
1やOS処理ワーク領域702といったデータ領域の先
頭アドレスをポインタ情報として制御引継ぎ用情報保持
空間106内の論理システムA用ポインタ表708のエ
ントリ711のアドレスポインタフィールド903にそ
れぞれ登録する。その際、プロセス識別子やプロセス内
識別子といった情報も同時に、上記エントリ711の該
当するプロセス識別子フィールド901やプロセス内識
別子フィールド902にそれぞれ登録する。更に、以
降、信頼性・可用性保証が必要なアプリケーションを起
動する毎に、OS起動時と同様に、動作604によっ
て、アプリケーションが使用する管理情報領域やワーク
領域といったデータ領域の先頭アドレスをポインタ情報
として制御引継ぎ用情報保持空間106内の論理システ
ムA用ポインタ表708のエントリ711のアドレスポ
インタフィールド903にそれぞれ登録する。その際、
プロセス識別子やプロセス内識別子といった情報も同時
に、上記エントリ711の該当するプロセス識別子フィ
ールド901やプロセス内識別子フィールド902にそ
れぞれ登録する。なお、この動作604はOSやアプリ
ケーション起動時だけでなく、新たにデータ領域を確保
した場合や、既にあるデータ領域を動かしたりした場合
などにも随時発生する。また、動作605に示すとお
り、これは特別な動作というわけではなく、ごく一般的
なプログラム処理の動作として、主記憶領域A104に
対する処理情報、状態の書込み処理は随時発生する。
て、構成管理CPU101は動作606に示すとおり、
所定のタイミング毎に論理システムA102の動作状態
をチェックする。論理システムA102は正常に動作し
ていれば構成管理CPU101の動作状態チェックに対
応して構成管理CPU101に正常応答を返す。一方、
異常発生ポイント607以降の時間帯に動作状態チェッ
クがなされた場合の動作は動作608以降のようにな
る。まず、動作608において、構成管理CPU101
からの動作状態チェックに対して、異常応答が構成管理
CPU101によって検出される。この異常応答とは、
実際に論理システムA102からの応答の場合と、構成
管理CPU101が論理システムA102からの応答に
よらずそのように判断する場合がある。前者は、論理シ
ステムA102が少なくとも動作状態チェックに対する
応答は可能であるが、障害あるいは極度の高負荷状態に
あって所定のレベルの可用性を保証できない場合であ
る。この場合、論理システムA102は、障害発生か、
あるいは極度の高負荷状態かを構成管理CPU101に
伝える。一方、後者は、障害によって論理システムA1
02が動作状態チェックに対して応答不能であるか、あ
るいは極度の高負荷状態で応答が非常に遅れる場合であ
る。この場合、構成管理CPU101は一定の時間応答
を待った後に異常発生を判断する。すなわち、所定時間
以内に応答がなく、さらに一定の時間応答を待ち、この
一定の時間以内に応答があったとき、障害あるいは極度
の高負荷状態にあって所定のレベルの可用性を保証でき
ない場合であると判断し、この一定の時間以内に応答が
なかったとき障害発生と判断する。
した後、制御引継ぎ用情報保持空間106内の制御引継
ぎ関係定義表707を参照して、異常が発生した本番系
論理システムA102に対応する待機系論理システムを
特定し、この場合、当該待機系論理システムである論理
システムB103に対して、障害発生時にはフェールオ
ーバによる処理の引継ぎを、極度の高負荷状態発生時に
はクローニングによる処理の引継ぎを、動作609によ
り指示する。先述したとおり、このタイミングで構成管
理CPU101から論理システムB103に対して制御
引継ぎ用情報保持空間106内の論理システムA用ポイ
ンタ表708の先頭アドレスを伝える場合がある。構成
管理CPU101からの処理引継ぎ指示を受けた論理シ
ステムB103は、フェールオーバの要求、またはクロ
ーニングの要求に応じて、それぞれ所定の処理引継ぎ動
作を行う。当該動作の概略ステップを動作610以降動
作613までで示した。
11により、構成管理CPU101から伝えられた制御
引継ぎ用情報保持空間106内の論理システムA用ポイ
ンタ表708の先頭アドレスを用いて、論理システムA
用ポインタ表708から各種ポインタ値を得る。当該ポ
インタ値は、本番系論理システムA102が管理してい
る主記憶領域A104の各種データ領域の先頭アドレス
を示しているため、動作612では、当該ポインタ値を
用いて処理引継ぎに必要な処理情報、状態を当該データ
領域から読出し、これを自身が管理する主記憶領域B1
05に複写する。この動作611、612の処理を繰り
返して主記憶領域B105上に論理システムA102が
管理する主記憶領域A上のイメージ(すなわち論理シス
テムA102の処理状態)を復元して、動作613で処
理引継ぎを完了し、以降、フェールオーバの場合には論
理システムA102の肩代わりとして動作し、クローニ
ングの場合には論理システムA102の負荷を一部分担
して処理する。なお、動作611、612によって復元
する論理システムA102の処理状態は、処理引継ぎ形
態がフェールオーバの場合には論理システムA102の
総ての処理状態であり、処理引継ぎ形態がクローニング
の場合には、処理引継ぎを行うアプリケーションに関す
る処理状態とOSの当該アプリケーションに係わる管理
情報およびワーク領域情報である。なお、論理システム
B103の処理引継ぎ動作に関して、論理システムB1
03で実行されることになるプログラムのコードについ
ても、上記の処理の枠組で主記憶領域A104から主記
憶領域B105に複写することもできる。さらには、複
写せずに直接主記憶領域A104を参照させるような処
理方法も実現可能である。以上が、本発明に係わるサー
バシステム運用管理方式によるフェールオーバ、クロー
ニングといった可用性向上機能の実現方法である。
いう観点での説明に終始したが、図1に示すとおり、本
サーバシステムの構成上の特性により、元々ストレージ
404に関しては論理システム間で共用されており、例
えば大規模なデータベースなどの当該ストレージ404
上の情報については複写などの処理を伴わずに引継ぎが
可能であるため、詳細な説明は省略する。また、先述し
た論理パーティションの実装および運用方法によって
は、異なる論理パーティションが管理する主記憶領域へ
のアクセスが禁じられるため、図6の動作612におけ
る論理システムB103による主記憶領域A104の参
照については、困難である場合がある。その場合は、構
成管理CPU101のみに上記のアクセス制約を受けな
い特権を与え、動作612の主記憶参照を論理システム
B103から構成管理CPU101に依頼し、構成管理
CPU101が当該主記憶アクセスを実施した後、その
結果を論理システムB103に引き渡すという方法が考
えられる。また、特開2000−235558に開示さ
れている方法によって、論理パーティション間で特別に
相互参照可能な共有主記憶領域を定義するという方法に
よっても論理システムB103による動作612が可能
になる。以上が本発明に係わる実施の形態である。
て、構成管理CPU101が果たす役割に関して以下の
バリエーションが存在する。まず、構成管理の実態は1
個の処理プロセスであり、構成管理処理部自体は、1個
の固定的なCPU401である必然性は無く、ある特別
な論理パーティションであっても良い。この場合、構成
管理プロセスは当該論理パーティション内の固定的でな
いいずれかのCPUで動作する。また、いわゆるシステ
ム制御用外部コンソール端末によっても構成管理を実現
できる。さらには、ここまでの説明で構成管理CPU1
01が行っていた処理の内、図6の動作606、60
8、609に関しては待機系論理プロセッサが行うとい
う方法も考えられる。
状態になった本番系システムの処理状態を共有主記憶を
介して高速に参照できるようになり、待機系システムに
よる本番系システムの処理状態復元を高速化することが
できる。また、これによって、アクセス不可及びレスポ
ンス不良時間をより短縮して可用性の高いサーバシステ
ムを構築できる。さらに、処理状態情報そのものではな
く、当該処理状態を保持する各種データ領域の先頭アド
レスをあらかじめ登録して、異常発生時には当該アドレ
ス情報を元に最新の処理状態情報を参照させる形で処理
引継ぎを実現することで、処理引継ぎ動作以外の部分で
のオーバヘッドを削減でき、これによりアクセス不可及
びレスポンス不良時間をより短縮した可用性の高いサー
バシステムを構築できる。
・サーバシステムの構成を示す図である。
タ型システムの構成を示す図である。
生時フェールオーバ処理の流れを示す図である。
憶共有型マルチプロセッサシステムの構成例を示す図で
ある。
憶共有型マルチプロセッサシステムの構成例を示す図で
ある。
た際の待機系システムによる処理引継ぎ処理の流れを示
す図である。
情報および当該情報と本番系論理システムAが管理する
主記憶領域A内の各データ領域との関係を示す図であ
る。
制御引継ぎ関係定義表のエントリ構成を示す図である。
論理システム用ポインタ表のエントリ構成を示す図であ
る。
フィールド 901 プロセス識別子フィールド 902 プロセス内識別子フィールド 903 アドレスポインタフィールド
Claims (10)
- 【請求項1】 複数個のプロセッサ、主記憶装置、外部
記憶装置、およびそれらを相互に接続する接続手段を有
する単一の主記憶共有型マルチプロセッサシステムにお
いて、 任意数のプロセッサおよび主記憶装置の一部からなる論
理的なシステム単位を複数個定義し、さらに、そのうち
2つ以上の論理的なシステム単位について、1つを本番
系論理システム、その他を待機系論理システムと定義
し、該本番系論理システムおよび該待機系論理システム
の双方からアクセス可能な主記憶装置上のメモリセグメ
ントを用意し、該メモリセグメントに該本番系論理シス
テムから該待機系論理システムへの制御引継ぎ用の情報
を格納する制御引継ぎ用の情報保持空間を設け、 該本番系論理システムはその制御の引継ぎに必要な情報
を該情報が作成される度に該制御引継ぎ用の情報保持空
間に登録し、 該待機系論理システムは、該本番系論理システムから該
待機系論理システムへの制御引継ぎの要求を受けた時点
で、該制御引継ぎ用の情報保持空間に格納された情報を
参照し、該本番系論理システムと同じ処理環境および状
態を形成し、その後該本番系論理システムの処理全部ま
たは一部を引き継ぐことを特徴とするサーバシステム運
用管理方法。 - 【請求項2】 請求項1記載のサーバシステム運用管理
方法において、前記待機系論理システムによる前記本番
系論理システムからの制御引継ぎに関して、該待機系論
理システムは、該本番系論理システムから該待機系論理
システムへの制御引継ぎの要求を受けた時点で、前記制
御引継ぎ用の情報保持空間に格納された情報を参照した
後、さらに、該参照の結果得られた情報を元に、該本番
系論理システムが管理する主記憶資源をアクセスして該
主記憶資源を該待機系論理システムが管理する主記憶装
置に格納することにより該本番系論理システムと同じ処
理環境および状態を形成し、その後該本番系論理システ
ムの処理全部または一部を引き継ぐことを特徴とする請
求項1のサーバシステム運用管理方法。 - 【請求項3】 請求項1または請求項2記載のサーバシ
ステム運用管理方法において、 前記本番系論理システムは、該本番系論理システムが管
理する主記憶領域上に存在して、該本番系論理システム
から前記待機系論理システムへの処理引継ぎ時に該待機
系論理システムが管理する主記憶領域に複製する必要の
ある該本番系論理システムの環境および処理状態情報が
含まれる複数個のメモリ領域について、該メモリ領域の
確保あるいは該メモリ領域の所在変更の際に、前記制御
引継ぎ用の情報保持空間に対して、その主記憶アドレス
を登録あるいは更新し、 該待機系論理システムは、該本番系論理システムからの
処理引継ぎ時に、該制御引継ぎ用の情報保持空間から該
複数個のメモリ領域に対する主記憶アドレスを順次参照
し、該主記憶アドレスを元に、該本番系論理システムが
管理する主記憶領域上の情報を得ることを特徴とするサ
ーバシステム運用管理方法。 - 【請求項4】 請求項1乃至請求項3のいずれかの請求
項記載のサーバシステム運用管理方法において、 前記主記憶共有型マルチプロセッサシステムにおいてそ
の論理的な構成を管理する構成管理処理部を定義し、該
構成管理処理部は、前記論理的なシステム単位を複数個
定義し、さらに、そのうち2つ以上の論理的なシステム
単位について、1つを本番系論理システム、その他を待
機系論理システムと定義し、該本番系論理システムおよ
び待機系論理システムの双方からアクセス可能な主記憶
上のメモリセグメントを用意し、該メモリセグメントに
前記制御引継ぎ用の情報保持空間を設け、これを維持・
管理し、また、該本番系論理システムの運用状態を監視
し、該監視の結果該本番系論理システムに異常を検出し
た場合に、その異常の状態に応じて前記制御引継ぎの要
求を該待機系論理システムに発し、該待機系論理システ
ムに対して、該本番系論理システムの処理全部または一
部を引き継ぐように指示することを特徴とするサーバシ
ステム運用管理方法。 - 【請求項5】 請求項4記載のサーバシステム運用管理
方法において、 前記定義された構成管理処理部は、前記主記憶共有型マ
ルチプロセッサシステムを構成する複数個のプロセッサ
の内の1つであることを特徴とするサーバシステム運用
管理方法。 - 【請求項6】 請求項4記載のサーバシステム運用管理
方法において、 前記定義された構成管理処理部は、前記主記憶共有型マ
ルチプロセッサシステムに対して用意される外部管理端
末であることを特徴とするサーバシステム運用管理方
法。 - 【請求項7】 請求項4乃至請求項6のいずれかの請求
項記載のサーバシステム運用管理方法において、 前記本番系論理システムが管理する主記憶領域に対し
て、他の論理的なシステム単位からのアクセスに対する
プロテクト制御が施されている場合、前記構成管理処理
部が前記待機系論理システムからの該本番系論理システ
ムが管理する主記憶領域へのアクセス要求を受け、該ア
クセスを処理し、該アクセスによって得た情報を該待機
系論理システムに引き渡すことを特徴とするサーバシス
テム運用管理方法。 - 【請求項8】 請求項4乃至請求項7のいずれかの請求
項記載のサーバシステム運用管理方法において、 前記本番系論理システムの運用状態を監視し、該監視の
結果該本番系論理システムに異常を検出した場合、その
異常の状態が障害発生である場合には該本番系論理シス
テムの処理全部の引き継ぎを、その異常の状態が高負荷
状態の発生である場合には該本番系論理システムの処理
の一部の引き継ぎを前記待機系論理システムが実施する
ことを特徴とするサーバシステム運用管理方法。 - 【請求項9】 請求項1乃至請求項8のいずれかの請求
項記載のサーバシステム運用管理方法において、 前記待機系論理システムによる前記本番系論理システム
の処理引継ぎに際して、該待機系論理システムで実行さ
れることになるプログラムコードに関して、該待機系論
理システムは該本番系論理システムが管理する主記憶領
域から該待機系論理システムが管理する主記憶領域へ該
プログラムコードを複写することを特徴とするサーバシ
ステム運用管理方法。 - 【請求項10】 請求項1乃至請求項8のいずれかの請
求項記載のサーバシステム運用管理方法において、 前記待機系論理システムによる前記本番系論理システム
の処理引継ぎに際して、該待機系論理システムで実行さ
れることになるプログラムコードに関して、該待機系論
理システムは該本番系論理システムが管理する主記憶領
域に既に存在しているものを直接使用することを特徴と
するサーバシステム運用管理方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001325904A JP2003131900A (ja) | 2001-10-24 | 2001-10-24 | サーバシステム運用管理方式 |
| US10/229,053 US6832298B2 (en) | 2001-10-24 | 2002-08-28 | Server system operation control method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001325904A JP2003131900A (ja) | 2001-10-24 | 2001-10-24 | サーバシステム運用管理方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2003131900A true JP2003131900A (ja) | 2003-05-09 |
Family
ID=19142376
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001325904A Abandoned JP2003131900A (ja) | 2001-10-24 | 2001-10-24 | サーバシステム運用管理方式 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US6832298B2 (ja) |
| JP (1) | JP2003131900A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007156679A (ja) * | 2005-12-02 | 2007-06-21 | Hitachi Ltd | サーバの障害回復方法及びデータベースシステム |
| JP2009116560A (ja) * | 2007-11-06 | 2009-05-28 | Nippon Information & Communication | コンピュータシステム及びその稼動方法 |
| JP2012099000A (ja) * | 2010-11-04 | 2012-05-24 | Toyota Motor Corp | 情報処理装置 |
| JP2015130134A (ja) * | 2014-01-09 | 2015-07-16 | 日本電気株式会社 | 情報処理装置、情報処理システム、メモリレプリケーション方法、並びにコンピュータ・プログラム |
| JP2015528962A (ja) * | 2012-08-03 | 2015-10-01 | フジツウ テクノロジー ソリューションズ インタレクチュアル プロパティ ゲーエムベーハー | 高可用性コンピュータシステム |
| JP2019507413A (ja) * | 2016-01-15 | 2019-03-14 | アファームド ネットワークス,インク. | 通信ネットワークにおけるデータベースに基づく冗長化 |
Families Citing this family (33)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7096383B2 (en) * | 2002-08-29 | 2006-08-22 | Cosine Communications, Inc. | System and method for virtual router failover in a network routing system |
| US7065673B2 (en) * | 2002-10-29 | 2006-06-20 | Brocade Communication Systems, Inc. | Staged startup after failover or reboot |
| US7076689B2 (en) * | 2002-10-29 | 2006-07-11 | Brocade Communication Systems, Inc. | Use of unique XID range among multiple control processors |
| US7203863B2 (en) * | 2003-05-09 | 2007-04-10 | Oracle International Corporation | Distributed transaction state management through application server clustering |
| US7552436B2 (en) * | 2003-11-25 | 2009-06-23 | International Business Machines | Memory mapped input/output virtualization |
| US7234037B2 (en) * | 2003-11-25 | 2007-06-19 | International Business Machines Corporation | Memory mapped Input/Output operations |
| US20050125557A1 (en) * | 2003-12-08 | 2005-06-09 | Dell Products L.P. | Transaction transfer during a failover of a cluster controller |
| JP2005293315A (ja) * | 2004-03-31 | 2005-10-20 | Nec Corp | データミラー型クラスタシステム及びデータミラー型クラスタシステムの同期制御方法 |
| US7437581B2 (en) * | 2004-09-28 | 2008-10-14 | Intel Corporation | Method and apparatus for varying energy per instruction according to the amount of available parallelism |
| US20060095690A1 (en) * | 2004-10-29 | 2006-05-04 | International Business Machines Corporation | System, method, and storage medium for shared key index space for memory regions |
| JP2006228121A (ja) * | 2005-02-21 | 2006-08-31 | Toshiba Corp | 演算処理装置 |
| JP4831599B2 (ja) * | 2005-06-28 | 2011-12-07 | ルネサスエレクトロニクス株式会社 | 処理装置 |
| US7937616B2 (en) * | 2005-06-28 | 2011-05-03 | International Business Machines Corporation | Cluster availability management |
| US7797522B2 (en) * | 2005-12-30 | 2010-09-14 | Sap Ag | Meta attributes of system configuration elements |
| US8849894B2 (en) * | 2005-12-30 | 2014-09-30 | Sap Ag | Method and system using parameterized configurations |
| US20070156715A1 (en) * | 2005-12-30 | 2007-07-05 | Thomas Mueller | Tagged property files for system configurations |
| US20070156641A1 (en) * | 2005-12-30 | 2007-07-05 | Thomas Mueller | System and method to provide system independent configuration references |
| US8201189B2 (en) | 2005-12-30 | 2012-06-12 | Sap Ag | System and method for filtering components |
| US8843918B2 (en) | 2005-12-30 | 2014-09-23 | Sap Ag | System and method for deployable templates |
| US8108863B2 (en) | 2005-12-30 | 2012-01-31 | Intel Corporation | Load balancing for multi-threaded applications via asymmetric power throttling |
| US8271769B2 (en) * | 2005-12-30 | 2012-09-18 | Sap Ag | Dynamic adaptation of a configuration to a system environment |
| US8838750B2 (en) * | 2005-12-30 | 2014-09-16 | Sap Ag | System and method for system information centralization |
| US20070257715A1 (en) * | 2005-12-30 | 2007-11-08 | Semerdzhiev Krasimir P | System and method for abstract configuration |
| US9038023B2 (en) * | 2005-12-30 | 2015-05-19 | Sap Se | Template-based configuration architecture |
| US7779389B2 (en) * | 2005-12-30 | 2010-08-17 | Sap Ag | System and method for dynamic VM settings |
| US7793087B2 (en) * | 2005-12-30 | 2010-09-07 | Sap Ag | Configuration templates for different use cases for a system |
| US7954087B2 (en) * | 2005-12-30 | 2011-05-31 | Sap Ag | Template integration |
| US7870538B2 (en) * | 2005-12-30 | 2011-01-11 | Sap Ag | Configuration inheritance in system configuration |
| JP4802207B2 (ja) * | 2008-04-23 | 2011-10-26 | 株式会社日立製作所 | 情報処理システムの制御方法、情報処理システム、およびプログラム |
| EP2568394A4 (en) * | 2010-05-07 | 2013-08-28 | Fujitsu Ltd | HARDWARE CONTROL METHOD FOR AN INFORMATION PROCESSING SYSTEM AND INFORMATION PROCESSING SYSTEM |
| JP2012128697A (ja) * | 2010-12-16 | 2012-07-05 | Hitachi Ltd | 情報処理装置 |
| WO2014076736A1 (en) * | 2012-11-15 | 2014-05-22 | Hitachi, Ltd. | Storage system and control method for storage system |
| WO2014128967A1 (ja) * | 2013-02-25 | 2014-08-28 | 株式会社日立製作所 | 記憶制御装置、及びデータの書き込み完了を検知する方法 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01140344A (ja) * | 1987-11-27 | 1989-06-01 | Mitsubishi Electric Corp | 情報処理装置 |
| JP2000235558A (ja) * | 1999-02-16 | 2000-08-29 | Hitachi Ltd | 主記憶共有型マルチプロセッサシステム及びその共有領域設定方法 |
| JP2001034489A (ja) * | 1999-07-19 | 2001-02-09 | Hitachi Ltd | オブジェクト指向型プログラム実行環境の実行制御方法 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5675579A (en) * | 1992-12-17 | 1997-10-07 | Tandem Computers Incorporated | Method for verifying responses to messages using a barrier message |
| US5812757A (en) * | 1993-10-08 | 1998-09-22 | Mitsubishi Denki Kabushiki Kaisha | Processing board, a computer, and a fault recovery method for the computer |
-
2001
- 2001-10-24 JP JP2001325904A patent/JP2003131900A/ja not_active Abandoned
-
2002
- 2002-08-28 US US10/229,053 patent/US6832298B2/en not_active Expired - Fee Related
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01140344A (ja) * | 1987-11-27 | 1989-06-01 | Mitsubishi Electric Corp | 情報処理装置 |
| JP2000235558A (ja) * | 1999-02-16 | 2000-08-29 | Hitachi Ltd | 主記憶共有型マルチプロセッサシステム及びその共有領域設定方法 |
| JP2001034489A (ja) * | 1999-07-19 | 2001-02-09 | Hitachi Ltd | オブジェクト指向型プログラム実行環境の実行制御方法 |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007156679A (ja) * | 2005-12-02 | 2007-06-21 | Hitachi Ltd | サーバの障害回復方法及びデータベースシステム |
| JP2009116560A (ja) * | 2007-11-06 | 2009-05-28 | Nippon Information & Communication | コンピュータシステム及びその稼動方法 |
| JP2012099000A (ja) * | 2010-11-04 | 2012-05-24 | Toyota Motor Corp | 情報処理装置 |
| JP2015528962A (ja) * | 2012-08-03 | 2015-10-01 | フジツウ テクノロジー ソリューションズ インタレクチュアル プロパティ ゲーエムベーハー | 高可用性コンピュータシステム |
| US9871704B2 (en) | 2012-08-03 | 2018-01-16 | Fujitsu Limited | High-availability computer system, working method and the use thereof |
| US10491488B2 (en) | 2012-08-03 | 2019-11-26 | Fujitsu Limited | High-availability computer system, working method and the use thereof |
| JP2015130134A (ja) * | 2014-01-09 | 2015-07-16 | 日本電気株式会社 | 情報処理装置、情報処理システム、メモリレプリケーション方法、並びにコンピュータ・プログラム |
| JP2019507413A (ja) * | 2016-01-15 | 2019-03-14 | アファームド ネットワークス,インク. | 通信ネットワークにおけるデータベースに基づく冗長化 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20030079093A1 (en) | 2003-04-24 |
| US6832298B2 (en) | 2004-12-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2003131900A (ja) | サーバシステム運用管理方式 | |
| US5561809A (en) | In a multiprocessing system having a coupling facility, communicating messages between the processors and the coupling facility in either a synchronous operation or an asynchronous operation | |
| Bhide | An Analysis of Three Transaction Processing Architectures. | |
| Bernstein | Sequoia: A fault-tolerant tightly coupled multiprocessor for transaction processing | |
| JP3628595B2 (ja) | 少なくとも1つのnuma(non−uniformmemoryaccess)データ処理システムとして構成可能な相互接続された処理ノード | |
| US8201183B2 (en) | Monitoring performance of a logically-partitioned computer | |
| EP3404537B1 (en) | Processing node, computer system and transaction conflict detection method | |
| JPS6131500B2 (ja) | ||
| JP2003044452A (ja) | 同期メモリ・バリアを実装する方法およびシステム | |
| US20100169289A1 (en) | Two Phase Commit With Grid Elements | |
| CN111240806B (zh) | 一种分布式容器镜像构建调度方法 | |
| CN117120976B (zh) | 解聚数据中心中的自适应存储器一致性 | |
| JP2007172334A (ja) | 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム | |
| JPS6375963A (ja) | システム回復方式 | |
| CN114722121B (zh) | 一种数据库集群间主备方法及装置 | |
| JP2001022599A (ja) | フォールトトレラント・システム,フォールトトレラント処理方法およびフォールトトレラント制御用プログラム記録媒体 | |
| US7904663B2 (en) | Secondary path for coherency controller to interconnection network(s) | |
| JP2023538241A (ja) | メモリロケーションに記憶されたデータが修正されたかどうかを識別するためのメモリロケーションの監視 | |
| JP2002202960A (ja) | データ処理方法および装置 | |
| JP2580525B2 (ja) | 並列計算機における負荷分散方法 | |
| JPH04291660A (ja) | プロセッサ間通信方法およびそのための並列プロセッサ | |
| Zhao et al. | Towards {High-Performance} Transactional Stateful Serverless Workflows with {Affinity-Aware} Leasing | |
| CN116450303A (zh) | 分布式事务处理方法及装置 | |
| JP4734348B2 (ja) | 共有メモリ型マルチプロセッサにおける非同期遠隔手続き呼び出し方法、非同期遠隔手続き呼び出しプログラムおよび記録媒体 | |
| JPH0310343A (ja) | ホットスポットデータ管理処理方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040318 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041020 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070413 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070515 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070716 |
|
| A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20080321 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080512 |