JP2003131900A - サーバシステム運用管理方式 - Google Patents

サーバシステム運用管理方式

Info

Publication number
JP2003131900A
JP2003131900A JP2001325904A JP2001325904A JP2003131900A JP 2003131900 A JP2003131900 A JP 2003131900A JP 2001325904 A JP2001325904 A JP 2001325904A JP 2001325904 A JP2001325904 A JP 2001325904A JP 2003131900 A JP2003131900 A JP 2003131900A
Authority
JP
Japan
Prior art keywords
logical system
production
logical
standby
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2001325904A
Other languages
English (en)
Inventor
Keimei Fujii
啓明 藤井
Yoshio Miki
良雄 三木
Tatsuya Kawashita
達也 川下
Akihiro Takamura
明裕 高村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001325904A priority Critical patent/JP2003131900A/ja
Priority to US10/229,053 priority patent/US6832298B2/en
Publication of JP2003131900A publication Critical patent/JP2003131900A/ja
Abandoned legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2043Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share a common memory address space
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2051Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant in regular structures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 フェールオーバ、クローニング等によるアク
セス不可及びレスポンス不良時間をより短縮し、可用性
の高いサーバシステムを構築する。 【解決手段】 主記憶共有型マルチプロセッサにおい
て、構成管理処理部101が本番系論理システム102
と待機系論理システム103を定義し、また両論理シス
テムからアクセス可能な情報保持空間106を用意し、
本番系論理システム102が、自身が管理する主記憶領
域104上のメモリ領域を指すアドレス情報を当該情報
保持空間106に登録し、フェールオーバまたはクロー
ニングが必要になったとき待機系論理システム103
が、当該アドレス情報を参照し、さらに当該アドレス情
報から本番系論理システム102が管理する主記憶領域
104上の情報を参照して、本番系論理システム102
と同じ処理環境および状態を形成し、その後本番系論理
システム102の処理全部または一部を引き継ぐ。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、サーバと呼ばれる
クラスの計算機システムの運用管理方法に係わり、特
に、同システムの信頼性、可用性を高めるための障害時
フェールオーバや高負荷時クローニングといった処理を
高速に実施するためのサーバシステム運用管理方法に関
する。
【0002】
【従来の技術】インターネットを活用したビジネス展開
を支えるインフラとしてのサーバシステムにおいては、
システムダウンに伴うアクセス不可時間や、急激なアク
セス量の増加に伴うレスポンス不良時間がビジネスチャ
ンスの喪失に直結するため、それらの時間を出来る限り
短縮する手段として、フェールオーバ、クローニングな
どの可用性向上機能が既に提案されている。ここで、フ
ェールオーバとは、本番系システムにおける処理におい
て障害が発生したとき、本番系システムから待機系シス
テムに切り替え、待機系システムに処理を引き継ぐこと
であり、クローニングとは、本番系システムにおける処
理において高負荷状態等が発生し、本番系システムにお
ける処理が滞る時、待機系システムに処理の一部を引き
継ぐことである。その具体的な事例は、Sun Mic
rosystems、 Inc.が発行するwhite
paperの“Sun(TM) Enterpris
e(TM)Cluster Failover”で紹介
されている。
【0003】図2に上記従来技術に基づくサーバシステ
ム構成を示す。本図において、202は通常本システム
での処理を受け持つ本番系サーバシステムであり、20
3は本番系サーバシステム202に異常が発生した場合
にその処理を引き継ぐ待機系サーバシステムである。2
04は、本番系サーバシステム202および待機系サー
バシステム203で共有して使用される共有ディスク、
205は、LANあるいはインターネットなどのネット
ワークである。また、201は、同ネットワーク205
を介してサーバシステムにアクセスし処理の要求を行う
クライアント端末である。本図に示したように、従来、
上記フェールオーバ、クローニングなどの可用性向上機
能は、クラスタ構成のシステムにおける本番系202と
待機系203間での共有ディスク204による情報共有
を前提として実現されている。
【0004】ここで、図2に示したサーバシステムにお
けるフェールオーバ処理の様子を図3を用いて説明す
る。図3では、同処理に係わる構成要素としてのクライ
アント端末201、本番系サーバシステム202、待機
系サーバシステム203、共有ディスク204の相互関
係を上から下への時間の流れに沿って示している。ま
ず、処理要求および正常レスポンス301で示すとお
り、正常時にはクライアント端末201からの処理要求
に応じて本番系サーバシステム202が相当する処理を
行い、その結果などをレスポンスとしてクライアント端
末201に返している。本処理は、クライアント端末2
01からの処理要求発生に応じてオンデマンドで繰り返
される。本番系処理状態保存処理302も正常時におけ
る動作である。ハードウェアやOS/ソフトウェアの障
害などによって本番系サーバシステム202がいかなる
問合せに対しても応答不能となり、その主記憶上に存在
する状態情報が参照不能となるケースに備えて、本番系
サーバシステム202は、共有ディスク204に対して
所定のタイミング毎に必要な自身の状態情報を書きこ
む。なお、本処理動作に関しては、状態変化のイベント
発生毎に常に行うという形も考えられるが、ディスクア
クセス処理のオーバヘッドは一般に大きく、本番系サー
バシステム202の処理性能上問題があるため、そのよ
うな解は現実的ではない。次に、本番系動作状態チェッ
クの問い合わせ(以下、本番系動作状態チェックとい
う)および正常応答303の動作は、待機系サーバシス
テム203による本番系サーバシステム202の動作監
視処理動作であり、これも正常時の動作である。このよ
うに待機系サーバシステム203から所定のタイミング
毎に動作状態をチェックするための通信を本番系サーバ
システム202に対して行い、それに対して本番系サー
バシステム202が異常無く応答することで本番系サー
バシステム202が正常に動作しているのを確認でき
る。
【0005】304は、本番系サーバシステム202に
おいて障害が発生したポイントを示している。動作30
5は、障害発生後初めての待機系サーバシステム203
による本番系サーバシステム202の動作状態チェック
により、該障害発生を待機系サーバシステム203が検
出したことを示す。ここで、異常応答とは、全く応答し
ない、あるいは、異常に応答が遅れるなどのケースを指
す。一方、動作306は、障害発生後、待機系サーバシ
ステム203によってフェールオーバ処理が行われ、本
番系サーバシステム202の処理が待機系サーバシステ
ム203によって引き継がれるまでの間に発生したクラ
イアント端末201からの処理要求に対する動作を示
す。ここで異常レスポンスとは、所定の時間内にレスポ
ンスが返らないようなケースを指す。動作305によっ
て本番系サーバシステム202における障害発生を検出
した待機系サーバシステム203は、動作307に示す
とおりフェールオーバ処理を開始し、その処理の過程で
本番系サーバシステム202の処理状態を復元すべく、
本番系サーバシステム202が動作302で共有ディス
ク204に保存した状態情報を動作308によって共有
ディスク204から読み出す。待機系サーバシステム2
03は、その状態情報を用いて、本番系サーバシステム
202の処理状態を可能な範囲で復元し、本番系サーバ
システム202からの処理の引継ぎに対する準備を行っ
た後、動作309にてフェールオーバ処理を完了させ
る。以降、待機系サーバシステム203は本番系サーバ
システムとして処理を開始し、動作310に示すような
形で、動作306の結果としてのクライアント端末20
1からの再処理要求や別の処理要求等に応答していく。
【0006】
【発明が解決しようとする課題】上記従来手法には、以
下の問題点が存在し、より高い可用性を求めるユーザの
要請に応えられない。 (1)待機系サーバシステム203による本番系サーバ
システム202の処理状態復元が共有ディスク204の
アクセスを伴うため、処理に時間がかかる。 (2)障害発生時点で本番系サーバシステム202の主
記憶上に存在する最新情報が共有ディスク204に反映
されず、またその読み出しも不可能であるため、状態回
復に限度がある。 本発明の目的は、上記の問題を解決し、システムの異常
状態の発生により生じるアクセス不可及びレスポンス不
良時間をより短縮して可用性の高いサーバシステムを構
築することにある。
【0007】
【課題を解決するための手段】本発明の代表的特徴は、
複数個のプロセッサ、主記憶装置、外部記憶装置、およ
びそれらを相互に接続する接続手段を有する単一の主記
憶共有型マルチプロセッサシステムにおいて、任意数の
プロセッサおよび主記憶装置の一部からなる論理的なシ
ステム単位を複数個定義し、さらに、そのうち2つ以上
の論理的なシステム単位について、1つを本番系論理シ
ステム、その他を待機系論理システムと定義し、本番系
論理システムおよび待機系論理システムの双方からアク
セス可能な主記憶装置上のメモリセグメントを用意し、
該メモリセグメントに本番系論理システムから待機系論
理システムへの制御引継ぎ用の情報を格納する制御引継
ぎ用の情報保持空間を設け、本番系論理システムはその
制御の引継ぎに必要な情報を該情報が作成される度に該
制御引継ぎ用の情報保持空間に登録し、待機系論理シス
テムは、本番系論理システムから待機系論理システムへ
の制御引継ぎの要求を受けた時点で、制御引継ぎ用の情
報保持空間に格納された情報を参照し、本番系論理シス
テムと同じ処理環境および状態を形成し、その後該本番
系論理システムの処理全部または一部を引き継ぐように
している点である。また、別の特徴は、待機系論理シス
テムによる本番系論理システムからの制御引継ぎに関し
て、待機系論理システムは、本番系論理システムから待
機系論理システムへの制御引継ぎの要求を受けた時点
で、前記制御引継ぎ用の情報保持空間に格納された情報
を参照した後、さらに、該参照の結果得られた情報を元
に、本番系論理システムが管理する主記憶資源をアクセ
スして該主記憶資源を待機系論理システムが管理する主
記憶装置に格納することにより本番系論理システムと同
じ処理環境および状態を形成し、その後本番系論理シス
テムの処理全部または一部を引き継ぐようにしている点
である。また、本番系論理システムは、本番系論理シス
テムが管理する主記憶領域上に存在して、本番系論理シ
ステムから待機系論理システムへの処理引継ぎ時に待機
系論理システムが管理する主記憶領域に複製する必要の
ある本番系論理システムの環境および処理状態情報が含
まれる複数個のメモリ領域について、該メモリ領域の確
保あるいは該メモリ領域の所在変更の際に、前記制御引
継ぎ用の情報保持空間に対して、その主記憶アドレスを
登録あるいは更新し、待機系論理システムは、該本番系
論理システムからの処理引継ぎ時に、該制御引継ぎ用の
情報保持空間から該複数個のメモリ領域に対する主記憶
アドレスを順次参照し、該主記憶アドレスを元に、本番
系論理システムが管理する主記憶領域上の情報を得るよ
うにしている。また、主記憶共有型マルチプロセッサシ
ステムにおいてその論理的な構成を管理する構成管理処
理部を定義し、該構成管理処理部は、前記論理的なシス
テム単位を複数個定義し、さらに、そのうち2つ以上の
論理的なシステム単位について、1つを本番系論理シス
テム、その他を待機系論理システムと定義し、本番系論
理システムおよび待機系論理システムの双方からアクセ
ス可能な主記憶上のメモリセグメントを用意し、該メモ
リセグメントに前記制御引継ぎ用の情報保持空間を設
け、これを維持・管理し、また、本番系論理システムの
運用状態を監視し、該監視の結果本番系論理システムに
異常を検出した場合に、その異常の状態に応じて前記制
御引継ぎの要求を該待機系論理システムに発し、待機系
論理システムに対して、本番系論理システムの処理全部
または一部を引き継ぐように指示するようにしている。
また、前記定義された構成管理処理部を、前記主記憶共
有型マルチプロセッサシステムを構成する複数個のプロ
セッサの内の1つとし、あるいは、前記主記憶共有型マ
ルチプロセッサシステムに対して用意される外部管理端
末とするようにしている。また、本番系論理システムが
管理する主記憶領域に対して、他の論理的なシステム単
位からのアクセスに対するプロテクト制御が施されてい
る場合、構成管理処理部が待機系論理システムからの本
番系論理システムが管理する主記憶領域へのアクセス要
求を受け、該アクセスを処理し、該アクセスによって得
た情報を待機系論理システムに引き渡すようにしてい
る。また、本番系論理システムの運用状態を監視し、該
監視の結果本番系論理システムに異常を検出した場合、
その異常の状態が障害発生である場合には本番系論理シ
ステムの処理全部の引き継ぎを、その異常の状態が高負
荷状態の発生である場合には本番系論理システムの処理
の一部の引き継ぎを待機系論理システムが実施するよう
にしている。また、待機系論理システムによる本番系論
理システムの処理引継ぎに際して、待機系論理システム
で実行されることになるプログラムコードに関して、待
機系論理システムは、本番系論理システムが管理する主
記憶領域から待機系論理システムが管理する主記憶領域
へ該プログラムコードを複写するようにし、あるいは、
本番系論理システムが管理する主記憶領域に既に存在し
ているものを直接使用するようにしている。
【0008】
【発明の実施の形態】本発明の実施の形態を図を用いな
がら説明する。図4ならびに図5は、本発明に係わるサ
ーバシステム運用管理方式を実装するプラットフォーム
として想定している主記憶共有型のマルチプロセッサシ
ステムの構成を示す。図4ならびに図5に示す構成は既
に公知である。図4のシステム構成は、一般にSymm
etric Multi−Processor(SM
P)と呼ばれる。本システムは、主に複数のCPU40
1、相互接続ネットワーク402、共有主記憶403、
ストレージ(外部記憶装置)404で構成される。複数
のCPU401、共有主記憶403、ストレージ404
は、相互接続ネットワーク402で互いに結合される。
共有主記憶403については、図では論理的に1個の構
成要素として示しているが、物理的には複数のセグメン
トから構成され、それぞれのセグメントが相互接続ネッ
トワーク402に結合する形態が一般的である。また、
相互接続ネットワーク402については、バスやクロス
バスイッチなど種々の構成方法が存在する。このような
構成によって、本システムでは、総てのCPU401か
ら共有主記憶403およびストレージ404といった資
源を均質にアクセスできる。
【0009】図5のシステム構成は、一般にNon−U
niform Memory Access(NUM
A)方式と呼ばれる。本システムは、複数のCPU40
1、第一レベル相互接続ネットワーク502、ローカル
主記憶503、ローカルストレージ504などからなる
基本構成ブロック505を複数個、第二レベル相互接続
ネットワーク506で結合した形態を取る。基本構成ブ
ロック505は、図4で示したSMP型のシステムと等
価である。第二レベル相互接続ネットワーク506は、
各基本構成ブロック505の第一レベル相互接続ネット
ワーク同士を結合する。このような構成によって、シス
テム中のローカル主記憶503およびローカルストレー
ジ504は、基本構成ブロック505の枠を越えてシス
テム中のどのCPU401からもアクセスが可能にな
る。例えば、図中右側の基本構成ブロック505中のC
PU401から左側の基本構成ブロック505中のロー
カル主記憶503あるいはローカルストレージ504を
アクセスする際には、当該CPU401から当該CPU
401が属する基本構成ブロック505内の第一レベル
相互ネットワーク502、第二レベル相互接続ネットワ
ーク506、さらに、アクセス先のローカル主記憶50
3あるいはローカルストレージ504が属する基本構成
ブロック505内の第一レベル相互ネットワーク502
を介して当該ローカル主記憶503あるいはローカルス
トレージ504をアクセスする。このシステム構成にお
いて、複数の第一レベル相互接続ネットワーク502と
第二レベル相互接続ネットワーク506からなる階層的
な相互接続ネットワークを論理的に1個のネットワーク
として見れば、図4と図5の論理的な構成は等しくな
る。その意味で、図4と図5の物理的な構成の違いは、
本発明に係わるサーバシステム運用管理方式を実装する
にあたって特に影響を及ぼさない。本発明に係わるサー
バシステム運用管理方式を実装するにあたって、プラッ
トフォームが満たすべき必要最低限の要件は、「主記憶
共有型」のマルチプロセッサである点である。
【0010】この図4あるいは図5に示した主記憶共有
型マルチプロセッサの運用形態のひとつとして、同シス
テム内の任意の複数CPU401および共有主記憶40
3(あるいはローカル主記憶503群)の一部を組み合
わせて論理パーティションという論理的な運用管理単位
を定義し、これを仮想的に独立した1個の論理システム
として運用する手法が既に存在する。この手法によっ
て、本来物理的に複数のサーバシステムで構成されるト
ータルシステムを物理的に1個のシステムに統合でき、
これによってトータルシステムの運用管理コストの削減
が図れる。本発明に係わるサーバシステム運用管理方式
は、本運用手法による複数の論理システムの存在を前提
とする。
【0011】続いて、図1を用いて本発明に係わるサー
バシステム運用管理方式の詳細を説明する。システム基
本構成は図4に準じており、上述の複数個の論理システ
ムとして、論理システムA102および論理システムB
103の2つを示している。論理システムA102およ
び論理システムB103は、それぞれ複数のCPU40
1と共有主記憶403の一部を有している。その論理シ
ステムA102が管理する共有主記憶403の一部を主
記憶領域A104、論理システムB103が管理する共
有主記憶403の一部を主記憶領域B105とする。さ
らに、本システムにおいては、CPU401の1つであ
る構成管理CPU101と共有主記憶403上の一領域
である制御引継ぎ用情報保持空間106が存在する。
【0012】構成管理CPU101は、論理システムの
定義および管理、システムの信頼性・可用性向上機能と
してのフェールオーバ、クローニングを実現するための
論理システム間での本番系−待機系関係の定義、本番系
論理システムの動作監視と、異常検出時の待機系論理シ
ステムへの処理引継ぎ指令、制御引継ぎ用情報保持空間
106の作成・管理などを受け持つ構成要素である。一
方、制御引継ぎ用情報保持空間106は、上記フェール
オーバ、クローニングといった処理の引継ぎを共有主記
憶403を活用して処理するために必要な情報を保持す
るためのメモリ領域である。
【0013】具体的な構成例を図7に示す。図7では、
論理システムA102が本番系論理システムとして定義
されている場合の制御引継ぎ用情報保持空間106およ
び主記憶領域A104の様子を示している。制御引継ぎ
用情報保持空間106中には、制御引継ぎ関係定義表7
07や、本番系論理システム毎に用意されるポインタ表
708、709といった各種管理テーブルが存在する。
制御引継ぎ関係定義表707を構成するエントリ710
は、図8に示すとおり、本番系論理システム識別子フィ
ールド801、待機系論理システム識別子フィールド8
02、本番系論理システム用ポインタ表へのポインタフ
ィールド803からなる。各エントリ710は、構成管
理CPU101がフェールオーバ、クローニングを実現
するための論理システム間での本番系−待機系関係の定
義を行う毎に構成管理CPU101によって消費され、
その本番系論理システムの識別子と待機系論理システム
の識別子がそれぞれフィールド801、802に登録さ
れる。さらに、構成管理CPU101は、本番系論理シ
ステム用にポインタ表(708あるいは709など)の
領域を確保し、当該ポインタ表の先頭アドレスを上述の
本番系論理システムの識別子と待機系論理システムの識
別子を登録したエントリ710のフィールド803に登
録する。論理システムA用ポインタ表708を構成する
エントリ711は、図9に示すとおり、プロセス識別子
フィールド901、プロセス内識別子フィールド90
2、アドレスポインタフィールド903からなる。各エ
ントリ711は、本番系論理システムがそのオペレーテ
ィングシステム(OS)を含めて信頼性・可用性保証が
必要なプロセスを立ち上げる毎に、基本的に当該プロセ
スの比較的初期の段階で当該プロセスによって消費され
る。その際、プロセス識別子フィールド901には当該
プロセスの識別子(例えばプロセスID)が登録され、
プロセス内識別子フィールド902には当該プロセスが
自身のアドレス空間に定義する複数のデータ領域を区別
するための識別子が登録され、さらに、アドレスポイン
タフィールド903に当該データ領域の先頭アドレスが
登録される。
【0014】図7の説明に戻る。図7の状態において
は、本発明に係わるサーバシステムにおいて、本番系論
理システムとして少なくとも論理システムA102およ
び論理システムCが登録されている。さらに、論理シス
テムA102においては既にOSが起動され、信頼性・
可用性保証が必要なアプリケーションとして少なくとも
アプリケーションAおよびアプリケーションBが実行中
である。これに伴って、論理システムA102が管理す
る主記憶領域A104中にはOSが使用するOS管理情
報領域701、OS処理ワーク領域702、アプリケー
ションAが使用する管理情報領域703、ワーク領域7
04、アプリケーションBが使用する管理情報領域70
5、ワーク領域706が存在している。この状態で、本
番系論理システムとして論理システムA102および論
理システムCが登録されているのに対応してそれぞれ論
理システムA用ポインタ表708および、論理システム
C用ポインタ表709が制御引継ぎ用情報保持空間10
6に確保され、その所在場所が制御引継ぎ関係定義表7
07の本番系論理システムとして自身の識別子が本番系
論理システム識別子フィールド801に登録されている
それぞれのエントリ710の本番系論理システム用ポイ
ンタ表へのポインタフィールド803に登録されてい
る。図中エントリ710から出ている矢印線は当該ポイ
ンタフィールド803の値が何処を指し示しているかを
明示している。また、OSが使用するOS管理情報領域
701、OS処理ワーク領域702、アプリケーション
Aが使用する管理情報領域703、ワーク領域704、
アプリケーションBが使用する管理情報領域705、ワ
ーク領域706が主記憶領域A104に存在しているの
に対応して、その所在場所が論理システムA用ポインタ
表708のそれぞれのデータ領域に対応するエントリ7
11のアドレスポインタフィールド903に登録されて
いる。図中エントリ711から出ている矢印線は当該ア
ドレスポインタフィールド903の値が何処を指し示し
ているかを明示している。なお、図7で示した主記憶領
域A104上のデータ領域の定義はあくまで一例であ
る。より具体的なイメージとしては、OSのプロセス管
理テーブルや、トランザクション処理応用の処理トラン
ザクション管理テーブル、各トランザクションの状態ヒ
ープもしくはプール、データベース応用におけるオンメ
モリデータベースキャッシュなどのようなものが考えら
れる。
【0015】続いて、図1のサーバシステム構成におい
てフェールオーバ、クローニングといった可用性向上機
能がどのように実現されるかを図6の処理フロー図を用
いて説明する。まず、サーバシステム立ち上げに際し
て、構成管理CPU101は、論理システムの定義など
と並行して、動作601に示すとおり、制御引継ぎ用情
報保持空間106を作成し、以後これを管理する。さら
に、定義した論理システムのうち可用性向上機能を実現
するための本番系論理システム、待機系論理システム、
および、その本番系−待機系の関係を定義する。先述し
たとおり、構成管理CPU101はまた、制御引継ぎ用
情報保持空間106の管理動作の一環として、制御引継
ぎ関係定義表707を作成し、そのエントリ710に上
述の本番系−待機系の関係を登録する。また、本番系論
理システムのそれぞれに対応してポインタ表(708あ
るいは709など)の領域を確保し、当該ポインタ表の
先頭アドレスを上述の本番系−待機系の関係を登録した
エントリ710のフィールド803に登録する。これら
の初期動作が完了した後、構成管理CPU101は、こ
の例では論理システムA102に対して動作602によ
って本番系としての稼動を指示し、動作603によって
論理システムB103に対して待機系としての稼動を指
示する。この際、構成管理CPU101は、論理システ
ムA102に対して論理システムA用ポインタ表708
の先頭アドレスを伝える。論理システムB103に対し
ては、動作603の段階で論理システムA用ポインタ表
708の先頭アドレスを伝えても良いし、あるいは後述
する動作609の処理引継ぎ指示時に伝えても良い。
【0016】本番系として稼動を開始した論理システム
A102は、まずそのOSを起動した際に、動作604
によって、図7を用いて説明したOS管理情報領域70
1やOS処理ワーク領域702といったデータ領域の先
頭アドレスをポインタ情報として制御引継ぎ用情報保持
空間106内の論理システムA用ポインタ表708のエ
ントリ711のアドレスポインタフィールド903にそ
れぞれ登録する。その際、プロセス識別子やプロセス内
識別子といった情報も同時に、上記エントリ711の該
当するプロセス識別子フィールド901やプロセス内識
別子フィールド902にそれぞれ登録する。更に、以
降、信頼性・可用性保証が必要なアプリケーションを起
動する毎に、OS起動時と同様に、動作604によっ
て、アプリケーションが使用する管理情報領域やワーク
領域といったデータ領域の先頭アドレスをポインタ情報
として制御引継ぎ用情報保持空間106内の論理システ
ムA用ポインタ表708のエントリ711のアドレスポ
インタフィールド903にそれぞれ登録する。その際、
プロセス識別子やプロセス内識別子といった情報も同時
に、上記エントリ711の該当するプロセス識別子フィ
ールド901やプロセス内識別子フィールド902にそ
れぞれ登録する。なお、この動作604はOSやアプリ
ケーション起動時だけでなく、新たにデータ領域を確保
した場合や、既にあるデータ領域を動かしたりした場合
などにも随時発生する。また、動作605に示すとお
り、これは特別な動作というわけではなく、ごく一般的
なプログラム処理の動作として、主記憶領域A104に
対する処理情報、状態の書込み処理は随時発生する。
【0017】この論理システムA102の動作と並行し
て、構成管理CPU101は動作606に示すとおり、
所定のタイミング毎に論理システムA102の動作状態
をチェックする。論理システムA102は正常に動作し
ていれば構成管理CPU101の動作状態チェックに対
応して構成管理CPU101に正常応答を返す。一方、
異常発生ポイント607以降の時間帯に動作状態チェッ
クがなされた場合の動作は動作608以降のようにな
る。まず、動作608において、構成管理CPU101
からの動作状態チェックに対して、異常応答が構成管理
CPU101によって検出される。この異常応答とは、
実際に論理システムA102からの応答の場合と、構成
管理CPU101が論理システムA102からの応答に
よらずそのように判断する場合がある。前者は、論理シ
ステムA102が少なくとも動作状態チェックに対する
応答は可能であるが、障害あるいは極度の高負荷状態に
あって所定のレベルの可用性を保証できない場合であ
る。この場合、論理システムA102は、障害発生か、
あるいは極度の高負荷状態かを構成管理CPU101に
伝える。一方、後者は、障害によって論理システムA1
02が動作状態チェックに対して応答不能であるか、あ
るいは極度の高負荷状態で応答が非常に遅れる場合であ
る。この場合、構成管理CPU101は一定の時間応答
を待った後に異常発生を判断する。すなわち、所定時間
以内に応答がなく、さらに一定の時間応答を待ち、この
一定の時間以内に応答があったとき、障害あるいは極度
の高負荷状態にあって所定のレベルの可用性を保証でき
ない場合であると判断し、この一定の時間以内に応答が
なかったとき障害発生と判断する。
【0018】構成管理CPU101は、異常発生を検出
した後、制御引継ぎ用情報保持空間106内の制御引継
ぎ関係定義表707を参照して、異常が発生した本番系
論理システムA102に対応する待機系論理システムを
特定し、この場合、当該待機系論理システムである論理
システムB103に対して、障害発生時にはフェールオ
ーバによる処理の引継ぎを、極度の高負荷状態発生時に
はクローニングによる処理の引継ぎを、動作609によ
り指示する。先述したとおり、このタイミングで構成管
理CPU101から論理システムB103に対して制御
引継ぎ用情報保持空間106内の論理システムA用ポイ
ンタ表708の先頭アドレスを伝える場合がある。構成
管理CPU101からの処理引継ぎ指示を受けた論理シ
ステムB103は、フェールオーバの要求、またはクロ
ーニングの要求に応じて、それぞれ所定の処理引継ぎ動
作を行う。当該動作の概略ステップを動作610以降動
作613までで示した。
【0019】まず、動作610で処理が始まり、動作6
11により、構成管理CPU101から伝えられた制御
引継ぎ用情報保持空間106内の論理システムA用ポイ
ンタ表708の先頭アドレスを用いて、論理システムA
用ポインタ表708から各種ポインタ値を得る。当該ポ
インタ値は、本番系論理システムA102が管理してい
る主記憶領域A104の各種データ領域の先頭アドレス
を示しているため、動作612では、当該ポインタ値を
用いて処理引継ぎに必要な処理情報、状態を当該データ
領域から読出し、これを自身が管理する主記憶領域B1
05に複写する。この動作611、612の処理を繰り
返して主記憶領域B105上に論理システムA102が
管理する主記憶領域A上のイメージ(すなわち論理シス
テムA102の処理状態)を復元して、動作613で処
理引継ぎを完了し、以降、フェールオーバの場合には論
理システムA102の肩代わりとして動作し、クローニ
ングの場合には論理システムA102の負荷を一部分担
して処理する。なお、動作611、612によって復元
する論理システムA102の処理状態は、処理引継ぎ形
態がフェールオーバの場合には論理システムA102の
総ての処理状態であり、処理引継ぎ形態がクローニング
の場合には、処理引継ぎを行うアプリケーションに関す
る処理状態とOSの当該アプリケーションに係わる管理
情報およびワーク領域情報である。なお、論理システム
B103の処理引継ぎ動作に関して、論理システムB1
03で実行されることになるプログラムのコードについ
ても、上記の処理の枠組で主記憶領域A104から主記
憶領域B105に複写することもできる。さらには、複
写せずに直接主記憶領域A104を参照させるような処
理方法も実現可能である。以上が、本発明に係わるサー
バシステム運用管理方式によるフェールオーバ、クロー
ニングといった可用性向上機能の実現方法である。
【0020】なお、ここでは主記憶上の情報の引継ぎと
いう観点での説明に終始したが、図1に示すとおり、本
サーバシステムの構成上の特性により、元々ストレージ
404に関しては論理システム間で共用されており、例
えば大規模なデータベースなどの当該ストレージ404
上の情報については複写などの処理を伴わずに引継ぎが
可能であるため、詳細な説明は省略する。また、先述し
た論理パーティションの実装および運用方法によって
は、異なる論理パーティションが管理する主記憶領域へ
のアクセスが禁じられるため、図6の動作612におけ
る論理システムB103による主記憶領域A104の参
照については、困難である場合がある。その場合は、構
成管理CPU101のみに上記のアクセス制約を受けな
い特権を与え、動作612の主記憶参照を論理システム
B103から構成管理CPU101に依頼し、構成管理
CPU101が当該主記憶アクセスを実施した後、その
結果を論理システムB103に引き渡すという方法が考
えられる。また、特開2000−235558に開示さ
れている方法によって、論理パーティション間で特別に
相互参照可能な共有主記憶領域を定義するという方法に
よっても論理システムB103による動作612が可能
になる。以上が本発明に係わる実施の形態である。
【0021】なお、本発明に係わる別の実施の形態とし
て、構成管理CPU101が果たす役割に関して以下の
バリエーションが存在する。まず、構成管理の実態は1
個の処理プロセスであり、構成管理処理部自体は、1個
の固定的なCPU401である必然性は無く、ある特別
な論理パーティションであっても良い。この場合、構成
管理プロセスは当該論理パーティション内の固定的でな
いいずれかのCPUで動作する。また、いわゆるシステ
ム制御用外部コンソール端末によっても構成管理を実現
できる。さらには、ここまでの説明で構成管理CPU1
01が行っていた処理の内、図6の動作606、60
8、609に関しては待機系論理プロセッサが行うとい
う方法も考えられる。
【0022】
【発明の効果】本発明によって、待機系システムが異常
状態になった本番系システムの処理状態を共有主記憶を
介して高速に参照できるようになり、待機系システムに
よる本番系システムの処理状態復元を高速化することが
できる。また、これによって、アクセス不可及びレスポ
ンス不良時間をより短縮して可用性の高いサーバシステ
ムを構築できる。さらに、処理状態情報そのものではな
く、当該処理状態を保持する各種データ領域の先頭アド
レスをあらかじめ登録して、異常発生時には当該アドレ
ス情報を元に最新の処理状態情報を参照させる形で処理
引継ぎを実現することで、処理引継ぎ動作以外の部分で
のオーバヘッドを削減でき、これによりアクセス不可及
びレスポンス不良時間をより短縮した可用性の高いサー
バシステムを構築できる。
【図面の簡単な説明】
【図1】本発明に係わる主記憶共有型マルチプロセッサ
・サーバシステムの構成を示す図である。
【図2】従来技術による可用性向上を目的としたクラス
タ型システムの構成を示す図である。
【図3】従来技術によるクラスタ型システムでの障害発
生時フェールオーバ処理の流れを示す図である。
【図4】本発明がプラットフォームとして想定する主記
憶共有型マルチプロセッサシステムの構成例を示す図で
ある。
【図5】本発明がプラットフォームとして想定する主記
憶共有型マルチプロセッサシステムの構成例を示す図で
ある。
【図6】本発明に係わる本番系システムに異常が発生し
た際の待機系システムによる処理引継ぎ処理の流れを示
す図である。
【図7】本発明に係わる制御引継ぎ用情報保持空間内の
情報および当該情報と本番系論理システムAが管理する
主記憶領域A内の各データ領域との関係を示す図であ
る。
【図8】本発明に係わる制御引継ぎ用情報保持空間内の
制御引継ぎ関係定義表のエントリ構成を示す図である。
【図9】本発明に係わる制御引継ぎ用情報保持空間内の
論理システム用ポインタ表のエントリ構成を示す図であ
る。
【符号の説明】
101 構成管理CPU 102 論理システムA 103 論理システムB 104 主記憶領域A 105 主記憶領域B 106 制御引継ぎ用情報保持空間 401 CPU 402 相互接続ネットワーク 403 共有主記憶 404 ストレージ 502 第一レベル相互接続ネットワーク 503 ローカル主記憶 504 ローカルストレージ 505 基本構成ブロック 506 第二レベル相互接続ネットワーク 701 OS管理情報領域 702 OS処理ワーク領域 703 アプリケーションAの管理情報領域 704 アプリケーションAのワーク領域 705 アプリケーションBの管理情報領域 706 アプリケーションBのワーク領域 707 制御引継ぎ関係定義表 708 論理システムA用ポインタ表 709 論理システムC用ポインタ表 710 制御引継ぎ関係定義表のエントリ 711 論理システム用ポインタ表のエントリ 801 本番系論理システム識別子フィールド 802 待機系論理システム識別子フィールド 803 本番系論理システム用ポインタ表へのポインタ
フィールド 901 プロセス識別子フィールド 902 プロセス内識別子フィールド 903 アドレスポインタフィールド
───────────────────────────────────────────────────── フロントページの続き (72)発明者 川下 達也 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 高村 明裕 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 Fターム(参考) 5B034 BB02 BB17 CC01 DD05 DD07 5B045 GG03 GG04 GG09 JJ04 JJ13 JJ26 JJ44

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 複数個のプロセッサ、主記憶装置、外部
    記憶装置、およびそれらを相互に接続する接続手段を有
    する単一の主記憶共有型マルチプロセッサシステムにお
    いて、 任意数のプロセッサおよび主記憶装置の一部からなる論
    理的なシステム単位を複数個定義し、さらに、そのうち
    2つ以上の論理的なシステム単位について、1つを本番
    系論理システム、その他を待機系論理システムと定義
    し、該本番系論理システムおよび該待機系論理システム
    の双方からアクセス可能な主記憶装置上のメモリセグメ
    ントを用意し、該メモリセグメントに該本番系論理シス
    テムから該待機系論理システムへの制御引継ぎ用の情報
    を格納する制御引継ぎ用の情報保持空間を設け、 該本番系論理システムはその制御の引継ぎに必要な情報
    を該情報が作成される度に該制御引継ぎ用の情報保持空
    間に登録し、 該待機系論理システムは、該本番系論理システムから該
    待機系論理システムへの制御引継ぎの要求を受けた時点
    で、該制御引継ぎ用の情報保持空間に格納された情報を
    参照し、該本番系論理システムと同じ処理環境および状
    態を形成し、その後該本番系論理システムの処理全部ま
    たは一部を引き継ぐことを特徴とするサーバシステム運
    用管理方法。
  2. 【請求項2】 請求項1記載のサーバシステム運用管理
    方法において、前記待機系論理システムによる前記本番
    系論理システムからの制御引継ぎに関して、該待機系論
    理システムは、該本番系論理システムから該待機系論理
    システムへの制御引継ぎの要求を受けた時点で、前記制
    御引継ぎ用の情報保持空間に格納された情報を参照した
    後、さらに、該参照の結果得られた情報を元に、該本番
    系論理システムが管理する主記憶資源をアクセスして該
    主記憶資源を該待機系論理システムが管理する主記憶装
    置に格納することにより該本番系論理システムと同じ処
    理環境および状態を形成し、その後該本番系論理システ
    ムの処理全部または一部を引き継ぐことを特徴とする請
    求項1のサーバシステム運用管理方法。
  3. 【請求項3】 請求項1または請求項2記載のサーバシ
    ステム運用管理方法において、 前記本番系論理システムは、該本番系論理システムが管
    理する主記憶領域上に存在して、該本番系論理システム
    から前記待機系論理システムへの処理引継ぎ時に該待機
    系論理システムが管理する主記憶領域に複製する必要の
    ある該本番系論理システムの環境および処理状態情報が
    含まれる複数個のメモリ領域について、該メモリ領域の
    確保あるいは該メモリ領域の所在変更の際に、前記制御
    引継ぎ用の情報保持空間に対して、その主記憶アドレス
    を登録あるいは更新し、 該待機系論理システムは、該本番系論理システムからの
    処理引継ぎ時に、該制御引継ぎ用の情報保持空間から該
    複数個のメモリ領域に対する主記憶アドレスを順次参照
    し、該主記憶アドレスを元に、該本番系論理システムが
    管理する主記憶領域上の情報を得ることを特徴とするサ
    ーバシステム運用管理方法。
  4. 【請求項4】 請求項1乃至請求項3のいずれかの請求
    項記載のサーバシステム運用管理方法において、 前記主記憶共有型マルチプロセッサシステムにおいてそ
    の論理的な構成を管理する構成管理処理部を定義し、該
    構成管理処理部は、前記論理的なシステム単位を複数個
    定義し、さらに、そのうち2つ以上の論理的なシステム
    単位について、1つを本番系論理システム、その他を待
    機系論理システムと定義し、該本番系論理システムおよ
    び待機系論理システムの双方からアクセス可能な主記憶
    上のメモリセグメントを用意し、該メモリセグメントに
    前記制御引継ぎ用の情報保持空間を設け、これを維持・
    管理し、また、該本番系論理システムの運用状態を監視
    し、該監視の結果該本番系論理システムに異常を検出し
    た場合に、その異常の状態に応じて前記制御引継ぎの要
    求を該待機系論理システムに発し、該待機系論理システ
    ムに対して、該本番系論理システムの処理全部または一
    部を引き継ぐように指示することを特徴とするサーバシ
    ステム運用管理方法。
  5. 【請求項5】 請求項4記載のサーバシステム運用管理
    方法において、 前記定義された構成管理処理部は、前記主記憶共有型マ
    ルチプロセッサシステムを構成する複数個のプロセッサ
    の内の1つであることを特徴とするサーバシステム運用
    管理方法。
  6. 【請求項6】 請求項4記載のサーバシステム運用管理
    方法において、 前記定義された構成管理処理部は、前記主記憶共有型マ
    ルチプロセッサシステムに対して用意される外部管理端
    末であることを特徴とするサーバシステム運用管理方
    法。
  7. 【請求項7】 請求項4乃至請求項6のいずれかの請求
    項記載のサーバシステム運用管理方法において、 前記本番系論理システムが管理する主記憶領域に対し
    て、他の論理的なシステム単位からのアクセスに対する
    プロテクト制御が施されている場合、前記構成管理処理
    部が前記待機系論理システムからの該本番系論理システ
    ムが管理する主記憶領域へのアクセス要求を受け、該ア
    クセスを処理し、該アクセスによって得た情報を該待機
    系論理システムに引き渡すことを特徴とするサーバシス
    テム運用管理方法。
  8. 【請求項8】 請求項4乃至請求項7のいずれかの請求
    項記載のサーバシステム運用管理方法において、 前記本番系論理システムの運用状態を監視し、該監視の
    結果該本番系論理システムに異常を検出した場合、その
    異常の状態が障害発生である場合には該本番系論理シス
    テムの処理全部の引き継ぎを、その異常の状態が高負荷
    状態の発生である場合には該本番系論理システムの処理
    の一部の引き継ぎを前記待機系論理システムが実施する
    ことを特徴とするサーバシステム運用管理方法。
  9. 【請求項9】 請求項1乃至請求項8のいずれかの請求
    項記載のサーバシステム運用管理方法において、 前記待機系論理システムによる前記本番系論理システム
    の処理引継ぎに際して、該待機系論理システムで実行さ
    れることになるプログラムコードに関して、該待機系論
    理システムは該本番系論理システムが管理する主記憶領
    域から該待機系論理システムが管理する主記憶領域へ該
    プログラムコードを複写することを特徴とするサーバシ
    ステム運用管理方法。
  10. 【請求項10】 請求項1乃至請求項8のいずれかの請
    求項記載のサーバシステム運用管理方法において、 前記待機系論理システムによる前記本番系論理システム
    の処理引継ぎに際して、該待機系論理システムで実行さ
    れることになるプログラムコードに関して、該待機系論
    理システムは該本番系論理システムが管理する主記憶領
    域に既に存在しているものを直接使用することを特徴と
    するサーバシステム運用管理方法。
JP2001325904A 2001-10-24 2001-10-24 サーバシステム運用管理方式 Abandoned JP2003131900A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001325904A JP2003131900A (ja) 2001-10-24 2001-10-24 サーバシステム運用管理方式
US10/229,053 US6832298B2 (en) 2001-10-24 2002-08-28 Server system operation control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001325904A JP2003131900A (ja) 2001-10-24 2001-10-24 サーバシステム運用管理方式

Publications (1)

Publication Number Publication Date
JP2003131900A true JP2003131900A (ja) 2003-05-09

Family

ID=19142376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001325904A Abandoned JP2003131900A (ja) 2001-10-24 2001-10-24 サーバシステム運用管理方式

Country Status (2)

Country Link
US (1) US6832298B2 (ja)
JP (1) JP2003131900A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007156679A (ja) * 2005-12-02 2007-06-21 Hitachi Ltd サーバの障害回復方法及びデータベースシステム
JP2009116560A (ja) * 2007-11-06 2009-05-28 Nippon Information & Communication コンピュータシステム及びその稼動方法
JP2012099000A (ja) * 2010-11-04 2012-05-24 Toyota Motor Corp 情報処理装置
JP2015130134A (ja) * 2014-01-09 2015-07-16 日本電気株式会社 情報処理装置、情報処理システム、メモリレプリケーション方法、並びにコンピュータ・プログラム
JP2015528962A (ja) * 2012-08-03 2015-10-01 フジツウ テクノロジー ソリューションズ インタレクチュアル プロパティ ゲーエムベーハー 高可用性コンピュータシステム
JP2019507413A (ja) * 2016-01-15 2019-03-14 アファームド ネットワークス,インク. 通信ネットワークにおけるデータベースに基づく冗長化

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7096383B2 (en) * 2002-08-29 2006-08-22 Cosine Communications, Inc. System and method for virtual router failover in a network routing system
US7065673B2 (en) * 2002-10-29 2006-06-20 Brocade Communication Systems, Inc. Staged startup after failover or reboot
US7076689B2 (en) * 2002-10-29 2006-07-11 Brocade Communication Systems, Inc. Use of unique XID range among multiple control processors
US7203863B2 (en) * 2003-05-09 2007-04-10 Oracle International Corporation Distributed transaction state management through application server clustering
US7552436B2 (en) * 2003-11-25 2009-06-23 International Business Machines Memory mapped input/output virtualization
US7234037B2 (en) * 2003-11-25 2007-06-19 International Business Machines Corporation Memory mapped Input/Output operations
US20050125557A1 (en) * 2003-12-08 2005-06-09 Dell Products L.P. Transaction transfer during a failover of a cluster controller
JP2005293315A (ja) * 2004-03-31 2005-10-20 Nec Corp データミラー型クラスタシステム及びデータミラー型クラスタシステムの同期制御方法
US7437581B2 (en) * 2004-09-28 2008-10-14 Intel Corporation Method and apparatus for varying energy per instruction according to the amount of available parallelism
US20060095690A1 (en) * 2004-10-29 2006-05-04 International Business Machines Corporation System, method, and storage medium for shared key index space for memory regions
JP2006228121A (ja) * 2005-02-21 2006-08-31 Toshiba Corp 演算処理装置
JP4831599B2 (ja) * 2005-06-28 2011-12-07 ルネサスエレクトロニクス株式会社 処理装置
US7937616B2 (en) * 2005-06-28 2011-05-03 International Business Machines Corporation Cluster availability management
US7797522B2 (en) * 2005-12-30 2010-09-14 Sap Ag Meta attributes of system configuration elements
US8849894B2 (en) * 2005-12-30 2014-09-30 Sap Ag Method and system using parameterized configurations
US20070156715A1 (en) * 2005-12-30 2007-07-05 Thomas Mueller Tagged property files for system configurations
US20070156641A1 (en) * 2005-12-30 2007-07-05 Thomas Mueller System and method to provide system independent configuration references
US8201189B2 (en) 2005-12-30 2012-06-12 Sap Ag System and method for filtering components
US8843918B2 (en) 2005-12-30 2014-09-23 Sap Ag System and method for deployable templates
US8108863B2 (en) 2005-12-30 2012-01-31 Intel Corporation Load balancing for multi-threaded applications via asymmetric power throttling
US8271769B2 (en) * 2005-12-30 2012-09-18 Sap Ag Dynamic adaptation of a configuration to a system environment
US8838750B2 (en) * 2005-12-30 2014-09-16 Sap Ag System and method for system information centralization
US20070257715A1 (en) * 2005-12-30 2007-11-08 Semerdzhiev Krasimir P System and method for abstract configuration
US9038023B2 (en) * 2005-12-30 2015-05-19 Sap Se Template-based configuration architecture
US7779389B2 (en) * 2005-12-30 2010-08-17 Sap Ag System and method for dynamic VM settings
US7793087B2 (en) * 2005-12-30 2010-09-07 Sap Ag Configuration templates for different use cases for a system
US7954087B2 (en) * 2005-12-30 2011-05-31 Sap Ag Template integration
US7870538B2 (en) * 2005-12-30 2011-01-11 Sap Ag Configuration inheritance in system configuration
JP4802207B2 (ja) * 2008-04-23 2011-10-26 株式会社日立製作所 情報処理システムの制御方法、情報処理システム、およびプログラム
EP2568394A4 (en) * 2010-05-07 2013-08-28 Fujitsu Ltd HARDWARE CONTROL METHOD FOR AN INFORMATION PROCESSING SYSTEM AND INFORMATION PROCESSING SYSTEM
JP2012128697A (ja) * 2010-12-16 2012-07-05 Hitachi Ltd 情報処理装置
WO2014076736A1 (en) * 2012-11-15 2014-05-22 Hitachi, Ltd. Storage system and control method for storage system
WO2014128967A1 (ja) * 2013-02-25 2014-08-28 株式会社日立製作所 記憶制御装置、及びデータの書き込み完了を検知する方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01140344A (ja) * 1987-11-27 1989-06-01 Mitsubishi Electric Corp 情報処理装置
JP2000235558A (ja) * 1999-02-16 2000-08-29 Hitachi Ltd 主記憶共有型マルチプロセッサシステム及びその共有領域設定方法
JP2001034489A (ja) * 1999-07-19 2001-02-09 Hitachi Ltd オブジェクト指向型プログラム実行環境の実行制御方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675579A (en) * 1992-12-17 1997-10-07 Tandem Computers Incorporated Method for verifying responses to messages using a barrier message
US5812757A (en) * 1993-10-08 1998-09-22 Mitsubishi Denki Kabushiki Kaisha Processing board, a computer, and a fault recovery method for the computer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01140344A (ja) * 1987-11-27 1989-06-01 Mitsubishi Electric Corp 情報処理装置
JP2000235558A (ja) * 1999-02-16 2000-08-29 Hitachi Ltd 主記憶共有型マルチプロセッサシステム及びその共有領域設定方法
JP2001034489A (ja) * 1999-07-19 2001-02-09 Hitachi Ltd オブジェクト指向型プログラム実行環境の実行制御方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007156679A (ja) * 2005-12-02 2007-06-21 Hitachi Ltd サーバの障害回復方法及びデータベースシステム
JP2009116560A (ja) * 2007-11-06 2009-05-28 Nippon Information & Communication コンピュータシステム及びその稼動方法
JP2012099000A (ja) * 2010-11-04 2012-05-24 Toyota Motor Corp 情報処理装置
JP2015528962A (ja) * 2012-08-03 2015-10-01 フジツウ テクノロジー ソリューションズ インタレクチュアル プロパティ ゲーエムベーハー 高可用性コンピュータシステム
US9871704B2 (en) 2012-08-03 2018-01-16 Fujitsu Limited High-availability computer system, working method and the use thereof
US10491488B2 (en) 2012-08-03 2019-11-26 Fujitsu Limited High-availability computer system, working method and the use thereof
JP2015130134A (ja) * 2014-01-09 2015-07-16 日本電気株式会社 情報処理装置、情報処理システム、メモリレプリケーション方法、並びにコンピュータ・プログラム
JP2019507413A (ja) * 2016-01-15 2019-03-14 アファームド ネットワークス,インク. 通信ネットワークにおけるデータベースに基づく冗長化

Also Published As

Publication number Publication date
US20030079093A1 (en) 2003-04-24
US6832298B2 (en) 2004-12-14

Similar Documents

Publication Publication Date Title
JP2003131900A (ja) サーバシステム運用管理方式
US5561809A (en) In a multiprocessing system having a coupling facility, communicating messages between the processors and the coupling facility in either a synchronous operation or an asynchronous operation
Bhide An Analysis of Three Transaction Processing Architectures.
Bernstein Sequoia: A fault-tolerant tightly coupled multiprocessor for transaction processing
JP3628595B2 (ja) 少なくとも1つのnuma(non−uniformmemoryaccess)データ処理システムとして構成可能な相互接続された処理ノード
US8201183B2 (en) Monitoring performance of a logically-partitioned computer
EP3404537B1 (en) Processing node, computer system and transaction conflict detection method
JPS6131500B2 (ja)
JP2003044452A (ja) 同期メモリ・バリアを実装する方法およびシステム
US20100169289A1 (en) Two Phase Commit With Grid Elements
CN111240806B (zh) 一种分布式容器镜像构建调度方法
CN117120976B (zh) 解聚数据中心中的自适应存储器一致性
JP2007172334A (ja) 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム
JPS6375963A (ja) システム回復方式
CN114722121B (zh) 一种数据库集群间主备方法及装置
JP2001022599A (ja) フォールトトレラント・システム,フォールトトレラント処理方法およびフォールトトレラント制御用プログラム記録媒体
US7904663B2 (en) Secondary path for coherency controller to interconnection network(s)
JP2023538241A (ja) メモリロケーションに記憶されたデータが修正されたかどうかを識別するためのメモリロケーションの監視
JP2002202960A (ja) データ処理方法および装置
JP2580525B2 (ja) 並列計算機における負荷分散方法
JPH04291660A (ja) プロセッサ間通信方法およびそのための並列プロセッサ
Zhao et al. Towards {High-Performance} Transactional Stateful Serverless Workflows with {Affinity-Aware} Leasing
CN116450303A (zh) 分布式事务处理方法及装置
JP4734348B2 (ja) 共有メモリ型マルチプロセッサにおける非同期遠隔手続き呼び出し方法、非同期遠隔手続き呼び出しプログラムおよび記録媒体
JPH0310343A (ja) ホットスポットデータ管理処理方式

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040318

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070716

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20080321

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080512