JPS5816362A - 二重化共有メモリ制御装置 - Google Patents

二重化共有メモリ制御装置

Info

Publication number
JPS5816362A
JPS5816362A JP56112995A JP11299581A JPS5816362A JP S5816362 A JPS5816362 A JP S5816362A JP 56112995 A JP56112995 A JP 56112995A JP 11299581 A JP11299581 A JP 11299581A JP S5816362 A JPS5816362 A JP S5816362A
Authority
JP
Japan
Prior art keywords
data
shared memory
memory
cpu
shared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56112995A
Other languages
English (en)
Other versions
JPS6113266B2 (ja
Inventor
Yoshihiro Miyazaki
義弘 宮崎
Susumu Kato
猛 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP56112995A priority Critical patent/JPS5816362A/ja
Publication of JPS5816362A publication Critical patent/JPS5816362A/ja
Publication of JPS6113266B2 publication Critical patent/JPS6113266B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、複数処m装置間の二重化共有メモリの制御装
置に関する。
まず、本発明の前提となる、二重化共有メモリを含む複
数処理装置の全体構成例を第1図を参照して説明する。
第18ii)は、4つの処理装置8(CPUI〜CPU
4)が二重化共有メモ!71(Ml、M2)t−共有す
る構成であシ、処理装置3(以下CPUと称す)は、共
有メモリlとの接続機構4(MEI〜MB4):以下メ
モリエクスパンダと称す)t−有し、共有メモ+71は
各CPUに対応して設けた処理装**g機@2(PI〜
P4:以下ポートと称す)を有する。第1図では、同一
の構成のものには、代表して1つの符号がつけられてい
るだけである。例えばC以H〜CPU4に対しては%C
PU1に符号3がつけられ、CPU2〜CPO4には符
号をつけていない、これは他の部分に対しても同様であ
る。
したがって、以下の説明では、CPU5という場合は、
CPUI〜CPU4を代表しえものとする。
メモリエクスパンダ4七、両共有メモリのポート2は共
有メモリ〜CPU間インターフェイス5によシ接続され
、各CPUからメモリエクスパンダ4、共有メ%す〜C
PU間インタインターフェイス5トj!を介して共有メ
モlとのデータ転送が行われる0両共有メ七り0間は、
共有メモリー共有メ4にす閲インターフェイス6によj
PII絖され両共有メモリは同期して一作する。各CP
Uは人出カパスγを有し、各種入出力装置9を動作させ
、020間連絡パス8を用いて、相互割込通信、相互監
視が行なわれるようになっている。
このようなシステム構成においてメモリエクスパンダ4
は、内部構成tsgz図に示すように一〇Pυからアド
レスA1書込みデータWDt−受取って、両共有メモ替
M1.M2にそれぞれアドレスA1書込2、書込みデー
タWD1.WD2をイン/−7エイス5.5′を介して
送出し、両共有メ峰りからO続出しデータRDI、RD
2を受取ってチェックし、正常な方のデータRDtCP
Uに送出する。このとき、両系のデータRDI。
RD2ともエラー検出されず正常であるが、両データが
異なるとい)ケースが起と9うみ、(1ビツトパリテイ
チエツクを行っているならは2ビツト誤〕は正常とみな
される)尚第2図において、10はアドレスバッファ、
1lrj:書込みデータバッファ、12は胱出しデータ
選択回路、13゜13′は胱出しデータバッファ、14
.14’は続出しデータ選択回路大刀、15は絖出しデ
ータ選択回路出力である。
従来の読出しデータ選択回路の代表的な具体例を第3図
、第4図に示している・ #I3図は、両系共正常ならばそのデータをオアしてC
PUへ送出する方式である0両系を各々l系、z系と呼
ぶこ、!:KI、%1系からの続出しデータ14tエラ
ー検出回路tgKてデータチェックし、エラーがあれば
、戒iは、1系タイムアウトエラー25を検出すれtf
l系エシエラ−検出信号17ンし、l系から0データ1
4はインヒビットされCPUへ送出されなり、2系につ
いても同様である0本方式は、エラー検出回路16で検
出されないデータm6でも同系データをオアすることに
よりCPUでエラー検出できるケースがあ)、データの
品質を上げるこ七はできるが、片系0共有メモリがアド
レス系中タイ2ング系の故障にょ〕、ζOようなエラー
検出回路で検出できないデータ誤pt続発すると、全て
のCPUがダウンする結果となる。
第4mは、両系正常ならばあらかじめ定まった方のデー
タ[−CPUK送出する方式である0本方式もあらかじ
め定まった方の共有メモリがエラー検出で龜ないデータ
g*nt続発すると、全てのCPUがダウンする結果と
なる。最近C)CPUの使用状況は、これがダウンした
とき、人手によるバックアップは不可能な時が多く、一
方このようなシステムでは高信頼度化のためにCPUの
完全二重系、入出力O同期、一致チェック、合理性チェ
ツタ、相互診断等、片系のCPUが誤った計算を行って
も、システムダウンとならぬよう、あらゆる考慮がなさ
れており、このようなシステムにおいて片系共有メ°モ
リが故障したからという塩山で、全て0CPUがダウン
するのは望ましくない。
本発@O目的は、このような片系共有メモリのエラー検
出不可なデータ誤p発生時に1全てのCPUがダウンす
ることを防止するようにした二重化共有メモリ制御装置
をII供するにある。
本発l1io特徴はい第5図に一例を示すように各メモ
リエクスパンダ(ある使は、各C5Pυ)内に、プログ
ツムあるいは何らかの手段にて七ット、リセットが可能
な記憶手段(優先選択7リツプフロツグ20)を設け、
両系l!出しデータ共正常なと龜、どちらtCPUに送
出するかをこの記憶手段のオン/オフによシ決めるよう
にしていることである。このようにすることにより、複
数CPU0内、一部0CPU群は共有メモリl系のデー
タを優先的に使用し、残pOcPU評は共有メモリ2系
のデータを優先的に使用することによって、片系共有メ
モリにてエラー検出不可なデータWAシが続発しても全
てのCPUがダウンすることは防止できる。
本発明の実施例をgsg〜第12WJt参照して説明す
る。
第6図はCPU5 (メそリエクスバンダ4t−含む)
の構成を示したものである。CPU内バス制脚装置1(
BC)30にて制御されるCPU内パス2faKti、
メモリエクスパンダ(MJi: ) 4、メモリ制御装
置(MCυ)28、基本演算機all(BPU)32、
入出力制御機構(IOP)33が接続される。メモリ前
脚装置28は、プログラム及びそのCPU専用のデータ
を格納し九メインメ峰り27tW御する。基本演算機#
1lB2には浮動小数点演算機構(PPP)31等オプ
ション機#Iが接続される0、入出力制御機11133
は、入出カバスフを、制御し、入出力鋏置〜メインメモ
リ、或いは共有メ毫讐関Oデータ転送を行う、メモリエ
クスパンダ4は、2本の共有メモリ〜CPU間インター
フェイス6を介し、−二重化共有メモリMl、M2と接
I!される。メインメモリ27と共有メモリl(Ml、
MりD区別はメモリアドレスにて区別され、 41m!
メモリアドレス以上のメモリアドレスが、共有メモリに
割当てられる。
第7図は共有メモリ1(ポート怠を含む)の構成を示し
たものである。共有メモリ内バス制御装置37にて制御
される共有メモリ内パス36には、メモリ制御装置3!
s1ポート2が接続される。メモリ制御装置3sは、複
数CPU間共有データを格納するメモリ34を制御する
。ボー)2(Pi〜P4)は共有メモリ〜CPU間イン
ターフェイスst介し% CPUI〜4と接続される。
共有メモリ内パス制御装置37は、共有メ峰り〜共有メ
モリインター7エイス6を介し、他系共有メモリの共有
メモリ内パス制御装置と接続され(図示せず)、両系の
共有メモリが同時KIfIiI定0CPUとのデータ転
送を行うよう、同期化制御を行う。
@fHIJBメモリエクスパンダ40構成〇−例を示し
たtのでToイ。CPυ内パスのアドレス4丁をそのア
ドレスが共有メモリのアドレス(41定アドレス以上の
アドレスが共有メモリに割当てられゐ)かどうかをアド
レス比較−路44にて検出し、共有メモリのアドレスに
て、メモリ起動信4I49を受けると共有メ峰り起動信
号46がオンし、アドレス人、データWDtアドレス/
(ツ7ア1G%書込ミデータパツファllICセツシし
、両系共有メモリM1.M2にアドレス38(A1.A
2)、書込みデータ81 (WDI −WD2 )%起
動信号40 (RIQl、REQi)t−!!出する0
両系共有メモリMl、M!かも、続出しデータ41(a
pl、iDg)、応答信号42(ANSI。
ムN82Fが:IL送される七、WR出しデータバッフ
ァ1B、13’にデータセットすると共に応答制御回路
43を起動する。応答制御回路43は両系共有メ令9M
1 、M2からの応答がそろうと応答@−It!$2を
CPU内バス29を介して基本演算機構32、入出力制
御機構33に返答する。このとき、l!出しデータ選択
回路12によp前記の方式にで選択され九両系どちらか
のデータが続出しデータ50として出力される。また、
応答制御回路43はタイムアウトエラーの検aSを行−
1l系タイムアクト工ラー検出信号25.2系タイムア
ウト工ラー検出信号26tデータ選択回路12に出カナ
ゐ、tた、データ選択回路12にて両系データ共エラー
検出したときは、エラー信号(ERB)51が応答信号
(AN8)52と共に返答される。
読出しデータ選択回路12内には後述する優先選択ツリ
ツブフロップが設けられているが、その書キ換えは、レ
ジスタアドレスtaico ADDR>54がそのツリ
ツブ70ツブ用Oレジスタアドレスになっていることt
レジスタアドレスデコード回路(DECODE)45に
て検出しているときくレジスタ書込み信号(Rli:G
 WRITE ) 55がオンすると行われ、レジスタ
デー!(REGDATA)5Bの特定ヒツトが@l”の
ときセット、′″o”oときリセットされる。
読出しデータ選択回路120詳細構成を第5図に示して
いる。両系共有メ毫りからll!出され、メモリエクス
パンダ内胱出しデータバッファ13゜13’にセットさ
れたデータ14.14’は一エラー検出回路16.18
にでエラーチェックされる。エラーチェックにてエラー
〇あった場合、もしくはタイムアウトエラー検出信−9
25,26がオンO場合、読出しデータエラー検、出信
号17゜19がオンとな〕、その系Oデータt−CPU
へ送ることt禁止し、他系データをCPUへ送るように
する0両系共正常な場合は優先選択7リツプ7ロックZ
ooの出力である読出しデータl優先選択信号21、続
出しデータ2優先選択信号22いずれかオンの方のデー
タt−CPUへ送出する。両系共エラ−〇ときは、両系
読出しデータエラー信号(ERR)20がオンとなる。
優先選択フリップ70ツブ100は、そのセット信号2
4がオンし九と自書換えられ、そのデータ信号23が1
1”のをき続出しデータ1遺択信号21がオン、続出し
データ2遺択信号22がオフとなシ、ま九データ信号2
3が@O”のときその逆となる。
応答制御回路43の構成を第9図に示している。
両系共有メモリからの応答の内、まず1系Mlの応答信
号(AN81)5が返信されるとl系応答記憶回路56
を七ッ卜すると共に2系タイムアウト検a$al115
Gヲ起動スル、そ01t2系M20応答信号5′がなけ
れはタイムアウト検出し%2系タイムアウト検出回路6
1がセットされ、2系タイムアウト工ラー信号26がオ
/するが、規定時間内に2系の応答信号5′が返信され
ると、2系タイムアウト検出回路59のリセットを行う
と共に応答信号52がオンとなる。CPUは応答信号5
2t−受けると起動信号をオフとするので共有メモリ起
動信号46もオフとなシ、本応答制御1回路4゛3内0
ζi記憶回路56,57.タイムアウト回路60.61
はリセットされ、初期状態となる。
次にポート2の構成を第10図に示す、メモリエクスパ
ンダ4からの起動信号(REQ)40がオンすると、共
有メモリ内パスにパス占有要求信号(B −Rli:Q
 I) 64をオンする。パス制御回路30にて各ポー
トからの要求信号を優先判定し、選択され九ポートに対
し、パス占有許可信号(B4ELt )65が出力され
る。ポート2は、この信号を受けると、アドレス、書込
みデータを共有メモリパスにのせ、メモリ起動7リツプ
70ツブ69をセットし、その出力であるメモリ起動信
号66を共有メモリパス36に出力する。メモリ書込み
または読出し動作終了後、絖出しデータ(RD)$7、
応答信号(AN8)68が共有メモリパス36t−介し
て返信されるのでメモリエクスパンダ4へそれらを送出
し、また応答信号68にてメモリ起動7リツプフロツプ
69t−リセットする。
以上、実施例の各部の説1jlIを行ったが、メモリア
クセス時Oタイムチャートを第11図に、優先選択ツリ
ツブフロップlOoの書′換え時のタイムチャートを第
12図に示す。なお、両者は同時に行なわれることがな
いよう、プログラム上インターロックされて使用される
次に、本実施例にてどのように優先選択アリラグフロッ
プ100を制御するかの使用例を第13図、第14図を
参照して説明する。
第1311はCPO2台系の場合であシ、(A)は全て
0機器が正常時の状態を示し、CPU1は内蔵する優先
選択アリラグフロップをオンし、l系共有メモリMlの
耽出しデータを使用し、CPU2は同じく内蔵する優先
選択7リツプフロツプをオフし、2系共有メモリM2の
−出しデータを使用している。CPUIは大系業務、C
PU2はB系桑務を行っておシ、どちらかの業務が存続
できれとシステムダウンにはならないものとする。図に
おいて実線は読出しデータ使用、破線は続出しデータ使
用せずを示している。また、Ml@故障、M2軽故障は
、メモリエクスパンダにてエラー検出可能なエラーを発
生したときであシ、この場合は(B)、(C)に示す如
く、正しい系の共有メモリのデータが使用されるので、
何ら影響はない。
また、Mt重故障、M2重故障は、メモリエクスパンダ
にてエラー検出不可なエラーを発生したときであシ、こ
の場合、そのデータを使用しているCPUは自己合理性
チェック、相互診断チェック等にて異常検出しダウンす
る。しかし、他系のCPUは重故障を発生したメモリの
データを使用しないのでそれぞれ(D)、(E)のごと
く業務を続行することができる。
第14図は、CPU3台で、1台は待機系の場合である
。この場合、共有メモリの軽故障、重故障については第
13図0CP02台のときとほぼ同一であるが、CPU
が故障した場合、優先選択フリップフロツブtプ党グラ
ムにて書換えられるということを利用して次のようなシ
ステム再構成  ゛・・が可能である。今、第14図(
A)において、CPU2が故障にてダウンし九とき、C
PUaは相互監視にてCPU2のダウンを検出し、バッ
クアップtS始するが、このとき、CPU2が共有メモ
リのどちら側を優先選択していなかを調べ(この情報は
各CPUのメインメモリ上のO8の構成管層テーブルに
格納しておく。)本図の場合、2系共有メ401を優先
選択してい九ので、CP!8自身の優先選択アリツブフ
ロップをオフし、2系共有メ−@:9M2のデータを使
用するととによシ第14図(B)のごとく故障前と全く
同等のシステム再構成が可能である。CPUI故障時は
、第14図(C)のごとくなる。
嬉1saioは、第14図(A)OCPU2/つ7のと
きO手順を示し九ものである。更に注意深くやるならば
、2系共有メモリM2の重故障にてCPU2がダウンし
たかもしれないので、まず最初は1系共有メモリM1の
データを使って一旦システム再構成を行い、共有メモリ
M2t−診断した後、共有メモリM2の内容を使うよう
に切換えることもできる。
第16図は本発明の他の実施例であり、第5図と異なる
とζろは、プログラムにて書換え可能な両系データオア
方式指定クリップ70ツブ70を付加していることであ
る。この両系データオア方式指定アリラグフロップ70
をオンさせることにより、第3図の従来例と同じく両系
讐正常時は両系データをオアしてCPUへ送出すること
がで自る。CPUKてそのデータ音チェックしているの
で両系データが相違するとき、エラー検出し、ストップ
する。使用状況によっては、−ったデータが処理装置内
に取込まれることが非常にまずく、むしろ、処理装置全
てストップの方がよいという状況の場合に適する。
第17図は本発明の更に他O実施例である。どちらの共
有メモリのデータを使用するかを決める、メモリエクス
パンダ内の優先選択フリップ70ツブをスイッチ7sK
[I換え良もので69、スイッチ73がオンのとき、1
系共有メモ!jM1t、。
オフのとき2系共有メそ!JM2t−選択する。本スイ
ッチをオペレータの手元に設置すれは、オペレータ04
1断にて切換えることができる。このように本発明によ
れば、二重化共有メモリの片系にて、データll!出し
時、エラー検出子゛町のデータIllが続発しても、全
てのCPUがダウンすることをさけることができる。ま
た、本発@oiltLい実施例によれif、CPU故障
のバックアップの際にも、故障前と岡等のシステム構成
をとることができ、システムの信II性を大幅に向上さ
せることができる。
[1110簡単な説明 第imlは、本発明の前提となる一般的な二重化共有メ
そ9を含む複数処理装置の全体構成図、第31aは、本
発@0前提となる処理装置内の共有メ峰り接続機構の構
成図、第゛3図、第4図は、第2rxto両系読出しデ
ータ選択回路の従来例の構成図、第61図は、両系読出
しデータ選択回路の本発明の実施例図、第6図〜菖10
図はそれぞれ本Jjl明に適用される各部の具体的な実
施例の構成図、第till、第1意図は本発明の動作説
明用タイムチャー)、lll5図〜篇1513は本発明
を使用したと亀の制御手順をポリ説明図、第16図、第
17図は第5図に対応する本発明の他の実施例図である
l・・・二重化共有メモリ、2・・・共有メモリ儒処堀
装置接続機l11(ボート)、3−・処m装置(CPU
)、4・・・処理装置側共有メモリ接続機all(メモ
リエクスパンダ)、5・・・共有メモリ〜処II装置閲
インタフェース、12・・・耽出しデータ選択回路、1
00・・・優先選択7リツプフロツグ。
代理人 弁理士 秋本正実 早  5 図 sz 2    − CPc/ t     CP(/2    0PU5C
F(/4第  8  図 早  77 第  !3  国 (C)                    (δ
)(A)

Claims (1)

    【特許請求の範囲】
  1. 1、複数OtS厘装置と、該複数O処理装置よp共通に
    アクセスされる二重化共有メモリとで構成され、各処理
    装置がそれぞれ二重化された共有メモリの両系よシデー
    タを読み出し、各データの工2−チェックを行い正常デ
    ータを処理装置内に取込む二真化共有メモリ制御装置に
    おいて、プログラムまたはそO他の手段にて変更可能な
    記憶手段を冬処場装置内に設け、当該記憶手段のオン・
    オフ内容によって、両系データ共正常なときどちらのデ
    ータを処m義置内に取込むかを決定し、複数処[Ito
    中で一部の処理装置は一方の系の共有メモリOデータを
    取込み、残n oisML装置は他系の共有メモリのデ
    ータを取込むようにしたことt−特徴とする二重化共有
    メモリ制御装置。
JP56112995A 1981-07-21 1981-07-21 二重化共有メモリ制御装置 Granted JPS5816362A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56112995A JPS5816362A (ja) 1981-07-21 1981-07-21 二重化共有メモリ制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56112995A JPS5816362A (ja) 1981-07-21 1981-07-21 二重化共有メモリ制御装置

Publications (2)

Publication Number Publication Date
JPS5816362A true JPS5816362A (ja) 1983-01-31
JPS6113266B2 JPS6113266B2 (ja) 1986-04-12

Family

ID=14600782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56112995A Granted JPS5816362A (ja) 1981-07-21 1981-07-21 二重化共有メモリ制御装置

Country Status (1)

Country Link
JP (1) JPS5816362A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6502167B1 (en) 1999-03-17 2002-12-31 Hitachi, Ltd. Duplicated shared memory controller for disk array
US6564294B1 (en) 1999-03-17 2003-05-13 Hitachi, Ltd. Broadcast system in disk array controller

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6502167B1 (en) 1999-03-17 2002-12-31 Hitachi, Ltd. Duplicated shared memory controller for disk array
US6564294B1 (en) 1999-03-17 2003-05-13 Hitachi, Ltd. Broadcast system in disk array controller
US6629204B2 (en) 1999-03-17 2003-09-30 Hitachi, Ltd. Disk array controller including a plurality of access paths
US6658529B2 (en) 1999-03-17 2003-12-02 Hitachi, Ltd. Broadcast system in disk array controller
US6925532B2 (en) 1999-03-17 2005-08-02 Hitachi, Ltd. Broadcast system in disk array controller

Also Published As

Publication number Publication date
JPS6113266B2 (ja) 1986-04-12

Similar Documents

Publication Publication Date Title
US4503535A (en) Apparatus for recovery from failures in a multiprocessing system
US3668644A (en) Failsafe memory system
US4939643A (en) Fault tolerant digital data processor with improved bus protocol
JP3742753B2 (ja) データ記憶システム
US5005172A (en) Diagnostic system in a data processing system
JPS5816362A (ja) 二重化共有メモリ制御装置
IE892223A1 (en) Improvements in and relating to stable memory circuits
JP2855633B2 (ja) マルチプロセッサシステムにおけるデュアルポートメモリの故障診断装置
JPS5845116B2 (ja) 二重化記憶装置
JPH0238969B2 (ja)
JPS59133623A (ja) バス情報履歴格納方式
JPH0635736A (ja) 二重化処理装置
JP2716571B2 (ja) 二重化データ保全装置
JPS61133453A (ja) メモリ制御装置
JPH01102651A (ja) 診断方式
JPH0486933A (ja) データ転送制御回路
JPS6252340B2 (ja)
JPH06124242A (ja) 二重化共有メモリ等価性保証方式
JPH0315214B2 (ja)
JPH0658664B2 (ja) 分散形共有メモリを持つデータ処理装置
JPH06259275A (ja) 情報処理装置
JPS62140152A (ja) メモリ診断方式
JPH0133858B2 (ja)
JPH02199562A (ja) 二重化メモリコピー方式
JPH02105241A (ja) メモリ故障検出回路