JPH0916531A

JPH0916531A - データ伝送方法

Info

Publication number: JPH0916531A
Application number: JP8029970A
Authority: JP
Inventors: Leonard R Fishler; レオナード・アール・フィシラー; Thomas M Clark; トーマス・エム・クラーク
Original assignee: Tandem Computers Inc
Current assignee: Tandem Computers Inc
Priority date: 1995-01-23
Filing date: 1996-01-23
Publication date: 1997-01-17
Also published as: CA2167633A1; EP0725346A1; US6032267A

Abstract

(57)【要約】【課題】実行する処理よりもデータの複写に多くの時
間がかかり、データ複写が故障許容性の確保に重要でな
い場合に、一定の条件の下で複数プロセス間においてデ
ータを効率的に送受信する新たなシステムを提供する。【解決手段】並列処理、フォールトトレラント型のコ
ンピュータシステムであって、データは２つの方法によ
り単一ＣＰＵ内の複数のプロセス間を伝送される。第１
の方法において、データは伝送の度に複写される。第２
の方法において、データは複写されず、共用メモリ待ち
行列システムを介して伝送される。第１の方法は故障許
容性及び線形拡張性を確保するのに用いられる。第２の
方法はプロセス間通信に要する時間を最短化する。共用
メモリ待ち行列システムの使用により、同一ＣＰＵで実
行するプロセスの垂直及び水平モジュール性が増大す
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、オペレーティング
システムに関し、特に、データ処理システムの信頼性や
効率を実質的に低下させることなく該オペレーティング
システムのモジュール性を高める方法に関する。

【０００２】

【従来の技術】従来の多重プロセッサコンピュータ及び
大量並列処理（ＭＰＰ）コンピュータは、同一の命令を
実行する、或は異なる命令を実行する多数のＣＰＵを含
む。一定の状況下で、複数のプロセッサ間を伝送される
データは、１個のプロセッサから他のプロセッサに伝送
される際に複写される。例えば従来のフォールトトレラ
ント（Fault Tlerant：故障許容）型コンピュータにお
いて、データは、故障許容性、線形拡張性及び大量並列
処理能力を達成するためＣＰＵ間でバックアップされ、
チェックポイントされる。従って、フォールトトレラン
ト型コンピュータにおいて、データはＣＰＵ間で複写さ
れ、１個のＣＰＵが故障した際、最小のデータ損で、或
はデータ損なしで、別のＣＰＵで継続処理される。プロ
セッサレベルでのこのようなデータ複写は、システムの
頑強性を確保するのに用いる場合は極めて望ましい。し
かし、データ複写はシステムの動作を遅くする。

【０００３】いくつかの従来システムにおいて、データ
は、データを１のプロセスから物理的に複写して他のプ
ロセスに送るメッセージシステムによってソフトウエア
プロセス間を伝送される。該他のプロセスは同一のＣＰ
Ｕ或は異なるＣＰＵで実行される。該メッセージングシ
ステムは、各メッセージを物理的に複写して受信側プロ
セスに１つずつ送信する。

【０００４】複写したデータを例えばプロセッサ間のチ
ェックポイントどりに用いる場合、データを物理的に複
写することが望ましい。しかし、他の場合にあっては、
データは、複数のプロセス間を伝送されてそれらのプロ
セスを相互に通信可能にするだけである。この場合にお
いて、それらのプロセスが同一ＣＰＵ内に存するとき
は、データを物理的に複写する必要はない。その時、受
信側プロセスがデータを実際に処理するよりも、プロセ
ス間でデータを複写して伝送するのに多くの時間がかか
る。同一ＣＰＵで実行するプロセス間でデータ伝送する
際、プロセス間を伝送されるデータを複写することは効
率的でない。

【０００５】伝統的に、フォールトトレラント型コンピ
ュータは、いかなる条件下においてもプロセス若しくは
ＣＰＵによるメモリの共用を許容しない。複数のＣＰＵ
が共用するメモリは、１個のＣＰＵがメモリへのアクセ
スを終了するまで他のＣＰＵは待たなければならないた
め、障害となりやすい。さらに、メモリを複数ののＣＰ
Ｕで共用していて１個のＣＰＵが故障した場合、他のＣ
ＰＵに対して非破壊メモリスペースを確保することがで
きない。従って、プロセスレベルでのデータの保全性を
確保するため、プロセス間でメッセージを複写すること
が従来から行われている。

【０００６】一方、データを複写することによってその
データを複数のプロセスに伝送するに時間がかかる。実
行時間を短縮するため、プログラマは、いくつかの機能
を小さなプロセスに分割する代りに、これらの機能を包
含する大きなプロセスを書く傾向がある。より少ない数
の大きいプロセスを書くことにより、プログラマはプロ
セス間のデータ複写による時間遅延を避けようとする。
しかし、大プロセスは、小プロセスよりも書くこと並び
にメンテナンスが難しい。

【０００７】

【発明が解決しようとする課題】本発明は、実行する処
理よりもデータの複写に多くの時間がかかり、データ複
写が故障許容性の確保に決定的でない場合に、一定の条
件の下で複数プロセス間でデータを効率的に送受信する
新たなシステムを提供することを目的とする。

【０００８】

【課題を解決するための手段】上記目的を達成するた
め、この発明は、少なくとも第１及び第２のプロセッサ
を有するデータ処理システムにおいてプロセス間でデー
タを伝送する方法であって、前記第１プロセッサによっ
て実行される第１プロセスと第２プロセスの間で実行さ
れる機能を分割するステップと、共用メモリ部内に前記
第２プロセスのための入力待ち行列を作成するステップ
と、伝送するデータを指示するポインタを前記第２プロ
セスの前記入力待ち行列内に前記第１プロセスによって
格納するステップと、前記第２プロセスの前記入力待ち
行列に格納された前記ポインタが指示するデータを前記
第２プロセスによって消費するステップと、前記データ
処理システム内の故障許容性を確保するために前記第１
プロセッサから前記第２プロセッサへのデータをチェッ
クポイントするステップであって、チェックポイントす
る際に該データを複写するものとを具備し、これらのス
テップが前記データ処理システムによって実行されるも
のである。

【０００９】また、この発明は、少なくとも第１及び第
２のプロセッサを有するデータ処理システムにおいて第
１プロセスとデバイスドライバとの間でデータを伝送す
る方法であって、共用メモリ部内に前記デバイスドライ
バのための入力待ち行列を作成するステップと、伝送さ
れるデータを指示するポインタを前記デバイスドライバ
の前記入力待ち行列内に前記第１プロセスによって格納
するステップと、前記デバイスドライバの前記入力待ち
行列に格納された前記ポインタが指示するデータを前記
デバイスドライバによって消費するステップと、前記デ
ータ処理システム内の故障許容性を確保するために前記
第１プロセッサから前記第２プロセッサへのデータをチ
ェックポイントするステップであって、チェックポイン
トする際に該データを複写するものとを具備し、これら
のステップが前記データ処理システムによって実行され
るものである。

【００１０】さらに、この発明は、少なくとも第１及び
第２のプロセッサを有するデータ処理システムにおいて
プロセス間でデータを伝送する方法であって、前記第１
プロセッサによって実行される第１及び第２のプロセス
に、同レベルの２つの機能を割当てるステップと、前記
第１プロセッサによって実行されるとともに、前記第１
及び第２プロセスの機能よりも低いレベルの機能を実行
する前記第３プロセスのための入力待ち行列を共用メモ
リ部に作成するステップと、伝送されるデータを指示す
るポインタを前記第３プロセスの前記入力待ち行列内に
前記第１プロセスによって格納するステップと、前記第
３プロセスの前記入力待ち行列に格納された前記ポイン
タが指示するデータを前記第３プロセスによって消費す
るステップと、前記データ処理システムの故障許容性を
確保するために前記第１プロセッサから前記第２プロセ
ッサへのデータをチェックポイントするステップであっ
て、チェックポイントする際に該データを複写するもの
とを具備し、これらのステップが前記データ処理システ
ムによって実行されるものである。

【００１１】さらに、この発明は、少なくとも第１及び
第２のプロセッサを有するデータ処理システムにおいて
プロセスとデバイスドライバとの間でデータを伝送する
方法であって、前記第１プロセッサによって実行される
第１及び第２のプロセスに、同レベルの２つの機能を割
当てるステップと、前記第１プロセッサによって実行さ
れるとともに、前記第１及び第２プロセスの機能よりも
低いレベルの機能を実行する前記デバイスドライバのた
めの入力待ち行列を共用メモリ部に作成するステップ
と、伝送されるデータを指示するポインタを前記デバイ
スドライバの前記入力待ち行列内に前記第１プロセスに
よって格納するステップと、前記デバイスドライバの前
記入力待ち行列に格納された前記ポインタが指示するデ
ータを前記デバイスドライバによって消費するステップ
と、前記データ処理システムの故障許容性を確保するた
め前記第１プロセッサから前記第２プロセッサへのデー
タをチェックポイントするステップであつて、チェック
ポイントする際に該データを複写するものとを具備し、
これらのステップが前記データ処理システムによって実
行されるものである。

【００１２】さらに、この発明は、チャンネルハードウ
ェア要素に接続されたデータ処理システムにおいてＯＳ
Ｉ−７層モデルに基づくプロトコルを用いてＬＡＮを通
じてデータを伝送する方法であって、クライアントアプ
リケーションプロセス及びネットワークプロトコルプロ
セスが前記データ処理システムの同一プロセッサによっ
て実行される場合に、伝送すべきデータを前記クライア
ントアプリケーションプロセスから前記ネットワークプ
ロトコルプロセスへ送信するステップと、ネットワーク
デバイスドライバが前記プロセッサで実行され、前記ネ
ットワークプロトコルプロセスの一部である場合に、共
用メモリ部に前記ネットワークデバイスドライバのため
の入力待ち行列を作成するステップと、伝送されるデー
タを指示するポインタを前記デバイスドライバの前記入
力待ち行列内に前記ネットワークプロトコルプロセスに
よって格納するステップと、前記ネットワークデバイス
ドライバの前記入力待ち行列に格納された前記ポインタ
が指示するデータを前記ネットワークデバイスドライバ
によって消費するステップと、前記ネットワークデバイ
スドライバを介して前記データを前記チャンネルハード
ウェア要素に送信するステップとを具備し、これらのス
テップが前記データ処理システムによって実行されるも
のである。

【００１３】本発明は、故障許容性メッセージベースの
オペレーティングシステムにおけるオペレーティングシ
ステムのモジュール性を、その効率及び信頼性に実質的
な影響を与えることなく、向上する方法を提供する。本
発明において、複数のプロセスは異なる２つの方法によ
って相互に通信可能になる。第１の方法において、それ
らのプロセスは、データがプロセス間を伝送される度に
複写されるとき、従来のメッセージシステムを用いて互
いに通信できる。この第１の方法は、伝送されるデータ
の複写が望ましいか、または、少なくとも受入れ可能な
場合、故障許容性、線形拡張性及び並列処理能力に関連
する機能に主に用いられる。第２の方法において、プロ
セスは、メモリ待ち行列システム（しばしば“共用メモ
リ”、“待機Ｉ／Ｏ”或は“ＱＩＯ”と略称される）を
用いることにより相互に通信することができる。この方
法は、主に、サーバ処理、ＬＡＮプロトコル処理及び同
一プロセッサ上で実行するプロセス間のデータ伝送に用
いられる。

【００１４】共用メモリ待ち行列システムは、同一プロ
セッサ上で実行するプロセスに、データ伝送の度にこれ
を複写することなくそのデータを伝送することを許容す
る。このプロセス間速度の増大は、プロセスの小機能モ
ジュールへの分割を可能とする。プロセスモジュール性
を“垂直方向”とすることができる。例えば、単一の大
プロセスをデータのプロセス間の伝送によって失われる
時間損失を最少としながらいくつかの小プロセスに分割
することができる。また、プロセスモジュール性を“水
平方向”にすることもできる。例えば、各種のクライア
ントプロセスは、共用メモリ待ち行列システムを介して
１個のサーバプロセスにアクセスすることができる。

【００１５】

【発明の実施の形態】図１は、共用メモリ待ち行列シス
テムを包含するフォールトトレラント型、並列データ処
理システム１００のブロック図である。図１は、ローカ
ルエリアネットワーク（ＬＡＮ）１０５によって接続さ
れたノード１０２及びワークステーション１０４を含
む。ノード１０２は、プロセス間バス（ＩＰＢ）１０９
を介して接続されたプロセッサ１０６及びプロセッサ１
０８を含む。プロセス間バス１０９は、当業者に知られ
るタイプの冗長バスである。図１には示されていない
が、システム１００は、フォールトトレラント型、並列
コンピュータシステムであり、そこで少なくとも１つの
プロセッサによってシステム内の他のプロセッサからの
データをチェックポイントする。このようなフォールト
トレラント型システムは、例えばKazmanらに付与された
米国特許No.4,817,091に記載されている。本発明は、そ
の発明思想の範囲から逸脱することなしに広範囲のハー
ドウエアに組込むことができる。

【００１６】図１及び本明細書を通して示される“プロ
セス”は、メモリに記憶されてＣＰＵで実行されるソフ
トウエアプログラム命令として実現するのが好ましい。
同様に、“ドライバ”も、メモリに記憶され、ＣＰＵに
よって実行されるソフトウエアプログラム命令として実
現するのが好ましい。プロセスがプロセッサ或はＣＰＵ
“内”という表現は、プロセスがＣＰＵのメモリに記憶
されていてＣＰＵで実行されることを意味する。

【００１７】プロセッサ１０６は、ＣＰＵ１１０及びメ
モリ１１２を含んでおり、ディスクコントローラ１１４
及びディスクドライバ１１６に接続されている。メモリ
１１２は、ソフトウエアプロセス１２０と、ソフトウエ
アディスクプロセス１２２と、以下で説明するキュー
（queue:待ち行列）１２５を含む共用メモリ部１２４と
を含む。プロセス１２０及び１２２は、ＱＩＯライブラ
リルーチン１２６を介して共用メモリ部１２４にアクセ
スする。共用メモリ部及びＱＩＯライブラリ１２６を用
いて送られるメッセージは、データ複写されずに送信さ
れる。

【００１８】プロセス１２０は、メッセージシステム
（ＭＳ）１２８及びファイルシステム（ＦＳ）１３０を
使用してプロセス間バス１０９と通信可能となってい
る。このメッセージシステム１２８は、例えばTandem P
art No.024507の第６章の“Introduction to Guardian
90 Internal Design”に記載されている。ファイルシス
テム１２８は、例えばTandem Part No.096042の“Guard
ian Programmer'S Guide”、Tandem Part No.026148お
よび026149の第１巻及び第２巻の“System Procedure C
alls Definition Manual”に記載されている。

【００１９】ディスクプロセス１２２は、ソフトウエア
ディスクドライバ１３２及びディスクコントローラ１１
４を介してデータをディスク１１６に送る。ノード１０
２は、ＬＡＮコントローラ１４０を介してＬＡＮ１０５
に接続されている。ノード１０２のプロセッサ１０８
は、ＣＰＵ１４２及びメモリ１４４を含む。メモリ１４
４は、ＱＩＯライブラリルーチン１５２を使用し共用メ
モリ部を介して通信するＴＣＰ／ＩＰプロセス１４６及
びＮＦＳディストリビュータプロセス１４８を含む。後
述するが、共用メモリ部１５０は、複数の待ち行列１５
１を含む。

【００２０】ＴＣＰ／ＩＰプロセス１４６は、上述のご
とく、メッセージシステム１５４及びファイルシステム
１５６を介してプロセス間バス１０９に接続されてい
る。ＴＣＰ／ＩＰプロセス１４６は、ＱＩＯライブラリ
１５２を経由しソフトウエアＬＡＮドライバ１５８を介
してＬＡＮコントローラ１４０と通信する。共用メモリ
部１５０を用いる通信においてデータ複写は行われない
が、メッセージシステム１５４及びファイルシステム１
５６を使用する通信ではデータ複写が行われる。図１に
示されていないが、本発明は、単一プロセッサ内の複数
プロセス間の通信を実現するためメッセージシステム１
５４及びファイルシステム１５６を使うように設計して
もよい。例えば、プロセス１２０は、ファイル及びメッ
セージシステムを用いてディスクプロセス１２２と通信
できるようにしてもよい。

【００２１】このように、図１は、プロセス１２０、１
２２間及びプロセス１４６、１４８間の通信に使用する
共用メモリ待ち行列システムを示す。また、図１は、共
用メモリ待ち行列システムを用いた、プロセス１４６と
ＬＡＮドライバ１５８との間の通信をも示している。

【００２２】図２は、図１のプロセッサ１０６のブロッ
ク図である。図２は、４種類のプロセス、即ち、複数の
ＯＤＢＣサーバプロセス２１４、複数のディスクプロセ
ス１２２、複数のオブジェクトサーバプロセス２１８及
びＤＯＭＳディストリビュータプロセス２２０を示す。
“ＯＤＢＣ”は、“オープンデータベース連結性（Open
Database Connectivity）”を意味する。ＯＤＢＣは、
マイクロソフト社（Microsoft Corp.）によって提供さ
れる遠隔ＳＱＬデータベースアクセスのための基準に適
合するデータベースクライアント／サーバ法である。
“ＤＯＭＳ”は、“分散オブジェクト管理システム（Di
stributed Object Management System）”を表し、ＣＯ
ＲＢＡを受容する分散オブジェクトマネジメントサーバ
である。プロセス２１４、１２２、２１８及び２２０
は、それぞれ対応するメッセージシステム２３０、ファ
イルシステム２３２、ＱＩＯソケットライブラリ２３４
及びＱＩＯライブラリ２３６を有する（ライブラリ２３
４及び２３６は図１のライブラリ１２６のサブセットで
ある）。ライブラリ２３４及び２３６の内容例が本発明
の理解に必要となる場合は、出願人は１９９４年７月２
０日発行の“QIQ Library Interface Specification”
（以下、参考文献Ａという）及び１９９４年８月２２日
発行の“ES for NonStop IPX/SPX”（以下、参考文献Ｂ
という）を提出する用意がある。

【００２３】図２は、メッセージデータの複写を伴う、
プロセス間でメッセージを伝送する第１の方法を示す。
図２のメッセージ２６０は、ディスクプロセス１２２を
介しメッセージシステム２３０を経由してプロセッサ１
０８のプロセスからプロセス間バス１０９に受信され
る。この種のメッセージは、単一プロセッサ内のいずれ
のプロセス間にも送信することができる。例えば、プロ
セスはいずれのプロセッサ上にも存在できるようにする
ことが望ましい。その場合、プロセスは、他のプロセッ
サ内のプロセス及び同一プロセッサ内のプロセスの両方
からメッセージを受信できなければならず、また、メッ
セージシステム２３０を介してメッセージを送受信しな
ければならない。

【００２４】また、図２は、プロセス間でメッセージを
送信する第２の方法を示し、この方法においてメッセー
ジは共用メモリ待ち行列システムを介して送信される。
図２において、プロセス２１４は、他のプロセス（例え
ばプロセス１２２）からのメッセージ２７０を保持する
対応の待ち行列２４０を有する。このような待ち行列の
詳細は、後段で図９乃至図１１に関連して説明する。プ
ロセス２１４、２１８及び２２０の各々は、対応の入力
待ち行列を有する。プロセス１２２は、他のプロセスか
ら送信されるメッセージ２７２を保持する対応のコマン
ド待ち行列２５０を有する。

【００２５】図３は、図１のプロセッサ１０８を示すブ
ロック図である。図３は、５個のプロセス、即ち、ＯＤ
ＢＣディストリビュータプロセス３１４、ＮＦＳディス
トリビュータプロセス３１６、ＦＴＰサーバプロセス３
１８、ＤＯＭＳディストリビュータプロセス３２０及び
ＴＣＰ／ＩＰプロトコルプロセス１４６を示す。“ＮＦ
Ｓ”は、サン・マイクロシステムズ社（Sun Microsyste
ms, Inc.）の遠隔ファイルサーバ基準である“ネットワ
ークファイルシステム（Netwprk File System）”を表
わす。ＦＴＰは、コンピュータシステム間のデータ伝送
に使用する通信プロトコルである“ファイル伝送プロト
コル”を指す。“ＴＣＰ／ＩＰ”は、ノード間の通信に
用いる通信プロトコルである“伝送制御プロトコル／イ
ンターネットプロトコル”を表わす。

【００２６】プロセス３１４、３１６、３１８及び３２
０の各々は、対応するメッセージシステム３３０、ファ
イルシステム３３２、ＱＩＯソケットライブラリ３３４
及びＱＩＯライブラリ３３６を有する（ライブラリ３３
４及び３３６は図１のＱＩＯライブラリ１５２のサブセ
ットである）。共用メモリ１５０にアクセスするのに使
用するライブラリ３３６の中味の例は上記参考文献Ａに
示されており、また、ライブラリ３３４の内容例は上記
参考文献Ｂに示されており、本発明の理解に必要な場合
は、これらの文献の提出が可能である。

【００２７】ＴＣＰ／ＩＰプロトコルプロセス１４６
は、共用メモリ１５０にアクセスするための対応ＱＩＯ
ライブラリ３３６及び３個のＩ／Ｏドライバ３３８を有
する。ドライバ３３８は、図４及び図５に示される態様
で共用メモリ待ち行列システムを用いてＴＣＰ／ＩＰプ
ロセス１４６とも通信する。

【００２８】図３は、メッセージシステム３３０及びフ
ァイルシステム３３２を介して別のプロセッサ内のプロ
セスに送られるメッセージ２６０を示す。具体的に、図
３は、プロセス３１８からプロセス間バス１０９を通っ
て図２に示されるディスクプロセス１２２に送られるメ
ッセージ２６０を示す。このように、メッセージはメッ
セージングシステムを用いてプロセッサ１０６及び１０
８のプロセス間を送信される。メッセージは、メッセー
ジングシステムを用いてプロセッサ１０８内のプロセス
間を送信することもできる。上述したように、メッセー
ジシステム３３０はメッセージを送る際にデータを複写
する。

【００２９】また、図３は、単一プロセッサ内のプロセ
ス間及び単一プロセッサ内のプロセスとドライバとの間
でメッセージを送信する第２の方法を示す。この第２の
方法において、メッセージは共用メモリ待ち行列システ
ムを介して送信される。図３において、プロセス３１４
は、他のプロセス（例えばプロセス１４６）からのメッ
セージ３７０を保持する対応待ち行列３４０を有する。
待ち行列の詳細は、図９乃至図１１に関連して後述す
る。プロセス３１４、３１６、３１８及び３２０の各々
は、対応の入力待ち行列を有する。プロセス１４６は、
たのプロセスによって送信されたメッセージ３７２を保
持する対応コマンド待ち行列３５０を有する。

【００３０】図２及び図３は、共用メモリ待ち行列シス
テムの使用がプロセスの“水平モジュール性”及び“垂
直モジュール性”をどのように高めるかを示す。共用メ
モリ待ち行列システムを使用してプロセッサ又はドライ
バから、或はこれらに、データ送信する際にオーバヘッ
ドが殆どないので、プログラマは、図３及び図４に示さ
れるようなプロセスなどの個別プロセスに機能を簡単に
分解することができる。垂直モジュール性は、プロセス
１２２などの低レベルプロセスと連絡するプロセス２１
４などの高レベルプロセスを包含する。水平モジュール
性は、プロセス１４６などの低レベルプロセスと連絡す
るプロセス３１４、３１６、３１８及び３２０などの複
数のプロセスを包含する。

【００３１】図４及び図５は、共用メモリ待ち行列シス
テムにアクセスするドライバを介してＬＡＮ１０５を通
してメッセージを受信する２つのプロセスの例をそれぞ
れ示している。図４及び図５の各例において、一定のセ
ットアップ機能が予め実行されているものと仮定する。
例えば、各プロセスは、共用メモリ待ち行列システムに
自己“登録”し、モジュールＩＤ（詳しい内容は前出の
上記参考文献Ａ中のＱＩＯライブラリルーチンの“ＳＭ
＿ＭＯＤＵＬＥ＿ＩＤ＿ＣＲＥＡＴＥ”に記載されてい
る）を受けている。これらのプロセスは、共用メモリ待
ち行列システムとの全ての対話に独自のモジュールＩＤ
を使用する。登録時、各プロセスは、共用メモリの何パ
ーセントを消費してよいかを定義するオプションを有す
る。好適実施例において、プロセスは、デフォルトとし
て共用メモリを１００％まで消費できる。また、各プロ
セスは、共用メモリ待ち行列システムに“プールスペー
ス”を要求する。プールスペースは、制御バッファなど
のデータ構造を割当てるプロセスの“専用”スペースと
して使用する。

【００３２】各プロセスは、例えば上記参考文献Ａに示
されたようなＳＭ＿ＤＲ＿ＲＥＧＩＳＴＥＲルーチン呼
出しによってＬＡＮドライバ１５８にも自己登録する。
このルーチンは、プロセスを指定ＬＡＮ及び指定ポート
に登録する。また、このルーチンは、共用メモリ内にプ
ロセスのための入力待ち行列及び出力待ち行列を作成す
ると共に、作成された各待ち行列の待ち行列ＩＤをプロ
セスに戻す。従って、図４において、ＴＣＰ／ＩＰプロ
セス４０２は、入力及び出力ＡＲＰ待ち行列と、入力及
び出力ＩＰ待ち行列を得るため２回登録する。入力待ち
行列は、ＬＡＮ１０５からメッセージを受信するのに用
いられる。図２及び図３に関連して前述したように、プ
ロセスは、例えば他のプロセス及び／又は他のドライバ
と通信するため他の入力及び出力待ち行列を有していて
もよい。これらの待ち行列は、上記参考文献ＡのＳＭ＿
Ｑ＿ＣＲＥＡＴＥを用いて作成される。出力待ち行列
は、ＬＡＮ１０５に送られるデータメッセージ記述子を
保持するのに用いられる。ドライバ／割り込み処理ルー
チン（割り込みハンドラ）１５８は、入力メッセージを
正しい入力待ち行列への経路にセットするのに用いるメ
モリに格納されたテーブルを維持する。ここでクライア
ントプロセスによるその入力待ち行列からのメッセージ
取り出しが可能となる。

【００３３】図４は、ＴＣＰ／ＩＰプロセス４０２及び
ＴＬＡＭＩＯＰ（Tandem LAN Access Method I/O Pro
cess）４０４の各々が、共用メッセージ待ち行列システ
ムを介してどのようにＬＡＮ１０５からメッセージを受
け取るかを示す。ＴＣＰ／ＩＰプロセス４０２は、周知
のＴＣＰ／ＩＰプロトコルを使用するとともに、ＩＰ及
びＡＲＰの両メッセージを受信する。従って、ＴＣＰ／
ＩＰプロセス４０２は、２つの入力待ち行列及び２つの
出力待ち行列を有する。ＴＬＡＭＩＯＰ４０４は、
工業規格インターフェイスを用いてＬＡＮにアクセスす
る。ＴＬＡＭＩＯＰ４０４は、ＩＥＥＥ８０２．２論
理リンク制御基準に準拠しており、タイプ１コネクショ
ンレスサービス及びＭＵＬＴＩＬＡＮＮＥＴＢＩＯＳ
プロトコルをサポートする。“ＭＵＬＴＩＬＡＮ”は、
タンデム・コンピュータ社（Tandem Computers, Inc.）
の商標である。従って、ＴＬＡＭＩＯＰ４０４は、各
種のＬＡＮに接続可能である。

【００３４】ドライバ１５８は、ＬＡＮ１０５からメッ
セージを受取る際、正しいプロセスのためそのメッセー
ジを入力待ち行列にセットし、その待ち行列のクリエー
タモジュールＩＤフィールド（図９参照）内で識別され
たプロセスを呼出す。従って、例えば、図４において、
入って来るメッセージは、ＴＬＡＭ入力待ち行列４０
８、入力ＩＰ待ち行列４１４、或は、入力ＡＲＰ待ち行
列４１６のいずれかにセットすればよい。ドライバ／イ
ンタラプトハンドラ１５８はメモリに格納されたテーブ
ルを参照し、入ってくるメッセージがの内容に応じてそ
のメッセージをどの待ち行列にセットするか、また、ど
のプロセスを呼出すかを決定する。

【００３５】プロセスは、“ＱＩＯイベント”で呼出さ
れる。ＱＩＯイベントは、コンピュータのオペレーティ
ングシステムを用いて図１２の（ａ）に示されるような
イベントマスクのＱＩＯビットと、プロセスの待ち行列
が非空き状態であることを示すＱＩＯ補助マスク（図１
２の（ｂ）参照）のビットを設定する。事象、即ち、イ
ベントが発生すると、オペレーティングシステムは受信
プロセスを呼出す。つまり、プロセスは待ち状態からレ
ディ（準備完了）状態に移行する。イベントマスク１２
００がセットされたＱＩＯビット１２０２を有する場
合、プロセスはＱＩＯ補助マスク１２０４をチェックす
る。“ＱＵＥＵ＿ＮＯＴ＿ＥＭＰＴＹ”ビット１２０６
がセットされるとき、プロセスは対応の待ち行列からの
データを消費する。（ＱＩＯイベントの例は、１９９４
年７月２０日発行のQIQ Library Interface Specificat
ion中のQIQ Library External Specification（以下、
参考文献Ｃという）に掲載されており、この参考文献Ｃ
は本発明の理解に必要となる場合は提出可能である。）

【００３６】プロセスは、例えば上記参考文献ＡのＳＭ
＿Ｑ＿ＧＥＴ＿ＭＳＧを呼出すことによって入力待ち行
列からメッセージを消費する。このルーチンは、待ち行
列の最上端部からメッセージを得る。ドライバ１５８
は、リターン待ち行列ポインタ１０２２（図１０参照）
がドライバのリターン待ち行列４１０を指示するように
入力待ち行列を設定する。従って、プロセスは、バッフ
ァを再使用すべくドライバ１５８に戻すため、例えば参
考文献ＡのＳＭ＿ＭＤ＿ＲＥＴＵＲＮを単に呼出すだけ
である。

【００３７】図５は、ＴＣＰ／ＩＰプロセス４０２及び
ＴＬＡＭＩＯＰ４０４が共用メッセージ待ち行列シス
テムを介してＬＡＮ１０５にメッセージをどのように送
信するかを示す。メッセージを送信するため、プロセス
は、例えば指定の出力待ち行列のＰＵＴルーチンを呼出
す、参考文献ＡのＳＭ＿Ｑ＿ＰＵＴ＿ＭＳＧを呼出す。
こうして、メッセージが、ドライバによって定義された
出力待ち行列にセットされる。プロセスは、ドライバ１
５８が送信されたメッセージを戻すようにリターン待ち
行列を表示するようにしてもよいが、必ずしもそうする
必要はない。このように、ＴＬＡＭＩＯＰ４０４がＳ
Ｍ＿Ｑ＿ＰＵＴ＿ＭＳＧを呼出すとき、送信されるメッ
セージはＴＬＡＭ出力待ち行列４０６の“ＰＵＴ”ルー
チンを呼出す。同様に、ＴＣＰ／ＩＰ４０２がＡＲＰメ
ッセージのためのＳＭ＿Ｑ＿ＰＵＴ＿ＭＳＧを呼出すと
き、送信されるメッセージは出力ＡＲＰ待ち行列４１８
の“ＰＵＴ”ルーチンを呼出す。ＴＣＰ／ＩＰ４０２が
ＩＰメッセージのためのＳＭ＿Ｑ＿ＰＵＴ＿ＭＳＧを呼
出すとき、送信されるメッセージは出力ＩＰ待ち行列４
１２の“ＰＵＴ”ルーチンを呼出す。

【００３８】好適な実施の形態において、ドライバ１５
８は、メッセージを待ち行列にセットしないが、メッセ
ージをＬＡＮ１０５に送ってよいかどうかを調べる。そ
うである場合、ドライバ１５８はメッセージを送信す
る。そうでない場合、ドライバ１５８はメッセージをド
ライバの内部待ち行列にセットする。割り込みが発生す
ると、ドライバ１５８は、待ち行列を作っている出力メ
ッセージがあるかどうかをチェックする。そうである場
合、ドライバはその内部待ち行列からメッセージを取り
出して送信する。メッセージバッファは、待ち行列構造
中にリターン待ち行列が指定されなかった場合、バッフ
ァフリーリストにリターンする。

【００３９】プロセスは、ＬＡＮ１０５から断続したい
ときは、例えば上記参考文献ＡのＳＭ＿ＤＲ＿ＤＥＲＥ
ＧＩＳＴＥＲを呼出す。このルーチンは、プロセスのた
めの入力及び出力待ち行列を取り出し、そのプロセスを
ドライバの内部ルーチンテーブルから削除する。

【００４０】本発明の共用メモリ待ち行列システムは、
システム内のプロセスの内容及び構成を向上させ、ま
た、システム内をデータが移動するデータ伝送の効率を
高める。例えば、本発明は、ＴＣＰ／ＩＰを使いＬＡＮ
を通じてデータを送受信するのに使用するＯＳＩ−７層
通信プロトコルの効率的実行を許容する。以下の図６乃
至図８の説明は、共用メモリ待ち行列システムの使用が
フォールトトレラント型コンピュータシステムにおける
ＯＳＩの実行速度及び効率をどのように高めるかを示
す。

【００４１】図６は、共用メモリ待ち行列を含まないシ
ステム内でイーサネット（Ｅｔｈｅｒｎｅｔ／Ｅｎｅ
ｔ）ＬＡＮ６３９とアプリケーションプロセス６０２と
の間のデータ伝送に用いるデータパスを示す。クライア
ントアプリケーションプロセス６０２は、ソケットライ
ブラリ６０４、ファイルシステム６０６及びメッセージ
システム６０８を含む。メッセージシステム６０８は、
同一プロセッサ内にあっても、別のプロセッサ内にあっ
てもよいＴＣＰ／ＩＰプロトコルプロセス６１２にデー
タを送信する。同一プロセッサへの送信は、データを複
写してＴＣＰ／ＩＰプロセス６１２のメッセージシステ
ム６１４に送信することによって実現される。別のプロ
セッサへの送信は、データを複写し、ＴＣＰ／ＩＰプロ
セス６１２に送られる前に再びデータが複写されるプロ
セス間バス１０９（図１参照）を通じて送信することに
よって実現される。

【００４２】ＴＣＰ／ＩＰプロセス６１２は、メッセー
ジシステム６１４、ファイルシステム６１６及びＴＣＰ
／ＩＰプロトコル手続き６１８を含む。メッセージシス
テム６１４及びファイルシステム６１６は、これらがプ
ロセス６１２への入力とプロセス６２６からの出力の両
方に使用されることを示すため２回図示されている。メ
ッセージシステム６２６は、同一プロセッサ内にあって
も、別のプロセッサ内にあってもよいＴＬＡＭＩ／Ｏ
プロセス６２６にデータを送信する。同一プロセッサへ
の伝送は、データを複写し、ＴＬＡＭＩ／Ｏプロセス
６２６のメッセージシステム６２８に伝送することによ
って実現される。別のプロセッサへの伝送は、データを
複写し、ＴＬＡＭＩ／Ｏプロセス６２６に送られる前
に再びデータの複写が行なわれるプロセス間バス１０９
を通じて伝送される。

【００４３】ＴＬＡＭＩ／Ｏプロセス６２６は、メッ
セージシステム６２８、ＴＬＡＭ手続き６３０、３６１
３ドライバ６３２及びカーネルＩ／Ｏドライバ６３４を
含む。ドライバ６３４は、イーサネットコントローラ６
３８にデータを伝送するチャンネルハードウエア６３６
にデータを送る。イーサネットコントローラ６３８は、
データをＬＡＮ６３９に送信する。図６のデータパスの
欠点は、メッセージシステムを介して、例えば６４０、
６５０で、データを伝送の度に少なくとも１回は複写し
なければならないことである。

【００４４】図７は、メッセージシステム及び共用メモ
リ待ち行列システムの両方を含む本発明の第１実施例に
おけるＬＡＮ６３９とアプリケーションプロセス７０２
との間のデータ伝送用データパスを示す。クライアント
アプリケーションプロセス７０２は、ソケットライブラ
リ７０４、ファイルシステム７０６及びメッセージシス
テム７０８を含む。メッセージシステム７０８は、同一
プロセッサ内にあっても、別のプロセッサ内にあっても
かまわないＴＣＰ／ＩＰプロトコルプロセス７１２へ、
或はこれから、データを送信或は受信する。同一プロセ
ッサへの送信は、データを複写してＴＣＰ／ＩＰプロセ
ス７１２のメッセージシステム７１４に伝送することに
よって実現する。別のプロセッサへの送信は、データを
複写し、プロセス間バス１０９を通じて伝送することに
よって達成され、データは後者においてプロセスに送ら
れる前に再度複写される。

【００４５】ＴＣＰ／ＩＰプロセス７１２は、メッセー
ジシステム７１４及びＴＣＰ／ＩＰプロトコル手続き７
１８を含む。メッセージシステム７１４は、プロセス７
０２からのデータの送受信に用いられる。図７におい
て、データ図５及び図６に示される要領でＴＣＰ／ＩＰ
プロセス７１２からドライバ７４２へ送受信される。従
って、本発明において、データがメッセージシステムを
通る回数は少なくなり、伝送時にデータが（７５０で示
す地点で）複写される回数は少なくなり、この結果、Ｌ
ＡＮからのデータ送受信時の処理が効率的となり、時間
の節約となる。

【００４６】図８は、本発明の第２実施例におけるＬＡ
Ｎ６３９とアプリケーションプロセス８０２との間のデ
ータ伝送のためのデータパスを示す。クライアントアプ
リケーションプロセス８０２は、特殊ソケットライブラ
リ８５０及びＱＩＯライブラリ８４０を含む。プロセス
８０２は、ソケットライブラリ及びＱＩＯライブラリを
介してデータの待ち行列を作成する。共用メモリ待ち行
列システムを介してデータを受信するため、ＴＣＰ／Ｉ
Ｐプロセス８１２は、プロセス８０２と同じプロセッサ
内になければならない。別のプロセッサへの、或は、こ
れからの伝送は、データを複写し、図１（図８には示さ
ず）のメッセージシステムを介しプロセス間バス１０９
を通じて伝送することによって実現する。同一プロセッ
サ内のプロセス間の伝送は、一般に、共用メモリ待ち行
列システムを介して実現する。

【００４７】ＴＣＰ／ＩＰプロセス８１２は、そのＱＩ
Ｏライブラリ８４０のルーチンを介して待ち行列システ
ムからメッセージを取り出す。従って、第２実施例にお
いて、データは、（チェックポイント及びバックアップ
目的などのために）これを複写するのが望ましい時及び
／又はデータがプロセス間バス１０９に送られる時だけ
メッセージシステムを通過する。この減少されたデータ
複写は、（例えば、ＬＡＮを通じて大量のデータを送受
信するネットワークマルチメディアアプリケーションな
どの）メッセージ送受信する単一プロセッサ内のプロセ
ス間通信の実行効率を上げ、多大の時間節約をもたら
す。

【００４８】図９は、共用メモリ部１２４、１５０内の
待ち行列のフォーマット９００を示す。例えば図２の待
ち行列２４０は、図９のフォーマットを有する。待ち行
列は、記述子タイプ９０１、人間が読取り可能な待ち行
列名９０２、最初のメッセージ記述子（ＭＤ）ポインタ
９０４、最終のメッセージ記述子ポインタ９０６、メッ
セージ記述子カウント９０８、待ち行列属性９１０、ク
リエータモジュールＩＤ９１２、ユーザ定義“ＧＥＴ＿
Ｑ”機能９４０を指示するポインタ９１４、ユーザ定義
された“ＰＵＴ＿Ｑ”機能９５０を指示するポインタ９
１６及びユーザ定義された制御ブロック９６０を指示す
るポインタ９１８を含む。

【００４９】記述子タイプ９０１は、このデータ構造が
待ち行列であることを表わす。待ち行列名９０２は、
“ＯＤＢＣＤＩＳＴＩＮＱ”などの待ち行列名であ
る。第１メッセージ記述子（ＭＤ）ポインタ９０４は、
二重にリンクされたメッセージリスト９２０内の第１メ
ッセージの第１メッセージ記述子９２２を指示する。最
終メッセージ記述子ポインタ９０６は、二重リンクリス
ト９２０の最終のメッセージの最初のメッセージ記述子
９２４を指示する。メッセージのフォーマットは、図１
０及び図１１に関連して以下で説明する。

【００５０】メッセージ記述子カウント９０８は、二重
リンクリスト９２０のメッセージの数を保持する。待ち
行列属性９１０は、例えばデータが入力待ち行列にセッ
トされた（ＰＵＴ）時にプロセスを呼出すべきかどうか
などの待ち行列の属性を含む。クリエータモジュールＩ
Ｄ９１２は、待ち行列を作成したモジュール（又はプロ
セス）のＩＤである。共用メモリシステムは、通常、待
ち行列が非空き状態になったときはいつでもこのプロセ
スを呼出す（図４及び図５参照）。ポインタ９１４は、
ユーザ定義“ＧＥＴ＿Ｑ”機能を指示する。ＧＥＴ＿Ｑ
機能は、待ち行列から情報を得るためＧＥＴ機能が実行
されたときに常に実行される機能である。これは、ＱＩ
Ｏライブラリの標準“ＧＥＴ”機能に加えて、或はその
代りに、ユーザ定義機能の実行を許容する。例えば、待
ち行列がＩ／Ｏドライバのための入力待ち行列である場
合、ユーザ定義ＧＥＴ機能がドライバを介してＩ／Ｏ動
作を開始させてもよい。ドライバは、いくつかの未決定
のＩ／Ｏを追跡してもよく、ＧＥＴ（又はＰＵＴ）が実
行される際に常にその数を調節してもよい。別の例とし
て、ＧＥＴは、待ち行列を作成したプロセスを介してハ
ウスキーピングルーチンを実行するようにしてもよい。

【００５１】ポインタ９１６は、情報を待ち行列にセッ
トするためにＰＵＴ機能が実行されるとき常に実行され
るユーザ定義“ＰＵＴ＿Ｑ”機能を指示する。標準“Ｐ
ＵＴ”機能に加えて、或はその代りに、ユーザ定義機能
の実行を許容する。例えば、ＬＡＮドライバに関連する
待ち行列において、ＰＵＴ＿Ｑ機能は、トランスポート
層ルーチンをしてＬＡＮ１０５に情報を出力せしめるよ
うにしてもよい。ポインタ９１８は、ユーザ定義制御ブ
ロック９６０を指示する。このブロックは、しばしばＰ
ＵＴ＿Ｑ及びＧＥＴ＿Ｑ機能の一方又は両方が必要とす
る制御ブロックである。例えば、この制御ブロックは、
待ち行列システムに情報が送られる際に情報を出力する
ドライバのための制御ブロックであってもよい。

【００５２】図１０は、図９の二重リンクリスト９２０
に格納されたメッセージのフォーマットを示す。メッセ
ージは、リンクされたメッセージ記述子で構成されてい
る。（１つ又はそれ以上のリンクされたメッセージ記述
子で構成された）メッセージは、次いで、図９のリスト
９２０に示されるように一体にリンクされる。図１０
は、メッセージ記述子９２２及び９２２’を示し、これ
らはリンクされたリスト中でポインタ１０１４及び１０
１４’によって合体されてメッセージを形成する。メッ
セージ記述子は、記述子タイプ１００４、次メッセージ
記述子ポインタ１０１０、前メッセージ記述子ポインタ
１０１２、継続メッセージ記述子ポインタ１０１４、バ
ッファ記述子（ＢＤ）ポインタ１０１６、ユーザデータ
読出しポインタ１０１８、ユーザデータ書込みポインタ
１０２０及びリターン待ち行列ポインタ１０２２を含
む。

【００５３】図１０において、メッセージ記述子９２２
及び９２２’は単一メッセージを形成する。記述子タイ
プ１００４は記述子がメッセージ記述子であることを示
す。次メッセージ記述子ポインタ１０１０は、二重リン
クされたリスト９２０に格納された次メッセージの最初
のメッセージ記述子を指示する。前メッセージ記述子ポ
インタ１０１２は、二重リンクされたリスト９２０に格
納された前メッセージの最初のメッセージ記述子を指示
する。継続メッセージ記述子ポインタ１０１４は、現行
メッセージの次メッセージ記述子を指示する。分散デー
タは、複数メッセージ記述子を必要とし、単一メッセー
ジは、異なるバッファロケーションのデータを指示する
複数メッセージ記述子で構成すればよい。バッファ記述
子（ＢＤ）ポインタ１０１６は、以下で図１１に関連し
て詳細に説明するバッファ記述子１０３０を指示する。
バッファ記述子１０３０はデータバッファ１０４０を指
示する。

【００５４】ユーザデータ読み出しポインタ１０１８
は、読み出しが開始される（又は停止した）データバッ
ファ１０４０内の位置１０４４を表示するバッファ１０
４０に対するポインタである。ユーザデータ書込みポイ
ンタ１０２０は、書込みが開始される（又は停止した）
データバッファ１０４０内の位置１０４６を表示するバ
ッファ１０４０を指示するポインタである。リターン待
ち行列ポインタ１０２２は、リターン待ち行列を指示す
る。メッセージが共用メモリ待ち行列システムを介して
戻された際（つまり、メッセージの処理が完了した
際）、戻されたメッセージは、リターン待ち行列が特定
されるとリターン待ち行列にセットされる。例えば、現
在のプロセスは送信されたメッセージの数をカウントす
る必要がある。メッセージは、待ち行列から取り出され
る際に“フリーメモリプール”に入れる代りに、現行プ
ロセスによる更なる処理のためリターン待ち行列にセッ
トされる。メッセージ中の他のメッセージ記述子は、第
２のリターン待ち行列ポインタ１０２２’を有していて
も、全く有していなくてもよい。これらの第２のリター
ン待ち行列ポインタは、主リターン待ち行列と関連する
個別のプロセスで処理される。

【００５５】図１１は、図１０のメッセージの一部であ
るバッファ記述子１０３０のフォーマットを示す。バッ
ファ記述子１０３０は、記述子タイプ１１０２、データ
バッファベースポインタ１１０８、データバッファリミ
ットポインタ１１１０及びデータバッファ長１１１２を
含む。記述子タイプ１１０２は、記述子がバッファ記述
子であることを示す。データバッファベースポインタ１
１０８は、メモリ中のデータバッファ１１４０のベース
を指示する。データバッファリミットポインタ１１１０
は、データバッファ１１４０の端部を指示する。データ
バッファ長１１０８は、データバッファ１０４０の長さ
である。

【００５６】前述したように、本発明は、プロセスの垂
直及び水平モジュール性の向上を実現する。図１３の
（ａ）及び（ｂ）は、本発明によって達成される垂直モ
ジュール性の例を示す。図１３の（ａ）は、共用メモリ
待ち行列システム（ＱＩＯ）を用いてＴＣＰ／ＩＰプロ
セス１４６と通信する図３のＮＦＳディストリビュータ
プロセス３１６の１例を示す。ＴＣＰ／ＩＰプロセス１
４６は、共用メモリ待ち行列システムを用いてドライバ
／割込みハンドラ３３８（例えば図１のＬＡＮドライバ
１５８）の１つと通信する。上述のように、ＱＩＯを介
する通信は、これらのプロセスの各々を別々のプロセス
として実行すること及びデータ複写によって時間を失う
ことなく他のプロセスと通信することを許容する。この
ようなプロセスの垂直方向の分割は、モジュール性を改
善し、プロセスのメンテナンスを容易にする。図１３の
（ｂ）は、図２のディスクプロセス１２２とＯＤＢＣサ
ーバプロセス２１４との間の垂直モジュール性を示す。
同じように、共用メモリ待ち行列システムの使用は、プ
ロセス間を通るデータを複写することで時間をロスする
ことなくそれらのプロセスを別個に実行することを許容
する。垂直モジュール性のその他の例が図示されてお
り、これら以外にも上記の説明から当業者が想到できる
ものがある。

【００５８】図１４の（ａ）、（ｂ）及び（ｃ）は、本
発明によって達成される水平モジュール性の例を示す。
図１４の（ａ）は、図１のＴＣＰ／ＩＰプロトコルプロ
セス１４６、ＩＰＸ／ＳＰＸプロセス１３０２及びＴＬ
ＡＭプロセス４０４を示す。これらのプロセスの各々
は、異なる通信プロトコルを実行し、共用メモリ待ち行
列システムを使用してＬＡＮドライバ１５８と通信する
（図４及び図５参照）。本発明の好適実施例において、
ＬＡＮドライバ１５８は、それ自体は別個のプロセスで
はないが、ＱＩＯライブラリ１５２にアクセスでき、従
って共用メモリ待ち行列システムにアクセス可能であ
る。

【００５９】図１４の（ｂ）は、共用メモリ待ち行列シ
ステムを用いてＩＰＸ／ＳＰＸプロセス１３０２又はＴ
ＣＰ／ＩＰプロセス１４６にアクセス可能なＯＤＢＣデ
ィストリビュータプロセス３１４の例を示す。ＱＩＯの
使用は、プロセスの別個の書込み及び維持を容易にす
る。更に、プロセス間を伝送されるデータを複写するこ
とにより時間を無駄にすることがない。

【００６０】図１４の（ｃ）は、ＦＴＰサーバプロセス
３１８、ＮＦＳディストリビュータプロセス３１６及び
ＯＤＢＣディストリビュータプロセス３１４を示し、こ
れらの各々は、共用メモリ待ち行列システムを介してＴ
ＣＰ／ＩＰプロセス１４６にアクセスできる。共用メモ
リ待ち行列システムの使用は、モジュール性を高め、プ
ロセスの維持を容易にするとともに、データを複写する
ことなくプロセス間を廻すことを可能とし、従ってシス
テムの実行速度が高まる。水平モジュール性の他の例が
図示されており、これら以外にも上記の説明から当業者
が想到できるものがある。以上説明した実施例において
は、本発明の様々な観点に従う実施例を実施するために
使用した数多くの特殊な技術が、発明を記述した、より
多くの一般的用語に関連づけられ、特定されている。し
かし、請求された発明の範囲は、そのような特殊なもの
にのみ限定されるものではないことは勿論である。

【００６１】

【発明の効果】以上のように、この発明は、共用メモリ
待ち行列システムの使用により、単一プロセッサ内の複
数プロセス間の通信速度を高め、システム全体の処理速
度を高める、という優れた効果を奏する。また、共用メ
モリ待ち行列システムの使用により、プロセスを定義す
る際にプログラマが垂直モジュール性及び水平モジュー
ル性の実行から解放される。このように垂直及び水平モ
ジュール性が高められる結果、プロセス間及びプロセス
とドライバとの間のデータ伝送が効率的となる一方、プ
ロセスのメンテナンスが容易になる。更に、説明した実
施例は、伝送の間にデータが複写されるメッセージシス
テムを含む。このような複写作用は、例えば故障許容性
を確実とするため望ましいものである。プロセッサ間で
メッセージを複写することによって遅くなる実行速度
は、プロセッサ間伝送にチェックポイントすることによ
って得られる追加の信頼性が故、受入れ可能なものであ
る。

【図面の簡単な説明】

【図１】共用メモリ待ち行列システムを包含するフォー
ルトトレラント型、並列データ処理システムを示すブロ
ック図である。

【図２】図１の第１のプロセッサを示すブロック図であ
る。

【図３】図１の第２のプロセッサを示すブロック図であ
る。

【図４】ＴＣＰ／ＩＰプロセス及びＴＬＡＭＩＯＰ
（タンデムＬＡＮアクセス法Ｉ／Ｏプロセス）がそれぞ
れどのようにしてＬＡＮから共用メッセージ待ち行列シ
ステムを介してメッセージを受信するかを示す概略図で
ある。

【図５】ＴＣＰ／ＩＰプロセス及びＴＬＡＭＩＯＰが
それぞれどのようにしてメッセージを共用メッセージ待
ち行列システムを介してＬＡＮに送信するかを示す概略
図である。

【図６】共用メモリ待ち行列システムを含まないシステ
ムのＬＡＮへの、アプリケーションプロセスから出力さ
れたデータのデータパスを示すブロック図である。

【図７】本発明の第１実施例のＬＡＮまでの、アプリケ
ーションプロセスから出力されたデータのデータパスを
示すブロック図である。

【図８】本発明の第２実施例のＬＡＮまでの、アプリケ
ーションプロセスから出力されたデータのデータパスを
示すブロック図ある。

【図９】共用メモリ待ち行列システムの待ち行列のフォ
ーマットを示すブロック図である。

【図１０】図９の待ち行列に格納されたメッセージのフ
ォーマットを示すブロック図である。

【図１１】図１０のメッセージの一部であるバッファ記
述子のフォーマットを示すブロック図である。

【図１２】ＱＩＯイベントの間に共用メモリ待ち行列シ
ステムが使用するマスクの概略図である。

【図１３】本発明によって達成される垂直モジュール性
の例を示すブロック図である。

【図１４】本発明によって達成される水平モジュール性
の例を示すブロック図である。

【符号の説明】

１００データ処理システム１０２ノード１０４ワークステーション１０５ローカルエリアネットワーク（ＬＡＮ）１０６第１のプロセッサ１０８第２のプロセッサ１０９プロセス間バス（ＩＰＢ）１１０ＣＰＵ１１２メモリ１１４ディスクコントローラ１１６ディスクドライブ１２０ソフトウエアプロセス１２２ディスクプロセス１２４共用メモリ部１２５待ち行列１２６ＱＩＯライブラリルーチン１２８メッセージシステム（ＭＳ）１３０ファイルシステム（ＦＳ）

───────────────────────────────────────────────────── フロントページの続き (72)発明者トーマス・エム・クラークアメリカ合衆国 95065 カリフォルニア, サンタクルズ，グラナイト・クリード・ロード 1333

Claims

【特許請求の範囲】

【請求項１】少なくとも第１及び第２のプロセッサを
有するデータ処理システムにおいてプロセス間でデータ
を伝送する方法であって、前記第１プロセッサによって実行される第１プロセスと
第２プロセスの間で実行される機能を分割するステップ
と、共用メモリ部内に前記第２プロセスのための入力待ち行
列を作成するステップと、伝送するデータを指示するポインタを前記第２プロセス
の前記入力待ち行列内に前記第１プロセスによって格納
するステップと、前記第２プロセスの前記入力待ち行列に格納された前記
ポインタが指示するデータを前記第２プロセスによって
消費するステップと、前記データ処理システム内の故障許容性を確保するため
に前記第１プロセッサから前記第２プロセッサへのデー
タをチェックポイントするステップであって、チェック
ポイントする際に該データを複写するものとを具備し、
これらのステップが前記データ処理システムによって実
行されるデータ伝送方法。
【請求項２】前記チェックポイントするステップは、
プロセッサ間バスを通じて前記第２プロセッサに送られ
るデータをチェックポイントするステップを含む請求項
１に記載のデータ伝送方法。
【請求項３】第３のプロセスと第４のプロセスとの間
で実行される第２の機能を分割するステップと、前記第３プロセスと前記第４プロセスとの間でデータを
伝送するステップであって、この伝送の際に該データの
複写を行なうものとを更に含む請求項１に記載のデータ
伝送方法。
【請求項４】前記第３プロセスは前記第１プロセッサ
で実行され、前記第４プロセスは前記第２プロセッサで
実行される請求項３に記載のデータ伝送方法。
【請求項５】前記第３プロセス及び前記第４プロセス
は、両方とも前記第１プロセッサで実行される請求項３
に記載のデータ伝送方法。
【請求項６】前記機能を分割するステップは、前記第
１プロセスと前記第２プロセスとの間で１個の機能を分
割するステップを含み、前記第１プロセスは、前記第２
プロセスよりも高位の前記機能の一部を実行し、もって
垂直モジュール性を促進する請求項１に記載のデータ伝
送方法。
【請求項７】前記機能を分割するステップは、前記第
１プロセスと前記第２プロセスとの間の１個の機能を分
割するステップを含み、前記第１プロセスは、前記第２
プロセスが実行するのと同レベルの前記機能の一部を実
行し、もって水平モジュール性を促進する請求項１に記
載のデータ伝送方法。
【請求項８】前記共用メモリ部内の前記第１プロセス
のための入力待ち行列を作成するステップと、前記第２プロセスを介して前記第１プロセスの前記入力
待ち行列に、伝送されるデータを指示するポインタを格
納するステップと、前記第１プロセスの前記入力待ち行列に格納された前記
ポインタが指示するデータを前記第１プロセスを介して
消費するステップとを更に含む請求項１に記載のデータ
伝送方法。
【請求項９】前記共用メモリ部内のデバイスドライバ
のための入力待ち行列を作成するステップと、前記第２プロセスを介して前記デバイスドライバの前記
入力待ち行列に、伝送されるデータを指示するポインタ
を格納するステップと、前記デバイスドライバの前記入力待ち行列に格納された
前記ポインタが指示するデータを前記デバイスドライバ
を介して消費するステップとを更に含む請求項１に記載
のデータ伝送方法。
【請求項１０】少なくとも第１及び第２のプロセッサ
を有するデータ処理システムにおいて第１プロセスとデ
バイスドライバとの間でデータを伝送する方法であっ
て、共用メモリ部内に前記デバイスドライバのための入力待
ち行列を作成するステップと、伝送されるデータを指示するポインタを前記デバイスド
ライバの前記入力待ち行列内に前記第１プロセスによっ
て格納するステップと、前記デバイスドライバの前記入力待ち行列に格納された
前記ポインタが指示するデータを前記デバイスドライバ
によって消費するステップと、前記データ処理システム内の故障許容性を確保するため
に前記第１プロセッサから前記第２プロセッサへのデー
タをチェックポイントするステップであって、チェック
ポイントする際に該データを複写するものとを具備し、
これらのステップが前記データ処理システムによって実
行されるデータ伝送方法。
【請求項１１】前記共用メモリ部に前記第１プロセス
のための入力待ち行列を作成するステップと、伝送されるデータに指示されるポインタを前記デバイス
ドライバを介して前記第１プロセスの前記入力待ち行列
に格納するステップと、前記第１プロセスの前記入力待ち行列に格納された前記
ポインタが指示するデータを前記第１プロセスを介して
消費するステップとを更に含む請求項１０に記載のデー
タ伝送方法。
【請求項１２】前記第１プロセスと前記デバイスドラ
イバとの間の１個の機能を分割する最初のステップを含
み、前記第１プロセスは、前記デバイスドライバが実行
するものよりも高位の前記機能の一部を実行し、もって
垂直モジュール性を促進する請求項１０に記載のデータ
伝送方法。
【請求項１３】前記共用メモリ部に前記デバイスドラ
イバのための入力待ち行列を作成するステップと、伝送されるデータを指示するポインタを第２プロセスを
介して前記デバイスドライバの前記入力待ち行列内に格
納するステップと、前記デバイスドライバの前記入力待ち行列に格納された
前記ポインタが指示するデータを前記デバイスドライバ
によって消費するステップとを更に含む請求項１０に記
載のデータ伝送方法。
【請求項１４】前記共用メモリ部に第２プロセスのた
めの入力待ち行列を作成するステップと、伝送されるデータを指示するポインタを前記第２プロセ
スの前記入力待ち行列内に前記第１プロセスによって格
納するステップと、前記第２プロセスの前記入力待ち行列に格納された前記
ポインタが指示するデータを前記第２プロセスを介して
消費するステップとを更に含む請求項１０に記載のデー
タ伝送方法。
【請求項１５】少なくとも第１及び第２のプロセッサ
を有するデータ処理システムにおいてプロセス間でデー
タを伝送する方法であって、前記第１プロセッサによって実行される第１及び第２の
プロセスに、同レベルの２つの機能を割当てるステップ
と、前記第１プロセッサによって実行されるとともに、前記
第１及び第２プロセスの機能よりも低いレベルの機能を
実行する前記第３プロセスのための入力待ち行列を共用
メモリ部に作成するステップと、伝送されるデータを指示するポインタを前記第３プロセ
スの前記入力待ち行列内に前記第１プロセスによって格
納するステップと、前記第３プロセスの前記入力待ち行列に格納された前記
ポインタが指示するデータを前記第３プロセスによって
消費するステップと、前記データ処理システムの故障許容性を確保するために
前記第１プロセッサから前記第２プロセッサへのデータ
をチェックポイントするステップであって、チェックポ
イントする際に該データを複写するものとを具備し、こ
れらのステップが前記データ処理システムによって実行
されるデータ伝送方法。
【請求項１６】少なくとも第１及び第２のプロセッサ
を有するデータ処理システムにおいてプロセスとデバイ
スドライバとの間でデータを伝送する方法であって、前記第１プロセッサによって実行される第１及び第２の
プロセスに、同レベルの２つの機能を割当てるステップ
と、前記第１プロセッサによって実行されるとともに、前記
第１及び第２プロセスの機能よりも低いレベルの機能を
実行する前記デバイスドライバのための入力待ち行列を
共用メモリ部に作成するステップと、伝送されるデータを指示するポインタを前記デバイスド
ライバの前記入力待ち行列内に前記第１プロセスによっ
て格納するステップと、前記デバイスドライバの前記入力待ち行列に格納された
前記ポインタが指示するデータを前記デバイスドライバ
によって消費するステップと、前記データ処理システムの故障許容性を確保するため前
記第１プロセッサから前記第２プロセッサへのデータを
チェックポイントするステップであつて、チェックポイ
ントする際に該データを複写するものとを具備し、これ
らのステップが前記データ処理システムによって実行さ
れるデータ伝送方法。
【請求項１７】チャンネルハードウェア要素に接続さ
れたデータ処理システムにおいてＯＳＩ−７層モデルに
基づくプロトコルを用いてＬＡＮを通じてデータを伝送
する方法であって、クライアントアプリケーションプロセス及びネットワー
クプロトコルプロセスが前記データ処理システムの同一
プロセッサによって実行される場合に、伝送すべきデー
タを前記クライアントアプリケーションプロセスから前
記ネットワークプロトコルプロセスへ送信するステップ
と、ネットワークデバイスドライバが前記プロセッサで実行
され、前記ネットワークプロトコルプロセスの一部であ
る場合に、共用メモリ部に前記ネットワークデバイスド
ライバのための入力待ち行列を作成するステップと、伝送されるデータを指示するポインタを前記デバイスド
ライバの前記入力待ち行列内に前記ネットワークプロト
コルプロセスによって格納するステップと、前記ネットワークデバイスドライバの前記入力待ち行列
に格納された前記ポインタが指示するデータを前記ネッ
トワークデバイスドライバによって消費するステップ
と、前記ネットワークデバイスドライバを介して前記データ
を前記チャンネルハードウェア要素に送信するステップ
とを具備し、これらのステップが前記データ処理システ
ムによって実行されるデータ伝送方法。
【請求項１８】前記クライアントアプリケーションプ
ロセスから前記ネットワークプロトコルプロセスに前記
データを送信するステップは、前記共用メモリ部に前記ネットワークプロトコルプロセ
スのための入力待ち行列を作成するステップと、伝送されるデータを指示するポインタを前記ネットワー
クプロトコルプロセスの前記入力待ち行列内に前記クラ
イアントアプリケーションプロセスによって格納するス
テップと、前記ネットワークプロトコルプロセスの前記入力待ち行
列に格納された前記ポインタが指示するデータを前記ネ
ットワークプロトコルプロセスによって消費するステッ
プとを含む請求項１７に記載のデータ伝送方法。