JPH01199260A - 複数プロセッサ装置 - Google Patents

複数プロセッサ装置

Info

Publication number
JPH01199260A
JPH01199260A JP62274602A JP27460287A JPH01199260A JP H01199260 A JPH01199260 A JP H01199260A JP 62274602 A JP62274602 A JP 62274602A JP 27460287 A JP27460287 A JP 27460287A JP H01199260 A JPH01199260 A JP H01199260A
Authority
JP
Japan
Prior art keywords
modular
elements
architecture
processor
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62274602A
Other languages
English (en)
Other versions
JP2545101B2 (ja
Inventor
Bhalchandra R Tulpule
バルチャンドラ ラムチャンドラ タルピュール
Robert E Collins
ロバート イー コリンズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RTX Corp
Original Assignee
United Technologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by United Technologies Corp filed Critical United Technologies Corp
Publication of JPH01199260A publication Critical patent/JPH01199260A/ja
Application granted granted Critical
Publication of JP2545101B2 publication Critical patent/JP2545101B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
    • G06F15/8023Two dimensional arrays, e.g. mesh, torus
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/448Execution paradigms, e.g. implementations of programming paradigms
    • G06F9/4494Execution paradigms, e.g. implementations of programming paradigms data driven

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は新規な複数プロセッサアーキテクチャに係り、
特に不均一なデータベースに基いて実行される不規則な
計算のスルーブツトを高めるのに適したアーキテクチャ
に関する。
従来の技術 本発明は本願の優先権主張の基礎をなす対応の米国特許
出願の出願日と同日にタルピュール他により出願され本
出願人に譲渡された米国特許出願「n次元モジュール式
プロセッサ」、「n次元モジュール式入出力コントロー
ラ」、「事象によって駆動される複数ブロセツザシステ
ム用エグゼクティブ」中に開示された教示内容の一部を
使用する。
デジタル技術の絶え間ない進歩により次々と強力で複雑
なマイクロプロセッサ及びその他の装置が利用できるよ
うになり、その結果従来は非常に困難であると考えられ
ていた問題も拡張のための余力を残して解決することが
可能になってきている。しかし、一方でこの進歩により
従来は計算上の極端な困難性のため考えられもしなかっ
たあるいは単に不可能と放棄されていたより困難な問題
が前面に押し出されてきているのも事実である。
すなわち、進歩が要求に油を注ぎより強力なマイクロプ
ロセッサが求められるようになり、この要求と可能なス
ループット能力との間の不一致は日常的なものになりつ
つある。この不均衡は今日特に多くの実時間処理を要す
る問題、例えば音声認識1人工知性及び高信頼性航空機
システムに端的に見られる。事実、これらの分野の多く
のものでは計算上の要求が余りにも莫大であるため今日
のあるいは近い将来に実現されるであろういかなるプロ
セッサも単独ではその能力が超過されてしまう。
かかる巨大なコンピュータ能力の要求を解決する自然な
解決法は複数のプロセッサを使ってワークロードを分担
させることである。複数のプロセッサにもとづく並列処
理コンピュータシステムの設計については数多くの研究
がなされており特定の用途に合わせて設計された様々な
アーキテクチャが提案されている。例えば「大規模並列
プロセッサ」システム(MPPS)がグツドイヤーによ
りNASA (米国航空宇宙局)のために設計されてい
るが、このシステムは大規模なマトリクス形式のデータ
を操作する問題を解決するためのプロセッサ、メモリ及
びコントローラのマトリクスを含む。同様にシストリッ
クアーキテクチャでは問題を解くのに必要とされるデー
タ流れに応じて再構成できる相互に結合された大規模な
プロセッサの配列が使われる。かかる複数プロセッサシ
ステムの中心的な特徴はこれらのアーキテクチャが例え
ば行列計算など規則的なあるいはパターンの決まったア
ルゴリズムの実行にしか適さないことである。このため
上記の如き複数プロセッサシステムはイメージ処理とか
合成開口レーダなど大規模なスルーブツトの要求を有し
大規模で均一なデータベースに基いた規則的な計算が並
列に実行されるシステムにおいては非常に有用である。
しかし、−船釣には演算タスクの規則性をほとんど欠く
ような種類の問題が数多く存在し、このような問題では
不均一なデータベースが使われ決定がデータに依存して
なされまた不規則なデータ流れパターンを特徴とする実
時間逐次演算が必要とされる。従って、かかる問題の特
徴である大規模で常時変化する複雑な計算を逐次的に処
理することができ常に変化する実時間演算処理分野に適
合する柔軟な複数プロセッサシステムアーキテクチャが
要求されている。またかかるアーキテクチャではシステ
ムの定義の変更に適合できまた拡張することのできる能
力が要求される。
かかる不規則な実時間演算処理分野で要求されるスルー
ブツトは非常に大きくまた複雑で、さらに個々の用途毎
に大きく変化する可能性がある。
すなわち、一般に可能な限り広範囲な計算及びデータ処
理操作及び入/出力信号処理能力が要求されるが、この
要求もまた個々の用途では大きく変化する可能性がある
。多くの場合、計算の複雑さは機能間におけるデータ流
れ経路のインタートウイニング、ルーピング及びミクシ
ングに起因する。
データ流れ経路及びタスクの実行処理の流れは動作モー
ド及びデータにより駆動されて直列的になされる判断に
よって決められる。このデータ及び実行処理の流れの不
規則性及び予知不能性のため、かかる用途ではスループ
ットの問題を解決するのにパイプラインアーキテクチャ
は不適当である。
過去に開発されたアレイプロセッサシステム、例えばバ
ローズによるILLIACIVあるいはMPPSは規則
的で1並列化が可能」な計算に適合するように設31さ
れており、このため逐次的なアルゴリズムや不規則なあ
るいはスカラーデータ流れにこれらを適用すると非常に
性能が低下する。かかるアレイプロセッサシステムは本
質的に均一な性質を有し、普通は与えられたデータにも
とづいて同じ計算をロックステップで実行する。
プロセッサのアレイを個々の用途に合わせて適合させる
ことは容易ではない。これは変更をする場合いくつかの
基本ユニットを複数個変化させるしか方法がなくまた変
更の都度それらの動作及びその他の制御システムを再プ
ログラムする必要′があるためである。
一方、シストリックアーキテクチャは構成コントローラ
により個々の用途に合わせて適合できるセルないし処理
要素(PE)より構成される。しかし、シストリックア
ーキテクチャはデータのパイプライン化を含んでいるた
め、不規則なデータ及び実行処理動作の流れを処理する
のに適していない。シストリックアーキテクチャ中のP
Eは全て同等であって同一のプログラムを有し、さらに
重要なことに極く限られた計算の組しか実行することが
できない。
大きなスルーブツトを必要とするということは所定タス
クを所定時間内に最少の持ち時間で実行することと同義
である。すなわち、例えば航空機の実時間制御システム
では演算の際のトランスボート遅れのタイミングに関す
る要求は非常に厳しく、これによってシステム全体とし
ての帯域幅。
故障管理及び(i頼性に関する性能及び能力が決定され
てしまう。複数プロセッサシステムを使用するとデータ
及び実行処理の流れがプロセッサの境界を超えてやりと
りされ、全体のトランスボート遅れに対して余計な因子
を追加することになる。
この余計なトランスボート遅れを減少させるためにはプ
ロセッサ間でのデータ処理要素どうしの効率的な広帯域
通信が必要になる。特に不規則で予知できないデータ及
び実行処理の流れが複数プロセッサアーキテクチャ全体
に拡がるため多数の信号を迅速に転送できる大きな通信
帯域が必要である。
従来、プロセッサ間での通信の問題は様々な形で解決さ
れてきて、いる。−船釣な方法はデータを直列バスを介
して送ることである。この方法ではハードウェア的な負
担を軽減することはできるがその代償としてトランスボ
ート遅れが非常に大きくなることが避けられず関与する
信号の数が非常に多いような高性能実時間処理用途には
適していない。この方法ではまたバス管理のため大きな
ソフトウェアオーバーヘッドが必要になる。
「メールボックス」と称する別の技術ではデータワード
をプロセッサ間で転送するのに専用の入/出力ボートが
使用される。この周知の方法においても入/出力ボート
の管理に伴って大きなソフトウェアオーバーヘッドが発
生し、またさらに重要なことにメールボックスデータ要
素の非同期的デポジット及び取出しによりレーシング状
態が発生する危険を有する。より良くまたより効率的な
のは直接メモリアクセス(DMA)による方法であり、
この場合には一のプロセッサがDMA裁定要素を使用し
て他のプロセッサのメモリを直接アクセスしデータ転送
を行なう。しかし、DMA裁定要素は特に裁定を多数の
及び/又は異なった種類のプロセッサ間で行なわなけれ
ばならない場合にはその設計が非常に困難になる。
大きなスルーブツトを有する実時間処理を必要とする多
くの問題においては関連しているわけではないが高い信
頼性が要求されることが多い。例えば航空機用のデジタ
ル制御コンピュータシステムでは信頼性に関する要求の
ため複数プロセッサアーキテクチャの構成に厳しい制約
が課せられる。
すなわち、制御システムの信頼性、消費電ツバ重量9体
積及びその他の要求を犠牲にすることなく処理上の要求
に適合できかつ拡張できるアーキテクチャが要求される
。この要求の組合わせのため、個々の用途に容易に適合
させることができないシストリックアレイあるいはパイ
プラインシステムは使用することができない。
またシストリックあるいはパイブラインアーキテクチャ
は多くの場合信頼性及び消費電力の観点から不適当であ
ることが多い。
シストリック及びその他のアーキテクチャを使用する際
の別の問題点はデータ及び実行処理の流れ経路をコント
ローラによって再構成する必要があることである。この
かかるシステムに典型的な単一コントローラ機能の存在
及びデータ経路の再構成の必要性のためかかるシステム
は高い信頼性を要求される航空機用制御システムへの使
用には魅力的でない。
発明が解決しようとする問題点 そこで本発明は不規則で複雑な計棹動作を不均一なデー
タベースに基いて逐次的に実行する大規模な複数プロセ
ッサシステムアーキテクチャを提供することを一の目的
とする。
本発明の他の目的は複数プロセッサシステムアーキテク
チャを要求の変化に合わせてスループットに悪影響を及
ぼすことなく容易に変更でき大きなスループットを実現
できる複数プロセッサシステムアーキテクチャを提供す
るにある。
本発明のさらに他の目的はかかる複数プロセッサシステ
ムアーキテクチャに広帯域プロセッサ聞通信能力を付与
することにある。
本発明のさらに他の目的はかかる複数ブロセッザアーキ
テクチャ中の各プロセッサ中においてタスクを所定時間
内に最少の持ち時間で実行する方法を提供するにある。
本発明のさらに他の目的はかかる複数プロセッサシステ
ム用の動的に再構成できない非常に信頼性の高いアーキ
テクチャを提供することにある。
問題点を解決するための手段 要約すると、本発明による複数プロセツサシステムアー
キテクチャは各々が別の複数プロセッサアーキテクチャ
であってもよいモジュール式要素よりなる格子中におい
て複数のモジュール式要素が2つのモジュール式要素間
における情報のやりとりに専用される一又は複数の2ポ
ートメモリ装置を介して相互に結合される構成を有する
すなわち、本発明は第一に、複数の信号プロセッサ要素
を含む、結合のための手段を各々有する複数のモジュー
ル式要素を、アドレス及びデータ信号ラインを介してか
かるモジュール式要素よりなる格子状アーキテクチャの
一のモジュール式要素と他のモジュール式要素との間で
の情報のやりとりに専用される一又は複数の2ポートラ
ンダムアクセスメモリ(DPR)に結合することによる
複数プロセッサシステムの結合方法を提供する。
作用 上記本発明の第一の特徴に関連して、本発明では複数プ
ロセッサシステムアーキテクチャが各々協働するアドレ
ス及びデータ信号ラインに接続されたー又は複数の2ポ
ートランダムアクセスメモリ(DPR)を内側に有し複
数のプロセッサ要素及び複数の入/出力コントローラを
も含む複数のモジュール式要素を相互結合することによ
り構成され、協働する各々の2ボ一トRAMはかがるモ
ジュール式要素よりなる格子状アーキテクチャ中の一の
モジュール式要素と他のモジュール式要素との間での情
報のやりとりに専用されることを特徴とする。各々のD
PRはその両側のモジュール式要素から同時にアクセス
できその結果誤ったデータアクセスがなされることがな
くまた同一データが同時に2つのモジュール式要素より
アクセスされた場合の裁定が可能になる。
さらに、上記本発明の第一の特徴に関連して、本発明で
は格子状アーキテクチャ中の一又は複数のプロセッサ要
素それ自身を複数プロセッサ格子状アーキテクチャで置
換えてもよいことを特徴とする。
本発明はまた各々4を超えない任意の数の2ボ一トRA
Mと協働する複数のモジュール式要素よりなる2次元格
子状アーキテクチャを提供する。
その際前記2ボートRAMは格子状アーキテクチャ中の
4を超えない任意の数の協働するモジュール式要素との
間で情報のやりとりを行なう。また複数のモジュール式
要素の各々は該アドレス及びデータ信号ラインを介して
格子状アーキテクチャ中の4を超えない任意の数の他の
モジュール式要素と結合することもできる。各々のモジ
ュール式要素は該アドレス及びデータ信号ラインを介し
て4を超えない任意の数の専用の2ボ一トRAMと通信
する。
本発明はまた各々6を超えない任意の数の2ボ一トRA
Mと協働する複数のモジュール式要素よりなる3次元格
子状アーキテクチャを提供する。
その際前記2ボートRAMは格子状アーキテクチャ中の
6を超えない任意の数の協働するモジュール式要素との
間で情報のやりとりを行なう。また複数のモジュール要
素の各々は該アドレス及びデータ信号ラインを介して格
子状アーキテクチャ中の6を超えない任意の数の他のモ
ジュール式要素と結合することもできる。前記任意の数
の別のモジュール式要素は該データ及びアドレス信号ラ
インを介した通信に専用される多数の2ボ一トRAMを
有する。
勿論、前記の2次元格子状アーキテクチャは2つの2ボ
一トRAM (DPR)を有する一種類のモジュール式
プロセッサ要素のみを使用して構成するのが有利である
ことが理解されよう。モジュール式プロセッサ要素中に
おけるDPRの方位はここでは問題にしない。ただ各々
のプロセッサ要−素の方位が全ての要素を通じて一定な
規則的格子状アーキテクチャではDPRは対称性をもっ
て配置されるのが望ましい。例えば正方形モジュール式
プロセッサ要素においては「北側」、及び「東側」の境
界にのみDPRが設けられる。また以下に詳細に説明す
る不規則な格子状アーキテクチャ(第1図参照)中の正
方形モジュール式要素における如く2つのDPRを「北
側」及び「南側」の境界に配設してもよい。勿論最終的
な選択は設計者の自由である。
モジュール式プロセッサ要素においては2次元格子状ア
ーキテクチャを格子全体にわたって一様にする必要は必
ずしもないことが容易に理解されよう。例えばアーキテ
クチャ中で2種類のモジュール式要、素を使用し、例え
ば一方のモジュール式要素が3つのDPRを有し他方の
モジュール式要素が1つのDPRを有するようにしても
よい。あるいは格子状アーキテクチャ中にも多数の異な
ったモジュール式プロセッサ要素を使用することも考え
られよう。しかし使われるモジュール式要素の種類を増
大させるにつれてモジュール性による利点は急速に消滅
する。
同じことは上記の3次元格子状アーキテクチャ中につい
てもあてはまる。例えば立方体で示した3次元モジュー
ル式プロセッサ要素において他のプロセッサ要素と接触
する3つの側面に3つのDPRを設けてもよい。このD
PR構成は規則的な格千秋アーキテクチャに対応するも
のである。また上記以外のDPR構成を用いれば不規則
な格子状アーキテクチャを形成することができる。
上記の2次元及び3次元格子状アーキテクチャについて
の説明はn次元アーキテクチャの場合にも同様に当ては
まる。すなわち、規則的なn次元格子状アーキテクチャ
では一般にn次元空間中の要所要所に配置されたN個の
DPRを使用するのが非常に有利であるが、これは必須
であるわけではない。すなわちn次元アーキテクチャの
場合にもDPRを対称的に配置することが重要であるが
これは絶対的なものではない。
以下の詳細な説明では本発明によるn次元格子状アーキ
テクチャを2次元正方形モジュール式要素あるいは3次
元正方形モジュール式要素よりなるアーキテクチャを例
にして説明するがこれは本発明の教示をわかりやすく開
示するためのものにすぎない。すなわち本発明の要旨に
は一対のモジュール式要素間に専用DPRを設ける基本
思想を使った他の「形状」のモジュール式要素も含まれ
る。すなわち、かかる格子状アーキテクチャは様々に異
なった形に構成できる。アーキテクチャには例えばプロ
セッサ要素をモジュール式要素が形成する幾何学的図形
の頂点に配置する例や、プロセッサ要素がモジュール式
ユニットの内部空間中の種々の規則的な位置に分布させ
らせる例、またモジュール式要素を構成単位としモジュ
ール式要素間に専用のDPRを備えた他の様々な格子構
造が可能である。
また格子状アーキテクチャは特定の次元内で形成される
必要はない。例えば2次元モジュール式プロセッサ要素
を3次元モジュール式プロセッサ要素と組合わせて使用
することもできる。事実多数の異なった次元のモジュー
ル式要素を組合わせて「純粋でない」格子状アーキテク
チャを形成することが可能である。かかるアーキテクチ
ャは特定の種類に分類することが困難であるが本発明の
最も広い要旨内に含まれる。
本発明で開示したモジュール式プ[1セツサ要素はシス
トリックアーキテクチャで使われるPEに対しモジュー
ル式複数ブOセッサ格子中の個々の要素がそれぞれ異な
ったタスクを実行しまた他と異なったデータ流れを処理
しさらに使用されるプロセッサによっであるいは展開さ
れた命令の組の種類によって制限されることがない点で
大きく異なっている。本発明で開示したモジュール式複
数プロセッサ格子状アーキテクチャではプロセッサ要素
間を結ぶハードウェアデータ流れ経路が動的に再構成さ
れることはなく、このためコント0−ラ機能が不要にな
り動作の信頼性及び再現性が向上する。
以下に開示するトランスポート遅れを最小化する方法は
、同時に唯2つのプロセッサ要素からのアクセスのみを
許す2ボ一トRAM (DPR)の使用を前提としてい
る。このDPRの機能は本出願人に譲渡された米国特許
出願「入/出力コントローラのアクセス裁定」1教示の
裁定技術の一部あるいは最近利用可能になった内部裁定
DPRRAMチップを使って実現できる。DPR装置で
は裁定は装置内部でワード単位でなされる。各モジュー
ル式プロセッサ要素は相互に割込み信号を交換してブO
セッサ間で通信を行ないレーシング状態を除去する。各
プロセッサ対に協働する専用のDPRメモリ対はプロセ
ッサ・間に分散されて実行されている計粋に予測のつく
最少限のトランスボート遅れを引起すが本発明により開
示される複数プロセッサ格子状アーキテクチャの概念に
おける鍵となる要素である。
本発明で開示する複数プロセッサアーキテクチャでは用
途に合わせてシステム構成を処理要素及びコントローラ
によって適合させることができ、これにより非常に大ぎ
なスループット及び実時間動作の要求に応じつつ信頼性
、消費電力及びその他の費用的因子を最適化することが
できる。
本発明で開示した複数プロセッサ格子状アーキテクチャ
の重要な特徴はプロセッサ要素及び入/出力コントロー
ラ間の結合がDPRを介してなされ所定の用途に対して
不変に固定されることである。格子状アーキテクチャを
使用することによりアーキテクチャを個々の用途に合わ
せて構成することができ大きなスループット、小さなト
ランスポート遅れ及び高い信頼性を実現することができ
る。処理要素及び入出力コントローラはモジュール式の
一般的要素であり隣接のあるいはその他の要素との通信
のためのボートを備えている。モジュール設計のために
七−要なボートの数は用途に応じて任意の数に変化させ
ることができる。すなわち、本明細囚で開示する2次元
及び3次元モジュール式要素は本発明を限定するもので
はなく、−般に2n個のボートを有する構成要素により
構成されるn次元アーキテクチャも可能である。また先
に説明したように対称性の低い他のモジュール式要素を
使用することもできる。さらに、先にも説明したように
n次元要素あるいはアレイ中においてq次元要素あるい
はアレイを使用ないしインターフェースすることも可能
である。
複数プロセッサ格子状アーキテクチャは動作の際データ
を例えば本出願人に譲渡された米国特許出願「汎用多モ
ード入出力コントローラ」中に開示された如き入/出力
コントローラより得、またワークロードを例えば本出願
人に譲渡された米国特許出願「事象によって駆動さる複
数プロセッサシステム用エグゼクティブ」中に開示され
たが如きタスクエグゼクティブシステムによりプロセッ
サ要素間で分担する。各々のプロセッサ要素は一又は複
数のプロセッサより構成されていてもよく、また別の複
数プロセッサ格子状アーキテクチャより構成されていて
もよい。また全てのプロセッサ要素は専用のプログラム
を記憶している。プロセッサは同一であってもなくても
よく、データの分担は2ボ一トRAMメモリ及びプロセ
ッサ間の割込みを介してなされる。各計算フレームが終
了するとデータは入/出力コントローラ要素へ移され外
部へ分配される。
本発明の以上の及びその他の目的、特徴及び利点は図面
を参照しながら行なう本発明の最良の実施例の詳細な説
明より明らかとなろう。
実施例 第1図は本発明による2次元格子状複数プロセッサアー
キテクチャ10を示す図である。図中、多数の2次元モ
ジュール式処理要素12,14゜16.18が相互に結
合されており、これを以下に詳細に説明する。処理要素
の数は少なくとも2を超える任意の数でよい。
また第1図に示した2次元格子状複数プロツセサアーキ
テクチャ10では2次元モジュール式入/出力コントロ
ーラ(IOC)20が使われる。
かかるIOCは外界と複数プロセッサアーキテクチャと
の間におけるデータ及び制御信号の通信に使われる。ま
た別のIOC,例えばl0C22を使用して入/出力ワ
ークロードを分担させてもよい。モジュール性の観点か
らはモジュール式処理要素及びモジュール式10Cをそ
れぞれ格子状アーキテクチャ10の構成要素として使う
のが有利である。しかし、本発明の要旨は複数のモジュ
ール式処理要素12.14,16.18等を複数プロセ
ッサアーキテクチャ中で使用することにあるのであって
モジュール式10cが必ず含まれるわけではない。l0
CIN能は勿論角のモジュール式ユニット以外の手段に
よっても得ることができる。
ただかかるモジュール式10Gを使用した方が有利であ
るにすぎない。
第2図は2次元モジュール式処理要素12を示す図であ
る。第2図の処理要素12は第1図中の同じ符号を有す
る処理要素に対応し、この要素の全体的な構造をわかり
やすく示す。
処理要素24自体は一又は複数のプロセッサ゛よりなっ
てもよく2次元モジュール式処理要素12の中心的な要
素を構成する(プロセッサ要素24はそれ自身が第1図
に示したような複数プロセッサアーキテクチャであって
もよい。その場合はI10ライン、例えば第1図中のモ
ジュール式■0C22のライン70.72は第2図では
リング状バス32に対応する)。プロセッサ24から延
在するデータライン26、アドレスライン28及び制御
ライン30は円形のリングバス32に接続され、このよ
うにして2次元モジュール式処理要素は同じ格子状アー
キテクチャ中の他の要素をインターフェースする。
2次元アーキテクチャでは個々の2次元モジュ−ル式処
理要素12は4つのボートを有するのが最適である。こ
れらのボートは第2図に示すようにリングバス32から
延在するラインが破線で示したモジュール式プロセッサ
12の4つの境界面の−を横切る位置に形成される。勿
論複数プロセッサ格子状アーキテクチャの実際の物理的
な形状はそれが何次元であれこれらの図に示した機能的
な構成と物理的に厳密に対応している必要はない。
すなわち、実際の回路はより複雑で印刷回路基板上に設
けられ、それらの印刷回路基板は他の印刷回路基板と共
にシャーシ中に挿入される。また印刷回路基板間の接続
も図示した程簡単ではなくまた対称的である必要もない
。これらの図は本発明の思想をわかりやすく示すための
概略化した図にすぎない。
本発明による格子状アーキテクチャは各々のモジュール
式要素と他のモジュール式要素との間に設けられ格子中
での通信を担う専用のメモリ域の使用を前提とする。こ
の機能は2ポートランダムアクセスメモリ(RAM)に
より実行すると最も効率的である。勿論2ボートRAM
が絶対に必要というわけではなく、メモリ裁定は先にも
説明したようにその他の装置でも可能である。
2次元モジュール式処理要素12.14.16゜18の
各々のモジュール性を向上させるにはモジュール式処理
要素毎に2つの2ボ一トRAMを設けるのが最も有利で
ある。他の2つのボートには2ボ一トRAMを設ける必
要がなく、伯のモジュール式プロセッサ要素と協働する
2ボ一トRAMが必要なインターフェースを行なう。処
理要素は第1図に示すように対称的に形成すると非常に
有利である。すなわち、モジュール式処理要素12はそ
の「南側」ボートに2ボ一トRAMを有さないモジュー
ル式処理要素16の「北側」ボートをインターフェース
する2ボ一トRAM24を有する。またモジュール式処
理装置12の「東側」ボートは協働する2ボ一トRAM
を有さないがモジュール式処理要素14の「西側」ボー
トに協働するRAM36がこれに協働する。このように
、モジュール式処理要素を対称化することにより複数プ
Oセッ勺の格子状アーキテクチャの形成が容易になり、
このアーキテクチャにおいて各々のモジュール式処理要
素を一般に専用ユニットRAMを介して他のモジュール
式処理要素と通信させることが可能になる。
第1図の規則的で対称的な格子状アーキテクチャに関連
して、個々のモジュール式処理要素が隣接のモジュール
式処理要素の方位に対応してその方位を不規則に変化さ
せているのがわかる。これは第2図の要素が有する対称
性に関係している。
例えば第2図において2つのDPRの配置の対称性を変
化させて処理要素の「北側」及び「東側」ボートにDP
Rが位置するようにすると第1図の格子状アーキテクチ
ャはより規則的になる。勿論、他にも様々な対称性が可
能である。またーのアーキテクチャ中で一以上の対称性
を混在させることも可能である。
第2図の例ではモジュール式処理要素12の「北側」ボ
ートには他のモジュール式要素へ結合されるデータ及び
アドレスライン40が延在する2ボ一トRAM3Bが設
けられる。勿論データ及びアドレスライン40は必ず他
のモジュール式要素に結合される必要はなく、要素の「
北側」境界が格子状アーキテクチャの境界と一致してい
るような場合に結合はなされない。また、リングバス3
2からはモジュール式処理要素12の1゛北側」境界を
横切って通信を行なうための制御ライン42が延在する
。かかるラインは必須というわけではないが、割込み能
力を備えたプロセッサで普通に使われるハードワイヤ割
込み線より構成される。勿論、割込み信号はデータ及び
アドレスライン 40を介して送ることもできる。以上
の割込みについての説明は2ボ一トRAMを有する有さ
ないを問わず全てのボートにあてはまる。
モジュール式処理要素12の「東側」境界では境界面を
横切ってリングバス32からデータ及びアドレスライン
44及び制御ライン46が延在する。
同様に、要素12の「西側、1境界でも境界面を横切っ
てリングバス32からデータ及びアドレスライン48及
び制御ライン50が延在する。
またモジュール式処理要素12の「南側」境界には2ボ
一トRAM34を介してリングバス32をインターフェ
ースするデータ及びアドレスライン52を含むボートが
形成される。制御ライン54は第1図に示したが如き隣
接したモジュール式処理要素16にハードウェア割込み
信号を供給する。第2図に示した要素12の如き典型的
な2次元モジュール式要素の内部構造のブロック図をや
はり概略的にだが第7図に示す。これについては後程さ
らに詳細に説明する。
第3図は2次元モジュール式10G22を詳細に示す図
である。モジュール式IOCは先に説明したモジュール
式プロセッサ要素と同様であるがその主要な機能が入/
出力(Ilo)装置をインターフェースしてデータをプ
ロセッサと外界、換言すれば非信号処理領域との間で転
送することにある点で異なっている。
再び第1図を参照するに、協働する2ボ一トRAMの数
についてのモジュール式10G20の対称性はモジュー
ル式10G22の対称性とは異なっていることがわかる
。IOCの主な機能は信号プロセッサ要素に外部データ
を入力しまた外界へ情報を出力することにあるためモジ
ュール式処理要素と比較すると内部の対称性に関する選
択の自由度は大きい。これは勿論IOCが格子状アーキ
テクチャの境界部に位置するためモジュール式処理要素
と比較して厳しい制約のある構造的な役割りが中心的で
ないためである。先に説明したように、本発明の要素は
入/出力構造とは無関係に複数のモジュール式処理要素
を有する格子状アーキテクチャにより深く関係している
。すなわち、本明細書中におけるモジュール式IOCに
関する説明はモジュール式信号処理要素よりなる基本的
な格子状アーキテクチャを制限するものではない。
第3図のモジュール式l0C20はリングバス62によ
り図示された中央入/出力コントローラ(IOC)60
よりなり、このリングバス62は10C60から延在す
るデータライン64、アドレスライン66、及び制御ラ
イン68と通信する。
第3図のリンクバス62は第2図のリングバスとはやや
異なって「途切れた円」を形成し、その切れ目から一対
のデータライン70及び制御ライン72が延在しこれら
のラインモジュール式10C20の1西側」ボートを通
って第1図に示した如く外界のI10装置と通信を行な
う。
モジュール式10C22の「北側」及び「南側」境界に
は2ボ一トRAMよりなる専用メモリ74゜76を備え
たボートが形成され、このボートを横切って格子状アー
キテクチャ中の他のモジュール式要素との間でデータ及
びアドレスバスライン78.80及び制御ライン82.
84を介した通信が行なわれる。第1図ではl0C22
は「北側」境界を介してl0C20と通信するが「南側
」境界を介して通信するモジュール式要素は図示されて
いない。このl0C22の「南側」は空白スロットでも
よいし別のモジュール式10Cでもよいし、あるいはモ
ジュール式処理要素であってもよい。
第3図のモジュール式10C要素22の「東側」境界に
は隣接のモジュール式要素と通信するデータ及びアドレ
スライン86及び制御ライン88を担持するボートが形
成される。このIOC要素22のこの「東側」ボートに
は協働する専用メモリは設けられないが、これは第1図
に示したように隣接のモジュール式処理要素16が専用
メモリ90を有しているためである。
このようにユニット20及び22の例で示したように、
同一の格子内においてもIOCは使用個所によって構造
が大きく異なることが理解されよう。しかし、これは単
一の対称性のIOCを格子上アーキテクチャを通して使
用することができないことを意味するものではない。む
しろ、設計上及び費用上の観点からはモジュール式処理
要素は格子状アーキテクチャ全体を通じて−様な対称性
を有する方が効率的である。
第4a図は3次元モジュール式処理要素100を示す。
この碗では中央処理要素102が第2図のリングバス3
2を3次元的に拡張した3次元バスにより囲まれる。こ
の球面状の「リボン」バス104はプロセッサ102を
囲んで延在し、データ、アドレス及び制御信号を3次元
複数プロセッサ格子状アーキテクチャ中の他のモジュー
ル式要素と6個所のボートを介してやりとりするための
通信路を形成する。第4a図に示した3次元要素100
は見えない(図示していない)正六面体の中心に位置す
ると考えることもできる。各々の面にはそれぞれ協働す
るボートが一つ形成されている。第4a図の例ではこれ
らのボートのうちの3つが協働する2ボ一トRAM10
6.108゜110を有する。他の3つのボートはイン
タフェースされる「面」を介してDPRを有する他のモ
ジュール式要素にデータ、アドレス及び制御ラインを延
在させるにすぎない。また第4a図は実際にはやや簡略
化されていて、第2図においてデータ及びアドレスライ
ンと制御ラインとの間に維持されていた間隔が簡単のた
め省略されていることに注意しなければならない。勿論
、3次元モジュール式処理要素100は図示したのと全
く同数のDPRを必ず有さねばならないわけではなく、
任°意の数のDPRを有することができる。すなわち、
第4a図に示した例で選択したDPRの数は単に対称性
を図示するためのものにすぎない。ただし、この特別に
図示した対称性は第1図及び第2図に示した対称性と異
なりかかる要素を使って構成した格子の規則性を特に高
める効果がある。先にも説明したように、実際に実現可
能なモジュール式3次元構造は格子を3次元のあらゆる
方向へ拡張できる利点のため3つのDPRを有する可能
性が高い。また3次元格子アーキテクグ・ヤはその任意
のr面」の−でDPRを介して他の次元の格子をインタ
ーフェースすることも可能である。
第4b図は第4a図に示したのと同様に3次元モジュー
ル式処理要素120,122,124゜126を複数個
使用した3次元格子状アーキテクチャを示す。これらの
要素の各々が第4a図に示したのと同一の対称性を有す
る場合は例えばモジュール式要素120にはその境界(
図示せず)内にてDPR130,132,134が協働
する。
これはDPR128が隣接の3次元モジュール式処理要
素(図示せず)の境界内に設けられていることを意味す
る。同じく、3次元の規則的な格子中において要素12
2に結合されているDPR136は隣接のモジュール式
要素(図示せず)に協働するものである。ライン141
と協働するDPR138,140及び別のDPR(図示
せず)は要素122にこのモジュール境界内で協働する
要素124にはDPR144及びライン145a。
145bと協働する2つの別のDPR(図示せず)が協
働する。この秤の構造は任意のサイズに形成でき任意の
スペースに適合させることができる。
例えば、モジュール式要素120.122.124及び
150が全て同一平面にある場合、アーキテクチャは前
記平面に平行に下方に拡張することができ、この場合は
要素126が下側面中に形成される。上記の規則的アー
キテクチャにおいてはこの要素126もDPRに関して
同一の対称性を有し、DPR146,147及び147
aと協働する別のDPR(図示せず)が協働する。
第4b図は2つのDPR,すなわちD P R152及
び156が協働する3次元モジュール式入/出カコント
0−ラ150を示す。モジュール式IOCでは内側のl
0C158がプロセッサ要素120゜122.124.
126の周囲に設けられている「リボン」状バス104
とよく似た別の「リボン」状バス160と協働する。バ
ス104と160の唯一の差異は10C15Bから延在
するーのデータ及び制御バス162が「リボン」160
と交差しない点にある。これは「リボンj中に第3図の
2次元モジュール式l0C22のリングバス62中に形
成されていたギャップと同様な小さなギャップが形成さ
れているためである。そこで、データ及び制御ライン1
62はこのギャップを通って延在してI10装置をイン
ターフェースする。これらのラインはCPUバス160
に対しては絶縁されていなければならない。
第5図は例えばn次元格子状複数プロセッサアーキテク
チャ中で使用されるn次元モジュール式処理要素の概略
図である。特定の次元の格子状アーキテクチャあるいは
モジュール式要素が他の次元の格子及び/又は要素をイ
ンターフェースできるのは勿論である。単一の処理要素
200はそれ自身が複数プロセツザ格子であってもよく
、要素200からはデータライン202、アドレスライ
ン204及び制御ライン206が延在してリング状デー
タ、アドレス及び制御バス208と通信する。このリン
グバスは多数の出力ボート、例えばn次元モジュール式
処理要素の場合だと2n個のボートを有する。かかる2
0個のボートを備えたあるいは「面」を有するn次元モ
ジュール式処理要素には2n個のボートの丁度半分に2
ボ一トRAMが協働するのが典型的である。換言すれば
、かかる要素にはn個の2ボ一ドRAMが協働する。
また2ボ一トRAMを有さないn個のボートが存在する
。勿論、上記の対称性すなわちn個のボートに対しn/
2個のDPRを設けることは先にも説明したように本発
明を限定するものではない。
第5図は車輪のハブに非常によく似たリング状バスを備
えたプロセッサを示す。このn次元モジュール式処理要
素は実際上処理要素の境界を画成するリム210に向っ
て延在する多数の「スポーク」を有する。この「II輪
」の「スポーク」の端には2n個のボートが形成されn
次元格子状アーキテクチャ中の他のモジュール式要素と
の間で必要なデータ、アドレス及び制御信号をやりとり
する。
図中、2ボ一トRAM (DPR)212がリングバス
208をインターフェースし境界210に向って延在す
るデータ及びアドレスバス214を介して格子中の他の
モジュール式要素のリングバスと別のDPRを介するこ
となく直接に通信する。
換言すれば、第5図の「車輪」中のスポークの各々は同
じ格子状アーキテクチャ中の別の同様なモジュール式要
素中の協働するDPRを有さない「スポーク」に接続す
るためのDPRを有する。
一方、制御ライン216は別の要素中のスポークの同様
なラインと直接に接続される。上記ボートに隣接するボ
ートは制御ライン218とデータ及びアドレスライン2
20より形成されるスポークを有しこのスポークを介し
てリング状バス218と「リム」が「スポーク」と交差
す、る位置に形成される出力ボートとの間で通信を行な
う。
さらに、同様な「スポーク」の対、すなわちDPR22
2もデータ及びアドレスバス224と制御バス226と
よりなる第1のスポークと、データ及びアドレスバス2
28と制御バス230とよりなる第2のスポークとより
なる対が前記第1のスポークの対に隣接して設けられる
第5図中に示したかかるスポークの第3の対はDPR2
32とデータ及び制御バス234と制御バス236とよ
りなる第1のスポークと、制御バス238とデータ及び
アドレスバス240とよりなる第2のスポークよりなる
。かかるスポークの対はモジュール式処理要素の次元に
対応してくりかえされる。例えば10次元格子状アーキ
テクチャを使用した場合は10対のかかるスポークが設
けられる。
第6図はn次元モジュール式入/出力コントローラ25
0を示す。これは第5図のn次元モジュール式処理要素
と非常によく似ているが、中心に位Uする要素がプロセ
ッサでなく入/出力コントローラ(IOC>である点、
及びモジュール式要素250の外界と通信するための別
の手段、すなわちIOCと外界との間の直接的な通イn
のためのデータ及び制御バス252が設けられている点
が異なっている。データ及び制御バス252とリング状
のデータ、アドレス及び制御バス254とは直接に接続
されることはない。第5図のリング状バス208と異な
り第6図のリング状バスには開口部256が形成される
。図中ではこれをデジタルデータ及び制御用リングバス
254と入/出力データ及び制御バス252との間の間
隙により図示する。この点を除けばn次元モジュール式
10Cの構造は第5図のn次元モジュール式処理要素の
構造と非常によく似ている。勿論DPRの数及びIOC
内でのスポークの数は用途によって変化する。明らかに
、IOCの各スポークはDPRを介して任意の次元のモ
ジュール式処理要素の「而」をインターフェースできる
。   □ 第7図は第2図中の2次元モジュール式処理要素をより
詳細に示す図である。図中、北側、東側。
南側及び西側のボートを第2図と同じ方位を保って示し
である。さらに、第2図にリングバス32に対応してC
PUデータ/アドレスバス32にバッフ?なしで拡張さ
れる別のボート300が形成される。第7図ではこのリ
ングバスは「リング」状にはなっていないが、第2図は
格子状複数プロセッサアーキテクチャ中の処理要素のモ
ジュール性をわかりやすくするための図にすぎないこと
を理解すべきである。第7図も概略図ではあるがより実
際に近い。
典型的な任意の次元のモジュール式処理要素ではプロセ
ッサ24(これは−を超える数のプロセッサよりなるも
のであってもよくまたそれ自身が別の格子であってもか
まわない)以外にも格子状アーキテクチャ中の別のモジ
ュール式要素からの割込み信号に応答して信号ライン3
04を介してプロセッサにかかる割込みの存在を通知す
る割込みコントローラ302が設けられる。この割込み
コントローラ302はまたプロセッサ24がらのライン
306上の割込み信号に応答して制御ライン42,46
.54及び50を介して同じ格子状アーキテクチャ中の
他のモジュール要素へ送られる割込み信号を形成する。
図示した2次元モジュール式処理要素12にはその他に
CPU  RAM310、PROM312、クロック3
14及び典型的なプロセッサの諸動作を行なうので特に
説明はしない他の機能ブロック316,317,317
a及び317bを始めとする様々な部分が含まれる。
CPU  RAM310の機能はプロセッサ24へのデ
ータ及び命令を一時的に記憶するためのものである。P
ROMは不揮発性のすなわち永久的なプログラム可能メ
モリであり電源をオンにしてレフレッシュをしなくとも
データを記憶できるメモリである。
クロック314はプロセッサ24にクロック信号を供給
するためのものである。
第8図は第3図に示したのと同様な2次元モジュール式
10C400を示す。ただし、このl0C400は2次
元格子状アーキテクチャ中の一のモジュール式要素しか
インターフェースできない。
すなわち、第3図の2次元モジュール式IOCは可能な
唯一の構造をあられすものではなく、他にも第8図の変
形例を含めて様々な変形が可能である。
第8図の2次元モジュール式10C400の心臓部はD
MAコントローラ404及びリンクコントローラ406
を含む中央コントローラ402である。これは第3図の
中央10C60と同様である。コントローラ402はた
またまこのl0C400が使用される複数プロセッサア
ーキテクチャの構造に起因する理由によりDMA制御機
能部とリンク制anii部とに分割されている。この特
別なアーキテクチャではDMA機能サービスを要求する
入/出力装置より別々にリービスされる必要のある冗長
チャンネル間に多数の直接リンクが存在している。
いずれにせよ、入/出力装置は出力幹線ライン412中
の複数のライン418及びI10インターフェースユニ
ット410を介してインターフェースされる。同様に、
リンク送受信ユニット414は複数のライン416を介
して同じ幹線412上で通信を行なう。
ユニット410及び414はいずれもデータ及びアドレ
スライン4201422及び制御ライン424.426
を介してIOCコントローラ402と通信する。このデ
ータ及びアドレスラインは多くの場合16ビツトライン
が使用されるのが典型的である。
DMAコントローラ404のシーケンスはDMAシーケ
ンサ432と協働する制御ライン430を介して制御さ
れる。これには一連のマイクロコード命令が含まれる。
同様に、マイクロコード命令を有し制御ライン434を
介してリンクコントローラ406を制御するリンクシー
ケンザ433が設けられる。
DMAコントローラ404及びリンクコントローラ40
6はDMA  RAM444及びリンクRAM446に
それぞれ通信するための別のデータ及びアドレスライン
440及び442を有する。
これらのRAM444及び446はいずれもcpUバス
448に結合されてアーキテクチャ中のリングバスの−
をインターフェースする。DMAコントローラ及びリン
クコントローラ404及び406はまた第3図に示した
如き一又は複数のモジュール式要素の側面を介して一又
は複数の内部DPRを直接にインターフェースしてもよ
い。
以上、本発明を最良の実施例について説明したが、本発
明の思想及び要旨内で様々な変更、省略及び追加が可能
である。
【図面の簡単な説明】
第1図は本発明による2次元格子状複数プロセッυアー
キテクチャを示す図、第2図は第1図の2次元格子状ア
ーキテクチャで使用される2次元モジュール式処理要素
の例を示す図、第3図は第1図の2次元格子状アーキテ
クチャで使用される2次元モジュール式入/出力コント
ローラ(10C)の例を示す図、第4(A)図及び第4
(B)図は本発明による純粋に3次元の格子状複数プロ
セッサアーキテクチャを示す図、第5図はn次元格子状
複数プロセッサアーキテクチャ中で使用されるn次元処
理要素を示す図、第6図はn次元格子状複数プロセッサ
アーキテクチャ中で使用されるn次元10Cを示す図、
第7図は第2図の2次元モジュール式処理要素の内部を
示す概略的ブロック図、第8図は第3図のIOCと同様
なただし完全に同等ではない2次元モジュール式要素の
内部を示す概略的ブロック図である。 10・・・2次元格子状アーキテクチャ、12゜14.
16.18・・・2次元モジュール式処理要素、20.
22.400・・・2次元モジュール式10C124,
200・・・処理要素、26.64,70゜202・・
・データライン、28.66.204・・・アドレスラ
イン、30.42.46.50.54゜68.72.8
2.84.88,206,216゜424.426,4
30,434・・・制御ライン、32.62,208,
218.254・・・リングバス、34.36.38,
106,108,110゜128.130,132,1
34,136,138 。 140.144,146,147,152,156 。 212.222.232・・・2ボ一トRAM、40゜
44.48,52,78,80.86.220゜420
.422,440.442・・・データ及びアドレスラ
イン、60.158・・・中央入/出力コントローラ、
74.76・・・専用メモ1ハ90 ・・・メモリ、1
00,120,122,124.126・・・3次元モ
ジュール式処叩要素、102・・・中央処理要素、10
4,160.162・・・バス、141゜145a、1
45b、147a、304,306゜416・・・ライ
シ、150・・・3次元モジュール式l0C1210・
・・要素境界、214,224,228 。 240・・・データ及びアドレスバス、226,230
゜234.236,238.252・・・制御バス、2
50・・・モジュール式要素、256・・・開口部、3
00・・・ボート、302・・・割込みコントローラ、
310・・・CPU  RAM、312・・・PROM
1314・・・クロック、316,317,317a。 317b・・・機能ブロック、402・・・中央コント
ローラ、404・・・DMAコントローラ、406・・
・リンクコントローラ、410・・・I10インターフ
ェースユニット、412・・・出力幹線ライン、414
・・・出力送受信ユニット、432・・・DMAシーケ
ンサ、433・・・リンクシーケンサ、444・・・D
MARAM、446・・・リンクRAM1448・・・
CPUバス。 特許出願人 ユナイテッド テクノロジーズFIG、2 FIG3 FIG、4A トμか久 /−/Cy、6 手続?1言l正書(方式) 昭和63年 3月24日 特許庁長官  小 川 邦 夫  殿   ゛1穐iノ 1、事件の表示 昭和62年 特許願 第274602号2、発明の名称 複数プロセッサシステムの形成方法 3、補正をする者 事件との関係  特許出願人 住 所 アメリカ合衆国 コネティカット 06101
ハートフオード ファイナンシャル プラグ 1番地名
 称  ユナイテッド チクノロシーズ コーポレーシ
ョン代表者 ドミニク ジェー キアンテラ4、代理人 住 所 〒102  東京都千代田区麹町5丁目7番地
6、 補正の対9 図面。 7、 補正の内容 図面の浄占(内容に変更なし)を別紙のとおり補充する

Claims (8)

    【特許請求の範囲】
  1. (1)複数の処理要素を含む、各々結合のための手段を
    有する複数のモジュール式要素を、アドレス及びデータ
    信号ラインを介してかかるモジュール式要素よりなる格
    子状アーキテクチャ中の一のモジュール要素と他のモジ
    ュール式要素との間での情報交換に専用される一又は複
    数の2ポートメモリ装置に結合する段階を有することを
    特徴とする複数プロセッサシステムの形成方法。
  2. (2)該メモリ装置は2ポートランダムアクセスメモリ
    (DPR)であることを特徴とする特許請求の範囲第1
    項記載の方法。
  3. (3)各々のモジュール式要素は協働するアドレス及び
    データ信号ラインに結合されている一又は複数の2ポー
    トメモリ装置を有することを特徴とする特許請求の範囲
    第1項記載の方法。
  4. (4)該結合する段階はさらに各々アドレス及びデータ
    信号ラインに接続されて格子状アーキテクチャ中の他の
    モジュール式要素との間での情報の交換に専用される2
    ポートメモリ装置を一又は複数個有するモジュール式処
    理要素を複数個結合し; 各々アドレス及びデータ信号ラインと協働して格子状ア
    ーキテクチャ中の他のモジュール式要素との間での情報
    の交換に専用される2ポートメモリ装置を一又は複数個
    有する一又は複数のモジュール式入/出力コントローラ
    (IOC)を該一又は複数のモジュール式処理要素と結
    合する段階を含むことを特徴とする特許請求の範囲第1
    項記載の方法。
  5. (5)該一対のモジュール式要素間における専用の2ポ
    ートメモリ装置を介した情報の交換は各対中の要素間に
    おける割込み信号によつて容易化されることを特徴とす
    る特許請求の範囲第1項記載の方法。
  6. (6)該複数のモジュール式処理要素の各々は2つの対
    応するモジュール式要素との間で情報を交換するための
    2つの2ポートメモリ装置を内側に有しており、該複数
    のモジュール式処理要素の各々はまた該アドレス及びデ
    ータ信号ラインを介して2つの別のモジュール式要素に
    結合されるべく適合されており、該別のモジュール式要
    素の各々もまた該アドレス及びデータ信号ラインを介し
    て通信に専用される2ポートメモリ装置を内部に有して
    いることを特徴とする特許請求の範囲第1項記載の方法
  7. (7)該複数のモジュール式処理装置の各々は3つの対
    応するモジュール式要素との間で情報を交換するための
    3つの2ポートメモリ装置を内側に有しており、該複数
    のモジュール式処理要素の各々はまた該アドレス及びデ
    ータ信号ラインを介して3つの別のモジュール式要素に
    結合されるべく適合されており、該別のモジュール式要
    素の各々もまた該アドレス及びデータ信号ラインを介し
    た通信に専用される2ポートメモリ装置を内部に有して
    いることを特徴とする特許請求の範囲第1項記載の方法
  8. (8)該複数のモジュール式要素の少なくとも一はそれ
    自身が別の格子状複数プロセッサアーキテクチャより構
    成されることを特徴とする特許請求の範囲第1項記載の
    方法。
JP62274602A 1986-10-29 1987-10-29 複数プロセッサ装置 Expired - Lifetime JP2545101B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US92464686A 1986-10-29 1986-10-29
US924.646 1986-10-29

Publications (2)

Publication Number Publication Date
JPH01199260A true JPH01199260A (ja) 1989-08-10
JP2545101B2 JP2545101B2 (ja) 1996-10-16

Family

ID=25450487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62274602A Expired - Lifetime JP2545101B2 (ja) 1986-10-29 1987-10-29 複数プロセッサ装置

Country Status (3)

Country Link
EP (1) EP0266300B1 (ja)
JP (1) JP2545101B2 (ja)
DE (1) DE3750839T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5708634B2 (ja) * 2010-02-24 2015-04-30 日本電気株式会社 Simdプロセッサ

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0367182A3 (en) * 1988-10-31 1992-07-22 Bts Broadcast Television Systems Gmbh High-speed digital computing system
US7415594B2 (en) * 2002-06-26 2008-08-19 Coherent Logix, Incorporated Processing system with interspersed stall propagating processors and communication elements
US8826228B2 (en) 2006-03-27 2014-09-02 Coherent Logix, Incorporated Programming a multi-processor system
US8880866B2 (en) 2010-10-15 2014-11-04 Coherent Logix, Incorporated Method and system for disabling communication paths in a multiprocessor fabric by setting register values to disable the communication paths specified by a configuration

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6073766A (ja) * 1983-09-29 1985-04-25 Meidensha Electric Mfg Co Ltd Cpu間の情報交換装置
JPS60181962A (ja) * 1984-02-29 1985-09-17 Fujitsu Ltd 並列計算機における通信方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6073766A (ja) * 1983-09-29 1985-04-25 Meidensha Electric Mfg Co Ltd Cpu間の情報交換装置
JPS60181962A (ja) * 1984-02-29 1985-09-17 Fujitsu Ltd 並列計算機における通信方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5708634B2 (ja) * 2010-02-24 2015-04-30 日本電気株式会社 Simdプロセッサ

Also Published As

Publication number Publication date
DE3750839D1 (de) 1995-01-19
EP0266300B1 (en) 1994-12-07
DE3750839T2 (de) 1995-05-04
JP2545101B2 (ja) 1996-10-16
EP0266300A2 (en) 1988-05-04
EP0266300A3 (en) 1991-04-03

Similar Documents

Publication Publication Date Title
US4933836A (en) n-Dimensional modular multiprocessor lattice architecture
US5410723A (en) Wavefront array processor for blocking the issuance of first handshake signal (req) by the presence of second handshake signal (ack) which indicates the readyness of the receiving cell
US4891751A (en) Massively parallel vector processing computer
EP0334943B1 (en) Enhanced input/ouput architecture for toroidally-connected distributed-memory parallel computers
US7152151B2 (en) Signal processing resource for selective series processing of data in transit on communications paths in multi-processor arrangements
EP0085520B1 (en) An array processor architecture utilizing modular elemental processors
JP2710536B2 (ja) コンピュータ・システム
JP2552076B2 (ja) コンピュータ・システム
US5361367A (en) Highly parallel reconfigurable computer architecture for robotic computation having plural processor cells each having right and left ensembles of plural processors
US20040215677A1 (en) Method for finding global extrema of a set of bytes distributed across an array of parallel processing elements
NO344681B1 (en) Coherent Node Controller
JPH01199260A (ja) 複数プロセッサ装置
WO2007124514A2 (en) Method and apparatus for a scalable hybrid architecture for polyvertexic extensible networks
JP2557175B2 (ja) コンピュータ・システム
US7448038B2 (en) Method for using filtering to load balance a loop of parallel processing elements
US7437726B2 (en) Method for rounding values for a plurality of parallel processing elements
JP2620487B2 (ja) コンピュータ・パッケージ
JP2579419B2 (ja) マルチプロセッサ・メモリ・システム
US7430742B2 (en) Method for load balancing a line of parallel processing elements
US7437729B2 (en) Method for load balancing a loop of parallel processing elements
US7503046B2 (en) Method of obtaining interleave interval for two data values
US20040216115A1 (en) Method for using extrema to load balance a loop of parallel processing elements
JPH0646413B2 (ja) デ−タ処理プロセッサ
JPH0635875A (ja) コンピュータ・システム
Giloi GMD-TUB Research Center for Innovative Computer Systems and Technology Berlin, Germany (West)