JPH076146A - 並列データ処理システム - Google Patents

並列データ処理システム

Info

Publication number
JPH076146A
JPH076146A JP5148017A JP14801793A JPH076146A JP H076146 A JPH076146 A JP H076146A JP 5148017 A JP5148017 A JP 5148017A JP 14801793 A JP14801793 A JP 14801793A JP H076146 A JPH076146 A JP H076146A
Authority
JP
Japan
Prior art keywords
data
data processing
sample data
learning
adjustment amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5148017A
Other languages
English (en)
Inventor
Katsuto Fujimoto
克仁 藤本
Hideki Yoshizawa
英樹 吉沢
Tatsushi Ootsuka
竜志 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5148017A priority Critical patent/JPH076146A/ja
Priority to DE4417932A priority patent/DE4417932B4/de
Priority to US08/248,642 priority patent/US5627944A/en
Publication of JPH076146A publication Critical patent/JPH076146A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/10Interfaces, programming languages or software development kits, e.g. for simulating neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Multi Processors (AREA)
  • Complex Calculations (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 学習時間を短縮する為に十分な並列度を持た
せる事の出来る並列学習方式を有する並列データ処理シ
ステムを提供する。 【構成】 複数のデータ処理手段1、該データ処理手段
に接続する複数の転送データ保持手段2を有するデータ
転送手段3とからなり、データ処理手段1のそれぞれに
は、実行パラメータ保持手段12と部分標本データ保持
手段11とが設けられ、部分標本データ保持手段11内
の部分標本データと実行パラメータ保持手段12内の実
行パラメータとから、該部分標本データについての調整
量を演算処理する調整量演算手段14と、全ての標本デ
ータについての実行パラメータの調整量の総和を演算す
るに際し、所定の演算結果を、前記データ転送手段の転
送データ保持手段を介して他のデータ処理手段に於ける
演算結果とを加累積算する累積手段15とから構成され
ている並列データ処理システム。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は並列データ処理方式に係
り、更に詳しくは、複数個のデータ処理ユニットを同期
的に用いてデータを処理する並列データ処理システムに
関する。
【0002】
【従来の技術】近年、電子計算機或いはデジタル信号処
理装置等のシステムにおいて、データ処理の適用分野の
拡大に伴い、処理されるデータの量が膨大になり、特に
画像処理或いは音声処理等の分野では高速なデータ処理
を行う必要があり、そのため、複数個のデータ処理ユニ
ットを同期的に用いてデータを処理するデータ処理の並
列性の利用が重要となる。一般に、複数の処理ユニット
を用いた処理において重要な概念に台数効果がある。こ
れは用意されたデータ処理ユニットの台数に比例したデ
ータ処理速度の向上が得られることを意味するが、並列
処理方式においては良好な台数効果を得ることが非常に
重要となる。
【0003】台数効果が悪化する主要な原因は、問題そ
のものの並列度による限界を別にすれば、データ処理に
伴うデータ転送に要する時間が本来のデータ処理に要す
る時間に加算されてトータルとしての処理時間が引き延
ばされることにある。従って、台数効果の向上にはデー
タ伝送路の容量をフルに活用することが有効であるが、
これはなかなか難しい。
【0004】しかし、処理が規則的な場合には、この規
則性を利用して台数効果を上げることが可能となる。デ
ータをシストリックアレイ、すなわち、巡回的にデータ
を流し、2つのデータがその流れにおいてそろったとこ
ろで演算を行うようにする。処理が規則的なことを利用
する並列処理がシストリックアレイ方式であり、この中
でリングシストリックアレイ方式と呼ばれる1次元のシ
ストリックアレイ方式は、複数個のデータ処理ユニット
を周期的に用いてシストリックなデータを処理する並列
データ処理方式であって実現が比較的容易である。規則
性のある処理として、ベクトルの内積演算を基本とした
行列演算や、ニューラルネットの積和演算に非線形関数
を介して出力する並列処理がある。かかるデータの並列
処理方式としては例えば図9に示す様な共通バス結合型
並列演算方式がある。
【0005】即ち、図9において91はプロセッサエレ
メント、4はメモリ、93は共通バス、92は共通バス
に接続されるバス、94は各プロセッサエレメントと、
それに対応して接続されるメモリ4を接続する内部バス
である。この共通バス結合型並列方式においては、プロ
セッサエレメント(以下PEと称す)間の通信が共通バ
ス93を介して行われる。特定な時間区域には共通バス
に乗せるデータは1つであるため、共通バスによる通信
は共通バス全体にわたって同期をとる必要がある。又、
別の方式としては図10に示す様なリングシストリック
方式も知られている。即ち同図において91はプロセッ
サエレメント(PE)である。各PEは巡回バス95に
よって接続されている。また、96は係数Wijを格納す
るメモリである。W11,W12,…,Wxyなどは係数行列
の要素であり、一般にWijは行列のij成分である。こ
の係数行列Wと、ベクトルx=(X1 ,X2 ,X3)を掛
ける動作をこのリングシストリック方式で行う場合、次
のようにして行われる。
【0006】図11は91で示すプロセッサエレメント
(PE)の第i番目の内部構造である。同図において1
31は乗算器、132は加算器、135はアキュムレー
タ(ACC)、96は係数の要素Wijを格納するレジス
タ群である。このレジスタ群はいわゆるFIFOであっ
て、係数行列の第i行目に関する係数としてWij、すな
わちj番目の列の要素が出力されようとしている状態で
ある。このFIFOは出力された次のクロックでは巡回
し、バス95を介して後ろ側からまた入力される。従っ
て図に示すように、Wij,…,Wi j-1 はすでに巡回
されて後側に格納されている状態となっている。
【0007】一方、ベクトルの各要素はバス95を介し
て入力される。現在、要素Xj が入力されている状態で
ある。すでにアキュムレータ135にはW11×X1 +…
+W i j-1 ×Xj-1 の内積結果が格納されている。これ
が今アキュムレータ135から出力され、加算器132
の一方の入力に入力されている。外部からのXj とFI
FOから出力されるWijの積が乗算器131によって乗
算され、その結果が加算器132の他方の入力に入力さ
れ、現在のアキュムレータ135の内容とが加えられ、
次のクロックで同じアキュムレータ135に加算され
る。この繰り返しによって、係数行列Wの第i行目の行
ベクトルと外部から与えらる列ベクトルとの内積演算が
実行される。なお、スイッチ(Switch)はデータ
i をスルーに外部に出すか、あるいは内部に取り込
み、アキュムレータ135にセットする場合との選択を
行うためのものである。このようなPEで、行列×ベク
トルの積を行う場合、図10に示すように、PE−1は
まず、W11とX1 を掛け、次のクロック周期に、X2
右側のPE−2から流れ込み、W12がメモリ96から出
力されるので、W12×X2 が演算される。同様に次のク
ロックではW13とX3 との積が実行され、このことによ
り係数行列の第1列目とベクトルxとの積がPE−1に
おいて可能となる。また、第2列目とベクトルとの積は
PE−2において行われる。すなわち、W22とX2 を掛
け、次のクロック周期に、W23とX3 を掛け、次のクロ
ック周期においてW21と巡回的にもどってきたX1 との
積を行うことになる。同様に、第3行目とベクトルとの
積はW33とX3 を掛け、W31と巡回してくるX1 とを掛
け、W32と巡回して戻ってくるX2 との積をとって内積
演算を実行することによって可能となる。従って、この
動作において、W11とX1 との積、及びW22とX2 、W
33とX3 との積は同時に行えることになる。しかし、図
に示すように、この同時性を実行するためには係数行列
の要素の並べ方にねじれが生じている。このようなリン
グシストリックアレイ方式においては、各PE間のデー
タ転送と、各PEでのデータ処理を同期して実行するこ
とで、データ転送路を有効に利用でき、従って良好な台
数効果を得ることができる。
【0008】図12は、図10のリングシストリック方
式の構成を多段に組み合わせたものであり、この構成に
より、連続する行列とベクトルの積を行うことが可能と
なる。このようなシストリックアレイ方式は処理が規則
的であるため、データ伝送路の容量をフルに活用するこ
とが可能であり、従って台数効果の向上が計れる。然し
ながら上記した従来の共通バス結合の並列方式において
は、プロセッシングエレメント、すなわちPE間の結合
が共通バスによっているため、一時には1つのデータし
か転送できない。また、共通バスによる結合は共通バス
全体にわたる同期をとらなければならない。従って、従
来の共通バス結合型並列方式においては良好な台数効果
を得られる処理の種類が少ないという問題が生じ、さら
に共通バスによる結合は、結合されるPEの個数の増加
とともに共通バスが長くなり、共通バス全体にわたる同
期をとるのが難しくなるという問題、そして、大規模並
列には適さないという問題が生じていた。また、図10
〜図12のような従来のリングシストリックアレイ方式
においては、各PE間のデータ転送とPEでのデータ処
理を同期して実行することにより、台数効果を得ること
ができるが、この方式では、各PE間でのデータ転送
と、各PE間でのデータ処理のタイミングを合わせねば
ならない。また、この方式では、例えば長方形の行列と
ベクトルとの積を求める場合等のようにデータ処理ユニ
ットとデータ保持ユニットのそれぞれの最適な個数が等
しくない場合には、実際のデータ処理に係わらないPE
が必要となり、すなわち、遊ぶPEが多くなり、そのた
め台数効果が悪化するという問題がある。言い換えれ
ば、効率よくとける問題と回路構成とが固く対応し、問
題の大きさが最適な値と異なると台数効果が悪化してし
まう。逆にいうと、良好な台数効果が得られる問題が特
定されてしまい、広範な処理に適用できず、柔軟性、或
いは汎用性に欠け、結果として、ある程度広い範囲の処
理に適用できる高速なデータ処理系を実現することが困
難であった。上記した従来技術の欠点を改良するため更
に図13に示す様なデータの並列処理システムが例えば
特開平3−105584号等に提案されている。即ち図
13に示されるデータの並列処理装置においては、デー
タ処理ユニット91、データの保持及び転送を行うトレ
イ151、各トレイの相互接続により構成されるシフト
レジスタ152、データ処理ユニットの第1の入力15
3、データ処理ユニットの第2の入力154、トレイ1
51の第1の入力155、トレイの第1の出力156、
トレイ2の第2の出力157とで構成されたものであ
る。
【0009】該データ処理ユニット91はデータの処理
を行い、トレイ151は転送の動作を行うものでシフト
レジスタ152 を構成して、データの巡回シフトを行
う。このシステムでは、m×n行列Aと要素数のベクト
ルxとの積を求める場合、行列Aの行数mが列数nより
小さい場合であっても、或いはmがnより大きい場合で
あっても、m個のデータ処理ユニットとn個のトレイを
用いてnに比例する処理時間でその積が実行可能とな
り、従って、良好な台数効果を得ることができる。すな
わち、図13に示すように、それぞれ2つの入力を持
ち、その入力間の乗算機能とその乗算結果の累積機能、
すなわち内積演算を実行するm個のデータ処理ユニット
91と、n個のトレイ151とからなる構成において、
ユニット内の累積レジスタをYとした場合に、データ処
理ユニットは153からの入力と154からの入力を掛
け合わせ、積を累積Yに足し込み、その後、シフトレジ
スタ152内の隣接するトレイ間でベクトルxの要素を
シフトする。この動作をn回繰り返すことにより、m×
nの行列Aと、n次元ベクトルとの乗算がm個のデータ
処理ユニットを用いてnに比例する処理時間で実行可能
となる。すなわち、このシステムでは、データ処理ユニ
ット91とデータ保持機能を有するトレイ151とを分
離することにより、それぞれmとnが異なっている場合
であっても、タイミングを合わせるための処理を必要と
せずに良好な台数効果を得ることが可能となる。さら
に、トレイ151間のデータ転送とデータ処理ユニット
91によるデータ処理とを同時並列的に行い、一般的に
はデータ処理ユニットがデータ処理に有する時間よりも
データ転送時間を短くすることが期待できる。
【0010】
【発明が解決しようとする課題】処で、上記従来の並列
データ処理システムに於いては、当該システムで使用さ
れる複数個のデータ処理手段91のそれぞれに、演算処
理の対象と成っている複数の標本データ全てを記憶させ
ておき、当該演算処理に必要とされる実行パラメータ
は、その全ての実行パラメータを当該データ処理手段9
1の数に適宜に分割して、その分割されたそれぞれの部
分実行パラメータを、当該データ処理手段91のそれぞ
れに記憶させるものである。
【0011】従って、係る従来の並列データ処理システ
ムに於いて、例えばニューロコンピューター演算を行う
場合を考えると、当該並列データ処理システム内の各デ
ータ処理手段91は、それぞれニューロンを構成するも
のであり、又それぞれのニューロンと接続しているシナ
プスに与えられる、例えばシグモイド関数で表される重
み付け係数の調整値である調整量を演算する場合、基本
的には、当該データ処理手段91に格納されている上記
両データに基づいて求めることであるが、係る調整量を
求める場合には、当該演算処理を実行する直前の調整量
データを使用する事、及び演算しようとする所定の標本
データの周辺の標本データに関する当該調整量も同時に
演算処理する必要があると言う原則から、当該データ処
理手段91が格納していない標本データに関する調整量
データを使用したい場合には、隣もしくは離れて配置さ
れた他のデータ処理手段91から、当該必要とされる調
整量データを読みだす必要があり、その為に、通信手段
を用いて、かかる必要なデータを獲得する必要がある。
【0012】その為、上記した係る従来の並列データ処
理システムに於いては、かなりの頻度で、通信手段を使
用する必要があるが、トレイ間のデータ転送とデータ処
理ユニットによるデータ処理とを同時並列的に行う事に
より見掛けの通信時間を0にできる。然しながら、かか
る手段処理システムに於いては、標本データの量に比例
して学習時間が増加する為、実行パラメータの量と比較
して大量の標本データを用いて学習する場合に、実行パ
ラメータの分割数に限りが有るために、標本データの量
を吸収するほどの並列度を持たせることが出来ず、膨大
な学習時間が必要で有った。
【0013】本発明の目的は、係る従来技術に於ける問
題を解決し、学習時間を短縮する為に十分な並列度を持
たせる事の出来る並列学習方式を有する並列データ処理
システムを提供するものである。
【0014】
【課題を解決するための手段】本発明は、上記した目的
を達成する為に、基本的には、以下に示す様な技術構成
を採用するものである。即ち、複数個のデータ処理手段
と、データ転送手段とからなり、且つ該データ処理手段
のそれぞれは、該データ転送手段に接続されている並列
データ処理装置に於いて、該データ処理手段のそれぞれ
には、データ処理に必要な実行パラメータ保持手段と所
定のデータ処理に必要とされる全標本データの少なくと
も一部を保持する部分標本データ保持手段とが設けられ
ており、該それぞれのデータ処理手段に於いて、当該デ
ータ処理手段に設けられている該部分標本データ保持手
段に保持されている部分標本データと該データ処理手段
に設けられている該実行パラメータ保持手段に保持され
ている実行パラメータとから、当該部分標本データにつ
いての当該実行パラメータに関する調整量を演算処理す
る調整量演算手段と、全ての標本データについての実行
パラメータの調整量の総和を演算して求めるに際し、所
定の該データ処理手段に於ける部分標本データについて
の当該実行パラメータに関する調整量を、前記データ転
送手段を介して他の当該データ処理手段に於ける部分標
本データについての当該実行パラメータに関する調整量
とを累積演算する累積手段とから構成されている並列デ
ータ処理システムである。
【0015】
【作用】本発明に係る並列データ処理システムは、上記
したような技術構成を採用しているので、前記した従来
の並列データ処理システムとは異なり、当該並列データ
処理システムを構成している複数個のデータ処理手段の
それぞれに、当該演算処理の対象と成っている全ての実
行パラメータを記憶させておき、当該演算処理に必要と
される、標本データの全てを当該データ処理手段の数に
適宜に分割して、その分割されたそれぞれの部分標本デ
ータを、当該データ処理手段のそれぞれに記憶させるも
のである。
【0016】つまり、本発明に係る該並列データ処理シ
ステムに於いては、前記した従来の並列データ処理シス
テムに於ける標本データと実行パラメータの格納方法及
び演算処理方法が異なるものであって、本発明に於いて
は、一つのデータ処理手段に格納されている部分標本デ
ータに付いては、当該データ処理手段に既に格納されて
いる全実行パラメータを用いて重み付け量の調整量に関
する演算処理を完結させる事が出来るので、係る演算処
理を実行する範囲に於いては、従来例の様に他のデータ
処理手段から必要な情報を獲得もしくは読出する為に、
通信手段を介してデータのやり取りを行う必要は全くな
く、当該演算処理の最後の工程に於いて、全体の調整量
を求めるに際して、各データ処理手段に於いて演算処理
した調整量の情報を累積する工程に於いてのみ、通信手
段を利用して各データ処理手段のデータを一回転送させ
る必要はあるが、係る工程に於いて必要とされる通信時
間は極めて僅かであり、従って、本発明に於ける演算処
理時間は従来の方式に比べて大幅に短縮出来る事にな
る。
【0017】つまり、本発明に於いては、標本データの
数の増加に応じて並列度を上げる事が可能となり、適応
システムの実行パラメータの数と比較して、標本データ
の数が多い場合に、従来技術と比較して学習時間の大幅
な短縮が可能となる。
【0018】
【実施例】以下に、本発明に係る並列データ処理システ
ムの具体例を図面を。参照しながら詳細に説明する。図
1は、本発明に係る並列データ処理システム10の構成
例の概略を示すブロックダイアグラムであり、図中、複
数個のデータ処理手段1、複数個の転送データ保持手段
2を内蔵するデータ転送手段3とからなり、且つ該デー
タ処理手段1のそれぞれは、該データ転送手段3内に設
けられた該転送データ保持手段2の一つに接続されてお
り、且つ、該並列データ処理装置10に於いて、該デー
タ処理手段1のそれぞれには、データ処理に必要な実行
パラメータ保持手段12と所定のデータ処理に必要とさ
れる全標本データの少なくとも一部を保持する部分標本
データ保持手段11とが設けられており、該それぞれの
データ処理手段1に於いて、当該データ処理手段1に設
けられている該部分標本データ保持手段11に保持され
ている部分標本データと該データ処理手段1に設けられ
ている該実行パラメータ保持手段12に保持されている
実行パラメータとから、当該部分標本データについての
当該実行パラメータに関する調整量を演算処理する調整
量演算手段14と、全ての標本データについての実行パ
ラメータの調整量の総和を演算して求めるに際し、所定
の該データ処理手段1に於ける演算結果を、前記データ
転送手段3内に設けられた前記転送データ保持手段2を
介して他の当該データ処理手段1に於ける演算結果と加
算演算する加算手段15とから構成されている並列デー
タ処理システムが示されている。
【0019】処で、上記した本発明に係るデータの並列
処理システムは、複数個の部分学習手段を同期的に用い
て学習を実行する、並列学習方式に関するものであり、
認識、予測、運動制御などに利用する学習処理を実時間
で実行することを主たる目的とする。そしてその基本的
構成は、実行パラメータと部分標本データを保持する1
つ以上の部分学習手段と、部分学習手段に入出力バスを
用いて接続された1つ以上の転送データ保持手段と、転
送データ保持手段に保持されているデータの転送を行な
うデータ転送手段を具備し、部分標本データについての
実行パラメータの調整量を通信することなしに計算し、
かつすべての標本データについての実行パラメータの調
整量の総和を求めるためにデータ転送手段を用いること
により、認識、予測、運動制御などに利用する学習処理
を高速に実行するように構成されているものである。
【0020】ここで、学習手段は、前記した本発明の基
本構成におけるデータ処理手段に相当するものである。
ここで、本発明に係るデータの並列処理システムにおい
て特にニューラルネットワークを用いて、特に複数個の
行列データを所定のアルゴリズムに従って演算処理する
場合の基本的処理方法について説明しておく。
【0021】つまり、一般的には、本発明のような認
識、予測、運動制御などを行なうシステムを実現するた
めには、システムの動作を明確に記述することが不可能
であったり、動作環境が変化するため、システムの動作
を規定する実行パラメータを、システムの実行前あるい
は実行中に調整する必要がある。
【0022】実行前あるいは実行中に実行パラメータの
調整を行なうシステムを適応システムと呼ぶ。かかる適
応システムの実行パラメータの調整手段としては、期待
されるシステムの入出力関係の標本データをもとに実行
パラメータを学習する手法が、有力であるために広く用
いられており、様々な学習方式が提案されている。
【0023】さらに、適応システムが、より柔軟で実世
界と対応したものになるためには、より大きなデータ量
を扱える必要があり、学習のための計算量は増大する方
向にある。また一方で、実世界と実時間で対応できる即
応性のあるシステムが望まれているために、増大する学
習計算量をより短い時間で処理する必要がある。
【0024】このため、適応システムにとって学習時間
の短縮は非常に重要な課題である。学習時間の短縮を実
現するための有力な技術として、学習処理の高速化を行
なう並列学習方式は重要な役割を果たしている。ここ
で、図2、及び図3を参照しながら、3層の階層型ニュ
ーラルネットワークの誤差逆伝播学習アルゴリズムにつ
いて簡単に説明しておく。
【0025】図2において、3層の階層型ニューラルネ
ットワークの入力層の状態をI、隠れ層の状態をH、出
力層の状態をOとする。入力層のニューロン数をNi
隠れ層のニューロン数をNh 、出力層のニューロン数を
o とすると、
【0026】
【数1】
【0027】上記の関係をより詳しく説明すると、図2
はニューロンモデルの複数を用いて入力層I、かくれ層
H、出力層Oの3層構造でニューロコンピュータを形成
する階層型のニューラルネットワークの概念図である。
第1層の入力層Iは入力信号I1 ,I2 ,…,IN(1)
入力する。第2層のかくれ層Hは各々のユニット、すな
わち、各々のニューロンモデルが第1層のすべてのニュ
ーロンモデルに接続され、その結合枝がシナプス結合で
あって、重み値Wijが与えられている。第3層の出力層
Oは同様にかくれ層Hの各ニューロンモデルの全てに各
々のユニットが接続されている。その出力は外部に出さ
れる。このニューラルネットにおいては学習時において
入力層Iに与えられる入力パターンの信号に対応する教
師データと出力層からの出力信号との誤差を求め、この
差が非常に小さくなるようにかくれ層Hと出力層との間
の重み及び第1層と第2層の間の重みを定めるようにす
る。このアルゴリズムがバックプロパゲーション法則、
すなわち逆伝播学習則と呼ばれるものである。逆伝播学
習則によって定められた重み値を保存し、例えばパター
ン認識等の連想処理を行う場合には、第1層の入力にて
認識するべきパターンからややずれた不完全なパターン
を与えると、出力層からそのパターンに対応した出力信
号が出力され、その信号は学習時に与えたそのパターン
に対応する教師データと非常に似たような信号が出てく
る。教師データとの差が非常に小さければ、その不完全
なパターンを認識したことになる。
【0028】図1のニューロコンピュータを用いてこの
ニューラルネットワークの動作を工学的に実現できる。
尚上記具体例において、それぞれのシナプスに与えられ
る重みは例えば図3に示す様にして予め求めておく。即
ち図3はニューロコンピュータにおいて処理の計算にお
ける基本素子であるニューロンモデルの例図である。ニ
ューロンモデルは入力X1 ,X2 ,…,Xn の各々にシ
ナプス結合としての重み時W1 ,W2 ,…,Wn をそれ
ぞれ掛け、その総和を求め、これを内部値Uとする。こ
のUに非線形関数fを施し、出力Yとする。ここで非線
形関数fは図に示すようなS型のシグモイド関数が一般
に使われる。上記した構成において、入力層Iのp番目
のニューロンと隠れ層Hのq番目のニューロンを接続す
るシナプスの重みをwpq (ih)とし、隠れ層Hのq番目の
ニューロンと出力層Oのr番目のニューロンを接続する
シナプスの重みをwqr (ho)とする。
【0029】重み行列を、W(ih),W(ho)とすると、
【0030】
【数2】
【0031】と書ける。又、入力層Iに入力データIが
入力されたときに、出力層Oの状態Oは次のように計算
される。 H=f(WT I) O=f(WT H) ここで、fは、ベクトルの各要素に前記したシグモイド
関数fを適用することを意味する。
【0032】シグモイド関数fは、例えば次のような関
数である。
【0033】
【数3】
【0034】ここで、Gはシグモイド関数のゲインを表
す。更に一般に、各標本データS(k) は、入力データI
(k) と、教師データT(k) の組として与えられる。
【0035】
【数4】
【0036】ここで、NP は標本データの数を、Ni
入力データの次元を、No は出力データあるいは教師デ
ータの次元を表す。本発明におけるデータ処理方法にお
いて学習の目的は、与えられた全ての標本データにたい
して、入力データから計算される出力データと教師デー
タの誤差が許容範囲内であるような、重みW(ih),W
(ho)を求めることである。
【0037】この様な重みを求める方法の例は前述した
特開平3−105584等に開示されている様なアルゴ
リズムを用いることにより、入力データから積和演算と
シグモイド関数を用いた計算とによって重みW(ih),W
(ho)が求められる。これを前向き処理と称している。一
方上述の方法で求めた重みに関して出力データと教師デ
ータとの誤差を最も小さくするために、かかる重みの調
整量ΔW(ih kh) ,ΔW(ho)(k) を求めることになるが
かかる演算には一般に知られている最急降下法を用いて
演算処理することによって求めることが可能である。か
かる重みの調整量ΔWを求める処理を前記処理とは異り
後向き処理(バックプロパゲーション)と称する。
【0038】即ち、ニューロコンピュータにおける学習
とはネットワークが所望の入出力関数を満たすようにな
るまで各ニューロンの重みを修正することである。学習
方法は所望の入力信号ベクトルと教師データベクトルと
の対を複数個、すなわち教師データの集合分だけ用意
し、その中から1対を選び、その入力信号Ip を学習対
象ネットワークに入力し、入力に対するネットワークの
出力と正しい出力信号、すなわちその入力信号に対応し
た教師データOp とを比較する。この差を誤差eと称す
るが、その誤差e、及びこの時の入出力信号の値を基
に、各ニューロンの重みを修正することになる。この過
程を教師データの集合中の全要素にわたり学習が収束す
るまで繰り返すものである。すなわち、入力パターンの
数の分だけ、すべて重み値として分布的に記憶すること
になる。この後ろ向き処理と呼ばれる重みの修正過程に
おいて出力層で得られた誤差を途中で変形しながら入力
層に向け通常の信号の流れる向きとは逆方向に伝播させ
る。これがバックプロパゲーションのアルゴリズムであ
る。このバックプロパゲーションに関する具体的演算例
も上記した特開平3−105584に詳細に説明されて
いる。
【0039】上記の各手法を用いることによって、標本
データS(k) =(I(k) ,T(k) )に対する重みの調整
量ΔW(ih)(k) ,ΔW(ho)(k) は、次のように計算され
る。
【0040】
【数5】
【0041】ここで、er (o)(k)はk番目の標本データ
に対する出力層のr番目のニューロンの誤差を表し、e
q (h)(k)はk番目の標本データに対する隠れ層のq番目
のニューロンの誤差を表している。また、ε(ih),ε
(ho)は、それぞれ入力層−隠れ層の重みの学習定数、隠
れ層−出力層の重みの学習定数を表している。学習は、
全ての標本データの出力層の誤差がある許容範囲内に収
まった時に完了する。すなわち、 |Or (k) −tr (k) |< allowance を満足した時に学習が完了する。ここで、allowa
nceは許容範囲を表す定数である。
【0042】又、Or (k) はk番目の標本データの入力
に対するr番目の出力層のニューロンの出力値であり、
r (k) は、k番目の標本データのr番目の出力層のニ
ューロンの出力の期待値である。標本データの出力層O
の誤差がある許容範囲内に収まっていない時には、重み
を調整して、学習を再開する。重みの調整は次の式で表
わされる。
【0043】 つまり、従来における並列データ処理システムにおけ
る、アルゴリズムは、図4に示される様なものであって
ステップ41においてデータ転送手段2を絶えず用いな
がら入力データから出力データを計算する前向き処理を
実行し、ステップ42において、その結果得られた出力
データにもとづいて教師データと該出力データとの誤差
を演算する。次でステップ43において後向き処理を行
い、データ転送手段を用いながら前記で得られた誤差を
もとに実行パラメータの調整分ΔWを累積する。その後
ステップ44に進みすべての標本データについて、上記
各ステップにおける演算をくり返したのちステップ45
に進み実行パラメータに前記ステップで得られた調整分
を加算する。
【0044】そしてこのステップをステップ46におい
て全ての標本データについて誤差が許容範囲内に収まる
まで繰り返すことになる。次に、ニューラルネットワー
クにおいて上記した複数のデータの並列演算処理を行う
場合の基本的な技術ベースにもとづいて、図5に示され
るデータ処理装置を用いて本発明に係るデータ処理シス
テムを実行する具体例を以下に説明する。図6は、図5
に示す本発明の並列データ処理システムを用いて本発明
の目的とする演算処理を行う手順の一例を示すフローチ
ャートである。尚図5中16は誤差の許容範囲設定手段
であり、17は学習定数を示すものとする。先ずスター
ト後、ステップ50で初期化を行う。このステップにお
いては、重みの調整量変数と誤差の最大値変数を初期化
する。
【0045】
【数6】
【0046】尚上記の式及び以下の各式において∀とΣ
はループ変数を用いて実現すると考える。次いでステッ
プ51において最初の標本データ(S)を選択するため
S=1と設定し、ステップ52に進んで前向き処理の演
算を開始する。即ちs番目の標本データ中の入力値と重
みから、以下の式により隠れ層Hおよび出力層Oのニュ
ーロンの出力値∀jhj ,∀k,ok と出力誤差∀k,
k out を計算する。
【0047】
【数7】
【0048】ここで、本具体例に使用されている各記号
の定義を以下に改めて示しておく。 (1)ニューロン間の接続の重み(実行パラメータ):
実行パラメータは Wij IH i=1…Ni j=1…Nhjk HO j=1…Nh k=1…No と表示され、ここでiは、入力層のニューロンのインデ
ックス(1からNi ) jは、隠れ層のニューロンのインデックス(1から
h ) kは、出力層のニューロンのインデックス(1から
o ) Wij IHは、入力層のニューロンiから隠れ層のニューロ
ンjへの接続の重みの大きさを表す。Wjk HO は、隠れ
層のニューロンjから出力層のニューロンkへの接続の
重みの大きさを表す。
【0049】プログラム実行前に、重みの初期値を設定
しておく。学習により、これらの重みを更新する。 (2)部分標本データ〔入力〕:各プロセッサに対し
て、pを固定した次のデータを設定する。 xi (s)(p) i=1…Ni,s =1…Nsk (s)(p) k=1…No,s =1…Ns iは、入力層のニューロンのインデックス(1から
i ) kは、出力層のニューロンのインデックス(1から
o ) sは、部分標本データ中の1つの標本データに対するイ
ンデックスを表す。(1からNs ) pは、プロセッサ(部分学習手段)に対するインデック
スを表す。(1からN p ) xi (s)(p)は、p番目のプロセッサに設定する部分標本
データのうち、s番目の標本データの、入力層のニュー
ロンiへの入力値を表す。
【0050】tk (s)(p)は、p番目のプロセッサに設定
する部分標本データのうち、s番目の標本データの、出
力層のニューロンkからの期待出力値を表す教師データ
である。プログラム実行前に、部分標本データを設定し
ておく。各プロセッサごとに、設定する部分標本データ
は異なる。
【0051】各プロセッサごとにNs 個の標本データを
設定する。全プロセッサ数はNp 個であるから、標本デ
ータ総数はNp s 個である。 (3)学習定数〔入力〕 εIH,εHO εIHは、入力層と隠れ層の間の接続の重みの学習定数で
あり、後向き処理における重みの調整量の更新の時に用
いる。
【0052】εHOは、隠れ層と出力層の間の接続の重み
の学習定数であり、後向き処理における重みの調整量の
更新の時に用いる。 (4)隠れ層Hのニューロンの出力値〔中間変数〕 hj j=1…Nh jは、隠れ層のニューロンのインデックス(1から
h ) hj は、隠れ層のニューロンjの出力の大きさを表す。 (5)出力層Oのニューロンの出力値〔中間変数〕 ok k=1…No kは、出力層のニューロンのインデックス(1から
o ) ok は、出力層のニューロンkの出力の大きさを表す。 (6)重みの調整量〔中間変数〕 ΔWij IH i=1…Ni j=1…Nh ΔWjk HO j=1…Nh k=1…No iは、入力層Iのニューロンのインデックス(1からN
i ) jは、隠れ層Hのニューロンのインデックス(1からN
h ) kは、出力層Oのニューロンのインデックス(1からN
o ) ΔWij IHは、入力層Iのニューロンiから隠れ層Hのニ
ューロンjへの接続の重みの調整量を表す。
【0053】ΔWjk HOは、隠れ層Hのニューロンjから
出力層Oのニューロンkへの接続の重みの調整量を表
す。学習により、全ての標本データについての重みの調
整量を累積する。調整量の総和を重みに加えることによ
り、重みを更新する。 (7)出力誤差〔中間変数〕 ek out kは、出力層Iのニューロンのインデックス(1からN
o ) ek out は、出力層Oのニューロンの出力誤差、すなわ
ち実際の出力と期待出力値つまり教師データの差を表
し、重みの調整量の計算に用いる。 (8)誤差の最大値〔中間変数〕 emax 出力層のニューロンの出力値と期待出力値(教師デー
タ)の誤差の最大値を格納するための変数。
【0054】学習を終了するかどうかの判定に用いる。 (9)出力層Oのニューロンの中間誤差〔中間変数〕 ek o kは、出力層Oのニューロンのインデックス(1からN
o ) ek o は、後向き処理において出力層Oのニューロンに
ついての中間誤差を表し、重みの調整量の計算に用い
る。 (10)隠れ層Hのニューロンの中間誤差〔中間変数〕 ej H jは、隠れ層Hのニューロンのインデックス(1からN
h ) ej H は、後向き処理において隠れ層Hのニューロンに
ついての中間誤差を表し、重みの調整量の計算に用い
る。
【0055】かかるステップ52の前向き処理において
は、前述した様に、複数個の各データ処理手段1のそれ
ぞれに、全部の実行パラメータを格納させる一方、標本
データについては、データ処理手段1の個数に応じて、
その数と等しい数に分割された部分標本データの1つを
格納させるものである。ここで部分標本データは必ずし
も同一数に分割されている必要はない。
【0056】次にステップ53に進み、ステップ52に
おいて得られた出力値に関し教師データと該出力値との
誤差∀k,ek out (=ok−tk (s)(p))の最大値を
記憶する。即ち、このステップでは出力誤差の最大のも
のを常に記憶しておく。
【0057】
【数8】
【0058】次にステップ54に進み、前記した後向き
処理を実行する。即ち、前工程において得られた誤差を
もとに重みの調整分ΔWを例えば最急降下法を用いて演
算しその結果を累積する。
【0059】
【数9】
【0060】上記各式は前述したΔWを求める基本的演
算方法と実質的に同一のものである。続いてステップ5
5に進み標本サンプル番号を1だけ歩進させ別の標本サ
ンプル番号Sを選択する。ステップ56で、選択された
標本サンプル番号Sが、部分標本サンプル数Ns より小
であれば、ステップ52に戻り上記した各ステップの演
算処理がくり返されるがステップ56でNOの場合、つ
まり部分標本サンプル数Ns 個の全てについての上記処
理が終了した場合にはステップ57に進み、調整量を求
めるの演算処理を終了させるかどうかを判定するための
演算処理に入る。つまり、ステップ57では、先ず各デ
ータ処理手段1が持っているそれぞれの部分標本データ
について、前記した出力誤差が許容範囲(allowa
nce)内にあるかどうかを判断し、全ての部分標本デ
ータについての誤差が、この許容範囲以内である場合
に、当該データ処理手段1における学習を終了する。
【0061】この場合、該データ処理手段1のエンドフ
ラグ(endflag)を例えば“TRUE”とする。
そして各プロセッサの持つ部分標本データについての出
力誤差がallowance以下である場合に、そのプ
ロセッサ(データ処理手段1)のendflagがTR
UEになる。
【0062】全てのプロセッサのエンドフラグ(end
flag)がTRUEとなっている場合に本発明におけ
る学習は終了する。つづいて各プロセッサは自分のen
dflagをドレイ2にセットして、バケツリレー式に
シフトして読み出すことにより、学習の終了条件オール
エンドフラグ(allendflag)を計算する。
【0063】本ステップの演算処理アルゴリズムの例を
示すと次の様になる。即ち if emax <allowance then endflag:=TRUE else endf
lag :=FALSE allendflag:=endflag tray:=endflag shift tray, allendflag:=allendflag AND tray …こ
れを(p−1)回繰り返す ここで“tray”とはデータ転送手段3を構成する転
送データ保持手段2を表わしておりプロセッサ間の通信
はこのトレイを介して行なう。トレイへの書き込み、読
み出し、シフトの3つの動作が行なえる。つまりステッ
プ57においては、全てのデータ処理手段1における部
分標本データに関する重みの累積分を、データ転送手段
3のシフトレジスタ機能を有する転送データ保持手段2
を作動させて全データを一回巡回させることにより、そ
の累積分の総和を計算する。
【0064】そしてステップ58に進み、演算結果が当
該演算処理操作を終了させる条件を満足するか否かが判
断される。即ち本発明における上記具体例においては、
学習の終了条件におけるallendflagがTRU
Eである場合に学習を終了する。つまり if allendflag ==TRUE then goto END である。
【0065】上記ステップ58においてYESである場
合、即ち上記終了条件が満足された場合には上記演算処
理は終了し、本ルーチンはENDとなる。一方、ステッ
プ58においてNOである場合には、ステップ59に進
み調整量の共有化処理を行ったのちステップ50に戻り
上述した全てのステップを繰り返すことになる。尚、ス
テップ59においては、各プロセッサの計算した、それ
ぞれの持つ部分標本データによる重みの調整量を、トレ
イ2を用いて共有化することにより、全標本データに対
する重みの調整量の総和を元の重みに加える。
【0066】これにより、全ての標本データに対する重
みの更新(学習)を行なったことになる。アルゴリズム
は∀i ,∀j について、以下を実行する。 tray:=ΔWij IH shift tray,Wij IH:=Wij IH+tray…これをp回繰り
返す 又∀j ,∀k について、以下を実行する。
【0067】tray:=ΔWjk HO shift tray,Wij HO:=Wjk HO+tray…これをp回繰り
返す 上記本発明に係るデータの並列処理システムにおける具
体例の演算処理速度と、前記した従来例(例えば特開平
−3−105584号に記載の方法)における演算処理
速度とを比較してみる。
【0068】ここで、3層の階層型ニューラルネットワ
ークについて、従来技術と本実施例1の学習性能の簡単
な評価をしてみる。全ての標本データについての重みの
調整量を求めるための時間Tを計算し、比較してみる。
従来技術の場合、部分実行パラメータの部分学習手段間
の通信時間は、積和演算と同時に行なうので、0と考え
ることができる。
【0069】T=Tf +Tb ここで、Tf は前向き処理にかかる時間、Tb は後向き
処理にかかる時間である。並列度を上げるための部分学
習手段の数Nl は充分にあるものとすると、 Nl =max(Ni ,Nh ,No ) の時に、データ転送手段による並列積和演算を行なうこ
とから、 Tf =cf p (Ni +Nh ) Tb =cb p (Nh +No ) ここで、cf は前向き処理での1つの重み当たりの平均
計算時間、cb は後向き処理での1つの重み当たりの平
均計算時間である。
【0070】本実施例の場合、重みの調整量を部分標本
データについて計算する間は、部分学習手段のなかで処
理が閉じているので通信時間は0である。ただし全ての
標本データについての1回分の処理の最後に1回だけ、
全体の重みの調整量を求めるために部分標本データによ
る部分的な重み調整量を全ての部分学習手段間で共有す
るために通信する必要がある。
【0071】従って、学習時間は、 T=Tf ’+Tb ’+Tcomm ここで、Tf ’は部分標本データによる前向き処理の計
算時間、Tb ’は部分標本データによる後向き処理の計
算時間、Tcommは全体の重みの調整量の総和を通信によ
り求めるための通信時間である。
【0072】さらに、
【0073】
【数10】
【0074】となる。ここで、比較を簡単にするため
に、全ての層のニューロン数が等しい。すなわち、 Ni =Nh =No =N の場合の学習時間を比較してみる。
【0075】従来技術の学習時間は、 Told =2Np N(cf +cb )∝Np N となり、標本データの数と1層当たりのニューロン数に
比例する。この時の部分学習手段の数Nopt は、 Nopt =N で与えられる。
【0076】本実施例の学習時間は、
【0077】
【数11】
【0078】上記の式の等号は、部分学習手段の最適な
数Nopt の時に成立する。
【0079】
【数12】
【0080】部分学習手段の数がNopt である時には、
本実施例の学習時間は、標本データの数の平方根と1層
当たりのニューロン数の2乗に比例する。従って、標本
データの数Np と1層当たりのニューロン数Nの間に、
関係
【0081】
【数13】
【0082】が成立している場合には、 Told ≧Tnew が成立する。一般に、実行パラメータの数、この場合は
1層当たりのニューロン数の2乗、に比べて、標本デー
タの数のほうがはるかに多いので、本発明の具体例の方
が従来にくらべて有効性があることが示された。
【0083】次に本発明に係る並列データ処理システム
における他の具体例(第2実施例)について説明する。
図7は本発明の第2の実施例の説明図であり、誤差逆伝
播学習を行なうニューロコンピュータを表している。図
中、図5で示したものと同一のものは同一の記号で示し
ている。
【0084】即ち本具体例(第2の実施例)と図5に示
す本発明の前記具体例(第1の実施例)との相異は、デ
ータ処理手段1に末尾標本データ保持手段18及び部分
標本データを調整量の更新に使用するかしないかを判断
する判定機構19が付加されているものでありその他の
構成は図5に示すものとほぼ同一である。つまり本発明
に係る第2の実施例では、基本的な演算処理手順は第1
の実施例と実質的に同じであるが、本実施例2では、部
分学習手段におのおのの標本データを調整分の累積に使
用するかどうかの判断機構を持たせることにより、標本
データの数Np が部分学習手段の数Nl の倍数でない場
合にも問題なく学習できる並列学習方式を実現してい
る。
【0085】つまり、第1の実施例では、部分標本デー
タNp の数が部分学習手段つまりデータ処理手段Nl
倍数と等しい場合を想定したものであるが、第2の実施
例では、部分標本データNp の数がデータ処理手段Nl
の数の倍数に一致しない場合の演算処理を行うことを想
定したものである。かかる状態においては、例えば部分
標本データNp の数がデータ処理手段Nlよりも小さい
場合には、かかるデータ処理手段のうちどれを使用し、
それを遊ばせておくかの判断が必要となる。
【0086】かかる演算処理のアルゴリズムは次の様に
なる。即ち、標本データの数Np は、部分学習手段の数
l の倍数とはならないから、 Np =kNl −r k:整数 0≦r<Nl が成立する。
【0087】kが部分標本データの数に対応すると考え
ると、実行パラメータ(重み)の調整分の累積時に、r
個の部分学習手段がそれぞれ1つのダミーの標本データ
を処理して、その時には調整分の累積を行なわないよう
にすれば、標本データの数N p が部分学習手段の数Nl
の倍数でない場合でも、調整分を正しく計算することが
できる。具体的には、末尾標本データ使用フラグ(en
duseflag)を導入するものであって、このフラ
グは、部分標本データのうち最後の標本データを学習に
使用するかどうかを示すフラグである。
【0088】末尾標本データ使用フラグは誤差の計算の
時に用い、もしenduseflag=FALSEなら
ば誤差を強制的に0に設定する。実際の演算処理におい
ては、部分標本データのうち最後の標本データについ
て、末尾標本データ使用フラグenduseflagを
参照して、下記のアルゴリズムによりその標本データを
学習に使用するかどうかを判断して、使用しない場合は
誤差を強制的に0にする。
【0089】if(s ==Ns)AN(Denduseflag ==FALS
E ) then ∀k,ek out =0 かかる演算処理の手順を示すフローチャートも図8に示
すように基本的には図6のフローチャートとほぼ同一で
あるが、異る点はステップ52がステップ52−Aとス
テップ52−Bに分けられており、まずステップ52−
Aでは、前述したと同じ前向き処理が行われる。次にス
テップ52−Bに進み、今対象となっている標本データ
を重みの調整に用いるかどうかを判断し、使用するので
あれば、そのままステップ53に進み、使用しないので
あれば誤差データを0としてステップ53に進むことに
なる。
【0090】
【発明の効果】以上説明したように、本発明によれば、
実行パラメータの量と比較して大量の標本データを用い
て学習させる場合に、従来の方法より大きな並列度を持
たせることができ、より短い時間で学習を実行できるた
め、適応システムの学習性能の向上に寄与するところが
大きい。
【図面の簡単な説明】
【図1】図1は、本発明に係る並列データ処理システム
の構成の一例を示すブロックダイアグラムである。
【図2】図2は、本発明に係る並列データ処理システム
で使用されるデータ処理手段の一態様であるニューロン
モデルの一例を示す図である。
【図3】図3は、図2に示されるニューロンモデルに於
ける入力と出力との関係を説明する図である。
【図4】図4は、従来に於ける並列データ処理システム
の演算処理手順の例を示すフローチャートである。
【図5】図5は、本発明に於ける並列データ処理システ
ムに係る第1の具体例の構成を示すブロックダイアグラ
ムである。
【図6】図6は、図5に示される本発明に係る並列デー
タ処理システムの演算処理手順の例を示すフローチャー
トである。
【図7】図7は、本発明に於ける並列データ処理システ
ムに係る第2の具体例の構成を示すブロックダイアグラ
ムである。
【図8】図8は、図7に示される本発明に係る並列デー
タ処理システムの演算処理手順の例を示すフローチャー
トである。
【図9】図9は、従来に於ける共通バス方式によるデー
タ処理システムの構成例を示すブロックダイアグラムで
ある。
【図10】図10は、従来に於けるリングシストリック
方式によるデータ処理システムの構成例を示すブロック
ダイアグラムである。
【図11】図11は、図10に示されるリングシストリ
ック方式によるデータ処理システムを実現させるための
回路構成例を示すブロックダイアグラムである。
【図12】図12は、従来に於けるリングシストリック
方式による他のデータ処理システムの構成例を示すブロ
ックダイアグラムである。
【図13】図13は、従来の別のデータ処理システムの
構成例を示すブロックダイアグラムである。
【符号の説明】
1…データ処理手段、部分学習手段 2…転送データ保持手段 3…データ転送手段 11…部分標本データ保持手段 12…実行パラメータ保持手段 13…入出力バス 14…調整量演算手段 15…加算手段 16…誤差許容範囲設定手段 17…学習定数 18…末尾標本データ保持手段 19…判断機構

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数個のデータ処理手段と、データ転送
    手段とからなり、且つ該データ処理手段のそれぞれは、
    該データ転送手段に接続されている並列データ処理装置
    に於いて、該データ処理手段のそれぞれには、データ処
    理に必要な実行パラメータ保持手段と所定のデータ処理
    に必要とされる全標本データの少なくとも一部を保持す
    る部分標本データ保持手段とが設けられており、該それ
    ぞれのデータ処理手段に於いて、当該データ処理手段に
    設けられている該部分標本データ保持手段に保持されて
    いる部分標本データと該データ処理手段に設けられてい
    る該実行パラメータ保持手段に保持されている実行パラ
    メータとから、当該部分標本データについての当該実行
    パラメータに関する調整量を演算処理する調整量演算手
    段と、全ての標本データについての実行パラメータの調
    整量の総和を演算して求めるに際し、所定の該データ処
    理手段に於ける部分標本データについての当該実行パラ
    メータに関する調整量を、前記データ転送手段を介して
    他の当該データ処理手段に於ける部分標本データについ
    ての当該実行パラメータに関する調整量とを累積演算す
    る累積手段とから構成されている事を特徴とする並列デ
    ータ処理システム。
  2. 【請求項2】 該複数個のデータ処理手段は、ニューラ
    ルネットワークを構成しているものである事を特徴とす
    る請求項1記載の並列データ処理システム。
  3. 【請求項3】 該各データ処理手段のそれぞれが、部分
    標本データについての当該実行パラメータの調整量を演
    算するに際して、それぞれのデータ処理手段が持ってい
    る部分標本データを、当該調整量の更新処理時に使用す
    るか否かを判断する判定機構が設けられている事を特徴
    とする請求項1及び2記載の並列データ処理システム。
JP5148017A 1993-06-18 1993-06-18 並列データ処理システム Pending JPH076146A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP5148017A JPH076146A (ja) 1993-06-18 1993-06-18 並列データ処理システム
DE4417932A DE4417932B4 (de) 1993-06-18 1994-05-24 Verfahren und ein System zum Erhalten von Zieleinstellbeträgen für Ausführungsparameter durch Lernen einer Mehrzahl von Sätzen von Muster-Eingabedaten und Muster-Ausgabedaten
US08/248,642 US5627944A (en) 1993-06-18 1994-05-25 Parallel data processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5148017A JPH076146A (ja) 1993-06-18 1993-06-18 並列データ処理システム

Publications (1)

Publication Number Publication Date
JPH076146A true JPH076146A (ja) 1995-01-10

Family

ID=15443247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5148017A Pending JPH076146A (ja) 1993-06-18 1993-06-18 並列データ処理システム

Country Status (3)

Country Link
US (1) US5627944A (ja)
JP (1) JPH076146A (ja)
DE (1) DE4417932B4 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016197389A (ja) * 2015-04-03 2016-11-24 株式会社デンソーアイティーラボラトリ 学習システム、学習プログラムおよび学習方法
JP2019537793A (ja) * 2016-10-27 2019-12-26 グーグル エルエルシー ニューラルネットワーク計算タイル
JP2022176964A (ja) * 2017-05-19 2022-11-30 株式会社半導体エネルギー研究所 半導体装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69628808T2 (de) * 1995-12-27 2004-05-06 Kabushiki Kaisha Toshiba, Kawasaki Datenverarbeitungssystem
US9015093B1 (en) 2010-10-26 2015-04-21 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US8775341B1 (en) 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US8510546B2 (en) 2011-03-29 2013-08-13 International Business Machines Corporation Run-ahead approximated computations
JP6347595B2 (ja) * 2013-11-25 2018-06-27 キヤノン株式会社 ロボット制御方法、及びロボット制御装置
US9996389B2 (en) 2014-03-11 2018-06-12 International Business Machines Corporation Dynamic optimization of workload execution based on statistical data collection and updated job profiling

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4942517A (en) * 1987-10-08 1990-07-17 Eastman Kodak Company Enhanced input/output architecture for toroidally-connected distributed-memory parallel computers
DE68926783T2 (de) * 1988-10-07 1996-11-28 Martin Marietta Corp Paralleler datenprozessor
JP2703010B2 (ja) * 1988-12-23 1998-01-26 株式会社日立製作所 ニユーラルネツト信号処理プロセツサ
EP0421639B1 (en) * 1989-09-20 1998-04-22 Fujitsu Limited Parallel data processing system
JP2825133B2 (ja) * 1989-09-20 1998-11-18 富士通株式会社 並列データ処理方式
JPH04293151A (ja) * 1991-03-20 1992-10-16 Fujitsu Ltd 並列データ処理方式
US5323335A (en) * 1991-07-05 1994-06-21 General Electric Co. Regular and fault-tolerant Kalman filter systolic arrays

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016197389A (ja) * 2015-04-03 2016-11-24 株式会社デンソーアイティーラボラトリ 学習システム、学習プログラムおよび学習方法
JP2019537793A (ja) * 2016-10-27 2019-12-26 グーグル エルエルシー ニューラルネットワーク計算タイル
US12455737B2 (en) 2016-10-27 2025-10-28 Google Llc Neural network compute tile
JP2022176964A (ja) * 2017-05-19 2022-11-30 株式会社半導体エネルギー研究所 半導体装置
US12190079B2 (en) 2017-05-19 2025-01-07 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device comprising operation circuits and a switch circuit

Also Published As

Publication number Publication date
US5627944A (en) 1997-05-06
DE4417932B4 (de) 2005-07-28
DE4417932A1 (de) 1994-12-22

Similar Documents

Publication Publication Date Title
US5506998A (en) Parallel data processing system using a plurality of processing elements to process data and a plurality of trays connected to some of the processing elements to store and transfer data
EP3669303B1 (en) Systolic neural network engine capable of backpropagation
JPH04290155A (ja) 並列データ処理方式
US5600843A (en) Ring systolic array system for synchronously performing matrix/neuron computation using data transferred through cyclic shift register connected in cascade of trays
CN112529166A (zh) 融合神经元模型、神经网络结构及训练、推理方法、存储介质和设备
US6654730B1 (en) Neural network arithmetic apparatus and neutral network operation method
US5479571A (en) Neural node network and model, and method of teaching same
CN110580519B (zh) 一种卷积运算装置及其方法
JPH0713949A (ja) ニューラルネットワークおよびその使用方法
US5592589A (en) Tree-like perceptron and a method for parallel distributed training of such perceptrons
EP0557997A2 (en) Information processing apparatus and information processing system
JPH076146A (ja) 並列データ処理システム
JPH05282272A (ja) ニューラルネットワーク並列分散処理装置
KR102866053B1 (ko) 시스톨릭 어레이를 갖는 신경망 연산 장치
CN109697511A (zh) 数据推理方法、装置及计算机设备
JP2760170B2 (ja) 学習機械
JP2001117900A (ja) ニューラルネットワーク演算装置
JP2825133B2 (ja) 並列データ処理方式
US20240220573A1 (en) Computing in Memory Accelerator for Applying to a Neural Network
JPH07210534A (ja) ニューラルネットワーク
JPH06110864A (ja) 学習処理装置
JPH05197707A (ja) 情報処理システム
US20250036963A1 (en) Constrained weight inference for online distributed learning
JP2765903B2 (ja) 情報処理装置
JP2766858B2 (ja) ニューラルネットワーク並列シミュレーション方法及びそれに用いる装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020709