JPH0447482A - 神経回路網型計算装置 - Google Patents
神経回路網型計算装置Info
- Publication number
- JPH0447482A JPH0447482A JP15277090A JP15277090A JPH0447482A JP H0447482 A JPH0447482 A JP H0447482A JP 15277090 A JP15277090 A JP 15277090A JP 15277090 A JP15277090 A JP 15277090A JP H0447482 A JPH0447482 A JP H0447482A
- Authority
- JP
- Japan
- Prior art keywords
- layer
- unit
- neural network
- output
- processors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔目 次]
概要
産業上の利用分野
従来の技術 (第5図〜第6図)発明が解決し
ようとする課題 課題を解決するための手段 作用 実施例 本発明の全体的なシステム構成の説明 (第11) 本発明の一実施例 (第2図〜第4図)発明の効果 〔概 要〕 多層構造型の神経回路網型計算装置に関し、計算の高速
化を達成すると共に、要素プロセサ間の配線を簡略化す
ることを目的とし、入力層、少なくとも1層の中間層お
よび出力層で構成された多層構造型の神経回路網型計算
装置であって、前記入力層を構成するユニット、前記中
間層を構成するユニットおよび前記出力層を構成するユ
ニットのそれぞれの機能を有し、リング網として構成さ
れた複数の要素プロセッサと、該各要素プロセッサに対
してそれぞれ設けられた複数のローカルメモリとを具備
し、前記複数の要素プロセッサによりバックプロパゲー
ジジン法による学習機能を並列に実行するように構成す
る。
ようとする課題 課題を解決するための手段 作用 実施例 本発明の全体的なシステム構成の説明 (第11) 本発明の一実施例 (第2図〜第4図)発明の効果 〔概 要〕 多層構造型の神経回路網型計算装置に関し、計算の高速
化を達成すると共に、要素プロセサ間の配線を簡略化す
ることを目的とし、入力層、少なくとも1層の中間層お
よび出力層で構成された多層構造型の神経回路網型計算
装置であって、前記入力層を構成するユニット、前記中
間層を構成するユニットおよび前記出力層を構成するユ
ニットのそれぞれの機能を有し、リング網として構成さ
れた複数の要素プロセッサと、該各要素プロセッサに対
してそれぞれ設けられた複数のローカルメモリとを具備
し、前記複数の要素プロセッサによりバックプロパゲー
ジジン法による学習機能を並列に実行するように構成す
る。
本発明はニューラルネットワーク(神経回路網)のハー
ドウェアシミュレータに関し、特に、多層構造型の神経
回路網型計算装置に関する。
ドウェアシミュレータに関し、特に、多層構造型の神経
回路網型計算装置に関する。
近年、ニューロ技術の応用の要求に伴って、高速なニュ
ーロ動作が可能な神経回路網型計算装置が要望されてい
る。
ーロ動作が可能な神経回路網型計算装置が要望されてい
る。
第5図は多層構造型の神経回路網型計算装置を示す図で
あり、入力層、中間層および出力層の三層で構成された
ニューラルネットワークを示すものである。
あり、入力層、中間層および出力層の三層で構成された
ニューラルネットワークを示すものである。
第5図に示されるように、多層構造型のニューラルネッ
トワークは、ニューロンを模擬したユニットと呼ばれる
素子Uと、それらを結ぶ結線りとから構成される。すな
わち、ニューラルネットワークは、ユニットI11.〜
II、を有する入力層、ユニットMU+〜MU、を有す
る中間層、および、ユニッ) 00.〜OU、を有する
出力層の3つの層から構成される。各ユニットは、同じ
層のユニットとの間には結合はなく、一つ下(上)の層
のすべてのユニットと結合している。例えば、中間層の
ユニットMU、は、入力層の全てのユニットIU I”
”” IIJ bと結線し4によって結ばれ、また、例
えば、出力層のユニットOU+ は、中間層の全てのユ
ニットMU、〜MU、と結線LMOによって結ばれてい
る。ここで、入力層は外部からの入力を受は取る層であ
り、出力層はニューラルネットワークの応答を外部へ出
力する層である。また、中間層は、人力層からの信号を
加工して出力層に渡す層である。そして、中間層は、ニ
ューラルネットワークによっては複数の層から構成され
ることもある。
トワークは、ニューロンを模擬したユニットと呼ばれる
素子Uと、それらを結ぶ結線りとから構成される。すな
わち、ニューラルネットワークは、ユニットI11.〜
II、を有する入力層、ユニットMU+〜MU、を有す
る中間層、および、ユニッ) 00.〜OU、を有する
出力層の3つの層から構成される。各ユニットは、同じ
層のユニットとの間には結合はなく、一つ下(上)の層
のすべてのユニットと結合している。例えば、中間層の
ユニットMU、は、入力層の全てのユニットIU I”
”” IIJ bと結線し4によって結ばれ、また、例
えば、出力層のユニットOU+ は、中間層の全てのユ
ニットMU、〜MU、と結線LMOによって結ばれてい
る。ここで、入力層は外部からの入力を受は取る層であ
り、出力層はニューラルネットワークの応答を外部へ出
力する層である。また、中間層は、人力層からの信号を
加工して出力層に渡す層である。そして、中間層は、ニ
ューラルネットワークによっては複数の層から構成され
ることもある。
第6図は第5図の多層構造型の神経回路網型計算装置に
使用する各ユニッ)Uを示す図である。
使用する各ユニッ)Uを示す図である。
第6図に示されるように、ユニット間の結合はそれぞれ
重みを持っている。各ユニット(入力層のユニットは除
く)の働きは、1つ下の層のユニットからの出力(V+
””Vfi)と、そのユニットU、との間の結合の重み
(−81〜−4n)との積を取ったもの(’bW=+〜
VJ、、)を、すべてのユニットに渡って総和(Σ)を
取り、さらに、成る闇値を加えた量にシグモイド関数と
呼ばれる非線形関数(f)を施したものを出力するよう
になっている。ここで、第に層(ただし入力層は除く)
のi番目のユニットUi”ゝの働きを弐で表すと次のよ
うになる。
重みを持っている。各ユニット(入力層のユニットは除
く)の働きは、1つ下の層のユニットからの出力(V+
””Vfi)と、そのユニットU、との間の結合の重み
(−81〜−4n)との積を取ったもの(’bW=+〜
VJ、、)を、すべてのユニットに渡って総和(Σ)を
取り、さらに、成る闇値を加えた量にシグモイド関数と
呼ばれる非線形関数(f)を施したものを出力するよう
になっている。ここで、第に層(ただし入力層は除く)
のi番目のユニットUi”ゝの働きを弐で表すと次のよ
うになる。
vl(k)=f(Σw=J(k−1) y 、 (k−
+)−θ%kl)j(1) f (x) −’A (1+tanh (x/xo
)l (2)ただし、v JLk川)は第(k−1)
層のj番目のユニットの出力であり、w 、 、 L
k + 1は第に層のi番目のユニットと第(k−1)
層のj番目のユニットとの間の結合の重みである。また
、θ−klはこのユニットの闇値である。さらに、(2
)式はシグモイド関数を表しており、Xoはシグモイド
関数の形状を決める定数である。
+)−θ%kl)j(1) f (x) −’A (1+tanh (x/xo
)l (2)ただし、v JLk川)は第(k−1)
層のj番目のユニットの出力であり、w 、 、 L
k + 1は第に層のi番目のユニットと第(k−1)
層のj番目のユニットとの間の結合の重みである。また
、θ−klはこのユニットの闇値である。さらに、(2
)式はシグモイド関数を表しており、Xoはシグモイド
関数の形状を決める定数である。
多層構造のニューラルネットワークは、入力データに対
してニューラルネットワークの出力と、ニューラルネッ
トワークが出力すべき正解データとの差(誤差)が小さ
くなるように、ユニット間の結合の重みを変化させてい
くことによって学習する。この学習のアルゴリズムとし
ては、バックプロパゲーション法が広く知られている。
してニューラルネットワークの出力と、ニューラルネッ
トワークが出力すべき正解データとの差(誤差)が小さ
くなるように、ユニット間の結合の重みを変化させてい
くことによって学習する。この学習のアルゴリズムとし
ては、バックプロパゲーション法が広く知られている。
このバックプロパゲーション法では、結合の重みは次の
ように修正される。
ように修正される。
ここで、Δwi j ”’ (n)は第に層のi番目の
ユニットと、第(k−1)層のj番目のユニットとの間
の結合の重みwl、Tkl (n)の修正量で、(4)
式または(5)式によって与えられる。
ユニットと、第(k−1)層のj番目のユニットとの間
の結合の重みwl、Tkl (n)の修正量で、(4)
式または(5)式によって与えられる。
である。ここでη及びαは学習定数と呼ばれる定数であ
る。(5)式でΣ、というのは、ネットワークに学習さ
せるすべてのパターンpについて総和をとるということ
を示している。つまり(4)式はネットワークに1つの
パターンを1度学習させるたびに重みを修正するという
ことを示し、(5)式はネットワークにすべてのパター
ンを1度ずつ学習させてから重みを修正するということ
を示している。
る。(5)式でΣ、というのは、ネットワークに学習さ
せるすべてのパターンpについて総和をとるということ
を示している。つまり(4)式はネットワークに1つの
パターンを1度学習させるたびに重みを修正するという
ことを示し、(5)式はネットワークにすべてのパター
ンを1度ずつ学習させてから重みを修正するということ
を示している。
また、出力層のユニットに対してはδは次のように与え
られる。
られる。
ここで1.は出力層のi番目のユニットが出力すべき教
師データである。また中間層のユニットに対してδは、 υ で与えられる。
師データである。また中間層のユニットに対してδは、 υ で与えられる。
上述した多層構造型の神経回路網型計算装置において、
神経回路網の計算には、上に示したような多くの積和演
算や関数計算を、全てのユニットに対して行わねばなら
ない。従来は、この計算をプログラムを作成して計算機
に行わせていたため、計算が全てのユニットに対して逐
次的に行われ、計算に長い時間を要していた。またプロ
セッサを多数並べて並列に計算を行わせる場合でも、各
ユニットは上下の層の全てのユニットと結合しているた
め、プロセッサ間相互の配線もボトルネックになってい
た。
神経回路網の計算には、上に示したような多くの積和演
算や関数計算を、全てのユニットに対して行わねばなら
ない。従来は、この計算をプログラムを作成して計算機
に行わせていたため、計算が全てのユニットに対して逐
次的に行われ、計算に長い時間を要していた。またプロ
セッサを多数並べて並列に計算を行わせる場合でも、各
ユニットは上下の層の全てのユニットと結合しているた
め、プロセッサ間相互の配線もボトルネックになってい
た。
本発明は、上述した課題に鑑み、計算の高速化を達成す
ると共に、要素プロセッサ間の配線を簡略化することを
目的とする。
ると共に、要素プロセッサ間の配線を簡略化することを
目的とする。
第1図は本発明に係る神経回路網型計算装置の全体的な
システム構成を示す図である。
システム構成を示す図である。
本発明によれば、入力層、少なくとも1層の中間層およ
び出力層で構成された多層構造型の神経回路網型計算装
置であって、前記入力層を構成するユニット、前記中間
層を構成するユニットおよび前記出力層を構成するユニ
ットのそれぞれの機能を有し、リング網として構成され
た複数の要素プロセッサPEと、該各要素プロセッサに
対してそれぞれ設けられた複数のローカルメモリ聞とを
具備し、前記複数の要素プロセッサによりバックプロパ
ゲーション法による学習機能を並列に実行するようにし
たことを特徴とする神経回路網型計算装置が提供される
。
び出力層で構成された多層構造型の神経回路網型計算装
置であって、前記入力層を構成するユニット、前記中間
層を構成するユニットおよび前記出力層を構成するユニ
ットのそれぞれの機能を有し、リング網として構成され
た複数の要素プロセッサPEと、該各要素プロセッサに
対してそれぞれ設けられた複数のローカルメモリ聞とを
具備し、前記複数の要素プロセッサによりバックプロパ
ゲーション法による学習機能を並列に実行するようにし
たことを特徴とする神経回路網型計算装置が提供される
。
本発明の神経回路網型計算装置によれば、複数の要素プ
ロセッサPEは、リング網として構成され、該各要素プ
ロセッサPEは、入力層を構成するユニット、中間層を
構成するユニットおよび出力層を構成するユニットのそ
れぞれの機能を有するようになっている。複数のローカ
ルメモリLMは、各要素プロセッサPEに対して設けら
でいる。そして、リング網構成の複数の要素プロセッサ
PEによりバックプロパゲーション法の学習機能を並列
的に実行することによって、計算の高速化を達成すると
共に、要素プロセッサPE間の配線を簡略化することが
できる。
ロセッサPEは、リング網として構成され、該各要素プ
ロセッサPEは、入力層を構成するユニット、中間層を
構成するユニットおよび出力層を構成するユニットのそ
れぞれの機能を有するようになっている。複数のローカ
ルメモリLMは、各要素プロセッサPEに対して設けら
でいる。そして、リング網構成の複数の要素プロセッサ
PEによりバックプロパゲーション法の学習機能を並列
的に実行することによって、計算の高速化を達成すると
共に、要素プロセッサPE間の配線を簡略化することが
できる。
すなわち、本発明の神経回路網型計算装置によれば、各
要素プロセッサPEに乗算器11およびAL012を搭
載して高速な積和演算を実行することが可能である。さ
らに、データを格納するための口−カルメモリLMと、
データを一時的に保存するレジスタ14.シグモイド関
数を計算する機能等(13)を持った要素プロセッサP
Eとを複数個並べて1次元のリング網を構成して神経回
路網の計算を並列に行って積和演算の順序を入れ換え、
また、各要素プロセッサPEが共通に必要とするデータ
をリング網を通じて転送することによって、計算の高速
化を達成すると共に、要素プロセッサPE間の配線を簡
略化することができる。
要素プロセッサPEに乗算器11およびAL012を搭
載して高速な積和演算を実行することが可能である。さ
らに、データを格納するための口−カルメモリLMと、
データを一時的に保存するレジスタ14.シグモイド関
数を計算する機能等(13)を持った要素プロセッサP
Eとを複数個並べて1次元のリング網を構成して神経回
路網の計算を並列に行って積和演算の順序を入れ換え、
また、各要素プロセッサPEが共通に必要とするデータ
をリング網を通じて転送することによって、計算の高速
化を達成すると共に、要素プロセッサPE間の配線を簡
略化することができる。
以下、図面を参照して本発明に係る神経回路網型計算装
置の一実施例を説明する。
置の一実施例を説明する。
第1図は本発明に係る神経回路網型計算装置の全体的な
システム構成を示す図であり、第2図は本発明の神経回
路網型計算装置における要素プロセッサへのユニットの
割り当てを説明するための図である。
システム構成を示す図であり、第2図は本発明の神経回
路網型計算装置における要素プロセッサへのユニットの
割り当てを説明するための図である。
本実施例の神経回路網型計算装置は、第2図に示される
ように、中間層が1層だけで、各層のユニットの数は入
力層が6個、中間層が6個、出力層が3個となっており
、また、要素プロセッサは3個となっている。
ように、中間層が1層だけで、各層のユニットの数は入
力層が6個、中間層が6個、出力層が3個となっており
、また、要素プロセッサは3個となっている。
すなわち、第2図に示されるように、各要素プロセッサ
PEI 、PEZ、PE3が受は持つ各層のユニットの
割り当ては、要素プロセッサPE、に対して入力層のユ
ニットIU、、IU、、中間層のユニットMLI、 M
U2および出力層のユニッ)00.が割り当てられ、要
素プロセッサPE2に対して人力層のユニットIU、。
PEI 、PEZ、PE3が受は持つ各層のユニットの
割り当ては、要素プロセッサPE、に対して入力層のユ
ニットIU、、IU、、中間層のユニットMLI、 M
U2および出力層のユニッ)00.が割り当てられ、要
素プロセッサPE2に対して人力層のユニットIU、。
10、、中間層のユニットMTJ、、MU4および出力
層のユニットOUtが割り当てられ、そして、要素プロ
セッサPE、に対して入力層のユニッ) rus、 I
O2,中間層のユニッ)MIJS、Mtl、および出力
層のユニッ) OU3が割り当てられるようになってい
る。ここで、各要素プロセッサPE1.PEz、PEs
に対応するローカルメモリ(LMI、LMZ、LM:l
)には、予め必要なデータ(入力データ、教師データ、
重みの初期値等)がロードされているものとする。また
、各層のユニットを割り当てるための要素プロセッサの
数が必要以上に多いと、各要素プロセッサ間で順次デー
タを転送するのに要する時間が長くなり、また、要素プ
ロセッサの数が少な過ぎると、並列処理することによる
計算時間の短縮の効果が薄くなる。
層のユニットOUtが割り当てられ、そして、要素プロ
セッサPE、に対して入力層のユニッ) rus、 I
O2,中間層のユニッ)MIJS、Mtl、および出力
層のユニッ) OU3が割り当てられるようになってい
る。ここで、各要素プロセッサPE1.PEz、PEs
に対応するローカルメモリ(LMI、LMZ、LM:l
)には、予め必要なデータ(入力データ、教師データ、
重みの初期値等)がロードされているものとする。また
、各層のユニットを割り当てるための要素プロセッサの
数が必要以上に多いと、各要素プロセッサ間で順次デー
タを転送するのに要する時間が長くなり、また、要素プ
ロセッサの数が少な過ぎると、並列処理することによる
計算時間の短縮の効果が薄くなる。
次に、計算の流れを概略する。この計算の流れは、(1
)人力層→中間層の前向き積和演算、(2)中間層ユニ
・ントのシグモイド関数計算、〔3)中間層→出力層の
前向き積和演算、(4)出力層ユニットのシグモイド関
数計算、(5)出力層ユニットの誤差計算、(6)出力
層→中間層の後向き誤差伝搬計算、(7)中間層ユニッ
トの誤差計算、および、(8)重みの修正の計算の順で
行われる。
)人力層→中間層の前向き積和演算、(2)中間層ユニ
・ントのシグモイド関数計算、〔3)中間層→出力層の
前向き積和演算、(4)出力層ユニットのシグモイド関
数計算、(5)出力層ユニットの誤差計算、(6)出力
層→中間層の後向き誤差伝搬計算、(7)中間層ユニッ
トの誤差計算、および、(8)重みの修正の計算の順で
行われる。
第3図は第2図の神経回路網型計算装置における動作を
説明するための図である。第2図および第3図を参照し
て、上記(1)〜(8)の計算方法について順に説明す
る。
説明するための図である。第2図および第3図を参照し
て、上記(1)〜(8)の計算方法について順に説明す
る。
(1)入力層→中間層の前向き積和演算まず、第2図に
示されるように、左端の要素プロセッサPEt は1番
目と2番目の中間層ユニットMU+ 、 Mugの計算
を担当し、中央の要素プロセッサPEzは3番目と4番
目の中間層ユニットMLI、、MU。
示されるように、左端の要素プロセッサPEt は1番
目と2番目の中間層ユニットMU+ 、 Mugの計算
を担当し、中央の要素プロセッサPEzは3番目と4番
目の中間層ユニットMLI、、MU。
の計算を担当し、そして、右端の要素プロセッサPE、
は5番目と6番目の中間層ユニットMUS、MU6の計
算を担当するが、最初は、それぞれ1番目3番目、5番
目の中間層ユニットMU+ 、 M[IzlMllsの
計算から始め、次いで、2番目、4番目、6番目の中間
層ユニットMUD、 MU41MIJ6の計算を行うよ
うになっている。
は5番目と6番目の中間層ユニットMUS、MU6の計
算を担当するが、最初は、それぞれ1番目3番目、5番
目の中間層ユニットMU+ 、 M[IzlMllsの
計算から始め、次いで、2番目、4番目、6番目の中間
層ユニットMUD、 MU41MIJ6の計算を行うよ
うになっている。
まず、各要素ユニ・ントPE+ 、 PEA、 PH3
は、対応するローカルメモリLM+、LMz、Ltbか
ら、それぞれが受は持っている入力層ユニットのうち、
1番目。
は、対応するローカルメモリLM+、LMz、Ltbか
ら、それぞれが受は持っている入力層ユニットのうち、
1番目。
3番目、5番目のユニットIU+ 、 IO2,IUS
の出力v、 Tll 、 ■3(11、y 5(1)
オヨヒ、ソノ入力層ユニットの間の結合の重みwl+”
’、w、3(1)、W、5(1)を読み込む。そして、
それらの積を計算する(第3図(a)参照)。
の出力v、 Tll 、 ■3(11、y 5(1)
オヨヒ、ソノ入力層ユニットの間の結合の重みwl+”
’、w、3(1)、W、5(1)を読み込む。そして、
それらの積を計算する(第3図(a)参照)。
次に、読み込んだ入力層ユニットの出力V、(1)■、
+11.■、(11を右隣の要素プロセッサに転送する
。各要素プロセンサPEI、PE2.PE:lは、左隣
の要素プロセッサから送られて来るデータに対応した重
みデータwls”ン、 w 3. ” 、 w 5.
” を。−カルメモリLMI、LM2.LM:lから読
み込み、それらの積を計算して、先はどの結果と加え合
わせる(第3図(b)参照)。さらに、もう−度、入カ
ニニットの出力を右隣の要素ユニットに転送し、同様に
重みデータと掛は合わせて加え合わせる(第3図(c)
参照)、ここで、第3図(a)〜(C)において、ロー
カルメモリLM+ 、 LM2.L?hから要素プロセ
ッサPE、。
+11.■、(11を右隣の要素プロセッサに転送する
。各要素プロセンサPEI、PE2.PE:lは、左隣
の要素プロセッサから送られて来るデータに対応した重
みデータwls”ン、 w 3. ” 、 w 5.
” を。−カルメモリLMI、LM2.LM:lから読
み込み、それらの積を計算して、先はどの結果と加え合
わせる(第3図(b)参照)。さらに、もう−度、入カ
ニニットの出力を右隣の要素ユニットに転送し、同様に
重みデータと掛は合わせて加え合わせる(第3図(c)
参照)、ここで、第3図(a)〜(C)において、ロー
カルメモリLM+ 、 LM2.L?hから要素プロセ
ッサPE、。
PE、、PH3に向かう矢印は、該ローカルメモリから
要素プロセッサに読み込んだデータを示し、また、要素
プロセッサPHI、PHA、PE3からローカルメモリ
LM+、LMz、LM:+に向かう矢印は、該要素プロ
セッサからローカルメモリに書き込むデータを示す。さ
らに、隣接する要素プロセッサ間の矢印(PE、→PE
、。
要素プロセッサに読み込んだデータを示し、また、要素
プロセッサPHI、PHA、PE3からローカルメモリ
LM+、LMz、LM:+に向かう矢印は、該要素プロ
セッサからローカルメモリに書き込むデータを示す。さ
らに、隣接する要素プロセッサ間の矢印(PE、→PE
、。
PEz→PH,、PH,→PE、)は、隣接する要素プ
ロセッサ間で転送されるデータを示している。この関係
は、第3図の全ての図においても同様であり、各図に於
ける参照符号は、読み出し、書き込みおよび転送される
データを示している。
ロセッサ間で転送されるデータを示している。この関係
は、第3図の全ての図においても同様であり、各図に於
ける参照符号は、読み出し、書き込みおよび転送される
データを示している。
次に、残りの2番目、4番目、6番目の入力層ユニット
IU2. Il4.Il6の出力v、 (+1 、
v4(+1■6(I) を読み込み、第3図(a)〜(
c)と同様に、重みデータw、”’+w+4”’、wS
th(I’ と(D積を加え合わせる(第3図(d)
〜Cf) 参照)、これによって、入力層ユニッ) I
U+−IUi(第2図参照)の出力の加重和が計算され
、その結果u、 Tel 、 u、 +11u、(Hを
ローカルメモリLMI、LMZ、LM3に出力する(第
3図軸)参照)。各要素プロセッサが担当する残りの中
間層ユニットの計算も同様に行って、その結果。、(り
、 u、(り、 u、(”) もローカルメモリに出
力する(第3図(h)参照)。
IU2. Il4.Il6の出力v、 (+1 、
v4(+1■6(I) を読み込み、第3図(a)〜(
c)と同様に、重みデータw、”’+w+4”’、wS
th(I’ と(D積を加え合わせる(第3図(d)
〜Cf) 参照)、これによって、入力層ユニッ) I
U+−IUi(第2図参照)の出力の加重和が計算され
、その結果u、 Tel 、 u、 +11u、(Hを
ローカルメモリLMI、LMZ、LM3に出力する(第
3図軸)参照)。各要素プロセッサが担当する残りの中
間層ユニットの計算も同様に行って、その結果。、(り
、 u、(り、 u、(”) もローカルメモリに出
力する(第3図(h)参照)。
(2)中間層ユニットのシグモイド関数計算上述した(
1)で計算された入力層ユニットの出力の加重和をロー
カルメモリLM+、LMz、LM3から読み込み、要素
プロセッサPE+、PEz、PE+においてシグモイド
関数fを施して結果を再びローカルメモリLM+、LM
z、LM3に書き込む(第3図(i)〜(D参照)(3
) 、 (4) 中間層→出力層の前向き積和演算お
よび出力層ユニットのシグモイド関数計算前述した(1
)と同様に、要素プロセッサPE、、PH1゜PE、に
おいて、中間層ユニットの出力をローカルメモリLMI
、LMZ、LM3から読み込んで加重和をとり、さらに
、シグモイド関数fを施してローカルメモリLM +
、 LMz 、LM3に書き込む(第3図(k)参照)
。
1)で計算された入力層ユニットの出力の加重和をロー
カルメモリLM+、LMz、LM3から読み込み、要素
プロセッサPE+、PEz、PE+においてシグモイド
関数fを施して結果を再びローカルメモリLM+、LM
z、LM3に書き込む(第3図(i)〜(D参照)(3
) 、 (4) 中間層→出力層の前向き積和演算お
よび出力層ユニットのシグモイド関数計算前述した(1
)と同様に、要素プロセッサPE、、PH1゜PE、に
おいて、中間層ユニットの出力をローカルメモリLMI
、LMZ、LM3から読み込んで加重和をとり、さらに
、シグモイド関数fを施してローカルメモリLM +
、 LMz 、LM3に書き込む(第3図(k)参照)
。
(5)出力層ユニットの誤差計算
ローカルメモリLM+ 、 LMz、 LM3から出力
層ユニッ)OU+、OUz、OU3の出力v 、 (:
Il 、 v2(3+ 、 v 、 (3)およびそ
の出カニニットに対応する教師データLl+tz、t3
を読み込み、(6)式に従って出力層ユニットの誤差δ
1゜′を計算し、その結果δ T316 (31,δ3
(3) をローカルメモリLM+、LMz、L?I+に
書き込む(第3図(1)〜(m)参照)。
層ユニッ)OU+、OUz、OU3の出力v 、 (:
Il 、 v2(3+ 、 v 、 (3)およびそ
の出カニニットに対応する教師データLl+tz、t3
を読み込み、(6)式に従って出力層ユニットの誤差δ
1゜′を計算し、その結果δ T316 (31,δ3
(3) をローカルメモリLM+、LMz、L?I+に
書き込む(第3図(1)〜(m)参照)。
(6)出力層→中間層の後向き誤差伝搬計算ここでは、
(7)式の右辺の積和の項の計算を行う。最初は、各要
素プロセッサはそれぞれ1番目、3番目、5番目の中間
層ユニットMU1.MU31MUSの計算を行う。まず
、ローカルメモリLMI、LM2.LM3から出カニニ
ット001.OUZ、003の誤差δ1(3)δ (3
1,δ、′3)とそれに対応する重みデータwll”w
23 ” 、 w 3S ” を読み込み、その積を
計算する(第3図(n)参照)。ここで、前向きの積和
演算の場合と異なり、計算された積を右隣の要素プロセ
ッサに転送する。
(7)式の右辺の積和の項の計算を行う。最初は、各要
素プロセッサはそれぞれ1番目、3番目、5番目の中間
層ユニットMU1.MU31MUSの計算を行う。まず
、ローカルメモリLMI、LM2.LM3から出カニニ
ット001.OUZ、003の誤差δ1(3)δ (3
1,δ、′3)とそれに対応する重みデータwll”w
23 ” 、 w 3S ” を読み込み、その積を
計算する(第3図(n)参照)。ここで、前向きの積和
演算の場合と異なり、計算された積を右隣の要素プロセ
ッサに転送する。
2番目の要素プロセッサPE2には、1番目の中間層ユ
ニットMU+ の途中のデータδ (2) ’が送られ
てくるが、この要素プロセッサPE、は、ローカルメモ
リLM、から1番目の中間層ユニットMU、と2番目の
出カニニット00.との間の重みデータw、、” を読
み込み、2番目の出カニニットの誤差δ2(3) と
の積を計算し、送られてきたデータδ <zr ’に加
え合わせる(第3図(o)参照)。その結果δ (Z)
’は、また右隣の要素プロセッサPH3に転送する。
ニットMU+ の途中のデータδ (2) ’が送られ
てくるが、この要素プロセッサPE、は、ローカルメモ
リLM、から1番目の中間層ユニットMU、と2番目の
出カニニット00.との間の重みデータw、、” を読
み込み、2番目の出カニニットの誤差δ2(3) と
の積を計算し、送られてきたデータδ <zr ’に加
え合わせる(第3図(o)参照)。その結果δ (Z)
’は、また右隣の要素プロセッサPH3に転送する。
3番目の要素プロセッサPE、には、1番目の中間層ユ
ニッI−MU、の途中のデータδ1(2ゝ′が送られて
くるが、この要素プロセッサPE、はローカルメモリL
M、から1番目の中間層ユニットMU、と3番目の出カ
ニニットOU、との間の重みデータw31”を読み込み
、3番目の出カニニットの誤差δ13ゝとの積を計算し
、送られてきたデータδ1′ワ°に加え合わせる(第3
図(p)参照)。これにより、3番目の要素プロセッサ
PE、で1番目の中間層ユニッ)Mtl、に対応する(
7)式の右辺の積和の項の計算結果が得られたことにな
る。同様に、1番目の要素プロセッサPE+では、3番
目の中間層ユニッ) MUIに対応する結果δ、″゛が
、2番目の要素プロセッサPE2では5番目の中間層ユ
ニットMUSに対応する積和結果δ、 +2) ’が得
られる。次に、その結果をさらに右隣の要素プロセッサ
に転送して、その要素プロセッサのローカルメモリに書
き込む(第3図(q)参照)。同様にして、残りの中間
層ユニッ)Mum、MLI4.Mumの計算も行う(第
3図(r)参照)。
ニッI−MU、の途中のデータδ1(2ゝ′が送られて
くるが、この要素プロセッサPE、はローカルメモリL
M、から1番目の中間層ユニットMU、と3番目の出カ
ニニットOU、との間の重みデータw31”を読み込み
、3番目の出カニニットの誤差δ13ゝとの積を計算し
、送られてきたデータδ1′ワ°に加え合わせる(第3
図(p)参照)。これにより、3番目の要素プロセッサ
PE、で1番目の中間層ユニッ)Mtl、に対応する(
7)式の右辺の積和の項の計算結果が得られたことにな
る。同様に、1番目の要素プロセッサPE+では、3番
目の中間層ユニッ) MUIに対応する結果δ、″゛が
、2番目の要素プロセッサPE2では5番目の中間層ユ
ニットMUSに対応する積和結果δ、 +2) ’が得
られる。次に、その結果をさらに右隣の要素プロセッサ
に転送して、その要素プロセッサのローカルメモリに書
き込む(第3図(q)参照)。同様にして、残りの中間
層ユニッ)Mum、MLI4.Mumの計算も行う(第
3図(r)参照)。
(7)中間層ユニットの誤差計算
ローカルメモリから中間層ユニットの出力値vj(t)
と、(6)で計算したその中間層ユニットの後向きの積
和結果δ、 (H’を読み込み、(7)式に従って中間
層ユニットの誤差δJ(2) を計算し、その結果δ、
(!l、δ!(2)工δ、(H,δ (!l 、δ、
(り。
と、(6)で計算したその中間層ユニットの後向きの積
和結果δ、 (H’を読み込み、(7)式に従って中間
層ユニットの誤差δJ(2) を計算し、その結果δ、
(!l、δ!(2)工δ、(H,δ (!l 、δ、
(り。
δ、 (2)を再びローカルメモリLM+ 、 LM2
. L?L3に書き込む(第3図(s)〜(u)参照)
。
. L?L3に書き込む(第3図(s)〜(u)参照)
。
(8)重みの修正の計算
ローカルメモリから中間層ユニットの誤差δ、3′大入
力ユニットの出力V、(1)、それらのユニット間の前
回の重みの修正量ΔW 、j ”ゝ、重みW、j”を読
み込む。(4)及び(3)弐に従って新しい重みの修正
量ΔW□J′1′ および重みw 、 、 (11を計
算する(第3図(v)参照)。その結果ΔW1.(1)
w、、”’、 Δ w、、”’、w33 ’目 :Δ
w、、(11,W55 (+1をローカルメモリLM+
、L?b、L?bに書き込む(第3図(−)参照)。人
力層ユニットの出力データは、右隣の要素プロセッサに
転送され、左隣の要素プロセッサから送られた入力層ユ
ニットに対応する重みおよびその重みの修正量をローカ
ルメモリから読み込み、同様にして、新しい重みw 、
、(l 1w 、、 H) 、 w33(+1および
重みの修正量ΔW、5(1)6w 、 、 + 11,
6w33(1)を計算してローカルメモリLM+、LM
z、LM3に書き込む(第3図(x)〜(y)参照)。
力ユニットの出力V、(1)、それらのユニット間の前
回の重みの修正量ΔW 、j ”ゝ、重みW、j”を読
み込む。(4)及び(3)弐に従って新しい重みの修正
量ΔW□J′1′ および重みw 、 、 (11を計
算する(第3図(v)参照)。その結果ΔW1.(1)
w、、”’、 Δ w、、”’、w33 ’目 :Δ
w、、(11,W55 (+1をローカルメモリLM+
、L?b、L?bに書き込む(第3図(−)参照)。人
力層ユニットの出力データは、右隣の要素プロセッサに
転送され、左隣の要素プロセッサから送られた入力層ユ
ニットに対応する重みおよびその重みの修正量をローカ
ルメモリから読み込み、同様にして、新しい重みw 、
、(l 1w 、、 H) 、 w33(+1および
重みの修正量ΔW、5(1)6w 、 、 + 11,
6w33(1)を計算してローカルメモリLM+、LM
z、LM3に書き込む(第3図(x)〜(y)参照)。
同様にして、中間層、出力層間の結合を含め全ての重み
と重みの修正量を計算し、更新した結果をローカルメモ
リに書き出す(第3図(z)参照)。
と重みの修正量を計算し、更新した結果をローカルメモ
リに書き出す(第3図(z)参照)。
以上で一回の学習計算が終了する。ここでは、1つのパ
ターンを学習するごとに重みを修正する方法について説
明したが、第3図(v)以降の部分を修正して、重みの
修正量を全てのパターンについて足し合わせてから重み
を更新すれば、全てのパターンを学習してから重みを修
正する方法も簡単に実現できる。
ターンを学習するごとに重みを修正する方法について説
明したが、第3図(v)以降の部分を修正して、重みの
修正量を全てのパターンについて足し合わせてから重み
を更新すれば、全てのパターンを学習してから重みを修
正する方法も簡単に実現できる。
第4図は各要素プロセッサの構成を示す図である。同図
に示されるように、要素プロセッサは、積和演算を行う
ための乗算器及びALU、デニタを一時的に保持するレ
ジスタ、シグモイド関数発生器、レジスタ、演算器への
入力を切り替えるマルチプレクサおよびこれら全体を制
御する回路から構成される。ここで、要素プロセッサは
、種々に構成することができ、第4図の要素プロセッサ
はその一例に過ぎない。また、第4図において、ローカ
ルメモリは要素プロセッサに外付けにしたが、要素プロ
セッサ内に含めるように構成してもよい。さらに、シグ
モイド関数発生器は要素プロセッサ上に搭載しているが
、シグモイド関数発生器を外部に設け、各要素プロセン
サからシグモイド関数発生器を除くように構成すること
もできる。
に示されるように、要素プロセッサは、積和演算を行う
ための乗算器及びALU、デニタを一時的に保持するレ
ジスタ、シグモイド関数発生器、レジスタ、演算器への
入力を切り替えるマルチプレクサおよびこれら全体を制
御する回路から構成される。ここで、要素プロセッサは
、種々に構成することができ、第4図の要素プロセッサ
はその一例に過ぎない。また、第4図において、ローカ
ルメモリは要素プロセッサに外付けにしたが、要素プロ
セッサ内に含めるように構成してもよい。さらに、シグ
モイド関数発生器は要素プロセッサ上に搭載しているが
、シグモイド関数発生器を外部に設け、各要素プロセン
サからシグモイド関数発生器を除くように構成すること
もできる。
(発明の効果〕
以上、詳述したように、本発明の神経回路網型計算装置
によれば、複数の要素プロセッサの並列計算によって、
計算の高速化を達成することができ、また、リング網構
成とすることによって、要素プロセッサ間の配線を簡単
にすることができる。
によれば、複数の要素プロセッサの並列計算によって、
計算の高速化を達成することができ、また、リング網構
成とすることによって、要素プロセッサ間の配線を簡単
にすることができる。
第1図は本発明に係る神経回路網型計算装置の全体的な
システム構成を示す図、 第2図は本発明の神経回路網型計算装置における要素プ
ロセッサへのユニットの割り当てを説明するための図、 第3図は第2図の神経回路網型計算装置の動作を説明す
るための図、 第4図は各要素プロセッサの構成を示す図、第5図は多
層構造型の神経回路網型計算装置を示す図、 第6図は第5図の多層構造型の神経回路網型計算装置に
使用する各ユニットを示す図である。 (符号の説明) LM、LMl、LMl、LM3・・・ローカルメモリ、
PE、 PE+ 、 PEz、 PE3・・・要素プロ
セッサ、11・・・乗算器、 12・・・ALU。 13・・・シグモイド関数発生器、 14・・・レジスタ、 15・・・マルチプレクサ、 16・・・制御回路。 全体的なシステム構成を示す図 ¥ 1 圀 切7 図 ローカルメモリ(LM)へ 各要素チップの構成を示す図 ○ : ユニットU :結線し 多層構造型の神経回路網型計算装置を示す図第5図
システム構成を示す図、 第2図は本発明の神経回路網型計算装置における要素プ
ロセッサへのユニットの割り当てを説明するための図、 第3図は第2図の神経回路網型計算装置の動作を説明す
るための図、 第4図は各要素プロセッサの構成を示す図、第5図は多
層構造型の神経回路網型計算装置を示す図、 第6図は第5図の多層構造型の神経回路網型計算装置に
使用する各ユニットを示す図である。 (符号の説明) LM、LMl、LMl、LM3・・・ローカルメモリ、
PE、 PE+ 、 PEz、 PE3・・・要素プロ
セッサ、11・・・乗算器、 12・・・ALU。 13・・・シグモイド関数発生器、 14・・・レジスタ、 15・・・マルチプレクサ、 16・・・制御回路。 全体的なシステム構成を示す図 ¥ 1 圀 切7 図 ローカルメモリ(LM)へ 各要素チップの構成を示す図 ○ : ユニットU :結線し 多層構造型の神経回路網型計算装置を示す図第5図
Claims (2)
- 1. 入力層、少なくとも1層の中間層および出力層で
構成された多層構造型の神経回路網型計算装置であって
、 前記入力層を構成するユニット、前記中間層を構成する
ユニットおよび前記出力層を構成するユニットのそれぞ
れの機能を有し、リング網として構成された複数の要素
プロセッサ(PE)と、該各要素プロセッサに対してそ
れぞれ設けられた複数のローカルメモリ(LM)とを具
備し、前記複数の要素プロセッサによりバックプロパゲ
ーション法による学習機能を並列に実行するようにした
ことを特徴とする神経回路網型計算装置。 - 2. 前記各要素プロセッサ(PE)は、バックプロパ
ゲーション法による学習機能を実現するための乗算器(
11)、ALU(12)、シグモイド関数発生装置(1
3)、レジスタ(14)、マルチプレクサ(15)、お
よび、それらを制御する制御回路(16)を備えている
請求項第1項に記載の神経回路網型計算装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15277090A JPH0447482A (ja) | 1990-06-13 | 1990-06-13 | 神経回路網型計算装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15277090A JPH0447482A (ja) | 1990-06-13 | 1990-06-13 | 神経回路網型計算装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0447482A true JPH0447482A (ja) | 1992-02-17 |
Family
ID=15547772
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP15277090A Pending JPH0447482A (ja) | 1990-06-13 | 1990-06-13 | 神経回路網型計算装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0447482A (ja) |
-
1990
- 1990-06-13 JP JP15277090A patent/JPH0447482A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5517600A (en) | Neuro-chip and neurocomputer having the chip | |
| US5784632A (en) | Parallel diagonal-fold array processor | |
| US5483620A (en) | Learning machine synapse processor system apparatus | |
| Croall et al. | Industrial applications of neural networks: project ANNIE handbook | |
| US5517596A (en) | Learning machine synapse processor system apparatus | |
| Lane et al. | Theory and development of higher-order CMAC neural networks | |
| US5583964A (en) | Computer utilizing neural network and method of using same | |
| Petrowski et al. | Performance analysis of a pipelined backpropagation parallel algorithm | |
| EP0421639B1 (en) | Parallel data processing system | |
| WO1991018350A1 (en) | A learning machine synapse processor system apparatus | |
| JPH04293151A (ja) | 並列データ処理方式 | |
| US20160196488A1 (en) | Neural network computing device, system and method | |
| Saeks et al. | On the Design of an MIMD Neural Network Processor | |
| Meng et al. | PPOAccel: A high-throughput acceleration framework for proximal policy optimization | |
| Ienne et al. | Digital systems for neural networks | |
| Shams et al. | Implementing regularly structured neural networks on the DREAM machine | |
| JPH0447482A (ja) | 神経回路網型計算装置 | |
| Viredaz et al. | MANTRA I: A systolic neuro-computer | |
| JPH0471063A (ja) | 神経回路網型計算装置 | |
| JP2825133B2 (ja) | 並列データ処理方式 | |
| Hiraiwa et al. | Implementation of ANN on RISC processor array | |
| Duranton et al. | A general purpose digital architecture for neural network simulations | |
| JPH0447483A (ja) | 神経回路網型計算装置 | |
| JPH0467255A (ja) | 神経回路網型計算装置 | |
| Lopez | Programmable VLSI systolic processors for neural network and matrix computations |