JPH07306845A - 神経系学習装置用の並列処理装置 - Google Patents
神経系学習装置用の並列処理装置Info
- Publication number
- JPH07306845A JPH07306845A JP6098623A JP9862394A JPH07306845A JP H07306845 A JPH07306845 A JP H07306845A JP 6098623 A JP6098623 A JP 6098623A JP 9862394 A JP9862394 A JP 9862394A JP H07306845 A JPH07306845 A JP H07306845A
- Authority
- JP
- Japan
- Prior art keywords
- arithmetic
- pattern
- weight vector
- data
- arithmetic unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001537 neural effect Effects 0.000 title claims abstract description 58
- 238000012545 processing Methods 0.000 claims abstract description 48
- 238000004891 communication Methods 0.000 claims abstract description 43
- 230000007246 mechanism Effects 0.000 claims abstract description 40
- 238000004364 calculation method Methods 0.000 claims description 40
- 210000000653 nervous system Anatomy 0.000 claims description 19
- 230000008878 coupling Effects 0.000 claims description 15
- 238000010168 coupling process Methods 0.000 claims description 15
- 238000005859 coupling reaction Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 14
- 238000012937 correction Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 abstract description 5
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 238000000034 method Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】
【目的】 データの授受に費やす処理時間が少ない。
【構成】 神経回路が構築された第1、第2、第3、第
4演算装置2、3、4、5と各演算装置のデータ通信を
行う放送通信機構6とを備える。この放送通信機構6
は、第1演算装置2に接続されるデータ送信装置61お
よび、第2演算装置3ないし第4演算装置5にそれぞれ
接続される第1、第2、第3データ受信装置62、6
3、64を有する。第1演算装置2には入出力用のホス
トコンピュータ7が接続される。また各演算装置は第
1、第2、第3、第4データ交信機構81、82、8
3、84と交互に且つ直列に接続されている。第1、第
2、第3、第4演算装置2、3、4、5には入力パター
ンと教師パターンとの対の第1、第2、第3、第4集合
n1、n2、n3、n4が配される。第1演算装置2は
重みベクトルの初期値W0 を元に第1集合n1の第1の
入力パターンについて神経系計算手段により第1の出力
パターンを計算し、重みベクトルの更新を行う。
4演算装置2、3、4、5と各演算装置のデータ通信を
行う放送通信機構6とを備える。この放送通信機構6
は、第1演算装置2に接続されるデータ送信装置61お
よび、第2演算装置3ないし第4演算装置5にそれぞれ
接続される第1、第2、第3データ受信装置62、6
3、64を有する。第1演算装置2には入出力用のホス
トコンピュータ7が接続される。また各演算装置は第
1、第2、第3、第4データ交信機構81、82、8
3、84と交互に且つ直列に接続されている。第1、第
2、第3、第4演算装置2、3、4、5には入力パター
ンと教師パターンとの対の第1、第2、第3、第4集合
n1、n2、n3、n4が配される。第1演算装置2は
重みベクトルの初期値W0 を元に第1集合n1の第1の
入力パターンについて神経系計算手段により第1の出力
パターンを計算し、重みベクトルの更新を行う。
Description
【0001】
【産業上の利用分野】本発明は、神経系学習装置に用い
複数の演算装置を並列に接続して計算時間を短縮する神
経系学習装置用の並列処理装置に関する。
複数の演算装置を並列に接続して計算時間を短縮する神
経系学習装置用の並列処理装置に関する。
【0002】
【従来の技術】従来、生物の神経系の仕組みを工学的に
実現し、情報処理を行う神経系学習装置用の並列処理装
置は複数の演算装置を有し、神経回路を演算装置の台数
に分割しその一つずつを各演算装置に割り当てている。
これにより、複数の演算装置が神経回路への入力パター
ンに対する出力パターンを計算する神経系計算手段を分
担している。また上記複数の演算装置が神経回路の個々
の結合部分の結合効率を表わす重み係数を要素とする重
みベクトルを更新する重みベクトル更新手段を分担し、
神経系計算手段および重みベクトル更新手段により計算
を行っている。
実現し、情報処理を行う神経系学習装置用の並列処理装
置は複数の演算装置を有し、神経回路を演算装置の台数
に分割しその一つずつを各演算装置に割り当てている。
これにより、複数の演算装置が神経回路への入力パター
ンに対する出力パターンを計算する神経系計算手段を分
担している。また上記複数の演算装置が神経回路の個々
の結合部分の結合効率を表わす重み係数を要素とする重
みベクトルを更新する重みベクトル更新手段を分担し、
神経系計算手段および重みベクトル更新手段により計算
を行っている。
【0003】図4に一例として3台の演算装置を用いた
神経系学習装置用の並列処理装置100を示す。図4の
破線は演算装置間の境界を表し、実線は計算によるデー
タの流れを表す。入力パターンx1〜x3が、神経素子
hと重みベクトルWを有する神経回路101に入力さ
れ、神経系計算手段により出力パターンy1〜y3を生
ずる。そして重みベクトルWが、入力パターンx1〜x
3の学習目標である教師パターンt1〜t3の出力パタ
ーンy1〜y3に対する差Eに応じて、重みベクトル更
新手段によって更新される。
神経系学習装置用の並列処理装置100を示す。図4の
破線は演算装置間の境界を表し、実線は計算によるデー
タの流れを表す。入力パターンx1〜x3が、神経素子
hと重みベクトルWを有する神経回路101に入力さ
れ、神経系計算手段により出力パターンy1〜y3を生
ずる。そして重みベクトルWが、入力パターンx1〜x
3の学習目標である教師パターンt1〜t3の出力パタ
ーンy1〜y3に対する差Eに応じて、重みベクトル更
新手段によって更新される。
【0004】そして個々の演算装置間のデータ授受は、
(1)2台の演算装置間で相互にデータ授受を行う通信
機構により、各演算装置を連鎖的に接続することによっ
て、順々に演算装置間を経由してデータを受け渡す第1
の方法、(2)全ての演算装置が共有する共有記憶機構
に対して全ての演算装置を並列に接続し、各演算装置が
交互に共有記憶機構に対して情報の書き込みおよび読み
出しを行う第2の方法の何れかによって行われていた。
(1)2台の演算装置間で相互にデータ授受を行う通信
機構により、各演算装置を連鎖的に接続することによっ
て、順々に演算装置間を経由してデータを受け渡す第1
の方法、(2)全ての演算装置が共有する共有記憶機構
に対して全ての演算装置を並列に接続し、各演算装置が
交互に共有記憶機構に対して情報の書き込みおよび読み
出しを行う第2の方法の何れかによって行われていた。
【0005】
【発明が解決しようとする課題】しかるにデータ授受の
第1の方法によるとデータは個々の演算装置を順々に伝
わって行き、その際に各演算装置が逐一データの受渡し
に関与することが処理の負担となり、総合的に見てデー
タの授受の速度および処理能力が低下していた。
第1の方法によるとデータは個々の演算装置を順々に伝
わって行き、その際に各演算装置が逐一データの受渡し
に関与することが処理の負担となり、総合的に見てデー
タの授受の速度および処理能力が低下していた。
【0006】またデータ授受の第2の方法によると、共
有記憶機構に対して一度に一つの演算装置しか情報の読
み書きが行えず、現在読み書きしている演算装置の処理
が完了するまで他の演算装置は処理を中断しなければな
らなかった。このため演算装置を多くするに伴い待機中
の演算装置が増し、総合的な処理能力の低下を招いてい
た。本発明の目的は、データの授受に費やす処理時間の
少ない神経系学習装置用の並列処理装置の提供にある。
有記憶機構に対して一度に一つの演算装置しか情報の読
み書きが行えず、現在読み書きしている演算装置の処理
が完了するまで他の演算装置は処理を中断しなければな
らなかった。このため演算装置を多くするに伴い待機中
の演算装置が増し、総合的な処理能力の低下を招いてい
た。本発明の目的は、データの授受に費やす処理時間の
少ない神経系学習装置用の並列処理装置の提供にある。
【0007】
【課題を解決するための手段】本発明は、神経系学習用
の神経回路が構築され、前記神経回路の個々の結合部分
の結合効率を表わす重み係数を要素とする重みベクトル
から前記神経回路への入力パターンに対する出力パター
ンを算出する神経系計算手段および、前記出力パターン
を前記入力パターンの学習目標である教師パターンと比
較して前記重みベクトルを更新する重みベクトル更新手
段を有する複数の演算装置と、前記演算装置のうちの一
つの演算装置に接続されるデータ送信装置および前記演
算装置のうちの残りの演算装置にそれぞれ接続されるデ
ータ受信装置を有する放送通信機構と、前記各演算装置
と交互に直列に接続され、2台の演算装置の間で相互に
データの授受を行わせる機能を有する前記演算装置と同
数のデータ交信機構と、前記一つの演算装置に接続さ
れ、前記入力パターンと前記教師パターンとの対を外部
から与えたり、学習の結果を表示するホストコンピュー
タとを備える神経系学習装置用の並列処理装置を技術的
手段として採用する。
の神経回路が構築され、前記神経回路の個々の結合部分
の結合効率を表わす重み係数を要素とする重みベクトル
から前記神経回路への入力パターンに対する出力パター
ンを算出する神経系計算手段および、前記出力パターン
を前記入力パターンの学習目標である教師パターンと比
較して前記重みベクトルを更新する重みベクトル更新手
段を有する複数の演算装置と、前記演算装置のうちの一
つの演算装置に接続されるデータ送信装置および前記演
算装置のうちの残りの演算装置にそれぞれ接続されるデ
ータ受信装置を有する放送通信機構と、前記各演算装置
と交互に直列に接続され、2台の演算装置の間で相互に
データの授受を行わせる機能を有する前記演算装置と同
数のデータ交信機構と、前記一つの演算装置に接続さ
れ、前記入力パターンと前記教師パターンとの対を外部
から与えたり、学習の結果を表示するホストコンピュー
タとを備える神経系学習装置用の並列処理装置を技術的
手段として採用する。
【0008】本発明は、技術的手段の神経系学習装置用
の並列処理装置において、前記各演算装置はそれぞれ入
力パターンと教師パターンとの対の集合が割り当てら
れ、前記集合の入力パターンについて逐次前記重みベク
トル更新手段によって更新した前記重みベクトルを用い
て前記神経系計算手段によって出力パターンを算出する
神経系学習装置用の並列処理装置を第1の実施態様とし
て採用する。
の並列処理装置において、前記各演算装置はそれぞれ入
力パターンと教師パターンとの対の集合が割り当てら
れ、前記集合の入力パターンについて逐次前記重みベク
トル更新手段によって更新した前記重みベクトルを用い
て前記神経系計算手段によって出力パターンを算出する
神経系学習装置用の並列処理装置を第1の実施態様とし
て採用する。
【0009】本発明は、技術的手段の神経系学習装置用
の並列処理装置において、前記各演算装置はそれぞれ入
力パターンと教師パターンとの対の集合が割り当てら
れ、前記集合の全ての入力パターンについて同一の重み
ベクトルで神経系計算手段によって出力パターンを計算
すると共に重みベクトル更新手段によって重みベクトル
の修正量を計算し、この修正量を用いて重みベクトルを
更新する神経系学習装置用の並列処理装置を第2の実施
態様として採用する。
の並列処理装置において、前記各演算装置はそれぞれ入
力パターンと教師パターンとの対の集合が割り当てら
れ、前記集合の全ての入力パターンについて同一の重み
ベクトルで神経系計算手段によって出力パターンを計算
すると共に重みベクトル更新手段によって重みベクトル
の修正量を計算し、この修正量を用いて重みベクトルを
更新する神経系学習装置用の並列処理装置を第2の実施
態様として採用する。
【0010】
【作用および発明の効果】本発明の神経系学習装置用の
並列処理装置は、全ての演算装置が各々割当られた計算
処理を行う際に、放送通信機構のテータ送信装置が接続
された演算装置がどの演算装置も等しく必要とするデー
タを出力し、放送通信機構のデータ受信装置が接続され
た各演算装置に一度に送ることができる。
並列処理装置は、全ての演算装置が各々割当られた計算
処理を行う際に、放送通信機構のテータ送信装置が接続
された演算装置がどの演算装置も等しく必要とするデー
タを出力し、放送通信機構のデータ受信装置が接続され
た各演算装置に一度に送ることができる。
【0011】
【実施例】次に、本発明の神経系学習装置用の並列処理
装置を図1および図2に示す第一実施例に基づき説明す
る。
装置を図1および図2に示す第一実施例に基づき説明す
る。
【0012】〔第一実施例の構成〕本実施例は、本発明
の神経系学習装置用の並列処理装置を非線形マッピング
の学習に適用する。本実施例の神経系学習装置用の並列
処理装置1は、図1に示すように、重み係数によって個
々の結合部分の結合効率が表される神経回路が構築され
た第1、第2、第3、第4演算装置2、3、4、5と第
1、第2、第3、第4演算装置2、3、4、5のデータ
通信を行う放送通信機構6とを備える。この放送通信機
構6は、第1演算装置2に接続されるデータ送信装置6
1および第2演算装置3ないし第4演算装置5にそれぞ
れ接続される第1、第2、第3データ受信装置62、6
3、64を有する。
の神経系学習装置用の並列処理装置を非線形マッピング
の学習に適用する。本実施例の神経系学習装置用の並列
処理装置1は、図1に示すように、重み係数によって個
々の結合部分の結合効率が表される神経回路が構築され
た第1、第2、第3、第4演算装置2、3、4、5と第
1、第2、第3、第4演算装置2、3、4、5のデータ
通信を行う放送通信機構6とを備える。この放送通信機
構6は、第1演算装置2に接続されるデータ送信装置6
1および第2演算装置3ないし第4演算装置5にそれぞ
れ接続される第1、第2、第3データ受信装置62、6
3、64を有する。
【0013】第1演算装置2には、入力パターンと入力
パターンの学習目標である教師パターンとの対を外部か
ら与えたり、学習の結果を表示する為のホストコンピュ
ータ7が接続されている。また各演算装置は、データ交
信機構である第1、第2、第3、第4データ交信機構8
1、82、83、84を有する。
パターンの学習目標である教師パターンとの対を外部か
ら与えたり、学習の結果を表示する為のホストコンピュ
ータ7が接続されている。また各演算装置は、データ交
信機構である第1、第2、第3、第4データ交信機構8
1、82、83、84を有する。
【0014】第1演算装置2に第1データ交信機構81
と第2データ交信機構82とが接続し、第2データ交信
機構82に第2演算装置3が接続している。そして第2
演算装置3に第3データ交信機構83が接続し、第3デ
ータ交信機構83に第3演算装置4が接続している。さ
らに第3演算装置4に第4データ交信機構84が接続
し、第4データ交信機構84に第4演算装置5が接続し
ている。これにより第1、第2、第3、第4演算装置
2、3、4、5は鎖状の接続が施される。放送通信機構
6は、RS422規格のシリアル通信のものである。第
1、第2、第3、第4データ交信機構81、82、8
3、84はデュアルポートメモリを備える。デュアルポ
ートメモリは、2台の演算装置を接続し相互にデータの
授受を行わせることが可能なメモリである。
と第2データ交信機構82とが接続し、第2データ交信
機構82に第2演算装置3が接続している。そして第2
演算装置3に第3データ交信機構83が接続し、第3デ
ータ交信機構83に第3演算装置4が接続している。さ
らに第3演算装置4に第4データ交信機構84が接続
し、第4データ交信機構84に第4演算装置5が接続し
ている。これにより第1、第2、第3、第4演算装置
2、3、4、5は鎖状の接続が施される。放送通信機構
6は、RS422規格のシリアル通信のものである。第
1、第2、第3、第4データ交信機構81、82、8
3、84はデュアルポートメモリを備える。デュアルポ
ートメモリは、2台の演算装置を接続し相互にデータの
授受を行わせることが可能なメモリである。
【0015】入力パターンと教師パターンとの対は図2
に示すように第1集合n1〜第4集合n4に分割されて
いる。そして各演算装置は予め全データを有し、第1集
合n1〜第4集合n4の内の一つを受け持つよう割り当
てられている。これにより各演算装置は全学習データの
4分の1の量の学習データを受け持つことになり、か
つ、全体として見ると、与えられたデータのうち演算に
使用されないデータはない。
に示すように第1集合n1〜第4集合n4に分割されて
いる。そして各演算装置は予め全データを有し、第1集
合n1〜第4集合n4の内の一つを受け持つよう割り当
てられている。これにより各演算装置は全学習データの
4分の1の量の学習データを受け持つことになり、か
つ、全体として見ると、与えられたデータのうち演算に
使用されないデータはない。
【0016】また各演算装置は次の神経系計算手段と重
みベクトル更新手段とを備える。神経系計算手段はy=
f(WX)で与えられる。ここでyは神経回路からの出
力素子yiを要素とする出力パターンベクトルであり、
fは飽和特性および単調増加特性等を持つ非線形変換関
数であり、yi =f(ui +θi )を満たす。ここでu
i は入力素子xj から出力素子yi への結合効率を表す
重み係数wijとx j の積wij・xj をjについて0から
n−1まで(nは入力層の素子の数を表す)加算したも
のである。θi はyがyi の値をとる際のしきい値であ
る。またWはW=|wθ|で与えられる結合荷重係数、
wはwijを要素とする重みベクトル、θはθi を要素と
するしきい値ベクトルである。
みベクトル更新手段とを備える。神経系計算手段はy=
f(WX)で与えられる。ここでyは神経回路からの出
力素子yiを要素とする出力パターンベクトルであり、
fは飽和特性および単調増加特性等を持つ非線形変換関
数であり、yi =f(ui +θi )を満たす。ここでu
i は入力素子xj から出力素子yi への結合効率を表す
重み係数wijとx j の積wij・xj をjについて0から
n−1まで(nは入力層の素子の数を表す)加算したも
のである。θi はyがyi の値をとる際のしきい値であ
る。またWはW=|wθ|で与えられる結合荷重係数、
wはwijを要素とする重みベクトル、θはθi を要素と
するしきい値ベクトルである。
【0017】そしてXは、列ベクトル(x1)T の絶対
値で与えられる。ここでxは入力素子xj を要素とする
入力パターンベクトルである。重みベクトル更新手段
は、入力パターンベクトルxの学習目標である教師パタ
ーンベクトルtと出力パターンベクトルyとの差を表す
E=(1/2)・‖y−t‖2 を用いて、Wを修正量Δ
W=−δE/δWに基づいて順次修正していく手段であ
る。ΔWはΔW=−δ・yと解かれ、δ=(y−t)・
f’(x)となる。ここでf’はfの導関数である。そ
して重みベクトル更新手段は、ΔWに学習係数ε(1以
下の正の定数)をかけたΔW=−δ・y・εを用いてW
k =Wk-1−δ・y・εで与えられる。ここでWk の添
字kは神経系計算の反復回数を表す。
値で与えられる。ここでxは入力素子xj を要素とする
入力パターンベクトルである。重みベクトル更新手段
は、入力パターンベクトルxの学習目標である教師パタ
ーンベクトルtと出力パターンベクトルyとの差を表す
E=(1/2)・‖y−t‖2 を用いて、Wを修正量Δ
W=−δE/δWに基づいて順次修正していく手段であ
る。ΔWはΔW=−δ・yと解かれ、δ=(y−t)・
f’(x)となる。ここでf’はfの導関数である。そ
して重みベクトル更新手段は、ΔWに学習係数ε(1以
下の正の定数)をかけたΔW=−δ・y・εを用いてW
k =Wk-1−δ・y・εで与えられる。ここでWk の添
字kは神経系計算の反復回数を表す。
【0018】〔第一実施例の作動〕本実施例の神経系学
習装置用の並列処理装置1は、次のように動作する(図
2参照)。 1)重みベクトルの初期値W0 を第1、第2、第3、第
4演算装置に渡す。 2)第1演算装置2が割り当てられた第1集合n1の入
力パターンと教師パターンとの対をテーブルルックアッ
プの手法で抽出する。 そして第1演算装置2は、初期値W0 を元に第1集合n
1の第1の入力パターンについて神経系計算手段により
第1の出力パターンを計算する。さらに第1演算装置2
は、計算した第1の出力パターンを第1の入力パターン
と対をなす第1の教師パターンと比較して重みベクトル
更新の計算を行う。
習装置用の並列処理装置1は、次のように動作する(図
2参照)。 1)重みベクトルの初期値W0 を第1、第2、第3、第
4演算装置に渡す。 2)第1演算装置2が割り当てられた第1集合n1の入
力パターンと教師パターンとの対をテーブルルックアッ
プの手法で抽出する。 そして第1演算装置2は、初期値W0 を元に第1集合n
1の第1の入力パターンについて神経系計算手段により
第1の出力パターンを計算する。さらに第1演算装置2
は、計算した第1の出力パターンを第1の入力パターン
と対をなす第1の教師パターンと比較して重みベクトル
更新の計算を行う。
【0019】つぎに第1演算装置2は、更新された重み
ベクトルを用いて第1集合n1の第2の入力パターンに
ついて神経系計算手段により第2の出力パターンを計算
する。さらに第1演算装置2は、計算した第2の出力パ
ターンを第2の入力パターンと対をなす第2の教師パタ
ーンと比較して重みベクトル更新の計算を行う。このよ
うにして逐次出力パターンの計算と重みベクトルの更新
とを行う。これにより第1演算装置2は結合荷重係数を
更新した結果W11を生ずる。
ベクトルを用いて第1集合n1の第2の入力パターンに
ついて神経系計算手段により第2の出力パターンを計算
する。さらに第1演算装置2は、計算した第2の出力パ
ターンを第2の入力パターンと対をなす第2の教師パタ
ーンと比較して重みベクトル更新の計算を行う。このよ
うにして逐次出力パターンの計算と重みベクトルの更新
とを行う。これにより第1演算装置2は結合荷重係数を
更新した結果W11を生ずる。
【0020】また第2、第3、第4演算装置3、4、5
が、第1演算装置2と同様に第2集合n2、第3集合n
3、第4集合n4の入力パターンと教師パターンとの対
をテーブルルックアップの手法で抽出する。そして第
2、第3、第4演算装置3、4、5は、逐次神経系計算
手段による計算と重みベクトル更新の計算とを行う。こ
れにより第2、第3、第4演算装置3、4、5は、それ
ぞれ結合荷重係数を更新した結果W12、W13、W14を生
ずる。この際第2演算装置3、第3演算装置4、第4演
算装置5は、独立して第1演算装置2と同時に、それぞ
れW11、W12、W13の決定を待たずに第1演算装置2と
同じW0 から計算を開始する。
が、第1演算装置2と同様に第2集合n2、第3集合n
3、第4集合n4の入力パターンと教師パターンとの対
をテーブルルックアップの手法で抽出する。そして第
2、第3、第4演算装置3、4、5は、逐次神経系計算
手段による計算と重みベクトル更新の計算とを行う。こ
れにより第2、第3、第4演算装置3、4、5は、それ
ぞれ結合荷重係数を更新した結果W12、W13、W14を生
ずる。この際第2演算装置3、第3演算装置4、第4演
算装置5は、独立して第1演算装置2と同時に、それぞ
れW11、W12、W13の決定を待たずに第1演算装置2と
同じW0 から計算を開始する。
【0021】3)そして学習係数εが十分に小さい場合
にはW0 ≒W11≒W12≒W13とみることができ、次の学
習過程の結合荷重係数W1 が、 W1 =(W11+W12+W13+W14)−W0 ・(4−1) ≒W14 により求められる。ここでW11+W12+W13+W14は次
の集計の機能により求められる。
にはW0 ≒W11≒W12≒W13とみることができ、次の学
習過程の結合荷重係数W1 が、 W1 =(W11+W12+W13+W14)−W0 ・(4−1) ≒W14 により求められる。ここでW11+W12+W13+W14は次
の集計の機能により求められる。
【0022】最初に第4演算装置5がW14を第3演算装
置4に送り、第3演算装置4がW14にW13を加えて第2
演算装置3に送る。第2演算装置3は受け取ったW13+
W14にW12を加えて第1演算装置2に送る。第1演算装
置2は受け取ったW12+W13+W14にW11を加え、第1
演算装置2の内部にW11+W12+W13+W14が生ずる。
4)W1 は放送通信機構6により全ての演算装置に配布
される。以上の1)〜4)の処理を学習過程の反復回数
だけ反復する。
置4に送り、第3演算装置4がW14にW13を加えて第2
演算装置3に送る。第2演算装置3は受け取ったW13+
W14にW12を加えて第1演算装置2に送る。第1演算装
置2は受け取ったW12+W13+W14にW11を加え、第1
演算装置2の内部にW11+W12+W13+W14が生ずる。
4)W1 は放送通信機構6により全ての演算装置に配布
される。以上の1)〜4)の処理を学習過程の反復回数
だけ反復する。
【0023】このように、与えられた全ての入力パター
ンと教師パターンとの対のうち任意の一部分だけについ
て神経系計算手段による計算と重みベクトルを更新する
計算を実施できる手段を用いる。そして各演算装置に対
して異なる入力パターンと教師パターンとの対を指示す
る。これにより全ての入力パターンと教師パターンとの
対は、漏れなく何れかの演算装置により神経系計算手段
による計算と重みベクトルを更新する計算が実施され、
かつ何れの入力パターンと教師パターンとの対も複数の
演算装置により重複して神経系計算手段による計算と重
みベクトルを更新する計算とが行われることがない。
ンと教師パターンとの対のうち任意の一部分だけについ
て神経系計算手段による計算と重みベクトルを更新する
計算を実施できる手段を用いる。そして各演算装置に対
して異なる入力パターンと教師パターンとの対を指示す
る。これにより全ての入力パターンと教師パターンとの
対は、漏れなく何れかの演算装置により神経系計算手段
による計算と重みベクトルを更新する計算が実施され、
かつ何れの入力パターンと教師パターンとの対も複数の
演算装置により重複して神経系計算手段による計算と重
みベクトルを更新する計算とが行われることがない。
【0024】〔数値実験〕5005点のデータを用いた
非線形マッピングのモデルを用いて学習させる。神経回
路は4層モデルで、各層の装置数は入力から順に、1、
5、5、1個である。そして第1演算装置2ないし第4
演算装置5で各50回学習させた。実験結果を表1に示
す。
非線形マッピングのモデルを用いて学習させる。神経回
路は4層モデルで、各層の装置数は入力から順に、1、
5、5、1個である。そして第1演算装置2ないし第4
演算装置5で各50回学習させた。実験結果を表1に示
す。
【表1】
【0025】データ点数が極めて多いため、演算装置の
複数化に伴う各演算装置間でのデータ通信に費やされる
時間の実行時間に対する比率を意味するオーバヘッドが
極めて少なく、装置全体としての処理速度の向上の倍率
を意味する速度倍率を総合した総合速度倍率は装置数倍
に近い。また誤差の収束速度は、演算装置が一台の場合
と殆ど差がない。
複数化に伴う各演算装置間でのデータ通信に費やされる
時間の実行時間に対する比率を意味するオーバヘッドが
極めて少なく、装置全体としての処理速度の向上の倍率
を意味する速度倍率を総合した総合速度倍率は装置数倍
に近い。また誤差の収束速度は、演算装置が一台の場合
と殆ど差がない。
【0026】〔第一実施例の効果〕全ての演算装置が、
神経回路と、入力パターンと教師パターンとの対と、重
みベクトルとを有するので、各演算装置は神経系計算手
段や重みベクトル更新手段の計算を、他の演算装置と完
全に無関係に行うことができる。このため演算途中結果
を演算装置間で互いに交換する必要が無く、それだけ処
理時間が短い。各演算装置はテーブルルックアップの手
法によりオーバーヘッドが殆ど無く任意のデータについ
て学習できる。
神経回路と、入力パターンと教師パターンとの対と、重
みベクトルとを有するので、各演算装置は神経系計算手
段や重みベクトル更新手段の計算を、他の演算装置と完
全に無関係に行うことができる。このため演算途中結果
を演算装置間で互いに交換する必要が無く、それだけ処
理時間が短い。各演算装置はテーブルルックアップの手
法によりオーバーヘッドが殆ど無く任意のデータについ
て学習できる。
【0027】第1演算装置が放送通信機構を通じて演算
開始を意味する開始データを送信し、第2演算装置ない
し第4演算装置は開始データを受信すると同時に演算処
理を開始するため演算装置間の同期が容易に取れる。全
演算装置への同一データの配布がし易い。
開始を意味する開始データを送信し、第2演算装置ない
し第4演算装置は開始データを受信すると同時に演算処
理を開始するため演算装置間の同期が容易に取れる。全
演算装置への同一データの配布がし易い。
【0028】〔変形例〕本実施例では放送通信機構はR
S422規格のシリアル通信であるが、同等の通信機能
が実現可能であれば特にRS422規格である必要はな
い。第4演算装置の第3演算装置と反対側に更に演算装
置とデータ交信機構とを並列に接続することにより4台
より多くの演算装置を使用してもよい。
S422規格のシリアル通信であるが、同等の通信機能
が実現可能であれば特にRS422規格である必要はな
い。第4演算装置の第3演算装置と反対側に更に演算装
置とデータ交信機構とを並列に接続することにより4台
より多くの演算装置を使用してもよい。
【0029】〔第二実施例〕次に、本発明の神経系学習
装置用の並列処理装置を図1および図3に示す第二実施
例に基づき説明する。
装置用の並列処理装置を図1および図3に示す第二実施
例に基づき説明する。
【0030】〔第二実施例の構成〕本実施例は、本発明
の神経系学習装置用の並列処理装置を第一実施例と同じ
非線形マッピングの学習に適用する。本実施例の神経系
学習装置用の並列処理装置は第一実施例(図1参照)と
同様の構成を有する。
の神経系学習装置用の並列処理装置を第一実施例と同じ
非線形マッピングの学習に適用する。本実施例の神経系
学習装置用の並列処理装置は第一実施例(図1参照)と
同様の構成を有する。
【0031】入力パターンと教師パターンとの対は図3
に示すように第1集合n1〜第4集合n4に分割されて
いる。そして各演算装置は予め全データを有し、第1集
合n1〜第4集合n4のうちの一つを受け持つよう割り
当てられている。これにより各演算装置は全学習データ
の4分の1の量の学習データを受け持つことになり、か
つ、全体として見ると、与えられたデータのうち演算に
使用されていないデータはない。そして各演算装置は次
の神経系計算手段と重みベクトル更新手段とを備える。
神経系計算手段はy=f(WX)で与えられる。重みベ
クトル更新手段は、修正量ΔW=−δ・yで与えられ
る。
に示すように第1集合n1〜第4集合n4に分割されて
いる。そして各演算装置は予め全データを有し、第1集
合n1〜第4集合n4のうちの一つを受け持つよう割り
当てられている。これにより各演算装置は全学習データ
の4分の1の量の学習データを受け持つことになり、か
つ、全体として見ると、与えられたデータのうち演算に
使用されていないデータはない。そして各演算装置は次
の神経系計算手段と重みベクトル更新手段とを備える。
神経系計算手段はy=f(WX)で与えられる。重みベ
クトル更新手段は、修正量ΔW=−δ・yで与えられ
る。
【0032】〔第二実施例の作動〕本実施例の神経系学
習装置用の並列処理装置は、次のように動作する(図3
参照)。 1)重みベクトルの初期値W0 が全演算装置に渡され
る。 2)第1演算装置が割り当てられた第1集合n1の入力
パターンと教師パターンとの対をテーブルルックアップ
の手法で使用し、全て同じ初期値W0 を元に一括して神
経系計算手段による計算と重みベクトル更新の計算とを
行う。そして第1演算装置は第1集合n1の入力パター
ンと教師パターンとの各対について結合荷重係数の修正
量を合計したΔW1 を生ずる。
習装置用の並列処理装置は、次のように動作する(図3
参照)。 1)重みベクトルの初期値W0 が全演算装置に渡され
る。 2)第1演算装置が割り当てられた第1集合n1の入力
パターンと教師パターンとの対をテーブルルックアップ
の手法で使用し、全て同じ初期値W0 を元に一括して神
経系計算手段による計算と重みベクトル更新の計算とを
行う。そして第1演算装置は第1集合n1の入力パター
ンと教師パターンとの各対について結合荷重係数の修正
量を合計したΔW1 を生ずる。
【0033】また第2、第3、第4演算装置が、第1演
算装置と同様にそれぞれ第2集合n2、第3集合n3、
第4集合n4をテーブルルックアップの手法で使用し、
全て同じ初期値W0 を元に一括して神経系計算手段によ
る計算と重みベクトル更新の計算とを行う。これにより
第2、第3、第4演算装置は、それぞれ第2集合n2、
第3集合n3、第4集合n4の入力パターンと教師パタ
ーンとの各対について結合荷重係数の修正量を合計した
ΔW2 、ΔW3 、ΔW4 を生ずる。 3)そして次の学習過程の結合荷重係数W1 が、 W1 =W0 +ΔWALL により求められる。ΔWALLはΔWALL=ΔW1 +
ΔW2 +ΔW3 +ΔW4である。
算装置と同様にそれぞれ第2集合n2、第3集合n3、
第4集合n4をテーブルルックアップの手法で使用し、
全て同じ初期値W0 を元に一括して神経系計算手段によ
る計算と重みベクトル更新の計算とを行う。これにより
第2、第3、第4演算装置は、それぞれ第2集合n2、
第3集合n3、第4集合n4の入力パターンと教師パタ
ーンとの各対について結合荷重係数の修正量を合計した
ΔW2 、ΔW3 、ΔW4 を生ずる。 3)そして次の学習過程の結合荷重係数W1 が、 W1 =W0 +ΔWALL により求められる。ΔWALLはΔWALL=ΔW1 +
ΔW2 +ΔW3 +ΔW4である。
【0034】ここでΔW1 +ΔW2 +ΔW3 +ΔW4 は
次の集計の機能により求められる。最初に第4演算装置
がΔW4 を第3演算装置に送り、第3演算装置がΔW4
にΔW3 を加えて第2演算装置に送る。第2演算装置は
受け取ったΔW3 +ΔW4にΔW2 を加えて第1演算装
置に送る。第1演算装置は受け取ったΔW2 +ΔW 3 +
ΔW4 にΔW1 を加え、第1演算装置の内部にΔW1 +
ΔW2 +ΔW3 +ΔW4 が生ずる。 4)W1 は放送通信機構により全ての演算装置に配布さ
れる。 以上の1)〜4)の処理を学習過程の反復回数だけ反復
する。
次の集計の機能により求められる。最初に第4演算装置
がΔW4 を第3演算装置に送り、第3演算装置がΔW4
にΔW3 を加えて第2演算装置に送る。第2演算装置は
受け取ったΔW3 +ΔW4にΔW2 を加えて第1演算装
置に送る。第1演算装置は受け取ったΔW2 +ΔW 3 +
ΔW4 にΔW1 を加え、第1演算装置の内部にΔW1 +
ΔW2 +ΔW3 +ΔW4 が生ずる。 4)W1 は放送通信機構により全ての演算装置に配布さ
れる。 以上の1)〜4)の処理を学習過程の反復回数だけ反復
する。
【0035】〔数値実験〕第一実施例と同様、5005
点のデータを用いた非線形マッピングのモデルを用いて
学習させる。神経回路は4層モデルで、各層の装置数は
入力から順に、1、5、5、1個である。そして第1演
算装置ないし第4演算装置で各50回学習させた。実験
結果を表2に示す。
点のデータを用いた非線形マッピングのモデルを用いて
学習させる。神経回路は4層モデルで、各層の装置数は
入力から順に、1、5、5、1個である。そして第1演
算装置ないし第4演算装置で各50回学習させた。実験
結果を表2に示す。
【表2】
【0036】誤差の収束速度は、演算装置が一台の場合
と殆ど差がなく、浮動小数点数の計算誤差の程度しか差
は見受けられない。次に、本発明の神経系学習装置用の
並列処理装置を図1および図2に示す第三実施例に基づ
き説明する。
と殆ど差がなく、浮動小数点数の計算誤差の程度しか差
は見受けられない。次に、本発明の神経系学習装置用の
並列処理装置を図1および図2に示す第三実施例に基づ
き説明する。
【0037】〔第三実施例〕本実施例は、本発明の神経
系学習装置用の並列処理装置を関数近似のモデルの学習
に適用する。本実施例の神経系学習装置用の並列処理装
置は、第一実施例と同様の構成を有し、第一実施例と同
様に作動する。
系学習装置用の並列処理装置を関数近似のモデルの学習
に適用する。本実施例の神経系学習装置用の並列処理装
置は、第一実施例と同様の構成を有し、第一実施例と同
様に作動する。
【0038】〔数値実験〕1000点のデータを用いた
関数近似のモデルを用いて学習させる。神経回路は3層
モデルで、各層の装置数は入力層から順に、1、10、
1個である。各装置の伝達関数は両極性のシグモイド関
数y=tanh(x/2.0)とした。入力へは−1<
x<1を1000等分して与え、出力がy=sin(x
π+π)となるように各200回学習させた。実験結果
を表3に示す。
関数近似のモデルを用いて学習させる。神経回路は3層
モデルで、各層の装置数は入力層から順に、1、10、
1個である。各装置の伝達関数は両極性のシグモイド関
数y=tanh(x/2.0)とした。入力へは−1<
x<1を1000等分して与え、出力がy=sin(x
π+π)となるように各200回学習させた。実験結果
を表3に示す。
【表3】
【0039】1000点のデータでも速度倍率はかなり
高い。台数が増すに従って速度倍率が飽和傾向にあるの
は、データが第4演算装置から第1演算装置へ伝わるパ
イプラインによる遅延時間が無視できなくなり台数に比
例してオーバーヘッドが増加している為と思われる。し
かしながら速度倍率は並列処理装置では整数倍以上には
なり得ず、何れも速度倍率は整数倍(理想値)に近いこ
とから処理速度の向上は著しい。次に、本発明の神経系
学習装置用の並列処理装置を図1および図3に示す第四
実施例に基づき説明する。
高い。台数が増すに従って速度倍率が飽和傾向にあるの
は、データが第4演算装置から第1演算装置へ伝わるパ
イプラインによる遅延時間が無視できなくなり台数に比
例してオーバーヘッドが増加している為と思われる。し
かしながら速度倍率は並列処理装置では整数倍以上には
なり得ず、何れも速度倍率は整数倍(理想値)に近いこ
とから処理速度の向上は著しい。次に、本発明の神経系
学習装置用の並列処理装置を図1および図3に示す第四
実施例に基づき説明する。
【0040】〔第四実施例〕本実施例は、本発明の神経
系学習装置用の並列処理装置を関数近似のモデルの学習
に適用する。本実施例の神経系学習装置用の並列処理装
置は、第二実施例と同様の構成を有し、第二実施例と同
様に作動する。
系学習装置用の並列処理装置を関数近似のモデルの学習
に適用する。本実施例の神経系学習装置用の並列処理装
置は、第二実施例と同様の構成を有し、第二実施例と同
様に作動する。
【0041】〔数値実験〕第三実施例と同様、1000
点のデータを用いた関数近似のモデルを用いて学習させ
る。神経回路は3層モデルで、各層の装置数は入力層か
ら順に、1、10、1個である。各装置の伝達関数は両
極性のシグモイド関数y=tanh(x/2.0)とし
た。入力へは−1<x<1を1000等分して与え、出
力がy=sin(xπ+π)となるように各200回学
習させた。実験結果を表4に示す。
点のデータを用いた関数近似のモデルを用いて学習させ
る。神経回路は3層モデルで、各層の装置数は入力層か
ら順に、1、10、1個である。各装置の伝達関数は両
極性のシグモイド関数y=tanh(x/2.0)とし
た。入力へは−1<x<1を1000等分して与え、出
力がy=sin(xπ+π)となるように各200回学
習させた。実験結果を表4に示す。
【表4】
【0042】第三実施例の数値実験と同様、1000点
のデータでも速度倍率はかなり高く、台数が増すに従っ
て速度倍率が飽和傾向にある。しかしながら速度倍率は
並列処理装置では整数倍以上にはなり得ず、何れも速度
倍率は整数倍(理想値)に近いことから処理速度の向上
は著しい。
のデータでも速度倍率はかなり高く、台数が増すに従っ
て速度倍率が飽和傾向にある。しかしながら速度倍率は
並列処理装置では整数倍以上にはなり得ず、何れも速度
倍率は整数倍(理想値)に近いことから処理速度の向上
は著しい。
【図1】4台の演算装置を使用した場合の神経系学習装
置用の並列処理装置の構成図である。
置用の並列処理装置の構成図である。
【図2】第一および第三実施例にかかる演算処理の流れ
を示す図である。
を示す図である。
【図3】第二および第四実施例にかかる演算処理の流れ
を示す図である。
を示す図である。
【図4】従来の神経系学習装置に於ける並列処理の応用
手法を示す図である。
手法を示す図である。
1 神経系学習装置用の並列処理装置 2 第1演算装置(演算装置) 3 第2演算装置(演算装置) 4 第3演算装置(演算装置) 5 第4演算装置(演算装置) 6 放送通信機構 7 ホストコンピュータ 61 データ送信装置 62、63、64 データ受信装置 81 第1データ交信機構(データ交信機構) 82 第2データ交信機構(データ交信機構) 83 第3データ交信機構(データ交信機構) 84 第4データ交信機構(データ交信機構)
Claims (3)
- 【請求項1】(a)神経系学習用の神経回路が構築さ
れ、前記神経回路の個々の結合部分の結合効率を表わす
重み係数を要素とする重みベクトルから前記神経回路へ
の入力パターンに対する出力パターンを算出する神経系
計算手段および、前記出力パターンを前記入力パターン
の学習目標である教師パターンと比較して前記重みベク
トルを更新する重みベクトル更新手段を有する複数の演
算装置と、(b)前記演算装置のうちの一つの演算装置
に接続されるデータ送信装置および前記演算装置のうち
の残りの演算装置にそれぞれ接続されるデータ受信装置
を有する放送通信機構と、(c)前記各演算装置と交互
に直列に接続され、2台の演算装置の間で相互にデータ
の授受を行わせる機能を有する前記演算装置と同数のデ
ータ交信機構と、(d)前記一つの演算装置に接続さ
れ、前記入力パターンと前記教師パターンとの対を外部
から与えたり、学習の結果を表示するホストコンピュー
タとを備える神経系学習装置用の並列処理装置。 - 【請求項2】 請求項1の神経系学習装置用の並列処理
装置において、前記各演算装置はそれぞれ入力パターン
と教師パターンとの対の集合が割り当てられ、前記集合
の入力パターンについて逐次前記重みベクトル更新手段
によって更新した前記重みベクトルを用いて前記神経系
計算手段によって出力パターンを算出する神経系学習装
置用の並列処理装置。 - 【請求項3】 請求項1の神経系学習装置用の並列処理
装置において、前記各演算装置はそれぞれ入力パターン
と教師パターンとの対の集合が割り当てられ、前記集合
の全ての入力パターンについて同一の重みベクトルで神
経系計算手段によって出力パターンを計算すると共に重
みベクトル更新手段によって重みベクトルの修正量を計
算し、この修正量を用いて重みベクトルを更新する神経
系学習装置用の並列処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6098623A JPH07306845A (ja) | 1994-05-12 | 1994-05-12 | 神経系学習装置用の並列処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6098623A JPH07306845A (ja) | 1994-05-12 | 1994-05-12 | 神経系学習装置用の並列処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07306845A true JPH07306845A (ja) | 1995-11-21 |
Family
ID=14224672
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6098623A Pending JPH07306845A (ja) | 1994-05-12 | 1994-05-12 | 神経系学習装置用の並列処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07306845A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018018220A (ja) * | 2016-07-26 | 2018-02-01 | 富士通株式会社 | 並列情報処理装置、情報処理方法、およびプログラム |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02181257A (ja) * | 1989-01-06 | 1990-07-16 | Hitachi Ltd | 情報処理装置 |
| JPH04287153A (ja) * | 1991-03-18 | 1992-10-12 | Fujitsu Ltd | 並列計算機システム |
| JPH05342172A (ja) * | 1992-06-08 | 1993-12-24 | Toshiba Corp | マルチプロセッサシステム |
-
1994
- 1994-05-12 JP JP6098623A patent/JPH07306845A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02181257A (ja) * | 1989-01-06 | 1990-07-16 | Hitachi Ltd | 情報処理装置 |
| JPH04287153A (ja) * | 1991-03-18 | 1992-10-12 | Fujitsu Ltd | 並列計算機システム |
| JPH05342172A (ja) * | 1992-06-08 | 1993-12-24 | Toshiba Corp | マルチプロセッサシステム |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018018220A (ja) * | 2016-07-26 | 2018-02-01 | 富士通株式会社 | 並列情報処理装置、情報処理方法、およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109522052B (zh) | 一种计算装置及板卡 | |
| EP3451242A1 (en) | Device and method for performing reversetraining of fully connected layers of neural network | |
| EP0421639B1 (en) | Parallel data processing system | |
| CN107886167A (zh) | 神经网络运算装置及方法 | |
| JPH04290155A (ja) | 並列データ処理方式 | |
| JPH04293151A (ja) | 並列データ処理方式 | |
| CN111045728B (zh) | 一种计算装置及相关产品 | |
| CN111047022A (zh) | 一种计算装置及相关产品 | |
| JPH0567060A (ja) | ニユーロデバイス | |
| CN111930681A (zh) | 一种计算装置及相关产品 | |
| JPH07306845A (ja) | 神経系学習装置用の並列処理装置 | |
| JPH076146A (ja) | 並列データ処理システム | |
| CN111198714B (zh) | 重训练方法及相关产品 | |
| JPH04229362A (ja) | 学習機械 | |
| GB2206428A (en) | Computer | |
| WO2023214609A1 (ko) | 상태 벡터를 효율적으로 계산하는 양자 회로 연산 방법 | |
| JP2679731B2 (ja) | パイプライン処理を用いたニューラルアーキテクチュア | |
| CN119398122B (zh) | 基于通用LoRA和领域专用LoRA多任务混合专家模型微调方法 | |
| CN114723032B (zh) | 一种长短期记忆神经网络硬件加速方法与计算系统 | |
| CN111222632A (zh) | 计算装置、计算方法及相关产品 | |
| CN111367567A (zh) | 一种神经网络计算装置和方法 | |
| JPH05197702A (ja) | 神経回路網シミュレータ装置 | |
| JP2765903B2 (ja) | 情報処理装置 | |
| JPH0451386A (ja) | ニューラルネットワーク及びその構築方法 | |
| JPH0471063A (ja) | 神経回路網型計算装置 |