JPH0680505B2 - 多層神経回路網の学習方式 - Google Patents
多層神経回路網の学習方式Info
- Publication number
- JPH0680505B2 JPH0680505B2 JP63250915A JP25091588A JPH0680505B2 JP H0680505 B2 JPH0680505 B2 JP H0680505B2 JP 63250915 A JP63250915 A JP 63250915A JP 25091588 A JP25091588 A JP 25091588A JP H0680505 B2 JPH0680505 B2 JP H0680505B2
- Authority
- JP
- Japan
- Prior art keywords
- layer
- pattern
- load
- learning
- patterns
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000013016 learning Effects 0.000 title claims description 35
- 238000000034 method Methods 0.000 title claims description 14
- 238000013528 artificial neural network Methods 0.000 title claims description 10
- 230000002964 excitative effect Effects 0.000 claims description 21
- 230000002401 inhibitory effect Effects 0.000 claims description 21
- 230000000452 restraining effect Effects 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 description 26
- 238000010586 diagram Methods 0.000 description 6
- 238000010304 firing Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Landscapes
- Exposure And Positioning Against Photoresist Photosensitive Materials (AREA)
- Image Analysis (AREA)
Description
【発明の詳細な説明】 〔概要〕 多層神経回路網の学習を行う学習方式に関し、 中間層に興奮性荷重および抑制性荷重を設け、第1層に
入力パターンを入力して自己学習させることにより、入
力パターンに対して特異的に反応する要素を自動形成さ
せ、冗長性、汎化能力を向上させることを目的とし、 入力パターンを非線型処理する第1層と、この第1層か
らのパターンV(1)の全てに対して演算するための学習し
得る興奮性荷重、およびモニタセルからのパターンに対
して演算するための学習し得る抑制性荷重、上記興奮性
荷重と上記抑制性荷重とについてそれぞれ演算したパタ
ーンの総和を求める和回路、この和回路によって求めた
パターンを非線型処理する第2層と、この第2層からの
パターンV(2)に所定の荷重を演算し、これら演算したパ
ターンの総和を求める和回路からなる第3層と、上記第
1層からのパターンV(1)および上記第2層からのパター
ンV(2)の和を求めて非線型処理を行い、その結果のパタ
ーンを上記第2層(中間層)の抑制性荷重と演算させる
モニタセルとを備え、第1層からのパターンV(1)および
第2層のパターンV(2)に基づいて該当する興奮性荷重の
値を更新(増分・減分)すると共に、第1層からのパタ
ーンV(1)の総和および第2層のパターンV(2)の総和に基
づいて該当する抑制性荷重(4)の値を更新(増分・減
分)する自己学習を行うようち構成する。また、第3層
の荷重に対して誤差分に対応するパターンによって、当
該荷重を更新(増分・減分)して誤差修正学習し得るよ
うに構成する。
入力パターンを入力して自己学習させることにより、入
力パターンに対して特異的に反応する要素を自動形成さ
せ、冗長性、汎化能力を向上させることを目的とし、 入力パターンを非線型処理する第1層と、この第1層か
らのパターンV(1)の全てに対して演算するための学習し
得る興奮性荷重、およびモニタセルからのパターンに対
して演算するための学習し得る抑制性荷重、上記興奮性
荷重と上記抑制性荷重とについてそれぞれ演算したパタ
ーンの総和を求める和回路、この和回路によって求めた
パターンを非線型処理する第2層と、この第2層からの
パターンV(2)に所定の荷重を演算し、これら演算したパ
ターンの総和を求める和回路からなる第3層と、上記第
1層からのパターンV(1)および上記第2層からのパター
ンV(2)の和を求めて非線型処理を行い、その結果のパタ
ーンを上記第2層(中間層)の抑制性荷重と演算させる
モニタセルとを備え、第1層からのパターンV(1)および
第2層のパターンV(2)に基づいて該当する興奮性荷重の
値を更新(増分・減分)すると共に、第1層からのパタ
ーンV(1)の総和および第2層のパターンV(2)の総和に基
づいて該当する抑制性荷重(4)の値を更新(増分・減
分)する自己学習を行うようち構成する。また、第3層
の荷重に対して誤差分に対応するパターンによって、当
該荷重を更新(増分・減分)して誤差修正学習し得るよ
うに構成する。
本発明は、多層神経回路網の学習を行う学習方式、特に
中間層を設けて自己学習を行うと共に誤差学習を行い得
るように構成した多層神経回路網の学習方式に関するも
のである。
中間層を設けて自己学習を行うと共に誤差学習を行い得
るように構成した多層神経回路網の学習方式に関するも
のである。
近年、小脳を模式した多層神経回路網を適用したロボッ
トマニュピュレータの学習方式として、バックプロパゲ
ーション法、誤差修正法などが提案されている。バック
プロパゲーション法は、中間層も最終層と同じアルゴリ
ズムで学習可能である点で優れているが、記憶可能な入
力パターン数、冗長性(細胞の一部に故障が発生しても
学習により正常な動作が可能となる性質)、汎化能力
(学習された入力パターンとは異なるが、それに近い入
力パターンがきた場合に、近い出力が得られる能力)な
どの点で未だ十分とは言えない問題がある。また、誤差
修正法は、最終層のみについて学習が行われ、中間層の
構成は先見的な知識に基づいていわば固定的であり、自
己学習し得ないという問題がある。
トマニュピュレータの学習方式として、バックプロパゲ
ーション法、誤差修正法などが提案されている。バック
プロパゲーション法は、中間層も最終層と同じアルゴリ
ズムで学習可能である点で優れているが、記憶可能な入
力パターン数、冗長性(細胞の一部に故障が発生しても
学習により正常な動作が可能となる性質)、汎化能力
(学習された入力パターンとは異なるが、それに近い入
力パターンがきた場合に、近い出力が得られる能力)な
どの点で未だ十分とは言えない問題がある。また、誤差
修正法は、最終層のみについて学習が行われ、中間層の
構成は先見的な知識に基づいていわば固定的であり、自
己学習し得ないという問題がある。
本発明は、中間層に興奮性荷重および抑制性荷重を設
け、第1層に入力パターンを入力して自己学習させるこ
とにより、入力パターンに対して特異的に反応する要素
を自動形成させ、冗長性、汎化能力を向上させることを
目的としている。
け、第1層に入力パターンを入力して自己学習させるこ
とにより、入力パターンに対して特異的に反応する要素
を自動形成させ、冗長性、汎化能力を向上させることを
目的としている。
第1図を参照して課題を解決する手段を説明する。
第1図において、第1層は、入力パターンを非線型処理
1するものである。
1するものである。
第2層(中間層)は、第1層からのパターンV(1)の全て
に対して演算するための学習し得る興奮性荷重2、およ
びモニタセル6からのパターンに対して演算するための
学習し得る抑制性荷重4、興奮性荷重2と抑制性荷重4
とについてそれぞれ演算したパターンの総和を求める和
回路3、この和回路3によって求めたパターンを非線型
処理5するものである。
に対して演算するための学習し得る興奮性荷重2、およ
びモニタセル6からのパターンに対して演算するための
学習し得る抑制性荷重4、興奮性荷重2と抑制性荷重4
とについてそれぞれ演算したパターンの総和を求める和
回路3、この和回路3によって求めたパターンを非線型
処理5するものである。
第3層は、第2層からのパターンV(2)に所定の荷重7を
演算し、これら演算したパターンの総和を求める和回路
8からなるものである。
演算し、これら演算したパターンの総和を求める和回路
8からなるものである。
モニタセル6は、第1層からのパターンV(1)および第2
層からのパターンV(2)の和を求めて非線型処理を行い、
その結果のパターンを第2層(中間層)の抑制性荷重4
と演算させるものである。
層からのパターンV(2)の和を求めて非線型処理を行い、
その結果のパターンを第2層(中間層)の抑制性荷重4
と演算させるものである。
本発明は、第1図に示すように、第1層が入力パターン
について非線型処理を行ってパターンV(1)を送出し、第
2層がこれらのパターンV(1)に興奮性荷重2を演算した
結果と、モニタセル6からのパターンに抑制性荷重4を
演算した結果との和を求め、更に非線形処理5を行って
パターンV(2)を送し、第3層がこのパターンV(2)に荷重
7を演算して和を求めて出力パターン(例えば第7図T
n)を出力するようにしている。この際、第2層へのパ
ターンV(1)および第2層からのパターンV(2)に基づい
て、第2層の要素の興奮性荷重2の値を更新(増分・減
分)し、また、モニタセル6が、第1層からのパターン
V(1)の和および第2層からのパターンV(2)に基づいて、
第2層の要素の抑制性荷重4の値を更新(増分・減分)
し、発火要素数を抑制することにより、自己学習(入力
パターンに対し特異的に反応する要素を形成)するよう
にしている。更に、第3層の荷重7について、誤差を修
正するように更新(増分・減分)する学習を行うように
している(第7図、第8図参照)。
について非線型処理を行ってパターンV(1)を送出し、第
2層がこれらのパターンV(1)に興奮性荷重2を演算した
結果と、モニタセル6からのパターンに抑制性荷重4を
演算した結果との和を求め、更に非線形処理5を行って
パターンV(2)を送し、第3層がこのパターンV(2)に荷重
7を演算して和を求めて出力パターン(例えば第7図T
n)を出力するようにしている。この際、第2層へのパ
ターンV(1)および第2層からのパターンV(2)に基づい
て、第2層の要素の興奮性荷重2の値を更新(増分・減
分)し、また、モニタセル6が、第1層からのパターン
V(1)の和および第2層からのパターンV(2)に基づいて、
第2層の要素の抑制性荷重4の値を更新(増分・減分)
し、発火要素数を抑制することにより、自己学習(入力
パターンに対し特異的に反応する要素を形成)するよう
にしている。更に、第3層の荷重7について、誤差を修
正するように更新(増分・減分)する学習を行うように
している(第7図、第8図参照)。
従って、入力パターンを第1層に入力して中間層に設け
た興奮性荷重2および抑制性荷重4について自己学習さ
せることにより、入力に適応した結線が自動的に行われ
て入力パターンに対して特異的に反応する要素(細胞)
を形成することが可能となると共に、冗長性、汎可能力
を得ることが可能となる。更に、最終層である第3層の
荷重7に対して誤差修正学習を行わせる。
た興奮性荷重2および抑制性荷重4について自己学習さ
せることにより、入力に適応した結線が自動的に行われ
て入力パターンに対して特異的に反応する要素(細胞)
を形成することが可能となると共に、冗長性、汎可能力
を得ることが可能となる。更に、最終層である第3層の
荷重7に対して誤差修正学習を行わせる。
〔実施例〕 次に、第1図から第8図を用いて本発明の1実施例の構
成および動作を順次詳細に説明する。
成および動作を順次詳細に説明する。
第1図において、第1層は、入力パターンを非線型処理
1する要素から構成されている。この非線型処理1は、
例えば下式で表される非線型処理を行う。
1する要素から構成されている。この非線型処理1は、
例えば下式で表される非線型処理を行う。
第2層(中間層)は、興奮性荷重2、和回路3、抑制性
荷重4、非線型処理5を持つ複数の要素(例えば500
個)から構成されている。ここで、和回路3は、第1層
からのパターンV(1)の全てについて興奮性荷重2をそれ
ぞれ演算した値と、モニタセル6からのパターンについ
て抑制性荷重4を演算した値との和を基めるものであ
る。
荷重4、非線型処理5を持つ複数の要素(例えば500
個)から構成されている。ここで、和回路3は、第1層
からのパターンV(1)の全てについて興奮性荷重2をそれ
ぞれ演算した値と、モニタセル6からのパターンについ
て抑制性荷重4を演算した値との和を基めるものであ
る。
第3層は、第2層からのパターンV(2)に所定の荷重(誤
差修正学習した荷重)7を演算し、これら演算したパタ
ーンの総和を求める和回路8から構成されている。
差修正学習した荷重)7を演算し、これら演算したパタ
ーンの総和を求める和回路8から構成されている。
モニタセル6は、第1層からのパターンV(1)および第2
層からのパターンV(2)の総和を求めて非線型処理を行う
ものである。
層からのパターンV(2)の総和を求めて非線型処理を行う
ものである。
第2図は、第1図第2層の1つの要素(細胞)構成例を
示す。ここで、Vj(1)は第1層からのパターン、Vi(2)は
第2層から出力されるパターン、Wijは興奮性荷重、Wig
は抑制性荷重、Σは和回路、θiは閾値、∫は非線型処
理を表す。
示す。ここで、Vj(1)は第1層からのパターン、Vi(2)は
第2層から出力されるパターン、Wijは興奮性荷重、Wig
は抑制性荷重、Σは和回路、θiは閾値、∫は非線型処
理を表す。
次に、第3図を用いて、本発明の全体概念を説明する。
第3図において、signalは後述する第7図に示すような
平面2関節マニュピレータの理想軌道についての入力
(関節角とその速度)である。
平面2関節マニュピレータの理想軌道についての入力
(関節角とその速度)である。
Gaussian filterは、ガウスフィルタであって、第4図
を用いて後述するように、入力パターンから第4図
(ハ)上段に示すような位相幅Δa(=40゜)、間隔10
゜からなる信号成分を抽出するものである。
を用いて後述するように、入力パターンから第4図
(ハ)上段に示すような位相幅Δa(=40゜)、間隔10
゜からなる信号成分を抽出するものである。
第1層は、第1図非線型処理から構成されている。
第2層(中間層)は、第1図第2層に示す構成を持ち、
self-organization(自己学習)を実行する層である。
self-organization(自己学習)を実行する層である。
第3層は、第1図第3層に示す構成を持ち、error-corr
ection(誤差修正学習)を実行する層である。
ection(誤差修正学習)を実行する層である。
モニタセル6は、第1層からのパターンV(1)および第2
層からのパターンV(2)に基づいて、第2層(中間層)の
抑制を行うものである。
層からのパターンV(2)に基づいて、第2層(中間層)の
抑制を行うものである。
第4図を用いて、第1層へ入力する入力パターンの生成
例について説明する。
例について説明する。
第4図(イ)はガウスフィルタの動作説明を示す。これ
は、第7図平面2関節マニピュレータのものであって、
第4図(ハ)上段の関節角θに示すように、 −60゜ないし+60゜(関節角の範囲) Δa=40゜(半値幅) フィルタ数=16 とした場合、第4図(ロ)に示すように指示された関節
角θを入力として、16個のガウスフィルタ(半値幅Δa
=40゜、間隔=10゜の特性を持つ合計16個のガウスフィ
ルタ)によって、合計16個の要素を持つ入力パターンを
生成する。また、第4図(ハ)速度についても同様に、
24個のガウスフィルタ(半値幅Δv=240度、間隔50度
/秒の特性を持つ合計24個のガウスフィルタ)によっ
て、合計24個の要素を持つ入力パターンを生成する。そ
して、第7図平面2関節マニュピレータの場合には、第
5図関節角および速度が2組となるから、合計 (16+24)×2=80 の入力パターンを第3図第1層(第1図第1層)に入力
する。これら入力した80個の要素の入力パターンについ
てそれぞれ既述した非線型処理を行ったパターンV(1)を
第2層に入力する。
は、第7図平面2関節マニピュレータのものであって、
第4図(ハ)上段の関節角θに示すように、 −60゜ないし+60゜(関節角の範囲) Δa=40゜(半値幅) フィルタ数=16 とした場合、第4図(ロ)に示すように指示された関節
角θを入力として、16個のガウスフィルタ(半値幅Δa
=40゜、間隔=10゜の特性を持つ合計16個のガウスフィ
ルタ)によって、合計16個の要素を持つ入力パターンを
生成する。また、第4図(ハ)速度についても同様に、
24個のガウスフィルタ(半値幅Δv=240度、間隔50度
/秒の特性を持つ合計24個のガウスフィルタ)によっ
て、合計24個の要素を持つ入力パターンを生成する。そ
して、第7図平面2関節マニュピレータの場合には、第
5図関節角および速度が2組となるから、合計 (16+24)×2=80 の入力パターンを第3図第1層(第1図第1層)に入力
する。これら入力した80個の要素の入力パターンについ
てそれぞれ既述した非線型処理を行ったパターンV(1)を
第2層に入力する。
次に、第5図式(1)から(4)を用いて、第2層(中
間層)の自己学習について詳細に説明する。
間層)の自己学習について詳細に説明する。
第5図において、式(1)の左辺のτdwij(2)/dtは興奮
性荷重の増分を示し、式(2)の右辺のτdwig/dtは抑
制性荷重の増分を示し、式(3)の左辺のVgはモニタセ
ル6からの抑制パターンを示し、式(4)のVi(2)は第
2層からのパターンを示す。また、τは時定数、c1、c2
は学習の速度や収束値を決める学習パラメータを示す。
以下自己学習の手順を説明する。
性荷重の増分を示し、式(2)の右辺のτdwig/dtは抑
制性荷重の増分を示し、式(3)の左辺のVgはモニタセ
ル6からの抑制パターンを示し、式(4)のVi(2)は第
2層からのパターンを示す。また、τは時定数、c1、c2
は学習の速度や収束値を決める学習パラメータを示す。
以下自己学習の手順を説明する。
第1に、式(1)の興奮性荷重wij(2)および式(2)の
抑制性荷重wigは、当初ランダム(例えば一様乱数)に
与える。
抑制性荷重wigは、当初ランダム(例えば一様乱数)に
与える。
第2に、第4図ガウスフィルタを通ってきた入力パター
ン(例えば平面2関節マニュピレータの関節角(θ1、
θ2)、速度(V1、V2)から生成した80個の要素を持つ
入力パターン)が、第1層の非線形処理1によって非線
型の変換を受け、第2層へのパターンV(1)となる。
ン(例えば平面2関節マニュピレータの関節角(θ1、
θ2)、速度(V1、V2)から生成した80個の要素を持つ
入力パターン)が、第1層の非線形処理1によって非線
型の変換を受け、第2層へのパターンV(1)となる。
第3に、この第2層へのパターンV(1)について、当初ラ
ンダムに設定し、その後学習する興奮性荷重wij(2)およ
び抑制性荷重wigの値に基づいて、式(4)に従って第
2層から出力されるパターンV(2)を生成する。ここで、
θiは閾値である。
ンダムに設定し、その後学習する興奮性荷重wij(2)およ
び抑制性荷重wigの値に基づいて、式(4)に従って第
2層から出力されるパターンV(2)を生成する。ここで、
θiは閾値である。
第4に、式(1)によって興奮性荷重の増分“Δwi
j(2)"を行う。この式(1)によって表される増分“Δw
ij(2)"は(シナップス値の上昇は)、第2層のある要素
(細胞、Vi(2))が発火し、かつ第1層のある要素(細
胞、Vj(1))が発火した時に、その積に比例する。一
方、第2層のある要素が発火していない時や第1層から
の入力がない時には、減少する。当初ランダムな興奮性
荷重wij(2)に設定しても、種々の特異的な入力パターン
を入力して繰り返し学習を行って更新することにより、
式(1)の右辺の括弧の中が零となるような安定平衡状
態に収束するように自動的に第2層の結線が形成され
る。
j(2)"を行う。この式(1)によって表される増分“Δw
ij(2)"は(シナップス値の上昇は)、第2層のある要素
(細胞、Vi(2))が発火し、かつ第1層のある要素(細
胞、Vj(1))が発火した時に、その積に比例する。一
方、第2層のある要素が発火していない時や第1層から
の入力がない時には、減少する。当初ランダムな興奮性
荷重wij(2)に設定しても、種々の特異的な入力パターン
を入力して繰り返し学習を行って更新することにより、
式(1)の右辺の括弧の中が零となるような安定平衡状
態に収束するように自動的に第2層の結線が形成され
る。
第5に、式(2)によって抑制性荷重の増分“Δwig"を
行う。この式(2)によって表される増分“Δwig"は、
第2層のある要素(細胞、Vi(2)が発火し、かつ第1層
からの出力パターンVi(1)の総和および第2層からのパ
ターンVj(2)の総和が所定閾値θ0よりも大きい時に、
その積に比例する。一方、第2層のある要素が発火して
いない時や、総和が小さい時には、減少する。当初ラン
ダムな抑制性荷重wigに設定しても、種々の特異的な入
力パターンを入力して学習を行って更新することによ
り、式(2)の右辺の括弧の中が零となるような安定平
衡状態に収束するように自動的に第2層の抑制が制御さ
れる。即ち、第2層(中間層)の要素(細胞)が発火し
すぎると、式(3)のVgが大となり、式(2)によって
抑制性荷重が大きくなって第2層の総発火数を抑えるよ
うに制御する。一方、総発火数が少ない時には、多くな
るように制御する。更に、第2層からのパターンV(2)の
値が小さくなってくると、式(1)、式(2)の右辺に
かかっているV(2)によって、興奮性荷重および抑制性荷
重の増分が小さくなるように制御される。
行う。この式(2)によって表される増分“Δwig"は、
第2層のある要素(細胞、Vi(2)が発火し、かつ第1層
からの出力パターンVi(1)の総和および第2層からのパ
ターンVj(2)の総和が所定閾値θ0よりも大きい時に、
その積に比例する。一方、第2層のある要素が発火して
いない時や、総和が小さい時には、減少する。当初ラン
ダムな抑制性荷重wigに設定しても、種々の特異的な入
力パターンを入力して学習を行って更新することによ
り、式(2)の右辺の括弧の中が零となるような安定平
衡状態に収束するように自動的に第2層の抑制が制御さ
れる。即ち、第2層(中間層)の要素(細胞)が発火し
すぎると、式(3)のVgが大となり、式(2)によって
抑制性荷重が大きくなって第2層の総発火数を抑えるよ
うに制御する。一方、総発火数が少ない時には、多くな
るように制御する。更に、第2層からのパターンV(2)の
値が小さくなってくると、式(1)、式(2)の右辺に
かかっているV(2)によって、興奮性荷重および抑制性荷
重の増分が小さくなるように制御される。
次に、第6図は、中間層(第2層)の応答例のシミュレ
ーション結果を模式的に表したものである。横軸に入力
パターンを示し、縦軸は細胞(要素)の種類を示す。図
中の横棒が発火した細胞、即ち入力パターンに対して特
異的に反応する細胞を示す。この応答例から入力パター
ンに対応してほぼ一様に当該入力パターンの検出細胞
(要素)が形成されたことが判明する(90%以上)。ま
た、検出細胞(第2層の要素)は、1個の入力パターン
に反応するものから、類似する数個の入力パターンに反
応するものまで分布している様子が判る。
ーション結果を模式的に表したものである。横軸に入力
パターンを示し、縦軸は細胞(要素)の種類を示す。図
中の横棒が発火した細胞、即ち入力パターンに対して特
異的に反応する細胞を示す。この応答例から入力パター
ンに対応してほぼ一様に当該入力パターンの検出細胞
(要素)が形成されたことが判明する(90%以上)。ま
た、検出細胞(第2層の要素)は、1個の入力パターン
に反応するものから、類似する数個の入力パターンに反
応するものまで分布している様子が判る。
次に、第7図および第8図を用いて、本発明を平面2関
節マニュピレータに適用した場合の構成およびシミュレ
ーション結果を説明する。
節マニュピレータに適用した場合の構成およびシミュレ
ーション結果を説明する。
第7図は、本発明を平面2関節マニュピレータに適用し
た場合の応用例を示す。この制御対象の力学的モデル
は、下式で表せる。
た場合の応用例を示す。この制御対象の力学的モデル
は、下式で表せる。
A(θ)+B(θ、)+C(θ)=T ここで、左辺の各項は慣性項、求心およびコリオリ力の
項、重力項を表す。また、右辺のTはトルクである。シ
ミュレーションでは、アームの質量M1=M2=5.0kg、長
さL1=L2=0.3mとした。理想軌道として、1秒間続く4
種類を採用し、シミュレーションの時間間隔は0.02秒と
した。従って、1個の軌道につき、50パターンが第1図
構成に提示されることとなる。フィードバックの利得Kp
=1.0、速度Kv=3.0とした。第1図の第1層の各要素
(細胞)には、角度と角速度とを既述した第4図(ロ)
ガウスフィルタを通して80個に離散化した入力パターン
を与えた。各関節につき、40個(角度:16個、各速度:24
個)である。
項、重力項を表す。また、右辺のTはトルクである。シ
ミュレーションでは、アームの質量M1=M2=5.0kg、長
さL1=L2=0.3mとした。理想軌道として、1秒間続く4
種類を採用し、シミュレーションの時間間隔は0.02秒と
した。従って、1個の軌道につき、50パターンが第1図
構成に提示されることとなる。フィードバックの利得Kp
=1.0、速度Kv=3.0とした。第1図の第1層の各要素
(細胞)には、角度と角速度とを既述した第4図(ロ)
ガウスフィルタを通して80個に離散化した入力パターン
を与えた。各関節につき、40個(角度:16個、各速度:24
個)である。
第8図(イ)、(ロ)は、アーム角θ1、アーム角θ2
について、単一軌道について学習を行わせた結果を表
す。横軸は学習回数を表し、縦軸は規格化したRMSE(平
均自乗誤差の平方)を表す。尚、第8図(ハ)は60回の
学習後のRMSEを示す。ここで、N(2)は中間層(第2の
層)の細胞数である。
について、単一軌道について学習を行わせた結果を表
す。横軸は学習回数を表し、縦軸は規格化したRMSE(平
均自乗誤差の平方)を表す。尚、第8図(ハ)は60回の
学習後のRMSEを示す。ここで、N(2)は中間層(第2の
層)の細胞数である。
以上説明したように、本発明によれば、入力パターンを
第1層に入力して中間層(第2層)に設けた興奮性荷重
2および抑制性荷重4について自己学習させ、入力に適
応した結線を自動的に行う構成を採用しているため、入
力パターンに対して特異的に反応する要素(細胞)を自
己学習的に形成することができると共に、冗長性、汎化
能力を持たせることができる。更に、最終層である第3
層の荷重7の学習によって誤差修正学習を行わせること
ができる。これら中間層の自己学習および最終層の誤差
修正学習を行う多層神経回路網をフィードバック系に適
用、例えば第7図に示すように適用することにより、フ
ィードバック系から学習に従い、本発明に係わる多層神
経回路網によるフィードフォワード系に移行する。
第1層に入力して中間層(第2層)に設けた興奮性荷重
2および抑制性荷重4について自己学習させ、入力に適
応した結線を自動的に行う構成を採用しているため、入
力パターンに対して特異的に反応する要素(細胞)を自
己学習的に形成することができると共に、冗長性、汎化
能力を持たせることができる。更に、最終層である第3
層の荷重7の学習によって誤差修正学習を行わせること
ができる。これら中間層の自己学習および最終層の誤差
修正学習を行う多層神経回路網をフィードバック系に適
用、例えば第7図に示すように適用することにより、フ
ィードバック系から学習に従い、本発明に係わる多層神
経回路網によるフィードフォワード系に移行する。
第1図は本発明の原理ブロック図、第2図は第2層の要
素構成例、第3図は本発明の全体説明図、第4図はガウ
スフィルタ説明図、第5図は中間層の学習動作説明図、
第6図は中間層の応答例、第7図は本発明の応用例説明
図、第8図は本発明の応用例の学習説明図を示す。 図中、1、5は非線形処理、2は興奮性荷重、3、8は
和回路、4は抑制性荷重、6はモニタセル、7は荷重を
表す。
素構成例、第3図は本発明の全体説明図、第4図はガウ
スフィルタ説明図、第5図は中間層の学習動作説明図、
第6図は中間層の応答例、第7図は本発明の応用例説明
図、第8図は本発明の応用例の学習説明図を示す。 図中、1、5は非線形処理、2は興奮性荷重、3、8は
和回路、4は抑制性荷重、6はモニタセル、7は荷重を
表す。
Claims (2)
- 【請求項1】多層神経回路網の学習を行う学習方式にお
いて、 入力パターンを非線型処理する手段(1)を有する第1
層と、 この第1層からのパターンV(1)の全てに対して演算する
ための学習し得る興奮性荷重手段(2)と、モニタセル
(6)からのパターンに対して演算するための学習し得
る抑制性荷重手段(4)と、上記興奮性荷重手段(2)
と上記抑制性荷重手段(4)とについてそれぞれ演算し
たパターンの総和を求める和回路(3)と、この和回路
(3)によって求めたパターンを非線型処理する手段
(5)を含む第2層と、 この第2層からのパターンV(2)に所定の荷重を演算する
荷重手段(7)と、当該演算したパターンの総和を求め
る和回路(8)とを含む第3層と、 上記第1層からのパターンV(1)および上記第2層からの
パターンV(2)の和を求めて非線型処理を行い、その結果
のパターンを上記第2層(中間層)の抑制性荷重手段
(4)と演算させるモニタセル(6)とを備え、 第1層からのパターンV(1)と第2層からのパターンV(2)
の積に比例して該当する興奮性荷重手段(2)の値を更
新(増分・減分)すると共に、 第1層からのパターンV(1)の総和に第2層からのパター
ンV(2)の総和を加えたものに第2層からのパターンV(2)
を積算した値に比例して該当する抑制性荷重手段(4)
の値を更新(増分・減分)する自己学習を行うように構
成したことを特徴とする多層神経回路網の学習方式。 - 【請求項2】上記第3層の荷重手段(7)に対して誤差
分に対応するパターンによって、当該荷重手段(7)を
更新(増分・減分)して誤差学習し得るように構成した
ことを特徴とする第(1)項記載の多層神経回路網の学
習方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63250915A JPH0680505B2 (ja) | 1988-10-06 | 1988-10-06 | 多層神経回路網の学習方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63250915A JPH0680505B2 (ja) | 1988-10-06 | 1988-10-06 | 多層神経回路網の学習方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0298770A JPH0298770A (ja) | 1990-04-11 |
| JPH0680505B2 true JPH0680505B2 (ja) | 1994-10-12 |
Family
ID=17214911
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63250915A Expired - Lifetime JPH0680505B2 (ja) | 1988-10-06 | 1988-10-06 | 多層神経回路網の学習方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0680505B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6463423B1 (en) | 1998-05-22 | 2002-10-08 | Nec Corporation | Multi-winners feedforward neural network |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5402519A (en) * | 1990-11-26 | 1995-03-28 | Hitachi, Ltd. | Neural network system adapted for non-linear processing |
-
1988
- 1988-10-06 JP JP63250915A patent/JPH0680505B2/ja not_active Expired - Lifetime
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6463423B1 (en) | 1998-05-22 | 2002-10-08 | Nec Corporation | Multi-winners feedforward neural network |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0298770A (ja) | 1990-04-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Yu et al. | Levenberg–marquardt training | |
| CN108388123A (zh) | 多个仿人机器人在速度不可测下的自适应控制方法 | |
| Wang et al. | A neuromorphic controller for a three-link biped robot | |
| JP5115965B2 (ja) | ニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、プログラム | |
| US6768927B2 (en) | Control system | |
| JPH0680505B2 (ja) | 多層神経回路網の学習方式 | |
| Song et al. | Neural adaptive control of excavators | |
| Jacobs et al. | A modular connectionist architecture for learning piecewise control strategies | |
| Belov et al. | Self-tuning PID controller using a neural network for nonlinear exoskeleton system | |
| Kitamura et al. | Autonomous motion planning and learning control of a biped locomotive robot | |
| Zweiri et al. | A new three-term backpropagation algorithm with convergence analysis | |
| Upadhyay et al. | ANN based intelligent controller for inverted pendulum system | |
| Zak et al. | On the adaptation algorithms for feedforward neural networks | |
| Pang et al. | CBMC-V2: A CNS-inspired Framework for Real-time Robotic Arm Control | |
| Katić et al. | Control algorithm for humanoid walking based on fuzzy reinforcement learning | |
| Ma et al. | Theory and implementation of a fuzzy control scheme for Pendubot | |
| Kang et al. | Learning deterministic spiking neuron feedback controllers | |
| Meng et al. | A neural network adaptive control scheme for robot manipulators | |
| Lan | Learning tracking controllers for unknown dynamical systems using neural networks | |
| Ahmed et al. | Adaptive neural network for identification and tracking control of a robotic manipulator | |
| Kurtaj et al. | New model of information processing at granule cell layer makes cerebellum as biological equivalent for ANFIS and CANFIS: Sharing of processing resources and generalization | |
| CN118732506A (zh) | 针对具有全状态约束的机械臂自适应变增益滑模控制方法 | |
| Hou et al. | Hybrid Control Method for a Flexible Manipulator | |
| Lee et al. | Self-tuning control by neural networks | |
| Shaffer et al. | Implementation of neural network controller for unknown systems |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |