JPH0680505B2

JPH0680505B2 - 多層神経回路網の学習方式

Info

Publication number: JPH0680505B2
Application number: JP63250915A
Authority: JP
Inventors: 信也細木
Original assignee: Agency of Industrial Science and Technology
Current assignee: National Institute of Advanced Industrial Science and Technology AIST
Priority date: 1988-10-06
Filing date: 1988-10-06
Publication date: 1994-10-12
Anticipated expiration: 2009-10-12
Also published as: JPH0298770A

Description

【発明の詳細な説明】〔概要〕多層神経回路網の学習を行う学習方式に関し、中間層に興奮性荷重および抑制性荷重を設け、第１層に
入力パターンを入力して自己学習させることにより、入
力パターンに対して特異的に反応する要素を自動形成さ
せ、冗長性、汎化能力を向上させることを目的とし、入力パターンを非線型処理する第１層と、この第１層か
らのパターンV⁽¹⁾の全てに対して演算するための学習し
得る興奮性荷重、およびモニタセルからのパターンに対
して演算するための学習し得る抑制性荷重、上記興奮性
荷重と上記抑制性荷重とについてそれぞれ演算したパタ
ーンの総和を求める和回路、この和回路によって求めた
パターンを非線型処理する第２層と、この第２層からの
パターンV⁽²⁾に所定の荷重を演算し、これら演算したパ
ターンの総和を求める和回路からなる第３層と、上記第
１層からのパターンV⁽¹⁾および上記第２層からのパター
ンV⁽²⁾の和を求めて非線型処理を行い、その結果のパタ
ーンを上記第２層（中間層）の抑制性荷重と演算させる
モニタセルとを備え、第１層からのパターンV⁽¹⁾および
第２層のパターンV⁽²⁾に基づいて該当する興奮性荷重の
値を更新（増分・減分）すると共に、第１層からのパタ
ーンV⁽¹⁾の総和および第２層のパターンV⁽²⁾の総和に基
づいて該当する抑制性荷重（４）の値を更新（増分・減
分）する自己学習を行うようち構成する。また、第３層
の荷重に対して誤差分に対応するパターンによって、当
該荷重を更新（増分・減分）して誤差修正学習し得るよ
うに構成する。

〔産業上の利用分野〕

本発明は、多層神経回路網の学習を行う学習方式、特に
中間層を設けて自己学習を行うと共に誤差学習を行い得
るように構成した多層神経回路網の学習方式に関するも
のである。

〔従来の技術と発明が解決しようとする課題〕

近年、小脳を模式した多層神経回路網を適用したロボッ
トマニュピュレータの学習方式として、バックプロパゲ
ーション法、誤差修正法などが提案されている。バック
プロパゲーション法は、中間層も最終層と同じアルゴリ
ズムで学習可能である点で優れているが、記憶可能な入
力パターン数、冗長性（細胞の一部に故障が発生しても
学習により正常な動作が可能となる性質）、汎化能力
（学習された入力パターンとは異なるが、それに近い入
力パターンがきた場合に、近い出力が得られる能力）な
どの点で未だ十分とは言えない問題がある。また、誤差
修正法は、最終層のみについて学習が行われ、中間層の
構成は先見的な知識に基づいていわば固定的であり、自
己学習し得ないという問題がある。

本発明は、中間層に興奮性荷重および抑制性荷重を設
け、第１層に入力パターンを入力して自己学習させるこ
とにより、入力パターンに対して特異的に反応する要素
を自動形成させ、冗長性、汎化能力を向上させることを
目的としている。

〔課題を解決する手段〕

第１図を参照して課題を解決する手段を説明する。

第１図において、第１層は、入力パターンを非線型処理
１するものである。

第２層（中間層）は、第１層からのパターンV⁽¹⁾の全て
に対して演算するための学習し得る興奮性荷重２、およ
びモニタセル６からのパターンに対して演算するための
学習し得る抑制性荷重４、興奮性荷重２と抑制性荷重４
とについてそれぞれ演算したパターンの総和を求める和
回路３、この和回路３によって求めたパターンを非線型
処理５するものである。

第３層は、第２層からのパターンV⁽²⁾に所定の荷重７を
演算し、これら演算したパターンの総和を求める和回路
８からなるものである。

モニタセル６は、第１層からのパターンV⁽¹⁾および第２
層からのパターンV⁽²⁾の和を求めて非線型処理を行い、
その結果のパターンを第２層（中間層）の抑制性荷重４
と演算させるものである。

〔作用〕

本発明は、第１図に示すように、第１層が入力パターン
について非線型処理を行ってパターンV⁽¹⁾を送出し、第
２層がこれらのパターンV⁽¹⁾に興奮性荷重２を演算した
結果と、モニタセル６からのパターンに抑制性荷重４を
演算した結果との和を求め、更に非線形処理５を行って
パターンV⁽²⁾を送し、第３層がこのパターンV⁽²⁾に荷重
７を演算して和を求めて出力パターン（例えば第７図T
n）を出力するようにしている。この際、第２層へのパ
ターンV⁽¹⁾および第２層からのパターンV⁽²⁾に基づい
て、第２層の要素の興奮性荷重２の値を更新（増分・減
分）し、また、モニタセル６が、第１層からのパターン
V⁽¹⁾の和および第２層からのパターンV⁽²⁾に基づいて、
第２層の要素の抑制性荷重４の値を更新（増分・減分）
し、発火要素数を抑制することにより、自己学習（入力
パターンに対し特異的に反応する要素を形成）するよう
にしている。更に、第３層の荷重７について、誤差を修
正するように更新（増分・減分）する学習を行うように
している（第７図、第８図参照）。

従って、入力パターンを第１層に入力して中間層に設け
た興奮性荷重２および抑制性荷重４について自己学習さ
せることにより、入力に適応した結線が自動的に行われ
て入力パターンに対して特異的に反応する要素（細胞）
を形成することが可能となると共に、冗長性、汎可能力
を得ることが可能となる。更に、最終層である第３層の
荷重７に対して誤差修正学習を行わせる。

〔実施例〕次に、第１図から第８図を用いて本発明の１実施例の構
成および動作を順次詳細に説明する。

第１図において、第１層は、入力パターンを非線型処理
１する要素から構成されている。この非線型処理１は、
例えば下式で表される非線型処理を行う。

第２層（中間層）は、興奮性荷重２、和回路３、抑制性
荷重４、非線型処理５を持つ複数の要素（例えば500
個）から構成されている。ここで、和回路３は、第１層
からのパターンV⁽¹⁾の全てについて興奮性荷重２をそれ
ぞれ演算した値と、モニタセル６からのパターンについ
て抑制性荷重４を演算した値との和を基めるものであ
る。

第３層は、第２層からのパターンV⁽²⁾に所定の荷重（誤
差修正学習した荷重）７を演算し、これら演算したパタ
ーンの総和を求める和回路８から構成されている。

モニタセル６は、第１層からのパターンV⁽¹⁾および第２
層からのパターンV⁽²⁾の総和を求めて非線型処理を行う
ものである。

第２図は、第１図第２層の１つの要素（細胞）構成例を
示す。ここで、Vj⁽¹⁾は第１層からのパターン、Vi⁽²⁾は
第２層から出力されるパターン、Wijは興奮性荷重、Wig
は抑制性荷重、Σは和回路、θｉは閾値、∫は非線型処
理を表す。

次に、第３図を用いて、本発明の全体概念を説明する。

第３図において、signalは後述する第７図に示すような
平面２関節マニュピレータの理想軌道についての入力
（関節角とその速度）である。

Gaussian filterは、ガウスフィルタであって、第４図
を用いて後述するように、入力パターンから第４図
（ハ）上段に示すような位相幅Δａ（＝40゜）、間隔10
゜からなる信号成分を抽出するものである。

第１層は、第１図非線型処理から構成されている。

第２層（中間層）は、第１図第２層に示す構成を持ち、
self-organization（自己学習）を実行する層である。

第３層は、第１図第３層に示す構成を持ち、error-corr
ection（誤差修正学習）を実行する層である。

モニタセル６は、第１層からのパターンV⁽¹⁾および第２
層からのパターンV⁽²⁾に基づいて、第２層（中間層）の
抑制を行うものである。

第４図を用いて、第１層へ入力する入力パターンの生成
例について説明する。

第４図（イ）はガウスフィルタの動作説明を示す。これ
は、第７図平面２関節マニピュレータのものであって、
第４図（ハ）上段の関節角θに示すように、 −60゜ないし＋60゜（関節角の範囲） Δａ＝40゜（半値幅）フィルタ数＝16 とした場合、第４図（ロ）に示すように指示された関節
角θを入力として、16個のガウスフィルタ（半値幅Δａ
＝40゜、間隔＝10゜の特性を持つ合計16個のガウスフィ
ルタ）によって、合計16個の要素を持つ入力パターンを
生成する。また、第４図（ハ）速度についても同様に、
24個のガウスフィルタ（半値幅Δｖ＝240度、間隔50度
／秒の特性を持つ合計24個のガウスフィルタ）によっ
て、合計24個の要素を持つ入力パターンを生成する。そ
して、第７図平面２関節マニュピレータの場合には、第
５図関節角および速度が２組となるから、合計（16＋24）×２＝80 の入力パターンを第３図第１層（第１図第１層）に入力
する。これら入力した80個の要素の入力パターンについ
てそれぞれ既述した非線型処理を行ったパターンV⁽¹⁾を
第２層に入力する。

次に、第５図式（１）から（４）を用いて、第２層（中
間層）の自己学習について詳細に説明する。

第５図において、式（１）の左辺のτdwij⁽²⁾/dtは興奮
性荷重の増分を示し、式（２）の右辺のτdwig/dtは抑
制性荷重の増分を示し、式（３）の左辺のVgはモニタセ
ル６からの抑制パターンを示し、式（４）のVi⁽²⁾は第
２層からのパターンを示す。また、τは時定数、c₁、c₂
は学習の速度や収束値を決める学習パラメータを示す。
以下自己学習の手順を説明する。

第１に、式（１）の興奮性荷重wij⁽²⁾および式（２）の
抑制性荷重wigは、当初ランダム（例えば一様乱数）に
与える。

第２に、第４図ガウスフィルタを通ってきた入力パター
ン（例えば平面２関節マニュピレータの関節角（θ_１、
θ_２）、速度（V₁、V₂）から生成した80個の要素を持つ
入力パターン）が、第１層の非線形処理１によって非線
型の変換を受け、第２層へのパターンV⁽¹⁾となる。

第３に、この第２層へのパターンV⁽¹⁾について、当初ラ
ンダムに設定し、その後学習する興奮性荷重wij⁽²⁾およ
び抑制性荷重wigの値に基づいて、式（４）に従って第
２層から出力されるパターンV⁽²⁾を生成する。ここで、
θｉは閾値である。

第４に、式（１）によって興奮性荷重の増分“Δwi
j⁽²⁾"を行う。この式（１）によって表される増分“Δw
ij⁽²⁾"は（シナップス値の上昇は）、第２層のある要素
（細胞、Vi⁽²⁾）が発火し、かつ第１層のある要素（細
胞、Vj⁽¹⁾）が発火した時に、その積に比例する。一
方、第２層のある要素が発火していない時や第１層から
の入力がない時には、減少する。当初ランダムな興奮性
荷重wij⁽²⁾に設定しても、種々の特異的な入力パターン
を入力して繰り返し学習を行って更新することにより、
式（１）の右辺の括弧の中が零となるような安定平衡状
態に収束するように自動的に第２層の結線が形成され
る。

第５に、式（２）によって抑制性荷重の増分“Δwig"を
行う。この式（２）によって表される増分“Δwig"は、
第２層のある要素（細胞、Vi⁽²⁾が発火し、かつ第１層
からの出力パターンVi⁽¹⁾の総和および第２層からのパ
ターンVj⁽²⁾の総和が所定閾値θ_０よりも大きい時に、
その積に比例する。一方、第２層のある要素が発火して
いない時や、総和が小さい時には、減少する。当初ラン
ダムな抑制性荷重wigに設定しても、種々の特異的な入
力パターンを入力して学習を行って更新することによ
り、式（２）の右辺の括弧の中が零となるような安定平
衡状態に収束するように自動的に第２層の抑制が制御さ
れる。即ち、第２層（中間層）の要素（細胞）が発火し
すぎると、式（３）のVgが大となり、式（２）によって
抑制性荷重が大きくなって第２層の総発火数を抑えるよ
うに制御する。一方、総発火数が少ない時には、多くな
るように制御する。更に、第２層からのパターンV⁽²⁾の
値が小さくなってくると、式（１）、式（２）の右辺に
かかっているV⁽²⁾によって、興奮性荷重および抑制性荷
重の増分が小さくなるように制御される。

次に、第６図は、中間層（第２層）の応答例のシミュレ
ーション結果を模式的に表したものである。横軸に入力
パターンを示し、縦軸は細胞（要素）の種類を示す。図
中の横棒が発火した細胞、即ち入力パターンに対して特
異的に反応する細胞を示す。この応答例から入力パター
ンに対応してほぼ一様に当該入力パターンの検出細胞
（要素）が形成されたことが判明する（90％以上）。ま
た、検出細胞（第２層の要素）は、１個の入力パターン
に反応するものから、類似する数個の入力パターンに反
応するものまで分布している様子が判る。

次に、第７図および第８図を用いて、本発明を平面２関
節マニュピレータに適用した場合の構成およびシミュレ
ーション結果を説明する。

第７図は、本発明を平面２関節マニュピレータに適用し
た場合の応用例を示す。この制御対象の力学的モデル
は、下式で表せる。

Ａ（θ）＋Ｂ（θ、）＋Ｃ（θ）＝Ｔここで、左辺の各項は慣性項、求心およびコリオリ力の
項、重力項を表す。また、右辺のＴはトルクである。シ
ミュレーションでは、アームの質量M₁＝M₂＝5.0kg、長
さL₁＝L₂＝0.3mとした。理想軌道として、１秒間続く４
種類を採用し、シミュレーションの時間間隔は0.02秒と
した。従って、１個の軌道につき、50パターンが第１図
構成に提示されることとなる。フィードバックの利得Kp
＝1.0、速度Kv＝3.0とした。第１図の第１層の各要素
（細胞）には、角度と角速度とを既述した第４図（ロ）
ガウスフィルタを通して80個に離散化した入力パターン
を与えた。各関節につき、40個（角度:16個、各速度:24
個）である。

第８図（イ）、（ロ）は、アーム角θ_１、アーム角θ_２
について、単一軌道について学習を行わせた結果を表
す。横軸は学習回数を表し、縦軸は規格化したRMSE（平
均自乗誤差の平方）を表す。尚、第８図（ハ）は60回の
学習後のRMSEを示す。ここで、N⁽²⁾は中間層（第２の
層）の細胞数である。

〔発明の効果〕

以上説明したように、本発明によれば、入力パターンを
第１層に入力して中間層（第２層）に設けた興奮性荷重
２および抑制性荷重４について自己学習させ、入力に適
応した結線を自動的に行う構成を採用しているため、入
力パターンに対して特異的に反応する要素（細胞）を自
己学習的に形成することができると共に、冗長性、汎化
能力を持たせることができる。更に、最終層である第３
層の荷重７の学習によって誤差修正学習を行わせること
ができる。これら中間層の自己学習および最終層の誤差
修正学習を行う多層神経回路網をフィードバック系に適
用、例えば第７図に示すように適用することにより、フ
ィードバック系から学習に従い、本発明に係わる多層神
経回路網によるフィードフォワード系に移行する。

【図面の簡単な説明】

第１図は本発明の原理ブロック図、第２図は第２層の要
素構成例、第３図は本発明の全体説明図、第４図はガウ
スフィルタ説明図、第５図は中間層の学習動作説明図、
第６図は中間層の応答例、第７図は本発明の応用例説明
図、第８図は本発明の応用例の学習説明図を示す。図中、１、５は非線形処理、２は興奮性荷重、３、８は
和回路、４は抑制性荷重、６はモニタセル、７は荷重を
表す。

Claims

【特許請求の範囲】

【請求項１】多層神経回路網の学習を行う学習方式にお
いて、入力パターンを非線型処理する手段（１）を有する第１
層と、この第１層からのパターンV⁽¹⁾の全てに対して演算する
ための学習し得る興奮性荷重手段（２）と、モニタセル
（６）からのパターンに対して演算するための学習し得
る抑制性荷重手段（４）と、上記興奮性荷重手段（２）
と上記抑制性荷重手段（４）とについてそれぞれ演算し
たパターンの総和を求める和回路（３）と、この和回路
（３）によって求めたパターンを非線型処理する手段
（５）を含む第２層と、この第２層からのパターンV⁽²⁾に所定の荷重を演算する
荷重手段（７）と、当該演算したパターンの総和を求め
る和回路（８）とを含む第３層と、上記第１層からのパターンV⁽¹⁾および上記第２層からの
パターンV⁽²⁾の和を求めて非線型処理を行い、その結果
のパターンを上記第２層（中間層）の抑制性荷重手段
（４）と演算させるモニタセル（６）とを備え、第１層からのパターンV⁽¹⁾と第２層からのパターンV⁽²⁾
の積に比例して該当する興奮性荷重手段（２）の値を更
新（増分・減分）すると共に、第１層からのパターンV⁽¹⁾の総和に第２層からのパター
ンV⁽²⁾の総和を加えたものに第２層からのパターンV⁽²⁾
を積算した値に比例して該当する抑制性荷重手段（４）
の値を更新（増分・減分）する自己学習を行うように構
成したことを特徴とする多層神経回路網の学習方式。
【請求項２】上記第３層の荷重手段（７）に対して誤差
分に対応するパターンによって、当該荷重手段（７）を
更新（増分・減分）して誤差学習し得るように構成した
ことを特徴とする第（１）項記載の多層神経回路網の学
習方式。