JPH02226461A - 学習装置 - Google Patents

学習装置

Info

Publication number
JPH02226461A
JPH02226461A JP1047610A JP4761089A JPH02226461A JP H02226461 A JPH02226461 A JP H02226461A JP 1047610 A JP1047610 A JP 1047610A JP 4761089 A JP4761089 A JP 4761089A JP H02226461 A JPH02226461 A JP H02226461A
Authority
JP
Japan
Prior art keywords
learning
memory
calculation unit
unit
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1047610A
Other languages
English (en)
Other versions
JPH0736185B2 (ja
Inventor
Hideyuki Takagi
英行 高木
〆木 泰治
Taiji Shimeki
Shigeo Sakagami
茂生 阪上
Toshiyuki Koda
敏行 香田
Hayato Togawa
戸川 隼人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1047610A priority Critical patent/JPH0736185B2/ja
Priority to EP93202797A priority patent/EP0579341A2/en
Priority to US07/481,330 priority patent/US5168550A/en
Priority to DE69027874T priority patent/DE69027874T2/de
Priority to EP90301825A priority patent/EP0385637B1/en
Priority to KR1019900002309A priority patent/KR920006792B1/ko
Publication of JPH02226461A publication Critical patent/JPH02226461A/ja
Publication of JPH0736185B2 publication Critical patent/JPH0736185B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Feedback Control In General (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は制御・パターン認識等に用いる神経回路網の学
習装置に関するものである。
従来の技術 従来の学習装置は、 例えば、 ハ゛フクブロハ゛ケ゛
イションラーニツク° リブしt゛ンテイシヨンス゛ハ
゛イ バフクフ゛ロバケ゛イティツク゛エラース゛ B
ackpropagatlon   (D、  E、 
 Rumeihart、  G。
E、Hlnton and R,J、 Wllllam
s  Learning Representatlo
ns  by  Back−Propagatlng 
 Errors、’  Nature、 vol、32
3. pp、533−538. Oct、 9.19E
H)の学習アルゴリズムに基づいていた。以下にこの従
来の学習装置について説明する。
第22図は従来の学習装置の構成図である。第22図に
おいて、1は設定された条件まで学習が進んだかどうか
を判定する学習終了判定部、mlは入力データを保持す
る入力データメモリ、m2は学習目的値である正しい値
を保持しておく教師データメモリ、2は神経回路網構成
をした前向き方向計算部、m3は前向き計算部2の計算
結果を保持しておくユニット出力値メモIハ m4は前
向き方向計算部2で用いる重み係数を保持しておく重み
係数メモiハ 3は前向き方向計算部2の出力値と教師
データメモ’Jm2との差異を計算する誤差値計算部、
mloは誤差値計算部3の出力を保持しておく誤差値メ
モリ、4は誤差値計算部3の計算値に基づいて学習方向
を求める学習方向計算部N  m7は学習方向計算部4
の出力値を保持しておく最急降下方向メモIへ m6は
学習方向計算部4で得られた学習方向にどれだけ学習を
進めるかを示す学習率を保持しておく学習率メモ八 5
は学習方向計算部4の計算方向に学習率メモ’Jm6の
学習率に従って学習を行い重み係数メモリm4の値をど
れだけ修正すべきを計算する重み修正量計算部、m5は
重み修正量計算部5の計算結果を保持する重み修正量メ
モリである。
この従来の学習装置の動作を説明するために、まず第1
にこの学習装置の基幹部である前向き方向計算部2の動
作説明を行なっておく。前向き方向計算部2の一般構成
を第27図・に示す。また、その具体的構成例として、
中間層が1層で、入力層から出力層までのユニット数が
各々4個4個3個の場合を第28図に示す。第27図及
び第28図において、21は入力データメモリm1が割
り当てられる入カニニット、20は神経細胞の工学的モ
デルである多大カー出力のユニットである。
前向き方向計算部2では各層内相互に結合がなくかつ上
段の層にのみ信号が伝播される。このような前向き方向
計算部2を構成するユニット20のうち、線形演算のみ
を基本とする線形ユニ・ソトの構成を具体的に示したも
のが第29図である。第29図において、201はユニ
ッ)20の入力部、203は重み係数メモリm4の重み
係数と入力部201からの入力を各々掛は合わせる乗算
器、204は乗算器203各々の出力を足し合わせる加
算器である。つまり、第29図に示す多入力−出力のユ
ニット20は入力部201への入力値をX、重み係数メ
モリm4に格納されている重み係数をWlとすれば、 y :ΣWIX+          (1式)を計算
しているわけである。また、第30図は、前向き方向計
算部2を構成するユニット20のうち、非線形演算も行
う非線形ユニットの構成を具体的に示したものである。
第30図において、200は第29図で説明した線形ユ
ニット、300は線形ユニットの出力を一定範囲、の値
に制限する閾値処理部である。閾値処理部300の入出
力特性例を第31図に示す。例えば、出力を(0,1)
の範囲に制限する閾値処理部300の入出力特性は 0 = f(1)= 1 / (1+ exp(−1)
)       (2式)と数式的に表現できる。ここ
で、■とOは閾値処理部300の入力と出力である。
(2式)の関数fOをs1gmold関数と呼ぶ。この
ように、前向き計算部2は入力データメモ’J m 1
が保持しているデータを入力し、重み係数メモリm4.
!:の積和演算を内部で行いながら神経回路網構成のネ
ットワークの出力を計算するのである。ユニット20の
出力はユニット出力値メモリm3に格納される。
これに対し、学習は前向き方向計算部2の出力結果に応
じて出力層側から入力層側へ逆向き方向に計算される。
これがbackpropagatlonアルゴリズムの
特徴である。以下、このアルゴリズムに基づいて従来の
学習装置の動作説明を続けよう。
初めに記号の定義を行なう。ユニット出力値メモ’J 
m 3に格納されたデータの内、第に層の第1番目のユ
ニット出力をoklとし、教師データメモリm2に格納
された出力層第iユニットのための教師データを’I+
する。重み係数メモ’Jm4に格納されたデータの内、
第に一1層第i番目のユニットと第に層第j番目のユニ
ットを結ぶ重み係数をW ’ −’ + ’ Hとする
。重み修正量メモリm5に格納されたデータの内、重み
係数をwkす+ k rを修正する量をΔW””+1と
する。ユニット出力値メモリm3の内出力層ユニットの
出力値と教師データメモリm2との差の自乗和をEとす
る。学習率メモリm6に格納されていて、学習によって
重みを修正する際の学習率をε、重み係数w’づ+ k
 Jに対する学習方向をg k−1+ k + +とす
る。すると、学習によって修正する毒は ΔWk−1,に、 =  −εgk□11kj(3式)
で表わされる。学習方向gは学習方向計算部4で計算さ
れ最急降下方向メモリm6に格納される。
学習率計算部6は単に学習率メモ’Jm6を読み出すの
みであり、学習の間中間、じ値の学習率εが使われる。
この(3式)を実行するのが重み修正量計算部5で、こ
こで計算された重み修正量ΔWは重み修正量メモ’Jm
5に格納される。最後に、重み係数メモリ4が重み修正
量メモ’J m 5の修正量たけ修正されて学習の1サ
イクルが終わるのである。従って、学習方向gの求め方
さえ確定できればこの従来の学習装置は動作する。ba
ckpropagattonアルゴリズムではこの学習
方向を以下のようにして定式化していた。
g”IJ =  a E  /  aw’−’1に、 
  (4式)即ち、最急降下法に基づいて逐次学習を行
なうのである。この右辺を更に展開すると最終的には次
のように表わされる。
gk−1,に、  =  dk、(、に−1,(5式)
dk」  =  (OkJ−y))f’ (1’+) 
           (Ei 式)dkJ=  (Σ
wkJ’−’++d’n)f’(IJ)  げ式)(6
式)はkが出力層の場合、(7式)はに層が中間層の場
合の式である。f” (1)はIによる11!!微分で
、(2式)のようにs1gmold関数で表わされる場
合は、f’(lk+) = f(1’+) (1−f(
1’+))=  oJ(1−o’j)      (8
式)となり、四則演算だけで学習が可能になる。
以上の演算は学習方向計算部4で行なわれる。
学習方向計算部4は第23図に示すように最急降下方向
計算部4工で構成されている。最急降下方向計算部41
は第24図に示す構成をしている。
第24図において、411は(8式)を実行する閾値関
数微分計算部、412は(4式)を実行する誤差微分値
計算部である。ユニット出力値メモリm3からo Jを
読み込み(8式)を実行した閾値関数微分値計算部41
1は計算したr’ (1’+ )を誤差微分値計算部4
12に送る。誤差微分値計算部412は(6式)(7式
)を計算してd k rを求めた後、ユニット出力値メ
モリm3または入力データメモリm1から0k−1+を
読み込んで(5式)を実行する。これは即ち(4式)を
実行したことになるので誤差微分の名称を持つ。こうし
て得られたgk−1,に、は最急降下方向メモリm7に
格納される。
第25図に重み修正1計算部5の一構成例を示す。第5
図において5alとta2はそれぞれ加算器と乗算器で
ある。乗算器5a2は最急降下方向メモ’Jm7に格納
された最急降下方向gk−1,k。
と学習率メモリm6のεとを掛は合わせて(3式)を実
行し、重み係数の修正量を重み、修正量メモ’Jm5へ
格納する。加算器5alはこの個分だけ重み係数メモ’
J m 5の値を修正すれば1回の学習分の重み修正が
完了する。重み係数が更新されると前向き方向計算部2
は更新された重み係数を用いて新しい出力値を求めユニ
ット出力値メモリm3に格納しておく。誤差値計算部3
はこの値と教師データメモリm2との差の自乗和を誤差
値メモリm10へ格納しておく。学習終了判定部1が学
習によって誤差がどれだけ小さくなったかを調べ、設定
値以下になれば終了のt旨示を出す。第26図はこの学
習終了判定部の一構成例を示したものである。1mlは
終了基準値メモリ、1a1は減算器、12は制御部であ
る。終了判定に用いる設定値は終了基孕値メモ’J 1
 m lにいれられており、この値と誤差値メモ’J 
m 10との大小を減算器1alで行なうことで制御部
12が学習終了か継続かを判断し、学習装置全体の制御
を出すのである。
発明が解決しようとする課題 しかしながら上記のような方法は最急降下法に基づいて
いるため学習時間が長くかかるという課題を有していた
。これは、最急降下法が局所的には最適であるが、大局
的には必ずしもよくない逐次法であるからである。例え
ば、鋭い谷間のような空間を考えて最急降下法で最小点
の存在を探索すると、谷間の方向ではなく谷の側壁方向
が最急降下方向になりがちで、なかなか谷の方向へは進
めないことからも容易に推測できよう。さらに、学習を
始める時の重み係数の初期値の決定方法がないために乱
数を発生させて決めざるを得ないが、運が悪いとなかな
か収束せず学習を−からやり直す必要がしばしば生じる
。この見極めにはある程度学習を続けて明らかに学習効
率が悪いと判断しなければならず、結果的に時間が、か
かってしまうという課題も残されていた。
本発明はかかる点に鑑み、高速に学習を行なう学習装置
を提供することを目的とする。
課題を解決するための手段 本発明は、動的に学習率を計算する学習率計算部を備え
たことを特徴とする学習装置である。
また、動的に学習率を計算する学習率計算部と、学習率
計算補助メモリとを備えたことを特徴とする学習装置で
ある。
また、動的に学習率を計算する学習率計算部を備え、前
記学習率計算部は、複数の誤差値を計算する多重誤差値
計算部と、前記多重誤差値計算部の出力値から最適な学
習率の存在範囲を求める最小点存在区間検出部と、前記
最小点存在区間検出部で求められた区間中の最小点を決
定する最小点決定部とを内蔵していることを特徴とする
学習装置である。
また、動的に学習率を計算する学習率計算部を備え、前
記学習率計算部は、複数の誤差値を並列に計算する多重
誤差値並列計算部と、前記多重誤差値計算部の出力値か
ら最適な学習率の存在範囲を求める最小点存在区間検出
部と、前記最小点存在区間検出部で求められた区間中の
最小点を決定する最小点決定部とを内蔵していることを
特徴とする学習装置である。
また、学習方向を保持しておく共役勾配方向メモリと、
学習方向計算部とを備え、前記学習方向計算部は最急降
下方向を求める最急降下方向計算部と、前記最急降下方
向に基づいて最急降下方向を共役勾配方向へ変換する変
換係数を求める傾斜変換係数変換部と、前記最急降下方
向計算部の最急降下方向と前記傾斜変換係数変換部の変
換係数から共役勾配方向を求める共役勾配方向計算部と
を内蔵していることを特徴とする学習装置である。
また、学習方向を保持しておく共役勾配方向メモリと、
学習回数を記録する学習カウンタと、学習方向計算部と
、学習終了判定部とを備え、前記学習方向計算部は最急
降下方向を求める最急降下方向計算部と、前記最急降下
方向に基づいて最急降下方向を共役勾配方向へ変換する
変換係数を求める傾斜変換係数変換部と、前記最急降下
方向計算部の最急降下方向と前記傾斜変換係数変換部の
変換係数から共役勾配方向を求める共役勾配方向計算部
とを内蔵していることを特徴とする学習装置である。
また、これ以上学習を続けても学習効率が悪い状態であ
ることを検出する不適学習状態検出部を備えたことを特
徴とする学習装置である。
また、これ以上学習を続けても学習効率が悪い状態であ
ることを検出する不適学習状B@出部と、前記不適学習
状態検出部が不適な学習状態にあることを検出した場合
前記重み係数、メモリの値を更新する重み係数調整部と
を備えたことを特徴とする学習装置である。
作用 本発明は前記した構成により、学習率計算部が最適な学
習率を求め、この学習率に基づいて高速に学習を収束さ
せる。また、前記した構成により、学習方向が共役勾配
方向を求め、°この学習方向に基づいて高速に学習を収
束させる。さらに、前記した構成により、学習状態が悪
い状態かどうかをいち早く判断し無駄な学習を続けない
ようにすることによって結果的に高速に学習を収束させ
る。
実施例 第1図は本発明の一実施例における学習装置の構成図を
示すものである。第1図において、6は動的に学習率を
計算する学習率計算部である。以上のように構成された
第1の実施例の学習装置について、以下その動作を説明
する。
前向き計算部2に入力データメモリm1のデータが入力
されると、前向き計算部2は重み係数メモ’J m 4
の値を用いて神経回路網構成されたネ・ントワーク出力
を計算し、中間層ユニ・ソトの値と共にユニット出力と
メモリm3へ書き込む。誤差値計算部はユニット出力値
メモ’J m 3の内出力層ユニットの出力値と対応す
る教師データメモリm2の値の差の自乗和を計算し、誤
差値メモリml。
へ格納する。学習終了判定部は誤差値メモ’J m 1
0の値が内部で設定されている終了基準値以下であれば
、各構成部分に学習を終了するよう制御を行い、すべて
の学習が終了する。この時の重み係数メモリm4の値が
学習によって得られた結果である。しかし、終了基準値
以上の誤差値が誤差値メモ’Jm10に書き込まれてい
れば各構成部分に学習を継続するよう制御する。学習方
向計算部はユニット山力値メモリm3・教師データメモ
リm2・重み係数メモリm4Φ入力データメモリm1の
それぞれからデータを読み込み最急降下方向を計算して
最急降下方向メモ’Jm7へ書き込んでいく。そして学
習率計算部6が動的に計算した学習率を学習率メモlJ
m6に書き込み、最後に重み修正量計算部5が学習率と
学習方向を掛は合わせて重み修正量を求め、重み修正量
メモリm5に書き込むと同時に重み係数メモリm4の値
を修正する。
問題は最適な学習率の決定方法であるが、本発明では少
しづつ学習率の値を変化させて前向き方向の計算を行い
、教師データメモリm2との差を求め、この誤差が最も
少なくなるような学習率を求める方式を採用している。
この方法を示したのが第2図である。第2図の横軸は学
習率ε、縦軸は前述の誤差値である。すべての学習率に
ついて計算した特待られるであろうグラフを第2図に示
しである。なるべく少ない探索回数でこのグラフの最小
点を求めればよいのである。この探索にはiを探索回数
として 5=e@+a’h   、        (9式)で
学習率を順次評価していく。学習率ε1を用いて求めた
前述の誤差値をflとすれば、 f+  <  f+4+             (
10式)となるまで評価を続ける。すると、少なくとも
ε−4からε141の間に最小誤差値f ’sinを与
える学習率ε、1、が存在する。この3点(εしl+ 
 fl−2)  (ε+、f+)(ε書41.  f1
41)の内2点を通る2次曲線を考え、最小点を与える
極値を求めるのである。α=2の場合はもう少し精度を
上げ、かつ演算量を少なくすることができる。その様子
を第3図に示す。第3図は、(10式)を満たす3点が
得られた時の図で、この3点を(ε+、’f+)(ε2
1  f2)(ε4.f4)とする。次にε2とε4の
中点をε3とし、対応する誤差値f3を求める。そして
f2<f3             (11式)%式
%) の3点を用い、(11式)を満たさなければ、 (ε2
゜f2)(ε3.f3)(εJ、  f4)の3点を用
いて2次曲線の当てほめを行い、最小誤差値を与える学
習率εaInを求める。εSとε2とε3とε4が等間
隔に並ぶのでこの最適学習率は容易に求められ、例えば
、前者の場合、 この計算を行なう学習率計算部6の構成を第4図に示す
。第4図において、61は最適な学習率c++Inが存
在する区間[εl −1+  ε141コを探す最小点
存在区間検出部、62はその区間から2次曲線の当ては
めによって最適な学習率εsInを決定する最小点決定
部である。各部は上述の方法で区間および最適な学習率
を求める。この具体的構成を示したのが第5図である。
第5図において、61m1〜61m3は(9式)の右辺
を実行するためのメモリで、各々αメモリ・hメモリ・
α1hメモリである。61m4は(9式)の左辺を格納
するεメモリである。61m5はεメモ’J 61 m
 4の各学習率εに対、応する誤差値fを格納するfメ
モリである。611は(10式)が満足するまで学習率
存在区間検出部61の制御を行い、終了すれば最終点決
定部62に制御を渡す制御部である。612は(9式)
の計算をするε4計算部、613はεメモリ61m4の
中のεメモリ61m4の値とfメモリ61m5の内容を
コピーするメモリコピー 614は(10式)の比較を
行なう比較器である。
以上のように構成された学習率存在区間検出部61の動
作を説明する。ε4計算部512はαメモ961m1φ
hメモリ61m2eεメモリe1m4から(9式)の計
算に必要な値を読みだし計算する。
(9式)の探索回数iはε4計算部512内部にあるカ
ウンタで管理する。この計算結果をεメモリ61m4の
ε4メモリに格納する。また、計算の途中結果αiIh
即ちhをα1hメモリ61m3へ待避しておく。これが
第1回目の計算である。第2回目は、ε4計算部512
はαメモ’J 61 m 1・α1hメモリ61m3@
εメモリ61m4から必要な値を読みだしく9式)の計
算を行い同様にεメモリ61m4のε4メモリに格納す
る。第2回目以降は、(9式)のα1hは指数演算をす
る必要はなく、α1hメモリ61m3の値にαメモリ6
1m1の値を乗じて再びαIhメモリ61m3へ戻すと
いう1回の乗算だけでよい。この演算に先立ちメモリコ
ピー613はQ2→Q+、Q4→Q2+  r2→f+
+  f4→f2とメモリの内容をコピーしておく。ε
4計算部512が(8式)の計算結果をεメモリ61m
4のε4メモリに格納すると、制御部611は前向き計
算部2および誤差値計算部3に指令をだし、学習率ε4
に対応するf4を求めさせる。そして、fメモリ61m
5のf、メモリに格納させる。比較器614はこのf4
とf2の大小比較を行、なう。これは(10式)に相当
する。その結果、(10式)が満たされれば最適学習率
の存在範囲は[ε1. ε4コであると確定するので制
御部1はそのことを最小点決定部62に知らせ制御を渡
す。
最小点決定部62の構成も同じく第5図に示しである。
第5図において、621は(12式)が求められるよう
最小点決定部6全体を制御する制御部、622はεメモ
981m4からε2とεイの中点であるε3を求めるε
3計算部、82m1はε3計算部622が求めたε3を
格納するε3メモリ、Ei2m2はε3に対応する誤差
値f3を格納するf3メモリ、623はεメモリe1m
411ε3メモリ62m1・fメモリ61m5からデー
タを読みだして(12式)を計算する最終点計算部、6
2m3は最終点計算部623の求めた最適な学習率εa
Inを格納するε、。メモリである。
以上のように構成された最小点決定部62の動作を説明
する。ε3計算部622はεメモリ[11m4からε2
とε4を読みだしε3=(ε2+ε4)/2を計算し、
ε3メモリ62m1へ格納する。ε3メモリ[112m
1にε3が書き込まれると、制御部621は前向き計算
部2および誤差値計算部3に指令をだし、学習率ε3に
対応するf3を求めさせる。そして、f3メモ’J62
m2に格納させる。最小点計算部623はεメモリ61
m4からε2の値を、ε3メモリ82m1からε3の値
を読みだし、(11式)の大小関係を比較する。その結
果(11式)が満たされれば、(12式)を計算しεn
lnメモ’JEi2+n3へ格納する。もし、(11式
)が満たされなければεメモ’JGIm4からf4を読
みだし、(13式)を実行して最適学習率εsInを求
める。
ε、。メモL62m3が書き込まれれば最小点決定部6
2の仕事は終わり制御を学習率計算部6へ戻す。学習率
計算部6は、最終的に求まったε、。メモ’J 62 
m 3の最適学習率ε、。を学習率メモIJ m6に格
納し、学習率計算をすべて終わる。
こうして本発明は学習毎に動的に最適な学習率を求めな
がら学習を行なう。第1図の構成をした本発明の学習装
置と第22図の構成をした従来の学習装置の学習終了時
間を実験的に比較してみた。
2OoO回実験を繰り返したところ、従来の学習装置の
学習終了期待時間が4秒58 m5ecであったのに対
し、本発明の学習装置では1秒444 m5ecと3倍
近く高速になった。
このように本実施例によれば、動的に学習率を求める学
習率計算部を設けることにより、効率よく学習を進め学
習時間を短縮させることができる。
なお、本実施例の最小点決定部において最適な学習率を
保持するεsInメモリを用いて説明したが、実施例の
説明でも明らかなように学習率メモリm6と同じ値であ
り、かつ、同時に使用することがないので、両メモリを
兼用しても何等差し支えない。また、(9式)からも明
かなようにe9をOと定義して行なう場合はεメモリ6
1m4は3つの値を保持するサイズでよい。また同様に
、(9式)のhを1と定義して行なう場合はhメモリ6
1m2は不用である。また、本実施例の最小点決定部は
(9式)のαが2である場合の説明を行なったが、股の
値であっても多少の構成の違、いはあるものの本質的に
大きな違いはなく、2次曲線の当てはめによる最小点の
決定が行える。
第6図は別の本発明の実施例における学習装置の構成図
を示すものである。第6図において、m9は学習率を効
率的に求めるための学習率計算補助メモリである。以上
のように構成された本発明の一実施例における学習装置
について、以下その動作を説明する。初めに、本発明の
学習率計算部6の動作の基本となる考え方についてもう
一度見直して見よう。第30図の線形信号処理部200
に入る入力総和は(1式)で表わされるので、(3式)
を組み込むと学習率計算部6内部で行なわれる逐次的な
計算は次のように表わされる。
Yk、=Σ (W ’ −’ + kH+Δwk−1,
に、) Xk−1と表わされる。ここでnは学習率存在
区間検出部61で最適学習率の存在区間が見つかるまで
逐次的に行なわれる探索回数である。
ところが、(14式)をよく検討すると、学習率存在区
間検出部61で本当に必要な演算は変数nに関わるもの
だけであるから、(14式)は次のように変形可能であ
る。
yk、=Σ (wk −1、k 、 X k −1。
一ε (gk−1,に、Xk−1,)  )=Σ W”
+JXk− 一ε。Σ g k−1+ k 、 x k−1゛   
1 = Ak″11kj ×が中間層のユニソ よって変わるので、 が入力データメモリ の場合に限られる。
gnB’−’IJ      (15式)トの出力の場
合は学習率ε。に (15式)の変形が可能なのは× 1の内容で、yが第1中間層 即ち、 の入力和を求める場合、(14式)では((2回の乗算
と1回の減算)×入力層ユニット数)×第1中間層ユニ
ット数の演算が必要であったのに対し、(18式)では
(1回の乗算と1回の減算)×第1中間層ユニット数だ
けでよい。一般に神経回路網構成をした場合入力層のユ
ニット数が最大になる場合が最も多いのでこの演算数の
削減効果は大きい。
さて、本発明における学習率計算部6の中の学習率区間
存在検出部61では初め1回だけ(16式)のAとBを
計算して学習率計算補助メモ’J m 9へ格納してお
く。以後、学習率、計算補助メモ’J m 9を参照し
ながら(18式)を計算し最適な学習率の計算を行なう
のである。
以上のように本実施例によれば、学習率計算補助メモリ
を設けることによって学習率を求める際の演算数を大幅
に削減できる。
第7図は別の本発明の実施例に、おける学習装置の中の
学習率計算部の構成図を示すものである。
第7図において、63は複数の誤差値を計算する多重誤
差値計算部、64は多重誤差値計算部63が計算した複
数の誤差値から最適な学習率が存在する区間を決定する
最小点決定部である。以上のように構成された本発明の
一実施例における学習装置について、以下その動作を説
明する。
初めに考え方を述べよう。第8図は第2図・第3図と同
じく、学習率εと誤差値との関係を示す例である。第2
図のように探索開始点elIから最適学習率εalnま
で誤差が単調減少する場合は第4図で述べたような構成
でもよい。しかし、第8図のように途中に局所最小点が
存在する場合は、前述した逐次探索方式ではこの局所最
小点に捕られれてしまい大局的最小点に行き着かない。
誤差値fを学習率εの関数としてf(ε)とすれば、第
8図の場合、f (e s + h ) <  f (
e Il+ 2 h )であるから探索開始早々(10
式)を満足してしまい、最初の局所最小点を最適な学習
率として探索をやめてしまう。この対処方法としては一
つの学習率に対する誤差値を求めたらすぐ前回計算の誤
差値と比較するのではなく、n個の学習率に対するn個
の誤差値をまず求め、次にこれらn個の誤差値を比較し
て(10式)を填足する位置を探すのである。n個目の
誤差値が最も小さければさらに次のn個を探索するので
ある。
この考え方に基づく本発明の学習率計算部について説明
する。多重誤差値計算部63は初めに複数(n個)の学
習率を用意し、各学習率に対応するn個の誤差値を計算
する。この詳細な構成例を第9図に示す。第9図におい
て、632は(9式)に基づいてn個の学習率εを計算
するε計算部、63m1はε計算器632で得られ・た
n個の学習率ε、〜ε7を記憶保持するεメモリ、63
m2はCメモリの各学習率εに対応する誤差値fを格納
するfメモIJ、611は多重誤差値計算部63全体の
制御を行なう制御部である。このように+16成された
多重誤差値計算部63では、初め(9式)に基づいてn
個の学習率εを計算しεメモリ63m1へ格納する。続
いて制御部631は前向き計算部2および誤差値計算部
3に指令を出し、εメモリ63m1のn個の学習率に対
応する誤差値を計算させ誤差値メモ’J 63 m 2
に格納させる。その後最小点存在区間検出部64へ制御
を渡す。
この最小点存在区間検出部64の構成も同じく第9図に
示しである。第9図において、θ42はfメモ!J 6
3m2の内容を比較する比較器、641は比較器642
を制御する制御部である。このように構成された最小点
存在区間検出部64は以下のように動作する。多重誤差
値計算部63の制御部から制御を渡された最小点存在区
間検出部64の制御部641はfメモリ63m2からf
、メモリとf2メモリの内容を読みだし比較するよう比
較器642を制御する。比較器642は両者の差を求め
制御部641へ送る。これによって制御部641はf+
メモリとf2メモリのいずれが小さいかを知ることがで
きる。この小さい方の値が入っているfメモリ63m2
の内容とf3を読みだし比較器642で比較させる。こ
うして、小さい方の誤差値とf4・f5・f8・・・と
繰り返していけばfメモ’Je3m2の中の最小誤差値
を捜し出すことができる。もし、fnが最小値ならばさ
らに先に最小値があることになるので次のn個の探索を
行なうよう多重誤差値計算部63へ制御を戻す。さてこ
うして見つかった誤差の最小値をfkとしよう。すると
、求めたい最適学習率は第8図、からもわかるようにε
、−1〜εに+1の間に存在すると考えられる。
こうして最小点存在区間検出部64はその求める範囲を
検出したので、最小点決定部62へ制御を渡し最適学習
率εア1.を決定する。
この方法によっても必ず大局的最小点が求められるわけ
ではなく、かつ、1つづつ誤差値の計算と比較を行なう
方法に比べて1回あたりの計算量も多くなる。しかし、
真の最適学習率を得る確率は高くなるので、その結果と
してより早く学習が完了しやすくなる。
以上のように本実施例によれば、多重誤差値計算部と最
小点存在区間検出部を内蔵した学習率計算部を設けるこ
とによって、学習を早く収束させることができる。
なお、実施例では最小点存在区間検出部が毎回誤差値の
fメモリから値を読みだし比較するように比較器を構成
したが、f++f2+fsと順次比較するわけであるか
ら、比較器で1つのレジスタ等を用意し1つ手前の誤差
値を保持しておけばfメモリから読みだす誤差値は1つ
で済む。
第10図は別の本発明の実施例における学習装置の中の
学習率計算部の構成図を示すものである。
第10図において、65は複数の誤差値を並列に計算す
る多重誤差値並列計算部である。以上のように構成され
た本発明の一実施例における学習装置について、以下そ
の動作を説明、する。
第7図の多重誤差値計算部63で説明したように複数の
学習率に対する誤差値を求める本発明の学習装置におい
ては、ここの誤差値の計算は順位性を持たず各々独立に
計算可能である。従って、複数の前向き計算部2と複数
の誤差値計算部を用意すれば並列計算が可能になる。こ
のように複数の誤差値計算を並列に行なうのが多重誤差
値並列計算部65である。こうして得られた複数の誤差
値から最小点存在区間検出部64で最適な学習率が求め
られる。
排他OR問題を解くような神経回路網構成の重み係数を
本発明の学習装置で学習を行なった。2000回実験を
繰り返して学習の終了する時間の期待値を求めたところ
、第1図で述べた別の本発明の学習終了期待時間が1秒
444 m5ecであったのに対し、第10図の構成を
した学習率計算部を持った本発明では451 m5ec
と3倍以上高速になった。
以上のように本実施例によれば、多重誤差値並列計算部
と最小点存在区間検出部を内蔵した学習率計算部を設け
ることによって、学習を早く収束させることができる。
第11図は別の本発明の実施例における学習装置の構成
図を示すものである。第11図において、m8は学習方
向計算部4で求められた共役勾配方向を格納する共役勾
配方向メモリである。以上のように構成された本発明の
一実施例における学習装置について、以下その動作を説
明する。
本発明では学習を行なう方向として最急降下方向ではな
く共役勾配方向を用いている。初めにこの理由と求め方
を説明する。
最急降下方向の問題点は従来の学習装置の課題として述
べたように、局所的には・最適であるが大局的には必ず
しも最適でない点にある。その解決策の1つとして兵役
勾配方向を考える。もし、学習しようとするする重み係
数の多次元空間が2次形式で表わされるならば、その次
元数だけの学習回数で最適な位置に到達することが保証
されている (証明は例えば、  メフソト° フォア
 アンコンストレインド  オフ。
テイニ七゛イション フルロブレムス゛ アメリカン 
エルシヒ゛イア バフ゛リフシュイツク゛  J、Ko
vallk  and  M、R,0sborne+ 
 ”METHODS  FORllNcONsTRAI
NED OPTIMIZATION PROBLEMs
”、 Amerlcan Elsevler Publ
lshlng+ 1911i8.  の3.6節)。2
次形式とは多次元空間上のお椀のような形状である。
学習の対象となる重み空間が2次形式で表わされるかど
うかは時と場合によるが少なくとも、非常に早く収束す
る場合がありえるわけである。
では、どのように共役勾配方向を求めるかを説明する。
 この方法の一つに フレフチャーリーへ゛スFlet
cher−Reevesの方法がある (アアツクショ
ン ミニマイ七°イション ハ゛イコンジユケ′イト 
り゛ラテ°イエント、コンピュータ エイジェント  
R,Fletcher and C,M、Reeves
、  ”Functl、on Mlnlmlzatl。
n by Conjugate Gradlents”
、 Computer Jarnal。
7(1964)、 149)。彼らの方法によれば、i
回目に計算された最急降下方向をgl 1回目に計算す
る共役勾配方向をpとすれば、 T)+=−g+  + βI)1−+       (
17式)で与えられる。(20式)においてβは変換係
数でβ ”  gl /  g+−+      ’ 
  (18式)で与えられる。この方法を神経回路網構
成した重み係数を学習するようにしたものが本発明であ
る。
本発明の構成を第11図に示す。第11図における学習
方向計算部4は最急降下方向を初めに計算し最急降下方
向メモリm7に格納する。その後この最急降下方向を使
って共役勾配方向を計算し共役勾配方向メモリm8に格
納する。以後、この共役勾配方向と学習率メモ’Jm6
の学習率を使って学習を進めていくのである。従って、
本発明の学習装置における特徴は共役勾配方向を計算す
る学習方向計算部4の構成と共役勾配方向メモ’J m
8にある。
この学習方向計算部4の構成を示したのが第12図であ
る。第12図において、42は計算された最急降下方向
から共役勾配方向を求めるための係数を計算する傾斜変
換係数計算部、43は最急降下方向計算部41と傾斜変
換係数計算部の出力および共役勾配方向メモリm8の内
容から次の共役勾配方向を求める共役勾配方向計算部で
ある。
以上のように構成された学習方向計算部4の動作を説明
する。i回目の学習で最急降下方向g1を求めた最急降
下方向計算部41は最急降下方向g1を傾斜変換係数計
算部42および共役勾配方向計算部43へ送る。この時
点では最急降下方向メモリm7には一回前の学習時の最
急降下方向g1−1が格納されているので、この値を読
み込む。そして最急降下方向計算部41からの最急降下
方向g1と最急降下方向メモリm7からの最急降下方向
g+−7との比を求める。即ち、(18式)を計算する
。こうして求まった傾斜変換係数βを共役勾配方向計算
部43へ送る。その後、最急降下方向計算部41から送
られてきた最急降下方向g1を最急降下方向メモリm7
へ格納し、次回の学習のためにメモリ内容を更新してお
く。この時点では共役勾配方向メモ’Jm8には一回前
の学習時の共役勾配方向p−1が格納されている。共役
勾配方向計算部43は共役勾配方向メモ’J m 8か
らこのp+−+を読み込み、最急降下方向計算部41か
ら送られてきた最急降下方向g+と、傾斜変換係数計算
部42から送られてきた傾斜変換係数βとを併せて(1
7式)を計算する。その後、共役勾配方向p1を共役勾
配方向メモ’Jm8へ格納し、次回の学習のためにメモ
リ内容を更新しておく。
以上のように本実施例によれば、傾斜変換係数計算部と
共役勾配方向計算部とを内蔵した学習率計算部と、共役
勾配方向メモリとを設けることによって、毎回共役勾配
方向を求めることができ、学習対象の重み係数の多次元
空間が2次形式で表わされる場合は非常に早く学習を終
了させることができる。
なお、本発明に実施例では学習率の求め方については何
も述べなかったが、学習、率メモリm6に固定値を設定
して固定学習率で学習を進めても良いし、別の発明述べ
た学習率計算部を用いて動的に求めてもよい。動的に求
める場合の例は例えば、第4図のような構成で参照する
学習方向のメモリが異なることになる。このような学習
率計算部の例を第13図に示す。学習率に対する誤差値
を求める際に学習方向として共役勾配・方向メモ’Jm
8を参照するのである。
第14図は別の本発明の実施例における学習装置の構成
図を示すものである。第14図において、7は学習の回
数を記録する学習カウンタである。
以上のように構成された本発明の一実施例における学習
装置について、以下その動作を説明する。
共役勾配方向を利用して学習を行なう前述した別の本発
明では、学習対象の重み係数の多次元空間が2次形式で
表わされる場合非常に学習が早くなることを特長とした
が、もしこのような単純な形状をしていなければ、共役
勾配方向がかえって仇になるかもしれない。そこで、局
所的には最も信頓できる最急降下方向へ数回に1回づつ
軌道修正した方が好ましい場合も考えられる。この考え
に基づくのが第14図に示す本発明の学習装置であり、
学習カウンタ7を用いて共役勾配方向から最急降下方向
へ軌道修正をかけるのである。
この様子を第15図に示した学習方向計算部4と学習カ
ウンタ7を用いて説明しよう。学習終了判定部1は学習
が1回行なわれる毎の学習カウンタ7の値に1を加算す
る。もし、この値が設定値に達したら傾斜変換係数計算
部42へ傾斜変換係数βをOにするよう制御する。傾斜
変換係数計算部42は通常(18式)を計算しているの
であるが、この制御をうけた場合は(18式)を計算せ
ずβ=0として共役勾配方向計算部43へ送る。共役勾
配方向計算部43はβ=0として(17式)を計算する
ことになるので、結果、最急降下方向を出力として共役
勾配方向メモ’Jm8へ格納する。以後、前述の学習が
続けられる。
では本発明の学習装置ではいかなる効果があるのであろ
うか。第1図の構成の別の本発明に於ける動的に学習率
を求める学習率計算部6を第11図の構成でも持つとし
た場合で性能を評価してみた。排他的OR問題を例に2
000回実験を行なった結果、本発明の学習装置におい
て学習カウンタ7が学習すべき重み係数と同じ値に達し
た場合、学習終了判定部1が傾斜変換係数計算部42に
傾斜変換係数β=0とするよう制御をかけた場合の学習
終了の期待時間は、1秒672 m5ecであった。
また、学習カウンタ7が学習すべき重み係数の半分の値
に達したら、学習終了判定部1が傾斜変換係数計算部4
2に傾斜変換係数β=0とするよ°う制御をかけた場合
は、1秒98 m5ecで学習が終了した。この性能は
従来の学習装置に比べ4倍近い高速であり、特に後者は
共役勾配を用いない第1図の構成の別の発明よりも高速
である。
以上のように本実施例によれば、学習カウンタを設ける
ことによって、学習対象が2次形式をしていない複雑な
形状であっても早く学習を終了させることができる。
第16図は別の本発明の一実施吻1における構成図を示
したものである。第16図において、8は学習している
状態が適切であるか不適切であるかを検出する不適切学
習状態検出部である。このように構成された本発明の学
習装置についてその動作を説明する。
ここで考える不適切な学習状態とはなかなか学習が進ま
ない状態をいう。このよ・うな状況に陥るのは重み係数
メモリm5の値の絶対値が大きくなり過ぎてしまうこと
が考えられる。このような状況では(1式)のyが正ま
たは負の方に大きくなり過ぎてしまい、第31図で言う
と右端か左端に寄ってしまった状況になる。学習におけ
る重み修正量は(3式)〜(8式)で示されているが、
特に(8式)で明らかなように、上述のような偏った状
況はs1gmold関数の出力が0または1に近づいて
しまうので結果として(3式)の学習量がほとんどOに
なってしまうこ七になる。こうなればなかなか学習が進
まないので不適切な学習状態に陥ったと判断される。
そこで、不適切学習状態検出部8はこの状態を検出し学
習終了判定部1へ学習を終了するよう制御を行なうので
ある。この判定は、ユニット出力値メモリm3に保持さ
れているユニット20の出力を合計し、その総和が一定
値以下であれば偏りすぎと判断することで行なう。当然
のことながら、この判断は誤差値メモリm1の値が依然
として大きいという条件付きである。
また、別の実施例においては、ユニット出力を監視する
のではなく、学習方向を監視してもよい。
上述のような偏った状況では第31図で微係数を考えれ
ばわかるように学習方向がほとんどOになる。従って、
最急降下方向メモ’J m 7を監視し、学習方向の総
和が一定値以下ならば偏りすぎと判断し、学習終了判定
部1へ学習路・了の制御を行なうのである。
また、最急降下方向メモリm7の代わりに共役勾配方向
メモリm8を監視していてもよい。
以上のように本実施例によれば、不適学習状態検出部を
設けることによって、無駄な学習を防ぐことができ、結
果としては早く学習を終了させることにつながる。
第17図は別の本発明の実施例を示すものである。第1
7図において、9は重み係数調整部である。このように
構成された発明の詳細な説明する。
不適切学習状態検出部8が不適切な学習状態に陥ってい
ると判断をした時、すぐ学習終了判定部1に学習を終了
させるのではなく、重み係数調整部9が重み係数の値を
変更して適切な学習状態に変更し、学習を継続すると言
う点が本発明の特長である。
この重み係数調整部9の一構成例を示したのが第18図
である。第18図において、91は乱数発生部である。
このような構成をした重み係数調整部9について以下そ
の動作を説明する。不適学習状態検出部8が不適当な学
習状態に陥ったことを検出すると、乱数発生部91にそ
の旨知らせる。
不適学習状態検出部8からの制御を受けた乱数発生部9
1は乱数を発生して重み係数メモ’J m 4の値をす
べて初期化する。乱数での初期化が終わるとその旨学習
終了部1へ指示を出、す。学習終了部1はこの結果を受
けて学習課程の管理」1初期化すべきものがあれば初期
化する。
以上のように本実施例によれば、乱数発生部を内蔵した
重み係数調整部を設けることによって不適当な学習状態
に陥っても、自動的に学習を再開させることができ、人
手を介さずに早く学習を終了させることができる。
なお、学習終了判定部が学習再開時に学習課程の管理上
初期化すべきものがなければ乱数発生部から学習終了判
定部への制御は必要ない。
第19図は重み係数調整部9の第2の構成例をボしたも
のである。第19図において、92は全重み係数圧縮部
である。このような構成をした重み係数調整部9につい
て以下その動作を説明する。
不適学習状態検出部8が不適当な学習状態に陥ったこと
を検出すると、全重み係数圧縮部92にその旨知らせる
。不適学習状態検出部8からの制御を受けた全重み係数
圧縮部92は重み係数メモリm4の値にすべて1より小
さい値を掛は合わせることで重み係数をすべて初期化す
る。この初期化が終わるとその旨学習終了部1へ指示を
出す。学習終了部1はこの結果を受けて学習課程の管理
上初期化すべきものがあれば初期化する。重み係数を一
定の割合ですべて圧縮するのはそれまでの学習が進んで
きた重み係数の多次元空間の方向を考慮し、象限は変え
ずに学習を再開させようとするものである。
以」二のように本実施例によれば、全重み係数圧縮部を
内蔵した重み係数調整部を設けることによって不適当な
学習状態に陥っても、それまでの学習の情報を多少残し
ながら自動的に学習を再開させることができ、人手を介
さずに早く学習を終了させることができる。
なお、学習終了判定部が学習再開時に学習課程の管理上
初期化すべきものがなければ乱数発生部から学習終了判
定部への制御は必要ない。
第20図は重み係数調整部9の第3のIf4成例を示し
たものである。第20図において、93は異常値用カニ
ニット検出部、94は重み係数圧縮部である。このよう
な構成をした重み係数調整部9について以下その動作を
説明する。不適学習状態検出部8が不適当な学習状態に
陥ったことを検出すると、μ常値出力ユニット検出部9
3にその旨知らせる。不適学習状態検出部8からの制御
を受けた異常値出力ユニット検出部93はユニット出力
値メモ’Jm3を検索して最も異常な値を出力している
ユニットを検出する。具体的にはs1gmold関数の
上限・下限値に最も近い値を出力しているユニットを探
す。こうして見つかった、異常値を出力しているユニッ
トの情報を重み係数圧縮部94に渡す。重み係数圧縮部
94はそのユニットと下層のユニットを結ぶ重み係数メ
モリm4に対してのみ、1より小さい値を掛は合わせる
ことで重み係数を初期化する。この初期化が終わるとそ
の旨学習終了部1へ指示を出す。学習終了部1はこの結
果を受けて学習課程の管理上初期化すべきものがあれば
初期化する。異常値を出力したユニットに関わる重み係
数にのみ一定の割合で圧縮するのはそれまでの学習が進
んできた重み係数の多次元空間の方向を考慮し、不適当
な学習状態に陥らせた重み係数のみ初期化する事で他の
重み係数はそれまでの学習結果を引き継がせながら学習
を再開させようとするものである。
以上のように本実施例によれば、異常値用カニニット検
出部と重み係数圧縮部を内蔵した重み係数調整部を設け
ることによって不°適当な学習状態に陥っても、それま
での学習の情報を多少残しながら自動的に学習を再開さ
せることができ、人手を介さずに早く学習を終了させる
ことができる。
なお、学習終了判定部が学習再開時に学習課程の管理上
初期化すべきものがなければ乱数発生部から学習終了判
定部への制御は必要ない。
また、本実施例においてはユニット20がs1gmol
d関数を使っていることを前提に説明したが、任意の閾
値関数であっても構わない。
第21図は重み係数調整部9の第4の構成例を示したも
のである。第21図において、95は異常入力検出部、
96は重み係数圧縮部である。このような構成をした重
み係数調整部9について以下その動作を説明する。不適
学習状態検出部8が不適当な学習状態に陥ったことを検
出すると、異常値用カニニット検出部93にその旨知ら
せる。
不適学習状態検出部8からの制御を受けた異常値用カニ
ニット検出部93はユニット出力値メモリm3を検索し
て最も異常な値を出力しているユニットを検出する。具
体的にはs1gmold関数の上限・下限値に最も近い
値を出力しているユニットを探す。こうして見つかった
、異常値を出力しているユニットの情報を異常入力検出
部95へ渡す。異常入力検出部95はそのユニットに入
力される値について最も絶対値が大きい入力を比較する
。こうして見つかった入力に掛は合わ゛される重み係数
メモU m 4の情報を重み係数圧縮部96に渡す。
重み係数圧縮部96はその重み係数1つだけに1より小
さい値を掛は合わせることで重み係数を初期化する。こ
の初期化が終わるとその旨学習終了部1へ指示を出す。
学習終了部1はこの結果を受けて学習課程の管理上初期
化すべきものがあれば初期化する。異常値を出力したユ
ニットの更に最も影響の大きい1つの重み係数にのみ一
定の割合で圧縮するのはそれまでの学習が進んできた重
み係数の多次元空間の方向を考慮し、不適当な学習状態
に陥らせた重み係数のみ初期化する事で他の重み係数は
それまでの学習結果を引き継がせながら学習を再開させ
ようとするものである。
以上のように本実施例によれば、異常値用カニニット検
出部と重み係数圧縮部を内蔵した重み係数調整部を設け
ることによって不適当な学習状態に陥っても、それまで
の学習の情報を多少残しながら自動的に学習を再開させ
ることができ、人手を介さすに早く学習を終了させるこ
とができる。
なお、学習終了判定部が学習再開時に学習課程の管理上
初期化すべきものがなければ乱数発生部から学習終了判
定部への制御は必要ない。
また、本実施例においてはユニット20がs1gmol
d関数を使っていることを前提に説明したが、任意の閾
値関数であっても構わない。
発明の詳細 な説明したように、本発明によれば、学習率計算部、あ
るい共役勾配方向を求める学習方向計算部、あるいは不
適学習状態検出部を設けることによって、学習を高速に
終了させることができ、その実用的価値には大なるもの
がある。
【図面の簡単な説明】
第1図は本発明における一実施°例の学習装置の構成図
、第2図および第3図は本発明の基本となる動作説明図
、第4図は学習率計算部の構成図、第5図は学習率存在
区間検出部と最小点決定部の構成図、第6図は本発明に
おける他の実施例の学習装置の構成図、第7図は学習率
計算部の他の構成図、第8図は本発明の第2の実施例の
基本となる動作説明図、第9図は多重誤差値計算部と最
小点決定部の構成図、第10図は学習率計算部の他の構
成図、第11図は本発明における他の実施例の学習装置
の構成図、第12図は学習方向計算部の構成図、第13
図は学習率の他の構成図、第14図は本発明における他
の実施例の学習装置の構成図、第15図は学習方向計算
部の他の構成図、第16図は本発明における他の実施例
の学習装置の構成図、第17図は本発明における他の実
施例の学習装置の構成図、第18図は重み係数調整部の
一構成因、第19図から第21図までは重み係数調整部
の他の構成図、第22図は従来の学習装置の構成図、第
23図は従来の学習方向計算部の構成図、第24図は最
急降下方向計算部の構成図、第25図は重み修正量計算
部の構成図、第28図は学習終了判定部の構成図、第2
7図および第28図は前向き方向計算部の構成図、第2
9図は前向き方向計算部を構成するユニットの構成図、
第30図はユニットの他の構成図、第31図は閾値処理
部の入出力特性図である。 1・・・学習終了判定部、1m1・・・終了基準値メモ
リ、 12・・・制御部、1a1・・・減算器、2・・
・前向き方向計算部、20・・・ユニット、21・・・
入力ユニ・ソト、201・・・入力部、203・・・乗
算器、204・・・加算器、200・・・線形信号処理
部、300・・・閾値処理部、3・・・誤差値計算部、
4・・・学習方向計算部、41・・・最急降下方向計算
部、411・・・閾値関数微分値計算部、412・・・
誤差微分値計算部、42・・・傾斜変換係数計算部、4
3・・・共役勾配方向計算部、5・・・重み修正量計算
部、5a1・・・加算器、5a2・・・乗算器、6・・
・学習率計算部、61・・・最小点存在区間検出部、6
11・・・制御部、612・・・ε4計算部、61 ・
・・メモリコピー 614・・・比較D、61 ml・
・・αメモリ、61m2・・・hメモリ、 61m3α
hメモリ、61m4・・・εメモリ、615m・・・f
メモリ、62・・・最小点決定部、621・・・制御部
、622・・・ε3計算部、623・・・最小点計算部
、62m1 ・・・E 3メモIハ 62 m 2 ・
・・f 3メモリ、62m3・・・ε、。メモリ、63
・・・多重誤差値計算部、631・・・制御部、632
・・・ε計算部、63m1・・・εメモ’J、83m2
・・・fメモリ、64・・・最小点存在区間検出部、6
41・・・制御部、642・・・比較器、65・・・多
重誤差値並列計算部、7・・・学習カウンタ、8・・・
不適学習状態計算部、9・・・重み係数調整部、91・
・・乱数発生部、92・・・全重み係数圧縮部、93・
・・異常値比カニニット検出部、9.4・・・重み係数
圧縮部、95・・・異常入力検出部、96・・・重み係
数圧縮部、ml・・・入力データメモリ、m2・・・教
師データメモリ、 m3・・・ユニット出力値メモリ、
m4・・・重み係数メモリ、m5・・・重み修正量メモ
リ、mθ・・・学習率メモリ、ml・・・最急降下方向
メモIJ、m8・・・共役勾配方向メモリ、 m9・・
・学習率計算補助メモリ、m10 ・・・ 誤差値メモ
リ。 代理人の氏名 弁理士 粟野重孝 はか1名第 図 第 図 図 零 図 第 図 第 図 菱外瘍モ ホ 第 図 弔 図 第10面 第12図 第13図 第14図 第16図 第15図 第17図 第18図 第20図 第19図 第21図 第22図 第24図 第23図 第25 図 第26 第29 図 第30図 図 第27図 第 図 出方値

Claims (14)

    【特許請求の範囲】
  1. (1)設定された条件まで学習が進んだかどうかを判定
    する学習終了判定部と、入力データを保持する入力デー
    タメモリと、学習目的値である正しい値を保持しておく
    教師データメモリと、神経回路網構成をした前向き方向
    計算部と、前記前向き計算部の計算結果を保持しておく
    ユニット出力値メモリと、前記前向き方向計算部で用い
    る重み係数を保持しておく重み係数メモリと、前記前向
    き方向計算部の出力値と前記教師データメモリとの差異
    を計算する誤差値計算部と、前記誤差値計算部の出力を
    保持しておく誤差値メモリと、前記誤差値計算部の計算
    値に基づいて学習方向を求める学習方向計算部と、前記
    学習方向計算部の出力値を保持しておく最急降下方向メ
    モリと、前記学習方向計算部で得られた学習方向にどれ
    だけ学習を進めるかを示す学習率を保持しておく学習率
    メモリと、前記学習方向計算部の計算方向に前記学習率
    メモリの学習率に従って学習を行い前記重み係数メモリ
    の値をどれだけ修正すべきを計算する重み修正量計算部
    と、前記重み修正量計算部の計算結果を保持する重み修
    正量メモリ、動的に学習率を計算する学習率計算部を具
    備し、前記学習方向計算部は学習方向として最急降下方
    向を求める最急降下方向計算部を内蔵し、前記学習率計
    算部は最適な学習率の存在範囲を求める最小点存在区間
    検出部と、前記最小点存在区間検出部で求められた区間
    中の最小点を決定する最小点決定部とを持つことを特徴
    とする学習装置。
  2. (2)設定された条件まで学習が進んだかどうかを判定
    する学習終了判定部と、入力データを保持する入力デー
    タメモリと、学習目的値である正しい値を保持しておく
    教師データメモリと、神経回路網構成をした前向き方向
    計算部と、前記前向き計算部の計算結果を保持しておく
    ユニット出力値メモリと、前記前向き方向計算部で用い
    る重み係数を保持しておく重み係数メモリと、前記前向
    き方向計算部の出力値と前記教師データメモリとの差異
    を計算する誤差値計算部と、前記誤差値計算部の出力を
    保持しておく誤差値メモリと、前記誤差値計算部の計算
    値に基づいて学習方向を求める学習方向計算部と、前記
    学習方向計算部の出力値を保持しておく最急降下方向メ
    モリと、前記学習方向計算部で得られた学習方向にどれ
    だけ学習を進めるかを示す学習率を保持しておく学習率
    メモリと、前記学習方向計算部の計算方向に前記学習率
    メモリの学習率に従って学習を行い前記重み係数メモリ
    の値をどれだけ修正すべきを計算する重み修正量計算部
    と、前記重み修正量計算部の計算結果を保持する重み修
    正量メモリと、動的に学習率を計算する学習率計算部と
    、学習率計算補助メモリとを具備し、前記学習方向計算
    部は学習方向として最急降下方向を求める最急降下方向
    計算部を内蔵することを特徴とする学習装置。
  3. (3)設定された条件まで学習が進んだかどうかを判定
    する学習終了判定部と、入力データを保持する入力デー
    タメモリと、学習目的値である正しい値を保持しておく
    教師データメモリと、神経回路網構成をした前向き方向
    計算部と、前記前向き計算部の計算結果を保持しておく
    ユニット出力値メモリと、前記前向き方向計算部で用い
    る重み係数を保持しておく重み係数メモリと、前記前向
    き方向計算部の出力値と前記教師データメモリとの差異
    を計算する誤差値計算部と、前記誤差値計算部の出力を
    保持しておく誤差値メモリと、前記誤差値計算部の計算
    値に基づいて学習方向を求める学習方向計算部と、前記
    学習方向計算部の出力値を保持しておく最急降下方向メ
    モリと、前記学習方向計算部で得られた学習方向にどれ
    だけ学習を進めるかを示す学習率を保持しておく学習率
    メモリと、前記学習方向計算部の計算方向に前記学習率
    メモリの学習率に従って学習を行い前記重み係数メモリ
    の値をどれだけ修正すべきを計算する重み修正量計算部
    と、前記重み修正量計算部の計算結果を保持する重み修
    正量メモリと、動的に学習率を計算する学習率計算部を
    具備し、前記学習方向計算部は学習方向として最急降下
    方向を求める最急降下方向計算部を内蔵し、前記学習率
    計算部は、複数の誤差値を計算する多重誤差値計算部と
    、前記多重誤差値計算部の出力値から最適な学習率の存
    在範囲を求める最小点存在区間検出部と、前記最小点存
    在区間検出部で求められた区間中の最小点を決定する最
    小点決定部とを内蔵することを特徴とする学習装置。
  4. (4)設定された条件まで学習が進んだかどうかを判定
    する学習終了判定部と、入力データを保持する入力デー
    タメモリと、学習目的値である正しい値を保持しておく
    教師データメモリと、神経回路網構成をした前向き方向
    計算部と、前記前向き計算部の計算結果を保持しておく
    ユニット出力値メモリと、前記前向き方向計算部で用い
    る重み係数を保持しておく重み係数メモリと、前記前向
    き方向計算部の出力値と前記教師データメモリとの差異
    を計算する誤差値計算部と、前記誤差値計算部の出力を
    保持しておく誤差値メモリと、前記誤差値計算部の計算
    値に基づいて学習方向を求める学習方向計算部と、前記
    学習方向計算部の出力値を保持しておく最急降下方向メ
    モリと、前記学習方向計算部で得られた学習方向にどれ
    だけ学習を進めるかを示す学習率を保持しておく学習率
    メモリと、前記学習方向計算部の計算方向に前記学習率
    メモリの学習率に従って学習を行い前記重み係数メモリ
    の値をどれだけ修正すべきを計算する重み修正量計算部
    と、前記重み修正量計算部の計算結果を保持する重み修
    正量メモリと、動的に学習率を計算する学習率計算部を
    具備し、前記学習方向計算部は学習方向として最急降下
    方向を求める最急降下方向計算部を内蔵し、前記学習率
    計算部は、複数の誤差値を並列に計算する多重誤差値並
    列計算部と、前記多重誤差値計算部の出力値から最適な
    学習率の存在範囲を求める最小点存在区間検出部と、前
    記最小点存在区間検出部で求められた区間中の最小点を
    決定する最小点決定部とを内蔵することを特徴とする学
    習装置。
  5. (5)動的に学習率を計算する学習率計算部と、学習率
    計算補助メモリとを備え、前記学習方向計算部は学習方
    向として最急降下方向を求める最急降下方向計算部を内
    蔵することを特徴とする請求項1、2または4記載の学
    習装置。
  6. (6)設定された条件まで学習が進んだかどうかを判定
    する学習終了判定部と、入力データを保持する入力デー
    タメモリと、学習目的値である正しい値を保持しておく
    教師データメモリと、神経回路網構成をした前向き方向
    計算部と、前記前向き計算部の計算結果を保持しておく
    ユニット出力値メモリと、前記前向き方向計算部で用い
    る重み係数を保持しておく重み係数メモリと、前記前向
    き方向計算部の出力値と前記教師データメモリとの差異
    を計算する誤差値計算部と、前記誤差値計算部の出力を
    保持しておく誤差値メモリと、前記誤差値計算部の計算
    値に基づいて学習方向を求める学習方向計算部と、前記
    学習方向計算部の出力値を保持しておく最急降下方向メ
    モリと、前記学習方向計算部で得られた学習方向にどれ
    だけ学習を進めるかを示す学習率を保持しておく学習率
    メモリと、前記学習方向計算部の計算方向に前記学習率
    メモリの学習率に従って学習を行い前記重み係数メモリ
    の値をどれだけ修正すべきを計算する重み修正量計算部
    と、前記重み修正量計算部の計算結果を保持する重み修
    正量メモリと、学習方向を保持しておく共役勾配方向メ
    モリを具備し、前記学習方向計算部は最急降下方向を求
    める最急降下方向計算部と、前記最急降下方向に基づい
    て最急降下方向を共役勾配方向へ変換する変換係数を求
    める傾斜変換係数変換部と、前記最急降下方向計算部の
    最急降下方向と前記傾斜変換係数変換部の変換係数から
    共役勾配方向を求める共役勾配方向計算部とを内蔵する
    ことを特徴とする学習装置。
  7. (7)学習方向を保持しておく共役勾配方向メモリと、
    学習回数を記録する学習カウンタとを備え、前記学習方
    向計算部は最急降下方向を求める最急降下方向計算部と
    、前記最急降下方向に基づいて最急降下方向を共役勾配
    方向へ変換する変換係数を求める傾斜変換係数変換部と
    、前記最急降下方向計算部の最急降下方向と前記傾斜変
    換係数変換部の変換係数から共役勾配方向を求める共役
    勾配方向計算部とを内蔵し、また、前記学習終了判定部
    は前記学習カウンタが一定値に達すると前記傾斜変換係
    数変換部に傾斜変換係数を0にリセットするよう制御を
    行なうことを特徴とする請求項6記載の学習装置。
  8. (8)動的に学習率を決定する学習率計算部を備えたこ
    とを特徴とする請求項6または7記載の学習装置。
  9. (9)設定された条件まで学習が進んだかどうかを判定
    する学習終了判定部と、入力データを保持する入力デー
    タメモリと、学習目的値である正しい値を保持しておく
    教師データメモリと、神経回路網構成をした前向き方向
    計算部と、前記前向き計算部の計算結果を保持しておく
    ユニット出力値メモリと、前記前向き方向計算部で用い
    る重み係数を保持しておく重み係数メモリと、前記前向
    き方向計算部の出力値と前記教師データメモリとの差異
    を計算する誤差値計算部と、前記誤差値計算部の出力を
    保持しておく誤差値メモリと、前記誤差値計算部の計算
    値に基づいて学習方向を求める学習方向計算部と、前記
    学習方向計算部の出力値を保持しておく最急降下方向メ
    モリと、前記学習方向計算部で得られた学習方向にどれ
    だけ学習を進めるかを示す学習率を保持しておく学習率
    メモリと、前記学習方向計算部の計算方向に前記学習率
    メモリの学習率に従って学習を行い前記重み係数メモリ
    の値をどれだけ修正すべきを計算する重み修正量計算部
    と、前記重み修正量計算部の計算結果を保持する重み修
    正量メモリと、これ以上学習を続けても学習効率が悪い
    状態すなわち、ユニット出力値が予め定めた上下限値に
    近いことを検出する不適学習状態検出部を具備し、前記
    不適学習状態検出部の出力により、前記学習終了判定部
    を制御することを特徴とする学習装置。
  10. (10)設定された条件まで学習が進んだかどうかを判
    定する学習終了判定部と、入力データを保持する入力デ
    ータメモリと、学習目的値である正しい値を保持してお
    く教師データメモリと、神経回路網構成をした前向き方
    向計算部と、前記前向き計算部の計算結果を保持してお
    くユニット出力値メモリと、前記前向き方向計算部で用
    いる重み係数を保持しておく重み係数メモリと、前記前
    向き方向計算部の出力値と前記教師データメモリとの差
    異を計算する誤差値計算部と、前記誤差値計算部の出力
    を保持しておく誤差値メモリと、前記誤差値計算部の計
    算値に基づいて学習方向を求める学習方向計算部と、前
    記学習方向計算部の出力値を保持しておく最急降下方向
    メモリと、前記学習方向計算部で得られた学習方向にど
    れだけ学習を進めるかを示す学習率を保持しておく学習
    率メモリと、前記学習方向計算部の計算方向に前記学習
    率メモリの学習率に従って学習を行い前記重み係数メモ
    リの値をどれだけ修正すべきを計算する重み修正量計算
    部と、前記重み修正量計算部の計算結果を保持する重み
    修正量メモリと、これ以上学習を続けても学習効率が悪
    い状態であることを検出する不適学習状態検出部と、前
    記不適学習状態検出部が不適な学習状態にあることを検
    出した場合前記重み係数メモリの値を更新する重み係数
    調整部を具備することを特徴とする学習装置。
  11. (11)重み調整部が乱数発生部を内蔵し前記重み係数
    メモリの重み係数値をすべて更新することを特徴とする
    請求項11記載の学習装置。
  12. (12)重み調整部が前記重み係数メモリの重み係数値
    すべてに一定の値を乗ずる全重み係数圧縮部を備えたこ
    とを特徴とする請求項11記載の学習装置。
  13. (13)重み調整部が、不適学習状態検出部が不適な学
    習状態を検出した時の不適な学習状態に最も寄与したユ
    ニット出力値を前記ユニット出力値メモリから探してく
    る異常値出力ユニット検出部と、前記異常値出力ユニッ
    ト検出部が検出したしたユニットに寄与している前記重
    み係数メモリ内の重み係数値に一定の値を乗ずる全重み
    係数圧縮部を備えたことを特徴とする請求項11記載の
    学習装置。
  14. (14)重み調整部が、不適学習状態検出部が不適な学
    習状態を検出した時の不適な学習状態に最も寄与したユ
    ニット出力値を前記ユニット出力値メモリから探してく
    る異常値出力ユニット検出部と、前記異常値出力ユニッ
    ト検出部が検出したしたユニット入力している値のうち
    最も異常値に寄与している前記重み係数メモリ内の重み
    係数値にのみ一定の値を乗ずる全重み係数圧縮部を備え
    たことを特徴とする請求項11記載の学習装置。
JP1047610A 1989-02-23 1989-02-28 学習装置 Expired - Lifetime JPH0736185B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP1047610A JPH0736185B2 (ja) 1989-02-28 1989-02-28 学習装置
EP93202797A EP0579341A2 (en) 1989-02-23 1990-02-20 Learning machine with multi-input single output circuits connected in hierarchical structure
US07/481,330 US5168550A (en) 1989-02-23 1990-02-20 Neutral network with plural weight calculation methods and variation of plural learning parameters
DE69027874T DE69027874T2 (de) 1989-02-23 1990-02-20 Lernmaschine mit Mehreingangs- Einausgangsschaltungen, die in einer hierarchischen Struktur verbunden sind
EP90301825A EP0385637B1 (en) 1989-02-23 1990-02-20 Learning machine with multi-input single output circuits connected in hierarchical structure
KR1019900002309A KR920006792B1 (ko) 1989-02-23 1990-02-23 다입력-출력회로를 계층형상으로 접속한 학습기계

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1047610A JPH0736185B2 (ja) 1989-02-28 1989-02-28 学習装置

Publications (2)

Publication Number Publication Date
JPH02226461A true JPH02226461A (ja) 1990-09-10
JPH0736185B2 JPH0736185B2 (ja) 1995-04-19

Family

ID=12780000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1047610A Expired - Lifetime JPH0736185B2 (ja) 1989-02-23 1989-02-28 学習装置

Country Status (1)

Country Link
JP (1) JPH0736185B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5390284A (en) * 1991-06-27 1995-02-14 Hitachi, Ltd. Learning method and apparatus for neural networks and simulator with neural network

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BIOL CYBERN 59=1988 *
BIOL.CYBERN=1988 *
IEEE INTERNATIONAL CONFERENCE ON NEURAL NETWORK=1988 *
IEEE INTERNATIONAL CONFERENCE ON NEURAL NETWORKS=1988 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5390284A (en) * 1991-06-27 1995-02-14 Hitachi, Ltd. Learning method and apparatus for neural networks and simulator with neural network

Also Published As

Publication number Publication date
JPH0736185B2 (ja) 1995-04-19

Similar Documents

Publication Publication Date Title
CN110647042A (zh) 一种基于数据驱动的机器人鲁棒学习预测控制方法
CN112116138A (zh) 基于数据驱动的电力系统预测状态估计方法及系统
US9330358B1 (en) Case-based reasoning system using normalized weight vectors
US20210286650A1 (en) Dynamic allocation and re-allocation of learning model computing resources
CN118760100B (zh) 一种大规模模糊柔性作业车间调度方法及相关设备
US11380301B2 (en) Learning apparatus, speech recognition rank estimating apparatus, methods thereof, and program
WO2019006541A1 (en) SYSTEM AND METHOD FOR AUTOMATIC CONSTRUCTION OF LEARNING MACHINES USING LEARNING MACHINES
EP3982304A1 (en) Method for mitigating error of quantum circuit and apparatus thereof
CN107608214B (zh) 三自由度直升机显式模型预测控制中的多级网格点定位方法
CN107644253A (zh) 一种基于反函数的神经网络优化方法、系统及电子设备
JPH02226461A (ja) 学習装置
JP2634994B2 (ja) ファジィ論理電子制御器及びそのメモリ動作方法
CN114995106A (zh) 基于改进小波神经网络的pid自整定方法、装置和设备
Harde et al. Design and implementation of ACO feature selection algorithm for data stream mining
JP7399568B2 (ja) 推論装置
WO2022137520A1 (ja) 学習装置、学習方法および学習プログラム
CN118983462A (zh) 质子交换膜燃料电池热管理系统的控制方法、设备及介质
WO2020142251A1 (en) Prediction for time series data using a space partitioning data structure
JPH05128284A (ja) ニユーロプロセツサ
CN115202591A (zh) 一种分布式数据库系统的存储装置、方法及存储介质
CN114372237B (zh) 一种分布式状态估计方法
CN112990256A (zh) 多传感器噪声计算方法及信息融合方法、存储介质及设备
CN117991637B (zh) 考虑扰动的非重复时变系统的迭代学习控制方法及系统
CN118916244B (zh) 一种用于数据湖的动态异常检测方法及系统
CN113723395A (zh) 用于图像的对象检测的样本加权学习系统及其方法