JPH02226461A

JPH02226461A - 学習装置

Info

Publication number: JPH02226461A
Application number: JP1047610A
Authority: JP
Inventors: Hideyuki Takagi; 英行高木; 〆木　泰治; Taiji Shimeki; Shigeo Sakagami; 茂生阪上; Toshiyuki Koda; 敏行香田; Hayato Togawa; 戸川　隼人
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1989-02-28
Filing date: 1989-02-28
Publication date: 1990-09-10
Anticipated expiration: 2010-04-19
Also published as: JPH0736185B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は制御・パターン認識等に用いる神経回路網の学
習装置に関するものである。

従来の技術従来の学習装置は、　例えば、　ハ゛フクブロハ゛ケ゛
イションラーニツク°　リブしｔ゛ンテイシヨンス゛ハ
゛イ　バフクフ゛ロバケ゛イティツク゛エラース゛　Ｂ
ａｃｋｐｒｏｐａｇａｔｌｏｎ　　　（Ｄ、　　Ｅ、　
　Ｒｕｍｅｉｈａｒｔ、　　Ｇ。

Ｅ、Ｈｌｎｔｏｎ　ａｎｄ　Ｒ，Ｊ、　Ｗｌｌｌｌａｍ
ｓ　　Ｌｅａｒｎｉｎｇ　Ｒｅｐｒｅｓｅｎｔａｔｌｏ
ｎｓ　　ｂｙ　　Ｂａｃｋ−Ｐｒｏｐａｇａｔｌｎｇ　
　Ｅｒｒｏｒｓ、’　　Ｎａｔｕｒｅ、　ｖｏｌ、３２
３．　ｐｐ、５３３−５３８．　Ｏｃｔ、　９．１９Ｅ
Ｈ）の学習アルゴリズムに基づいていた。以下にこの従
来の学習装置について説明する。

第２２図は従来の学習装置の構成図である。第２２図に
おいて、１は設定された条件まで学習が進んだかどうか
を判定する学習終了判定部、ｍｌは入力データを保持す
る入力データメモリ、ｍ２は学習目的値である正しい値
を保持しておく教師データメモリ、２は神経回路網構成
をした前向き方向計算部、ｍ３は前向き計算部２の計算
結果を保持しておくユニット出力値メモＩハ　ｍ４は前
向き方向計算部２で用いる重み係数を保持しておく重み
係数メモｉハ　３は前向き方向計算部２の出力値と教師
データメモ’Ｊｍ２との差異を計算する誤差値計算部、
ｍｌｏは誤差値計算部３の出力を保持しておく誤差値メ
モリ、４は誤差値計算部３の計算値に基づいて学習方向
を求める学習方向計算部Ｎ　　ｍ７は学習方向計算部４
の出力値を保持しておく最急降下方向メモＩへ　ｍ６は
学習方向計算部４で得られた学習方向にどれだけ学習を
進めるかを示す学習率を保持しておく学習率メモ八　５
は学習方向計算部４の計算方向に学習率メモ’Ｊｍ６の
学習率に従って学習を行い重み係数メモリｍ４の値をど
れだけ修正すべきを計算する重み修正量計算部、ｍ５は
重み修正量計算部５の計算結果を保持する重み修正量メ
モリである。

この従来の学習装置の動作を説明するために、まず第１
にこの学習装置の基幹部である前向き方向計算部２の動
作説明を行なっておく。前向き方向計算部２の一般構成
を第２７図・に示す。また、その具体的構成例として、
中間層が１層で、入力層から出力層までのユニット数が
各々４個４個３個の場合を第２８図に示す。第２７図及
び第２８図において、２１は入力データメモリｍ１が割
り当てられる入カニニット、２０は神経細胞の工学的モ
デルである多大カー出力のユニットである。

前向き方向計算部２では各層内相互に結合がなくかつ上
段の層にのみ信号が伝播される。このような前向き方向
計算部２を構成するユニット２０のうち、線形演算のみ
を基本とする線形ユニ・ソトの構成を具体的に示したも
のが第２９図である。第２９図において、２０１はユニ
ッ）２０の入力部、２０３は重み係数メモリｍ４の重み
係数と入力部２０１からの入力を各々掛は合わせる乗算
器、２０４は乗算器２０３各々の出力を足し合わせる加
算器である。つまり、第２９図に示す多入力−出力のユ
ニット２０は入力部２０１への入力値をＸ、重み係数メ
モリｍ４に格納されている重み係数をＷｌとすれば、ｙ　：ΣＷＩＸ＋　　　　　　　　　　（１式）を計算
しているわけである。また、第３０図は、前向き方向計
算部２を構成するユニット２０のうち、非線形演算も行
う非線形ユニットの構成を具体的に示したものである。

第３０図において、２００は第２９図で説明した線形ユ
ニット、３００は線形ユニットの出力を一定範囲、の値
に制限する閾値処理部である。閾値処理部３００の入出
力特性例を第３１図に示す。例えば、出力を（０，１）
の範囲に制限する閾値処理部３００の入出力特性は０　＝　ｆ（１）＝　１　／　（１＋　ｅｘｐ（−１）
）　　　　　　　（２式）と数式的に表現できる。ここ
で、■とＯは閾値処理部３００の入力と出力である。

（２式）の関数ｆＯをｓ１ｇｍｏｌｄ関数と呼ぶ。この
ように、前向き計算部２は入力データメモ’Ｊ　ｍ　１
が保持しているデータを入力し、重み係数メモリｍ４．
！：の積和演算を内部で行いながら神経回路網構成のネ
ットワークの出力を計算するのである。ユニット２０の
出力はユニット出力値メモリｍ３に格納される。

これに対し、学習は前向き方向計算部２の出力結果に応
じて出力層側から入力層側へ逆向き方向に計算される。

これがｂａｃｋｐｒｏｐａｇａｔｌｏｎアルゴリズムの
特徴である。以下、このアルゴリズムに基づいて従来の
学習装置の動作説明を続けよう。

初めに記号の定義を行なう。ユニット出力値メモ’Ｊ　
ｍ　３に格納されたデータの内、第に層の第１番目のユ
ニット出力をｏｋｌとし、教師データメモリｍ２に格納
された出力層第ｉユニットのための教師データを’Ｉ＋
する。重み係数メモ’Ｊｍ４に格納されたデータの内、
第に一１層第ｉ番目のユニットと第に層第ｊ番目のユニ
ットを結ぶ重み係数をＷ　’　−’　＋　’　Ｈとする
。重み修正量メモリｍ５に格納されたデータの内、重み
係数をｗｋす＋　ｋ　ｒを修正する量をΔＷ””＋１と
する。ユニット出力値メモリｍ３の内出力層ユニットの
出力値と教師データメモリｍ２との差の自乗和をＥとす
る。学習率メモリｍ６に格納されていて、学習によって
重みを修正する際の学習率をε、重み係数ｗ’づ＋　ｋ
　Ｊに対する学習方向をｇ　ｋ−１＋　ｋ　＋　＋とす
る。すると、学習によって修正する毒は ΔＷｋ−１，に、　＝　　−εｇｋ□１１ｋｊ（３式）
で表わされる。学習方向ｇは学習方向計算部４で計算さ
れ最急降下方向メモリｍ６に格納される。

学習率計算部６は単に学習率メモ’Ｊｍ６を読み出すの
みであり、学習の間中間、じ値の学習率εが使われる。

この（３式）を実行するのが重み修正量計算部５で、こ
こで計算された重み修正量ΔＷは重み修正量メモ’Ｊｍ
５に格納される。最後に、重み係数メモリ４が重み修正
量メモ’Ｊ　ｍ　５の修正量たけ修正されて学習の１サ
イクルが終わるのである。従って、学習方向ｇの求め方
さえ確定できればこの従来の学習装置は動作する。ｂａ
ｃｋｐｒｏｐａｇａｔｔｏｎアルゴリズムではこの学習
方向を以下のようにして定式化していた。

ｇ”ＩＪ　＝　　ａ　Ｅ　　／　　ａｗ’−’１に、　
　　（４式）即ち、最急降下法に基づいて逐次学習を行
なうのである。この右辺を更に展開すると最終的には次
のように表わされる。

ｇｋ−１，に、　　＝　　ｄｋ、（、に−１，（５式）
ｄｋ」　　＝　　（ＯｋＪ−ｙ））ｆ’　（１’＋）　
　　　　　　　　　　　（Ｅｉ　式）ｄｋＪ＝　　（Σ
ｗｋＪ’−’＋＋ｄ’ｎ）ｆ’（ＩＪ）　　げ式）（６
式）はｋが出力層の場合、（７式）はに層が中間層の場
合の式である。ｆ”　（１）はＩによる１１！！微分で
、（２式）のようにｓ１ｇｍｏｌｄ関数で表わされる場
合は、ｆ’（ｌｋ＋）　＝　ｆ（１’＋）　（１−ｆ（
１’＋））＝　　ｏＪ（１−ｏ’ｊ）　　　　　　（８
式）となり、四則演算だけで学習が可能になる。

以上の演算は学習方向計算部４で行なわれる。

学習方向計算部４は第２３図に示すように最急降下方向
計算部４工で構成されている。最急降下方向計算部４１
は第２４図に示す構成をしている。

第２４図において、４１１は（８式）を実行する閾値関
数微分計算部、４１２は（４式）を実行する誤差微分値
計算部である。ユニット出力値メモリｍ３からｏ　Ｊを
読み込み（８式）を実行した閾値関数微分値計算部４１
１は計算したｒ’　（１’＋　）を誤差微分値計算部４
１２に送る。誤差微分値計算部４１２は（６式）（７式
）を計算してｄ　ｋ　ｒを求めた後、ユニット出力値メ
モリｍ３または入力データメモリｍ１から０ｋ−１＋を
読み込んで（５式）を実行する。これは即ち（４式）を
実行したことになるので誤差微分の名称を持つ。こうし
て得られたｇｋ−１，に、は最急降下方向メモリｍ７に
格納される。

第２５図に重み修正１計算部５の一構成例を示す。第５
図において５ａｌとｔａ２はそれぞれ加算器と乗算器で
ある。乗算器５ａ２は最急降下方向メモ’Ｊｍ７に格納
された最急降下方向ｇｋ−１，ｋ。

と学習率メモリｍ６のεとを掛は合わせて（３式）を実
行し、重み係数の修正量を重み、修正量メモ’Ｊｍ５へ
格納する。加算器５ａｌはこの個分だけ重み係数メモ’
Ｊ　ｍ　５の値を修正すれば１回の学習分の重み修正が
完了する。重み係数が更新されると前向き方向計算部２
は更新された重み係数を用いて新しい出力値を求めユニ
ット出力値メモリｍ３に格納しておく。誤差値計算部３
はこの値と教師データメモリｍ２との差の自乗和を誤差
値メモリｍ１０へ格納しておく。学習終了判定部１が学
習によって誤差がどれだけ小さくなったかを調べ、設定
値以下になれば終了のｔ旨示を出す。第２６図はこの学
習終了判定部の一構成例を示したものである。１ｍｌは
終了基準値メモリ、１ａ１は減算器、１２は制御部であ
る。終了判定に用いる設定値は終了基孕値メモ’Ｊ　１
　ｍ　ｌにいれられており、この値と誤差値メモ’Ｊ　
ｍ　１０との大小を減算器１ａｌで行なうことで制御部
１２が学習終了か継続かを判断し、学習装置全体の制御
を出すのである。

発明が解決しようとする課題しかしながら上記のような方法は最急降下法に基づいて
いるため学習時間が長くかかるという課題を有していた
。これは、最急降下法が局所的には最適であるが、大局
的には必ずしもよくない逐次法であるからである。例え
ば、鋭い谷間のような空間を考えて最急降下法で最小点
の存在を探索すると、谷間の方向ではなく谷の側壁方向
が最急降下方向になりがちで、なかなか谷の方向へは進
めないことからも容易に推測できよう。さらに、学習を
始める時の重み係数の初期値の決定方法がないために乱
数を発生させて決めざるを得ないが、運が悪いとなかな
か収束せず学習を−からやり直す必要がしばしば生じる
。この見極めにはある程度学習を続けて明らかに学習効
率が悪いと判断しなければならず、結果的に時間が、か
かってしまうという課題も残されていた。

本発明はかかる点に鑑み、高速に学習を行なう学習装置
を提供することを目的とする。

課題を解決するための手段本発明は、動的に学習率を計算する学習率計算部を備え
たことを特徴とする学習装置である。

また、動的に学習率を計算する学習率計算部と、学習率
計算補助メモリとを備えたことを特徴とする学習装置で
ある。

また、動的に学習率を計算する学習率計算部を備え、前
記学習率計算部は、複数の誤差値を計算する多重誤差値
計算部と、前記多重誤差値計算部の出力値から最適な学
習率の存在範囲を求める最小点存在区間検出部と、前記
最小点存在区間検出部で求められた区間中の最小点を決
定する最小点決定部とを内蔵していることを特徴とする
学習装置である。

また、動的に学習率を計算する学習率計算部を備え、前
記学習率計算部は、複数の誤差値を並列に計算する多重
誤差値並列計算部と、前記多重誤差値計算部の出力値か
ら最適な学習率の存在範囲を求める最小点存在区間検出
部と、前記最小点存在区間検出部で求められた区間中の
最小点を決定する最小点決定部とを内蔵していることを
特徴とする学習装置である。

また、学習方向を保持しておく共役勾配方向メモリと、
学習方向計算部とを備え、前記学習方向計算部は最急降
下方向を求める最急降下方向計算部と、前記最急降下方
向に基づいて最急降下方向を共役勾配方向へ変換する変
換係数を求める傾斜変換係数変換部と、前記最急降下方
向計算部の最急降下方向と前記傾斜変換係数変換部の変
換係数から共役勾配方向を求める共役勾配方向計算部と
を内蔵していることを特徴とする学習装置である。

また、学習方向を保持しておく共役勾配方向メモリと、
学習回数を記録する学習カウンタと、学習方向計算部と
、学習終了判定部とを備え、前記学習方向計算部は最急
降下方向を求める最急降下方向計算部と、前記最急降下
方向に基づいて最急降下方向を共役勾配方向へ変換する
変換係数を求める傾斜変換係数変換部と、前記最急降下
方向計算部の最急降下方向と前記傾斜変換係数変換部の
変換係数から共役勾配方向を求める共役勾配方向計算部
とを内蔵していることを特徴とする学習装置である。

また、これ以上学習を続けても学習効率が悪い状態であ
ることを検出する不適学習状態検出部を備えたことを特
徴とする学習装置である。

また、これ以上学習を続けても学習効率が悪い状態であ
ることを検出する不適学習状Ｂ＠出部と、前記不適学習
状態検出部が不適な学習状態にあることを検出した場合
前記重み係数、メモリの値を更新する重み係数調整部と
を備えたことを特徴とする学習装置である。

作用本発明は前記した構成により、学習率計算部が最適な学
習率を求め、この学習率に基づいて高速に学習を収束さ
せる。また、前記した構成により、学習方向が共役勾配
方向を求め、°この学習方向に基づいて高速に学習を収
束させる。さらに、前記した構成により、学習状態が悪
い状態かどうかをいち早く判断し無駄な学習を続けない
ようにすることによって結果的に高速に学習を収束させ
る。

実施例第１図は本発明の一実施例における学習装置の構成図を
示すものである。第１図において、６は動的に学習率を
計算する学習率計算部である。以上のように構成された
第１の実施例の学習装置について、以下その動作を説明
する。

前向き計算部２に入力データメモリｍ１のデータが入力
されると、前向き計算部２は重み係数メモ’Ｊ　ｍ　４
の値を用いて神経回路網構成されたネ・ントワーク出力
を計算し、中間層ユニ・ソトの値と共にユニット出力と
メモリｍ３へ書き込む。誤差値計算部はユニット出力値
メモ’Ｊ　ｍ　３の内出力層ユニットの出力値と対応す
る教師データメモリｍ２の値の差の自乗和を計算し、誤
差値メモリｍｌ。

へ格納する。学習終了判定部は誤差値メモ’Ｊ　ｍ　１
０の値が内部で設定されている終了基準値以下であれば
、各構成部分に学習を終了するよう制御を行い、すべて
の学習が終了する。この時の重み係数メモリｍ４の値が
学習によって得られた結果である。しかし、終了基準値
以上の誤差値が誤差値メモ’Ｊｍ１０に書き込まれてい
れば各構成部分に学習を継続するよう制御する。学習方
向計算部はユニット山力値メモリｍ３・教師データメモ
リｍ２・重み係数メモリｍ４Φ入力データメモリｍ１の
それぞれからデータを読み込み最急降下方向を計算して
最急降下方向メモ’Ｊｍ７へ書き込んでいく。そして学
習率計算部６が動的に計算した学習率を学習率メモｌＪ
ｍ６に書き込み、最後に重み修正量計算部５が学習率と
学習方向を掛は合わせて重み修正量を求め、重み修正量
メモリｍ５に書き込むと同時に重み係数メモリｍ４の値
を修正する。

問題は最適な学習率の決定方法であるが、本発明では少
しづつ学習率の値を変化させて前向き方向の計算を行い
、教師データメモリｍ２との差を求め、この誤差が最も
少なくなるような学習率を求める方式を採用している。

この方法を示したのが第２図である。第２図の横軸は学
習率ε、縦軸は前述の誤差値である。すべての学習率に
ついて計算した特待られるであろうグラフを第２図に示
しである。なるべく少ない探索回数でこのグラフの最小
点を求めればよいのである。この探索にはｉを探索回数
として５＝ｅ＠＋ａ’ｈ　　　、　　　　　　　　（９式）で
学習率を順次評価していく。学習率ε１を用いて求めた
前述の誤差値をｆｌとすれば、ｆ＋　　＜　　ｆ＋４＋　　　　　　　　　　　　　（
１０式）となるまで評価を続ける。すると、少なくとも
ε−４からε１４１の間に最小誤差値ｆ　’ｓｉｎを与
える学習率ε、１、が存在する。この３点（εしｌ＋　
　ｆｌ−２）　　（ε＋、ｆ＋）（ε書４１．　　ｆ１
４１）の内２点を通る２次曲線を考え、最小点を与える
極値を求めるのである。α＝２の場合はもう少し精度を
上げ、かつ演算量を少なくすることができる。その様子
を第３図に示す。第３図は、（１０式）を満たす３点が
得られた時の図で、この３点を（ε＋、’ｆ＋）（ε２
１　　ｆ２）（ε４．ｆ４）とする。次にε２とε４の
中点をε３とし、対応する誤差値ｆ３を求める。そして
ｆ２＜ｆ３　　　　　　　　　　　　　（１１式）％式
％）の３点を用い、（１１式）を満たさなければ、　（ε２
゜ｆ２）（ε３．ｆ３）（εＪ、　　ｆ４）の３点を用
いて２次曲線の当てほめを行い、最小誤差値を与える学
習率εａＩｎを求める。εＳとε２とε３とε４が等間
隔に並ぶのでこの最適学習率は容易に求められ、例えば
、前者の場合、この計算を行なう学習率計算部６の構成を第４図に示す
。第４図において、６１は最適な学習率ｃ＋＋Ｉｎが存
在する区間［εｌ　−１＋　　ε１４１コを探す最小点
存在区間検出部、６２はその区間から２次曲線の当ては
めによって最適な学習率εｓＩｎを決定する最小点決定
部である。各部は上述の方法で区間および最適な学習率
を求める。この具体的構成を示したのが第５図である。

第５図において、６１ｍ１〜６１ｍ３は（９式）の右辺
を実行するためのメモリで、各々αメモリ・ｈメモリ・
α１ｈメモリである。６１ｍ４は（９式）の左辺を格納
するεメモリである。６１ｍ５はεメモ’Ｊ　６１　ｍ
　４の各学習率εに対、応する誤差値ｆを格納するｆメ
モリである。６１１は（１０式）が満足するまで学習率
存在区間検出部６１の制御を行い、終了すれば最終点決
定部６２に制御を渡す制御部である。６１２は（９式）
の計算をするε４計算部、６１３はεメモリ６１ｍ４の
中のεメモリ６１ｍ４の値とｆメモリ６１ｍ５の内容を
コピーするメモリコピー　６１４は（１０式）の比較を
行なう比較器である。

以上のように構成された学習率存在区間検出部６１の動
作を説明する。ε４計算部５１２はαメモ９６１ｍ１φ
ｈメモリ６１ｍ２ｅεメモリｅ１ｍ４から（９式）の計
算に必要な値を読みだし計算する。

（９式）の探索回数ｉはε４計算部５１２内部にあるカ
ウンタで管理する。この計算結果をεメモリ６１ｍ４の
ε４メモリに格納する。また、計算の途中結果αｉＩｈ
即ちｈをα１ｈメモリ６１ｍ３へ待避しておく。これが
第１回目の計算である。第２回目は、ε４計算部５１２
はαメモ’Ｊ　６１　ｍ　１・α１ｈメモリ６１ｍ３＠
εメモリ６１ｍ４から必要な値を読みだしく９式）の計
算を行い同様にεメモリ６１ｍ４のε４メモリに格納す
る。第２回目以降は、（９式）のα１ｈは指数演算をす
る必要はなく、α１ｈメモリ６１ｍ３の値にαメモリ６
１ｍ１の値を乗じて再びαＩｈメモリ６１ｍ３へ戻すと
いう１回の乗算だけでよい。この演算に先立ちメモリコ
ピー６１３はＱ２→Ｑ＋、Ｑ４→Ｑ２＋　　ｒ２→ｆ＋
＋　　ｆ４→ｆ２とメモリの内容をコピーしておく。ε
４計算部５１２が（８式）の計算結果をεメモリ６１ｍ
４のε４メモリに格納すると、制御部６１１は前向き計
算部２および誤差値計算部３に指令をだし、学習率ε４
に対応するｆ４を求めさせる。そして、ｆメモリ６１ｍ
５のｆ、メモリに格納させる。比較器６１４はこのｆ４
とｆ２の大小比較を行、なう。これは（１０式）に相当
する。その結果、（１０式）が満たされれば最適学習率
の存在範囲は［ε１．　ε４コであると確定するので制
御部１はそのことを最小点決定部６２に知らせ制御を渡
す。

最小点決定部６２の構成も同じく第５図に示しである。

第５図において、６２１は（１２式）が求められるよう
最小点決定部６全体を制御する制御部、６２２はεメモ
９８１ｍ４からε２とεイの中点であるε３を求めるε
３計算部、８２ｍ１はε３計算部６２２が求めたε３を
格納するε３メモリ、Ｅｉ２ｍ２はε３に対応する誤差
値ｆ３を格納するｆ３メモリ、６２３はεメモリｅ１ｍ
４１１ε３メモリ６２ｍ１・ｆメモリ６１ｍ５からデー
タを読みだして（１２式）を計算する最終点計算部、６
２ｍ３は最終点計算部６２３の求めた最適な学習率εａ
Ｉｎを格納するε、。メモリである。

以上のように構成された最小点決定部６２の動作を説明
する。ε３計算部６２２はεメモリ［１１ｍ４からε２
とε４を読みだしε３＝（ε２＋ε４）／２を計算し、
ε３メモリ６２ｍ１へ格納する。ε３メモリ［１１２ｍ
１にε３が書き込まれると、制御部６２１は前向き計算
部２および誤差値計算部３に指令をだし、学習率ε３に
対応するｆ３を求めさせる。そして、ｆ３メモ’Ｊ６２
ｍ２に格納させる。最小点計算部６２３はεメモリ６１
ｍ４からε２の値を、ε３メモリ８２ｍ１からε３の値
を読みだし、（１１式）の大小関係を比較する。その結
果（１１式）が満たされれば、（１２式）を計算しεｎ
ｌｎメモ’ＪＥｉ２＋ｎ３へ格納する。もし、（１１式
）が満たされなければεメモ’ＪＧＩｍ４からｆ４を読
みだし、（１３式）を実行して最適学習率εｓＩｎを求
める。

ε、。メモＬ６２ｍ３が書き込まれれば最小点決定部６
２の仕事は終わり制御を学習率計算部６へ戻す。学習率
計算部６は、最終的に求まったε、。メモ’Ｊ　６２　
ｍ　３の最適学習率ε、。を学習率メモＩＪ　ｍ６に格
納し、学習率計算をすべて終わる。

こうして本発明は学習毎に動的に最適な学習率を求めな
がら学習を行なう。第１図の構成をした本発明の学習装
置と第２２図の構成をした従来の学習装置の学習終了時
間を実験的に比較してみた。

２ＯｏＯ回実験を繰り返したところ、従来の学習装置の
学習終了期待時間が４秒５８　ｍ５ｅｃであったのに対
し、本発明の学習装置では１秒４４４　ｍ５ｅｃと３倍
近く高速になった。

このように本実施例によれば、動的に学習率を求める学
習率計算部を設けることにより、効率よく学習を進め学
習時間を短縮させることができる。

なお、本実施例の最小点決定部において最適な学習率を
保持するεｓＩｎメモリを用いて説明したが、実施例の
説明でも明らかなように学習率メモリｍ６と同じ値であ
り、かつ、同時に使用することがないので、両メモリを
兼用しても何等差し支えない。また、（９式）からも明
かなようにｅ９をＯと定義して行なう場合はεメモリ６
１ｍ４は３つの値を保持するサイズでよい。また同様に
、（９式）のｈを１と定義して行なう場合はｈメモリ６
１ｍ２は不用である。また、本実施例の最小点決定部は
（９式）のαが２である場合の説明を行なったが、股の
値であっても多少の構成の違、いはあるものの本質的に
大きな違いはなく、２次曲線の当てはめによる最小点の
決定が行える。

第６図は別の本発明の実施例における学習装置の構成図
を示すものである。第６図において、ｍ９は学習率を効
率的に求めるための学習率計算補助メモリである。以上
のように構成された本発明の一実施例における学習装置
について、以下その動作を説明する。初めに、本発明の
学習率計算部６の動作の基本となる考え方についてもう
一度見直して見よう。第３０図の線形信号処理部２００
に入る入力総和は（１式）で表わされるので、（３式）
を組み込むと学習率計算部６内部で行なわれる逐次的な
計算は次のように表わされる。

Ｙｋ、＝Σ　（Ｗ　’　−’　＋　ｋＨ＋Δｗｋ−１，
に、）　Ｘｋ−１と表わされる。ここでｎは学習率存在
区間検出部６１で最適学習率の存在区間が見つかるまで
逐次的に行なわれる探索回数である。

ところが、（１４式）をよく検討すると、学習率存在区
間検出部６１で本当に必要な演算は変数ｎに関わるもの
だけであるから、（１４式）は次のように変形可能であ
る。

ｙｋ、＝Σ　（ｗｋ　−１、ｋ　、　Ｘ　ｋ　−１。

一ε　（ｇｋ−１，に、Ｘｋ−１，）　　）＝Σ　Ｗ”
＋ＪＸｋ− 一ε。Σ　ｇ　ｋ−１＋　ｋ　、　ｘ　ｋ−１゛　　　
１＝　Ａｋ″１１ｋｊ ×が中間層のユニソよって変わるので、が入力データメモリの場合に限られる。

ｇｎＢ’−’ＩＪ　　　　　　（１５式）トの出力の場
合は学習率ε。に（１５式）の変形が可能なのは× １の内容で、ｙが第１中間層即ち、の入力和を求める場合、（１４式）では（（２回の乗算
と１回の減算）×入力層ユニット数）×第１中間層ユニ
ット数の演算が必要であったのに対し、（１８式）では
（１回の乗算と１回の減算）×第１中間層ユニット数だ
けでよい。一般に神経回路網構成をした場合入力層のユ
ニット数が最大になる場合が最も多いのでこの演算数の
削減効果は大きい。

さて、本発明における学習率計算部６の中の学習率区間
存在検出部６１では初め１回だけ（１６式）のＡとＢを
計算して学習率計算補助メモ’Ｊ　ｍ　９へ格納してお
く。以後、学習率、計算補助メモ’Ｊ　ｍ　９を参照し
ながら（１８式）を計算し最適な学習率の計算を行なう
のである。

以上のように本実施例によれば、学習率計算補助メモリ
を設けることによって学習率を求める際の演算数を大幅
に削減できる。

第７図は別の本発明の実施例に、おける学習装置の中の
学習率計算部の構成図を示すものである。

第７図において、６３は複数の誤差値を計算する多重誤
差値計算部、６４は多重誤差値計算部６３が計算した複
数の誤差値から最適な学習率が存在する区間を決定する
最小点決定部である。以上のように構成された本発明の
一実施例における学習装置について、以下その動作を説
明する。

初めに考え方を述べよう。第８図は第２図・第３図と同
じく、学習率εと誤差値との関係を示す例である。第２
図のように探索開始点ｅｌＩから最適学習率εａｌｎま
で誤差が単調減少する場合は第４図で述べたような構成
でもよい。しかし、第８図のように途中に局所最小点が
存在する場合は、前述した逐次探索方式ではこの局所最
小点に捕られれてしまい大局的最小点に行き着かない。

誤差値ｆを学習率εの関数としてｆ（ε）とすれば、第
８図の場合、ｆ　（ｅ　ｓ　＋　ｈ　）　＜　　ｆ　（
ｅ　Ｉｌ＋　２　ｈ　）であるから探索開始早々（１０
式）を満足してしまい、最初の局所最小点を最適な学習
率として探索をやめてしまう。この対処方法としては一
つの学習率に対する誤差値を求めたらすぐ前回計算の誤
差値と比較するのではなく、ｎ個の学習率に対するｎ個
の誤差値をまず求め、次にこれらｎ個の誤差値を比較し
て（１０式）を填足する位置を探すのである。ｎ個目の
誤差値が最も小さければさらに次のｎ個を探索するので
ある。

この考え方に基づく本発明の学習率計算部について説明
する。多重誤差値計算部６３は初めに複数（ｎ個）の学
習率を用意し、各学習率に対応するｎ個の誤差値を計算
する。この詳細な構成例を第９図に示す。第９図におい
て、６３２は（９式）に基づいてｎ個の学習率εを計算
するε計算部、６３ｍ１はε計算器６３２で得られ・た
ｎ個の学習率ε、〜ε７を記憶保持するεメモリ、６３
ｍ２はＣメモリの各学習率εに対応する誤差値ｆを格納
するｆメモＩＪ、６１１は多重誤差値計算部６３全体の
制御を行なう制御部である。このように＋１６成された
多重誤差値計算部６３では、初め（９式）に基づいてｎ
個の学習率εを計算しεメモリ６３ｍ１へ格納する。続
いて制御部６３１は前向き計算部２および誤差値計算部
３に指令を出し、εメモリ６３ｍ１のｎ個の学習率に対
応する誤差値を計算させ誤差値メモ’Ｊ　６３　ｍ　２
に格納させる。その後最小点存在区間検出部６４へ制御
を渡す。

この最小点存在区間検出部６４の構成も同じく第９図に
示しである。第９図において、θ４２はｆメモ！Ｊ　６
３ｍ２の内容を比較する比較器、６４１は比較器６４２
を制御する制御部である。このように構成された最小点
存在区間検出部６４は以下のように動作する。多重誤差
値計算部６３の制御部から制御を渡された最小点存在区
間検出部６４の制御部６４１はｆメモリ６３ｍ２からｆ
、メモリとｆ２メモリの内容を読みだし比較するよう比
較器６４２を制御する。比較器６４２は両者の差を求め
制御部６４１へ送る。これによって制御部６４１はｆ＋
メモリとｆ２メモリのいずれが小さいかを知ることがで
きる。この小さい方の値が入っているｆメモリ６３ｍ２
の内容とｆ３を読みだし比較器６４２で比較させる。こ
うして、小さい方の誤差値とｆ４・ｆ５・ｆ８・・・と
繰り返していけばｆメモ’Ｊｅ３ｍ２の中の最小誤差値
を捜し出すことができる。もし、ｆｎが最小値ならばさ
らに先に最小値があることになるので次のｎ個の探索を
行なうよう多重誤差値計算部６３へ制御を戻す。さてこ
うして見つかった誤差の最小値をｆｋとしよう。すると
、求めたい最適学習率は第８図、からもわかるようにε
、−１〜εに＋１の間に存在すると考えられる。

こうして最小点存在区間検出部６４はその求める範囲を
検出したので、最小点決定部６２へ制御を渡し最適学習
率εア１．を決定する。

この方法によっても必ず大局的最小点が求められるわけ
ではなく、かつ、１つづつ誤差値の計算と比較を行なう
方法に比べて１回あたりの計算量も多くなる。しかし、
真の最適学習率を得る確率は高くなるので、その結果と
してより早く学習が完了しやすくなる。

以上のように本実施例によれば、多重誤差値計算部と最
小点存在区間検出部を内蔵した学習率計算部を設けるこ
とによって、学習を早く収束させることができる。

なお、実施例では最小点存在区間検出部が毎回誤差値の
ｆメモリから値を読みだし比較するように比較器を構成
したが、ｆ＋＋ｆ２＋ｆｓと順次比較するわけであるか
ら、比較器で１つのレジスタ等を用意し１つ手前の誤差
値を保持しておけばｆメモリから読みだす誤差値は１つ
で済む。

第１０図は別の本発明の実施例における学習装置の中の
学習率計算部の構成図を示すものである。

第１０図において、６５は複数の誤差値を並列に計算す
る多重誤差値並列計算部である。以上のように構成され
た本発明の一実施例における学習装置について、以下そ
の動作を説明、する。

第７図の多重誤差値計算部６３で説明したように複数の
学習率に対する誤差値を求める本発明の学習装置におい
ては、ここの誤差値の計算は順位性を持たず各々独立に
計算可能である。従って、複数の前向き計算部２と複数
の誤差値計算部を用意すれば並列計算が可能になる。こ
のように複数の誤差値計算を並列に行なうのが多重誤差
値並列計算部６５である。こうして得られた複数の誤差
値から最小点存在区間検出部６４で最適な学習率が求め
られる。

排他ＯＲ問題を解くような神経回路網構成の重み係数を
本発明の学習装置で学習を行なった。２０００回実験を
繰り返して学習の終了する時間の期待値を求めたところ
、第１図で述べた別の本発明の学習終了期待時間が１秒
４４４　ｍ５ｅｃであったのに対し、第１０図の構成を
した学習率計算部を持った本発明では４５１　ｍ５ｅｃ
と３倍以上高速になった。

以上のように本実施例によれば、多重誤差値並列計算部
と最小点存在区間検出部を内蔵した学習率計算部を設け
ることによって、学習を早く収束させることができる。

第１１図は別の本発明の実施例における学習装置の構成
図を示すものである。第１１図において、ｍ８は学習方
向計算部４で求められた共役勾配方向を格納する共役勾
配方向メモリである。以上のように構成された本発明の
一実施例における学習装置について、以下その動作を説
明する。

本発明では学習を行なう方向として最急降下方向ではな
く共役勾配方向を用いている。初めにこの理由と求め方
を説明する。

最急降下方向の問題点は従来の学習装置の課題として述
べたように、局所的には・最適であるが大局的には必ず
しも最適でない点にある。その解決策の１つとして兵役
勾配方向を考える。もし、学習しようとするする重み係
数の多次元空間が２次形式で表わされるならば、その次
元数だけの学習回数で最適な位置に到達することが保証
されている　（証明は例えば、　　メフソト°　フォア
　アンコンストレインド　　オフ。

テイニ七゛イション　フルロブレムス゛　アメリカン　
エルシヒ゛イア　バフ゛リフシュイツク゛　　Ｊ、Ｋｏ
ｖａｌｌｋ　　ａｎｄ　　Ｍ、Ｒ，０ｓｂｏｒｎｅ＋　
　”ＭＥＴＨＯＤＳ　　ＦＯＲｌｌＮｃＯＮｓＴＲＡＩ
ＮＥＤ　ＯＰＴＩＭＩＺＡＴＩＯＮ　ＰＲＯＢＬＥＭｓ
”、　Ａｍｅｒｌｃａｎ　Ｅｌｓｅｖｌｅｒ　Ｐｕｂｌ
ｌｓｈｌｎｇ＋　１９１１ｉ８．　　の３．６節）。２
次形式とは多次元空間上のお椀のような形状である。

学習の対象となる重み空間が２次形式で表わされるかど
うかは時と場合によるが少なくとも、非常に早く収束す
る場合がありえるわけである。

では、どのように共役勾配方向を求めるかを説明する。

　この方法の一つに　フレフチャーリーへ゛スＦｌｅｔ
ｃｈｅｒ−Ｒｅｅｖｅｓの方法がある　（アアツクショ
ン　ミニマイ七°イション　ハ゛イコンジユケ′イト　
り゛ラテ°イエント、コンピュータ　エイジェント　　
Ｒ，Ｆｌｅｔｃｈｅｒ　ａｎｄ　Ｃ，Ｍ、Ｒｅｅｖｅｓ
、　　”Ｆｕｎｃｔｌ、ｏｎ　Ｍｌｎｌｍｌｚａｔｌ。

ｎ　ｂｙ　Ｃｏｎｊｕｇａｔｅ　Ｇｒａｄｌｅｎｔｓ”
、　Ｃｏｍｐｕｔｅｒ　Ｊａｒｎａｌ。

７（１９６４）、　１４９）。彼らの方法によれば、ｉ
回目に計算された最急降下方向をｇｌ　１回目に計算す
る共役勾配方向をｐとすれば、Ｔ）＋＝−ｇ＋　　＋　βＩ）１−＋　　　　　　　（
１７式）で与えられる。（２０式）においてβは変換係
数でβ　”　　ｇｌ　／　　ｇ＋−＋　　　　　　’　
　　（１８式）で与えられる。この方法を神経回路網構
成した重み係数を学習するようにしたものが本発明であ
る。

本発明の構成を第１１図に示す。第１１図における学習
方向計算部４は最急降下方向を初めに計算し最急降下方
向メモリｍ７に格納する。その後この最急降下方向を使
って共役勾配方向を計算し共役勾配方向メモリｍ８に格
納する。以後、この共役勾配方向と学習率メモ’Ｊｍ６
の学習率を使って学習を進めていくのである。従って、
本発明の学習装置における特徴は共役勾配方向を計算す
る学習方向計算部４の構成と共役勾配方向メモ’Ｊ　ｍ
８にある。

この学習方向計算部４の構成を示したのが第１２図であ
る。第１２図において、４２は計算された最急降下方向
から共役勾配方向を求めるための係数を計算する傾斜変
換係数計算部、４３は最急降下方向計算部４１と傾斜変
換係数計算部の出力および共役勾配方向メモリｍ８の内
容から次の共役勾配方向を求める共役勾配方向計算部で
ある。

以上のように構成された学習方向計算部４の動作を説明
する。ｉ回目の学習で最急降下方向ｇ１を求めた最急降
下方向計算部４１は最急降下方向ｇ１を傾斜変換係数計
算部４２および共役勾配方向計算部４３へ送る。この時
点では最急降下方向メモリｍ７には一回前の学習時の最
急降下方向ｇ１−１が格納されているので、この値を読
み込む。そして最急降下方向計算部４１からの最急降下
方向ｇ１と最急降下方向メモリｍ７からの最急降下方向
ｇ＋−７との比を求める。即ち、（１８式）を計算する
。こうして求まった傾斜変換係数βを共役勾配方向計算
部４３へ送る。その後、最急降下方向計算部４１から送
られてきた最急降下方向ｇ１を最急降下方向メモリｍ７
へ格納し、次回の学習のためにメモリ内容を更新してお
く。この時点では共役勾配方向メモ’Ｊｍ８には一回前
の学習時の共役勾配方向ｐ−１が格納されている。共役
勾配方向計算部４３は共役勾配方向メモ’Ｊ　ｍ　８か
らこのｐ＋−＋を読み込み、最急降下方向計算部４１か
ら送られてきた最急降下方向ｇ＋と、傾斜変換係数計算
部４２から送られてきた傾斜変換係数βとを併せて（１
７式）を計算する。その後、共役勾配方向ｐ１を共役勾
配方向メモ’Ｊｍ８へ格納し、次回の学習のためにメモ
リ内容を更新しておく。

以上のように本実施例によれば、傾斜変換係数計算部と
共役勾配方向計算部とを内蔵した学習率計算部と、共役
勾配方向メモリとを設けることによって、毎回共役勾配
方向を求めることができ、学習対象の重み係数の多次元
空間が２次形式で表わされる場合は非常に早く学習を終
了させることができる。

なお、本発明に実施例では学習率の求め方については何
も述べなかったが、学習、率メモリｍ６に固定値を設定
して固定学習率で学習を進めても良いし、別の発明述べ
た学習率計算部を用いて動的に求めてもよい。動的に求
める場合の例は例えば、第４図のような構成で参照する
学習方向のメモリが異なることになる。このような学習
率計算部の例を第１３図に示す。学習率に対する誤差値
を求める際に学習方向として共役勾配・方向メモ’Ｊｍ
８を参照するのである。

第１４図は別の本発明の実施例における学習装置の構成
図を示すものである。第１４図において、７は学習の回
数を記録する学習カウンタである。

以上のように構成された本発明の一実施例における学習
装置について、以下その動作を説明する。

共役勾配方向を利用して学習を行なう前述した別の本発
明では、学習対象の重み係数の多次元空間が２次形式で
表わされる場合非常に学習が早くなることを特長とした
が、もしこのような単純な形状をしていなければ、共役
勾配方向がかえって仇になるかもしれない。そこで、局
所的には最も信頓できる最急降下方向へ数回に１回づつ
軌道修正した方が好ましい場合も考えられる。この考え
に基づくのが第１４図に示す本発明の学習装置であり、
学習カウンタ７を用いて共役勾配方向から最急降下方向
へ軌道修正をかけるのである。

この様子を第１５図に示した学習方向計算部４と学習カ
ウンタ７を用いて説明しよう。学習終了判定部１は学習
が１回行なわれる毎の学習カウンタ７の値に１を加算す
る。もし、この値が設定値に達したら傾斜変換係数計算
部４２へ傾斜変換係数βをＯにするよう制御する。傾斜
変換係数計算部４２は通常（１８式）を計算しているの
であるが、この制御をうけた場合は（１８式）を計算せ
ずβ＝０として共役勾配方向計算部４３へ送る。共役勾
配方向計算部４３はβ＝０として（１７式）を計算する
ことになるので、結果、最急降下方向を出力として共役
勾配方向メモ’Ｊｍ８へ格納する。以後、前述の学習が
続けられる。

では本発明の学習装置ではいかなる効果があるのであろ
うか。第１図の構成の別の本発明に於ける動的に学習率
を求める学習率計算部６を第１１図の構成でも持つとし
た場合で性能を評価してみた。排他的ＯＲ問題を例に２
０００回実験を行なった結果、本発明の学習装置におい
て学習カウンタ７が学習すべき重み係数と同じ値に達し
た場合、学習終了判定部１が傾斜変換係数計算部４２に
傾斜変換係数β＝０とするよう制御をかけた場合の学習
終了の期待時間は、１秒６７２　ｍ５ｅｃであった。

また、学習カウンタ７が学習すべき重み係数の半分の値
に達したら、学習終了判定部１が傾斜変換係数計算部４
２に傾斜変換係数β＝０とするよ°う制御をかけた場合
は、１秒９８　ｍ５ｅｃで学習が終了した。この性能は
従来の学習装置に比べ４倍近い高速であり、特に後者は
共役勾配を用いない第１図の構成の別の発明よりも高速
である。

以上のように本実施例によれば、学習カウンタを設ける
ことによって、学習対象が２次形式をしていない複雑な
形状であっても早く学習を終了させることができる。

第１６図は別の本発明の一実施吻１における構成図を示
したものである。第１６図において、８は学習している
状態が適切であるか不適切であるかを検出する不適切学
習状態検出部である。このように構成された本発明の学
習装置についてその動作を説明する。

ここで考える不適切な学習状態とはなかなか学習が進ま
ない状態をいう。このよ・うな状況に陥るのは重み係数
メモリｍ５の値の絶対値が大きくなり過ぎてしまうこと
が考えられる。このような状況では（１式）のｙが正ま
たは負の方に大きくなり過ぎてしまい、第３１図で言う
と右端か左端に寄ってしまった状況になる。学習におけ
る重み修正量は（３式）〜（８式）で示されているが、
特に（８式）で明らかなように、上述のような偏った状
況はｓ１ｇｍｏｌｄ関数の出力が０または１に近づいて
しまうので結果として（３式）の学習量がほとんどＯに
なってしまうこ七になる。こうなればなかなか学習が進
まないので不適切な学習状態に陥ったと判断される。

そこで、不適切学習状態検出部８はこの状態を検出し学
習終了判定部１へ学習を終了するよう制御を行なうので
ある。この判定は、ユニット出力値メモリｍ３に保持さ
れているユニット２０の出力を合計し、その総和が一定
値以下であれば偏りすぎと判断することで行なう。当然
のことながら、この判断は誤差値メモリｍ１の値が依然
として大きいという条件付きである。

また、別の実施例においては、ユニット出力を監視する
のではなく、学習方向を監視してもよい。

上述のような偏った状況では第３１図で微係数を考えれ
ばわかるように学習方向がほとんどＯになる。従って、
最急降下方向メモ’Ｊ　ｍ　７を監視し、学習方向の総
和が一定値以下ならば偏りすぎと判断し、学習終了判定
部１へ学習路・了の制御を行なうのである。

また、最急降下方向メモリｍ７の代わりに共役勾配方向
メモリｍ８を監視していてもよい。

以上のように本実施例によれば、不適学習状態検出部を
設けることによって、無駄な学習を防ぐことができ、結
果としては早く学習を終了させることにつながる。

第１７図は別の本発明の実施例を示すものである。第１
７図において、９は重み係数調整部である。このように
構成された発明の詳細な説明する。

不適切学習状態検出部８が不適切な学習状態に陥ってい
ると判断をした時、すぐ学習終了判定部１に学習を終了
させるのではなく、重み係数調整部９が重み係数の値を
変更して適切な学習状態に変更し、学習を継続すると言
う点が本発明の特長である。

この重み係数調整部９の一構成例を示したのが第１８図
である。第１８図において、９１は乱数発生部である。

このような構成をした重み係数調整部９について以下そ
の動作を説明する。不適学習状態検出部８が不適当な学
習状態に陥ったことを検出すると、乱数発生部９１にそ
の旨知らせる。

不適学習状態検出部８からの制御を受けた乱数発生部９
１は乱数を発生して重み係数メモ’Ｊ　ｍ　４の値をす
べて初期化する。乱数での初期化が終わるとその旨学習
終了部１へ指示を出、す。学習終了部１はこの結果を受
けて学習課程の管理」１初期化すべきものがあれば初期
化する。

以上のように本実施例によれば、乱数発生部を内蔵した
重み係数調整部を設けることによって不適当な学習状態
に陥っても、自動的に学習を再開させることができ、人
手を介さずに早く学習を終了させることができる。

なお、学習終了判定部が学習再開時に学習課程の管理上
初期化すべきものがなければ乱数発生部から学習終了判
定部への制御は必要ない。

第１９図は重み係数調整部９の第２の構成例をボしたも
のである。第１９図において、９２は全重み係数圧縮部
である。このような構成をした重み係数調整部９につい
て以下その動作を説明する。

不適学習状態検出部８が不適当な学習状態に陥ったこと
を検出すると、全重み係数圧縮部９２にその旨知らせる
。不適学習状態検出部８からの制御を受けた全重み係数
圧縮部９２は重み係数メモリｍ４の値にすべて１より小
さい値を掛は合わせることで重み係数をすべて初期化す
る。この初期化が終わるとその旨学習終了部１へ指示を
出す。学習終了部１はこの結果を受けて学習課程の管理
上初期化すべきものがあれば初期化する。重み係数を一
定の割合ですべて圧縮するのはそれまでの学習が進んで
きた重み係数の多次元空間の方向を考慮し、象限は変え
ずに学習を再開させようとするものである。

以」二のように本実施例によれば、全重み係数圧縮部を
内蔵した重み係数調整部を設けることによって不適当な
学習状態に陥っても、それまでの学習の情報を多少残し
ながら自動的に学習を再開させることができ、人手を介
さずに早く学習を終了させることができる。

第２０図は重み係数調整部９の第３のＩｆ４成例を示し
たものである。第２０図において、９３は異常値用カニ
ニット検出部、９４は重み係数圧縮部である。このよう
な構成をした重み係数調整部９について以下その動作を
説明する。不適学習状態検出部８が不適当な学習状態に
陥ったことを検出すると、μ常値出力ユニット検出部９
３にその旨知らせる。不適学習状態検出部８からの制御
を受けた異常値出力ユニット検出部９３はユニット出力
値メモ’Ｊｍ３を検索して最も異常な値を出力している
ユニットを検出する。具体的にはｓ１ｇｍｏｌｄ関数の
上限・下限値に最も近い値を出力しているユニットを探
す。こうして見つかった、異常値を出力しているユニッ
トの情報を重み係数圧縮部９４に渡す。重み係数圧縮部
９４はそのユニットと下層のユニットを結ぶ重み係数メ
モリｍ４に対してのみ、１より小さい値を掛は合わせる
ことで重み係数を初期化する。この初期化が終わるとそ
の旨学習終了部１へ指示を出す。学習終了部１はこの結
果を受けて学習課程の管理上初期化すべきものがあれば
初期化する。異常値を出力したユニットに関わる重み係
数にのみ一定の割合で圧縮するのはそれまでの学習が進
んできた重み係数の多次元空間の方向を考慮し、不適当
な学習状態に陥らせた重み係数のみ初期化する事で他の
重み係数はそれまでの学習結果を引き継がせながら学習
を再開させようとするものである。

以上のように本実施例によれば、異常値用カニニット検
出部と重み係数圧縮部を内蔵した重み係数調整部を設け
ることによって不°適当な学習状態に陥っても、それま
での学習の情報を多少残しながら自動的に学習を再開さ
せることができ、人手を介さずに早く学習を終了させる
ことができる。

また、本実施例においてはユニット２０がｓ１ｇｍｏｌ
ｄ関数を使っていることを前提に説明したが、任意の閾
値関数であっても構わない。

第２１図は重み係数調整部９の第４の構成例を示したも
のである。第２１図において、９５は異常入力検出部、
９６は重み係数圧縮部である。このような構成をした重
み係数調整部９について以下その動作を説明する。不適
学習状態検出部８が不適当な学習状態に陥ったことを検
出すると、異常値用カニニット検出部９３にその旨知ら
せる。

不適学習状態検出部８からの制御を受けた異常値用カニ
ニット検出部９３はユニット出力値メモリｍ３を検索し
て最も異常な値を出力しているユニットを検出する。具
体的にはｓ１ｇｍｏｌｄ関数の上限・下限値に最も近い
値を出力しているユニットを探す。こうして見つかった
、異常値を出力しているユニットの情報を異常入力検出
部９５へ渡す。異常入力検出部９５はそのユニットに入
力される値について最も絶対値が大きい入力を比較する
。こうして見つかった入力に掛は合わ゛される重み係数
メモＵ　ｍ　４の情報を重み係数圧縮部９６に渡す。

重み係数圧縮部９６はその重み係数１つだけに１より小
さい値を掛は合わせることで重み係数を初期化する。こ
の初期化が終わるとその旨学習終了部１へ指示を出す。

学習終了部１はこの結果を受けて学習課程の管理上初期
化すべきものがあれば初期化する。異常値を出力したユ
ニットの更に最も影響の大きい１つの重み係数にのみ一
定の割合で圧縮するのはそれまでの学習が進んできた重
み係数の多次元空間の方向を考慮し、不適当な学習状態
に陥らせた重み係数のみ初期化する事で他の重み係数は
それまでの学習結果を引き継がせながら学習を再開させ
ようとするものである。

以上のように本実施例によれば、異常値用カニニット検
出部と重み係数圧縮部を内蔵した重み係数調整部を設け
ることによって不適当な学習状態に陥っても、それまで
の学習の情報を多少残しながら自動的に学習を再開させ
ることができ、人手を介さすに早く学習を終了させるこ
とができる。

発明の詳細な説明したように、本発明によれば、学習率計算部、あ
るい共役勾配方向を求める学習方向計算部、あるいは不
適学習状態検出部を設けることによって、学習を高速に
終了させることができ、その実用的価値には大なるもの
がある。

【図面の簡単な説明】

第１図は本発明における一実施°例の学習装置の構成図
、第２図および第３図は本発明の基本となる動作説明図
、第４図は学習率計算部の構成図、第５図は学習率存在
区間検出部と最小点決定部の構成図、第６図は本発明に
おける他の実施例の学習装置の構成図、第７図は学習率
計算部の他の構成図、第８図は本発明の第２の実施例の
基本となる動作説明図、第９図は多重誤差値計算部と最
小点決定部の構成図、第１０図は学習率計算部の他の構
成図、第１１図は本発明における他の実施例の学習装置
の構成図、第１２図は学習方向計算部の構成図、第１３
図は学習率の他の構成図、第１４図は本発明における他
の実施例の学習装置の構成図、第１５図は学習方向計算
部の他の構成図、第１６図は本発明における他の実施例
の学習装置の構成図、第１７図は本発明における他の実
施例の学習装置の構成図、第１８図は重み係数調整部の
一構成因、第１９図から第２１図までは重み係数調整部
の他の構成図、第２２図は従来の学習装置の構成図、第
２３図は従来の学習方向計算部の構成図、第２４図は最
急降下方向計算部の構成図、第２５図は重み修正量計算
部の構成図、第２８図は学習終了判定部の構成図、第２
７図および第２８図は前向き方向計算部の構成図、第２
９図は前向き方向計算部を構成するユニットの構成図、
第３０図はユニットの他の構成図、第３１図は閾値処理
部の入出力特性図である。１・・・学習終了判定部、１ｍ１・・・終了基準値メモ
リ、　１２・・・制御部、１ａ１・・・減算器、２・・
・前向き方向計算部、２０・・・ユニット、２１・・・
入力ユニ・ソト、２０１・・・入力部、２０３・・・乗
算器、２０４・・・加算器、２００・・・線形信号処理
部、３００・・・閾値処理部、３・・・誤差値計算部、
４・・・学習方向計算部、４１・・・最急降下方向計算
部、４１１・・・閾値関数微分値計算部、４１２・・・
誤差微分値計算部、４２・・・傾斜変換係数計算部、４
３・・・共役勾配方向計算部、５・・・重み修正量計算
部、５ａ１・・・加算器、５ａ２・・・乗算器、６・・
・学習率計算部、６１・・・最小点存在区間検出部、６
１１・・・制御部、６１２・・・ε４計算部、６１　・
・・メモリコピー　６１４・・・比較Ｄ、６１　ｍｌ・
・・αメモリ、６１ｍ２・・・ｈメモリ、　６１ｍ３α
ｈメモリ、６１ｍ４・・・εメモリ、６１５ｍ・・・ｆ
メモリ、６２・・・最小点決定部、６２１・・・制御部
、６２２・・・ε３計算部、６２３・・・最小点計算部
、６２ｍ１　・・・Ｅ　３メモＩハ　６２　ｍ　２　・
・・ｆ　３メモリ、６２ｍ３・・・ε、。メモリ、６３
・・・多重誤差値計算部、６３１・・・制御部、６３２
・・・ε計算部、６３ｍ１・・・εメモ’Ｊ、８３ｍ２
・・・ｆメモリ、６４・・・最小点存在区間検出部、６
４１・・・制御部、６４２・・・比較器、６５・・・多
重誤差値並列計算部、７・・・学習カウンタ、８・・・
不適学習状態計算部、９・・・重み係数調整部、９１・
・・乱数発生部、９２・・・全重み係数圧縮部、９３・
・・異常値比カニニット検出部、９．４・・・重み係数
圧縮部、９５・・・異常入力検出部、９６・・・重み係
数圧縮部、ｍｌ・・・入力データメモリ、ｍ２・・・教
師データメモリ、　ｍ３・・・ユニット出力値メモリ、
ｍ４・・・重み係数メモリ、ｍ５・・・重み修正量メモ
リ、ｍθ・・・学習率メモリ、ｍｌ・・・最急降下方向
メモＩＪ、ｍ８・・・共役勾配方向メモリ、　ｍ９・・
・学習率計算補助メモリ、ｍ１０　・・・　誤差値メモ
リ。代理人の氏名　弁理士　粟野重孝　はか１名第図第図図零図第図第図菱外瘍モホ第図弔図第１０面第１２図第１３図第１４図第１６図第１５図第１７図第１８図第２０図第１９図第２１図第２２図第２４図第２３図第２５図第２６第２９図第３０図図第２７図第図出方値

Claims

【特許請求の範囲】

（１）設定された条件まで学習が進んだかどうかを判定
する学習終了判定部と、入力データを保持する入力デー
タメモリと、学習目的値である正しい値を保持しておく
教師データメモリと、神経回路網構成をした前向き方向
計算部と、前記前向き計算部の計算結果を保持しておく
ユニット出力値メモリと、前記前向き方向計算部で用い
る重み係数を保持しておく重み係数メモリと、前記前向
き方向計算部の出力値と前記教師データメモリとの差異
を計算する誤差値計算部と、前記誤差値計算部の出力を
保持しておく誤差値メモリと、前記誤差値計算部の計算
値に基づいて学習方向を求める学習方向計算部と、前記
学習方向計算部の出力値を保持しておく最急降下方向メ
モリと、前記学習方向計算部で得られた学習方向にどれ
だけ学習を進めるかを示す学習率を保持しておく学習率
メモリと、前記学習方向計算部の計算方向に前記学習率
メモリの学習率に従って学習を行い前記重み係数メモリ
の値をどれだけ修正すべきを計算する重み修正量計算部
と、前記重み修正量計算部の計算結果を保持する重み修
正量メモリ、動的に学習率を計算する学習率計算部を具
備し、前記学習方向計算部は学習方向として最急降下方
向を求める最急降下方向計算部を内蔵し、前記学習率計
算部は最適な学習率の存在範囲を求める最小点存在区間
検出部と、前記最小点存在区間検出部で求められた区間
中の最小点を決定する最小点決定部とを持つことを特徴
とする学習装置。
（２）設定された条件まで学習が進んだかどうかを判定
する学習終了判定部と、入力データを保持する入力デー
タメモリと、学習目的値である正しい値を保持しておく
教師データメモリと、神経回路網構成をした前向き方向
計算部と、前記前向き計算部の計算結果を保持しておく
ユニット出力値メモリと、前記前向き方向計算部で用い
る重み係数を保持しておく重み係数メモリと、前記前向
き方向計算部の出力値と前記教師データメモリとの差異
を計算する誤差値計算部と、前記誤差値計算部の出力を
保持しておく誤差値メモリと、前記誤差値計算部の計算
値に基づいて学習方向を求める学習方向計算部と、前記
学習方向計算部の出力値を保持しておく最急降下方向メ
モリと、前記学習方向計算部で得られた学習方向にどれ
だけ学習を進めるかを示す学習率を保持しておく学習率
メモリと、前記学習方向計算部の計算方向に前記学習率
メモリの学習率に従って学習を行い前記重み係数メモリ
の値をどれだけ修正すべきを計算する重み修正量計算部
と、前記重み修正量計算部の計算結果を保持する重み修
正量メモリと、動的に学習率を計算する学習率計算部と
、学習率計算補助メモリとを具備し、前記学習方向計算
部は学習方向として最急降下方向を求める最急降下方向
計算部を内蔵することを特徴とする学習装置。
（３）設定された条件まで学習が進んだかどうかを判定
する学習終了判定部と、入力データを保持する入力デー
タメモリと、学習目的値である正しい値を保持しておく
教師データメモリと、神経回路網構成をした前向き方向
計算部と、前記前向き計算部の計算結果を保持しておく
ユニット出力値メモリと、前記前向き方向計算部で用い
る重み係数を保持しておく重み係数メモリと、前記前向
き方向計算部の出力値と前記教師データメモリとの差異
を計算する誤差値計算部と、前記誤差値計算部の出力を
保持しておく誤差値メモリと、前記誤差値計算部の計算
値に基づいて学習方向を求める学習方向計算部と、前記
学習方向計算部の出力値を保持しておく最急降下方向メ
モリと、前記学習方向計算部で得られた学習方向にどれ
だけ学習を進めるかを示す学習率を保持しておく学習率
メモリと、前記学習方向計算部の計算方向に前記学習率
メモリの学習率に従って学習を行い前記重み係数メモリ
の値をどれだけ修正すべきを計算する重み修正量計算部
と、前記重み修正量計算部の計算結果を保持する重み修
正量メモリと、動的に学習率を計算する学習率計算部を
具備し、前記学習方向計算部は学習方向として最急降下
方向を求める最急降下方向計算部を内蔵し、前記学習率
計算部は、複数の誤差値を計算する多重誤差値計算部と
、前記多重誤差値計算部の出力値から最適な学習率の存
在範囲を求める最小点存在区間検出部と、前記最小点存
在区間検出部で求められた区間中の最小点を決定する最
小点決定部とを内蔵することを特徴とする学習装置。
（４）設定された条件まで学習が進んだかどうかを判定
する学習終了判定部と、入力データを保持する入力デー
タメモリと、学習目的値である正しい値を保持しておく
教師データメモリと、神経回路網構成をした前向き方向
計算部と、前記前向き計算部の計算結果を保持しておく
ユニット出力値メモリと、前記前向き方向計算部で用い
る重み係数を保持しておく重み係数メモリと、前記前向
き方向計算部の出力値と前記教師データメモリとの差異
を計算する誤差値計算部と、前記誤差値計算部の出力を
保持しておく誤差値メモリと、前記誤差値計算部の計算
値に基づいて学習方向を求める学習方向計算部と、前記
学習方向計算部の出力値を保持しておく最急降下方向メ
モリと、前記学習方向計算部で得られた学習方向にどれ
だけ学習を進めるかを示す学習率を保持しておく学習率
メモリと、前記学習方向計算部の計算方向に前記学習率
メモリの学習率に従って学習を行い前記重み係数メモリ
の値をどれだけ修正すべきを計算する重み修正量計算部
と、前記重み修正量計算部の計算結果を保持する重み修
正量メモリと、動的に学習率を計算する学習率計算部を
具備し、前記学習方向計算部は学習方向として最急降下
方向を求める最急降下方向計算部を内蔵し、前記学習率
計算部は、複数の誤差値を並列に計算する多重誤差値並
列計算部と、前記多重誤差値計算部の出力値から最適な
学習率の存在範囲を求める最小点存在区間検出部と、前
記最小点存在区間検出部で求められた区間中の最小点を
決定する最小点決定部とを内蔵することを特徴とする学
習装置。
（５）動的に学習率を計算する学習率計算部と、学習率
計算補助メモリとを備え、前記学習方向計算部は学習方
向として最急降下方向を求める最急降下方向計算部を内
蔵することを特徴とする請求項１、２または４記載の学
習装置。
（６）設定された条件まで学習が進んだかどうかを判定
する学習終了判定部と、入力データを保持する入力デー
タメモリと、学習目的値である正しい値を保持しておく
教師データメモリと、神経回路網構成をした前向き方向
計算部と、前記前向き計算部の計算結果を保持しておく
ユニット出力値メモリと、前記前向き方向計算部で用い
る重み係数を保持しておく重み係数メモリと、前記前向
き方向計算部の出力値と前記教師データメモリとの差異
を計算する誤差値計算部と、前記誤差値計算部の出力を
保持しておく誤差値メモリと、前記誤差値計算部の計算
値に基づいて学習方向を求める学習方向計算部と、前記
学習方向計算部の出力値を保持しておく最急降下方向メ
モリと、前記学習方向計算部で得られた学習方向にどれ
だけ学習を進めるかを示す学習率を保持しておく学習率
メモリと、前記学習方向計算部の計算方向に前記学習率
メモリの学習率に従って学習を行い前記重み係数メモリ
の値をどれだけ修正すべきを計算する重み修正量計算部
と、前記重み修正量計算部の計算結果を保持する重み修
正量メモリと、学習方向を保持しておく共役勾配方向メ
モリを具備し、前記学習方向計算部は最急降下方向を求
める最急降下方向計算部と、前記最急降下方向に基づい
て最急降下方向を共役勾配方向へ変換する変換係数を求
める傾斜変換係数変換部と、前記最急降下方向計算部の
最急降下方向と前記傾斜変換係数変換部の変換係数から
共役勾配方向を求める共役勾配方向計算部とを内蔵する
ことを特徴とする学習装置。
（７）学習方向を保持しておく共役勾配方向メモリと、
学習回数を記録する学習カウンタとを備え、前記学習方
向計算部は最急降下方向を求める最急降下方向計算部と
、前記最急降下方向に基づいて最急降下方向を共役勾配
方向へ変換する変換係数を求める傾斜変換係数変換部と
、前記最急降下方向計算部の最急降下方向と前記傾斜変
換係数変換部の変換係数から共役勾配方向を求める共役
勾配方向計算部とを内蔵し、また、前記学習終了判定部
は前記学習カウンタが一定値に達すると前記傾斜変換係
数変換部に傾斜変換係数を０にリセットするよう制御を
行なうことを特徴とする請求項６記載の学習装置。
（８）動的に学習率を決定する学習率計算部を備えたこ
とを特徴とする請求項６または７記載の学習装置。
（９）設定された条件まで学習が進んだかどうかを判定
する学習終了判定部と、入力データを保持する入力デー
タメモリと、学習目的値である正しい値を保持しておく
教師データメモリと、神経回路網構成をした前向き方向
計算部と、前記前向き計算部の計算結果を保持しておく
ユニット出力値メモリと、前記前向き方向計算部で用い
る重み係数を保持しておく重み係数メモリと、前記前向
き方向計算部の出力値と前記教師データメモリとの差異
を計算する誤差値計算部と、前記誤差値計算部の出力を
保持しておく誤差値メモリと、前記誤差値計算部の計算
値に基づいて学習方向を求める学習方向計算部と、前記
学習方向計算部の出力値を保持しておく最急降下方向メ
モリと、前記学習方向計算部で得られた学習方向にどれ
だけ学習を進めるかを示す学習率を保持しておく学習率
メモリと、前記学習方向計算部の計算方向に前記学習率
メモリの学習率に従って学習を行い前記重み係数メモリ
の値をどれだけ修正すべきを計算する重み修正量計算部
と、前記重み修正量計算部の計算結果を保持する重み修
正量メモリと、これ以上学習を続けても学習効率が悪い
状態すなわち、ユニット出力値が予め定めた上下限値に
近いことを検出する不適学習状態検出部を具備し、前記
不適学習状態検出部の出力により、前記学習終了判定部
を制御することを特徴とする学習装置。
（１０）設定された条件まで学習が進んだかどうかを判
定する学習終了判定部と、入力データを保持する入力デ
ータメモリと、学習目的値である正しい値を保持してお
く教師データメモリと、神経回路網構成をした前向き方
向計算部と、前記前向き計算部の計算結果を保持してお
くユニット出力値メモリと、前記前向き方向計算部で用
いる重み係数を保持しておく重み係数メモリと、前記前
向き方向計算部の出力値と前記教師データメモリとの差
異を計算する誤差値計算部と、前記誤差値計算部の出力
を保持しておく誤差値メモリと、前記誤差値計算部の計
算値に基づいて学習方向を求める学習方向計算部と、前
記学習方向計算部の出力値を保持しておく最急降下方向
メモリと、前記学習方向計算部で得られた学習方向にど
れだけ学習を進めるかを示す学習率を保持しておく学習
率メモリと、前記学習方向計算部の計算方向に前記学習
率メモリの学習率に従って学習を行い前記重み係数メモ
リの値をどれだけ修正すべきを計算する重み修正量計算
部と、前記重み修正量計算部の計算結果を保持する重み
修正量メモリと、これ以上学習を続けても学習効率が悪
い状態であることを検出する不適学習状態検出部と、前
記不適学習状態検出部が不適な学習状態にあることを検
出した場合前記重み係数メモリの値を更新する重み係数
調整部を具備することを特徴とする学習装置。
（１１）重み調整部が乱数発生部を内蔵し前記重み係数
メモリの重み係数値をすべて更新することを特徴とする
請求項１１記載の学習装置。
（１２）重み調整部が前記重み係数メモリの重み係数値
すべてに一定の値を乗ずる全重み係数圧縮部を備えたこ
とを特徴とする請求項１１記載の学習装置。
（１３）重み調整部が、不適学習状態検出部が不適な学
習状態を検出した時の不適な学習状態に最も寄与したユ
ニット出力値を前記ユニット出力値メモリから探してく
る異常値出力ユニット検出部と、前記異常値出力ユニッ
ト検出部が検出したしたユニットに寄与している前記重
み係数メモリ内の重み係数値に一定の値を乗ずる全重み
係数圧縮部を備えたことを特徴とする請求項１１記載の
学習装置。
（１４）重み調整部が、不適学習状態検出部が不適な学
習状態を検出した時の不適な学習状態に最も寄与したユ
ニット出力値を前記ユニット出力値メモリから探してく
る異常値出力ユニット検出部と、前記異常値出力ユニッ
ト検出部が検出したしたユニット入力している値のうち
最も異常値に寄与している前記重み係数メモリ内の重み
係数値にのみ一定の値を乗ずる全重み係数圧縮部を備え
たことを特徴とする請求項１１記載の学習装置。