JPH05159086A - ニューラルネットワークの学習方式 - Google Patents

ニューラルネットワークの学習方式

Info

Publication number
JPH05159086A
JPH05159086A JP3319136A JP31913691A JPH05159086A JP H05159086 A JPH05159086 A JP H05159086A JP 3319136 A JP3319136 A JP 3319136A JP 31913691 A JP31913691 A JP 31913691A JP H05159086 A JPH05159086 A JP H05159086A
Authority
JP
Japan
Prior art keywords
pattern
input
learning
neural network
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3319136A
Other languages
English (en)
Inventor
Kazuhiro Obara
和博 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP3319136A priority Critical patent/JPH05159086A/ja
Publication of JPH05159086A publication Critical patent/JPH05159086A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 入力パターンの学習の進み具合いを個別に監
視し、汎化能力の高いニューラルネットワークを構築し
得るニューラルネットワークの学習方式を提供する。 【構成】 入力パターンP1を入力したときの出力層の
出力パターンO1と教師パターンT1との2乗誤差E1
が所定の値α以上のときには、バックプロパゲーション
・アルゴリズムによる重みの更新処理を行い、前記2乗
誤差E1が所定の値α未満のときに、前記重みの更新処
理を行わないという動作を入力パターン毎に実行する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力層、中間層および
出力層からなる多層構造型ニューラルネットワークの学
習方式に関する。
【0002】
【従来の技術】入力層、中間層および出力層からなる多
層構造型ニューラルネットワークに入力パターンと教師
パターンを与えて、バックプロパゲーション・アルゴリ
ズム[参考文献 Rumelhart,D.E.et al.:Parallel Dist
ributed Processing,Vol.1,MITPress(1986)]によ
り、上記入力パターンと上記教師パターン間の相関関係
を学習させる場合の従来技術を以下に説明する。
【0003】図1は、多層構造型ニューラルネットワー
クの構成例を示す図である。同図において、1は入力層
のニューロンを、2は中間層のニューロンを、3は出力
層のニューロンをそれぞれ示す。
【0004】入力パターンをPi (i=1,2,…,
N)、教師パターンをTi (i=1,2,…,N)とす
る。また、Pi を入力したときのニューラルネットワー
クの出力層の出力パターンOi (i=1,2,…,N)
とする。
【0005】従来技術では、すべての入力パターンを対
象とした上記出力パターンと上記教師パターンとの平均
2乗誤差Em の値があらかじめ設定した値よりも小さく
なったとき、学習を停止するという方法が採用されてい
た。出力層のニューロンの指標をj(j=1,2,…,
M)としたとき、Em は次のように定義される。
【0006】 Em =(1/N)ΣEp (1) Ep =(1/2)Σ(Tpj−Opj2 (2) 例えば、手書き数字のメッシュ特徴(図2(a)〜
(d)は16×16メッシュの手書き数字「0」〜
「3」のメッシュ特徴の例である)を入力層1への入力
パターンとし、出力層3への教師パターンとして、断定
的な値を与えて(数字「0」を入力としたときには、
「0」に対応する出力層のニューロンだけに1、残りの
ニューロンには0を与え、他の数字のときも同様な教師
パターンを与えて)、バックプロパゲーション・アルゴ
リズムにより学習を進め、平均2乗誤差が0.01より
小さくなったら学習を停止する。
【0007】
【発明が解決しようとする課題】従来技術のように、入
力パターンごとに区別することなく、すべての入力パタ
ーンでの平均2乗誤差で学習の停止条件を設定したとき
に生じる問題を説明する。
【0008】一般的に言って、N個の入力パターンを学
習に用いたとき、すべての入力パターンが同じ速度で学
習されていくとはかぎらない。比較的速く学習されるパ
ターン(2乗誤差が速やかに小さくなっていくパター
ン)と、なかなか学習が進まないパターン(2乗誤差が
なかなか小さくならないパターン)というように分かれ
る。このような状況下で、従来技術のようにトータルに
見て停止条件を設定すると、どの入力パターンも、ニュ
ーラルネットワークの学習に関して、同じくらい重要な
意味をもつようなケースでは次のような問題が生じる。
【0009】すなわち、従来技術では、もっと学習さ
せたいのに(他のパターンが十分学習され、平均2乗誤
差が設定値よりも小さくなってしまったために)学習を
打ち切られたり、十分学習が行われているのに(他の
パターンの学習が十分行われていないために)さらに学
習を進めることになる。
【0010】上記により、用意した入力パターンを満
偏なく学習させる(各パターンでの2乗誤差をできるだ
け同じように小さくする)ことができなくなる。また、
上記により、必要以上に特定のパターンを学習させる
(過剰学習させる)ことになる。これらが原因で、汎化
能力の高いニューラルネットワークを構築できないとい
う問題が生じる。
【0011】本発明は、上記に鑑みてなされたもので、
その目的とするところは、入力パターンの学習の進み具
合いを個別に監視し、汎化能力の高いニューラルネット
ワークを構築し得るニューラルネットワークの学習方式
を提供することにある。
【0012】
【課題を解決するための手段】上記目的を達成するた
め、本発明のニューラルネットワークの学習方式は、入
力層、中間層および出力層からなる多層構造型ニューラ
ルネットワークに入力パターンと教師パターンを与え
て、バックプロパゲーション・アルゴリズムにより入力
パターンと教師パターンとの間の相関関係を学習させる
ニューラルネットワークの学習方式であって、入力パタ
ーンを入力したときの出力層の出力パターンと教師パタ
ーンとの2乗誤差が所定の値以上のときには、バックプ
ロパゲーション・アルゴリズムによる重みの更新処理を
行い、前記2乗誤差が所定の値未満のときに、前記重み
の更新処理を行わないという動作を入力パターン毎に実
行することを要旨とする。
【0013】
【作用】本発明のニューラルネットワークの学習方式で
は、入力パターンを入力したときの出力層の出力パター
ンと教師パターンとの2乗誤差が所定の値以上のときに
は、バックプロパゲーション・アルゴリズムによる重み
の更新処理を行い、前記2乗誤差が所定の値未満のとき
に、前記重みの更新処理を行わないという動作を入力パ
ターン毎に実行している。
【0014】
【実施例】以下、図面を用いて本発明の実施例を説明す
る。
【0015】本実施例では、入力パターンとして、図2
に例示するような手書き数字のメッシュ特徴を与え、教
師パターンとして、上述したように例えば数字「0」を
入力したときには、「0」に対応する出力層のニューロ
ンのみに1を与え、残りのニューロンには0を与えると
いうように断定的な値を与える場合を例にとって説明を
行う。
【0016】入力パターンをPi (i=1,2,…,
N)、教師パターンをTi (i=1,2,…,N)とす
る。Pi を入力したときの出力パターンをOi (i=
1,2,…,N)とする。
【0017】Pi が数字「0」の入力パターンのときに
は、Ti=(1000000000)である(「0」に
対応する出力層のニューロンには1、その他のニューロ
ンには0を教師信号として与えるという意味)。Pi
数字「1」の入力パターンのときには、Ti =(010
0000000)である(他の数字に対応する入力パタ
ーンのときも同様)。
【0018】多層構造型ニューラルネットワークの規模
は、入力層のニューロン数は256個(入力パターンが
16×16のメッシュ特徴なので)、出力層のニューロ
ン数は10個(手書き数字には、10個のクラスがある
ので)、中間層のニューロン数は20個(これは通常、
試行錯誤的に決定する)である。
【0019】次に、図3を参照して、作用を説明する。
【0020】まず、パターンP1 をニューラルネットワ
ークの入力層1に入力する(ステップ110)。それか
ら、順方向(入力層→中間層→出力層)に計算して、出
力層での出力パターンO1 を得る(ステップ120)。
【0021】前述した式(2)に従って、T1 とO1
の間の2乗誤差E1 を計算する(ステップ130)。そ
して、計算した2乗誤差E1 があらかじめ設定した値α
以上のときには、バックプロパゲーション・アルゴリズ
ムにしたがい、逆方向(出力層→中間層→入力層)で重
みの更新を行なう。α未満のときには重みの更新は行な
わない(ステップ140)。
【0022】そして、上記ステップ110〜ステップ1
40と同様の動作を他の入力パターン(P2 〜PN )に
対して実行する(ステップ150)。すべての入力パタ
ーン(P1 〜PN )を対象とした平均2乗誤差Em を式
(1)および式(2)にしたがって計算する(ステップ
160)。
【0023】計算した平均2乗誤差Em があらかじめ設
定した値β未満のときには、ニューラルネットワークの
学習を停止する。β以上のときには、上記の第1からの
一連の動作を繰り返す(ステップ170)。
【0024】例えば、α=0.005、β=0.010
と設定して、上記の学習を実行させたとする。従来の学
習方式では、個々のパターンの学習の進み具合いを見な
いで、平均2乗誤差だけで学習の停止条件を規定してい
た。従って、特定のパターンでは2乗誤差が十分小さい
(例えば0.001)のに対し、学習の遅いパターンで
は2乗誤差がかなり大きい(例えば0.050)のに学
習が停止してしまうという、学習上のアンバランスが生
じる。
【0025】これに対し、本発明の学習方式では、2乗
誤差が0.005未満に到達したパターンに対する学習
動作(重みの更新)は行なわず、2乗誤差が0.005
以上のパターンに対する学習動作のみ実行する。
【0026】従って、トータルに見たときの停止条件
(平均2乗誤差がβ未満になったとき学習を終了する)
は従来技術と同じであるが、個々の入力パターンで見た
ときの学習内容がまったく異なってくる。つまり、すべ
ての入力パターンにおける2乗誤差が従来技術に比べ
て、ばらつきが少なく、減るように学習が進むようにな
る。
【0027】従って、本発明の学習方式では、従来技術
に比べて、入力パターンに関して偏りの少ない学習が実
現できるとともに、特定のパターンに対する過剰学習を
抑えることができる。これらの結果として従来技術より
も汎化能力の高いニューラルネットワークを構築できる
ことは明らかである。
【0028】
【発明の効果】以上説明したように、本発明によれば、
入力パターンを入力したときの出力層の出力パターンと
教師パターンとの2乗誤差が所定の値以上のときには、
バックプロパゲーション・アルゴリズムによる重みの更
新処理を行い、前記2乗誤差が所定の値未満のときに、
前記重みの更新処理を行わないという動作を入力パター
ン毎に実行しているので、学習が十分進んだ状態にある
パターンの学習は停止し、学習がまだ十分でないパター
ンの学習のみ継続し、従って入力パターンに関して偏り
の少ない学習が実現できるとともに、特定のパターンに
対する過剰学習を抑えることができ、結果として汎化能
力の高いニューラルネットワークを構築することができ
る。
【図面の簡単な説明】
【図1】多層構造型ニューラルネットワークの構成を示
す図である。
【図2】手書き数字のメッシュ特徴の例を示す図であ
る。
【図3】本発明の一実施例に係わるニューラルネットワ
ークの学習方式の作用を示すフローチャートである。
【符号の説明】
1 入力層のニューロン 2 中間層のニューロン 3 出力層のニューロン

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力層、中間層および出力層からなる多
    層構造型ニューラルネットワークに入力パターンと教師
    パターンを与えて、バックプロパゲーション・アルゴリ
    ズムにより入力パターンと教師パターンとの間の相関関
    係を学習させるニューラルネットワークの学習方式であ
    って、入力パターンを入力したときの出力層の出力パタ
    ーンと教師パターンとの2乗誤差が所定の値以上のとき
    には、バックプロパゲーション・アルゴリズムによる重
    みの更新処理を行い、前記2乗誤差が所定の値未満のと
    きに、前記重みの更新処理を行わないという動作を入力
    パターン毎に実行することを特徴とするニューラルネッ
    トワークの学習方式。
JP3319136A 1991-12-03 1991-12-03 ニューラルネットワークの学習方式 Pending JPH05159086A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3319136A JPH05159086A (ja) 1991-12-03 1991-12-03 ニューラルネットワークの学習方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3319136A JPH05159086A (ja) 1991-12-03 1991-12-03 ニューラルネットワークの学習方式

Publications (1)

Publication Number Publication Date
JPH05159086A true JPH05159086A (ja) 1993-06-25

Family

ID=18106855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3319136A Pending JPH05159086A (ja) 1991-12-03 1991-12-03 ニューラルネットワークの学習方式

Country Status (1)

Country Link
JP (1) JPH05159086A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257140A (ja) * 2009-04-23 2010-11-11 Canon Inc 情報処理装置及び情報処理方法
JP2019509550A (ja) * 2016-02-05 2019-04-04 エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. 非一貫性確率的勾配降下を使用した深層ニューラルネットワークのトレーニングの高速化

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257140A (ja) * 2009-04-23 2010-11-11 Canon Inc 情報処理装置及び情報処理方法
JP2019509550A (ja) * 2016-02-05 2019-04-04 エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. 非一貫性確率的勾配降下を使用した深層ニューラルネットワークのトレーニングの高速化

Similar Documents

Publication Publication Date Title
EP0327817B1 (en) Associative pattern conversion system and adaptation method thereof
US5448681A (en) Intelligent controller with neural network and reinforcement learning
US4914603A (en) Training neural networks
US4912647A (en) Neural network training tool
US4912655A (en) Adjusting neural networks
Zhang et al. Convergence of gradient method with momentum for two-layer feedforward neural networks
US5455890A (en) Method for structuring an expert system utilizing one or more neural networks
JPH03288285A (ja) データ処理装置の学習方法
Li et al. Fuzzy cognitive map learning based on improved nonlinear Hebbian rule
JPH05159086A (ja) ニューラルネットワークの学習方式
Dedeakayogullari et al. The determination of mean and/or variance shifts with artificial neural networks
US5239618A (en) Data processing device with network structure and its learning processing method
JPH02231670A (ja) ニューラル・ネットワークの学習装置
EP4134876A1 (en) Method and device for hebbian masked machine learning
JPH06314267A (ja) ニューラルネットワークの学習方式
USRE36823E (en) Inference rule determining method and inference device
JPH05324598A (ja) ニューラル・ネットワーク学習装置における学習方式
JP2639028B2 (ja) 神経回路の学習装置および学習方法
JPH02244255A (ja) ニユーロコンピユータ
Keerthi et al. Immediate reinforcement learning
JPH0696046A (ja) ニューラルネットワークの学習処理装置
JPH0652135A (ja) ニューラルネットワークの学習方式
Kumara et al. Neural Networks in Process Diagnostics
Lin et al. A Self-organizing Fuzzy Neural Networks
Ishibuchi et al. Learning of neural networks from linguistic knowledge and numerical data