JPH09503602A - 学習ニューラルネットワークおよびその方法 - Google Patents

学習ニューラルネットワークおよびその方法

Info

Publication number
JPH09503602A
JPH09503602A JP7510802A JP51080294A JPH09503602A JP H09503602 A JPH09503602 A JP H09503602A JP 7510802 A JP7510802 A JP 7510802A JP 51080294 A JP51080294 A JP 51080294A JP H09503602 A JPH09503602 A JP H09503602A
Authority
JP
Japan
Prior art keywords
network
weights
weight
output
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7510802A
Other languages
English (en)
Inventor
研一 弘津
ブルック,マーティン・アンソニー
Original Assignee
ジョージア・テック・リサーチ・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジョージア・テック・リサーチ・コーポレイション filed Critical ジョージア・テック・リサーチ・コーポレイション
Publication of JPH09503602A publication Critical patent/JPH09503602A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0499Feedforward networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 学習ニューラルネットワーク(30)は、ネットワーク(30)に対する所望の機能を達成するために、ネットワーク(30)の入力に与えられる重みを操作するための重み調整機構(28)内においてランダム重み変更学習アルゴリズムを実現する。重みは、初期状態から、+δまたは−δのいずれかのわずかな増分重み変更でランダムに変更される。重み変更により総ネットワーク出力が減少する場合には、誤差が増加するまで同じ重み変化が繰返される。しかしながら、総ネットワーク誤差が増加する場合には、重みは再度ランダムに変更される。前述の方法を繰返した後、ネットワーク誤差は徐々に減少してついにはおおよそゼロに達する。さらに、シフト機構(36)および乗算器(38)は重み付与機構(16)として用いられる。シフト機構(36)は、ランダム線(35)で直列に接続され、かつシフト線(44)で並列に接続される。ランダムな方向はシフト線(44)の制御下でランダム線(35)を介してシフト機構(36)を通って連続して送られるので、ニューラルネットワーク(30)内のシフト機構(36)のすべてに対してわずかに1つの乱数が発生されればよい。

Description

【発明の詳細な説明】 学習ニューラルネットワークおよびその方法 発明の分野 この発明は一般にニューラルネットワークに関し、より特定的には、特定の機 能を実現するために学習ニューラルネットワークのパラメータを調整するための 学習アルゴリズムを有する学習ニューラルネットワークに関する。 背景技術 ニューラルネットワークは、人の脳のアーキテクチャをモデルにした計算アー キテクチャである。図1に示されるように、一般的には、ニューラルネットワー ク12は、複数の入力Io〜Imを受信し、所望の関数に基づいて入力Io〜Imに 演算を行なって、複数のネットワーク出力Oo〜Opを生ずる。ニューラルネット ワーク12は、本質的に直列で動作するコンピュータとは対照的に、入力Io〜 Imを並列に処理するため、極めて高速である。構造において、ニューラルネッ トワーク12は、連続する一連の層に組織化された複数の「ニューロン」14を 含む。出力Oo〜Opに最も近い層は「出力層ニューロン」と呼ばれ、出力層ニュ ーロンの前に位置する層は「隠れ層ニューロン」と呼ばれる。 各ニューロン14は、図2に示されるアーキテクチャを一般的に含む。利用可 能な入力の任意の組合せが各ニューロン14に与えられてもよい。各ニューロン 14において、まず、ニューロン14に接続された各入力Iに重みが付与 される。一例として、図2は、出力Oqを与えるために入力Io〜Ikがニューロ ン14に入るのを示す。重み付与機構16によって入力Io〜Ikに重みWo〜Wk がそれぞれ付与されるが、ここで重み付与機構16は、単に、重みをそれぞれの 入力Iと数学的に結合させるための乗算器であってもよい。重みWo〜Wkがそれ ぞれの入力Io〜Ikに付与された後、それらの信号は図2の加算ブロック18に よって示されるように総和演算を介して数学的に組み合わされる。次に、加算ブ ロック18からの信号は、当該技術分野では「シグモイド」と呼ばれることもあ る非線形回路22に送られ、そこで、出力Oqを与えるために信号に非線形変換 が加えられる。 通常は、各ネットワーク12には、多数の重み付与機構16と、その重み付与 機構16により付与され得る多数の重み値とがある。したがって、ネットワーク 12のための所望の機能と出力の所望の組とを達成するために入力の特定の組に 付与されるべき重みを決定することは、それに伴う必要な複雑な数学的計算のた め、極めて困難である。この理由から、一定のネットワーク機能を達成するため に付与されるべき適当な重みを決定するための学習アルゴリズムまたはトレーニ ングアルゴリズムを作り出すことに対して、多大な努力が払われてきた。 一般に、学習アルゴリズムは、一連の実際のネットワーク出力Oo〜Opを、対 応する一連の所望の値Oo′〜Op ′と比較する。この一連の所望の値Oo〜Op′は、ネットワーク12の所望の 機能に基づく。図1を参照して、この比較により、誤差ブロック24で示される ように、一連の誤差Eo〜Epが発生される。さらに、誤差Eo〜Epは、最小誤差 が、所望の機能に対するネットワークの機能の最良の一致を示すことが確実にな るような方法で、通常は数学的に正にされる。この手順は、乗算ブロック25に つながる対の矢印で示されるように、数学的二乗によって達成され得る。次いで 、二乗された値は加算ブロック26で総和演算を介して数学的に組合せられて、 一連の総ネットワーク誤差ENを与える。一連のネットワーク誤差ENは次いで重 み調整機構28に送られ、重み調整機構28は、ニューロン14において各重み 変化が実現されるべき方向(各重みに対して+Dまたは−Dのいずれか)を時々 発生する。図1および図2に示されるように、方向(+Dまたは−D)は多くの 並列接続線29を介して一種の利得制御である大きさ調整機構31に送られ、大 きさ調整機構29は重み変化の大きさδを決定してこの大きさを適切な方向の符 号と結合させる。こうして、+δまたは−δの変化増分が重み16の各々に与え られる。 重み調整機構28内において用いられる周知の技術は逆誤差伝播(バックプロ パゲーション)学習アルゴリズムである。この問題については多くの教本が著さ れている。逆誤差伝播学習アルゴリズムに従うと、誤差の勾配(グラフ 上の傾斜)が各重みに関して決定され、その勾配は各重みが操作されなければな らない方向を示す。数学において、この技術は最急降下の一形式と呼ばれること もある。 しかしながら、逆誤差伝播を含む大抵の学習アルゴリズムは、複雑な乗算、加 算、および数学的導関数の発生を要する。これらの数学的演算は膨大な処理サポ ートを必要とし、特に非常に多数のニューロン14を電子回路で実装する場合に は、乗算器および加算器を実施するために多くの空間が用いられれなければなら ない。デジタル回路の直列動作を用いてサイズを低減することもできるが、これ は、処理時間を遅くし学習期間を長くする。並列アナログ回路を用いれば、学習 速度は速くなりかつ必要な面積は低減されるであろうが、しかしながら、アナロ グ回路が理想的ではないという点(オフセット、非直線性等)がこれらの学習ア ルゴリズムを期待どおりに達成することを非常に困難なものにして、学習能力の 劣化を引き起こすかまたは学習が全くなされないことさえある。逆伝播学習アル ゴリズムは、これらの理想的ではない点に対して特に影響を受けやすい。 このように、産業界においては、ニューラルネットワークと関連して用いるこ とができる学習アルゴリズムに対し、乗算のような複雑な回路を要することなく 信号処理速度および学習期間の両方を改善するという、これまでは対処がなされ てこなかった要求が存在する。 発明の概要 簡単に説明すると、この発明は、ニューラルネットワークの重みを調整するた めの方法を提供し、特定のネットワーク機能を達成するために学習ニューラルネ ットワークの対応する重みを適応的に修正するための学習アルゴリズムを有する 学習ニューラルネットワークを提供する。この方法に従うと、重みは初期状態か ら変化増分(+δまたは−δ)の分だけランダムに変更される。さらに、重みの 変更後にネットワークのネットワーク誤差が減少する場合には、ネットワーク誤 差が増加するまでその変化増分は繰返され、重みの変更後にネットワーク誤差が 増加する場合には、重みは再度ランダムに変更される。この手順は、ネットワー ク誤差がゼロに近付くまで繰返される。 前述の方法は以下のようにより特定的に記載され得る。第1の変化増分の方向 (たとえば+または−、すなわちδの極性)の組が、ネットワークのそれぞれの 第1の重みにおけるそれぞれの変化増分(δ)に対して、ランダムに、任意に選 択される。第1の重みは、それぞれの変化増分の分だけ増分され、第2の重みを 形成する。次いで、第2の重みと結合された一連のネットワーク入力から、一連 のネットワーク出力が発生される。このネットワーク出力を、このネットワーク 入力に対応する所望の出力と数学的に組合せることによって、一連のネットワー ク出力についての総ネットワーク誤差が発生される。総ネットワーク誤差の 大きさが減少する場合、第2の重みは、第3の重みを形成するために、第1の方 向にそれぞれの変化増分の分だけ再度増分されて、第3の重みと結合されたネッ トワーク入力から一連のネットワーク出力が発生される。誤差の大きさが増加し た場合には、それぞれの変化増分に対してランダムに第2の方向の組が任意に選 択され、第2の重みは第4の重みを形成するために第2の方向にそれぞれの変化 増分の分だけ増分され、第4の重みと結合したネットワーク入力からネットワー ク出力が発生される。 この発明の別の特徴に従うと、重み変更のための方向はネットワーク内のさま ざまな重み機構に乱数を順次シフトすることによって発生でき、その乱数(たと えば、+1または−1のいずれかのランダムな選択)を重み変更の方向を指定す るために用いる。 この発明の利点は、信号処理速度、学習期間、および能力が先行技術の実施例 に対して改善されるという点である。 この発明の別の利点は、新規な学習アルゴリズムが複雑な乗算回路なしに実現 でき、電子回路内での容易な実現と、それを実現するために必要な空間の低減と をもたらすという点である。 この発明の別の利点は、ネットワーク内の重み機構の各々に順次シフトされる 、重み変更のための方向を示す1つの乱数を発生することによって、処理回路を 最小限にするという点である。 この発明の別の利点は、非線形または線形のいずれかも知れずかつ複雑度がど のようなものかわからない未知のプラントを効率的かつ正確に制御するために学 習ニューラルネットワークが利用され得るという点である。 この発明の他の目的、特徴、および利点は、以下の図面および詳細な説明を考 察すれば、当業者には明らかとなるであろう。 図面の簡単な説明 この発明は以下の図面を参照するとよりよく理解され得る。図面は必ずしも尺 度決めされてはおらず、代わりに、この発明の原理を明確に説明することに重点 が置かれている。 図1は、ニューラルネットワーク内の重みを調整するための学習アルゴリズム を実現するための重み調整機構を有する、従来の学習ニューラルネットワークの ブロック図であり、 図2は、図1のニューロンのブロック図であり、 図3は、この発明に従う学習ニューラルネットワークのブロック図であり、 図4は、従来の逆誤差伝播学習アルゴリズムをこの発明のランダム重み変更学 習アルゴリズムと比較する三次元グラフであり、 図5は、図3のニューロンのブロック図であり、 図6は、図5の重み付与機構のブロック図であり、 図7は、未知のプラントが学習ニューラルネットワークによって制御される、 図3の学習ネットワークに対する適用例のブロック図である。 好ましい実施例の詳細な説明 いくつかの図を通して同じ参照番号は対応する部分を示すが、これら図を参照 すると、図3は、この発明に従う新規なランダム重み変更学習アルゴリズムを実 現する新規な学習ニューラルネットワーク30を示す。学習ニューラルネットワ ーク30は、複数の入力Io〜Imと、重み調整機構28を介して操作される複数 の重みWo〜Wpとの結合から複数の出力Oo〜Opを発生するための複数の学習ニ ューロン14′を含む。ニューラルネットワーク30はどのような数のニューロ ン層を含んでもよい。さらに、利用可能な入力の任意の組合せが各ニューロン1 4に与えられてもよい。言換えれば、図3に示される第1の層における各ニュー ロン14は入力Io〜Imのどのような組合せを受信してもよく、各外側層ニュー ロン14は隠れ層ニューロンからのニューロン出力のどのような組合せを受取っ てもよい。さらに、ブロック24に示されるようにそれぞれの誤差Eo〜Epを発 生するために、出力Oo〜Opの各々はそれぞれの所望の出力Oo′〜Op′と比較 される。これらの誤差Eo−Epは次いでブロック25で示されるように数学的に 二乗され、結果として生じた二乗誤差は次いで加算ブロック26に示されるよう にともに加算されて、 一連の入力Io〜Imから一連の誤差EN′を発生する。 学習ニューラルネットワーク30において、重み調整機構28′は、時間遅延 機構(T)32と、累積機構33と、比較器(C)34とを含む。累積機構33 は一連の誤差EN′を累積して分析のための総ネットワーク誤差ENを発生する。 累積機構33はなくても良いが、それはある時間的期間にわたる複数の入力/出 力関係に基づいて重みの調整を可能にするため、学習ニューラルネットワーク3 0の学習を促進するという点で好ましい。さらに、時間遅延機構32は総ネット ワーク誤差ENを受取る。比較器34は、総ネットワーク誤差ENと、時間遅延機 構32からの時間遅延出力とを比較して、重みの操作後にネットワーク誤差EN が増加したか減少したかを判断する。この情報は次いで学習ニューロン14′に 送られ、それは次いで正の極性または負の極性のいずれかを有する重み変化δを 供給する。重み変化δの極性は、重みが変更される方向を特定する。 重要なことは、この発明のランダムな重み変更学習アルゴリズムに従うと、重 みはまずそれらの初期状態から+δまたは−δのいずれかのわずかな増分重み変 化の分だけランダムに変更される。ランダムな重み変更方向(+Dまたは−D) は、図3の参照番号35によって示されるように学習ニューロン14′に供給さ れる。この文書の文脈においては、「ランダムな」選択とは、真にランダムな選 択、擬似ランダム選択、または、集合内の、他の選択されなか った値と比較して、ほぼ等しい選択の確率を有する、その集合内のある新しい値 を任意に特定することを特徴とする任意の他の選択を示す。さらに、前の重み変 更の実施後に総ネットワーク誤差ENが減少した場合には、誤差ENが増加するま で同じ重み変更が繰返される。しかしなから、総ネットワーク誤差ENが増加し た場合には、重みは再度ランダムに変更される。前述の方法を繰返した後、出力 誤差ENおよび誤差Eo〜Epは徐々に減少して最終的には0に近付く。 この発明のランダムな重み変更学習アルゴリズムは以下のように数学的に表わ すことができる。 Wij(n+1)=Wij(n)+ΔWij(n+1) E(n+1)< E(n)のとき、ΔWij(n+1)=ΔWij(n) E(n+1)≧ E(n)のとき、ΔWij(n+1)=δ*Rand(n) (Rand(n):2つの状態±1のみ有する確率関数) ここで、Wijはj番目の層にあるi番目の重みを表わし、Eは総ネットワーク誤 差を表わす。上の等式は、ともに図3の、比較器34と組合された時間遅延機構 32によって実現される。 図4は、従来の逆誤差伝播学習アルゴリズムと、この発明のランダム重み変更 学習アルゴリズムとの比較を示す。逆誤差伝播学習アルゴリズムでは、動作点は 、ニューラルネットワーク12に対応する総ネットワーク誤差曲線の最も急な傾 斜に沿って下に進む。重み変更のための方向は、 総ネットワーク誤差曲線Eの勾配に対応する。対照的に、この発明のランダム重 み変更学習アルゴリズムでは、動作点は、急な傾斜にそって真っ直ぐ降下するの ではなく、総ネットワーク誤差曲線E上を上下するか、統計的かつ究極的には、 動作点は、誤差がゼロである正しい答えに降下する。本質的に、ギザギザの動作 曲線に沿った方向の各変更は、新しいランダムな方向の発生を表わす。 図4から明らかなように、この発明のランダム重み変更学習アルゴリズムは、 逆誤差伝播学習アルゴリズムほど効率的ではない。しかしながら、ランダム重み 変更学習アルゴリズムは、アナログ回路においてはオフセット等の理想的でない 点を引き起こし、かつデジタル回路においてはさらなる複雑さをもたらす乗算器 を必要としない。さらに、わずかに2つの重み変更の状態+δ、−δ値しか有さ ない重み更新のための非常に単純な回路が利用可能である。最後に、ランダム重 み変更学習アルゴリズムは、いずれの特定のネットワーク構造も必要としない。 ゆえに、いくらかの効率性を犠牲にすることによって、前述の重要な利点がこの 発明において実現される。 図5は、ランダムに発生される重み変更を最も有利に利用するための学習ニュ ーロンアーキテクチャを示す。図5に示されるように、各重み付与機構16は、 シフト機構36と乗算器38とを含む。シフト機構36は乗算器38に重みを与 え、乗算器38は、その重みを、入力Ix(xは Io…Ik…Imのいずれか)と数学的に結合する。さらに、シフト機構36は、 ランダム線35を介して直列に接続され、かつシフト線44を介して並列に接続 される。好ましくは、各ニューロン14′に関して実質的に真の乱数発生を達成 するよう、ランダム線35は、図3に示すように、ニューロン層を通して逆方向 順に(外側層から内方へ向かって隠れ層の方向へ)接続される。図5を参照して 、動作において、ランダムに発生された方向は、学習ニューロン14′に入力さ れ、シフト線44の制御下でランダム線35を介した直列接続に沿ってシフト機 構36からシフト機構36へ送られる。上述の構成では、一度に1つだけのラン ダムな方向が発生されればよいので、シフト機構36の各々に対してランダムな 方向を発生する必要をなくし、それによって処理回路を最小限にする。 シフト機構36は、図6にさらに詳細に示される。図6を参照して、シフト機 構36は、ランダム線35からランダムな方向を受取りかつシフト線44からシ フト制御信号を受取るためのシフトレジスタ48を含む。シフト機構36は、ラ ンダム線35により特定される増分重み変化(+δまたは−δのいずれか)をシ フトレジスタ48から受取るための加算ブロック52をさらに含む。加算ブロッ ク52はその増分重み変化を現在の重みWと組合せて線46に重みを与え、その 重みは対応する入力Iと結合される。シフトレジスタ48がシフト線44上でパ ルスを受取らない 場合には、重みWは同じ方向(+または−のいずれか)に同じ重み変化δの分だ け変更される。しかしながら、シフトレジスタ48がシフト線44上でパルスを 受取った場合には、別のランダムな方向が方向線35を介してシフトレジスタ4 8に送られ、δに対する新しい方向が加算ブロック52に、および究極的には入 力Iに送られる。 図7は、未知のプラント56を制御するために学習ニューラルネットワーク3 0が用いられる、学習ニューラルネットワーク30のための可能な適用例55を 示す。この文書において、未知のプラント56は、出力が入力により制御される 任意のシステムまたは装置として定義される。さらに、未知のプラント56は、 非線形または線形であってもよく、かつ複雑度がどようなものかわからなくとも よい。 図7の実施例において、未知のプラント56はネットワーク30の出力Oo〜 Opに直接接続される。一般に、出力Oo〜Opは未知のプラント56を直接制御 し、入力Io〜Imはニューラルネットワーク30による入力Io〜Imの操作後に 未知のプラント56を間接的に制御する。入力Io〜Imは、遅延ブロック58を 用いて、異なる時間期間だけ遅延される。実際の入力および遅延された入力は学 習ニューラルネットワーク56に与えられ、各入力は専用の重み付与機構16( 図2)を有する。同様に、図示されるように、未知のプラントの出力Oo〜Opお よび所 望のプラント出力O′o〜O′pは、遅延ブロック58を介して、いくつかの異な る時間期間の分だけ遅延される。さらに、実際の出力Oo〜Opと、所望のプラン ト出力O′o〜O′pと、遅延された実際の出力と、遅延された所望の出力とが学 習ニューラルネットワーク30により用いられて総誤差信号EN′(図3)を発 生する。ネットワーク30は次いでこの誤差信号EN′を用いて重み更新を制御 する。学習ニューラルネットワーク30は非線形関数および線形関数を学習でき るため、図7の適用例55は、学習ニューラルネットワーク30が幅広いさまざ まな未知のプラント56を制御するのに用いられ得ることを示す。 最後に、この発明の精神および範囲から実質的に逸脱することなく、上述の好 ましい実施例に多くの変更がなされてもよいことは、当業者には明らかである。 したがって、すべてのそのような変更は、以下の請求の範囲に述べられる、この 発明の範囲内に含まれることが意図される。
───────────────────────────────────────────────────── 【要約の続き】 対してわずかに1つの乱数が発生されればよい。

Claims (1)

  1. 【特許請求の範囲】 ゆえに、以下が請求される: 1. ニューラルネットワークにおいて重みを調整する計算の複雑さを最小限に するための方法であって、 重みを初期状態から変化増分の分だけランダムに変更するステップと、 重みを変更した後にネットワークのネットワーク誤差が減少する場合には、ネ ットワーク誤差が増加するまで変化増分を繰返すステップと、 重みの変更後にネットワーク誤差が増加する場合には、重みを再度ランダムに 変更するステップとを含む、ニューラルネットワークにおいて重みを調整する計 算の複雑さを最小限にするための方法。 2. 前記ネットワークでプラントを制御するステップをさらに含む、請求項1 に記載の方法。 3. ニューラルネットワークにおいて重みを調整する計算の複雑さを最小限に するための方法であって、 (a) ネットワークのそれぞれの第1の重みにおけるそれぞれの変化増分の ための第1の方向を任意に選択するステップと、 (b) 第2の重みを形成するために、前記第1の重みを前記それぞれの変化 増分の分だけ増分するステップと、 (c) 前記第2の重みと結合されたネットワーク入力からネットワーク出力 を発生するステップと、 (d) 前記ネットワーク出力を、前記ネットワーク入力に対応する所望の出 力と数学的に結合することによって、前記ネットワーク出力に関連する誤差を発 生するステップと、 (e) 前記誤差の大きさが減少する場合に、 (i) 第3の重みを形成するために、前記第2の重みを前記第1の方向に 前記それぞれの変化増分の分だけ再度増分するステップと、 (ii) 前記第3の重みと組合されたネットワーク入力からネットワーク出 力を発生するステップと、さらに、 (f) 前記誤差の大きさが増加する場合に、 (i) 前記それぞれの変化増分に対して第2の方向を任意に選択するステ ップと、 (ii) 第4の重みを形成するために、前記第2の重みを前記第2の方向に 前記それぞれの変化増分の分だけ増分するステップと、 (iii) 第4の重みと組合されたネットワーク入力からネットワーク出力 を発生するステップとを含む、ニューラルネットワークにおいて重みを調整する 計算の複雑さを最小限にするための方法。 4. 前記誤差は、前記所望される出力と前記ネットワーク出力との間の差の二 乗の総和を累積することによって発生される、請求項3に記載の方法。 5. 前記誤差は、前記所望される出力と前記ネットワーク出力との間の差の絶 対値を計算することによって発生される、請求項3に記載の方法。 6. 前記誤差は、前記所望される出力と前記ネットワーク出力とを数学的に結 合することによって正の数を計算することにより発生される、請求項3に記載の 方法。 7. 前記第1および第2の方向を選択するために乱数発生器を用いるステップ をさらに含む、請求項3に記載の方法。 8. 前述の請求項1から請求項7のいずれかの方法を実行するためのニューラ ルネットワーク。 9. ネットワーク出力を達成するために、ニューラルネットワークにおいてネ ットワーク入力に付与されるべき重みを学習するためのシステムであって、 ネットワークのそれぞれの重みにおけるそれぞれの変化増分に対する方向の第 1の組を任意に選択するための手段と、 前記重みを前記それぞれの変化増分の分だけ増分するための手段と、 ネットワーク入力と前記重みとからネットワーク出力を発生するための手段と 、 前記ネットワーク出力を、前記ネットワーク入力に対応する所望の出力と数学 的に結合することによって、前記ネットワーク出力に関連する誤差を発生するた めの手段と、 前記誤差が減少したとき、および前記誤差が増加したときを判断するための学 習手段とを含み、 前記誤差が減少する場合に、前記学習手段は、新しい重みを形成するために前 記重みを前記方向の第1の組に前記それぞれの変化増分の分だけ増加させ、ネッ トワーク入力と前記新しい重みとからネットワーク出力を発生し、 前記誤差が増加する場合に、前記学習手段は、前記それぞれの変化増分に対す る方向の第2の組を任意に選択し、前記新しい重みを形成するために前記重みを 前記それぞれの変化増分の分だけ前記方向の第2の組に増加し、ネットワーク入 力と前記新しい重みとからネットワーク出力を発生する、ネットワーク出力を達 成するためにニューラルネットワークにおいてネットワーク入力に付与されるべ き重みを学習するためのシステム。 10. 請求項9のシステムを含む集積回路。 11. 重みをネットワーク値と結合する複数の重み機構を有するニューラルネ ットワークのため、計算の複雑さを最小限にしかつ計算速度を増大させながら重 みを発生するための方法は、 乱数を発生するステップと、 乱数を複数の重み機構の各々に順次与えるステップと、 乱数に基づいて、それぞれの重み機構で重みに対する極性を発生させるステッ プと、 前記極性をそれぞれの大きさと結合させることによって、 それぞれの重み機構で重みを発生するステップとを含む、計算の複雑さを最小限 にしかつ計算速度を増大させながら重みを発生するための方法。 12. 前記ネットワークは複数のニューロン層を含み、ネットワークを通るデ ータフローの方向と実質的に逆方向に当該層を通して乱数を伝播するステップを さらに含む、請求項11に記載の方法。 13. 乱数をネットワークの出力層からネットワークの入力層へ向かう方向に 移動させるステップをさらに含む、請求項11に記載の方法。 14. ネットワーク入力を受信しネットワーク出力を発生するための複数のニ ューロンを有し、ネットワーク入力を増分によって修正するための複数の重み機 構を有する前記ニューラルネットワークにおける、計算速度を増大させる一方で 複雑さを最小限にするための改良であって、前記改良は前記複数の重み機構にラ ンダムコードを順次送るためのシフトレジスタ手段を含み、前記ランダムコード は、変化増分の方向を指定し、それを受取ると前記重み機構の各々に変化増分の 方向を実現させるためのものである、改良。 15. ランダムコードを発生し、ランダムコードを前記シフトレジスタ手段に 送るための乱数発生器をさらに含む、請求項14に記載の改良。 16. 前記重み機構は、重みとネットワーク入力とを結 合するよう構成される乗算器を各々が含む、請求項14に記載の改良。 17. ネットワーク出力に接続され、ネットワーク出力により制御されるプラ ントをさらに含む、請求項14に記載の改良。 18. 各々が重みをネットワーク値と数学的に結合するための複数の重み手段 と、 ランダムな方向を発生するための手段と、 前記複数の重み手段にランダムな方向を連続して与えるためのシフト手段とを 含む、ニューラルネットワーク。 19. ネットワークの出力に接続され、ネットワークにより制御されるプラン トをさらに含む、請求項18に記載のネットワーク。
JP7510802A 1993-10-04 1994-07-27 学習ニューラルネットワークおよびその方法 Pending JPH09503602A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/131,121 1993-10-04
US08/131,121 US5455891A (en) 1993-10-04 1993-10-04 System and method for a learning neural network for generating random directions for weight changes
PCT/US1994/008512 WO1995010087A1 (en) 1993-10-04 1994-07-27 Learning neural network and methods thereof

Publications (1)

Publication Number Publication Date
JPH09503602A true JPH09503602A (ja) 1997-04-08

Family

ID=22447975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7510802A Pending JPH09503602A (ja) 1993-10-04 1994-07-27 学習ニューラルネットワークおよびその方法

Country Status (7)

Country Link
US (1) US5455891A (ja)
EP (1) EP0722587A1 (ja)
JP (1) JPH09503602A (ja)
KR (1) KR960705277A (ja)
CN (1) CN1132562A (ja)
CA (1) CA2172608A1 (ja)
WO (1) WO1995010087A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6061673A (en) * 1996-11-06 2000-05-09 Sowa Institute Of Technology Co., Ltd. Learning methods in binary systems
JP2002024199A (ja) * 1998-02-20 2002-01-25 Souwa Kenkyusho:Kk 二値システムの学習方法
US6721503B1 (en) * 1998-08-26 2004-04-13 Georgia Tech Research Corporation System and method for bi-directional optical communication using stacked emitters and detectors
US6424961B1 (en) 1999-12-06 2002-07-23 AYALA FRANCISCO JOSé Adaptive neural learning system
US6678853B1 (en) * 1999-12-17 2004-01-13 Hewlett-Packard Development Company, L.P. Method and apparatus for generating random code
US20050240311A1 (en) * 2002-03-04 2005-10-27 Herschel Rabitz Closed-loop apparatuses for non linear system identification via optimal control
US20030220889A1 (en) * 2002-05-21 2003-11-27 Bingxue Shi Analog accumulator for neural networks
US20040128081A1 (en) * 2002-12-18 2004-07-01 Herschel Rabitz Quantum dynamic discriminator for molecular agents
JP2007504576A (ja) * 2003-01-17 2007-03-01 アヤラ,フランシスコ,ジェイ 人工知能を開発するためのシステム及び方法
US7493295B2 (en) * 2003-01-17 2009-02-17 Francisco J. Ayala Method, system and computer program for developing cortical algorithms
JP4773680B2 (ja) * 2003-08-07 2011-09-14 ソニー株式会社 情報処理装置および方法、プログラム記録媒体、並びにプログラム
US20060271305A1 (en) * 2005-02-25 2006-11-30 The Trustees Of Princeton University Optimal dynamic discrimination of similar molecular scale systems using functional data
US7711582B2 (en) * 2006-04-17 2010-05-04 General Electric Company Remote health application for the optimization of remote site visit frequency
JP5816771B1 (ja) * 2015-06-08 2015-11-18 株式会社Preferred Networks 学習装置ユニット
CN105877931B (zh) * 2016-05-24 2017-08-04 巢湖学院 一种四自由度并联减振担架平台
CN107203662A (zh) * 2017-05-11 2017-09-26 北方工业大学 一种电子设备舱室的温度预测模型建立方法及装置
JP6925911B2 (ja) * 2017-08-30 2021-08-25 株式会社日立製作所 機械学習装置及び機械学習方法
US11138501B2 (en) * 2018-02-22 2021-10-05 International Business Machines Corporation Hardware-implemented training of an artificial neural network
US11494625B2 (en) 2018-10-03 2022-11-08 Maxim Integrated Products, Inc. Systems and methods for energy-efficient analog matrix multiplication for machine learning processes
CN115803754A (zh) * 2020-03-10 2023-03-14 艾普半导公司 用于在神经网络中处理数据的硬件架构

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57194621A (en) * 1981-05-26 1982-11-30 Nec Corp Random number generator
EP0579341A2 (en) * 1989-02-23 1994-01-19 Matsushita Electric Industrial Co., Ltd. Learning machine with multi-input single output circuits connected in hierarchical structure
US5324991A (en) * 1989-07-12 1994-06-28 Ricoh Company, Ltd. Neuron unit and neuron unit network
US5075868A (en) * 1989-09-18 1991-12-24 The United States Of America As Represented By The Secretary Of The Navy Memory modification of artificial neural networks
US5214746A (en) * 1991-06-17 1993-05-25 Orincon Corporation Method and apparatus for training a neural network using evolutionary programming
US5258903A (en) * 1991-12-16 1993-11-02 Thomson Consumer Electronics Control circuit and power supply for televisions

Also Published As

Publication number Publication date
US5455891A (en) 1995-10-03
WO1995010087A1 (en) 1995-04-13
CN1132562A (zh) 1996-10-02
KR960705277A (ko) 1996-10-09
CA2172608A1 (en) 1995-04-13
EP0722587A4 (en) 1996-05-14
EP0722587A1 (en) 1996-07-24

Similar Documents

Publication Publication Date Title
JPH09503602A (ja) 学習ニューラルネットワークおよびその方法
Hagan et al. Training feedforward networks with the Marquardt algorithm
Castillo et al. Some applications of functional networks in statistics and engineering
US5056037A (en) Analog hardware for learning neural networks
US5704016A (en) Temporal learning neural network
JPH0713950A (ja) 人工ニューロンおよびその使用方法
WO1991014226A1 (en) Neuro-fuzzy fusion data processing system
US5473730A (en) High efficiency learning network
Buckley et al. Solving fuzzy equations using evolutionary algorithms and neural nets
JP3345478B2 (ja) ニューラルネットワーク装置およびその学習方法
KR20200076083A (ko) 오류 역전파를 이용하여 지도 학습을 수행하는 뉴로모픽 시스템
Liu et al. Learning with multi-objective criteria
US5680516A (en) Multiple pulse series generating device and method applicable to random pulse series generating apparatus
JP2760170B2 (ja) 学習機械
Lin et al. A wavelet-based neuro-fuzzy system and its applications
EP0661645A2 (en) Neural network
Mezghani et al. Multimodel control of discrete systems with uncertainties
JP3262340B2 (ja) 情報処理装置
Goryn et al. Conjugate gradient learning algorithms for multilayer perceptrons
WO2024141751A1 (en) Analog neural network
JPH03167655A (ja) ニューラルネットワーク
Hines A logarithmic neural network architecture for a PRA approximation
EP0391404B1 (en) Data processing system
Patyra et al. Processing of incomplete fuzzy data using artificial neural networks
Sivakumar et al. A modified BPTT algorithm for trajectory learning in block-diagonal recurrent neural networks