JPH11134314A - 簡略化準ニュートン射影法演算システム、神経回路網学習システム、記録媒体および信号処理装置 - Google Patents

簡略化準ニュートン射影法演算システム、神経回路網学習システム、記録媒体および信号処理装置

Info

Publication number
JPH11134314A
JPH11134314A JP9294445A JP29444597A JPH11134314A JP H11134314 A JPH11134314 A JP H11134314A JP 9294445 A JP9294445 A JP 9294445A JP 29444597 A JP29444597 A JP 29444597A JP H11134314 A JPH11134314 A JP H11134314A
Authority
JP
Japan
Prior art keywords
equation
processing
matrix
vector
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9294445A
Other languages
English (en)
Other versions
JP3733711B2 (ja
Inventor
Masahiko Tateishi
雅彦 立石
Kazutoshi Koyanagi
一敏 小柳
Yuji Ito
裕司 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP29444597A priority Critical patent/JP3733711B2/ja
Publication of JPH11134314A publication Critical patent/JPH11134314A/ja
Application granted granted Critical
Publication of JP3733711B2 publication Critical patent/JP3733711B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】 【課題】 デジタル式演算装置の固定小数点演算による
準ニュートン射影法にて神経回路網の学習等を行う場合
に、計算時間を短く、メモリの消費量も小さく、かつ計
算結果が正確になる簡略化準ニュートン射影法演算シス
テム等の提供。 【解決手段】 本学習処理では、計算上、4つの簡略化
を行っている。そして、この4つの簡略化は、神経回路
網のシナプス荷重wに上下限を設定するに際して、制約
条件の係数ベクトルaiが、第li要素が−1または1で
あり、他の要素が全て0の1行M列の行ベクトルである
との制約のもとに、初めて得られる。例えば、ステップ
S240にて式1に示すごとくで簡略化される。 【数1】

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、簡略化準ニュート
ン射影法演算システム、このシステムを利用した神経回
路網学習システム、これらのシステムをコンピュータシ
ステム上で実現するプログラムを記録した記録媒体、お
よび信号処理装置に関する。
【0002】
【従来の技術】神経回路網(ニューラルネットワークと
も言う。)は、パターン認識やデータ処理等に広く応用
されている。この神経回路網は、繰り返し行われる学習
処理によりその処理能力を獲得するものであり、迅速な
学習と学習処理後に獲得される能力向上のために、シナ
プス荷重の変更方法がいくつか提案されている。
【0003】神経回路網はユニットからなる入力層、中
間層、出力層と各層間を結合するシナプスから構成され
る。各シナプスはシナプス荷重という重みを持ち、この
シナプス荷重を学習により変えることで様々な入出力特
性を実現できる。以下シナプスの総数をMとし、各シナ
プス荷重をw1,w2,…wMとする。また、w=[w1
2,…wMtで表す。
【0004】神経回路網の学習は、教師入力信号を神経
回路網に入力したときの神経回路網出力信号を計算し、
この出力信号と教師出力信号と比較し、比較結果に基づ
いて各シナプス荷重w1,w2,…,wMを変更して、教
師出力信号と神経回路網出力信号との誤差、例えば、自
乗誤差和E(w)が最小になるようにする処理である。
【0005】一般に最小値はたとえばバックプロパゲー
ション法(McClelland,J.L.,Rumelhart,D.E., and the
PDP Research Group, Parallel Distributed Processin
g: Explorations in the Microstructure of Cognitio
n, MIT Press, Chapter 8, 1986)などの降下法によっ
て計算する。
【0006】このバックプロパゲーション法の計算ステ
ップを説明する。ここで、kは更新回数、kmaxは更新
回数の上限である。また降下法の模式図を図8(a)に
示す。(厳密に言うと、以下のステップで求まるのは最
小値ではなく極小値であるが、以下の説明において本質
的な違いをもたらすものではない。) ステップ1:k=0として、神経回路網のシナプス荷重
に初期値wkを設定する。
【0007】ステップ2:wkにおけるE(wk)の勾配
∇E(wk)を計算する。∇E(wk)=0ならステップ
4に飛ぶ。 ステップ3:E(wk+1)<E(wk)を満たす新たな点
k+1を見つける。そしてwkにwk+1の値を設定して新
たなwkとして、k<kmaxならステップ2に戻る。k=
maxなら、ステップ4に移る。
【0008】ステップ4:wkを解とする。 図8(a)の例では誤差曲面301において、初期値w
0を与えたときの学習の進行する様子を示す。ここでは
k回更新後の値wkにおいて最小値に収束している。
【0009】しかし適用事例によっては最小値が空間の
無限遠に存在するものがある。このような事例の学習を
行なうと、一部のシナプス荷重の絶対値がたとえば10
00を超えて増大し続ける。その例を図8(b)に示
す。このような神経回路網はシナプス荷重のダイナミッ
クレンジが大きく、デジタル式演算装置の浮動小数点演
算では正しい入出力特性が得られるが、固定小数点演算
では大きな量子化誤差が発生し所望の入出力特性が得ら
れない。民生品ではコスト削減等の理由で固定小数点C
PUを用いるので、シナプス荷重が過大になるような神
経回路網を組み込んで使用することはできない。
【0010】例えば、語長16ビットの固定小数点演算
で神経回路網を計算する場合を考える。[sxxxxx
xx.xxxxxxxx]は小数部に8ビットを割り当
てたデータ型を示す。sは符号ビット、xは数値データ
を表すビットである。このデータ型で表現できる数の精
度は「1/28=0.00390625」であり、範囲
は[−216-1/28,(216-1−1)/28]=[−12
8,127.99609375]である。
【0011】神経回路網を固定小数点演算で実現する場
合、シナプス荷重w=[w12… wMtを固定小数
点データ型で表現する。データ型は各シナプス荷重の絶
対値の最大値により決まる。たとえばその値が1000
であるとすると、その格納のため整数部は10ビット必
要となり、小数部は5ビットしか取れない。すなわち、
[sxxxxxxxxxx.xxxxx]となる。この
精度は「1/25=0.03125」であり、範囲は
[−216-1/25,(216-1−1)/25]=[−102
4,1023.96875]である。これでは演算精度
を低下させ、量子化誤差が増大する原因となる。
【0012】上述した量子化誤差を低減させる方法とし
て、バックプロパゲーション法にてシナプス荷重に上下
限を設けて、学習させる方法が知られている(特開平7
−152716号公報,特開平7−44515号公報,
特開平2−143384号公報)が、バックプロパゲー
ション法の特質から計算速度を高める各種の工夫が困難
であり計算速度は不十分なものであった。
【0013】この他に、シナプス荷重の絶対値増大を抑
制する方法としては、ペナルティ関数法がある(Michae
l A.Arbib, The Handbook of Brain Theory and Neural
Networks, MIT Press,p643,p992)。これはG(w)=
E(w)+μ×F(w)で定義された自乗誤差和E
(w)と各シナプスの自乗の関数であるペナルティ項F
(w)の和で定義される関数G(w)を最小化する方法
である。係数μはE(w)とF(w)との相対的な重要
度を決めるパラメーターである。
【0014】しかしながらペナルティ関数法ではパラメ
ーターμを試行錯誤により設定しなければならないとい
う問題があり、適切な解が得られるまでに長時間を要し
た。
【0015】
【発明が解決しようとする課題】上述した問題を生じな
い方法として、シナプス荷重の絶対値に上限を設定し、
その上限を超えない範囲で学習を行なうことが考えられ
る。その実現には準ニュートン射影法であるGoldf
arb(コールドファーブ)法が利用できる(たとえば
今野 浩、山下 浩、非線型計画法、日科技連、p.264-26
7)。
【0016】しかしながらGoldfarb法は一般化
逆行列等の複雑な計算が必要なため、プログラミングが
困難であった。また一般化逆行列等の計算時間は長く、
計算に用いる作業用メモリ領域としてかなり大きなもの
が必要であった。別の問題として、一般化逆行列の計算
は桁落ち等の数値解析上の問題により、デジタル式演算
装置では正確な計算ができないことがあり、その現象が
生じた場合、計算結果が不正確になるという問題があっ
た。
【0017】本発明は、デジタル式演算装置の固定小数
点演算による準ニュートン射影法にて神経回路網の学習
等を行う場合に、計算時間を短く、メモリの消費量も小
さく、かつ計算結果が正確になる簡略化準ニュートン射
影法演算システムを提供すること、更にこの簡略化準ニ
ュートン射影法演算システムを利用した神経回路網学習
システム、これらのシステムをコンピュータシステム上
で実現するプログラムを記録した記録媒体および前記神
経回路網学習システムによる学習処理により得られた神
経回路網を組み込んだ信号処理装置の提供を目的とする
ものである。
【0018】
【課題を解決するための手段及び発明の効果】本発明の
簡略化準ニュートン射影法演算システムは、固定小数点
演算を行うデジタル式演算装置を用いて、式1にて表さ
れ式2の制約条件を満たすM個の変数wからなる関数E
(w)が最小値となる変数wの解を求めるに際して、基
本的には前述した準ニュートン射影法を用いている。
【0019】すなわち、直線探索を行って、関数E
(w)の値を小さくする変数wの値を求める第1処理手
段と、前記第1処理手段の処理の次に行われ、新しい変
数wの値に基づく前記式2の新しい制約条件が有効にな
ったら、新たに有効になった制約条件の係数ベクトルa
rを、制約条件が有効である係数ベクトルから構成され
ている行列Aqに加え、かつ前記関数E(w)の勾配を
表す転置行列∇tE(w)から前記関数E(w)の変化
方向を表すベクトルdを求めるためのヘシアンHを式3
により更新して処理を前記第1処理手段に戻し、新しい
変数wの値に基づく新しい制約条件が有効にならなかっ
たら、新しいヘシアンHを作成するための公式にて、新
たなヘシアンHを更新して処理を前記第1処理手段に戻
す第2処理手段と、前記第1処理手段にて、前記転置行
列∇tE(w)と前記ヘシアンHとの積に基づいて得ら
れる前記関数E(w)の変化方向を表すベクトルdがゼ
ロとなった場合には、式4に基づいて行列で得られるラ
グランジュ乗数λの要素すべてが非負ならば、そのとき
のwを解として得て全処理を終了し、前記ベクトルdが
ゼロでない場合には、ラグランジュ乗数λの負の要素の
内、絶対値が最大のものに対応する制約条件の係数ベク
トルasを、前記行列Aqから除いて、式5に基づいてヘ
シアンHを更新して処理を第1処理手段に戻す第3処理
手段と、を備えることにより、準ニュートン射影法によ
る演算を行っている。
【0020】この準ニュートン射影法による処理におい
て、1〜Mの整数の内、相異なるq個の整数を要素とす
る集合Icを式6に示すごとく表し、各li(i=1,
2,…,q)に対して1行M列のベクトルで、第li
要素がcliであり他の要素がすべて0、かつcliが+1
または−1で定義されるベクトルを式7の記号で表し、
更にq行M列の行列Aqを式8に示すごとく表した場合
に、前記式4の計算の内、式9にて表す行列の計算の代
わりに、m∈Icならばbm=1、m∈Icでないならば
m=0である関数bmを対角要素とする対角行列dia
g[b12 …bM]の計算を用いることとして、準
ニュートン射影法を簡略化している。
【0021】
【数6】
【0022】この簡略化により、式9に示す一般化逆行
列の計算をしなくて済む。したがって、計算時間が長く
ならず、計算に用いる作業用メモリ領域も小さくて済
む。更に、桁落ち等の数値解析上の問題が生じないの
で、正確な計算ができる。また同様に、直線探索を行っ
て、関数E(w)の値を小さくする変数wの値を求める
第1処理手段と、前記第1処理手段の処理の次に行わ
れ、新しい変数wの値に基づく前記式12の新しい制約
条件が有効になったら、新たに有効になった制約条件の
係数ベクトルarを、制約条件が有効である係数ベクト
ルから構成されている行列Aqに加え、かつ前記関数E
(w)の勾配を表す転置行列∇tE(w)から前記関数
E(w)の変化方向を表すベクトルdを求めるためのヘ
シアンHを式13により更新して処理を前記第1処理手
段に戻し、新しい変数wの値に基づく新しい制約条件が
有効にならなかったら、新しいヘシアンHを作成するた
めの公式にて、新たなヘシアンHを更新して処理を前記
第1処理手段に戻す第2処理手段と、前記第1処理手段
にて、前記転置行列∇tE(w)と前記ヘシアンHとの
積に基づいて得られる前記関数E(w)の変化方向を表
すベクトルdがゼロとなった場合には、式14に基づい
て行列で得られるラグランジュ乗数λの要素すべてが非
負ならば、そのときのwを解として得て全処理を終了
し、前記ベクトルdがゼロでない場合には、ラグランジ
ュ乗数λの負の要素の内、絶対値が最大のものに対応す
る制約条件の係数ベクトルasを、前記行列Aqから除い
て、式15に基づいてヘシアンHを更新して処理を第1
処理手段に戻す第3処理手段と、を備えることにより、
準ニュートン射影法による演算を行うに際して、次のよ
うな処理としても良い。
【0023】すなわち、ヘシアンHの第i行第j列の要
素をhijで表し、全ての制約条件における各係数ベクト
ルarの第r要素が+1または−1であり、他の要素が
すべて0であるとして表すことで、前記式13の計算の
内、式16にて表す行列の計算の代わりに、第i行第j
列の要素が式17で表されるM行M列の行列の計算を用
いることを特徴とするものである。
【0024】
【数7】
【0025】この簡略化により、5回の行列の乗算が必
要な式16が、式17のごとく簡略化される。したがっ
て、計算時間が長くならず、計算に用いる作業用メモリ
領域も小さくて済む。更に、桁落ち等の数値解析上の問
題が生じないので、正確な計算ができる。
【0026】また同様に、直線探索を行って、関数E
(w)の値を小さくする変数wの値を求める第1処理手
段と、前記第1処理手段の処理の次に行われ、新しい変
数wの値に基づく前記式22の新しい制約条件が有効に
なったら、新たに有効になった制約条件の係数ベクトル
rを、制約条件が有効である係数ベクトルから構成さ
れている行列Aqに加え、かつ前記関数E(w)の勾配
を表す転置行列∇tE(w)から前記関数E(w)の変
化方向を表すベクトルdを求めるためのヘシアンHを式
23により更新して処理を前記第1処理手段に戻し、新
しい変数wの値に基づく新しい制約条件が有効にならな
かったら、新しいヘシアンHを作成するための公式に
て、新たなヘシアンHを更新して処理を前記第1処理手
段に戻す第2処理手段と、前記第1処理手段にて、前記
転置行列∇tE(w)と前記ヘシアンHとの積に基づい
て得られる前記関数E(w)の変化方向を表すベクトル
dがゼロとなった場合には、式24に基づいて行列で得
られるラグランジュ乗数λの要素すべてが非負ならば、
そのときのwを解として得て全処理を終了し、前記ベク
トルdがゼロでない場合には、ラグランジュ乗数λの負
の要素の内、絶対値が最大のものに対応する制約条件の
係数ベクトルasを、前記行列Aqから除いて、式25に
基づいてヘシアンHを更新して処理を第1処理手段に戻
す第3処理手段と、を備えることにより、準ニュートン
射影法による演算を行うに際して、次のような処理とし
ても良い。
【0027】すなわち、1〜Mの整数の内、相異なるq
個の整数を要素とする集合Icを式26に示すごとく表
し、集合Icに含まれる各整数li(i=1,2,…,
q)に対して1行M列のベクトルで、第liの要素がc
liであり他の要素がすべて0、かつcliが+1または−
1で定義されるベクトルを式27の記号で表し、更に前
記行列Aqを式28に示すごとくq行M列の行列で表
し、∇E(wk)を式29に示すごとく表すことで、前
記式24の計算の内、式30にて表す行列の計算の代わ
りに、式31にて表す計算を用いることを特徴とするも
のである。
【0028】
【数8】
【0029】この簡略化により、式30に示す一般化逆
行列の計算をしなくて済む。したがって、計算時間が長
くならず、計算に用いる作業用メモリ領域も小さくて済
む。更に、桁落ち等の数値解析上の問題が生じないの
で、正確な計算ができる。また同様に、直線探索を行っ
て、関数E(w)の値を小さくする変数wの値を求める
第1処理手段と、前記第1処理手段の処理の次に行わ
れ、新しい変数wの値に基づく前記式42の新しい制約
条件が有効になったら、新たに有効になった制約条件の
係数ベクトルarを、制約条件が有効である係数ベクト
ルから構成されている行列Aqに加え、かつ前記関数E
(w)の勾配を表す転置行列∇tE(w)から前記関数
E(w)の変化方向を表すベクトルdを求めるためのヘ
シアンHを式43により更新して処理を前記第1処理手
段に戻し、新しい変数wの値に基づく新しい制約条件が
有効にならなかったら、新しいヘシアンHを作成するた
めの公式にて、新たなヘシアンHを更新して処理を前記
第1処理手段に戻す第2処理手段と、前記第1処理手段
にて、前記転置行列∇tE(w)と前記ヘシアンHとの
積に基づいて得られる前記関数E(w)の変化方向を表
すベクトルdがゼロとなった場合には、式44に基づい
て行列で得られるラグランジュ乗数λの要素すべてが非
負ならば、そのときのwを解として得て全処理を終了
し、前記ベクトルdがゼロでない場合には、ラグランジ
ュ乗数λの負の要素の内、絶対値が最大のものに対応す
る制約条件の係数ベクトルasを、前記行列Aqから除い
て、式45に基づいてヘシアンHを更新して処理を第1
処理手段に戻す第3処理手段と、を備えることにより、
準ニュートン射影法による演算を行うに際して、次のよ
うな処理としても良い。
【0030】すなわち、1〜Mの整数の内、相異なるq
個の整数を要素とする集合Icを式46に示すごとく表
し、集合Icに含まれる各整数li(i=1,2,…,
q)に対して1行M列のベクトルで、第liの要素がc
liであり他の要素がすべて0、かつcliが+1または−
1で定義されるベクトルを式47の記号で表し、更に前
記行列Aqを式48に示すごとくq行M列の行列で表す
ことで、前記式45の計算の内、式49にて表す行列の
計算の代わりに、第s行s列の要素が1で他の要素が全
て0であるM行M列の計算を用いることを特徴とするも
のである。
【0031】
【数9】
【0032】この簡略化により、行列の計算が不要とな
る。したがって、計算時間が長くならず、計算に用いる
作業用メモリ領域も小さくて済む。更に、桁落ち等の数
値解析上の問題が生じないので、正確な計算ができる。
また、これら全ての簡略化を用いたものであっても良
く、より一層効果的である。
【0033】第2処理手段にて用いられる公式として
は、BFGS公式、DFP公式あるいは対称ランク1公
式が挙げられる。前記M個の変数wは、神経回路網にお
ける入力層のユニットから出力層のユニットに至るユニ
ットを結合するM本のシナプスのシナプス荷重を表し、
関数E(w)は前記神経回路網に与えられる教師信号と
前記神経回路網の出力との誤差を表し、第1処理手段、
第2処理手段および第3処理手段によって行われる関数
E(w)が最小値となる変数wの解を求める処理は、前
記神経回路網に対する学習処理であるものとして、上述
した簡略化準ニュートン射影法演算システムを神経回路
網学習システムに適用しても良い。
【0034】前述したごとく、メモリ不足を生じること
なく短時間に学習して、精度の高い神経回路網を作成す
ることができる。なお、このような簡略化準ニュートン
射影法演算システムや神経回路網学習システムの各手段
をコンピュータシステムにて実現する機能は、例えば、
コンピュータシステム側で起動するプログラムとして備
えることができる。このようなプログラムの場合、例え
ば、フロッピーディスク、光磁気ディスク、CD−RO
M、ハードディスク等のコンピュータ読み取り可能な記
録媒体に記録し、必要に応じてコンピュータシステムに
ロードして起動することにより用いることができる。こ
の他、ROMやバックアップRAMをコンピュータ読み
取り可能な記録媒体として前記プログラムを記録してお
き、このROMあるいはバックアップRAMをコンピュ
ータシステムに組み込んで用いても良い。
【0035】上述した神経回路網学習システムによる学
習処理により得られた神経回路網は、信号処理装置に組
み込まれることにより、入力層のユニットから出力層の
ユニットへ、M本のシナプスのシナプス荷重に基づいて
信号を処理することができる。このような信号処理装置
に組み込むためには、例えば、処理される入力信号を、
神経回路網の入力層のユニットへ入力する入力手段と、
神経回路網の出力層のユニットの状態を読み取って信号
として出力する出力手段と、を備える。
【0036】前記神経回路網学習システムによる学習処
理は、安価なデジタルコンピュータでも迅速に学習で
き、しかも正確な学習結果を得ることができるので、信
号処理装置においても精度の高い出力をなすことができ
る。
【0037】
【発明の実施の形態】図1は、上述した発明が適用され
た神経回路網学習システム2の概略構成を表すブロック
図である。本神経回路網学習システム2は、神経回路網
12、学習制御部14、標準パターン格納部18を備え
る。ここでは、神経回路網12はRAMやEEPROM
等の書換え可能なメモリが用いられる。更に、学習制御
部14はコンピュータ装置として構成され、その中心と
なるCPUはデジタル式演算装置を用いている。学習制
御部14は、ハードディスクにて構成される標準パター
ン格納部18に他のデータと共に記憶されているプログ
ラムをRAMにロードして後述する神経回路網学習処理
を実行する。
【0038】本神経回路網学習システム2は神経回路網
12に対して学習処理を行う。この学習処理では、図2
に示すごとく、学習制御部14は標準パターン格納部1
8内に備えられた教師パターンデータベース18aの標
準パターンから、標準入力信号18bを形成して神経回
路網12へ出力する。学習制御部14は、標準入力信号
18bの入力に伴う神経回路網12からの出力信号18
cを、教師パターンデータベース18aの標準パターン
から形成した教師信号18dと比較する。この比較結果
に基づいて学習制御部14は、シナプス荷重更新指令信
号18eを神経回路網12へ出力する。このシナプス荷
重更新指令信号18eを受けて神経回路網12ではユニ
ット12aのシナプス荷重、ここではM個のシナプス荷
重が調整される。この処理を繰り返すことにより、神経
回路網12にて学習が行われる。
【0039】このようにして学習される神経回路網12
の一例として、図3に、オートカーエアコンの制御用途
に用いるための神経回路網12の学習例を示す。標準入
力信号18bとしてオートカーエアコンの運転状態を検
出するセンサからの信号、この神経回路網12では、目
標吹出温度、日射量、内気温度および外気温度の信号が
入力され、出力信号として風量レベルを出力している。
この風量レベル出力信号が学習制御部14にて教師信号
と比較されて、シナプス荷重を更新する指令がなされ
る。これを繰り返すことにより学習がなされる。
【0040】このようにして学習された結果、適切なシ
ナプス荷重が得られれば、例えば自動車に搭載される電
子制御ユニット(ECU)に組み込まれて、オートカー
エアコンのセンサから目標吹出温度、日射量、内気温度
および外気温度の信号を入力して、風量レベルを出力す
ることにより、オートカーエアコンの風量を制御するこ
とができる。
【0041】上述した学習処理において、シナプス荷重
更新指令信号、すなわち、M個のシナプス荷重の変動量
は、簡略化準ニュートン射影法演算システムとして構成
されている神経回路網学習システム2により決定され
る。次に神経回路網学習システム2にておこなわれる神
経回路網学習処理について説明する。神経回路網学習処
理のフローチャートを図4〜図6に示す。この神経回路
網学習処理は、Goldfarb法(たとえば今野
浩、山下 浩、非線型計画法、日科技連、p.264-267)を
利用した簡略化準ニュートン射影法によるものである。
【0042】なお、Goldfarb法は、線形制約条
件付き最適化問題を解く手法である。前述した神経回路
網12に対して線形制約条件付き最適化問題は以下のよ
うに定式化される。すなわち、M個のシナプス荷重
1,w2,…,wMを変数として、前述した自乗誤差和
の関数E(w)は式71のごとく表され、この関数E
(w)において、式72で表すK個の不等式を満足する
最小値を求める手法である。ただし、wは式73で定義
される。
【0043】
【数10】
【0044】ここで、いくつか用語と記号を定義する。 (1)有効制約とI(w) あるwに対しaiw−bi=0となる制約条件を、制約条
件が有効である(以下、「有効制約」と称する。)と呼
ぶ。またその番号iの集合を式74のごとくI(w)で
表す。
【0045】
【数11】
【0046】(2)すべての制約条件を満たす点の集合
を許容領域と呼び、式75のごとく記号Sで表す。
【0047】
【数12】
【0048】(3)wにおける有効制約の数をqとし、
有効制約の係数ベクトルai(制約条件が有効である係
数ベクトルai)を行に持つq行M列の行列をAqとし、
I(w)が式76で表されるとき、Aqは式77のごと
く表す。
【0049】
【数13】
【0050】(4)M×Mの単位行列をIMで表記す
る。 (5)式78によりM行M列の行列を定義する。第2項
に現れる式79はAqの一般化逆行列である。
【0051】
【数14】
【0052】(6)Goldfarb法では式80で表
される条件を満足する点wk+1を見つけるのにヘシアン
というM行M列の行列を使用する。k回目の更新におけ
るヘシアンをHkで示す。ヘシアンHkは常に対称行列で
あり、式81で表す関係が成立する。
【0053】
【数15】
【0054】(7)式82のごとく表される∇E
(wk)は、点wkにおける関数E(wk)の勾配を示
す。これは1行M列の行ベクトルである。∇Et(wk
はその転置であり、M行1列の列ベクトルである。
【0055】
【数16】
【0056】(8)対角要素がa12 … aMであ
るM行M列の対角行列を式83に示すごとく表記する。
【0057】
【数17】
【0058】神経回路網学習処理が開始されると、ま
ず、k=0にkが初期設定され、初期値としてw0∈S
を満足するシナプス荷重w0が選択される(S10
0)。次に、有効制約の番号の集合I(w0)と、行列
qとを求める(S102)。式84により、Pqを求め
る(S104)。
【0059】
【数18】
【0060】ここで、diag[b12 … bM
は、m∈I(w0)ならbm=1、m∈I(w0)でない
ならbm=0である関数bmを対角成分とする対角行列を
表している。次に、ヘシアンHの初期の内容として、P
qをそのまま設定する(S106)。
【0061】次に、学習制御部14はシナプス荷重更新
指令信号18eを神経回路網12に出力して、神経回路
網12の実際のシナプス荷重をw0の値に設定する(S
110)。次に、標準パターン格納部18からの標準パ
ターンの内の標準入力信号18bを、神経回路網12の
入力層のユニット12aに入力し、同時に神経回路網1
2の出力層のユニット12aからの出力信号18cを、
学習制御部14内のメモリに記録する(S120)。
【0062】次に、E(wk)が算出され(S13
0)、更に∇E(wk)が算出される(S134)。E
(wk)は、式85に示すごとく、tで表す標準パター
ンの教師信号18dとoで表す神経回路網12の出力信
号18cとの自乗誤差和に該当する。
【0063】
【数19】
【0064】ここで、Nは出力層のユニット数、Pは標
準パターンの数である。∇E(wk)は、式86に示す
ごとく定義される。
【0065】
【数20】
【0066】次に、∇E(wk)を転置した∇t
(wk)をヘシアンHkにより、式87のごとくの計算に
より、E(wk)の変化方向を表すベクトルdkを求める
(S140)。
【0067】
【数21】
【0068】次に、dk=0か否かが判定される(S1
50)。dk=0で無ければ(S150にて「N
O」)、次に直線探索により、新たなシナプス荷重w
k+1を設定する(S190)。ただし、直線探索は、式
88に示す計算によって行われる。
【0069】
【数22】
【0070】ここで、係数行列αkは、αk>0 かつw
k+1∈Sとなる範囲で設定する。次に、新たに設定され
たシナプス荷重wk+1を神経回路網12のシナプス荷重
として設定して、標準入力信号18bを神経回路網12
の入力層のユニット12aに入力し、出力層のユニット
12aからの出力信号18cと教師信号18dとによ
る、式85に示した計算を行って、E(wk+1)を算出
する(S200)。そして、式89を満足するか否かを
判定する(S210)。
【0071】
【数23】
【0072】式89を満足していなければ(S210で
「NO」)、再度、ステップS190に戻って、更に直
線探索を継続して、E(wk+1)を検討する。直線探索
の結果、式89を満足すれば(S210で「YE
S」)、次に、式72で示した制約条件の内、新たに有
効制約となったものがあるか否かが判定される(S22
0)。新たに有効になった制約条件がなければ(S22
0で「NO」)、BFGS公式によりHkを更新する
(S230)。
【0073】BFGS公式による計算は、式90に示す
ごとくなされる。なお、sk=wk+1−wk、rk=∇t
(wk+1)−∇tE(wk)とする。
【0074】
【数24】
【0075】一方、新たに有効になった制約条件があれ
ば(S220で「YES」)、式91にて新たなヘシア
ンHk+1を算出する(S240)。
【0076】
【数25】
【0077】ここで、Rkは、Hkの第i行第j列の要素
をhk ijとした場合に、式92で示すごとく第i行第j
列の要素が表される行列である。
【0078】
【数26】
【0079】次に、新たに有効になった制約条件を行列
qに加えて、Aq+1とし(S250)、有効制約の数を
表すカウンタqをインクリメントする(S260)。そ
して、kをインクリメントする(S270)。ステップ
S230の処理が終了した場合もこのステップS270
の処理を行う。
【0080】ステップS270の次にkがkの上限値k
maxを越えていないか判定し(S272)、越えていな
ければ(S272で「NO」)、新たな∇E(wk)を
算出し(S134)、新たなヘシアンHkと∇t
(wk)とにより、式87に示したごとく、ベクトルdk
を求め(S140)、dk=0でなければ(S150で
「NO」)、前述した処理が繰り返される。
【0081】もし、dk=0であった場合には(S15
0で「YES」)、ラグランジュ乗数λを式93のごと
く算出する(S280)。ここで、I(wk)は、式9
4、∇E(wk)は式95のごとく定義されている。
【0082】
【数27】
【0083】次にラグランジュ乗数λの全要素が非負、
すなわち、λの全要素≧0か否かが判定される(S29
0)。ラグランジュ乗数λの全要素が非負でない場合
(S290で「NO」)は、現在のシナプス荷重wk
解ではないので、ラグランジュ乗数λの要素の内、最も
小さい要素、すなわち負で絶対値が最大の要素(番号
s)に対応する制約条件asをAqから取り除き、Aq-1
とする(S300)。
【0084】次にI(wk)から番号sを取り除く(S
310)。そして、式96の計算にて、新たなヘシアン
k+1を算出する(S320)。
【0085】
【数28】
【0086】ここでDsは、第s行第s列の要素が1で
他は全て0のM行M列の行列である。次にqがステップ
S300でAqから要素を1つ取り除いたことに対応し
て、1つ減算される(S330)。
【0087】次にkをインクリメントして(S34
0)、kがkの上限値kmaxを越えていないか判定し
(S342)、越えていなければ(S342で「N
O」)、ベクトルdkを求める処理(S140)に戻
る。以後、ステップS150またはステップS290に
て「NO」と判定される限り、前述した処理を繰り返
し、学習が継続される。
【0088】ステップS290にてラグランジュ乗数λ
の全要素が非負であると判定された場合(S290にて
「YES」)、この時に設定されているwkが解として
記録される(S350)。こうして学習処理は終了す
る。なお、ステップS272またはステップS342に
て、k>kmaxと判定された場合も、この時に設定され
ているwkが解として記録され(S350)、学習処理
を終了する。
【0089】上述した学習処理では、計算上、4つの簡
略化を行っている。そして、この4つの簡略化は、神経
回路網12のシナプス荷重wに上下限を設定するに際し
て、前記式72にて示した制約条件の係数ベクトルai
が、第li要素が−1または1であり、他の要素が全て0
の1行M列の行ベクトルであるとの制約のもとに、初め
て得られる。ここで便宜上、aiをcで表すと、式97
に示すごとくとなる。
【0090】
【数29】
【0091】更に、式97をZ毎に区別して表すと、式
98のごとくに表すことができる。
【0092】
【数30】
【0093】このような係数ベクトルaiの制約による
簡略化について説明する。 [第1の簡略化]ステップS104におけるPqの算出
に際して、式99に示す計算を行っている。
【0094】
【数31】
【0095】従来知られているPqの計算は、式100
に示すごとくの一般化逆行列の計算である。
【0096】
【数32】
【0097】簡単のため、1行M列で第m番目の要素が
xで他の要素が全て0であるベクトルをeM m(x)と表
記する。eM m(x)について、式101が成立する。
【0098】
【数33】
【0099】なお、前記式97のcli Zは式102のよ
うに表記できる。
【0100】
【数34】
【0101】次に、i,j=1,2,…,qとして、A
qq tの第i行第j列要素は、cli(clitである。i
=jならli=lj、i≠jならli≠ljであるから、式
103が整成立する。
【0102】
【数35】
【0103】したがって、Aqq tはq行q列の単位行
列Iqであり、(Aqq t-1もq行q列の式104で表
すごとく単位行列Iqとなる。
【0104】
【数36】
【0105】式104から、式105が成立する。
【0106】
【数37】
【0107】Aqの第i列ベクトル(i=1,2,…,
M)をdiで表記する。これは、式106に示すごとく
である。
【0108】
【数38】
【0109】すると、Aq tqの第i行第j列要素は、
(ditjとなる。さて、式107が成立するならdi
=0である。したがって式107または式108が成立
するなら(ditj=0となる。
【0110】
【数39】
【0111】一方、式109が成立するなら、i=
u、j=lvとなる数u,vが存在する。diは第u要
素がclu、他の要素は0のベクトルとなる。すなわち、
式110が成立し、同様に式111が成立する。
【0112】
【数40】
【0113】i=jならu=v、i≠jならu≠vであ
るので、式112が成立する。
【0114】
【数41】
【0115】以上より、(ditj=1となるのは、
i=jかつi∈Ic(wk)のときに限る。したがって、
mを式113のごとく表すと、Aq tqは、式114の
ごとく表される。
【0116】
【数42】
【0117】すなわち式99が証明された。したがっ
て、一般化逆行列の計算を実行しなくても、ステップS
104におけるPqの算出が可能であり、この部分で計
算のための作業メモリを要したり、計算が不正確になる
のを防止できる。また、プログラム作成時も一般化逆行
列のプログラムを作成しなくても良いので、プログラム
作成作業が容易となる。
【0118】[第2の簡略化]ステップS240におけ
るHk+1の算出に際して、Hk+1の各要素について、式1
15に示す計算を行っている。
【0119】
【数43】
【0120】従来知られているHk+1の計算は、式11
6に示すごとくの行列の計算である。
【0121】
【数44】
【0122】ここで、wkをwk+1に更新して、wr k+1
−Bまたはwr k+1=Bになったとする。すると、制約条
件cr Zk+1−Bが新たに有効制約となる。ar=cr Z
おくと、前記式116は、式117のごとく表される。
【0123】
【数45】
【0124】この内、前記式117の第2項の分母と分
子とに共通のHk(cr Ztを計算すると式118のごと
くになる。
【0125】
【数46】
【0126】したがって、前記式117の第2項の分母
は式119のように計算できる。
【0127】
【数47】
【0128】次に、Hk t=Hkの関係より、前記式11
7の第2項の分子の一部であるcr Zkは、式120の
計算式に示すごとく、分子の他の部分であるH
k(cr Ztを転置したものに等しい。
【0129】
【数48】
【0130】前記式118と前記式120とにより、前
記式117の第2項の分子は式121で表される。
【0131】
【数49】
【0132】前記式119と前記式121との関係か
ら、前記式115の関係が得られる。したがって、5回
の行列の乗算が必要な式116が、式115のごとく簡
略化さえる。ステップS240におけるHk+1の算出が
可能であり、この部分で計算のための作業メモリを要し
たり、計算が不正確になるのを防止できる。また、プロ
グラム作成作業が容易となる。
【0133】[第3の簡略化]ステップS280におけ
るラグランジュ乗数λの算出に際して、式122に示す
計算を行っている。
【0134】
【数50】
【0135】従来知られているλの計算は、式123に
示すごとくの一般化逆行列を含む計算である。
【0136】
【数51】
【0137】ここで、前記式104の関係から、式12
4の関係が成立する。
【0138】
【数52】
【0139】したがって、λのi番目の要素は式125
のように求められ、前記式122が証明された。
【0140】
【数53】
【0141】したがって、一般化逆行列の計算を実行し
なくても、ステップS280におけるλの算出が可能で
あり、この部分で計算のための作業メモリを要したり、
計算が不正確になるのを防止できる。また、プログラム
作成時も一般化逆行列のプログラムを作成しなくても良
いので、プログラム作成作業が容易となる。
【0142】[第4の簡略化]ステップS320におけ
るHk+1の算出に際して、式126に示す計算を行って
いる。
【0143】
【数54】
【0144】ここでDsは、第s行第s列の要素が1で
他は全て0のM行M列の行列である。従来知られている
k+1の計算は、式127に示すごとくの一般化逆行列
の計算である。
【0145】
【数55】
【0146】ここで、制約条件cs Zk−B=0を有効
制約から取り除くとする。式128の条件が成立するの
で、bs=0となる。
【0147】
【数56】
【0148】as=cs Zとおくと、式127は、式12
9のごとく表される。
【0149】
【数57】
【0150】はじめに、前記式129の第2項の分母と
分子とに共通なPq-1(cs Ztを計算する。前記式99
の関係から式130の関係が存在する。
【0151】
【数58】
【0152】ここで、bs=0であるので、Pq-1の第s
行第s列の要素は1である。これにより、前記式129
の第2項の分母と分子とに共通なPq-1(cs Ztは式1
31に示すごとく(cs Ztに等しいことがわかる。
【0153】
【数59】
【0154】したがって、第2項の分母は、式132に
示すごとく1となる。
【0155】
【数60】
【0156】一方、Pq-1 t=Pq-1であることにより第
2項の分子の一部であるcs Zq-1は式133に示すご
とく、第2項の他の一部であるPq-1(cs Ztを転置し
たcs Zとなる。
【0157】
【数61】
【0158】したがって、第2項の分子は、式134に
示すごとくとなり、第s行第s列の要素が1で、他の要
素は全て0のM行M列の行列となる。
【0159】
【数62】
【0160】すなわち、第i行第j列の要素をpijとす
ると、式135のように表すことができる。
【0161】
【数63】
【0162】したがって、一般化逆行列の計算を実行し
なくても、ステップS320におけるHk+1の算出が可
能であり、この部分で計算のための作業メモリを要した
り、計算が不正確になるのを防止できる。また、プログ
ラム作成時も一般化逆行列のプログラムを作成しなくて
も良いので、プログラム作成作業が容易となる。
【0163】以上述べたように、固定小数点式デジタル
演算装置で実行する神経回路網12のシナプス荷重のダ
イナミックレンジを抑制するために、シナプス荷重の絶
対値に上限値を設定し、その範囲内で学習を行なうGo
ldfarb法を適用する際に、上述のごとく、前記式
72にて示した制約条件の係数ベクトルaiが、第li
素が−1または1であり、他の要素が全て0の1行M列
の行ベクトルであるとの制約のもとに、一般化逆行列の
複雑な計算を不要にできるため、神経回路網12の学習
プログラムのプログラミングは容易となる。また計算時
間、メモリ使用量を削減できる。更に、別の効果とし
て、一般化逆行列の計算は桁落ち等の数値解析上の問題
により、正確な計算ができない場合があるが、上述した
簡略化によりその問題を回避でき、より正確な数値解が
得られるという利点もある。
【0164】なお、本実施の形態では各シナプス荷重w
i(i=1,2,…,M)の絶対値に共通の上限値Bを
設定した場合、すなわち|wi|≦Bについて簡略計算
式を導出し、証明した。しかしこれらの式は、各シナプ
ス荷重wiにそれぞれ別個に上限値Bi U、下限値Bi L
設定した場合、すなわちBi L≦wi≦Bi Uとした場合に
も同様に有効である。また本実施の形態は階層型神経回
路網について説明したが、降下法により学習できる神経
回路網であれば、他のモデル(リカレントニューラルネ
ットワーク等)にも適用可能である。
【0165】[実験例]オートカーエアコン風量制御に
本発明を適用した効果を示す実験結果を以下に説明す
る。本実験では、前述した4つの簡略化を行った処理に
て学習した場合(「実施例」で表す。)と、従来の学習
法であるBFGS公式を用いたGoldfarb法
(「従来法」で表す。)にて学習した場合との比較を行
ない、固定小数点演算での神経回路網出力の誤差を評価
した。
【0166】A.要領 比較に用いた適用事例、神経回路網の構成等の条件を以
下に示す。オートカーエアコンをA/Cと略記する。 (a)適用事例 A/C吹き出し口制御 (FACE,B/L,FOOT
等の切り替え) (b)入出力の仕様 入出力は、4入力1出力である。各入力の仕様を表1
に、各出力の仕様を表2に示す。入力センサー値範囲の
うち、単純なif-thenルールによりプログラム処理でき
る領域を除いた部分を神経回路網により処理する。神経
回路網へは、各センサー信号をセンサー値範囲で[0,
1]に正規化して入力する。
【0167】
【表1】
【0168】
【表2】
【0169】出力信号である吹出口モードにしたがい、
A/Cは以下のようにモードを切り替えさせるものとす
る。
【0170】
【表3】
【0171】吹出口モードの許容誤差は±0.1である
が、モード切替点では確実にモードを切り替えるため、
誤差をできるだけ小さくする必要がある。 (c)教師パターン数 5915個 (うち3944個を学習に使用) (d)神経回路網の構成 4層型神経回路網 (入力層4ユニット、第1中間層8
ユニット、第2中間層8ユニット、出力層1ユニット)
入力ユニットは線形ユニット、中間、出力ユニットはシ
グモイドユニット (e)評価方法 ステップ1.従来法、実施例(上限値B=64、12
8)それぞれにつき、初期値を変えて20回学習を行な
った。各神経回路網係数の初期値は(−1、1)の範囲
の乱数とする。学習サイクルは各試行とも1000回と
する。
【0172】ステップ2.各神経回路網を浮動小数点演
算、固定小数点演算で計算し、式136に示すごとく全
パターンに対する自乗誤差和Eを算出して比較する。
【0173】
【数64】
【0174】B.実験結果 自乗誤差和Eの計算結果を表4に示す。試行番号が同じ
神経回路網は同一の初期値から学習を開始している。
従来法は浮動小数点演算において最良の結果を示し、試
行3、12、13、17で自乗誤差和Eはほぼ0となっ
た。しかしながら固定小数点演算では試行により演算精
度が低下し、自乗誤差和Eが異常に大きくなることがあ
った(試行3、10等)。自乗誤差和Eの最大値を比較
すると、従来法で187.1となったのに対し、実施例
は上限値B=64、128それぞれで1.372、1.
079となった。これより固定小数点演算に関し、実施
例は、従来法より神経回路網の初期値依存性が低く、試
行による自乗誤差和Eのばらつきの少ないことが分か
る。
【0175】
【表4】
【0176】次に、従来法、実施例につき固定小数点演
算における自乗誤差和Eの最も小さいもの3つを選択
し、シナプス荷重の絶対値の最大値、教師出力と神経回
路網出力との絶対誤差の最大値を比較した。従来法の結
果を表5に、実施例の上限値B=64の場合の結果を表
6に、実施例の上限値B=128の場合の結果を表7に
示す。
【0177】
【表5】
【0178】
【表6】
【0179】
【表7】
【0180】最小の自乗誤差和Eを比較すると、実施例
が2桁小さく、より正確な入出力関数が実現できた。絶
対誤差の最大値も本実施の形態が従来法より小さく、優
れた性能を示した。許容誤差は各学習法すべて±0.1
の範囲内であるが、従来法では出力値0.3、0.4、
0.5付近で大きな自乗誤差和Eが発生した。特に0.
3、0.5はモード切替点であり、この神経回路網を制
御に用いることはできない。一方、実施例では上限値B
=64、128いずれにおいても特定の出力値で大きな
自乗誤差和Eが発生する現象はなかった。
【0181】表8に演算方式の違いによる実施例と従来
例との自乗誤差和Eの比較を示す。
【0182】
【表8】
【0183】表8からわかるように、実施例では浮動小
数点演算でも、固定小数点演算でもほとんど自乗誤差和
Eに差はないが、従来法では極めて大きな差を生じる。
このことから、従来法は、ECU等において一般的に用
いられている固定小数点演算を行う演算装置に用いるの
は不適であることがわかる。
【0184】図7に実施例と従来法とによる制御曲線の
比較を示す。図中の教師出力は実現すべき制御曲線を、
神経回路網出力は神経回路網の出力した制御曲線を示
す。(a)は実施例による結果、(b)は従来法の結果
である。従来法では出力値0.3、0.4、0.5で大
きな自乗誤差和Eが発生したのに対し、実施例は教師出
力曲線、神経回路網出力曲線がほぼ一致したことが分か
る。これより実施例の効果を確認した。
【0185】
【その他】上述した実施の形態では、学習制御部14
は、ハードディスクとして構成されている標準パターン
格納部18に記憶されているプログラムをRAMにロー
ドして神経回路網学習処理を実行したが、これ以外に、
例えば、フロッピーディスク、光磁気ディスク、CD−
ROM等のコンピュータ読み取り可能な記録媒体に記録
し、必要に応じてコンピュータシステムにロードして起
動することにより用いても良い。この他、ROMやバッ
クアップRAMをコンピュータ読み取り可能な記録媒体
として前記プログラムを記録しておき、このROMある
いはバックアップRAMをコンピュータシステムに組み
込んで用いても良い。
【図面の簡単な説明】
【図1】 一実施の形態としての神経回路網学習システ
ムの概略構成を表すブロック図である。
【図2】 前記神経回路網学習システムによる神経回路
網に対する学習処理の説明図である。
【図3】 前記神経回路網学習システムによるオートカ
ーエアコン制御用の神経回路網に対する学習処理の説明
図である。
【図4】 前記神経回路網学習システムによる神経回路
網学習処理のフローチャートである。
【図5】 前記神経回路網学習システムによる神経回路
網学習処理のフローチャートである。
【図6】 前記神経回路網学習システムによる神経回路
網学習処理のフローチャートである。
【図7】 実施例と従来法との学習の効果を示す説明図
である。
【図8】 従来の学習における自乗誤差和Eの推移状態
説明図である。
【符号の説明】
2…神経回路網学習システム 12…神経回路網
12a…ユニット 14…学習制御部 18…標準パターン格納部 18a…教師パターンデータベース 18b…標準入
力信号 18c…出力信号 18d…教師信号 18e…シナプス荷重更新指令信号

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】M本のシナプス(結合)を有し、各シナプ
    ス荷重wi(i=1,2,..,M)に上限値Bi U 、下限値Bi L
    設定し、Bi L≦wi≦Bi Uを満たすよう学習を行う神経回路
    網に対し、学習準ニュートン射影法により実現すること
    を特徴とする神経回路網学習システム。
  2. 【請求項2】デジタル式演算装置を用いて、式1にて表
    され式2の制約条件を満たすM個の変数wからなる関数
    E(w)が最小値となる変数wの解を求めるに際して、 直線探索を行って、関数E(w)の値を小さくする変数
    wの値を求める第1処理手段と、 前記第1処理手段の処理の次に行われ、新しい変数wの
    値に基づく前記式2の新しい制約条件が有効になった
    ら、新たに有効になった制約条件の係数ベクトルa
    rを、制約条件が有効である係数ベクトルから構成され
    ている行列Aqに加え、かつ前記関数E(w)の勾配を
    表す転置行列∇tE(w)から前記関数E(w)の変化
    方向を表すベクトルdを求めるためのヘシアンHを式3
    により更新して処理を前記第1処理手段に戻し、新しい
    変数wの値に基づく新しい制約条件が有効にならなかっ
    たら、新しいヘシアンHを作成するための公式にて、新
    たなヘシアンHを更新して処理を前記第1処理手段に戻
    す第2処理手段と、 前記第1処理手段にて、前記転置行列∇tE(w)と前
    記ヘシアンHとの積に基づいて得られる前記関数E
    (w)の変化方向を表すベクトルdがゼロとなった場合
    には、式4に基づいて行列で得られるラグランジュ乗数
    λの要素すべてが非負ならば、そのときのwを解として
    得て全処理を終了し、前記ベクトルdがゼロでない場合
    には、ラグランジュ乗数λの負の要素の内、絶対値が最
    大のものに対応する制約条件の係数ベクトルasを、前
    記行列Aqから除いて、式5に基づいてヘシアンHを更
    新して処理を第1処理手段に戻す第3処理手段と、 を備えて準ニュートン射影法による演算を行うと共に、 1〜Mの整数の内、相異なるq個の整数を要素とする集
    合Icを式6に示すごとく表し、集合Icに含まれる各整
    数li(i=1,2,…,q)に対して1行M列のベク
    トルで、第liの要素がcliであり他の要素がすべて
    0、かつcliが+1または−1で定義されるベクトルを
    式7の記号で表し、更に前記行列Aqを式8に示すごと
    くq行M列の行列で表すことで、前記式4の計算の内、
    式9にて表す行列の計算の代わりに、整数m∈Icなら
    ばbm=1、整数m∈Icでないならばbm=0である関
    数bmを対角要素とする対角行列diag[b12
    … b M]の計算を用いることを特徴とする簡略化準ニ
    ュートン射影法演算システム。 【数1】
  3. 【請求項3】デジタル式演算装置を用いて、式11にて
    表され式12の制約条件を満たすM個の変数wからなる
    関数E(w)が最小値となる変数wの解を求めるに際し
    て、 直線探索を行って、関数E(w)の値を小さくする変数
    wの値を求める第1処理手段と、 前記第1処理手段の処理の次に行われ、新しい変数wの
    値に基づく前記式12の新しい制約条件が有効になった
    ら、新たに有効になった制約条件の係数ベクトルa
    rを、制約条件が有効である係数ベクトルから構成され
    ている行列Aqに加え、かつ前記関数E(w)の勾配を
    表す転置行列∇tE(w)から前記関数E(w)の変化
    方向を表すベクトルdを求めるためのヘシアンHを式1
    3により更新して処理を前記第1処理手段に戻し、新し
    い変数wの値に基づく新しい制約条件が有効にならなか
    ったら、新しいヘシアンHを作成するための公式にて、
    新たなヘシアンHを更新して処理を前記第1処理手段に
    戻す第2処理手段と、 前記第1処理手段にて、前記転置行列∇tE(w)と前
    記ヘシアンHとの積に基づいて得られる前記関数E
    (w)の変化方向を表すベクトルdがゼロとなった場合
    には、式14に基づいて行列で得られるラグランジュ乗
    数λの要素すべてが非負ならば、そのときのwを解とし
    て得て全処理を終了し、前記ベクトルdがゼロでない場
    合には、ラグランジュ乗数λの負の要素の内、絶対値が
    最大のものに対応する制約条件の係数ベクトルasを、
    前記行列Aqから除いて、式15に基づいてヘシアンH
    を更新して処理を第1処理手段に戻す第3処理手段と、 を備えて準ニュートン射影法による演算を行うと共に、 ヘシアンHの第i行第j列の要素をhijで表し、全ての
    制約条件における各係数ベクトルarの第r要素が+1
    または−1であり、他の要素がすべて0であるとして表
    すことで、前記式13の計算の内、式16にて表す行列
    の計算の代わりに、第i行第j列の要素が式17で表さ
    れるM行M列の行列の計算を用いることを特徴とする簡
    略化準ニュートン射影法演算システム。 【数2】
  4. 【請求項4】デジタル式演算装置を用いて、式21にて
    表され式22の制約条件を満たすM個の変数wからなる
    関数E(w)が最小値となる変数wの解を求めるに際し
    て、 直線探索を行って、関数E(w)の値を小さくする変数
    wの値を求める第1処理手段と、 前記第1処理手段の処理の次に行われ、新しい変数wの
    値に基づく前記式22の新しい制約条件が有効になった
    ら、新たに有効になった制約条件の係数ベクトルa
    rを、制約条件が有効である係数ベクトルから構成され
    ている行列Aqに加え、かつ前記関数E(w)の勾配を
    表す転置行列∇tE(w)から前記関数E(w)の変化
    方向を表すベクトルdを求めるためのヘシアンHを式2
    3により更新して処理を前記第1処理手段に戻し、新し
    い変数wの値に基づく新しい制約条件が有効にならなか
    ったら、新しいヘシアンHを作成するための公式にて、
    新たなヘシアンHを更新して処理を前記第1処理手段に
    戻す第2処理手段と、 前記第1処理手段にて、前記転置行列∇tE(w)と前
    記ヘシアンHとの積に基づいて得られる前記関数E
    (w)の変化方向を表すベクトルdがゼロとなった場合
    には、式24に基づいて行列で得られるラグランジュ乗
    数λの要素すべてが非負ならば、そのときのwを解とし
    て得て全処理を終了し、前記ベクトルdがゼロでない場
    合には、ラグランジュ乗数λの負の要素の内、絶対値が
    最大のものに対応する制約条件の係数ベクトルasを、
    前記行列Aqから除いて、式25に基づいてヘシアンH
    を更新して処理を第1処理手段に戻す第3処理手段と、 を備えて準ニュートン射影法による演算を行うと共に、 1〜Mの整数の内、相異なるq個の整数を要素とする集
    合Icを式26に示すごとく表し、集合Icに含まれる各
    整数li(i=1,2,…,q)に対して1行M列のベ
    クトルで、第liの要素がcliであり他の要素がすべて
    0、かつcliが+1または−1で定義されるベクトルを
    式27の記号で表し、更に前記行列Aqを式28に示す
    ごとくq行M列の行列で表し、∇E(wk)を式29に
    示すごとく表すことで、前記式24の計算の内、式30
    にて表す行列の計算の代わりに、式31にて表す計算を
    用いることを特徴とする簡略化準ニュートン射影法演算
    システム。 【数3】
  5. 【請求項5】デジタル式演算装置を用いて、式41にて
    表され式42の制約条件を満たすM個の変数wからなる
    関数E(w)が最小値となる変数wの解を求めるに際し
    て、 直線探索を行って、関数E(w)の値を小さくする変数
    wの値を求める第1処理手段と、 前記第1処理手段の処理の次に行われ、新しい変数wの
    値に基づく前記式42の新しい制約条件が有効になった
    ら、新たに有効になった制約条件の係数ベクトルa
    rを、制約条件が有効である係数ベクトルから構成され
    ている行列Aqに加え、かつ前記関数E(w)の勾配を
    表す転置行列∇tE(w)から前記関数E(w)の変化
    方向を表すベクトルdを求めるためのヘシアンHを式4
    3により更新して処理を前記第1処理手段に戻し、新し
    い変数wの値に基づく新しい制約条件が有効にならなか
    ったら、新しいヘシアンHを作成するための公式にて、
    新たなヘシアンHを更新して処理を前記第1処理手段に
    戻す第2処理手段と、 前記第1処理手段にて、前記転置行列∇tE(w)と前
    記ヘシアンHとの積に基づいて得られる前記関数E
    (w)の変化方向を表すベクトルdがゼロとなった場合
    には、式44に基づいて行列で得られるラグランジュ乗
    数λの要素すべてが非負ならば、そのときのwを解とし
    て得て全処理を終了し、前記ベクトルdがゼロでない場
    合には、ラグランジュ乗数λの負の要素の内、絶対値が
    最大のものに対応する制約条件の係数ベクトルasを、
    前記行列Aqから除いて、式45に基づいてヘシアンH
    を更新して処理を第1処理手段に戻す第3処理手段と、 を備えて準ニュートン射影法による演算を行うと共に、 1〜Mの整数の内、相異なるq個の整数を要素とする集
    合Icを式46に示すごとく表し、集合Icに含まれる各
    整数li(i=1,2,…,q)に対して1行M列のベ
    クトルで、第liの要素がcliであり他の要素がすべて
    0、かつcliが+1または−1で定義されるベクトルを
    式47の記号で表し、更に前記行列Aqを式48に示す
    ごとくq行M列の行列で表すことで、前記式45の計算
    の内、式49にて表す行列の計算の代わりに、第s行s
    列の要素が1で他の要素が全て0であるM行M列の計算
    を用いることを特徴とする簡略化準ニュートン射影法演
    算システム。 【数4】
  6. 【請求項6】デジタル式演算装置を用いて、式51にて
    表され式52の制約条件を満たすM個の変数wからなる
    関数E(w)が最小値となる変数wの解を求めるに際し
    て、 直線探索を行って、関数E(w)の値を小さくする変数
    wの値を求める第1処理手段と、 前記第1処理手段の処理の次に行われ、新しい変数wの
    値に基づく前記式52の新しい制約条件が有効になった
    ら、新たに有効になった制約条件の係数ベクトルa
    rを、制約条件が有効である係数ベクトルから構成され
    ている行列Aqに加え、かつ前記関数E(w)の勾配を
    表す転置行列∇tE(w)から前記関数E(w)の変化
    方向を表すベクトルdを求めるためのヘシアンHを式5
    3により更新して処理を前記第1処理手段に戻し、新し
    い変数wの値に基づく新しい制約条件が有効にならなか
    ったら、新しいヘシアンHを作成するための公式にて、
    新たなヘシアンHを更新して処理を前記第1処理手段に
    戻す第2処理手段と、 前記第1処理手段にて、前記転置行列∇tE(w)と前
    記ヘシアンHとの積に基づいて得られる前記関数E
    (w)の変化方向を表すベクトルdがゼロとなった場合
    には、式54に基づいて行列で得られるラグランジュ乗
    数λの要素すべてが非負ならば、そのときのwを解とし
    て得て全処理を終了し、前記ベクトルdがゼロでない場
    合には、ラグランジュ乗数λの負の要素の内、絶対値が
    最大のものに対応する制約条件の係数ベクトルasを、
    前記行列Aqから除いて、式55に基づいてヘシアンH
    を更新して処理を第1処理手段に戻す第3処理手段と、 を備えて準ニュートン射影法による演算を行うと共に、 1〜Mの整数の内、相異なるq個の整数を要素とする集
    合Icを式56に示すごとく表し、集合Icに含まれる各
    整数li(i=1,2,…,q)に対して1行M列のベ
    クトルで、第liの要素がcliであり他の要素がすべて
    0、かつcliが+1または−1で定義されるベクトルを
    式57の記号で表し、更に前記行列Aqを式58に示す
    ごとくq行M列の行列で表すことで、前記式54の計算
    の内、式59にて表す行列の計算の代わりに、整数m∈
    cならばbm=1、整数m∈Icでないならばbm=0で
    ある関数bmを対角要素とする対角行列diag[b1
    2 … bM]の計算を用い、前記式55の計算の内、式
    60にて表す行列の計算の代わりに、第s行s列の要素
    が1で他の要素が全て0であるM行M列の計算を用い、 更に、∇E(wk)を式61に示すごとく表すことで、
    前記式54の計算の内、式62にて表す行列の計算の代
    わりに、式63にて表す計算を用い、 更に、ヘシアンHの第i行第j列の要素をhijで表し、
    全ての制約条件における各係数ベクトルarの第r要素
    が+1または−1であり、他の要素がすべて0であると
    して表すことで、前記式53の計算の内、式64にて表
    す行列の計算の代わりに、第i行第j列の要素が式65
    で表されるM行M列の行列の計算を用いることを特徴と
    する簡略化準ニュートン射影法演算システム。 【数5】
  7. 【請求項7】第2処理手段にて用いられる公式は、BF
    GS公式、DFP公式あるいは対称ランク1公式である
    ことを特徴とする請求項2〜6のいずれかに記載の簡略
    化準ニュートン射影法演算システム。
  8. 【請求項8】前記M個の変数wは、神経回路網における
    入力層のユニットから出力層のユニットに至るユニット
    を結合するM本のシナプスのシナプス荷重を表し、関数
    E(w)は前記神経回路網に与えられる教師信号と前記
    神経回路網の出力との誤差を表し、第1処理手段、第2
    処理手段および第3処理手段によって行われる関数E
    (w)が最小値となる変数wの解を求める処理は、前記
    神経回路網に対する学習処理であることを特徴とする請
    求項2〜7のいずれか記載の神経回路網学習システム。
  9. 【請求項9】請求項2〜7のいずれか記載の簡略化準ニ
    ュートン射影法演算システムの各手段としてコンピュー
    タシステムを機能させるためのプログラムを記録したコ
    ンピュータ読み取り可能な記録媒体。
  10. 【請求項10】請求項8記載の神経回路網学習システム
    の各手段としてコンピュータシステムを機能させるため
    のプログラムを記録したコンピュータ読み取り可能な記
    録媒体。
  11. 【請求項11】請求項8における神経回路網学習システ
    ムによる学習処理により得られた神経回路網を組み込ん
    だことを特徴とする信号処理装置。
  12. 【請求項12】請求項8における神経回路網学習システ
    ムによる学習処理により得られた神経回路網と、 処理される入力信号を、前記神経回路網の入力層のユニ
    ットへ入力する入力手段と、 前記神経回路網の出力層のユニットの状態を読み取って
    信号として出力する出力手段と、 を備えたことを特徴とする信号処理装置。
JP29444597A 1997-10-27 1997-10-27 簡略化準ニュートン射影法演算システム、神経回路網学習システム、記録媒体および信号処理装置 Expired - Fee Related JP3733711B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29444597A JP3733711B2 (ja) 1997-10-27 1997-10-27 簡略化準ニュートン射影法演算システム、神経回路網学習システム、記録媒体および信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29444597A JP3733711B2 (ja) 1997-10-27 1997-10-27 簡略化準ニュートン射影法演算システム、神経回路網学習システム、記録媒体および信号処理装置

Publications (2)

Publication Number Publication Date
JPH11134314A true JPH11134314A (ja) 1999-05-21
JP3733711B2 JP3733711B2 (ja) 2006-01-11

Family

ID=17807879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29444597A Expired - Fee Related JP3733711B2 (ja) 1997-10-27 1997-10-27 簡略化準ニュートン射影法演算システム、神経回路網学習システム、記録媒体および信号処理装置

Country Status (1)

Country Link
JP (1) JP3733711B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012015450A1 (en) * 2010-07-30 2012-02-02 Hewlett-Packard Development Company, L.P. Systems and methods for modeling binary synapses
CN110651280A (zh) * 2017-05-20 2020-01-03 谷歌有限责任公司 投影神经网络

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012015450A1 (en) * 2010-07-30 2012-02-02 Hewlett-Packard Development Company, L.P. Systems and methods for modeling binary synapses
US9342780B2 (en) 2010-07-30 2016-05-17 Hewlett Packard Enterprise Development Lp Systems and methods for modeling binary synapses
CN110651280A (zh) * 2017-05-20 2020-01-03 谷歌有限责任公司 投影神经网络
US11544573B2 (en) 2017-05-20 2023-01-03 Google Llc Projection neural networks

Also Published As

Publication number Publication date
JP3733711B2 (ja) 2006-01-11

Similar Documents

Publication Publication Date Title
US11216721B2 (en) Method for calculating a neuron layer of a multi-layer perceptron model with simplified activation function
US6678640B2 (en) Method and apparatus for parameter estimation, parameter estimation control and learning control
JP3634023B2 (ja) ニューラル・ネットワーク用の適応型重み調整回路
CN116088307B (zh) 基于误差触发自适应稀疏辨识的多工况工业过程预测控制方法、装置、设备及介质
KR20190018885A (ko) 중첩 신경망을 프루닝하는 방법 및 장치
US12541680B2 (en) Reduced computation real time recurrent learning
US5280564A (en) Neural network having an optimized transfer function for each neuron
EP0813127A2 (en) Inference rule determining method and inference device
CA2504810A1 (en) System and method for the automated establishment of experience ratings and/or risk reserves
EP0384709B1 (en) Learning Machine
CN114298291A (zh) 一种模型量化处理系统及一种模型量化处理方法
US20240143886A1 (en) Method of correcting layout for semiconductor process using machine learning, method of manufacturing semiconductor device using the same, and layout correction system performing the same
KR20200076083A (ko) 오류 역전파를 이용하여 지도 학습을 수행하는 뉴로모픽 시스템
CN106067075B (zh) 一种建筑用能负荷预测模型建立、负荷预测方法及其装置
Khilenko et al. Optimization of the selection of software elements in control systems with significantly different-speed processes
JPH11134314A (ja) 簡略化準ニュートン射影法演算システム、神経回路網学習システム、記録媒体および信号処理装置
EP3848858A1 (en) Information processing apparatus, neural network computation program, and neural network computation method
US5420810A (en) Adaptive input/output apparatus using selected sample data according to evaluation quantity
CN114266387A (zh) 一种输变电工程工期预测方法、系统、设备及存储介质
JPH05128284A (ja) ニユーロプロセツサ
CN118502716B (zh) 一种降低浮点指数运算对算力的消耗的方法
CN115238873B (zh) 神经网络模型部署方法、装置、计算机设备
JPH09101944A (ja) ニューラルネットワーク回路
JP3276035B2 (ja) 神経回路網モデルの逐次型加速化学習方法
US20230367356A1 (en) Digital signal processing device and method of calculating softmax performed by the same

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051010

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees