JPH03125257A - ニューラル・ネットワーク及び適応推論システム - Google Patents

ニューラル・ネットワーク及び適応推論システム

Info

Publication number
JPH03125257A
JPH03125257A JP2190378A JP19037890A JPH03125257A JP H03125257 A JPH03125257 A JP H03125257A JP 2190378 A JP2190378 A JP 2190378A JP 19037890 A JP19037890 A JP 19037890A JP H03125257 A JPH03125257 A JP H03125257A
Authority
JP
Japan
Prior art keywords
input
value
neural network
output
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2190378A
Other languages
English (en)
Inventor
John H Murphy
ジョン・ハーバート・マーフィ
Terry A Jeeves
テリー・アレン・ジーブス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Westinghouse Electric Corp
Original Assignee
Westinghouse Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US07/416,626 external-priority patent/US5073867A/en
Application filed by Westinghouse Electric Corp filed Critical Westinghouse Electric Corp
Publication of JPH03125257A publication Critical patent/JPH03125257A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0499Feedforward networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Devices For Executing Special Programs (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は確率に基づくニューラル・ネットワーク及びニ
ューラル・ネットワーク処理素子に係わり、特に、線形
変換またはべき級数展開された入力信号の積として出力
を形成するニューラル・ノードを有するネットワークに
係わる。
ニューラル・ネットワークは大部分が、場合によっては
すべてが相互接続されている多数の処理素子から成る。
これらの処理素子の相互接続は構造化することができる
が、このことはこれらの構成がニューラル・ネットワー
クと呼称されるための必要条件ではない。処理素子は解
くべき問題及び利用可能な手段に応じて層、カラム、ツ
リーリング、スターなどの形態に組織化すればよい。
1つのニューラル・ネットワーク中のすべての処理素子
が同じである必要はない。従って、ネットワーク内で特
定機能、例えば、入力または出力機能を行なうように処
理素子の構成を特別なものにすることができる。従来の
ニューラル・ネットワーク8はプール信号を取扱い、第
1図に示すようにほぼ層状に構成されている処理素子か
ら成る。この信号はパターン認識ネットワークにおいて
は画素を、プロセス制御システム・ネットワークにおい
ては装置の状態をそれぞれ表わすことができ、ニューラ
ル・ネットワーク及びエキスパート・システムによりて
処理されるその他の信号または値を表わす場合もある。
ニューラル・ネットワークは複数の層、即ち、複数の入
力ノード12を含む入力層10、複数の出力ノード16
を含む出力層14から成り、複雑な問題、即ち、線形分
離が不可能な問題を解くため、従来のニューラル・ネッ
トワーク8は通常、入力層10と出力層14の間に、ネ
ットワーク内での位置に因んでかくれ層(h+dden
 1ayers) とも呼称される1つまたは2つ以上
の層18−22を含む。かくね層はそれぞれノード24
及び26をも含むや原則としてネットワーク8中には複
数のかくれ層が存在し得る。かくれ層が増えるとネット
ワーク内での直列処理の量が増加するが、そのネットワ
ーク8により得られる解答が明確なものになる可能性が
ある。かくれ層を1つしか含まないネットワークでも任
意の機能を形成できる、即ち。
任意の問題を解くことができることは理論的に立証済み
であり、従って、従来の3層ニューラル・ネットワーク
は任意の問題を解くフォールト・トレラント・システム
を開発するのに必要なすべての特徴を具えていることに
なる。公知のニューラル・ネットワーク8はほかに、ニ
ューラル・ネットワーク8による認識すべきパターンの
学習を可能にするトレーニング・ノード30を備えるト
レーニング層28をも含む。公知のニューラル・ネット
ワーク処理は重みベクトルと入力ベクトルの内積を求め
、これをなんらかの閾値と比較するという単純なもので
ある。第2図は入力及び出力層を含むネットワークのす
べての層に利用されるタイプの公知のニューラル・ネッ
トワーク処理素子構造またはノードを示す。このノード
40は方程式1に示すようにリンケージ入力信号×1に
重みAIを乗算することによフてリンケージ出力信号を
形成するリンケージ素子42またはアルゴリズムを含む
yl=AIX!           (1)処理素子
間の接続が励起的か抑止的かに応じてリンケージ重みA
iは正または負となる。これらのリンケージ出力信号y
1が累算され、方程式2で示すように閾値θと比較され
る。
y=圧8?′I≧θ=と、公1x星≧θ  (2)この
公知アルゴリズムにより、重み付き情報で推論するとい
う古典的な判断方法を実行できる。
このようなアルゴリズムは加重合計と呼称され、各ノー
ドはパターンを知覚できることからバーセブトロンと呼
ばれることがある。加重合計アルゴリズムそのものは多
数の関連生データを単一のデータに統合するのに利用さ
れる統計約手゛法である。このプロセスはニューラル・
ネットワークの入力層(10)においてマルチ・センサ
ーの融合を行なうのに極めて有用である。このプロセス
はニューラル・ネットワークの出力層において複数の判
断源からのコンセンサス形成にも極めて有用である。公
知のニューラル・ネットワークはプール信号だけを取扱
うものであるから、加重合計によるこの統合の結果は再
びプール信号に変換しなければならない。これは上記ア
ルゴリズムにおいて加重合計yを閾値θと比較し、もし
不等関係が妥当でなければO(偽)を、もし不等関係が
妥当なら1(真)を戻すことによって達成される。
上述した単純閾値関数の代りに、変換関数比較素子46
を介して合計素子44からの出力に作用するシグモイド
関数のような複合閾値関数を使用することもできる。ト
レーニング段階において、各ノードの入力信号に加えら
れる重みAiを調整するため、従来はエラーのバック・
プロパゲーションに基づく種々のトレーニング・アルゴ
リズムが重み計算ユニット48によって利用されている
方程式2の関数はオフセットが冗長であることからオフ
セットを含まない。オフセットは加算が存在するから閾
値θに簡単に吸収される。単一合計閾値処理素子はプー
ル論理関数をすべて形成できるわけではなく、例えば、
2入力の場合には16個の関数のうち14個(の線形分
離可能な関数)だけを形成でき、表1に示すように線形
分離が不可能な関数である排他的論理和または同値(排
他的否定論理和)関数を形成することはできない。なお
、表1においてZは集合(偽、真)である。
(以  下  余  白) 関   数 真 偽 ot  x ot  y ANDy (NOTX)ANDy − xAND(NOTy) (NOTx)    − AND(NOTy) x ORy (NOTx)ORy  − xOR(NOTy) (NOTX)    − 0R(NOTy) x  XORY x  EQV  y 表    1 合計閾値 2入力の場合 Z;(0,1)  z Ax  Ay  θ 0 0−1 0 0 1 1 0 1 0 1 1 1 0 0− 0 1 0 1 1 2 1 1 1− 1−1 1 −10− = (−1、1) Ax   Ay   θ 0    0  −1 01 1    0    1 11 1    0    1 0  −1    1 1    1    1 1    1    1 1  −1    1 1  −1    1 1    1    1 1    1    0 1  −1    0 1   −1   −1 不可能 不可能  1 1 −1 −1 1−1 =1−1 不可能 不可能 方程式2がプール関数を全部が全部まで形成できなくて
も、これらの素子を複数層から成るネットワークに使用
すれば、これらの素子の組み合わせが任意の論理関数を
形成できるから実際には問題とならない。即ち、単一合
計閾値処理素子が汎用論理素子NOR,汎用論理素子N
AND及び基本プール論理関数−式、即ち、AND、O
R及びNOTを形成できるからである。
単一の公知処理素子がエミュレートできるプール論理関
数の個数は表2の3列目に示すように入力数の増大と共
に急激に増大する。
表   2 汎用処理素子とパーセプトロン における論理関係の個数比較 1              4         
           42            
16                  143  
        256              
  1044    65.536         
  1.8825 232〜4 ・ 10”     
    93. 8526    264〜10″  
   〜1 、4 ・ 107表2は仮定の汎用処理素
子が形成し得るプール論理関数の最多個数を公知のノー
ドまたはバーセブトロンが1〜6入力の場合に形成し得
るプール論理関数(線形分離可能関数)の実個数と比較
している。表2から明らかなように、入力の個数が3以
上の場合、仮定の汎用処理素子は(パーセプトロンの項
に記載しであるように)公知装置よりもはるかに多数の
プール論理関係を形成する(汎用処理素子の項に示す)
が、必ずしもすべてのプール論理関数を形成する必要は
ない。このことから示唆されるように、コンパクトな高
速ニュートラル・ネットワークを構成するための例えば
汎用処理素子のような強力な処理素子は線形分離不能な
プール論理関数を形成するように特殊設計された処理素
子となる。
本発明の目的は確率に基づく線形変換リンケージ素子に
より従来のニューラル・ネットワークのノードを改良す
ることにある。
本発明の他の目的は線形変換の積を求める、確率に基づ
〈従来よりも強力なニューラル・ネットワーク処理素子
を提供することにある。
その積に対してテストを行なうニューラル・ネットワー
ク閾値素子を提供することも本発明の目的である。
線形分離可能な論理関数だけでなく線形分離不能な論理
関数をも形成する従来よりも強力な処理素子を提供する
ことも本発明の目的である。
本発明のさらに他の目的は2層のニューラル・ネットワ
ークの実現を可能にするニューラル・ネットワーク・ノ
ードを提供することにある。
べき級数展開素子を利用する場合、汎用ニューラル・ネ
ットワーク処理素子を提供することも本発明の目的であ
る。
上記目的は入力信号を線形変換する事前処理装置によっ
て達成される。事前処理装置の出力はこれらの線形変換
の積として結合される。次いでこの積が閾値に基づいて
検討される。この処理素子の構成は入力データと出力結
果との間の非線形変換を行なうという点で独自である。
従って、この処理素子は独力で線形分離可能及び線形分
離不能プール論理関数を形成する。このような処理素子
を使用すれば、判断を求められる任意の問題を解く2層
ニューラル・ネットワークを構成することがで咎る。事
前処理にべき級数展開を利用すれば、汎用処理素子が得
られる。
本発明のニューラル・ネットワーク素子の一実施例は入
力値を変換する入力手段と、変換久カ僅の積を形成する
結合手段とを含み、前記入力手段は各入力値を線形変換
するか、またはXiが入力値を、Aikが定数をそれぞ
れ表わすとじてΣA lkX I’ ff1l を行なうか、またはXiが入力値を、Ai及びB、が定
係数を、θが閾値をそれぞれ表わすとして π (A+  Xi  +Bi  )>θを行なうこと
によって各入力値をべき級数変換する。この実施例は直
接探索によって素子にパターンを教示するフィードバッ
ク手段をも含むことができる。
ニューラル・ネットワーク素子の他の実施例はXlが入
力値を、AI及びB、が定数を、ylが変換値をそれぞ
れ表わすとして、yl −At Xi+B、に従フて入
力値を線形変換する入力手段と、yが結合値を表わすと
して、 y=fl−?′+ に従って線形変換値を結合する結合手段と、結合値を閾
値と比較し、閾値が満たされれば出力を形成する比較手
段と、直接探索によって定数の値を求める教示手段を含
む。
ニューラル・ネットワークの他の実施例は互いに接続す
る第1及び第2ニユーラル・ノードは層を含み、その層
の各ノードはAiが定数を、Xiが入力値をそれぞれ表
わすとして、 ΣA I x。
1=1 を行なう変換手段と、前記入力層と接続し、且つそれぞ
れが、Bl及びC1が変換係数を、y息が入力ノードの
1つからの値をそれぞれ表わすとして π (B+  ’j I +C+  )五ml を行なう変換ノードから成る2進ツリー変換層と、前記
変換層と接続し、且つそれぞれが、DIが定数を、Zi
が変換ノードの1つからの値をそれぞれ表わすとして Σ DI  Zl 1m+ を行なう出力ノードから成る出力層を含む。
さらに他の実施例として、a、b、c及びdが2ビット
係数を、X及びyが1ビット入力層号を、θが1ビット
閾値を、2が1ビット出力をそれぞれ表わすとして ((a −x+b)・(c−yld)>θ)−+zを行
なう論理回路からニューラル・ネットワーク・ダイアデ
ィック処理素子を構成することができる。
本発明はまた、alが2ビット線形変換係数を、b、が
1ビット線形変換係数を、θが1ビット符号制御を、X
iが1ビット入力層号を、2が2ビット出力をそれぞれ
表わすとしてを行なう論理回路から成るニューラル・ネ
ットワーク収縮ダイアデイック処理素子として実施する
こともできる。
本発明はそれぞれのノードごとに、(a)入力値を変換
し、(b)変換入力信号の積を形成するステップから成
り、前記ステップ(a)において入力値を線形変換する
かまたは入力値をべき級数展開し、さらに、(c)前記
績を閾値と比較し、閾値が満たされれば出力を形成する
ステップをも含むニューラル・ネットワーク・ノードを
作用させる方法として実施することもできる。この実施
例においては、Xiが入力値を、AI及びBlが係数を
、θが閾値をそれぞれ表わすとして、ステップ(a) 
−(c)において、 π (Ai  Xi  +81  )≧θIll+ が行なわれる。ステップ(a)においては変換係数を利
用して線形変換を行なうことができ、ステップ(c)で
は直接探索によって変換係数を求めることができる。こ
の方法実施例は入力層及び出力層を含むニューラル・ネ
ットワークに応用でき、入出力層における各ノードはC
,が定数を、X、が入力または出力値をそれぞれ表わす
としてステップ ΣCI Xl i*+ を行なう。
上記及びその他の目的、長所は添付図面に沿って以下に
述べる構成及び作用の詳細な説明から明らかになるであ
ろう。なお、添付図面中、同様の部分には同様の参照符
号を付した。
本願明細書に記載のニューラル・ネットワーク・ノード
及びネットワーク自体は1989年6月12日付米国出
願第07/364,475号に対応し、その内容を本願
明細書の一部として引用している平成2年6月12日付
日本出願“確率に基づく推論システム”に基づくもので
あり、該出願の内容については第17−20図を参照し
て詳細に説明する。第3図に示すように、ニューラル・
ノード60は単純含意または線形変換を行なう改良型リ
ンケージ・アルゴリズムまたは素子を含む。単純含意ア
ルゴリズムは方程式3に示すようにリンケージ入力信号
x1に重みAiを乗算し、オフセットを加算することに
よってリンケージ出力信号yiを求める。
yi=A+ Xi 十B+        (3)確率
に基づく作業にはリンケージ・オフセットが必要である
。リンケージ・オフセットがなければ、即ち、B、−0
なら、このアルゴリズムまたは素子は簡略化されて方程
式1で表わされるような公知のリンケージ素子となる。
複合含意に使用されるアルゴリズムまたは素子62は方
程式4で示すように入り信号Xiをべき級数変換するこ
とによりリンケージ出力信号yiを求める。
’Jl=ΣA lkX 、it          (
4)A 、に= O1k≠1なら、このアルゴリズムは
簡略化されて公知のニューラル・ネットワーク・リンケ
ージ・アルゴリズムであり、A Ik= Olk>1な
ら単純含意アルゴリズムとなる。リンケージ・アルゴリ
ズムとなる。リンケージ・アルゴリズムが複雑になれば
なるほど精度が高くなり、従って適正な含意決定が可能
になる。リンケージ出力を形成する個別部品、ソフトウ
ェア及び専用プロセッサーによる線形変換(方程式3)
及びべき級数展開(方程式4)の実行については本願明
細書中にその一部を形成するものとして引用した前記出
願を参照されたい。上記リンケージ・アルゴリズムまた
は素子はいずれも公知のリンケージ素子42中に使用さ
れた場合の公知ノードの意志決定をも改善する。
改良型リンケージ・アルゴリズムまたは素子62を有す
るニューラル・ネットワークを逐次処理システムでシミ
ュレートすると、推論能力は高くなるものの、計算が増
大する。ところが上記出願の確率に基づく推論システム
を利用してニューラル・ネットワークを構成すれば、は
とんど代価なしに推論能力の向上を享受できる。
用途に関係なく、べき級数展開を利用するリンケージ・
アルゴリズムまたは素子における項の数は2つの矛盾す
る条件、即ち、1)複雑性を軽減することによって処理
素子の個数を最大限に増やすこと及び2)複雑性を高め
ることによってより正確な解を得ることの2条件をバラ
ンスさせてから選択する。
この処理素子は2つ以上のリンケージ・ユニット62か
らの信号を結合しなければならない。
既に述べたように、従来のニューラル・ネットワークは
入り信号の和に基づいて閾値またはシグモイド機能を行
なう、これに対して、本発明のアプローチは飽くまでも
確率理論に基づくものであり、この点が従来のニューラ
ル・ネットワークと本発明のニューラル・ネットワーク
との大きな相違点である。リンケージ信号を結合する本
発明の素子64は線形変換されたマルチ・ビット入力信
号の積を求める。この方式は確率理論に基づく証拠プロ
パゲーションの法則と完全に符合する。
確率に基づくニューラル・ネットワーク処理に使用され
るアルゴリズムまたは素子(ノード)は下記方程式に従
って作用する。
係数A及びBは親出願のアプローチ、関連出願の選択ア
プローチまたは本願明細書に記載の表に従って求めるこ
とができる。既に述べたこの素子の構成部分を第3図に
示した。このニューラル・ノード素子60は方程式3に
よってリンケージを行なうための線形変換素子または方
程式4で表わされる機能を果たし、積ユニット64を含
む(図示のような)べき級数変換ユニット62を含むこ
とができる。これらのユニットは詳しくは後述するハー
ドウェアまたはソフトウェア素子を用いて実現すること
ができる。個別部品方式による方程式5で表わされる閾
値比較演算は閾値を記憶するレジスター及び公知の個別
マルチビット・コンパレータ−によって行なうことがで
きる。ソフトウェアによって実現する場合、比較は公知
の比較ステップによって行なわれることになる。専用プ
ロセッサーによって実現する場合、マルチビット・コン
パレーター及びレジスターも利用できる。処理素子64
の出力信号は詳しくは後述する学習ア゛ルゴリズム66
を介してフィードバックされる。この素子60は方程式
5で表わされる動作を行なう。この素子60は公知ネッ
トワーク8のかくれ層ノード24/2Bに好適である。
公知ノード素子の代りにこのノード素子を利用すること
により、この単一積閾値素子は表3に示すようにダイア
デイック処理素子として可能な限りのすべての論理関数
を出力することができる。
(以 下 余 白) 表   3 積閾値 2入力の場合 zw (0,1)  zz (−1,1)問  数  
   Ax  Bx  Ay By θ   Ax  
ax  Ay  By   θ真       000
 ・0−10000−1偽       00001 
  0000  1x     2−1011  10
01 1、Y     012−11  0110 1
not x    −21011−10011noty
    01−211  01−10 1xANDy 
  20201  1111 1(NOTx)ANDy
  −22201−11’l  1 1xAND(NO
Ty)  2 0−2 2 1  1 1−1 1 1
(NOTx)    −22−22−1−11−11−
IAND (NOTy) xORy    2−2−2 2−1  1−1−1 
1 −1(NOTx)ORy  −20−22−1−1
−1−11−1xOR(NOTy)   2−2 2 
0−1  1−1 1 1 −1(N(lTx)   
 −202(1−1−1−111−108tNory) xXORY   −212−11−10101xEQV
y    2−12−11  1010 1表3から明
らかなように、方程式5に従って積閾値関数を満たせば
極めて強力な閾値素子が形成される。
オフセットを含む方程式5を満たすには多数の係数が必
要であり、従って、記憶量も増大する。
そこでB係数を省けば係数の個数を減らして方程式6に
示すようなオフセットなしの積閾値関数となる。
y±πAi  Xi  >θ            
(6)i*+       − この素子は各入力と対応の重みとの積を求め、次いでこ
れらの重み付き入力の積を形成する。
この素子は形成された積の値を閾値と比較することによ
って出力を形成する。この素子は装置部分集合または上
記ステップで実現することができる。
(以 下 余 白) 表   4 オフセットを含まない積閾値 2入力の場合 2冨(0,1)z=(−1,1) 関   数   Ax   Ay   θ    Ax
   Ay   θ真      0   0−1  
  0   0−1偽      001001 X      不   可   能   不   可 
  能y      不   可   能   不  
 可   能not  x      不   可  
 能   不   可   能not  y     
 不   可   能   不   可   能xAN
Dy     1    1    1    不  
 可   能(NOTx)ANDy  不   可  
 能   不可能xAND (NOTy)  不   
可   能   不   可   能(NQTX)  
   不   可   能   不   可   能A
ND(NOTy) x  ORy     不   可   能   不 
  可   能(NOTx)ORy   不   可 
  能   不   可   能xOR(NOTy) 
  不   可   能   不可能(NOTX)  
  −110不   可   能OR(NO73F) x XORY    不   可   能  −111
x  EQV  y     不   可   能  
 1   1   1表4から明らかなように、ダイア
デイック処理素子の場合、オフセットのない方程式6で
表わされる積閾値関数からは4つのプール論理関数しか
得られず、この4つの論理関数は進及び偽に対応して設
定された値に応じて異なる。処理素子から成るネットワ
ークにおいてこの積閾値関数は設定された真/偽表現の
パリティ−次第では普通関数となる。例えば、Z−[0
,11なら、パリティ−は奇数であり、この関数はNA
ND : xNAND:Y= (NOT  X)OR(
NOT  y)を形成するから普遍であり、Z−[−1
,1]なら、パリティ−は偶数であり、この積閾値関数
は普遍ではない。
(以 下 余 白) 公知のエキスパート・システムは論理演算の代りに極値
関数を利用するファジー論理と呼ばれる新しいタイプの
論理を導入した。最小、最大閾値関数という2種類の極
値関数はファジー論理理論の当然の外延である。本発明
における最大閾値素子は方程式7で表わされる。
y−MAX [AI Xi+B+ ] >θ  (7)
この方程式によって各入力の簡単な線形変換が行なわれ
、次いで最大値が得られる。この結果を閾値と比較する
ことによって出力が形成される。
この素子は上記リンケージ素子と先行の最大値を記憶す
る第ルジスターを利用して実現することができ、前記先
行最大値は公知のコンパレーターまたは比較ステップに
より、第ルジスターに記憶されている2個の値のうち大
きい方の値と比較される。コンパレーターまたは比較ス
テップを、閾値を記憶している第2レジスターの内容と
を併用することによって最終比較を行なう。
表   5 オフセットを含む最大閾値 2入力の場合 Z=(0,1)  Z=(−1,1 関   数   ^x  ax  Ay  By  θ
   ^x  ex  Ay By真       0
000−1   0000偽       00001
   0000x     2−1001  1000
y    002−11  001O NOT x    −21001−100010丁 y
  ’     00−211    0O−10x 
 AND  y    不   可   能   不 
  可(NOTx)ANDy  不   可   能 
  不   可xAND (NOTy)  不   可
   能   不   可(NOTx)ANI)   
不   可   能   不   可(NOTy) xORy      2−12−11   1010(
NOTx)ORy   −212−11−1011xO
R(NOTy)    2−1−2 1 1   1 
0−1 0(NOTx)OR−21−211−10−1
0(NOTy) x  XORy    不   可   能   不 
  可x  EQV  y    不   可   能
   不   可表5から明らかなように、ダイアデイ
ック処理素子の場合、最大閾値関数からは10個の論理
関数が得られるだけである。
ここでも厖大な個数の係数とこれに対応する大きい記憶
量を軽減するためにはB係数を省けばよい、その結果オ
フセットのない方程式8に示すような最大閾値が得られ
る。
y−MAX [A+ Xs ]≧θ    (8)この
素子またはアルゴリズムは各入力と対応の重みとの積を
求め、次いで最大値を見出す。この結果を閾値と比較す
ることによって出力を形成する。上述した装置部分集合
でこのノードを実現することができる。
(以 下 余 白) 表   6 オフセットを含まない最大閾値 2入力の場合 (0,1)  Z−(−1、 Ay θ Ax  Ay o−to。
0 1 0 0 −1  1  1  0 1 1 0 1 可   能  −10 可   能   0−1 可   能   不   可 可   能   不   可 可   能   不   可 可   能   不   可 − 関   数   Ax 真      O 偽      O 1 y      −t NOT x不 NOT y不 x AND y不 (NOTx)ANDy不 xAND (NOTy)不 (NOTx)AND不 (NOTy) x  ORy      t (NOTx)ORy不 X0R(NOT!IT)不 (NOTx)OR−1 (NOTy) x XORy不 x EQV y不 1    1    1    1 可   能  −11 可   能    1−1 −10−1−1 可   能   不 可   能   不 可   能 可   能 表6から明らかなように、オフセットを含まない最大閾
値関数からは真偽を表わすために設定された値に応じて
10個または6個の論理関数が得られる。いずれの場合
にも閾値関数はNANDを含むからこれらの処理素子か
ら成るネットワークにおける普遍素子である。
本発明の確率論でいうところの最小閾値関数は方程式9
を用いて得られる。
y=MIN  [A+  Xi  +B+  3>、θ
    (9)この素子またはアルゴリズムは各入力の
簡単な線形変換を形成し、最小値を見出す。この結果を
閾値と比較することによって出力が形成される。
この素子は上述した個別部品またはステップを用いて実
現することができる。
(以 下 余 白) 表   7 オフセットを含む最小閾値 y=(NOT  x)AND(NOT  y )であり
、従ってこの素子は普遍である。
ここでもB係数を省くことによりて係数の個数を減らし
、方程式lOで表わされるようなオフセットを含まない
最小閾値関数が得られる。
Y=M I N [A+ Xi ] >θ     (
10)この素子またはアルゴリズムは各入力と対応の重
みとの積を求め、次いで最小値を見出す、出力はこの結
果の値を閾値と比較することによって形成される。ここ
でも上述した個別部品またはステップを利用してこのノ
ードを実現することができる。
(以 下 余 白) 表7から明らかなように、最小閾値関数からはダイアデ
イック処理素子の場合NORを含む10個の論理関数が
得られるだけである。x  NORオフセラ Z = 関   数   Ax 真      O 偽       O X不 y不 N0Tx −I 0TyO xANDy 1 (NOTx)ANDy不 xAND (NOTy)不 (NOTX)AND−1 (NOTy) x ORy不 (NOTX)ony不 xOR(NOTy)不 (NOTx)OR不 (NoTy) x XORy不 x EQV y不 表   8 トを含まない最小閾値 2入力の場合 (0,1)  Z=(−1、 Ay θ Ax  Ay −100 0100 可   能    10 可   能   01 0−10 100−1 1    1    1    1 可   能  −11 可   能   1  −1 −10−1−1 可   能   不   可 可   能   不   可 可   能   不   可 可   能   不   可 可   能   不   可 可   能   不   可 表8から明らかなように、ダイアデイック処理素子の場
合、この最小閾値関数、アルゴリズムまたは素子は真偽
を表わすため設定された値に応じて10個または6個の
論理関数を形成する。この閾値関数はNORを含むから
、これらの処理素子から成るネットワークにおける普遍
素子である。
既に述べたように、従来のニューラル・ネットワーク素
子(パーセブトロン)から成る3層ネットワークは任意
の意志決定問題を解くことができる。3層の場合、ニュ
ーラル・ネットワーク・コミユニティ−はエラー・バッ
ク・プロパゲーションに基づく種々の学習ルーチンの1
つを利用してかくれ層の処理素子に対する重み割り当て
の問題を解決しなければならなかった。この問題は従来
のニューラル・ノード素子が線形分離可能な問題しか扱
えないことに起因する。既に表3に関連して述べたよう
に、本発明は線形分離可能な問題を扱うだけでなく線形
分離可能な問題をも扱うネットワーク素子またはノード
を提供する。従って、方程式5に示した本発明の処理素
子は従来は3層ネットワークによって解決され、意志決
定が下された問題のすべてを第4図に示すような2層で
解決し、意志決定することができる。かくれ層が存在し
ないから、本発明は重みを適応させるためにエラー・バ
ック・プロパゲーション・ルーチンを必要としない、即
ち、本発明は出力層に入る重みを、例えばクラシックな
漸次降下または後述する好ましい学習アルゴリズムのよ
うな簡単な最適化ルーチンを用いて適応させることがで
きる。N3図に示すように処理素子が簡単であり、しか
も問題を解くのに必要な層数が少ないから、本発明では
いかなる意志決定の問題をも迅速に解くことができる。
本発明の詳細な説明するため、クラシックな排他的論理
和の問題を例に取って、従来のニューラル・ネットワー
ク素子がこの問題を解くのに3層ネットワークを必要と
するのに対して本発明は線形分離不能な問題をも2層で
解けることを論証する。第5図は方程式2を実行する従
来の処理素子を利用して排他的論理和の問題を解く場合
の一例を示す、この2ビット排他的論理和ニユーラル・
ネットワークにおいては第1層の各ノード70が同じ重
みを付けられたビットの1つを受信し、各ノード7は同
じ閾値を有する。第2層では入力に対する重み付けAが
それぞれ異なり、閾値は同じである。第3層では入力に
対する重みが同じである。この例からも明らかなように
、3層が必要である。第6図は同じ問題を第3図の処理
素子60を用いたニューラル・ネットワークによって解
く場合を示す、この解決法では、第1層における線形変
換の重み及びオフセットはどちらの1ビット入力に対し
ても同じである。第2層のノードはリンケージ線形変換
処理の過程でそれぞれ異なる重み及びオフセットを付加
し、閾値と比較する前にリンケージ出力を乗算する。
第7図に示すように、確率を入力とする2進判断ツリー
の形にニューラル・ノードを構成することによって本発
明を実施することもできる。
同様に、2進ツリー及び層以外の構造、例えば、リング
、スターまたはカラム・ネットワークとして構成するこ
とも可能である。2進ツリー構造は好ましくは上記出願
0確率に基づく推論システム“に記載されているように
実施する。この場合、判断の閾値関数はツリー構造中に
マツプされているから、方程式5で表わされる閾値比較
演算を省くことができる。確率に基づく2進ツリー構造
の長所は確率論に関する法則に従って情報に対して数学
的な演算を行なうことにある。入力を線形変換し、例え
ば、直接探索のような学習方法で2進ツリー構造におけ
る積演算を用いて入力を結合するノードの組み合わせが
適応確率推論システムを形成する。このような確率に基
づく判断ツリー構造は従来のニューラル・ネットワーク
やその他のエキスパート・システム構造と異なり、本来
的に確認可能かつ検証可能である。この適応確率推論シ
ステムはホスト・コンピューター86により簡単な入力
記憶ノード85を介して、直接パターン探索学習アルゴ
リズムによって形成された重みを有する入力を学習する
ことができる。
第7図に示すような2進ツリーに第3図のノード素子6
0を使用する場合、極めて強力であるにも拘らず、素子
60は確率に基づく2進ツリー・ネットワークの入出力
層における証拠固めには不適当である。従って、入力層
82及び出力層84における情報結合に適した処理素子
80またはアルゴリズムが必要になる。
第7図に示すような確率に基づくネットワークの入/出
力層において生入力データを同化し、いくつかの異なる
推論ラインからの出力結果を統合するためには、方程式
11に示す機能を行なう確率に基づく加重合計処理素子
を利用する。
y = Σ (A+  V  I )        
          (11)ll ただし、yiは線形変換でもべき級数展開でもよい、入
出力処理素子として有効であるためには、方程式11の
重みが方程式12に示すように制限されねばならない。
ΣAム< 1           (12)i冒1 
 − 第8図は第7図のネットワークにおける入/出力層のノ
ードとして好適な確率に基づく加重合計処理素子を示す
、この素子は方程式3及び4の機能を行なうリンケージ
・ユニット94及び方程式3.4の結果を合計する合計
ユニット96を含む。学習素子98の機能、即ち、フィ
ードバック・アルゴリズムについては詳しく後述する。
従来のニューラル・ネットワーク処理素子が論理信号で
作用するのに対して確率に基づく加重合計処理素子はマ
ルチ・ビット信号Pi、P2・・・・で作用する。また
、従来のニューラル・ネットワーク処理素子が第2図に
示すように変換関数を必要とするのに対して、第8図の
確率に基づく加重合計処理素子は必要としない。この新
しい処理素子を確率に基づくニューラル・ネットワーク
に使用することにより入/出力層における必要な事前処
理または事後処理を行なうことができる。
ニューラル・ネットワークにおける学習アルゴリズムは
ニューラル・ネットワークに、入り信号に付加される重
みを変えることによって環境変化に適応する能力を与え
る6本発明が利用する学習アルゴリズム(66/88)
はJournal of theA(:M、 vol、
8. pp、212−229に掲載されたRobert
)1ooke及びTarry^、 Jeeves (1
961)の” ’DirectSearch’  5o
lutIon  of  Numerical  an
d  5tatistical Probie++s″
において取り上げられ、最適化に間する本願関連の出願
に詳述されているHooke/Jeeves直接探索ア
ルゴリズムであり、両文献共にその内容を本願明細書の
一部を形成するものとして引用した。この直接探索アル
ゴリズムはネットワークの費用関数を最適化し、広く採
用されているエラー・プロパゲーションに関するデルタ
法よりも迅速かつ確実である。直接探索アプローチはた
とえ費用関数が不連続であっても、また、関数パラメー
ターが極く限られた離散値を取る場合であっても有効で
ある。直接探索アプローチは問題の解に収斂する一連の
試行的解を求める戦略である。特に有効な直接探索ルー
チンは第9図にそのフローダイヤグラムを示すパターン
探索である。
このパターン探索は1つの試行点から他の試行点へ移行
する際に2種類の移動を利用する。第1のタイプは知識
を得るための小さい探査移動、第2のタイプは移行する
ーための大きいベクトル8勤、即ち、パターン移動であ
る。パターン移動の方向は先行の探査及びパターン移動
から得られたすべての知識を統合した結果である。パタ
ーン探索のための全面的な戦略及び作戦は上記論文に記
載されている。ネットワークによる実行または診断サイ
クルに続いて、ホスト・コンピューター84は初期ベー
ス・ポイントにおける関数評価からスタートする。次い
で学習アルゴリズムは探索のための適正なステップ・サ
イズが求まるまで循環するループに入る。最初のステッ
プとしてベース・ポイントにおいてスタートし、探査移
動を行なう。ネットワークの重み係数を変えながら探査
移動が行なわれた後、評価がなされる。この評価によっ
て関数値がベース・ポイントにおける関数値以下である
か否かが判定される。即ち、このアプローチは最適解に
おける極小を求めるものである。もし現在値がベース・
ポイントにおける関数値よりも小さくなければ、ステッ
プ・サイズが充分小さいかどうかの判定がなされる。充
分小さくなければ、ステップ・サイズが縮小され、再び
ループがスタートする。もし関数値または費用関数が低
ければ、新しいベース・ポイントが設定され、パターン
移動が行なわれる。パターン移動が行なわれたら、関数
値のテストに続いてさらに探査移動が行なわれる。本発
明のノードに使用される重みA及び係数Bを求めるにパ
ターン直接探索を利用する方法についてはニューラル・
ネットワーク最適化に係わる関連出願にその詳細が開示
されている。
以上の説明は方程式5の稜間値演算・、方程式6−10
の変形、及び入出力演算のための方程式11を行なう処
理素子60を中心に述べた。これらの素子はマルチビッ
ト個別バスワイド部品、ソフトウェア・ルーチン及び専
用プロセッサーの形で実施することができる。線形変換
入力信号に作用する極めて高速の稜間値素子を得るため
には、専用の論理素子成分ノード60を構成すればよい
0次にプログラマブル・ダイアデイック処理素子の6通
りの実施例及び上記稜間値演算を行なうプログラマブル
収縮処理素子の一実施例のための2進論理ユニツトを説
明する。これらの論理ユニットは従来のニューラル・ネ
ットワークのパーセブトロンの代りに使用することがで
きる。
ダイアデイック処理素子は下記の変換を行なう。
((a  −x+b)・(c  −y+d)>θ)  
−z  (13)係数a、b%C及びdは1乃至2ビッ
トで表わすことができるが、閾値θ、入力バラメーター
X及びy、及び出力変数2は1ビットで表現できる。
a、b、c及びdの値は上記各表から、または上記直接
探索法を適宜利用して求めることができる。
方程式13の関数の内部表示は第10図に示す33ゲ一
ト回路によってすべて行なうことができる。この回路は
バイポーラ−技術を利用すれば毎秒250,000.0
00 イ’、tターコネクトで、VLS 1技術を利用
すれば毎秒25,000,000インターコネクトで動
作することができる。
もっとコンパクトな表示方式としては、線形変換入力信
号に対するシグナム関数演算を利用することによって回
路設計を改良する。第11図に示すように、8ゲートの
プロパゲーション遅延を有する26ゲ一ト回路がこの目
的を満たし、バイポーラ−技術を利用すれば毎秒250
,000,000インターコネクトで、VSLI技術を
利用すれば毎秒25.000.000インターコネクト
で動作することができる。
さらに改良を加えたコンパクトな内部表示装置では出力
段を組み合わせることによってゲート・カウントを減ら
し、処理をスピードアップする。
第12図に示すように、方程式13を実行する、プロパ
ゲーション遅延が6ゲートの25ゲ一ト回路を利用する
が、この回路はバイポーラ−技術を利用すれば毎秒33
0,000,000インターコネクトの速度で、VLS
I技術を利用すれば毎秒33.000,000インター
コネクトの速度で動作することができる。
入力段に変更を加え、出力段を組み合わせてゲート・カ
ウントを減らした特殊なコンパクト内部表示装置を第1
3図に示す。これは15ゲート回路であり、ゲート遅延
及び速度特性は第12図と同じであるが、占有スペース
は第12図の場合よりも狭い。
方程式13を実行するプログラマブル論理処理素子の他
の実施例は入力段を組み合わせることによってフラッシ
ュ線形変換を行なう。第14図に示す実施例はプロパゲ
ーション遅延が4ゲートの19ゲ一ト回路であり、バイ
ポーラ−技術を利用すれば毎秒500,000,000
インターコネクトの速度でVLSI技術を利用すれば毎
秒50,000,000インターコネクトの速度で動作
できる。
第10−14図に示すように段の組み合わせを増やせば
最終的には第15図に示すような方程式13の演算を行
なう表索引プログラマブル論理処理素子が得られる。I
 NS7入力は実行すべき表3中の機能を選択する。こ
のニューラル・ノード素子は必然的に速度を増大させ、
入力線の数を減らし、プロパゲーション遅延が2ゲート
の22ゲ一ト回路が得られ、この回路はバイポーラ−技
術を利用すれば毎秒1.000.000.000インタ
ーコネクトの速度で、VLSI技術を利用すれば毎秒t
oo 、 000.000インターコネクトの速度で動
作することができる。表索引アプローチは極めて高速で
はあるが、入力数及び所要の出力組み合わせ数と共に回
路サイズが増大するから多重入力処理素子としては不適
当である。
第15図に示すフラッシュ・プログラマブル論理処理素
子はフラッシュ線形変換を行なう多重入力処理素子の構
成に好適な構成要件、を具えている。線形変換はアルゴ
リズムの中枢であり、方程式141,7従って収縮タイ
プの装置で行なわねばならない。
((−1)θyc signum(a 、 x r +
 b +)≧1)−z(14)+11ま ただし、シグナム関数はもしその引数がOならOを1個
戻し、もしその引数が正なら0を1個戻し、もしその引
数が負なら−1を1個戻す。
線形変換係数alは2ビットで表わすことができるが、
符号制御θ、入カバラメーターXlb線形変換オフセッ
トb1及び出力変数Zはそれぞれ1ビットで表わすこと
ができる。第16図に示すように、プロパゲーション遅
延が各入力ごとに4ゲート+出力における2ゲートであ
る20ゲ一ト回路は方程式14の機能を行なうことがで
きる32入力装置を形成する。この回路の上半分は入力
Xを線形変換し、下半分に記憶されている先行の結果を
乗算する。演算の過程で先行演算の符号及び絶対値がフ
リップフロップに記憶される。
次の入力群がロードされると、結果が処理され、乗算入
力がトグルされるとフリップフロップの内容を乗算され
る。開始入力がフリップフロップを、絶対値1、符号O
で初期設定する。自伝のように、この回路は上半分が処
理し、下半分がメモリーとして作用する収縮タイプの素
子である。
第16図に示すような回路はバイポーラ−技術を用いれ
ば毎秒240,000,000インターコネクトの速度
で、VLS I技術を用いれば毎秒24.000 、G
o。
インターコネクトの速度で動作することができる。
各チップに50,000個のゲート、128個の処理素
子を形成し、各処理素子ごとに32インターコネクトの
割合で記憶されることができる。
従って、本発明を第16図に示すように実施すれば、公
知のニューラル・ネットワーク・チップ10個分を1個
のチップに集約することができる。第10−16図の処
理素子を利用するネットワークは例えばカリフォルニア
州サン・ホセのXlllnX社製品のようなプログラマ
ブル・ゲート・アレイを使用することによって容易に試
作することができる。従って、第16図のノード構成は
第1.4及び7図に示すニューラル・ネットワークにお
ける並行処理に理想的である。表9は第10−16図の
処理素子構造の比較である。
(以 下 余 白) 表  9 処理素子特性の比較 相互接続速度 回路  ゲート・カウント ?延 バイポーラ−VLS
I  サイズ   メリット構造          
  ゲート)   (Mhz)(Mhz)(ゲート)(
ゲー)/Mhz)フル白部    33    8  
  250   25  47.0  1.96表ホ もし速度を重視し、占有スペースを問題にしないなら、
ダイアデイック処理素子として第15図の表索引プログ
ラマブル論理処理素子が理想的である。逆に占有スペー
スを重視し、速度を問題にしないなら、第13図の特殊
コンパクト内部表示構成が最適である。速度も占有スペ
ースも等しく重視するなら、第14図のフラッシュ・プ
ログラマブル論理処理素子が最適である。3入力以上の
場合、占有スペースを最小限にするには第16図のプロ
グラマブル収縮タイプ処理素子が最適である。3入力以
上の場合、速度を重視し、占有スペースを問題にしない
なら、第15図に示す表索引処理素子が最適である。
本発明の線形変換は第17図に示すような配線式個別部
品ゲート130で行なうことができる。
このゲート130は2つの含意素子132.134を含
み、各含意素子は例えば定数レジスター136.138
、乗算器140及び加算器142を含む。これらの個別
部品は整数部品であることが好ましいが、必要なら浮動
小数点部品であってもよい。含意素子の出力は乗算器で
ある結合素子152によって結合される。このゲート1
30の詳細については上記出願“確率に基づく推論シス
テム”を参照されたい。
有限べき級数展開は Xa ”Aa +A+ X’ +”AnX”  (15
)で表わされる。この多項式の次元は利用可能な遊休時
間、含意関数または含意集合の表現精度及び係数記憶に
利用できるスペースの兼ね合いで決定される。高次元関
数は線形変換の積で表わすこともできる。
XO= rt  [b r  + c IX]    
        (16)111 第1.7図のゲート130は基本的には2つの線形変換
を掛は合わせる機構であるから、第17図に示すゲート
130のような線形ANDゲート162に両入力から同
じ信号が供給されると、第18図に示すように、2次A
NDゲートが構成される。べき級数展開ゲート160は
直列接続された3個の2次ゲート162−166から成
る。
第19図に示すように、ゲート162.166は1対の
定数を記憶するための例えばレジスターのような記憶ユ
ニット168.170.及び入力信号を第1定数と結合
するための乗算器172.174を含む、加算器176
.178が第2定数を乗算結果と結合し、乗算器180
が加算結果を結合することによって高位出力を得る。
べき級数展開は下記帰納式で表わすことも可能である。
YM++  −AM−Ill ◆ YMX、YO−0、
0≦M  <8   (17)X6− ”lH+H−^
o”[A++[A2+[Ai+[A4+[AS  +[
・・・・IXiXiXiXiX]X     (18)
高位AND関数を得るためのこのアプローチは第20図
に示すようなゲートを用いて実現することができる。こ
のゲート190は2つのべき級数展開ユニット192.
194及び乗算器196を含む、各べき級数展開ユニッ
トは入力信号−時記憶装置198、上記方程式の定数A
iを記憶するレジスターまたはメモリー200、及び帰
納的な加算、乗算及びフィードバックを行なうための乗
算器202、加算器204及び記憶装置206を含む。
第18図及び第20図に示す方法はいずれも例えばバス
ワイド乗算器及び加算器のような個別バスワイド・ユニ
ットによって実施することができ、演算を行なう単一処
理ユニットにおいて実施することもできる。例えば、下
記方程式19をコンピューターによフて実行する場合、
第18図のゲートが機能することになる。
Xout=(ΣAIJXi )  (ΣA+hXk) 
 (19)本発明の処理素子は従来のAI(エキスパー
ト)システムまたはニューラル・ネットワーク・システ
ムの確率推論を改善するのに利用できるだけでなく、画
像認識、2Dまたは3D作像、レーダー追跡、磁気共鳴
作像、ソナー追跡及び地震地図作成のため情報または信
号を結合する機構をも提供する。
本発明はニューラル・ネットワークを構成するための処
理素子を提示した。この処理素子は線形変換された入力
信号の積を求めるものであり、コンパクトな、高速ニュ
ーラル・ネットワークを構築するように構成されている
。この処理素子は線形分離可能な論理関数だけでなく、
線形分離不能な論理関数をも形成するから、従来のニュ
ーラル・ネットワーク処理素子よりもはるかにすぐれて
いる。処理素子のべき級数変換方式に伴なう汎用性は任
意の意志決定機能を2層ニューラル・ネットワークで達
成することを可能にする。これは従来のニューラル・ネ
ットワーク処理素子を用いた場合に任意の意志決定問題
を解決するのに必要であった3層ニューラル・ネットワ
ークに比較して著しい改良である。本発明のニューラル
・ネットワークには処理素子のかくれ層が存在せず、そ
の分だけ処理素子の総数が減り、汎用処理素子によって
行なわれるアルゴリズムは極めて簡単であるから、この
汎用処理素子を利用するニューラル・ネットワークは極
めてコンパクトになり、著しく高速化される。本発明の
適応確率推論システムは下記の点で公知のニューラル・
ネットワークと異なる。即ち、(1)処理素子は入力合
計に基づく連続微分可能な出力及び所定の閾値を形成す
るのではなく積を求め、(2)相互接続した処理素子間
を流れる情報に簡単な重み付けをするのではなく、処理
素子間を線形変換またはべき級数変換で相互接続し、(
3)相互接続された大量の処理素子から成る少なくとも
3つの層を必要とし、構造化が乏しい公知二二−ラル・
ネットワークとは異なり、2道ツリー 高度に構造化さ
れたシステムまたは2つの層のカラムとしてエキスパー
ト・システムを構成することがでか、従って、確認、検
証が可能であり、(4)漸次的最適化ではなく直接探索
最適化を採用することにより、解への収斂が従来よりも
はるかに迅速となる。ニューラル・ノードを専用論理ゲ
ートの形で実施することにより汎用方式に比較して著し
く高速化され、超高速動作を必要とするニューラル・ネ
ットワークの課題に応用できる。
以上の詳細な説明から明らかなように、本発明には多様
な特徴及び長所があり、頭書した特許請求の範囲は本発
明の思想及び範囲に該当するこれらの特徴及び長所をす
べて包含するものとする。
さらにまた、当業者にとって種々の変更を試みることは
容易であろうから、本発明は図示、説明した構成及び作
用とそっくり同じでなくともよく、本発明の範囲を逸脱
しない限り、すべての適切な変更及び均等手段に依存す
ることができる。
【図面の簡単な説明】
第1図は、従来のニューラル・ネットワークを示す。 第2図は、従来のネットワーク・ノードを示す。 第3図は、本発明のニューラル・ノードを示す。 第4図は、本発明の2層ネットワークを示す。 第5図は、線形分離不能関数を得るための従来の3層ア
プローチを示す。 第6図は、本発明を利用してXOR関数を得るための2
層アプローチを示す。 第7図は、ツリー構造ニューラル・ネットワークを示す
。 第8図は、第7図の入/出力ノードを示す。 第9図は、本発明において使用される直接探索学習アル
ゴリズムを示す。 第10−16図は、本発明のノードを構成する専用論理
素子を示す。 第17図は、線形変換素子を示す。 第18図は、べき級数展開素子を示す。 第19図は、べき級数展開素子の一実施例を示す。 第20図は、べき級数展開素子の他の実施例を示す。 0・・・・ニューラル・ノード 2・・・・べき級数変換ユニット 4・・・・積ユニット 6・・・・直接探索学習アルゴリズム 4・・・・リンケージ・ユニット

Claims (23)

    【特許請求の範囲】
  1. (1)入力値を変換するための入力手段と;変換入力値
    の積を形成するための結合手段とより成ること を特徴とするニューラル・ネットワーク素子。
  2. (2)前記入力手段が各入力値に関して線形変換を行な
    うことを特徴とする請求項第(1)項に記載の素子。
  3. (3)前記入力手段が各入力値に関してべき級数変換を
    行なうことを特徴とする請求項第(1)項に記載の素子
  4. (4)x_iが入力値を、A_i_kが定数をそれぞれ
    表わすとして、前記入力手段が ▲数式、化学式、表等があります▼ を行なうことを特徴とする請求項第(1)項に記載の素
    子。
  5. (5)x_iが入力値を、A_i及びB_iが定係数を
    、θが閾値をそれぞれ表わすとして、前記入力手段及び
    前記結合手段が ▲数式、化学式、表等があります▼ を行なうことを特徴とする請求項第(1)項に記載の素
    子。
  6. (6)直接探索により前記素子にパターンを教示するた
    めのフィードバック手段をも含むことを特徴とする請求
    項第(5)項に記載の素子。
  7. (7)x_iが入力値を、A_i及びB_iが定数を、
    y_iが変換値をそれぞれ表わすとして、y_i=A_
    ix_i+B_iに従って入力値を線形変換する入力手
    段と; yが結合値を表わすとして、線形変換値を ▲数式、化学式、表等があります▼ に従って結合する結合手段と; 結合値を閾値と比較し、閾値が満たされれば出力を形成
    する比較手段と; 直接探索により定数の値を求める教示手段とより成るこ
    と を特徴とするニューラル・ネットワーク素子。
  8. (8)互いに接続する第1及び第2ニュー ラル・ノード層の各ノードが、x_iが入力値を、A_
    i及びB_iが変換係数を、θが閾値をそれぞれ表わす
    として、 ▲数式、化学式、表等があります▼ を行なうための変換手段から成ることを特徴とするニュ
    ーラル・ネットワーク。
  9. (9)直接探索により変換係数の値を求める学習手段を
    も含むことを特徴とする請求項第(8)項に記載のネッ
    トワーク。
  10. (10)A_iが定数を、X_iが入力値をそれぞれ表
    わすとしてそれぞれが ▲数式、化学式、表等があります▼ を行なう入力ノードから成る入力層と; 前記入力層と接続し、B_i及びC_iが変換係数を、
    y_iが入力ノードの1つからの値をそれぞれ表わすと
    して、それぞれが ▲数式、化学式、表等があります▼ を行なう変換ノードから成る2進ツリー変換層と; 前記変換層と接続し、D_iが定数を、z_iが変換ノ
    ードの1つからの値をそれぞれ表わすとして、それぞれ
    が ▲数式、化学式、表等があります▼ を行なう出力ノードから成る出力層とより成ること を特徴とする適応推論システム。
  11. (11)前記変換ノードを2進ツリーとして接続したこ
    とを特徴とする請求項第(9)項に記載のネットワーク
  12. (12)直接探索により変換係数を求めるため前記変換
    層に接続した学習手段をも含むことを特徴とする請求項
    第(10)項に記載のネットワーク。
  13. (13)a、b、c及びdが2ビット係数を、x及びy
    が1ビット入力信号を、θが1ビット閾値を、zが1ビ
    ット出力をそれぞれ表わすとして、{(a・x+b)・
    (c・y+d)≧θ}→zを行なう論理回路を備えたこ
    とを特徴とするニューラル・ネットワーク・ダイアディ
    ック処理素子。
  14. (14)a_iが2ビット線形変換係数を、b_iが1
    ビット線形変換係数を、θが1ビット符号制御を、x_
    iが1ビット入力信号を、2が1ビット出力をそれぞれ
    表わすとして、 ▲数式、化学式、表等があります▼ を行なう論理回路を備えたことを特徴とするニューラル
    ・ネットワーク収縮ダイアディック処理素子。
  15. (15)ニューラル・ネットワークのノードを演算を行
    なう方法であって、それぞれのノードごとに、 (a)入力値を変換し; (b)変換入力信号の積を形成する ステップより成ることを特徴とする方法。
  16. (16)ステップ(a)が入力値を線形変換することを
    特徴とする請求項第(15)項に記載の方法。
  17. (17)ステップ(a)が入力値をべき級数展開するこ
    とを特徴とする請求項第(15)項に記載の方法。
  18. (18)積を閾値と比較し、閾値が満たされれば出力を
    形成するステップ(c)をも含むことを特徴とする請求
    項第(15)項に記載の方法。
  19. (19)x_iが入力値を、A_i及びB_iが係数を
    、θが閾値をそれぞれ表わすとして、ステップ(a)−
    (c)が ▲数式、化学式、表等があります▼ を行なうことを特徴とする請求項第(18)項に記載の
    方法。
  20. (20)ステップ(a)が変換係数を利用して線形変換
    を行ない、前記方法が直接探索により変換係数を求める
    ステップ(c)をも含むことを特徴とする請求項第(1
    6)項に記載の方法。
  21. (21)直接探索により係数を求めるステップ(d)を
    も含むことを特徴とする請求項第(19)項に記載の方
    法。
  22. (22)ニューラル・ネットワークが入力層及び出力層
    を有し、c_iが定数を、x_iが入力または出力値を
    それぞれ表わすとして、入出力層の各ノードが ▲数式、化学式、表等があります▼ を行なうことを特徴とする請求項第(16)項に記載の
    方法。
  23. (23)入力値を線形変換またはべき級数変換するため
    の入力手段と; 変換入力値を結合するための結合手段とより成ること を特徴とするニューラル・ネットワーク素子。
JP2190378A 1989-10-03 1990-07-17 ニューラル・ネットワーク及び適応推論システム Pending JPH03125257A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US416,626 1989-10-03
US07/416,626 US5073867A (en) 1989-06-12 1989-10-03 Digital neural network processing elements

Publications (1)

Publication Number Publication Date
JPH03125257A true JPH03125257A (ja) 1991-05-28

Family

ID=23650690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2190378A Pending JPH03125257A (ja) 1989-10-03 1990-07-17 ニューラル・ネットワーク及び適応推論システム

Country Status (2)

Country Link
JP (1) JPH03125257A (ja)
DE (1) DE4018779A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10141736A (ja) * 1996-09-11 1998-05-29 Toshiba Corp 快適性指標pmv学習装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5357597A (en) * 1991-06-24 1994-10-18 International Business Machines Corporation Convolutional expert neural system (ConExNS)
DE4120828A1 (de) * 1991-06-24 1993-01-07 Siemens Ag Verfahren zur verarbeitung von unsicherheiten von eingangsdaten in neuronalen netzwerken

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10141736A (ja) * 1996-09-11 1998-05-29 Toshiba Corp 快適性指標pmv学習装置

Also Published As

Publication number Publication date
DE4018779A1 (de) 1991-04-11

Similar Documents

Publication Publication Date Title
US5073867A (en) Digital neural network processing elements
US5517667A (en) Neural network that does not require repetitive training
Tarakanov et al. Immunocomputing: principles and applications
JP3798451B2 (ja) 事前装填回路
CN108364064A (zh) 操作神经网络的方法、对应网络、装置、以及计算机程序产品
JPH08171541A (ja) 集合回路
CN115017178A (zh) 数据到文本生成模型的训练方法和装置
Amakdouf et al. Classification and recognition of 3D image of charlier moments using a multilayer perceptron architecture
US5058034A (en) Digital neural network with discrete point rule space
Dogaru et al. Bconv-elm: Binary weights convolutional neural network simulator based on keras/tensorflow, for low complexity implementations
US5581661A (en) Artificial neuron using adder circuit and method of using same
Ranganath et al. Design of MAC unit in artificial neural network architecture using Verilog HDL
Chen et al. High-accurate stochastic computing for artificial neural network by using extended stochastic logic
US5634063A (en) Neural network and method for operating the same
EP0661645A2 (en) Neural network
JPH03125257A (ja) ニューラル・ネットワーク及び適応推論システム
EP4241206A1 (en) Device and method for implementing a tensor-train decomposition operation
Nepomnyashchiy et al. Method of recurrent neural network hardware implementation
Gisutham et al. A high speed flat CORDIC based neuron with multi-level activation function for robust pattern recognition
RU2279132C2 (ru) Нейронная сеть конечного кольца
Sabbaghi et al. New full adders using multi-layer perceptron network
Vysotskiy et al. FPGA-Based Convolutional Neural Network for Classifying Image Blocks
CN116384445B (zh) 神经网络模型的处理方法和相关装置
Galayko et al. Oleg Nepomnyashchiy1 ()
JP4696529B2 (ja) 多層ニューラルネットワーク装置とそのソフトウェア