JPH04213750A - 層化されたニューラル・ネットワークでの分類方法 - Google Patents
層化されたニューラル・ネットワークでの分類方法Info
- Publication number
- JPH04213750A JPH04213750A JP3039043A JP3904391A JPH04213750A JP H04213750 A JPH04213750 A JP H04213750A JP 3039043 A JP3039043 A JP 3039043A JP 3904391 A JP3904391 A JP 3904391A JP H04213750 A JPH04213750 A JP H04213750A
- Authority
- JP
- Japan
- Prior art keywords
- subgroups
- samples
- neuron
- class
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、階級別に分割される標
本の分類を継起的な二分法(dichotomies)
により実行するのに必要とされる継起的なニューロン
(neuron)の追加によって少なくとも1つの層(
layer) が構築される学習段階(learnin
g steps)を有するところの、層化されたニュー
ラル・ネットワーク(neural network)
中で遂行される分類方法(classificatio
n method) に関する。本発明はまた、この方
法を遂行するニューラル・ネットワークにも関する。
本の分類を継起的な二分法(dichotomies)
により実行するのに必要とされる継起的なニューロン
(neuron)の追加によって少なくとも1つの層(
layer) が構築される学習段階(learnin
g steps)を有するところの、層化されたニュー
ラル・ネットワーク(neural network)
中で遂行される分類方法(classificatio
n method) に関する。本発明はまた、この方
法を遂行するニューラル・ネットワークにも関する。
【0002】ニューラル・ネットワークは分類問題に応
用され、特に、形状及び文字の認識、音声信号の処理、
画像処理、データ圧縮等に応用される。
用され、特に、形状及び文字の認識、音声信号の処理、
画像処理、データ圧縮等に応用される。
【0003】ニューラル・ネットワークは、シナプス係
数(synapticcoefficient)を持つ
シナプス(synapses)により一般的に相互に結
合している非線形のオートマトンで構成される。それは
、在来の逐次処理型コンピュータで扱うことの困難な問
題の処理を可能なものとする。
数(synapticcoefficient)を持つ
シナプス(synapses)により一般的に相互に結
合している非線形のオートマトンで構成される。それは
、在来の逐次処理型コンピュータで扱うことの困難な問
題の処理を可能なものとする。
【0004】
【従来の技術】ネットワークの最も普通の2つのタイプ
というのは: ─ いわゆるホップフィールド・ネットワーク(Ho
pfield networks) と呼ばれる完全に
結合している(fully connected) ネ
ットワーク、と ─ 層化された(layered) ネットワーク:
すなわちニューロンは継起的な層にグループ化され、
各ニューロンはそれに続く層のすべてのニューロンに結
合するものとである。
というのは: ─ いわゆるホップフィールド・ネットワーク(Ho
pfield networks) と呼ばれる完全に
結合している(fully connected) ネ
ットワーク、と ─ 層化された(layered) ネットワーク:
すなわちニューロンは継起的な層にグループ化され、
各ニューロンはそれに続く層のすべてのニューロンに結
合するものとである。
【0005】最も一般的な構造では、情報は入力端子(
受動的−passive− な)から入力層(能動的−
active−な)へ、次いで逐次各隠された層(能動
的な)へ、そして出力層(能動的な)に至るまで、前向
きに供給される。最も簡略化された構造では、情報は入
力端子(受動的な)から単一の(=出力)層(能動的な
)へと前向きに供給される。
受動的−passive− な)から入力層(能動的−
active−な)へ、次いで逐次各隠された層(能動
的な)へ、そして出力層(能動的な)に至るまで、前向
きに供給される。最も簡略化された構造では、情報は入
力端子(受動的な)から単一の(=出力)層(能動的な
)へと前向きに供給される。
【0006】これらのシステムは、標本によるか又は自
己組織(self−organizing) による学
習の能力がある。逐次型コンピュータ(sequent
ial computers)の長い計算時間は、学習
相(learning phases) と分解相(r
esolution phases) とを有する操作
を並列に実行することにより相当軽減することができる
。
己組織(self−organizing) による学
習の能力がある。逐次型コンピュータ(sequent
ial computers)の長い計算時間は、学習
相(learning phases) と分解相(r
esolution phases) とを有する操作
を並列に実行することにより相当軽減することができる
。
【0007】所与の操作を実行するためには、ニューラ
ル・ネットワークはそれを実行する学習を前以てして置
かなければならない。学習相と呼ばれるこの相では、標
本を用いる。多数のアルゴリズムに対してこれらの標本
で得られる出力結果は予め既知である。意図されたタス
クを未だ採り上げていないニューラル・ネットワークは
、最初は誤った結果を出すであろう。そこで、得られた
結果と得らるべきであった結果との間の誤りが明らかに
され、ニューラル・ネットワークに選定された標本を学
習することを許すために、適合判定基準に基づいてシナ
プス係数が変形される。この段階は、ニューラル・ネッ
トワークが満足な学習をするのに必要と考えられる一団
の標本に対して何度でも繰り返される。
ル・ネットワークはそれを実行する学習を前以てして置
かなければならない。学習相と呼ばれるこの相では、標
本を用いる。多数のアルゴリズムに対してこれらの標本
で得られる出力結果は予め既知である。意図されたタス
クを未だ採り上げていないニューラル・ネットワークは
、最初は誤った結果を出すであろう。そこで、得られた
結果と得らるべきであった結果との間の誤りが明らかに
され、ニューラル・ネットワークに選定された標本を学
習することを許すために、適合判定基準に基づいてシナ
プス係数が変形される。この段階は、ニューラル・ネッ
トワークが満足な学習をするのに必要と考えられる一団
の標本に対して何度でも繰り返される。
【0008】学習アルゴリズムは2つの階級(clas
ses) に分割される: ─ 局所学習(local learning)、す
なわちニューロンjをニューロンiに結合するシナプス
係数Cijの変形が、ニューロンi及びニューロンj上
に限定されている情報にのみ依存するもの、と ─ 非局所学習(non−local learni
ng)、すなわち該変形が、ネットワーク全体に所在す
る情報に依存するもの、その公知の例としては層化され
たネットワーク内で誤りが後ろ向きに伝播されるもの とである。
ses) に分割される: ─ 局所学習(local learning)、す
なわちニューロンjをニューロンiに結合するシナプス
係数Cijの変形が、ニューロンi及びニューロンj上
に限定されている情報にのみ依存するもの、と ─ 非局所学習(non−local learni
ng)、すなわち該変形が、ネットワーク全体に所在す
る情報に依存するもの、その公知の例としては層化され
たネットワーク内で誤りが後ろ向きに伝播されるもの とである。
【0009】種々のタイプのニューラル・ネットワーク
が既に、IEEE ASSP Magazine誌19
87年4月号第4−22頁に所載のR.P.LIPPM
ANNによる”An introduction to
computingwith neural net
s” という論文に記載されている。 これらのニューラル・ネットワークでは、構造の組織は
(層化されているか又は完全に結合しているかに)固定
されている、そしてニューロン間の結合は前以て固定さ
れている。
が既に、IEEE ASSP Magazine誌19
87年4月号第4−22頁に所載のR.P.LIPPM
ANNによる”An introduction to
computingwith neural net
s” という論文に記載されている。 これらのニューラル・ネットワークでは、構造の組織は
(層化されているか又は完全に結合しているかに)固定
されている、そしてニューロン間の結合は前以て固定さ
れている。
【0010】その時実行される学習の目的は、異なるア
ーキテクチャを提案し然る後に処理結果に基づき帰納的
な選択をなすことにより、最適構造を見出すことである
。
ーキテクチャを提案し然る後に処理結果に基づき帰納的
な選択をなすことにより、最適構造を見出すことである
。
【0011】学習の過程でアーキテクチャが決定できる
ようなアルゴリズムが、J.Phys.A :Math
. Gen. 誌 22(1989年) 第2191−
2203頁に所載の”Learning in Fee
dforwardLayered Networks:
the tiling algorithm” という
文献中で既に、M.MEZARD及びJ.P.NADA
L により提案されている。この目的のために、該学習
はある層中に存在する1番目のニューロンのシナプス係
数を最適化することにより初期化され、もしこのニュー
ロンが分類のタスクを完成するのに十分でなければ、更
にもう1つのニューロンが当該の層に、又は同じく初期
化されたその次の層に追加される。このやり方によって
、アーキテクチャの学習及び、出力を2つの階級に分離
して、層化されたネットワークのパラメータ(多層パー
セプトロン)の学習ができる。
ようなアルゴリズムが、J.Phys.A :Math
. Gen. 誌 22(1989年) 第2191−
2203頁に所載の”Learning in Fee
dforwardLayered Networks:
the tiling algorithm” という
文献中で既に、M.MEZARD及びJ.P.NADA
L により提案されている。この目的のために、該学習
はある層中に存在する1番目のニューロンのシナプス係
数を最適化することにより初期化され、もしこのニュー
ロンが分類のタスクを完成するのに十分でなければ、更
にもう1つのニューロンが当該の層に、又は同じく初期
化されたその次の層に追加される。このやり方によって
、アーキテクチャの学習及び、出力を2つの階級に分離
して、層化されたネットワークのパラメータ(多層パー
セプトロン)の学習ができる。
【0012】しかしながら、そのようなニューラル・ネ
ットワークの構造は、いくつかの階級に分布している標
本の分類の問題を遂行することができるものではない。
ットワークの構造は、いくつかの階級に分布している標
本の分類の問題を遂行することができるものではない。
【0013】
【発明が解決しようとする課題】それ故、提起されてい
る課題は、学習中にアーキテクチャの決定を維持しなが
ら、そのような問題を処理することを可能ならしめると
いうことである。
る課題は、学習中にアーキテクチャの決定を維持しなが
ら、そのような問題を処理することを可能ならしめると
いうことである。
【0014】
【課題を解決するための手段】その解答は、少なくとも
1つの層を創造するために、2つより多い階級に分割さ
れた標本のグループから出発して、各継起的なニューロ
ンは入力データを、当面問題の層のニューロンの学習の
対象となる上記入力データの分布の主要構成要素分析に
従って、該ニューロンに特有の予め定められた階級のサ
ブグループにより、識別することを指向して成るもので
ある。
1つの層を創造するために、2つより多い階級に分割さ
れた標本のグループから出発して、各継起的なニューロ
ンは入力データを、当面問題の層のニューロンの学習の
対象となる上記入力データの分布の主要構成要素分析に
従って、該ニューロンに特有の予め定められた階級のサ
ブグループにより、識別することを指向して成るもので
ある。
【0015】それ故その方法は、父ニューロンと然る後
に後継ニューロンとを使用し、それらは共に、いくつか
の階級に分布している標本のグループの、各々が単一の
階級を形成する標本のサブグループへの分離を許すもの
となるであろう。従って、学習を行うために、各ニュー
ロンは次のいくつかの継起的なステップすなわち:A─
標本の非斉次のグループの投入、 B─非斉次のグループの標本の主要構成要素分析に基づ
く2つの階級のサブグループへの分割、C─標本のグル
ープを、2つの階級のサブグループへの最初の分割に対
し可能な限り近くに接近する2つの標本のサブグループ
に区別することを指向するように、父ニューロンがその
シナプス係数を計算することによって行う学習、 D─2つの標本のサブグループが単一の標本の階級を含
んでいるか否かを判定するための、該2つの標本のサブ
グループの各々の斉次性の検査、 E─上記標本のサブグループからの、単一の非斉次サブ
グループの選出、 F─非斉次サブグループの標本の、主要構成要素分析に
基づく2つの階級のサブグループへの分割、G─選出さ
れた標本の非斉次サブグループを、2つの階級のサブグ
ループへの後続の分割に対し可能な限り近くに接近する
2つの標本のサブグループに区別することを指向するよ
うに、後続ニューロンがそのシナプス係数を計算するこ
とによって行う学習、 H─新しい標本のサブグループを生成するために、先行
ニューロンにより識別された標本の非斉次サブグループ
のすべてに対して執られる上記後続ニューロンの行動、
I─新しく生成された標本のサブグループの各々の斉次
性の検査、 J─標本の非斉次サブグループに属する標本の抽出、K
─残りの非斉次標本のサブグループに対する、単一の階
級で形成される斉次サブグループが得られるに至までの
、段階Eで始まる処理の続行、の各ステップを実行する
ものとなるであろう。
に後継ニューロンとを使用し、それらは共に、いくつか
の階級に分布している標本のグループの、各々が単一の
階級を形成する標本のサブグループへの分離を許すもの
となるであろう。従って、学習を行うために、各ニュー
ロンは次のいくつかの継起的なステップすなわち:A─
標本の非斉次のグループの投入、 B─非斉次のグループの標本の主要構成要素分析に基づ
く2つの階級のサブグループへの分割、C─標本のグル
ープを、2つの階級のサブグループへの最初の分割に対
し可能な限り近くに接近する2つの標本のサブグループ
に区別することを指向するように、父ニューロンがその
シナプス係数を計算することによって行う学習、 D─2つの標本のサブグループが単一の標本の階級を含
んでいるか否かを判定するための、該2つの標本のサブ
グループの各々の斉次性の検査、 E─上記標本のサブグループからの、単一の非斉次サブ
グループの選出、 F─非斉次サブグループの標本の、主要構成要素分析に
基づく2つの階級のサブグループへの分割、G─選出さ
れた標本の非斉次サブグループを、2つの階級のサブグ
ループへの後続の分割に対し可能な限り近くに接近する
2つの標本のサブグループに区別することを指向するよ
うに、後続ニューロンがそのシナプス係数を計算するこ
とによって行う学習、 H─新しい標本のサブグループを生成するために、先行
ニューロンにより識別された標本の非斉次サブグループ
のすべてに対して執られる上記後続ニューロンの行動、
I─新しく生成された標本のサブグループの各々の斉次
性の検査、 J─標本の非斉次サブグループに属する標本の抽出、K
─残りの非斉次標本のサブグループに対する、単一の階
級で形成される斉次サブグループが得られるに至までの
、段階Eで始まる処理の続行、の各ステップを実行する
ものとなるであろう。
【0016】ニューロンにより行われる2つの標本のサ
ブグループへのこの標本の分離は、標本の分布の重心に
関する2つの階級のサブグループへの分割を行うことに
よる、標本の分布の主要構成要素分析によって実行され
る階級の分割に合致することを指向する。
ブグループへのこの標本の分離は、標本の分布の重心に
関する2つの階級のサブグループへの分割を行うことに
よる、標本の分布の主要構成要素分析によって実行され
る階級の分割に合致することを指向する。
【0017】主要構成要素分析というのは統計的な方法
で、それはベクトルの集合がd個の主要方向とそれに対
応する分散とを持つ平均ベクトルを援用して書き表され
ることを許すものである。この方法は後述する。
で、それはベクトルの集合がd個の主要方向とそれに対
応する分散とを持つ平均ベクトルを援用して書き表され
ることを許すものである。この方法は後述する。
【0018】学習を実行するために、父ニューロンのシ
ナプス係数が階級Pのある特定のサブグループを標本の
グループMから識別するために計算される。この区分は
サブグループM1+中でサブグループPを識別するもの
であり得る。
ナプス係数が階級Pのある特定のサブグループを標本の
グループMから識別するために計算される。この区分は
サブグループM1+中でサブグループPを識別するもの
であり得る。
【0019】ニューロンを援用して実行するのが望まし
い該特定の階級PのグループM1+の区分は、標本の階
級が線形に分離できるものでない時には、不完全にしか
得ることができない。従って該特定の階級Pと同じ階級
を持つ標本は最初のニューロンによる区分の後で相補的
なサブグループM1−中に見出すことができる。
い該特定の階級PのグループM1+の区分は、標本の階
級が線形に分離できるものでない時には、不完全にしか
得ることができない。従って該特定の階級Pと同じ階級
を持つ標本は最初のニューロンによる区分の後で相補的
なサブグループM1−中に見出すことができる。
【0020】その次に、グループM1+及びその相補グ
ループM1−が、単一の階級を含むか否かを判定するた
めに斉次性が検査される。これらのグループが共に斉次
であるならば、これらのサブグループの区分は完了する
。もしこれらのグループのどちらかが非斉次であるなら
ば、非斉次のサブグループが選出され、非斉次グループ
を2つの新しいグループに区別する後継ニューロンが生
成される。これをするために、該方法は、先ずサブグル
ープ中に存在する階級を主要構成要素分析によって2つ
の階級のサブグループに区別し、次いで2つの階級のサ
ブグループによる二分法の判定基準によって区分を行う
この後継ニューロンのためのシナプス係数を計算する。 それから、後継ニューロンは、こうして定められたシナ
プス係数を用いて、先行ニューロンの生成したすべての
非斉次グループ(1グループ又は2グループ)に対して
行動を執らされる。この標本の二分法の手順及び後継ニ
ューロンの生成は、後続の世代で逐次繰り返される。
ループM1−が、単一の階級を含むか否かを判定するた
めに斉次性が検査される。これらのグループが共に斉次
であるならば、これらのサブグループの区分は完了する
。もしこれらのグループのどちらかが非斉次であるなら
ば、非斉次のサブグループが選出され、非斉次グループ
を2つの新しいグループに区別する後継ニューロンが生
成される。これをするために、該方法は、先ずサブグル
ープ中に存在する階級を主要構成要素分析によって2つ
の階級のサブグループに区別し、次いで2つの階級のサ
ブグループによる二分法の判定基準によって区分を行う
この後継ニューロンのためのシナプス係数を計算する。 それから、後継ニューロンは、こうして定められたシナ
プス係数を用いて、先行ニューロンの生成したすべての
非斉次グループ(1グループ又は2グループ)に対して
行動を執らされる。この標本の二分法の手順及び後継ニ
ューロンの生成は、後続の世代で逐次繰り返される。
【0021】すべての階級がこうして識別されたとき、
学習相は完了してニューラル・ネットワークは分類を実
行するための完全動作モードで使用できる。
学習相は完了してニューラル・ネットワークは分類を実
行するための完全動作モードで使用できる。
【0022】階級の2つのサブグループへの区分の後で
、2つのサブグループ上での区分を行う各ニューラル・
ネットワークの学習には、いくつかの変形がある。優先
的に使用されるのはポケット・アルゴリズムで、これは
M.MEZARD 及びJ.P.NADAL により
用いられ、Paris(1986年) の 8th C
onf. on Pattern Recogniti
on におけるIEEE proc.に所載のS.GA
LANTによる”Optimal Linear Di
scriminants”という文献に記載されている
。このポケット・アルゴリズムは各ニューロンが実行す
る区分の動作のために使用することができる。
、2つのサブグループ上での区分を行う各ニューラル・
ネットワークの学習には、いくつかの変形がある。優先
的に使用されるのはポケット・アルゴリズムで、これは
M.MEZARD 及びJ.P.NADAL により
用いられ、Paris(1986年) の 8th C
onf. on Pattern Recogniti
on におけるIEEE proc.に所載のS.GA
LANTによる”Optimal Linear Di
scriminants”という文献に記載されている
。このポケット・アルゴリズムは各ニューロンが実行す
る区分の動作のために使用することができる。
【0023】各ニューロンにとって、「パーセプトロン
(Perceptron)」という学習判定基準を用い
ることも可能で、これはどの標本に対してもニューラル
・ネットワークの出力で得られた結果と期待される結果
との差異を特徴付ける誤りに基づいてシナプス係数を再
更新するものである。これらの学習判定基準は、当業者
にとって既知である。
(Perceptron)」という学習判定基準を用い
ることも可能で、これはどの標本に対してもニューラル
・ネットワークの出力で得られた結果と期待される結果
との差異を特徴付ける誤りに基づいてシナプス係数を再
更新するものである。これらの学習判定基準は、当業者
にとって既知である。
【0024】ニューロンのシナプス係数の計算というの
はすべて、入力層のニューロンの行動の対象となる入力
標本のグループか、或いはそれぞれ後続層のニューロン
の行動の対象となる選出された非斉次グループかを、そ
の都度2つの予め定められた階級のグループによって、
当面問題のニューロンに識別させることを意図するもの
である。
はすべて、入力層のニューロンの行動の対象となる入力
標本のグループか、或いはそれぞれ後続層のニューロン
の行動の対象となる選出された非斉次グループかを、そ
の都度2つの予め定められた階級のグループによって、
当面問題のニューロンに識別させることを意図するもの
である。
【0025】どのニューロンの学習でもこれを成し遂げ
るためには、そのシナプス係数の計算は、「ポケット」
アルゴリズム(”Pocket” algorithm
)か、「パーセプトロン」型(”Perceptron
” type) の学習規則か、又はヘッブ型(Heb
b type) の学習規則かのいずれかを実行するこ
とになる。(前掲の R.P.LIPPMANN の文
献、及び Phys.Rev. A 誌、第37巻第7
号 (1988年) 第2660頁所載 R.MEIR
と E.DOMANY による”Integrate
d Learning in a layered F
eed−Forward Neural Networ
k”という文献参照)
るためには、そのシナプス係数の計算は、「ポケット」
アルゴリズム(”Pocket” algorithm
)か、「パーセプトロン」型(”Perceptron
” type) の学習規則か、又はヘッブ型(Heb
b type) の学習規則かのいずれかを実行するこ
とになる。(前掲の R.P.LIPPMANN の文
献、及び Phys.Rev. A 誌、第37巻第7
号 (1988年) 第2660頁所載 R.MEIR
と E.DOMANY による”Integrate
d Learning in a layered F
eed−Forward Neural Networ
k”という文献参照)
【0026】本発明はまた、この
方法を実行するニューラル・ネットワークにも関する。 ニューラル・ネットワークがまず初めに構築され、然る
後に学習された分類のタスクを実施する。最初の層を形
成するニューロンは入力データ空間を分離する機能を持
つ。従ってその各々は出力上に2進状態(binary
state)を供給する。その2進状態の集合が後続
の層のための入力データを構成する。 これらの2進状態の集合は、ニューラル・ネットワーク
を形成する継起的な層を援用して復号化することができ
る。それはまた、標本の階級を最初の層のニューロンの
2進状態の関数として記憶するメモリを援用して復号化
することもできる。動作モードでは、このメモリがこれ
らの2進状態によりアドレスされ、それから実行される
分類を供給するために読み出される。
方法を実行するニューラル・ネットワークにも関する。 ニューラル・ネットワークがまず初めに構築され、然る
後に学習された分類のタスクを実施する。最初の層を形
成するニューロンは入力データ空間を分離する機能を持
つ。従ってその各々は出力上に2進状態(binary
state)を供給する。その2進状態の集合が後続
の層のための入力データを構成する。 これらの2進状態の集合は、ニューラル・ネットワーク
を形成する継起的な層を援用して復号化することができ
る。それはまた、標本の階級を最初の層のニューロンの
2進状態の関数として記憶するメモリを援用して復号化
することもできる。動作モードでは、このメモリがこれ
らの2進状態によりアドレスされ、それから実行される
分類を供給するために読み出される。
【0027】
【実施例】図1は抽象的な2次元空間の25個の標本を
示し、各標本はそれぞれのパラメータ値により与えられ
る所在場所に位置し、又それらが属する特定の階級に対
応する文字a,b,c,d,eで表されている。該標本
はそれぞれグループ又はサブグループSG1,SG2,
SG3 にグループ化され、グループSG1 は使われ
る総ての標本を事実上含んでいる。各グループ又はサブ
グループはそれぞれの主軸AP1,AP2,AP3 を
持ち、その決め方の詳細は後述するが、これら主軸の用
途は当該グループ又はサブグループの一般的な空間的方
向付けを示すものである。各サブグループに対しては、
それぞれの二分ライン(dichotomy line
)が示されている、それは一般的に該サブグループの主
軸を横切って走り、該サブグループを2つの部分に分割
する。二分法はそれぞれN1,N2,N3で示されるそ
れぞれの単一ニューロンによって実行される。
示し、各標本はそれぞれのパラメータ値により与えられ
る所在場所に位置し、又それらが属する特定の階級に対
応する文字a,b,c,d,eで表されている。該標本
はそれぞれグループ又はサブグループSG1,SG2,
SG3 にグループ化され、グループSG1 は使われ
る総ての標本を事実上含んでいる。各グループ又はサブ
グループはそれぞれの主軸AP1,AP2,AP3 を
持ち、その決め方の詳細は後述するが、これら主軸の用
途は当該グループ又はサブグループの一般的な空間的方
向付けを示すものである。各サブグループに対しては、
それぞれの二分ライン(dichotomy line
)が示されている、それは一般的に該サブグループの主
軸を横切って走り、該サブグループを2つの部分に分割
する。二分法はそれぞれN1,N2,N3で示されるそ
れぞれの単一ニューロンによって実行される。
【0028】図2は層化されたニューラル・ネットワー
クに関するフローチャートで、本発明の方法のステップ
を示すものである。該方法は、定められたタスクに適合
するようにニューラル・ネットワークによる学習操作を
実行するために与えられたところの、選択された標本の
グループMに基づいて行われる (ステップ200)。 この標本のグループMは定義により非斉次(non−h
omogeneous) である、という意味はそれら
の標本は1つより多い階級に属している。学習は茲では
広い意味に理解され、それは必要とされるシナプス係数
を決定するだけではなく、このタスクを完成するのに必
要とされるニューロンの数を同時に決定するものである
。従ってそれはまたニューラル・ネットワークのサイズ
をも決定する。
クに関するフローチャートで、本発明の方法のステップ
を示すものである。該方法は、定められたタスクに適合
するようにニューラル・ネットワークによる学習操作を
実行するために与えられたところの、選択された標本の
グループMに基づいて行われる (ステップ200)。 この標本のグループMは定義により非斉次(non−h
omogeneous) である、という意味はそれら
の標本は1つより多い階級に属している。学習は茲では
広い意味に理解され、それは必要とされるシナプス係数
を決定するだけではなく、このタスクを完成するのに必
要とされるニューロンの数を同時に決定するものである
。従ってそれはまたニューラル・ネットワークのサイズ
をも決定する。
【0029】標本のグループMはk個の異なる階級の標
本に対して形成される。ステップ202 ではk個の階
級を、階級G1+と階級G1−の2サブグループに分割
し、これによって分類問題を階級G1+と階級G1−と
の2つのサブグループの分類問題に縮小する。ステップ
203 では該方法は、標本のグループMの全体に亙っ
て動作するある特定の父ニューロン(father n
euron) のシナプス係数を決定する。これらのシ
ナプス係数は、ニューラル・ネットワークが既知の階級
のサブグループG1+とG1−とにそれぞれ従って標本
のグループMを標本のサブグループM1+とM1−とに
出来るだけ正確に分離するように決定される。この学習
過程は以下に述べるポケット・アルゴリズム(Pock
et algorithm)により実行されるのを好適
とする。これらの条件下で該学習は実行時間に関しても
所要のハードウェアに関しても最適であることが判明す
る。 ニューラル・ネットワークの出力は各階級が意図したサ
ブグループに正確に割当てられたか非正確に割当てられ
たかについて分析される。物事を明確にするために、例
えば、標本のグループMから階級のサブグループG1+
を孤立させるように試みることが可能である。
本に対して形成される。ステップ202 ではk個の階
級を、階級G1+と階級G1−の2サブグループに分割
し、これによって分類問題を階級G1+と階級G1−と
の2つのサブグループの分類問題に縮小する。ステップ
203 では該方法は、標本のグループMの全体に亙っ
て動作するある特定の父ニューロン(father n
euron) のシナプス係数を決定する。これらのシ
ナプス係数は、ニューラル・ネットワークが既知の階級
のサブグループG1+とG1−とにそれぞれ従って標本
のグループMを標本のサブグループM1+とM1−とに
出来るだけ正確に分離するように決定される。この学習
過程は以下に述べるポケット・アルゴリズム(Pock
et algorithm)により実行されるのを好適
とする。これらの条件下で該学習は実行時間に関しても
所要のハードウェアに関しても最適であることが判明す
る。 ニューラル・ネットワークの出力は各階級が意図したサ
ブグループに正確に割当てられたか非正確に割当てられ
たかについて分析される。物事を明確にするために、例
えば、標本のグループMから階級のサブグループG1+
を孤立させるように試みることが可能である。
【0030】そうすると階級のサブグループG1−は標
本のグループMから階級のサブグループG1+を取り去
ることにより形成される。こうして父ニューロンの学習
はM1+をG1+に符合させ、M1−をG1−に符合さ
せるようになるであろう。
本のグループMから階級のサブグループG1+を取り去
ることにより形成される。こうして父ニューロンの学習
はM1+をG1+に符合させ、M1−をG1−に符合さ
せるようになるであろう。
【0031】階級のサブグループG1+は、斉次でも非
斉次でもどちらでもよい。階級は先験的に線形に分離さ
れるものではないから、こうして分離されたサブグルー
プM1−はそれ自体階級のサブグループG1−のエレメ
ントを含むことができる。
斉次でもどちらでもよい。階級は先験的に線形に分離さ
れるものではないから、こうして分離されたサブグルー
プM1−はそれ自体階級のサブグループG1−のエレメ
ントを含むことができる。
【0032】標本のサブグループM1+とM1−とを構
成する標本は最初に別々に処理される。ステップ220
及びステップ210 で、M1+及びM1−の斉次性
が検査される。
成する標本は最初に別々に処理される。ステップ220
及びステップ210 で、M1+及びM1−の斉次性
が検査される。
【0033】実際には、父ニューロンは前以て定義され
た階級のサブグループを識別するというタスクを持つ。 もし標本のグループM1+(またはM1−)が斉次なら
ば、すなわち同一の階級の標本のみを含むならば、これ
らの標本はステップ222(またはステップ212)で
識別される(階級K0,K1)。
た階級のサブグループを識別するというタスクを持つ。 もし標本のグループM1+(またはM1−)が斉次なら
ば、すなわち同一の階級の標本のみを含むならば、これ
らの標本はステップ222(またはステップ212)で
識別される(階級K0,K1)。
【0034】もし標本のグループM1+(またはM1−
)が非斉次ならば、すなわち異なる階級の標本を含むな
らば、区別を続けることが必要である。
)が非斉次ならば、すなわち異なる階級の標本を含むな
らば、区別を続けることが必要である。
【0035】これを行うために、標本の非斉次サブグル
ープM1+またはM1−が1つ(ステップ224 で)
選択される。この選択は、例えば最も数の多いサブグル
ープを、または含まれる階級の数が最小の(一般的に新
しいkの値は前のものより小さい)サブグループを、或
いはその他の任意の判断基準で選ぶことができる。
ープM1+またはM1−が1つ(ステップ224 で)
選択される。この選択は、例えば最も数の多いサブグル
ープを、または含まれる階級の数が最小の(一般的に新
しいkの値は前のものより小さい)サブグループを、或
いはその他の任意の判断基準で選ぶことができる。
【0036】こうして選択されたサブグループM1+ま
たはM1−は、ステップ202 で行ったのと同様な、
選択されたサブグループのk個の階級を僅かに2個の階
級のサブグループに分割する操作 (ステップ226)
で階級別に分割される。このことはk個の階級への分類
の問題を2つの階級への分類の繰り返しに還元する。ニ
ューロンN2 の学習(ステップ228)とは、2つの
新しい標本のグループを予め定められた階級の2つのサ
ブグループに対応させるようにするところの、選択され
た標本のグループの2つのサブグループへの1番目の区
分を実行することである。ニューロンN2 のシナプス
係数はこうして決定される。それらはその時不変のまま
であり、ニューロンN2 は、先行のニューロンにより
生成された標本のサブグループM1+及びM1−の全体
に亙って2番目の区分を実行する。この目的のために命
令231 が与えられて、それがニューロンN2 によ
るM1+の処理(ステップ230)及びM1−の処理(
ステップ240)を実行させる。
たはM1−は、ステップ202 で行ったのと同様な、
選択されたサブグループのk個の階級を僅かに2個の階
級のサブグループに分割する操作 (ステップ226)
で階級別に分割される。このことはk個の階級への分類
の問題を2つの階級への分類の繰り返しに還元する。ニ
ューロンN2 の学習(ステップ228)とは、2つの
新しい標本のグループを予め定められた階級の2つのサ
ブグループに対応させるようにするところの、選択され
た標本のグループの2つのサブグループへの1番目の区
分を実行することである。ニューロンN2 のシナプス
係数はこうして決定される。それらはその時不変のまま
であり、ニューロンN2 は、先行のニューロンにより
生成された標本のサブグループM1+及びM1−の全体
に亙って2番目の区分を実行する。この目的のために命
令231 が与えられて、それがニューロンN2 によ
るM1+の処理(ステップ230)及びM1−の処理(
ステップ240)を実行させる。
【0037】最後の2つの段階の終わりに、ニューロン
N2 はサブグループM1+及びM1−の標本を、それ
ぞれ2つの新しい標本のサブグループM2+/M2−及
びM3+/M3−にそれぞれ分割した。
N2 はサブグループM1+及びM1−の標本を、それ
ぞれ2つの新しい標本のサブグループM2+/M2−及
びM3+/M3−にそれぞれ分割した。
【0038】それからこれら4つのサブグループは同様
のメカニズムで処理ニューロンN3 (チャートには示
されていない)により処理される。(図2の)鎖線 A
−AとB−B の間に所在する一連のステップが、2つ
のサブグループに対してではなく4つのサブグループに
対して全く同じように繰り返される。
のメカニズムで処理ニューロンN3 (チャートには示
されていない)により処理される。(図2の)鎖線 A
−AとB−B の間に所在する一連のステップが、2つ
のサブグループに対してではなく4つのサブグループに
対して全く同じように繰り返される。
【0039】当面の層の構築は、グループMのすべての
標本がこうして処理され終わり、各孤立したサブグルー
プが単一の階級に属する標本のみを含む時に完成する。 該方法はこの時点で完了したと考えてよいが、或いはも
し必要と考えられれば更にもう1つの層を構築すること
も可能であろう。
標本がこうして処理され終わり、各孤立したサブグルー
プが単一の階級に属する標本のみを含む時に完成する。 該方法はこの時点で完了したと考えてよいが、或いはも
し必要と考えられれば更にもう1つの層を構築すること
も可能であろう。
【0040】第1の層の構築の終わりに、多階級データ
語間の区分を行うことができる。しかし出力状態の配置
は余りに多いことのあり得る出力の数に亙って分布して
いる。従って出力の数を減らすトランスコーディング(
transcoding) を行うことが望まれること
もあり得る。それ故、次の層が最初の能動ニューロン層
について既に述べたのと同じ方法で構築される。この最
初の層の出力は2番目の層の入力として用いられる。同
じ過程が他の層に対して繰り返されることができる。最
後の層の出力で、出力状態の配置は減らされた出力数に
亙り分布したものが得られる。これらの配置は入力上に
導入されたデータ語のいくつかの階級を識別することを
許す。ニューロンの数及びそのシナプス係数はこうして
方法そのものによって決定され、学習動作はこの標本の
グループに対して完了する。それからニューラル・ネッ
トワークは分類の課題を実行するのに用いることができ
る。
語間の区分を行うことができる。しかし出力状態の配置
は余りに多いことのあり得る出力の数に亙って分布して
いる。従って出力の数を減らすトランスコーディング(
transcoding) を行うことが望まれること
もあり得る。それ故、次の層が最初の能動ニューロン層
について既に述べたのと同じ方法で構築される。この最
初の層の出力は2番目の層の入力として用いられる。同
じ過程が他の層に対して繰り返されることができる。最
後の層の出力で、出力状態の配置は減らされた出力数に
亙り分布したものが得られる。これらの配置は入力上に
導入されたデータ語のいくつかの階級を識別することを
許す。ニューロンの数及びそのシナプス係数はこうして
方法そのものによって決定され、学習動作はこの標本の
グループに対して完了する。それからニューラル・ネッ
トワークは分類の課題を実行するのに用いることができ
る。
【0041】図3は本発明による方法で操作される分離
ステップのもう1つの表現である。父ニューロンN1(
太線で表す) は、標本のサブグループM1+とM1−
とへの分離を実行するために標本の非斉次のグループM
上で動作する。
ステップのもう1つの表現である。父ニューロンN1(
太線で表す) は、標本のサブグループM1+とM1−
とへの分離を実行するために標本の非斉次のグループM
上で動作する。
【0042】この表現では、標本のサブグループM1+
とM1−とは共に非斉次と仮定する。シナプス係数を計
算することによって後継ニューロンN2 による学習を
遂行するために、サブグループの1つ、例えばM1+が
選定されるのである。この学習が完了すると、ニューロ
ンN2 はそのシナプス係数を保持して、グループM1
+及びM1−上での分割を行い、M1+及びM1−はそ
れぞれM2+/M2−及びM3+/M3−に分離される
。M2−及びM3+は斉次と仮定すると、該方法は残っ
た非斉次のサブグループM2+及びM3−に対して続け
られる。後継ニューロンN3 のシナプス係数を計算す
るために、例えばサブグループM2+が選定される。そ
れからニューロンN3 は、サブグループM2+及びM
3−をそれぞれM4+/M4−及びM5+/M5−に分
割する。もし例えばM4−及びM5+のみが非斉次なら
ば、後継ニューロンN4 が前と同様に動作し、それら
をM6+/M6−及びM7+/M7−に分離して斉次に
なるようにする。 その時この分類のタスクに対するニューロン・ネットワ
ークの学習は完成して、その他の標本にこの種のタスク
を行うための全動作モードで使用することができる。
とM1−とは共に非斉次と仮定する。シナプス係数を計
算することによって後継ニューロンN2 による学習を
遂行するために、サブグループの1つ、例えばM1+が
選定されるのである。この学習が完了すると、ニューロ
ンN2 はそのシナプス係数を保持して、グループM1
+及びM1−上での分割を行い、M1+及びM1−はそ
れぞれM2+/M2−及びM3+/M3−に分離される
。M2−及びM3+は斉次と仮定すると、該方法は残っ
た非斉次のサブグループM2+及びM3−に対して続け
られる。後継ニューロンN3 のシナプス係数を計算す
るために、例えばサブグループM2+が選定される。そ
れからニューロンN3 は、サブグループM2+及びM
3−をそれぞれM4+/M4−及びM5+/M5−に分
割する。もし例えばM4−及びM5+のみが非斉次なら
ば、後継ニューロンN4 が前と同様に動作し、それら
をM6+/M6−及びM7+/M7−に分離して斉次に
なるようにする。 その時この分類のタスクに対するニューロン・ネットワ
ークの学習は完成して、その他の標本にこの種のタスク
を行うための全動作モードで使用することができる。
【0043】図3の右側の部分は、その縦の列Iに、ニ
ューロンのシナプス係数を計算するために同じ横の行に
置かれた該ニューロンにより使用される標本のグループ
が示される。また、縦の列IIには、同じ横の行に置か
れたニューロンがその次に標本のサブグループの区分を
実行する標本のグループが示される。さらに、縦の列I
II には、上記ニューロンの各々に対し斉次の標本の
サブグループが示され、これらはそのとき後継ニューロ
ンの行動の前に抜き出される。
ューロンのシナプス係数を計算するために同じ横の行に
置かれた該ニューロンにより使用される標本のグループ
が示される。また、縦の列IIには、同じ横の行に置か
れたニューロンがその次に標本のサブグループの区分を
実行する標本のグループが示される。さらに、縦の列I
II には、上記ニューロンの各々に対し斉次の標本の
サブグループが示され、これらはそのとき後継ニューロ
ンの行動の前に抜き出される。
【0044】本発明によれば、ニューロンの指向すべき
分割は標本の分布の主要構成要素分析(a princ
ipal components analysis)
を使用することにある。該主要構成要素分析というの
は統計的な方法で、それはN個のベクトル外1
分割は標本の分布の主要構成要素分析(a princ
ipal components analysis)
を使用することにある。該主要構成要素分析というの
は統計的な方法で、それはN個のベクトル外1
【外1】
(d次元空間の点)のグループが、d個の主要方向とd
個の対応する分散σ2 を持つ平均ベクトル数1
個の対応する分散σ2 を持つ平均ベクトル数1
【数1
】 を援用して書き表すことを許すものである。この方法の
詳細は、1982年 Dunod社発行のE.DIDA
Y, J.LEMAIRE, J.POUGET, E
.TESTU による”Elements d’Ana
lyse deDonnees” という文献の第 1
67頁に記載されている。
】 を援用して書き表すことを許すものである。この方法の
詳細は、1982年 Dunod社発行のE.DIDA
Y, J.LEMAIRE, J.POUGET, E
.TESTU による”Elements d’Ana
lyse deDonnees” という文献の第 1
67頁に記載されている。
【0045】図4Aの単純な場合では、標準偏差比σ1
/σ2 がほぼ3に等しい2次元空間の分布40が示さ
れている。この分布に対しては、平均外2
/σ2 がほぼ3に等しい2次元空間の分布40が示さ
れている。この分布に対しては、平均外2
【外2】
及び特性方向D1,D2 に沿った主要構成要素外3
【
外3】 が定義されている。もし主要構成要素が減少する分散に
よって分類されるならば、第1の特性方向は外4
外3】 が定義されている。もし主要構成要素が減少する分散に
よって分類されるならば、第1の特性方向は外4
【外4
】 のノルムが標本μで最も変動する方向を示す。階級C1
,C2,… ,Ck に割り当てられた標本のグループ
があり、それに対してk階級の分類を進めるために線形
セパレータ(ニューロン)を適用することが望ましい時
には、次のようにしてk個の階級を2つの別々のグルー
プG+/G− に分離することが好適である: i) 外5
】 のノルムが標本μで最も変動する方向を示す。階級C1
,C2,… ,Ck に割り当てられた標本のグループ
があり、それに対してk階級の分類を進めるために線形
セパレータ(ニューロン)を適用することが望ましい時
には、次のようにしてk個の階級を2つの別々のグルー
プG+/G− に分離することが好適である: i) 外5
【外5】
例えば共分散行列を計算し対角化し、続いて最大分散を
選択することによる完全な主要構成要素分析を実行する
ことによって計算される、 ii) ΣC を階級がCの標本の総和とし、NC を
階級C中の標本の数とするとき、各階級Cに対応する重
心が次式数2
選択することによる完全な主要構成要素分析を実行する
ことによって計算される、 ii) ΣC を階級がCの標本の総和とし、NC を
階級C中の標本の数とするとき、各階級Cに対応する重
心が次式数2
【数2】
によって計算される、
iii) その重心が次の関係数3
【数3】
を満足する階級をG+ とし、その他の階級をG− と
することによってグループ化が実行される。
することによってグループ化が実行される。
【0046】主要構成要素分析の方法が、3つの階級を
持つ2次元の分布に対して、図4Bに示される。分布4
0は3つの階級C1,C2,C3 を持ち、これらの各
階級の平均値をそれぞれ<y>1,<y>2,<y>3
、重心をそれぞれH1,H2,H3 とする。上記i
) に従っての平均の計算及び最初の主要ベクトルの計
算によって、<y>及び外6
持つ2次元の分布に対して、図4Bに示される。分布4
0は3つの階級C1,C2,C3 を持ち、これらの各
階級の平均値をそれぞれ<y>1,<y>2,<y>3
、重心をそれぞれH1,H2,H3 とする。上記i
) に従っての平均の計算及び最初の主要ベクトルの計
算によって、<y>及び外6
【外6】
が決定される。上記ii) に従っての各階級に付随す
る重心の計算によって、H1,H2,H3 が決定され
る。上記 iii) に従っての階級のグループ化は、
セパレータ41を援用して、3つの階級を2つの階級の
サブグループ上に分布させることを可能にする。
る重心の計算によって、H1,H2,H3 が決定され
る。上記 iii) に従っての階級のグループ化は、
セパレータ41を援用して、3つの階級を2つの階級の
サブグループ上に分布させることを可能にする。
【0047】この場合、2つの階級のサブグループへの
標本の分布は、該標本の分布の重心を通り主方向に垂直
な軸に関する分布を実行するもので、該重心は主要構成
要素分析による処理中に決定される。他の選択(例えば
階級の選択)に関するこの方法の本質的利点は、線形セ
パレータが更によくバランスするであろうこと、すなわ
ちそれは標本を、母集団がより僅かにしか異ならない2
つの部分集合に、分離するであろうことである。
標本の分布は、該標本の分布の重心を通り主方向に垂直
な軸に関する分布を実行するもので、該重心は主要構成
要素分析による処理中に決定される。他の選択(例えば
階級の選択)に関するこの方法の本質的利点は、線形セ
パレータが更によくバランスするであろうこと、すなわ
ちそれは標本を、母集団がより僅かにしか異ならない2
つの部分集合に、分離するであろうことである。
【0048】所望の階級のサブグループへの可能な限り
最善のアプローチをなすべくニューロンがそのシナプス
係数を決定するために実行する学習は、 J.Phys
.A : Math.Gen.誌 22(1989年)
第2191−2203頁に所載の”Learning
in Feedforward Layeredne
tworks:the tiling algorit
hm” という文献中で M.MEZARD 及びJ.
P.NADAL により用いられ、Paris(198
6年) の 8th Conf. on Patter
n Recognition におけるIEEE pr
oc.に所載のS.GALANTによる”Optima
l Linear Discriminants”とい
う文献に記載されているポケット・アルゴリズムにより
実行されるのを好適とする。
最善のアプローチをなすべくニューロンがそのシナプス
係数を決定するために実行する学習は、 J.Phys
.A : Math.Gen.誌 22(1989年)
第2191−2203頁に所載の”Learning
in Feedforward Layeredne
tworks:the tiling algorit
hm” という文献中で M.MEZARD 及びJ.
P.NADAL により用いられ、Paris(198
6年) の 8th Conf. on Patter
n Recognition におけるIEEE pr
oc.に所載のS.GALANTによる”Optima
l Linear Discriminants”とい
う文献に記載されているポケット・アルゴリズムにより
実行されるのを好適とする。
【0049】無作為に選ばれた各標本に対してこれをす
るために、ニューロンの出力ポテンシャルが計算される
。もしこのポテンシャルが安定性判定基準 S≧0 を
満足させるならば、別の標本が選ばれる。もしこのポテ
ンシャルが安定性判定基準を満足させない(S<0)な
らば、新しいシナプス係数が計算され、その新しいシナ
プス係数はそれらが最小の誤り判定基準を満足させる時
に限り以前のシナプス係数を更新するために用いられる
。すべての標本が当面問題のニューロンのシナプス係数
を決定するのに用いられ、「ポケット」アルゴリズムは
非斉次の階級の二分法を行わせるために最適のシナプス
係数に向かって収束する。
るために、ニューロンの出力ポテンシャルが計算される
。もしこのポテンシャルが安定性判定基準 S≧0 を
満足させるならば、別の標本が選ばれる。もしこのポテ
ンシャルが安定性判定基準を満足させない(S<0)な
らば、新しいシナプス係数が計算され、その新しいシナ
プス係数はそれらが最小の誤り判定基準を満足させる時
に限り以前のシナプス係数を更新するために用いられる
。すべての標本が当面問題のニューロンのシナプス係数
を決定するのに用いられ、「ポケット」アルゴリズムは
非斉次の階級の二分法を行わせるために最適のシナプス
係数に向かって収束する。
【0050】このアルゴリズム(tiling)は、進
行中の層のユニットにより表される符号(+/−;1/
0)が忠実(faithful)となるまで、すなわち
2つの異なる階級の標本が当面問題の層の全体に亙って
同一の符号を持たなくなるまで、ニューロンを付加する
ことによって多層ニューラル・ネットワークを構築する
ために設計されたものである。各層は先行の層の標本に
基づいてこうして構築される。
行中の層のユニットにより表される符号(+/−;1/
0)が忠実(faithful)となるまで、すなわち
2つの異なる階級の標本が当面問題の層の全体に亙って
同一の符号を持たなくなるまで、ニューロンを付加する
ことによって多層ニューラル・ネットワークを構築する
ために設計されたものである。各層は先行の層の標本に
基づいてこうして構築される。
【0051】図5は、標本のグループの2つのグループ
への分離を行うポケット・アルゴリズムのフローチャー
トを示す。
への分離を行うポケット・アルゴリズムのフローチャー
トを示す。
【0052】所与のニューロンに対してそのシナプス係
数Cijは0で初期化される、また最大誤り判定基準C
rmは非常に大きい値で初期化される (ステップ40
0)。無作為標本EXが採られ (ステップ402)、
それに対して安定値Sがiを分析されるニューロンの指
標とし、jをそれに接続されるニューロン又は入力の指
標とし、外7
数Cijは0で初期化される、また最大誤り判定基準C
rmは非常に大きい値で初期化される (ステップ40
0)。無作為標本EXが採られ (ステップ402)、
それに対して安定値Sがiを分析されるニューロンの指
標とし、jをそれに接続されるニューロン又は入力の指
標とし、外7
【外7】
をニューロンiの入力に存在する標本μのj番目の構成
要素とする時数4
要素とする時数4
【数4】
によって決定される (ステップ404)。
【0053】この安定値Sが検査される (ステップ4
06)。もし正ならば安定性は十分で、他の標本が選ば
れる。もし安定値Sが負又は0ならば、シナプス係数C
’ ijは次の式 C’ ij(新)=C’ ij(旧)+yjにより決定
される (ステップ408)。
06)。もし正ならば安定性は十分で、他の標本が選ば
れる。もし安定値Sが負又は0ならば、シナプス係数C
’ ijは次の式 C’ ij(新)=C’ ij(旧)+yjにより決定
される (ステップ408)。
【0054】こうして決定された各新シナプス係数C’
ijは、例えば安定性が間違った符号を持つ標本の数
を算定する誤り判定基準Crを満足させなければならな
い (ステップ410)。もしこの判定基準Cr が判
定基準の最大値Crmよりも小さければ (ステップ4
12)、決定されたシナプス係数C’ ijは、以前に
記憶されていたシナプス係数Cijを更新するのに使わ
れる(ステップ414)。
ijは、例えば安定性が間違った符号を持つ標本の数
を算定する誤り判定基準Crを満足させなければならな
い (ステップ410)。もしこの判定基準Cr が判
定基準の最大値Crmよりも小さければ (ステップ4
12)、決定されたシナプス係数C’ ijは、以前に
記憶されていたシナプス係数Cijを更新するのに使わ
れる(ステップ414)。
【0055】同様に、最大値Crmも更新される。こう
してすべての標本が計算のため及びそれから恐らくはニ
ューロンiのシナプス係数の更新のために逐次使われる
。 この学習の最後に、このニューロンiによって行われた
分離が、所与のグループの標本に対して得られた結果
(2つの階級のグループ:+/−;1/0)を算定する
ことにより、検査される。もし該分離が斉次な階級のグ
ループを供給しないならば、また別のニューロンが層に
付加され、ポケット・アルゴリズムが再び同じやり方で
用いられる。
してすべての標本が計算のため及びそれから恐らくはニ
ューロンiのシナプス係数の更新のために逐次使われる
。 この学習の最後に、このニューロンiによって行われた
分離が、所与のグループの標本に対して得られた結果
(2つの階級のグループ:+/−;1/0)を算定する
ことにより、検査される。もし該分離が斉次な階級のグ
ループを供給しないならば、また別のニューロンが層に
付加され、ポケット・アルゴリズムが再び同じやり方で
用いられる。
【0056】本発明はまた、該方法を実行する手段を具
えたニューラル・ネットワークにも関する。該ネットワ
ークは計算ユニットを有し、これは出力状態Vi を、
入力ポテンシャルVj に基づき次式 Vi =ΣCij・Vj によって算定する。但し茲でCijはニューロンiを入
力j(又はニューロンj)に接続するシナプス係数であ
る。そのために、各入力ベクトルのコンポネントは入力
端子に接続される。入力ベクトルVj は該方法により
逐次入力端子に到達する。最初のニューロン(父ニュー
ロン)が創造される。それは入力端子に到達するすべて
の入力ベクトル・コンポネントを受け取る。もし最初の
ニューロンが階級を識別するのに十分でなければ、2番
目のニューロンが生成され、これもやはり入力端子に到
達するすべての入力ベクトル・コンポネントを受け取る
。 ニューラル・ネットの生成は、必要な総てのニューロン
に対して同じやり方で実現する。
えたニューラル・ネットワークにも関する。該ネットワ
ークは計算ユニットを有し、これは出力状態Vi を、
入力ポテンシャルVj に基づき次式 Vi =ΣCij・Vj によって算定する。但し茲でCijはニューロンiを入
力j(又はニューロンj)に接続するシナプス係数であ
る。そのために、各入力ベクトルのコンポネントは入力
端子に接続される。入力ベクトルVj は該方法により
逐次入力端子に到達する。最初のニューロン(父ニュー
ロン)が創造される。それは入力端子に到達するすべて
の入力ベクトル・コンポネントを受け取る。もし最初の
ニューロンが階級を識別するのに十分でなければ、2番
目のニューロンが生成され、これもやはり入力端子に到
達するすべての入力ベクトル・コンポネントを受け取る
。 ニューラル・ネットの生成は、必要な総てのニューロン
に対して同じやり方で実現する。
【0057】この計算ユニットは、当業者にとって既知
のメカニズムによって動作し、それは例えば上掲のR.
P.LIPPMANNの文献に記載されている。ホスト
・コンピュータがすべての動作を管理する。
のメカニズムによって動作し、それは例えば上掲のR.
P.LIPPMANNの文献に記載されている。ホスト
・コンピュータがすべての動作を管理する。
【0058】層化されたニューラル・ネットワークは、
上述の方法で学習を実行したニューロンを持つ継起的な
層により形成することができる。それはまた、上述の方
法で得られてそのニューロンが入力空間でセパレータと
して行動する単一の層から形成されたニューラル・ネッ
トワークとすることもできる。その時、この層のニュー
ロンの出力の状態は、標本の階級を上記の層のニューロ
ンの2進状態(binarystates) の関数と
して記憶しているメモリにより、直接処理することがで
きる。
上述の方法で学習を実行したニューロンを持つ継起的な
層により形成することができる。それはまた、上述の方
法で得られてそのニューロンが入力空間でセパレータと
して行動する単一の層から形成されたニューラル・ネッ
トワークとすることもできる。その時、この層のニュー
ロンの出力の状態は、標本の階級を上記の層のニューロ
ンの2進状態(binarystates) の関数と
して記憶しているメモリにより、直接処理することがで
きる。
【図1】図1は、K個の階級に分けられた標本に基づく
セパレータの行動のモードの入力の空間中の表現を示す
図である。
セパレータの行動のモードの入力の空間中の表現を示す
図である。
【図2】図2は、階級の分離のメカニズム及び層化され
たニューラル・ネットワークの学習に関係する標本のサ
ブグループを示すフローチャートを示す図である。
たニューラル・ネットワークの学習に関係する標本のサ
ブグループを示すフローチャートを示す図である。
【図3】図3は、標本の分離の表現を示す図である。
【図4】図4A及び図4Bは、分布の主要構成要素の表
現及び階級への分割の一例を示す図である。
現及び階級への分割の一例を示す図である。
【図5】図5は、操作される2つの階級のサブグループ
間の分離を許すポケット・アルゴリズムにより構成され
るアルゴリズムの一例を示す図である。
間の分離を許すポケット・アルゴリズムにより構成され
るアルゴリズムの一例を示す図である。
AP1,AP2,AP3 グループ又はサブグルー
プの主軸N1,N2,N3 二分法を実行する単一ニ
ューロンSG1,SG2,SG3 標本のグループ
又はサブグループ40 2次元空間の分布 41 セパレータ
プの主軸N1,N2,N3 二分法を実行する単一ニ
ューロンSG1,SG2,SG3 標本のグループ
又はサブグループ40 2次元空間の分布 41 セパレータ
Claims (5)
- 【請求項1】 階級別に分割される標本の分類を継起
的な二分法により実行するのに必要とされる継起的なニ
ューロンの追加によって、少なくとも1つの層が構築さ
れる学習段階を有するところの、層化されたニューラル
・ネットワーク中で遂行される分類方法において、少な
くとも1つの層を創造するために、2つより多い階級に
分割された標本のグループから出発して、各継起的なニ
ューロンは入力データを、当面問題の層のニューロンの
学習の対象となる上記入力データの分布の主要構成要素
分析に従って、該ニューロンに特有の予め定められた階
級のサブグループにより、識別することを指向して成る
ことを特徴とする分類方法。 - 【請求項2】 標本の非斉次のグループを分離するた
めに、学習は次のステップすなわち A─標本の非斉次のグループの投入、 B─非斉次のグループの標本の主要構成要素分析に基づ
く2つの階級のサブグループへの分割、C─標本のグル
ープを、2つの階級のサブグループへの最初の分割に対
し可能な限り近くに接近する2つの標本のサブグループ
に区別することを指向するように、父ニューロンがその
シナプス係数を計算することによって行う学習、 D─2つの標本のサブグループが単一の標本の階級を含
んでいるか否かを判定するための、該2つの標本のサブ
グループの各々の斉次性の検査、 E─上記標本のサブグループからの、単一の非斉次サブ
グループの選出、 F─非斉次サブグループの標本の、主要構成要素分析に
基づく2つの階級のサブグループへの分割、G─選出さ
れた標本の非斉次サブグループを、2つの階級のサブグ
ループへの後続の分割に対し可能な限り近くに接近する
2つの標本のサブグループに区別することを指向するよ
うに、後続ニューロンがそのシナプス係数を計算するこ
とによって行う学習、 H─新しい標本のサブグループを生成するために、先行
ニューロンにより識別された標本の非斉次サブグループ
のすべてに対して執られる上記後続ニューロンの行動、
I─新しく生成された標本のサブグループの各々の斉次
性の検査、 J─標本の非斉次サブグループに属する標本の抽出、K
─残りの非斉次標本のサブグループに対する、単一の階
級で形成される斉次サブグループが得られるに至までの
、段階Eで始まる処理の続行、の各ステップを有するこ
とを特徴とする請求項1に記載の分類方法。 - 【請求項3】 シナプス係数の計算は、「ポケット」
アルゴリズムか、「パーセプトロン」型の学習規則か、
又は「ヘッブ」型の学習規則かのいずれかを実行するも
のであることを特徴とする請求項2に記載の分類方法。 - 【請求項4】 請求項1ないし3のうちのいずれか1
項に記載の方法を実行するための手段を有することを特
徴とする学習手段を具えたニューラル・ネットワーク。 - 【請求項5】 標本の階級を、最初の層のニューロン
の2進状態の関数として記憶するメモリを有することを
特徴とする請求項4に記載のニューラル・ネットワーク
。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR9001528A FR2658336A1 (fr) | 1990-02-09 | 1990-02-09 | Procede d'apprentissage d'un reseau de neurones en couches pour classification multiclasses et reseau de neurones en couches. |
| FR9001528 | 1990-02-09 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04213750A true JPH04213750A (ja) | 1992-08-04 |
Family
ID=9393540
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3039043A Pending JPH04213750A (ja) | 1990-02-09 | 1991-02-12 | 層化されたニューラル・ネットワークでの分類方法 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5220618A (ja) |
| EP (1) | EP0446974A1 (ja) |
| JP (1) | JPH04213750A (ja) |
| FR (1) | FR2658336A1 (ja) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5497253A (en) * | 1988-07-18 | 1996-03-05 | Northrop Grumman Corporation | Multi-layer opto-electronic neural network |
| KR930009066B1 (ko) * | 1990-08-18 | 1993-09-22 | 정호선 | 다층신경회로망 및 그 회로설계방법 |
| JP2727257B2 (ja) * | 1991-04-16 | 1998-03-11 | 富士写真フイルム株式会社 | ニューラルネットワークを用いた放射線画像処理方法 |
| DE4207595A1 (de) * | 1992-03-10 | 1993-09-16 | Siemens Ag | Verfahren zur vorklassifikation von hochdimensionalen merkmalsvektoren fuer zwecke der signalverarbeitung |
| US5371809A (en) * | 1992-03-30 | 1994-12-06 | Desieno; Duane D. | Neural network for improved classification of patterns which adds a best performing trial branch node to the network |
| DE69329218T2 (de) * | 1992-06-19 | 2001-04-05 | United Parcel Service Of America, Inc. | Verfahren und Vorrichtung zur Eingabeklassifizierung mit einem neuronalen Netzwerk |
| EP0582885A3 (en) * | 1992-08-05 | 1997-07-02 | Siemens Ag | Procedure to classify field patterns |
| DE69330021T2 (de) * | 1992-12-18 | 2001-10-31 | Raytheon Co., El Segundo | Verbessertes System zur Mustererkennung für Sonar und andere Anwendungen |
| DE19509186A1 (de) * | 1995-03-14 | 1996-09-19 | Siemens Ag | Einrichtung zum Entwurf eines neuronalen Netzes sowie neuronales Netz |
| US5790758A (en) * | 1995-07-07 | 1998-08-04 | The United States Of America As Represented By The Secretary Of The Navy | Neural network architecture for gaussian components of a mixture density function |
| DE19649618A1 (de) * | 1996-11-29 | 1998-06-04 | Alsthom Cge Alcatel | Verfahren und Vorrichtung zur automatischen Klassifikation von Objekten |
| DE19649563A1 (de) * | 1996-11-29 | 1998-06-04 | Alsthom Cge Alcatel | Vorrichtung und Verfahren zur automatischen Klassifikation von Objekten |
| CN109948742B (zh) * | 2019-03-25 | 2022-12-02 | 西安电子科技大学 | 基于量子神经网络的手写体图片分类方法 |
| US12256179B2 (en) | 2022-11-14 | 2025-03-18 | Samsung Electronics Co., Ltd. | Color reconstruction using homogeneous neural network |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60262290A (ja) * | 1984-06-08 | 1985-12-25 | Hitachi Ltd | 情報認識システム |
| JP2940933B2 (ja) * | 1989-05-20 | 1999-08-25 | 株式会社リコー | パターン認識方式 |
-
1990
- 1990-02-09 FR FR9001528A patent/FR2658336A1/fr not_active Withdrawn
-
1991
- 1991-02-06 EP EP91200248A patent/EP0446974A1/fr not_active Withdrawn
- 1991-02-08 US US07/653,592 patent/US5220618A/en not_active Expired - Fee Related
- 1991-02-12 JP JP3039043A patent/JPH04213750A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| FR2658336A1 (fr) | 1991-08-16 |
| EP0446974A1 (fr) | 1991-09-18 |
| US5220618A (en) | 1993-06-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3088766B2 (ja) | ハイアラーキー ニューラル ネットワークに用いる分類方法及びネットワーク | |
| Baldominos et al. | Evolutionary convolutional neural networks: An application to handwriting recognition | |
| Woodward et al. | Active one-shot learning | |
| EP0724750B1 (en) | Method for unsupervised neural network classification with back propagation | |
| CN112288086A (zh) | 一种神经网络的训练方法、装置以及计算机设备 | |
| JPH04213750A (ja) | 層化されたニューラル・ネットワークでの分類方法 | |
| EP0465489A1 (en) | GENETIC SYNTHESIS OF NEURONAL NETWORKS. | |
| CN113627471A (zh) | 一种数据分类方法、系统、设备及信息数据处理终端 | |
| CN114503122A (zh) | 深度神经网络的结构学习和简化方法 | |
| CN117765334A (zh) | 基于深度二值神经网络模型的图像分类方法、系统、设备及介质 | |
| CN118052999A (zh) | 一种多任务大模型的训练方法及装置 | |
| Singh et al. | Two phase learning technique in modular neural network for pattern classification of handwritten Hindi alphabets | |
| KR102788433B1 (ko) | 심층 신경망 구조 학습 및 경량화 방법 | |
| JP3169635B2 (ja) | ニューラルネットワーク及びその学習方法 | |
| Babatunde et al. | Comparative analysis of genetic algorithm and particle swam optimization: An application in precision agriculture | |
| CN113470740A (zh) | 基于全连接网络集成深度学习模型的药物推荐系统、计算机设备、存储介质 | |
| CN117274692A (zh) | 一种基于新遗传编程结构及基因修饰的图像分类方法 | |
| Goswami | Deep learning–a state-of-the-art approach to artificial intelligence | |
| Chen et al. | Static correlative filter based convolutional neural network for visual question answering | |
| Shiri et al. | DeepCaps+: A Light Variant of DeepCaps. | |
| JPH08263660A (ja) | 信号認識方法、信号認識装置、信号認識装置の学習方法及び信号認識装置の学習装置 | |
| Njah et al. | A Constrained Multi-Objective Learning Algorithm for Feed-Forward Neural Network Classifiers | |
| Lis | The synthesis of the ranked neural networks applying genetic algorithm with the dynamic probability of mutation | |
| Nishida et al. | An online learning algorithm with dimension selection using minimal hyper basis function networks | |
| Brady | Neural networks: an overview |