JPH0784977A - Construction method of multilayered neural network - Google Patents
Construction method of multilayered neural networkInfo
- Publication number
- JPH0784977A JPH0784977A JP5230406A JP23040693A JPH0784977A JP H0784977 A JPH0784977 A JP H0784977A JP 5230406 A JP5230406 A JP 5230406A JP 23040693 A JP23040693 A JP 23040693A JP H0784977 A JPH0784977 A JP H0784977A
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- learning
- classification
- rule
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 本発明の目的は、確実な分類規則を保存し、
不確実な分類規則を事例学習で精錬でき、分類精度の向
上を図り、学習効率を上げることができる多層構造型ニ
ューラルネットワークの構成方法を提供することであ
る。
【構成】 ニューラルネットワークの部分構成を概略分
類規則に基づいて初期設定し(ステップ1)、各結合
に、概略分類規則に基づいて確信度を割り付け(ステッ
プ2)、確信度の値に従って、抑制率を決定し(ステッ
プ3)、ニューラルネットワークの学習を行い(ステッ
プ4)、ニューラルネットワークが対象データに対する
分類機能を有しているかを検査する(ステップ5)。
(57) [Summary] [Objective] The object of the present invention is to store a reliable classification rule,
An object of the present invention is to provide a method for constructing a multilayered neural network that can refine uncertain classification rules by case learning, improve classification accuracy, and improve learning efficiency. [Configuration] A partial configuration of the neural network is initialized based on the rough classification rule (step 1), a certainty factor is assigned to each connection based on the rough classification rule (step 2), and the suppression rate is calculated according to the certainty value. Is determined (step 3), the neural network is learned (step 4), and it is checked whether the neural network has a classification function for the target data (step 5).
Description
【0001】[0001]
【産業上の利用分野】本発明は、多層構造型ニューラル
ネットワークの構成方法に係り、特に、多次元特徴ベク
トルで表現された対象データの分類処理を行う多層構造
型ニューラルネットワークの構成方法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for constructing a multi-layered neural network, and more particularly to a method for constructing a multi-layered neural network for classifying target data represented by multidimensional feature vectors.
【0002】[0002]
【従来の技術】従来より、対象データの分類処理を目的
として、多層構造型ニューラルネットワークが用いられ
ている。2. Description of the Related Art Hitherto, a multilayer structure type neural network has been used for the purpose of classifying target data.
【0003】図4は、多層構造型ニューラルネットワー
クの構成を示す。同図において、入力層11は、分類対
象データの特徴量(x1 ,x2 ,x3 ,x4 )を入力
し、出力層12は、分類結果(on1,on2)を出力し、
入力層11と出力層12の間には、1層乃至はそれ以上
の中間層13がある。各層のユニットの入力は、その前
後の層の各々のユニットの出力に結合されている。各々
の層のユニットの出力は、以下の式により決定される。FIG. 4 shows the structure of a multilayer structure type neural network. In the figure, the input layer 11 inputs the feature quantities (x 1 , x 2 , x 3 , x 4 ) of the classification target data, and the output layer 12 outputs the classification results (o n1 , o n2 ),
Between the input layer 11 and the output layer 12, there are one or more intermediate layers 13. The inputs of the units in each layer are coupled to the outputs of each unit in the layers before and after it. The output of each layer unit is determined by the following equation.
【数1】 [Equation 1]
【0004】ここで、oj (k) は、k層(k≧1,k=
1が入力層)のj番目のユニットの出力値であり、wij
(k) は、k−1層のi番目のユニットからk層のj番目
のユニットへの結合荷重であり、N(k-1) はk−1層の
ユニット総数である。但し、式(2) のw0j (k) は、k層
のj番目のユニットにバイアスを与えるための結合荷重
であり、この場合の出力値o0 (k-1) は常に1とする。
また、入力層(k=1)の各ユニットは、入力された特
徴量をそのまま出力する。Here, o j (k) is k layers (k ≧ 1, k =
1 is the output value of the j-th unit in the input layer), and w ij
(k) is the coupling load from the i-th unit of the k-1 layer to the j-th unit of the k layer, and N (k-1) is the total number of units in the k-1 layer. However, w 0j (k) in the equation (2) is a coupling weight for giving a bias to the j-th unit in the k layer, and the output value o 0 (k-1) in this case is always 1.
Further, each unit in the input layer (k = 1) outputs the input feature amount as it is.
【0005】このようなニューラルネットワークにデー
タの分類を行わせるには、入力層11のユニットに分類
対象データの特徴を与えた時に、その対象データの属す
る分類カテゴリに対応する出力層12のユニットのみが
高い値を出力し、他の出力層12のユニットが低い値を
出力するように、上述の各ユニット間の結合荷重wij
(k) 及びバイアス値を設定する必要がある。In such a neural network, the data
In order to classify the data into the units of the input layer 11,
When the characteristics of the target data are given, the
Only the units of the output layer 12 corresponding to the classification category
It outputs a high value and the other units in the output layer 12 output a low value.
As output, the coupling load w between each unit described aboveij
(k)And the bias value needs to be set.
【0006】この設定法として、まず、ニューラルネッ
トワークの初期荷重をランダム値に設定し、対象データ
のサンプルのベクトル要素を入力したときの実際の出力
値と望ましい出力値の誤差が減少するよう、荷重wij
(k) を微少量ずつ繰り返し調整する誤差逆伝搬学習方式
がある。しかし、この方式は、ランダムな初期荷重値か
ら荷重を微少量ずつ調整するため、学習が収束するまで
の収束時間がかかる点や、学習が収束しない場合が多い
等、収束時間、収束性に関する問題がある。また、サン
プルデータのみを参照して学習を行うため、多くのサン
プルデータを得ることができない場合や、サンプルデー
タに偏りがある場合、対象データに関する一般的な分類
性能が得られないという汎化能力に関する問題がある。As this setting method, first, the initial weight of the neural network is set to a random value, and the weight is adjusted so that the error between the actual output value and the desired output value when the vector element of the sample of the target data is input is reduced. w ij
There is an error backpropagation learning method that repeatedly adjusts (k) in small increments. However, since this method adjusts the load in small increments from random initial load values, it takes a long time for the learning to converge, and in many cases the learning does not converge. There is. In addition, since the learning is performed by referring to only the sample data, generalization ability that general classification performance for the target data cannot be obtained when a large amount of sample data cannot be obtained or the sample data is biased. I have a problem with.
【0007】そこで、従来の対象データに関して概ね正
しいと考えられる概略分類規則が既知である場合に、こ
の概略分類規則と等価な初期分類機能を有するようにニ
ューラルネットワークの構造と荷重を初期設定し(特開
平4−76660)、しかる後、初期設定値をできるだ
け保ちつつ事例学習を行う重み変動抑制学習方法(特開
平4−242937)により事例学習を行う方法があ
る。Therefore, when the general classification rule which is considered to be almost correct for the conventional target data is known, the structure and weight of the neural network are initialized so as to have an initial classification function equivalent to this general classification rule ( Japanese Patent Laid-Open No. 4-76660), and thereafter, there is a method for performing case learning by a weight variation suppression learning method (Japanese Patent Laid-Open No. 4-242937) for performing case learning while keeping the initial setting value as much as possible.
【0008】図5は、従来の方法を説明するためのフロ
ーチャートを示す。以下、図5を用いて各処理を説明す
る。対象データのベクトル要素x1 ,x2 ,x3 ,
x4 ,x5 ,x6 から対象データのカテゴリy1 ,y2
のいずれかに属するかを分類する。以下の概ね正しいと
考えられる概略分類規則が与えられているとする。FIG. 5 shows a flow chart for explaining the conventional method. Hereinafter, each process will be described with reference to FIG. Vector elements x 1 , x 2 , x 3 , of the target data,
Categories of target data y 1 , y 2 from x 4 , x 5 , x 6
Classify which one of them belongs to. Given the following general classification rules, which are considered to be generally correct:
【0009】 IF x1 or x2 THEN y’ (3) IF (y’and x3 )or x4 THEN y1 (4) IF x3 or x5 or x6 THEN y2 (5) 規則(3)は、「特徴x1 あるいはx2 が存在すれば、
対象データはサブカテゴリy’に属する」という規則で
あり、規則(4)は、「対象データがサブカテゴリy’
に属し、かつx3 が存在する、或いは、x4 が存在すれ
ば、対象データは、カテゴリy1 に属する」という規則
であり、規則(5)は、「x3 、x5 あるいは、x6 が
存在すれば、対象データはカテゴリy2 に属する」とい
う規則である。IF x 1 or x 2 THEN y '(3) IF (y'and x 3 ) or x 4 THEN y 1 (4) IF x 3 or x 5 or x 6 THEN y 2 (5) Rule (3) ) Is "if the feature x 1 or x 2 exists,
The target data belongs to the subcategory y ', and the rule (4) is that the target data is the subcategory y'.
If x 3 exists or x 4 exists, the target data belongs to category y 1 ”, and the rule (5) is“ x 3 , x 5, or x 6 Is present, the target data belongs to the category y 2 ”.
【0010】これらの概略分類規則は、分類規則/多段
論理式変換処理(ステップ21)により、以下の多段論
理式に変換される。These general classification rules are converted into the following multi-step logical expressions by the classification rule / multi-step logical expression conversion processing (step 21).
【0011】 y’=x1 +x2 (6) y1 =(y’+x3 )+x4 (7) y2 =x4 +x5 +x6 (8) 次に、多段論理式/荷重変換処理(ステップ22)によ
り、分類処理を行うニューラルネットワークの結合構成
は、多段論理式(6)、(7)、(8)に従って、図6
に示すように設置される。図6は、多段論理式/荷重変
換処理により初期設定されたニューラルネットワークの
例を示す。Y ′ = x 1 + x 2 (6) y 1 = (y ′ + x 3 ) + x 4 (7) y 2 = x 4 + x 5 + x 6 (8) Next, a multistage logical expression / load conversion process ( In step 22), the connection configuration of the neural network for performing the classification process is as shown in FIG.
It is installed as shown in. FIG. 6 shows an example of a neural network initially set by the multistage logical expression / weight conversion processing.
【0012】ここで、ニューラルネットワーク31の結
合構成は、同図に示すように、多段論理式の右辺に現れ
る変数毎に一つの入力層ユニットを乗法項毎に一つの第
2中間層ユニットを割り付け、出力層12で全乗法項の
加法を実現するように行う。また、荷重wijは、特開平
4−76660に記述されている方法に従って決定され
る。Here, as shown in the figure, the connection structure of the neural network 31 is such that one input layer unit is allocated to each variable appearing on the right side of the multi-stage logical expression and one second intermediate layer unit is allocated to each multiplication term. , The output layer 12 is implemented so as to realize the addition of the multiplicative term. The load w ij is determined according to the method described in Japanese Patent Laid-Open No. 4-76660.
【0013】次に、パラメータ設定処理(ステップ2
3)により、学習パラメータが設定される。学習パラメ
ータの内容については、学習処理(ステップ24)を説
明する部分で詳細に説明する。パラメータ設定処理にお
いて、学習パラメータは、人手により試行錯誤的に決定
している。Next, a parameter setting process (step 2)
By 3), the learning parameter is set. The contents of the learning parameter will be described in detail in the part for explaining the learning process (step 24). In the parameter setting process, the learning parameter is manually determined by trial and error.
【0014】次に、事例学習処理(ステップ24)によ
り、事例学習が行われる。以下、事例学習処理で用いら
れる、重み変動抑制学習法について説明する。Next, case learning is performed by a case learning process (step 24). The weight variation suppression learning method used in the case learning process will be described below.
【0015】誤差逆伝搬学習法では、サンプルデータの
誤差のみを少なくするため、サンプルデータが少ない場
合や、サンプルデータに偏りがある場合、初期構造が大
きく変化し、対象データに関する一般的な分類能力が低
下するという問題がある。そこで、重み変動抑制学習法
では、以下の式で示される評価関数Eを減少させるよう
に荷重の値を変化させる。In the error back-propagation learning method, only the error of the sample data is reduced. Therefore, when the sample data is small or the sample data is biased, the initial structure changes greatly, and the general classification ability for the target data is improved. There is a problem that Therefore, in the weight variation suppression learning method, the value of the load is changed so as to decrease the evaluation function E represented by the following equation.
【0016】[0016]
【数2】 [Equation 2]
【0017】ここで、Kは、出力層12の層番号、即
ち、ニューラルネットワークの全層数である。また、y
j は、出力層j番目のユニットの当該学習サンプルに対
する望ましい出力値、即ち、正しい分類結果である。W
ij (k) は、荷重wij (k) の初期設定値である。f(x,
y)は、xとyの差の増加に伴って増加する関数であ
り、例えば、|x−y|、(x−y)2 等である。ηij
(k) は抑制率と呼ばれ、評価関数Eに対する各荷重の差
分の寄与の大きさを決める学習パラメータである。抑制
率ηij (k) は、通常、全ての荷重に対して一定の値ない
し、層毎に一定の値としている。右辺の第1項は、学習
サンプルデータの特徴量を入力した時のニューラルネッ
トワークの出力値と望ましい出力値の二乗誤差を示す。
即ち、誤差逆伝搬学習法で用いられた評価関数と等価で
ある。また、第2項は、荷重の初期設定値からのずれを
表す項である。Here, K is the layer number of the output layer 12, that is, the total number of layers of the neural network. Also, y
j is a desired output value for the learning sample of the j-th unit in the output layer, that is, a correct classification result. W
ij (k) is an initial setting value of the load w ij (k) . f (x,
y) is a function that increases with an increase in the difference between x and y, and is, for example, | x−y |, (x−y) 2, or the like. η ij
(k) is called a suppression rate, and is a learning parameter that determines the magnitude of the contribution of the difference of each load to the evaluation function E. The suppression rate η ij (k) is usually a constant value for all loads or a constant value for each layer. The first term on the right side represents the squared error between the output value of the neural network and the desired output value when the feature amount of the learning sample data is input.
That is, it is equivalent to the evaluation function used in the error backpropagation learning method. The second term is a term that represents the deviation of the load from the initial setting value.
【0018】このように、重み変動抑制学習法では、ニ
ューラルネットワークの出力値の二乗誤差と、荷重値の
初期設定値からのずれの和が減少するように荷重を調整
する。従って、抑制率を大きな値に設定すれば、荷重値
の変動を防止できるため、初期に与えた概略分類規則は
強く保存され、逆に小さい値に設定すれば、概略規則は
あまり保存されないことになる。As described above, in the weight variation suppression learning method, the weight is adjusted so that the sum of the squared error of the output value of the neural network and the deviation of the load value from the initial setting value decreases. Therefore, if the suppression rate is set to a large value, the fluctuation of the load value can be prevented, so the rough classification rule given at the beginning is strongly saved, and conversely, if it is set to a small value, the rough rule is not saved much. Become.
【0019】上の評価関数Eを減少させるための、荷重
wij (k) の変化量Δwij (k) は以下の式で与えられる。The change amount Δw ij (k) of the load w ij (k) for reducing the above evaluation function E is given by the following equation.
【0020】[0020]
【数3】 [Equation 3]
【0021】ここで、荷重の変化量Δwij (k) は、荷重
ないし、バイアス値の調整量である。また、右辺第1項
は通常の逆誤差伝搬学習における荷重の調整量と等価で
ある。εは、学習率とよばれ、1回の繰り返しでの調整
量の大きさを決める学習パラメータである。また、dj
(k) は、k層が出力層(k=K)のとき、以下の式で算
出される。Here, the change amount Δw ij (k) of the load is the adjustment amount of the load or the bias value. Further, the first term on the right side is equivalent to the adjustment amount of the load in the ordinary inverse error propagation learning. ε is a learning parameter called a learning rate, which is a learning parameter that determines the magnitude of the adjustment amount in one iteration. Also, d j
(k) is calculated by the following equation when the k layer is the output layer (k = K).
【0022】[0022]
【数4】 [Equation 4]
【0023】k層が中間層の時は、dj (k) は以下の式
で与えられる。When the k layer is the intermediate layer, d j (k) is given by the following equation.
【0024】[0024]
【数5】 [Equation 5]
【0025】以上の式を用いて、繰り返し同じ学習パラ
メータで事例学習を行い、誤差がある一定値以下になっ
た場合に処理を終了する。また、ある回数事例学習を行
っても誤差が減少しない場合や、誤差が減少、増加を繰
り返す振動状態などで収束しない場合も処理を終了す
る。Using the above equations, case learning is repeatedly performed with the same learning parameters, and the processing is terminated when the error falls below a certain value. In addition, the processing is also ended when the error does not decrease even after performing the case learning a certain number of times or when the error does not converge due to the repeated decrease and increase of the vibration.
【0026】次に、分類処理機能検査処理(ステップ2
5)は、テストサンプルデータを実際にニューラルネッ
トワークに入力し、正しい分類結果が出力されるかを検
査する。テストサンプルデータに対する分類機能が得ら
れていれば、すべての処理を終了する。十分な分類機能
が得られていない場合や、学習が振動状態に陥った場合
には、パラメータ設定処理(ステップ23)に戻る。Next, the classification processing function inspection processing (step 2)
In 5), the test sample data is actually input to the neural network, and it is checked whether or not the correct classification result is output. If the classification function for the test sample data is obtained, all processing is terminated. When the sufficient classification function is not obtained or when the learning falls into the vibration state, the process returns to the parameter setting process (step 23).
【0027】従来の方法は、概略分類規則と等価な初期
分類機能を有するようにニューラルネットワークの構造
と荷重を初期設定するため、収束速度、収束性に優れて
いる。また、抑制率を適切な値に設定できれば、サンプ
ルデータが十分得られていない場合や、サンプルデータ
に偏りがある場合であっても、初期構造を適切に保存し
つつ事例学習を行うことができるため、汎化能力低下を
防ぎ、初期に与えられた規則を精錬することが可能であ
る。The conventional method is excellent in convergence speed and convergence because the structure and weight of the neural network are initialized so as to have an initial classification function equivalent to the rough classification rule. In addition, if the suppression rate can be set to an appropriate value, case learning can be performed while preserving the initial structure even when sample data is not sufficiently obtained or the sample data is biased. Therefore, it is possible to prevent the generalization ability from decreasing and refine the rules given in the early stage.
【0028】[0028]
【発明が解決しようとする課題】上記従来の方法は、学
習パラメータの再設定値は試行錯誤的に決定している。
このため、本来、各ユニットの結合毎に異なる値を設定
できる抑制率は、その設定作業に多大な労力が必要であ
るため、全ての結合に対して一定の値、或いは、各層内
の結合に関して一定の値として再設定するのが通常であ
る。しかし、概略分類規則には、略確実であるため強く
保存する必要があるものや、或いは、不確実なのであま
り強く保存する必要がないものなど、様々な確実性をも
つ規則が存在する。このような概略分類規則に対して同
じ抑制率で学習を行った場合、抑制率が大きければ、不
確実な規則の精錬が妨げられてしまい、抑制率が小さけ
れば、確実な規則がノイズの影響を受けて不必要に変化
し、汎化能力が低下する等の問題がある。In the above-mentioned conventional method, the reset value of the learning parameter is determined by trial and error.
Therefore, originally, the suppression rate at which a different value can be set for each coupling of each unit requires a great deal of labor for the setting work, and therefore a constant value for all couplings or a coupling within each layer is required. It is usually reset to a constant value. However, there are rules with various certainty in the rough classification rules, such as one that needs to be strongly preserved because it is almost certain, and one that does not need to be strongly preserved because it is uncertain. When learning is performed at the same suppression rate for such rough classification rules, if the suppression rate is large, refining of uncertain rules will be hindered, and if the suppression rate is small, the certain rules will be affected by noise. Therefore, there is a problem that it changes unnecessarily and the generalization ability decreases.
【0029】また、概略分類規則全体がかなり確実であ
れば、事例学習による結合の変更は、微少量で済むた
め、1回に調整する荷重の量を決定する学習率は、小さ
な値に設定する方が収束性がよい。逆に概略分類規則が
不確実であるならば、学習の初期の段階においては、学
習率は大きな値に設定する方が効率的である。しかし、
従来の方法では、規則の確実性を考慮していなかったた
め、上記のように学習率を適切な値に設定できず、学習
が効率的に行うことができないという問題がある。Further, if the overall rough classification rule is fairly reliable, the change of the connection by case learning can be made in a very small amount, so the learning rate for determining the amount of weight to be adjusted at one time is set to a small value. The convergence is better. On the contrary, if the rough classification rule is uncertain, it is more efficient to set the learning rate to a large value in the early stage of learning. But,
In the conventional method, since the certainty of the rule is not taken into consideration, there is a problem that the learning rate cannot be set to an appropriate value as described above and learning cannot be performed efficiently.
【0030】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、分類処理を行う多層構
造型ニューラルネットワークを構成する際に、確実な分
類規則を保存し、不確実な分類規則を事例学習で精錬で
き、分類精度の向上を図り、学習効率を上げることがで
きる多層構造型ニューラルネットワークの構成方法を提
供することを目的とする。The present invention has been made in view of the above points, and when solving the above-mentioned conventional problems and constructing a multilayer structure type neural network for performing a classification process, a reliable classification rule is saved and An object of the present invention is to provide a method for constructing a multilayer structure type neural network which can refine a reliable classification rule by case learning, improve classification accuracy, and improve learning efficiency.
【0031】[0031]
【課題を解決するための手段】図1は、本発明の原理説
明図である。本発明は、複数のベクトル要素からなる特
徴ベクトルで表現された対象データに関して、規則の確
実性を表す確信度付きの概略分類規則が既知である場合
に、対象データの分類処理を行う多層構造型ニューラル
ネットワークを構成する方法において、ニューラルネッ
トワークの部分構成を概略分類規則に基づいて初期設定
し(ステップ1)、ニューラルネットワークの初期設定
された部分構成の各結合に、概略分類規則に基づいて確
信度を割り付け(ステップ2)、部分構成の各結合に割
り付けられた確信度の値に従って、ニューラルネットワ
ークの評価関数に対する各荷重の差分の寄与の大きさを
決める学習パラメータである抑制率を決定し(ステップ
3)、サンプルデータを用いてニューラルネットワーク
の学習を行い(ステップ4)、ニューラルネットワーク
が対象データに対する分類機能を有しているかを検査
し、有していない場合には、学習パラメータを決定する
処理以降を繰り返し、有している場合には、処理を終了
する(ステップ5)。FIG. 1 is a diagram for explaining the principle of the present invention. The present invention relates to a multi-layered structure type that performs a classification process of target data when the rough classification rule with certainty factor indicating the certainty of the rule is known for the target data represented by the feature vector composed of a plurality of vector elements. In a method of constructing a neural network, a partial configuration of a neural network is initialized based on a rough classification rule (step 1), and a confidence factor is calculated based on the rough classification rule for each connection of the initialized partial configurations of the neural network. Is assigned (step 2), and the suppression rate, which is a learning parameter that determines the size of the contribution of the difference of each weight to the evaluation function of the neural network, is determined according to the value of the certainty factor assigned to each combination of partial configurations (step 2). 3), learning the neural network using the sample data (step 4), It is checked whether or not the Ural network has a classification function for the target data, and if it does not, the processing for determining the learning parameter and subsequent steps are repeated, and if it does, the processing ends ( Step 5).
【0032】また、本発明は、学習パラメータを決定す
る場合(ステップ3)に、1回の繰り返しで荷重または
バイアスの調整量の大きさを決定する前記学習パラメー
タである学習率を、概略規則の確信度の代表値に従って
決定する。In addition, according to the present invention, when the learning parameter is determined (step 3), the learning rate, which is the learning parameter for determining the magnitude of the adjustment amount of the load or the bias in one iteration, is set as a rule. It is determined according to the representative value of the certainty factor.
【0033】[0033]
【作用】本発明は、個々の概略分類規則に確信度と呼ば
れる規則の確実性を表す尺度を設け、この尺度に従っ
て、学習パラメータである抑制率の設定を行う。これに
より、学習をサンプルデータが少なかったり、偏りがあ
った場合に、概略分類規則が保存されるように、ニュー
ラルネットワークの各結合に割り付けられた確信度に従
って、抑制率を増加させ、また、誤差が減少しなくなる
場合には、抑制率を減少させるような調整を行うことに
より、確実な分類規則を保存し、不確実な分類規則を事
例学習で精錬することができるため、分類処理の精度が
向上する。According to the present invention, each rough classification rule is provided with a measure called certainty, which is a measure of the certainty of the rule, and the suppression rate, which is a learning parameter, is set according to this measure. This increases the suppression rate according to the certainty factor assigned to each connection of the neural network so that the rough classification rule is preserved when learning has a small amount of sample data or bias, and the error rate is also increased. If the value does not decrease, the accuracy of the classification process can be improved by adjusting the reduction rate so that the reliable classification rules can be saved and the uncertain classification rules can be refined by case learning. improves.
【0034】また、個々の概略分類規則の確信度の代表
値に応じた学習率を設定できる。Further, the learning rate can be set according to the representative value of the certainty factor of each rough classification rule.
【0035】[0035]
【実施例】以下、図面とともに本発明の実施例を説明す
る。Embodiments of the present invention will be described below with reference to the drawings.
【0036】まず、以下のような書き下ろした確信度付
き概略分類規則があるとする。 IF x1 or x2 THEN y’with C1 (14) IF(y’and x3 )or x4 THEN y1 with C2 (15) IF x3 or x5 or x6 THEN y2 with C3 (16) ここで、C1,C2,C3は、確信度であり、規則(1
4)は、特徴x1 あるいは、x2 が存在すれば、対象デ
ータはサブカテゴリy’に属する」という概略規則がC
1程度信頼できることを示す。First, it is assumed that there is the following written general classification rule with certainty factor. IF x 1 or x 2 THEN y'with C1 (14) IF (y'and x 3 ) or x 4 THEN y 1 with C2 (15) IF x 3 or x 5 or x 6 THEN y 2 with C3 (16) Here, C1, C2, C3 are the certainty factors, and the rule (1
4) is that if the feature x 1 or x 2 exists, the target data belongs to the subcategory y '.
It shows that it is reliable about 1.
【0037】規則(15)、規則(16)も同様に、そ
れぞれC2,C3程度信頼できることを示す。また、確
信度CFは、0<CF<1のアナログ値であり、CF=
1が最も高い確信度、逆にCF=0が最も低い確信度で
あるとする。Similarly, the rules (15) and (16) also indicate that the reliability is about C2 and C3, respectively. The confidence factor CF is an analog value of 0 <CF <1, and CF =
It is assumed that 1 is the highest certainty, and conversely, CF = 0 is the lowest certainty.
【0038】図2は、本発明の一実施例の概要を示すフ
ローチャートである。同図において、ステップ21、2
2、24、及び25は、図5に示す従来の処理と同様で
ある。FIG. 2 is a flow chart showing the outline of one embodiment of the present invention. In the figure, steps 21, 2
2, 24, and 25 are similar to the conventional processing shown in FIG.
【0039】まず、従来の方法と同様に、分類規則/多
段論理式変換処理(ステップ21)及び多段論理式/荷
重変換処理(ステップ22)により、図4に示すような
結合構成のニューラルネットワークを構成する。First, similarly to the conventional method, the classification rule / multistage logical formula conversion process (step 21) and the multistage logical formula / weight conversion process (step 22) are used to construct a neural network having a connection structure as shown in FIG. Constitute.
【0040】図3は、本発明の一実施例の学習パラメー
タを設定するニューラルネットワークを説明するための
図である。同図において、点線に囲まれた部分ネットワ
ーク511、521、531がそれぞれ規則(14)、
(15)、(16)に対応する。FIG. 3 is a diagram for explaining a neural network for setting learning parameters according to an embodiment of the present invention. In the figure, the partial networks 511, 521, and 531 surrounded by the dotted line are rule (14),
It corresponds to (15) and (16).
【0041】確信度割り付け処理(ステップ41)は、
図3に示した点線内の結合にそれぞれに割り付けた分類
規則の確信度を割り付ける。また、バイアス値について
は、入力する結合の確信度を割り付ける。但し、図3に
示すユニット522のように、確信度C1とC2という
異なる確信度を割り付けられた結合を入力とするユニッ
トのバイアス値は、各結合に割り付けられた確信度のう
ち、最小値を選択する。また、概略分類規則の全体の確
信度は、全規則の確信度の平均値とする。以下、各結合
に割り付けられた確信度をCij (k) 、確信度の平均値を
Cmid と表す。The certainty factor allocation process (step 41)
The certainty factor of the classification rule assigned to each of the connections within the dotted line shown in FIG. 3 is assigned. For the bias value, the certainty factor of the input combination is assigned. However, as in the unit 522 shown in FIG. 3, the bias value of a unit whose input is a combination to which different certainty factors C1 and C2 are assigned is the minimum value among the certainty factors assigned to each combination. select. The overall confidence level of the rough classification rules is the average value of the confidence levels of all the rules. Hereinafter, the certainty factor assigned to each combination will be referred to as C ij (k) , and the average value of the certainty factors will be referred to as C mid .
【0042】次に、確信度をもとにした学習パラメータ
算出処理(ステップ42)は、以下の規則に従って、学
習パラメータの設定処理を行う。なお、以下の規則に従
った設定処理と、事例学習処理(ステップ24)とを、
ニューラルネットワークが分類処理機能を得るまで繰り
返し行う。Next, in the learning parameter calculation process (step 42) based on the certainty factor, the learning parameter setting process is performed according to the following rules. In addition, the setting process according to the following rules and the case learning process (step 24)
This is repeated until the neural network has the classification processing function.
【0043】《規則1》初期設定値は、以下のようにす
る。 Ho ij (k) =0 (17) A0 =−0.2×Cmid +0.2 (18) R=1 (19) 但し、Ht ij (k) は、t回目の再設定時における抑制率
の値、At は、学習率である。また、Rは、抑制率の増
加、減少を繰り返した回数を保存するカウンタである。<< Rule 1 >> The initial setting values are as follows. Ho ij (k) = 0 (17) A 0 = −0.2 × C mid +0.2 (18) R = 1 (19) where H t ij (k) is the suppression rate at the t-th resetting. The value A t is the learning rate. Further, R is a counter that stores the number of times that the suppression rate is repeatedly increased and decreased.
【0044】《規則2》事例学習処理(ステップ24)
において、学習サンプルデータに対する誤差が減少しな
い場合、以下のように再設定する。まず、(t−1)回
目の処理で規則3が適用されていた場合、カウンタRを
インクリメントする。 R=R+1 (20) 次に、抑制率を以下の式に従って設定する。 H(t) ij (k) =H(t-1) ij (k) +Cij (k) /R (21) 《規則3》分類処理機能検査処理(ステップ25)にお
いて、十分な分類処理機能が得られていない場合、以下
のように再設定する。(t−1)回目の処理で規則2が
適用されていた場合、カウンタRをインクリメントす
る。 R=R+1 (22) 次に、抑制率を以下の式に従って設定する。 H(t) ij (k) =H(t-1) ij (k) −Cij (k) /R (23) 以上の規則を適用した場合、学習は、以下のように進行
する。<Rule 2> Case study processing (step 24)
In, if the error with respect to the learning sample data does not decrease, reset as follows. First, when the rule 3 is applied in the (t-1) th process, the counter R is incremented. R = R + 1 (20) Next, the suppression rate is set according to the following formula. H (t) ij (k) = H (t-1) ij (k) + Cij (k) / R (21) << Rule 3 >> Classification processing function In the inspection processing (step 25), a sufficient classification processing function is obtained. If not, reset as follows. When the rule 2 is applied in the (t-1) th process, the counter R is incremented. R = R + 1 (22) Next, the suppression rate is set according to the following formula. H (t) ij (k) = H (t-1) ij (k) -Cij (k) / R (23) When the above rules are applied, learning proceeds as follows.
【0045】まず、規則1が適用され、抑制率は、 Ho ij (k) =0 即ち、学習が従来の誤差逆伝搬学習方法と同じになるよ
うに初期設定される。また、学習率は、 Cmin =1 即ち、概略分類規則が100%信用できる時、A0 =0
となり、Cmin =0即ち、規則を全く信用できない時、
A0 =0.2となるよう式(18)に従って設定する。
ここで、0.2は、誤差逆伝搬学習方で一般に使われて
いる学習率である。First, rule 1 is applied, and the suppression rate is initialized so that Ho ij (k) = 0, that is, the learning is the same as the conventional error backpropagation learning method. Further, the learning rate is C min = 1, that is, when the rough classification rule is 100% credible, A 0 = 0
And C min = 0, that is, when the rule cannot be trusted at all,
It is set according to the equation (18) so that A 0 = 0.2.
Here, 0.2 is a learning rate generally used in the error backpropagation learning method.
【0046】以上のように設定し、事例学習処理を行う
が、学習サンプルデータが少なかったり、偏りがある場
合、例え、サンプルデータに関する誤差が減少しても汎
化能力は得られず、テストデータに関する分類機能は向
上しない。このような場合には、規則2が適用され、概
略分類規則が保存されるように、各結合に割り付けられ
た確信度に従って抑制率を増加させる。確信度の増加を
繰り返し行っていた場合、事例学習処理を行っても誤差
が減少しなくなる場合がある。このような場合には、規
則3が適用され、抑制率を減少させる。When the case learning processing is performed with the above settings, if the learning sample data is small or biased, the generalization ability cannot be obtained even if the error related to the sample data is reduced, and the test data is not obtained. The classification function for does not improve. In such a case, rule 2 is applied and the inhibition rate is increased according to the confidence assigned to each join so that the rough classification rule is preserved. If the confidence factor is repeatedly increased, the error may not decrease even if the case learning process is performed. In such cases, Rule 3 is applied to reduce the inhibition rate.
【0047】以上の処理により、分類処理機能を有した
ニューラルネットワークが構成される。By the above processing, a neural network having a classification processing function is constructed.
【0048】なお、本発明は、上記実施例で用いた方法
に限定されず、請求範囲を逸脱しない限度で種々変更が
可能である。例えば、本実施例において、異なる確信度
を割り付けられた結合を入力とするユニットのバイアス
値の確信度は、最小値以外に平均値などを用いることも
可能である。また、概略分類規則全体の確信度の代表値
は、メジアン等、平均値以外の基本的な方法で代行させ
ることも可能である。The present invention is not limited to the method used in the above embodiment, and various modifications can be made without departing from the scope of the claims. For example, in the present embodiment, as the confidence factor of the bias value of the unit that receives the combination to which different confidence factors are assigned, an average value or the like can be used in addition to the minimum value. Further, the representative value of the certainty factor of the overall rough classification rule can be substituted by a basic method other than the average value such as median.
【0049】また、初期設定時から確信度に従って、抑
制率を設定する規則を適用することも可能である。It is also possible to apply a rule for setting the suppression rate according to the certainty factor from the initial setting.
【0050】[0050]
【発明の効果】上述のように、本発明は、分類処理を行
う多層構造型ニューラルネットワークを構成する際に、
ニューラルネットワークに初期設定した概略分類規則に
基づいて、各結合に確信度を割り付けた確信度に従っ
て、抑制率を各結合毎に設定できるため、確実な分類規
則を保存し、また、不確実な分類規則を事例学習で精錬
でき、分類精度の向上が図れる。また、1回に調整する
量を決定する学習率を、概略分類規則全体が確実である
ときは、小さな値に設定でき、反対に、不確実であれば
大きな値に設定できるため、学習が効率的に行うことが
できる。また、従来人手により試行錯誤的に行っていた
パラメータ設定のための作業を軽減することができる。As described above, according to the present invention, in constructing a multilayer structure type neural network for performing classification processing,
Based on the general classification rule initially set in the neural network, the suppression rate can be set for each connection according to the certainty value assigned to each connection, so a reliable classification rule can be saved and uncertain classification can be performed. The rules can be refined by case study, and the classification accuracy can be improved. In addition, the learning rate that determines the amount to be adjusted at one time can be set to a small value when the overall rough classification rule is certain, and can be set to a large value when it is uncertain, so that the learning efficiency is high. Can be done on a regular basis. In addition, it is possible to reduce the work for setting parameters, which has conventionally been performed manually by trial and error.
【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.
【図2】本発明の一実施例の概要を示すフローチャート
である。FIG. 2 is a flowchart showing an outline of an embodiment of the present invention.
【図3】本発明の一実施例の学習パラメータを設定する
ニューラルネットワークを説明するための図である。FIG. 3 is a diagram for explaining a neural network that sets a learning parameter according to an embodiment of the present invention.
【図4】多層構造型ニューラルネットワークの構成例を
示す図である。FIG. 4 is a diagram showing a configuration example of a multilayer structure type neural network.
【図5】従来の方法を説明するためのフローチャートで
ある。FIG. 5 is a flowchart illustrating a conventional method.
【図6】多段論理式/荷重変換処理により初期設定され
たニューラルネットワークの例を示す図である。FIG. 6 is a diagram showing an example of a neural network initially set by a multi-stage logical expression / weight conversion process.
11 分類対象の特徴量を入力する入力層 12 分類結果を出力する出力層 13 中間層 51、52、53 多段論理式に従って構成されたニュ
ーラルネットワークの例 511 規則(14)を割り付けたニューラルネットワ
ーク 521 規則(15)を割り付けたニューラルネットワ
ーク 522 異なる確信度を割り付けた結合を入力とするユ
ニット 531 規則(16)を割り付けた部分ニューラルネッ
トワーク11 Input layer for inputting feature amount of classification target 12 Output layer for outputting classification result 13 Intermediate layer 51, 52, 53 Example of neural network configured according to multistage logical expression 511 Neural network 521 to which rule (14) is assigned 521 Rule Neural network to which (15) is assigned 522 Unit which receives as input a combination to which different certainty factors are assigned 531 Partial neural network to which rule (16) is assigned
Claims (2)
ルで表現された対象データに関して、規則の確実性を表
す確信度付きの概略分類規則が既知である場合に、該対
象データの分類処理を行う多層構造型ニューラルネット
ワークを構成する方法において、 該ニューラルネットワークの部分構成を該概略分類規則
に基づいて初期設定し、 該ニューラルネットワークの初期設定された該部分構成
の各結合に、該概略分類規則に基づいて確信度を割り付
け、 該部分構成の各結合に割り付けられた該確信度の値に従
って、該ニューラルネットワークの評価関数に対する各
荷重の差分の寄与の大きさを決める学習パラメータであ
る抑制率を決定し、 サンプルデータを用いて該ニューラルネットワークの学
習を行い、 該ニューラルネットワークが該対象データに対する分類
機能を有しているかを検査し、有していない場合には、
該学習パラメータを決定する処理以降を繰り返し、有し
ている場合には、処理を終了することを特徴とする多層
構造型ニューラルネットワークの構成方法。1. A multi-layer for performing a classification process on target data represented by a feature vector composed of a plurality of vector elements when a rough classification rule with a certainty factor indicating the certainty of the rule is known. In a method of constructing a structural neural network, a partial configuration of the neural network is initialized based on the general classification rule, and each combination of the initialized partial configurations of the neural network is based on the general classification rule. And assigning a certainty factor according to the value of the certainty factor assigned to each combination of the partial configurations, a suppression rate that is a learning parameter that determines the magnitude of the contribution of the difference of each weight to the evaluation function of the neural network is determined. , Learning of the neural network using sample data, the neural network Checks whether a classification function for data, if they do not have the
A method for constructing a multilayer structure type neural network, characterized in that the processing after the processing for determining the learning parameter is repeated, and if the learning parameter is included, the processing is terminated.
1回の繰り返しで荷重またはバイアスの調整量の大きさ
を決定する前記学習パラメータである学習率を、前記概
略規則の確信度の代表値に従って決定する請求項1記載
の多層構造型ニューラルネットワークの構成方法。2. When determining the learning parameter,
The configuration of a multilayer structure type neural network according to claim 1, wherein the learning rate, which is the learning parameter for determining the magnitude of the adjustment amount of the load or the bias in one iteration, is determined according to the representative value of the certainty factor of the general rule. Method.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5230406A JPH0784977A (en) | 1993-09-16 | 1993-09-16 | Construction method of multilayered neural network |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5230406A JPH0784977A (en) | 1993-09-16 | 1993-09-16 | Construction method of multilayered neural network |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0784977A true JPH0784977A (en) | 1995-03-31 |
Family
ID=16907390
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5230406A Pending JPH0784977A (en) | 1993-09-16 | 1993-09-16 | Construction method of multilayered neural network |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0784977A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022012405A (en) * | 2020-07-01 | 2022-01-17 | 株式会社Screenホールディングス | Image processing system, visual inspection equipment, trained parameter, image processing method, and program |
-
1993
- 1993-09-16 JP JP5230406A patent/JPH0784977A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022012405A (en) * | 2020-07-01 | 2022-01-17 | 株式会社Screenホールディングス | Image processing system, visual inspection equipment, trained parameter, image processing method, and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN115861625B (en) | A self-label modification method for dealing with noisy labels | |
| CN111008690A (en) | Method and apparatus for learning neural network with adaptive learning rate | |
| US5926804A (en) | Discriminant neural networks | |
| CN113673592B (en) | Sample selection method and device, classifier training method and device | |
| CN119886264A (en) | Training method of classified neural network and target classification method | |
| CN112580785B (en) | Three-way decision-based neural network topology optimization method | |
| US5890143A (en) | Apparatus for refining determination rule corresponding to probability of inference result of evaluation object, method thereof and medium thereof | |
| JPH0784977A (en) | Construction method of multilayered neural network | |
| JPH0451384A (en) | Neural network and its construction method | |
| CN111209839A (en) | Face recognition method | |
| US6813390B2 (en) | Scalable expandable system and method for optimizing a random system of algorithms for image quality | |
| US20210241077A1 (en) | Computing apparatus, computing method, storage medium, and table generating apparatus | |
| CN111666872A (en) | Efficient behavior identification method under data imbalance | |
| Yildiz et al. | Ordering and finding the best of K> 2 supervised learning algorithms | |
| JPH06309293A (en) | Constituting method for multilayer structure type neural network | |
| JP2002042107A (en) | Learning method of neural network | |
| JP2000259598A (en) | Optimization Learning Method of Neural Network | |
| JPH0991264A (en) | Method and device for optimizing neural network structure | |
| CN117035819A (en) | A method and equipment for identifying the upstream and downstream of the industrial chain based on industry power data | |
| Kondo | Identification of radial basis function networks by using revised GMDH-type neural networks with a feedback loop | |
| JP2606317B2 (en) | Learning processing device | |
| JP3412700B2 (en) | Neural network type pattern learning method and pattern processing device | |
| JPH07104849B2 (en) | Learning method of neural network | |
| KR970006030B1 (en) | Local linear regression model structure | |
| JPH064692A (en) | Learning method of neural network |