JPH05143636A - 判別分析方法及び装置 - Google Patents

判別分析方法及び装置

Info

Publication number
JPH05143636A
JPH05143636A JP3332848A JP33284891A JPH05143636A JP H05143636 A JPH05143636 A JP H05143636A JP 3332848 A JP3332848 A JP 3332848A JP 33284891 A JP33284891 A JP 33284891A JP H05143636 A JPH05143636 A JP H05143636A
Authority
JP
Japan
Prior art keywords
discriminant
discriminant function
function
separated
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3332848A
Other languages
English (en)
Inventor
Tokumasa Yakura
得正 矢倉
Toru Fujii
徹 藤井
Hirohide Ushida
牛田  博英
Yasuhiro Tsutsumi
康弘 堤
Atsushi Irie
篤 入江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP3332848A priority Critical patent/JPH05143636A/ja
Publication of JPH05143636A publication Critical patent/JPH05143636A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】 【目的】 たとえ母集団の境界形状が非線形で複雑であ
っても、線形な判別関数でもって確実に分離することが
できる判別分析方法及び装置を提供すること。 【構成】 状態設定装置11の出力データを受け取り、
複数の母集団に分離すべく線形の判別関数を設定する判
別関数設定装置12と、その判別関数設定装置12にて
得られた判別関数によってサンプルデータが完全に分離
されたか否かを判断する分離終了判定装置13と、分離
されなかった場合に得られた判別関数に垂直でデータ数
を2等分する垂直関数を設け、その垂直関数で分けられ
た部分の各サンプルデータをそれぞれ分離して判別関数
設定装置に入力する第1判別領域絞り装置14と、判別
関数設定装置にて得られたすべての判別関数を受け取
り、入力された想起データWに対しその判別関数を用い
てその想起データWが属する母集団を決定する判別装置
15とからなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の母集団を分離す
るための判別分析方法及び装置に関するもので、特に判
別分析を行う基準となる判別関数の作成する方法の改良
並びにそれを行うための装置に関する。
【0002】
【従来の技術】判別分析は、p種の変量を持つデータ
が、与えられたk個の母集団のどこに属するかを判別す
るもので、まず予め多次元のサンプルデータから最も判
別しやすい境界、すなわち、誤判別を生じる確率和を最
小にするような境界を判別関数として取出し、次いで新
たに与えられた未知の想起用データが係る判別関数のど
ちら側に位置しているかを判断することにより属する母
集団の特定を行うようになっている。
【0003】
【発明が解決しようとする課題】しかし、上記した従来
の判別分析で用いられた線形の判別関数では、母集団の
境界形状が複雑になると、その母集団を厳密に分離でき
なくなる。そのため、想起用データがどの母集団に属す
るかの判断における信頼性が低下する。また、近年、ニ
ューラルネットやファジィで代表されるような非線形分
離のニーズが高くなり、係るニューラルネットを用いれ
ば、上記した複雑な境界形状を有する母集団の分離も可
能である。しかし、ニューラルネットを用いた場合、境
界形状が複雑になればなるほど、また、入力するサンプ
ルデータ数が多くなるほど学習に時間がかかるとともに
得られた計算結果の解析がしにくいなどの問題を有す
る。
【0004】本発明は、上記した背景に鑑みてなされた
もので、その目的とするところは、たとえ分離する母集
団の境界形状が非線形で複雑であるような場合であって
も、線形な判別関数でもって確実に分離することがで
き、しかも、係る分離に要する学習時間等を短時間で処
理することのできる判別分析方法及び装置を提供するこ
とにある。
【0005】
【課題を解決するための手段】上記した目的を達成する
ために、本発明に係る判別分析方法では、サンプルデー
タから形成される複数の母集団に対して判別分析を行っ
て判別関数を求め、係る判別関数で母集団の分離ができ
ない時には、前記判別関数に垂直な所定の垂直関数を引
き、その垂直関数で分離される領域に位置するサンプル
データ毎に判別関数を求めるようにした。
【0006】また、サンプルデータから形成される複数
の母集団に対して判別分析を行って判別関数を求め、係
る判別関数で母集団の分離ができない時に、その分離で
きない部分を挟むようにして前記判別関数と平行な2つ
の関数を設定し、それら両関数で囲まれる領域に対し、
判別関数と平行な方向に度数分布をとり、その分布状態
からデータを分離できるか否かを判断し、分離できる場
合にはその分布を分ける仕切り値を求め、一方分離でき
ない場合には前記領域内に位置するサンプルデータに対
し判別関数を行うようにしてもよい。さらには、上記2
つの方法を適宜組み合わせて実行するようにしても良
い。
【0007】また、上記方法を実施するに適した判別分
析装置としては、入力されたサンプルデータに基づき複
数の母集団に分離すべく確率的に最も誤判別の少なくな
るような線形の判別関数を設定する判別関数設定装置
と、その判別関数設定装置にて得られた判別関数によっ
てサンプルデータが完全に分離されたか否かを判断する
分離終了判定装置と、サンプルデータが完全に分離され
なかった場合に、求められた判別関数に垂直な垂直関数
を引くと共に、その垂直関数で分けられた部分のサンプ
ルデータをそれぞれ分離して前記判別関数設定装置に入
力する第1判別領域絞り装置とから構成することであ
る。
【0008】また、上記第1判別領域絞り装置に替え
て、求められた判別関数に平行な2つの関数によって分
離できない部分を挟み、その挟まれた部分を判別関数と
平行な方向に度数分布を取り、その分布状態からデータ
を分離できる時にはその仕切り値を設定し、分離できな
い時は前記2つの関数間に挾まれた領域に属するサンプ
ルデータを前記判別関数設定装置に入力する第2判別領
域絞り装置を設けても良い。
【0009】
【作用】与えられたサンプルデータに対して線形の判別
関数を設定し、その判別関数により母集団を分離できた
か否かを判断する。そして、分離できない場合には、得
られた判別関数を基準にして得られる垂直な垂直関数、
或いはその判別関数に平行な関数により新たな領域を形
成し、その新たな領域のサンプルデータに対して判別関
数を求める。そして、母集団同士を完全に分離できるま
で行う。これにより、たとえ母集団の境界形状が非線形
であったとしても、線形の判別関数でもって分離され
る。
【0010】また、必要に応じ、上記判別関数に加え、
所定の判別関数に平行な方向に度数分布をとり、得られ
る仕切り値を用いることにより、少ない判別関数でもっ
て母集団の分離が行われる。
【0011】
【実施例】以下、本発明に係る判別分析方法及び装置の
好適な実施例を添付図面を参照にして詳述する。図1は
本発明に係る判別分析装置の第1実施例を示している。
同図に示すように、母集団の判別を行うための多変量解
析用のサンプルデータXijを出力する状態設定装置11
と、その状態設定装置11の出力データを受け取り、複
数の母集団に分離すべく確率的に最も誤判別の少なくな
るような線形の判別関数を設定する判別関数設定装置1
2と、その判別関数設定装置12にて得られた判別関数
によってサンプルデータが完全に分離されたか否かを判
断する分離終了判定装置13と、サンプルデータが完全
に分離されなかった場合に、求められた判別関数に垂直
な分割線(垂直関数)を、データ数を2等分する位置に
引くと共に、その垂直関数で分けられた部分のサンプル
データをそれぞれ分離して判別関数設定装置12に入力
する第1判別領域絞り装置14と、判別関数設定装置1
2にて得られたすべての判別関数を受け取り、入力され
た想起データWに対しその判別関数を用いてその想起デ
ータWが属する母集団を決定する判別装置15とを備え
ている。 ここで、上記状態設定装置11で設定される
サンプルデータXij(iは変量の数(i=1〜n)を、
jはサンプル数(j=1〜N)をそれぞれ意味する)の
具体的なデータ構造は、 X1 = [X11,X21,…,Xn1] X2 = [X12,X22,…,Xn2] : : Xj = [X1j,X2j,…,Xnj] : : XN = [X1N,X2N,…,XnN] のようになっている。
【0012】また、判別関数設定装置11で形成される
判別関数Zk (X)のデータ構造は、 Zk (X)=ak1*X1+ak2*X2+… +akn*Xn+bk となっている。ここで、aki 並びにbkは定数項である。
また、kは不連続な自然数であり、判別される母集団の
番号を示す。そして、第1判別領域絞り装置14で形成
される判別関数に垂直な分割線ZT1 (X)のデータ構
造は、 ZTk (X)=atk1*X1+atk2*X2+…atkn*Xn+btk となっている。ここで、atki 並びにbtkは定数項であ
る。
【0013】さらに、判別関数にて分離された母集団A
k とBk は、それぞれ通し番号が付加され、この番号は
生成された順につけられるようになっている。すなわ
ち、s回目の分割でAk からできた集団はA2sとA(2s+
1)となり、同様にBk からはB2sとB(2s+1)となる。な
お、sは1から始まる連続した自然数である。また、分
割された2つの母集団に対し付加する数字は、原点に近
いほうの母集団を2sにする。
【0014】次に、上記した実施例を用いて本発明に係
る判別分析方法の第1実施例について図2に示すフロー
チャートを参照にして説明する。まず、所定の母集団を
分離するための判別関数の設定する手順について説明す
ると、状態設定装置11によりすべての多変量解析用の
サンプルデータXijを判別関数設定装置12に入力し
(S101)、その判別関数設定装置12では与えられ
たサンプルデータXijから、2つの母集団Ak ,Bk を
最も効率よく分割する線形の判別関数Zk (X)を求め
る(S102)。次いで、その判別関数Zk(X)を分
離終了判定装置13に入力し、そこにおいてその得られ
た判別関数Zk (X)に全サンプルデータXijを入力し
両母集団A,Bに完全に分離され、判別可能であるか否
かが判断される(S103)。そして、判別可能である
場合には、すべての判別関数Zk (X)を判別装置15
に入力し、処理を終了する(S104)。
【0015】一方、判別できなかった場合には、判別関
数並びにサンプルデータを第1判別領域絞り装置14に
送り、その判別関数Zk (X)に垂直で、しかも、両母
集団Ak ,Bk を構成するサンプルデータの数を2等分
するような垂直関数ZTk (X)を求める。そして、求
められた分割線ZTk (X)でもって両母集団を分割す
る(S105)。なお、上述したごとく、この分割によ
り分けられた各領域には、通し番号が付与される。すな
わち、例えば母集団A1 に対し1回目の分割によって分
割された2つの母集団は、2×1=2,2×1+1=3
より、それぞれA2 ,A3 となる。これにより4つの母
集団A2s,A(2s+1) ,B2s,B(2s+1) が生成される
ことになる。
【0016】また、後の想起データの判別を行うため
に、各母集団の関連付けを明確化しておく必要がある。
よって、下記に示すようなTaiとTbiのテーブルを
作成する。
【0017】 Tai:[(Ai,AL ,AL+1 ),(F),(dui,doi)] Tbi:[(Bi,BL ,BL+1 ),(F),(dui,doi)] 但し i,L =1,2,3,… ここで、各テーブルの意味は、第1項から第3項までは
母集団のTree関係、すなわち、判別関数に直交する
垂直関数によりAi(Bi)がAL ,AL+1 (BL ,B
L+1 )に分割されたことを意味する。なお、分岐先がな
い、すなわち対となる母集団Ak とBk とが分離された
場合には、上記第1項〜第3項は(0,0,0)とす
る。また、第4項目のFは、判別関数により母集団Ak
とBk とが分離されたか否かのフラグを意味し、分離さ
れた場合には「1」または「−1]となり、分離されな
かった場合には「0」となる。具体的な算出手法は、母
集団Ai の全データを判別関数Zi に代入し、すべての
Zi (X)>0ならばF=1すべてのZi (X)<0な
らばF=−1とし、それ以外(判別関数の両側にAiの
データが存在する)ならF=0とする。なお、第5項と
第6項は、後述する第2,第3実施例における方法及び
装置に用いられるTreeとの共通化を図るために設け
たもので、本例ではすべて(0,0)となる。したがっ
て、本実施例のみの使用であれば、第4項までにしても
良い。
【0018】そして、上述した第1判別領域絞り装置1
4で生成された垂直関数ZTk (X)により分割された
母集団に含まれるサンプルデータをそれぞれ別々に分離
した状態で判別関数設定装置12に送る(S106)。
すなわち、A2sとB2sを対にし,またA(2s+1) とB
(2s+1) を対にして送る。そして、ステップ102に戻
り上記処理を繰り返し行う。なお、ステップ102で行
う判別分析は母集団に付与された通し番号の小さい方か
ら行うようになっている。
【0019】ここで、上記した学習方法の具体例を図3
を用いて説明する。まず、同図(A)に示すように与え
られたサンプルデータにより2つの母集団A1,B1 が
構成されているとする。すると、係るサンプルデータに
対して判別関数設定装置12にて判別関数Z1 を引く。
するとこの判別関数Z1 では両母集団A1 ,B1 を分離
することができないため、その判別関数Z1 に直交する
所定の垂直関数ZT1を引き、その垂直関数ZT1 によ
り両母集団A1 ,B1 をそれぞれA2 ,A3 ,B2 ,B
3 に分割する(同図(B))。そしてこれら分割された
対となる母集団A2 ,B2 に属するサンプルデータ並び
に、A3 ,B3 に属するサンプルデータをそれぞれ別々
に分離した状態で判別関数設定装置12に入力する。そ
して、判別関数設定装置12では、通し番号の小さい母
集団すなわちA2 ,B2 のサンプルデータに対して判別
分析を行い判別関数Z2 を引く(同図(C))。する
と、分離終了判定装置13にて係る判別関数Z2 で両母
集団A2 ,B2 にて分離されたことが判断されるため、
この母集団にA2 ,B2 に対する判別処理は終了する。
【0020】次いで、通し番号の大きい母集団すなわち
A3 ,B3 のサンプルデータに対して判別分析を行い判
別関数Z3 を引く。しかし、この判別関数Z3 では両母
集団A3 ,B3 を分離することができないため、その判
別関数Z3 に直交する所定の垂直関数ZT3 を引き、そ
の垂直関数ZT3 により両母集団A3 ,B3 をそれぞれ
A4 ,A5 ,B4 ,B5 に分割する(同図(D))。
【0021】次いで、上記と同様にA4 ,B4 のサンプ
ルデータに対して判別分析を行い判別関数Z4 を引く
(同図(E))。また、A5,B5 のサンプルデータに
対して判別分析を行い判別関数Z5 を引く(同図
(F))。これにより2つの母集団Ak ,Bk が完全に
分離され、上記すべての判別関数Z1 ,Z2 ,Z3 ,Z
4,Z5 並びにTreeのテーブルデータを判別装置1
5に供給し、処理を終了する。なお、上記した具体例に
おけるテーブルデータ並びにTree構造は、それぞれ
図4,図5に示すようになっている。なお、母集団B側
も上記母集団Aのものと同様であるため記載を省略す
る。
【0022】次ぎに、上記した方法により形成された判
別関数に基づいて未知の想起データがどの母集団に属す
るかの判別を行う方法について図2のフローチャートに
基づいて説明する。
【0023】すなわち、想起モードを稼働させ、想起用
データWを判別装置15に入力する(S110)。する
と、判別装置15では、与えられた想起用データWがど
の母集団に属するかを判別する(S111)。具体的に
は、想起用データWを最初の判別関数Z1 に垂直な垂直
関数ZT1 に代入し、その値が正または負のいずれにな
るかで(A2 ,B2 )か(A3 ,B3 )のどちらの母集
団に属するかを判断する。ここで、原点に近い母集団の
通し番号のほうを小さくしているため、ZT1(W)が
負なら想起データWは(A2 ,B2 )に属し、正なら
(A3 ,B3 )に属することになる。
【0024】そして、想起データWがAk かBk に属す
ることが分かったなら、そのTakとTbk のテーブル
を参照し、各母集団が分割されているかを調べ、分割さ
れているならそのテーブルから分割される4つの母集団
を調べ、上記と同様に判別関数の垂直関数ZTk に代入
し、得られた値の正負でどちら側の集団に属するかを判
断する。すなわち、ZTk (W)が負なら想起データW
は(A2s,B2s)に属し、正なら(A2s+1,B2s+1)に
属することになる。
【0025】そして、上記操作を繰り返し行い、最終的
に想起データを含んでいる母集団Ae ,Be とを特定さ
れたなら、最後にそれらどちらの母集団に属するかをT
aeとTbe のテーブルに含まれるFで判断する。そし
て、その分析結果を出力し(S113)想起処理を終了
する。
【0026】なお上記した第1実施例における装置及び
方法では、判別領域を絞り込む際に、判別関数に垂直な
垂直関数を、対象となるサンプルデータ数を2等分する
ような位置に引くようにしたが、本発明はこれに限ら
ず、例えば、係る垂直関数から各サンプルデータまでの
距離の和が両側で等しくなるようにしたり、距離の二乗
の和が等しくなるようにしたり、母集団の面積が2等分
なるようにしたりする位置に、垂直関数を引くなど種々
の手法をとることができる。
【0027】図6は本発明に係る判別分析装置の第2実
施例を示している。同図に示すように基本構成は上記第
1実施例で同様であるため、同一符合を付すことにより
その説明を省略する。ここで本例では、上記実施例と相
違して、上記第1判別領域絞り装置14に替えて、第2
判別領域絞り装置14aを設けている。この第2判別領
域絞り装置14aは、判別関数Zk (X)でサンプルデ
ータを完全に分離できなかった場合に、求められた判別
関数Zk (X)に平行な2つの関数によって分離できな
い部分を挟み、その挟まれた部分を判別関数Zk (X)
と平行な方向に度数分布を取り、その分布状態からデー
タを分離できる時(度数分布にオーバーラップ部分がな
い時)はそれを利用して分離(判別)し、分離できない
時は、前記判別関数に平行な2つの関数間に挾まれた領
域に属するデータを判別関数設定装置12に入力するよ
うになっている。さらに、本装置14aでは、上記度数
分布により分離できた場合には、その時の分布の境界を
示す仕切り値Sを判別装置15に設定する機能も有して
いる。
【0028】また、上記判別関数Zk (X)に平行な2
つの関数と判別関数Zk (X)との距離、すなわちマー
ジン量をdui,doiとする。但し、原点に近い関数側の
マージン量をduiとする。さらに、その一方の関数によ
り、母集団AiがAL とAL+1 に分離され、他方の関数
により母集団BiがBL とBL+1 とに分離される。な
お、分離される母集団に付与される通し番号の付け方は
マージン内すなわち、2つの関数に囲まれた領域内に位
置する母集団の方を大きくする。また、各母集団相互の
Treeのテーブルは、上記第1実施例と同様に Tai:(Ai,AL ,AL+1 ),(F),(dui,doi) Tbi:(Bi,BL ,BL+1 ),(F),(dui,doi) であらわさる。但し、第4項目のFには、上記第1実施
例の際に用いた「−1,0,1」に加え、仕切り値を有
する時の「2」がある。また、第5項,第6項には、上
記マージン量が入力されるが、判別関数で分離可能、す
なわち、分岐先の母集団がない場合には第5,第6項は
いずれも0となる。
【0029】次に、上記した実施例を用いて本発明に係
る判別分析方法の第2実施例について図7に示すフロー
チャートを参照にして説明する。まず、所定の母集団を
分離するための判別関数の設定する手順について説明す
ると、状態設定装置10によりすべての多変量解析用の
サンプルデータXijを判別関数設定装置12に入力し
(S201)、その判別関数設定装置12では与えられ
たサンプルデータXijから、2つの母集団Ak ,Bk を
最も効率よく分割する線形の判別関数Zk (X)を求め
る(S202)。次いで、その判別関数Zk(X)を分
離終了判定装置13に入力し、そこにおいてその得られ
た判別関数Zk (X)に全サンプルデータXijを入力し
両母集団A,Bに完全に分離され、判別可能であるか否
かが判断される(S203)。そして、判別可能である
場合には、すべての判別関数Zk (X)を判別装置15
に入力し、処理を終了する(S204)。
【0030】一方、判別できなかった場合には、判別関
数並びにサンプルデータを第2判別領域絞り装置14a
に送り、判別関数Zk (X)から平行に所定のマージン
を取って、判別できない領域を含むように2本の平行な
関数を引く(S205)。そして、その2本の平行な関
数で囲まれた領域を判別関数Zk(X)と平行な方向に
度数分布を取り、各母集団を分離できるか否かを判断す
る(S206)。そして、分離できたなら、隣接する母
集団を分離する仕切り値S(平行な関数上の値)を求め
(S207)、その仕切り値Sを判別装置15に設定し
(S204)、処理を終了する。
【0031】また、分離できなかった場合には、上記平
行な2つの関数で囲まれた領域内のデータを判別関数設
定装置12に設定し(S208)、ステップ202に戻
り、係るデータに対して判別関数を設定し、以下、母集
団を分離できるまで上記処理を繰り返し行う。
【0032】ここで、上記した学習方法の具体例を図8
を用いて説明する。まず、同図(A)に示すように与え
られたサンプルデータにより2つの母集団A1,B1 が
構成されているとする。すると、係るサンプルデータに
対して判別関数設定装置12にて判別関数Z1 を引く。
するとこの判別関数Z1 では両母集団A1 ,B1 を分離
することができないため、判別関数Z1 に平行で所定の
マージンdo1,du1だけ隔たれた2本の関数を引く。そ
して、両関数にて両母集団A1 ,B1 がそれぞれA2 ,
A3 ,B2 ,B3 に分割される(同図(B))。これに
より、この判別関数Z1 により、母集団A2 ,とB2 と
が分離される。
【0033】一方、分離できなかった、両関数で囲まれ
た領域(図中ハッチングで示す)に存在する母集団A3
,B3 を判別関数Z1 と平行な方向に度数分布を取る
(同図(C))。本例では、母集団A3 ,B3の一部が
オーバーラップしているため母集団を分離することがで
きない。よって、その母集団A3 ,B3 に属するサンプ
ルデータを取り出し、それに対して判別関数Z3 を引
き、上記と同様に判別関数Z3 に平行で所定のマージン
do3,du3だけ隔たれた2本の関数を引く(同図
(D))。そして、両関数にて両母集団A3 ,B3 がそ
れぞれA4 ,A5 ,B4 ,B5 に分割される(同図
(E))。これにより、この判別関数Z3 によって、2
つの母集団A4 ,とB4 とが分離される。そして、分離
できなかった、両関数で囲まれた領域(図中ハッチング
で示す)に存在する母集団A5 ,B5 に対し判別関数Z
3 と平行な方向に度数分布を取る(同図(F))。する
と、同図から明らかなように、両母集団A5 とB5 の分
布にオーバーラップ部分がなく、両母集団A5 ,B5
は、仕切り値S1 ,S2 で分離される。すなわち、判別
関数Z1 にて母集団A2 とB2 とが分離され、判別関数
Z3 にて母集団A4 とB4 とが分離され、度数分布にと
もなう仕切り値S1 ,S2 にて母集団A5 とB5 とが分
離され、完全に分離作業が終了する。
【0034】そして、上記すべての判別関数Z1 ,Z3
,すべての仕切り値S1 ,S2 並びにTreeのテー
ブルデータを判別装置15に供給し、処理を終了する。
なお、上記した具体例におけるテーブルデータ並びにT
ree構造は、それぞれ図9,図10に示すようになっ
ている。なお、母集団B側も上記母集団Aのものと同様
であるため記載を省略する。
【0035】次ぎに、上記した方法により形成された判
別関数に基づいて未知の想起データがどの母集団に属す
るかの判別を行う方法について図7のフローチャートに
基づいて説明する。
【0036】すなわち、想起モードを稼働させ、想起用
データWを判別装置15に入力する(S210)。する
と、判別装置15では、与えられた想起用データWがど
の母集団に属するかを判別する(S211)。具体的に
は、まずTa1,Tb1 のテーブルのフラグFを見に行
き、その値が1か−1ならば、1本の判別関数Z1 で母
集団が分離されることを意味するため、想起用データW
を最初の判別関数Z1(W)に代入し、その値が正また
は負のいずれになるかでA1 とB1 のどちらの母集団に
属するかを判断し、想起処理を終了する。ここで、Z1
(W)が正ならF=1となっている母集団に属し、負な
ら想起データWはF=−1となっている母集団に属する
ことになる。
【0037】一方、Ta1 ,Tb2 が1または−1でな
いときには(係るケースが一般的であるが)、想起用デ
ータWを最初の判別関数Z1 (W)に代入し、得られた
値とマージンdu1,do1との大小で(A2 ,B2 )か
(A3 ,B3 )のどちらの母集団の対に属するかを判断
する。ここで、母集団に付与される通し番号は平行な2
つの関数に囲まれている領域側を大きくしているため、 Z1 (X)<du1 or do1<Z1 (X) なら、想起データWは、前記領域外に位置、すなわちこ
の判別関数Z1 で判別できるA2 またはB2 に位置する
ことを意味しているため、上記と同様に得られた値とT
ai,TbiのテーブルのフラグFとから、A2 とB2
のどちらの母集団に属するかを判断し、想起処理を終了
する。また、 Z1 (X)>du1 and do1>Z1 (X) なら、想起データWは、前記領域内に位置、すなわち、
A3 またはB3に位置することがわかる。
【0038】そして、想起データWがA3 またはB3
(以下、一般データとして、付与する数値をk (Ak か
Bk )として説明する)に属することがわかったなら、
そのTak とTbk のテーブルを参照し、フラグFが2
であるか否かを判断し、2ならば仕切り値による分離が
可能であるため、想起データWを係る判別関数の平行方
向に投射し、仕切り値Sm からどの母集団に含まれるか
を判断し、想起処理を終了する。
【0039】一方、仕切り値からの分離ができない場合
には、次ぎの判別関数Zk (W)に想起データを代入
し、得られた値並びにマージンdul,dol ,Bk から
分岐された4つの母集団(A2s,B2s)或いは(A2s+
1,B2s+1)のどこに属するかを判断する。具体的な判
断手法は上述の通りである。このようにし、判別関数或
いは仕切り値にて想起データWを含んでいる母集団Ae
或いはBeが求められる。そして、得られた分析結果を
出力し、想起処理が終了する(S212)。
【0040】図11は、本発明の判別分析装置の第3実
施例を示している。同図に示すように、基本構成は上記
した第1実施例と同様のものを用いており(同一符号で
示す)、その特徴は、第1実施例における分離終了判定
装置13と、第1判別領域絞り装置14との間に第3判
別領域絞り装置16を挿入配置している。この第3判別
領域絞り装置16は、第2実施例における第2判別領域
絞り装置14aと類似する機能を有している。すなわ
ち、求められた判別関数に平行な2つの関数によって分
離できない部分を挟み、その挟まれた部分に対し判別関
数と平行な方向に度数分布を取り、その分布状態からデ
ータを分離できる時にはその仕切り値を求め、それを判
別装置15に設定する点では第2判別領域絞り装置14
aと同様である。但し、この第3判別領域絞り装置16
では、分離できないときに出力するデータが、入力され
た判別関数をそのまま出力し、しかもそれを第1判別領
域絞り装置14に供給するようになっている。
【0041】そして、係る装置を用いて行う判別分析方
法は、上記第1,第2実施例の方法を適宜組み合わせて
実行するもので、第1実施例を実行し、その最終工程に
第2実施例の度数分布を用いた判別方法を組み込むよう
にしている。これにより、使用する判別関数の数を少な
くすることができ、システムの簡略化が図れる。
【0042】また、具体的な方法について説明すると、
上記各実施例と同様に与えられたサンプルデータより判
別関数を求め、分離終了判定装置13にてその判別関数
によって分離が終了したか否かが判断される。そして、
分離が終了していない場合には、第3判別領域絞り装置
16に判別関数が入力され、そこにおいて判別関数に平
行な関数が引かれると共に度数分布を求め、その分布に
より分離か可能か否かが判断され、可能な場合には仕切
り値Sを求め、それを判別装置15に設定する。
【0043】一方、上記度数分布では分離できない場合
には、上記第1実施例と同様に判別関数を第1判別領域
絞り装置14に代入し、係る判別関数に垂直な所定の垂
直関数を引くと共に、その垂直関数により領域(サンプ
ルデータ)を2分しそれを判別関数設定装置12に供給
し、それぞれに対して判別関数を行う。以後、上記操作
を繰り返し行うことにより、求められるすべての判別関
数並びに必要に応じて仕切り値を判別装置15に設定
し、想起処理を終了する。
【0044】
【発明の効果】以上のように、本発明に係る判別分析方
法及び装置では、たとえ分離する母集団の境界形状が非
線形であったとしても、線形の判別関数でもって分離す
ることができる。よって、ニューラルネット等に比べ、
学習時間が短く、しかも、計算結果の解析が容易とな
る。そして、未知の想起データが入力された場合に、得
られた判別関数並びに必要に応じて仕切り値に基づいて
母集団の特定が容易に行える。
【図面の簡単な説明】
【図1】本発明に係る判別分析装置の第1実施例を示す
ブロック構成図である。
【図2】本発明に係る判別分析方法の第1実施例を示す
フローチャートである。
【図3】本発明の処理工程の一例を示す図である。
【図4】母集団Aについてのテーブルの構成を示す図で
ある。
【図5】母集団AについてのTree構造を示す図であ
る。
【図6】本発明に係る判別分析装置の第2実施例を示す
ブロック構成図である。
【図7】本発明に係る判別分析方法の第2実施例を示す
フローチャートである。
【図8】本発明の処理工程の一例を示す図である。
【図9】母集団Aについてのテーブルの構成を示す図で
ある。
【図10】母集団AについてのTree構造を示す図で
ある。
【図11】本発明に係る判別分析装置の第3実施例を示
すブロック構成図である。
【符号の説明】
11 状態設定装置 12 判別関数設定装置 13 分離終了判定装置 14 第1判別領域絞り装置 14a 第2判別領域絞り装置 15 判別装置 16 第3判別領域絞り装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 堤 康弘 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 (72)発明者 入江 篤 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 サンプルデータから形成される複数の母
    集団に対して判別分析を行って判別関数を求め、係る判
    別関数で母集団の分離ができない時には、前記判別関数
    に垂直な所定の垂直関数を引き、その垂直関数で分離さ
    れる領域に位置するサンプルデータ毎に判別関数を求め
    ることを特徴とする判別分析方法。
  2. 【請求項2】 入力されたサンプルデータに基づき複数
    の母集団に分離すべく確率的に最も誤判別の少なくなる
    ような線形の判別関数を設定する判別関数設定装置と、
    その判別関数設定装置にて得られた判別関数によってサ
    ンプルデータが完全に分離されたか否かを判断する分離
    終了判定装置と、サンプルデータが完全に分離されなか
    った場合に、求められた判別関数に垂直な垂直関数を引
    くと共に、その垂直関数で分けられた部分のサンプルデ
    ータをそれぞれ分離して前記判別関数設定装置に入力す
    る第1判別領域絞り装置とを備えた判別分析装置。
  3. 【請求項3】 サンプルデータから形成される複数の母
    集団に対して判別分析を行って判別関数を求め、係る判
    別関数で母集団の分離ができない時に、その分離できな
    い部分を挟むようにして前記判別関数と平行な2つの関
    数を設定し、それら両関数で囲まれる領域に対し、前記
    判別関数と平行な方向に度数分布をとり、その分布状態
    からデータを分離できるか否かを判断し、分離できる場
    合にはその分布を分ける仕切り値を求め、一方分離でき
    ない場合には前記領域内に位置するサンプルデータに対
    し判別関数を行うようにしたことを特徴とする判別分析
    方法。
  4. 【請求項4】 入力されたサンプルデータに基づき複数
    の母集団に分離すべく確率的に最も誤判別の少なくなる
    ような線形の判別関数を設定する判別関数設定装置と、
    その判別関数設定装置にて得られた判別関数によってサ
    ンプルデータが完全に分離されたか否かを判断する分離
    終了判定装置と、求められた判別関数に平行な2つの関
    数によって分離できない部分を挟み、その挟まれた部分
    を前記判別関数と平行な方向に度数分布を取り、その分
    布状態からデータを分離できる時にはその仕切り値を設
    定し、分離できない時は前記2つの関数間に挾まれた領
    域に属するサンプルデータを前記判別関数設定装置に入
    力する第2判別領域絞り装置とを備えた判別分析装置。
  5. 【請求項5】 請求項1に記載の判別分析方法の実行途
    中の所定のタイミングで、得られた判別関数で母集団の
    分離ができない時に、その分離できない部分を挟むよう
    にして前記判別関数と平行な2つの関数を設定し、それ
    ら両関数で囲まれる領域に対し、前記判別関数と平行な
    方向に度数分布をとり、その分布状態からデータを分離
    できるか否かを判断し、分離できる時には前記仕切り値
    を求め、分離できない時には前記請求項1に記載の方法
    を続行するようにしたことを特徴とする判別分析方法。
  6. 【請求項6】 入力されたサンプルデータに基づき複数
    の母集団に分離すべく確率的に最も誤判別の少なくなる
    ような線形の判別関数を設定する判別関数設定装置と、
    その判別関数設定装置にて得られた判別関数によってサ
    ンプルデータが完全に分離されたか否かを判断する分離
    終了判定装置と、求められた判別関数に平行な2つの関
    数によって分離できない部分を挟み、その挟まれた部分
    を前記判別関数と平行な方向に度数分布を取り、その分
    布状態からデータを分離できる時にはその仕切り値を設
    定する第3判別領域絞り装置と、 その第3判別領域絞り装置で前記仕切り値が得られない
    場合に前記判別関数に垂直な垂直関数を引くと共に、そ
    の垂直関数で分けられた部分のサンプルデータをそれぞ
    れ分離して前記判別関数設定装置に入力する第1判別領
    域絞り装置とを備えたことを特徴とする判別分析装置。
  7. 【請求項7】 未知の想起データが入力された場合に、
    請求項1の方法により設定された判別関数を用いて前記
    複数の母集団のどれに属するかを判別することを特徴と
    する判別分析方法。
  8. 【請求項8】 未知の想起データが入力された場合に、
    前記請求項3または5に記載の方法により設定された判
    別関数並びに仕切り値を用いて前記複数の母集団のどれ
    に属するかを判別することを特徴とする判別分析方法。
JP3332848A 1991-11-22 1991-11-22 判別分析方法及び装置 Withdrawn JPH05143636A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3332848A JPH05143636A (ja) 1991-11-22 1991-11-22 判別分析方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3332848A JPH05143636A (ja) 1991-11-22 1991-11-22 判別分析方法及び装置

Publications (1)

Publication Number Publication Date
JPH05143636A true JPH05143636A (ja) 1993-06-11

Family

ID=18259476

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3332848A Withdrawn JPH05143636A (ja) 1991-11-22 1991-11-22 判別分析方法及び装置

Country Status (1)

Country Link
JP (1) JPH05143636A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009078096A1 (ja) * 2007-12-18 2009-06-25 Fujitsu Limited 二クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび二クラス分類予測モデルの作成装置
WO2010016109A1 (ja) * 2008-08-05 2010-02-11 富士通株式会社 サンプルの帰属クラス予測方法、帰属クラス予測プログラムおよび帰属クラス予測装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009078096A1 (ja) * 2007-12-18 2009-06-25 Fujitsu Limited 二クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび二クラス分類予測モデルの作成装置
JP5104877B2 (ja) * 2007-12-18 2012-12-19 富士通株式会社 二クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび二クラス分類予測モデルの作成装置
US8352390B2 (en) 2007-12-18 2013-01-08 Fujitsu Limited Method, program, and apparatus for generating two-class classification/prediction model
WO2010016109A1 (ja) * 2008-08-05 2010-02-11 富士通株式会社 サンプルの帰属クラス予測方法、帰属クラス予測プログラムおよび帰属クラス予測装置
US8682813B2 (en) 2008-08-05 2014-03-25 Fujitsu Limited Sample class prediction method, prediction program, and prediction apparatus

Similar Documents

Publication Publication Date Title
JP3209163B2 (ja) 分類装置
CN111309824A (zh) 实体关系图谱显示方法及系统
Cao et al. Practical aspects of phylogenetic network analysis using PhyloNet
EP1043666A2 (en) A system for identification of selectively related database records
Aracena et al. Mathematical modeling in genetic networks: relationships between the genetic expression and both chromosomic breakage and positive circuits
CN105912629A (zh) 一种智能问答方法及装置
Barnett et al. Endnote: Feature-based classification of networks
CN114817567A (zh) 分类号共现网络的构建方法、技术机会识别方法和系统
JP2024528500A (ja) 著者検証を伴う電子文書をグラフモデル化する方法
Yonai et al. Mercem: Method name recommendation based on call graph embedding
CN114417857B (zh) 基于数据挖掘的报文类型识别方法及装置
CN114358202A (zh) 基于药物分子图像分类的信息推送方法及装置
JPH05143636A (ja) 判別分析方法及び装置
Azuaje et al. Predictive integration of gene ontology-driven similarity and functional interactions
Jansson et al. A faster algorithm for constructing the frequency difference consensus tree
CN111710360A (zh) 一种预测蛋白质序列的方法、系统、装置及介质
CN114710344A (zh) 一种基于溯源图的入侵检测方法
Pah et al. PRESIDE: A Judge Entity Recognition and Disambiguation Model for US District Court Records
CN121480669B (zh) 构建知识图谱的方法、装置、设备、存储介质及程序产品
Eom et al. Prediction of protein interaction with neural network-based feature association rule mining
CN120448766B (zh) 特征选择方法、电子设备、可读存储介质及程序产品
KR20210111620A (ko) 전문가 평가를 활용한 생물학적 시스템 정보 저장 및 정확성 보정 장치 및 방법
Becker et al. TensorSV: structural variation inference using tensors and variable topology neural networks
Dai Perfect sampling methods for random forests
Zhao et al. Improved comparison of protein subcellular location patterns

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990204