JP2009042997A - データ分類方法および装置 - Google Patents

データ分類方法および装置 Download PDF

Info

Publication number
JP2009042997A
JP2009042997A JP2007206858A JP2007206858A JP2009042997A JP 2009042997 A JP2009042997 A JP 2009042997A JP 2007206858 A JP2007206858 A JP 2007206858A JP 2007206858 A JP2007206858 A JP 2007206858A JP 2009042997 A JP2009042997 A JP 2009042997A
Authority
JP
Japan
Prior art keywords
category
prototype
data
input data
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007206858A
Other languages
English (en)
Other versions
JP4641537B2 (ja
Inventor
Yoshinari Hori
嘉成 堀
Akihiko Yamada
昭彦 山田
Takuya Yoshida
卓弥 吉田
Jinichiro Goto
仁一郎 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007206858A priority Critical patent/JP4641537B2/ja
Priority to CN2008101298050A priority patent/CN101364269B/zh
Priority to US12/187,760 priority patent/US8484139B2/en
Publication of JP2009042997A publication Critical patent/JP2009042997A/ja
Application granted granted Critical
Publication of JP4641537B2 publication Critical patent/JP4641537B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】異常検知や異常診断に適用した場合に、判定精度を低下させず、かつ実装が容易なデータ分類装置を提供する。
【解決手段】複数個の入力データを複数個のカテゴリーに分類するデータ分類装置である。読み込んだ入力データに最も近いカテゴリーのプロトタイプを選択するプロトタイプ選択手段13と、選択したプロトタイプが妥当であるかを評価するプロトタイプ評価手段14を有する。選択したプロトタイプが妥当でなかった場合に、プロトタイプを追加するプロトタイプ追加手段15を有する。また選択したプロトタイプが妥当であった場合に、カテゴリー毎にそのカテゴリーの領域の大きさを規定する領域決定パラメータとプロトタイプの少なくとも一方を補正することが可能な内部データ補正手段16を有する。カテゴリーの領域の大きさがカテゴリー毎に設定可能であるため、適切なデータ分類が可能となり、異常検知や異常診断に適用した場合に判定精度を向上できる。
【選択図】図1

Description

本発明は、異常検知及び異常診断システムへの適用を目的とした、データ分類方法および装置に関する。
従来のデータ分類方法には特許文献1に記載された適応共鳴理論(Adaptive Resonance Theory:ART)がある。ARTは1987年にG.A.CarpenterとS.Grossbergによって、提案された教師なし学習ネットワークの一種であり、入力データを複数個のカテゴリーに分類する機能がある。
特許文献1の技術は、人間のパターン認識のアルゴリズムを模擬したアルゴリズムであり、次のような特徴を持つ。
(1)パターン生成ユニット(F1)とカテゴリー選択ユニット(F2)の間で入力パターンをやり取りし、カテゴリーの候補選定と候補の妥当性判定を繰り返してカテゴリーを決定する。
(2)妥当性の判定には、カテゴリーの領域の大きさを決定するパラメータ(vigilance parameter)を利用し、入力パターンが選択したカテゴリーの領域から外れるか否かを判定する。
(3)入力パターンに対して、全てのカテゴリーが妥当でないと判定されると、新しいカテゴリーを作成する。
これらの特徴により、様々なタイプのパターン認識に適用可能なアーキテクチャーとなっている。
また、G.A.Carpenter らは、ARTを教師付き学習型のデータ分類技術に拡張し、特許文献2に記載されたARTMAPというアーキテクチャーを提案している。この技術では、次のステップ1−4を繰り返すことで、入力データを与えたカテゴリーに分類する。
ステップ1:入力データを教師なしのデータ分類技術であるARTで分類する。
ステップ2:分類したカテゴリー(カテゴリーA)を分類したいカテゴリー(カテゴリーB)に変換する。
ステップ3:変換されたカテゴリーBと教師として与えるカテゴリーBを比較する。
ステップ4:比較した結果、カテゴリーが一致しなかった場合、ARTのパラメータを調整し、新しいカテゴリーAを選択する。
このように、従来のデータ分類技術は様々なデータ分類、パターン認識に対応できるように、柔軟なアルゴリズムとなっている。
特表昭63−501455号公報 USP5214715公報
しかしながら、異常検知や異常診断に上記アルゴリズムを適用した場合に、次のような2つの問題がある。1つは、検知や診断の精度が低下することである。これは、カテゴリーの領域の大きさを決定するパラメータ(vigilance parameter)が、カテゴリーによらず同じであることに起因する。
図2はARTの技術でデータを分類した概念図を示す。破線はカテゴリーの領域を模式的に表したもので、データは3つのカテゴリーに分類されている。カテゴリー1はカテゴリーの領域にデータが均等に分散しているが、カテゴリー2、カテゴリー3は、領域の中心にデータが偏っている。これは、カテゴリーの領域の大きさを決定するパラメータがカテゴリーによらず同じ値をとるためである。
異常検知や異常診断では、例えばカテゴリー2の領域の境界付近に位置するデータは、既存のデータとは離れており、別の事象である場合がある。このような場合、ARTでは判定精度が低下する。
図3はARTMAPの技術でデータを分類した概念図を示す。白丸が正常な場合のデータ、黒丸が異常な場合のデータとする。入力データをARTで分類したカテゴリーAと、教師として与えるカテゴリーB(例えば、「正常」「異常」)の対応関係から入力データとカテゴリーBの関係を学習する。図3の例では、カテゴリーA1〜A6までが「正常」に対応し、カテゴリーA7〜A9が「異常」に対応する。この例ではカテゴリーA2〜A5に属するデータは一塊になっているが、各カテゴリーの領域が小さく定義されているため、カテゴリーA2〜A5で囲まれた領域は、どのカテゴリーにも属さない領域となっている。これは、カテゴリーA7をカテゴリーA5、A6と分離させるために、カテゴリーA7の領域を小さくした結果、そのほかのカテゴリーの領域も小さくなったためである。
異常検知や異常診断では、このような領域は異常とも正常とも判定できない領域であり、このような領域が多くなると判定精度が低下する。
2つめの問題は、人間のパターン認識のアルゴリズムを模擬しているため、処理ステップ数が多くなり、実装するハードの制約で、処理の単純化が要求される場合に、実装が難しくなる場合を生じることである。
本発明の目的は、上記従来技術の問題点に鑑み、異常検知や異常診断に適用した場合に判定精度を低下させず、かつ実装が容易なデータ分類方法及び装置を提供することである。
上記目的を達成するために、本発明は、コンピュータにより、自然界の複数個の入力データを複数個のカテゴリーに分類するデータ分類方法であって、予めカテゴリーのプロトタイプと、カテゴリーの領域の大きさを規定する領域決定パラメータを格納し、入力された入力データを正規化し、正規化された入力データに最も近いカテゴリーのプロトタイプを選択し、該選択されたプロトタイプと入力データとの距離から該プロトタイプが妥当であるかを評価し、該プロトタイプが妥当と判定された場合に、領域決定パラメータとプロトタイプの少なくとも一方を補正し、該プロトタイプが妥当と判定されなかった場合に、新しいプロトタイプを追加することを特徴とする。
前記プロトタイプの評価は、入力データとプロトタイプの距離で判定することを特徴とする。
また、本発明は、コンピュータにより、自然界の複数個の入力データを予め設定した複数個のカテゴリーBに分類するデータ分類方法であって、前記カテゴリーBに関連するカテゴリーAのプロトタイプと、カテゴリーAの領域の大きさを規定する領域決定パラメータと、カテゴリーAをカテゴリーBに変換するためのカテゴリー対応マトリックスとを格納し、入力された入力データを正規化し、正規化された入力データに最も近いカテゴリーAのプロトタイプを選択し、該選択されたプロトタイプと入力データとの距離から該プロトタイプが妥当であるかを評価し、該プロトタイプが妥当と判定されなかった場合に、新しいプロトタイプを追加して前記プロトタイプの選択を繰り返し、該プロトタイプが妥当と判定された場合に、前記領域決定パラメータ、前記プロトタイプ、及び前記カテゴリー対応マトリックスを補正し、補正されたカテゴリー対応マトリックスを用いて、前記選択されたカテゴリーAをカテゴリーBに変換することを特徴とする。
補正されたカテゴリー対応マトリックスに選択されたカテゴリーAと予め設定したカテゴリーBの関係を追加するときに、選択したカテゴリーAが既に別のカテゴリーBに対応している場合は対応関係の追加を拒否し、前記カテゴリーAのプロトタイプを前記入力データから遠ざけるように補正し、前記領域決定パラメータを、該領域決定パラメータが該カテゴリーAのプロトタイプと該入力データの距離と等しくなるように補正することを特徴とする。
本発明は、前記データ分類方法のいずれかを適用したデータ分類装置である。
本発明は、設備の運転データを入力して設備の診断を行う設備診断装置において、前記データ分類装置を採用し、前記設備の運転データを前記データ分類装置に入力し、分類されたカテゴリーに基づき設備の状態を診断することを特徴とする。
あるいは、前記設備の状態を教師パターンとして与え、前記設備の状態と前記設備の運転データとの関係を前記データ分類装置により学習し、学習後の前記データ分類装置に未学習の運転データを入力し、前記データ分類装置が出力したカテゴリーBにより機器の状態を診断することを特徴とする。
本発明によれば、異常検知や異常診断に適用した場合でも、カテゴリーの領域の大きさがカテゴリー毎に設定できるため、より適切なデータ分類が可能となり、判定精度を低下させることがない。また、処理ステップが少ないため、実装が容易となる。
本発明では、自然界における複数個の入力データを複数個のカテゴリーに分類する第一の発明を提案する。また、本発明では、自然界における複数個の入力データを予め設定した複数個のカテゴリーBに分類する第2の発明を提案する。また、本発明では、複数個の入力データを複数個のカテゴリーに分類する第一の発明を用いて、設備を診断する第三の発明を提案する。さらに、複数個の入力データを予め設定した複数個のカテゴリーBに分類する第2の発明を用いて、設備を診断する第四の発明を提案する。
第一の発明に係るデータ分類装置の実施形態は、設備等から受信した複数個の入力データを複数個のカテゴリーに分類するデータ分類装置である。カテゴリーのプロトタイプと、カテゴリーの領域の大きさを規定する領域決定パラメータを格納する内部データ格納部12と、読み込んだ入力データに最も近いカテゴリーのプロトタイプを選択するプロトタイプ選択手段13と、選択したプロトタイプが妥当であるかを、プロトタイプと入力データの類似度を両者の距離で評価するプロトタイプ評価手段14を有している。また、新しいプロトタイプを新規に作成するプロトタイプ追加手段15と、領域決定パラメータとプロトタイプの少なくとも一方を補正することができる内部データ補正手段16を有している。
プロトタイプ評価手段14では、プロトタイプが妥当と判定された場合に、内部データ補正手段16により、領域決定パラメータとプロトタイプの少なくとも一方を補正し、プロトタイプが妥当と判定されなかった場合に、プロトタイプ追加手段15により新しいプロトタイプを作成することを特徴とする。
第二の発明に係るデータ分類装置の実施形態は、設備等から受信した複数個の入力データを予め設定した複数個のカテゴリーBに分類するデータ分類装置である。該カテゴリーBに関連するカテゴリーAのプロトタイプと、カテゴリーAの領域の大きさを規定する領域決定パラメータを格納する内部データ格納部12と、カテゴリーAをカテゴリーBに変換するためのカテゴリー対応マトリックスを格納するカテゴリ対応マトリックス格納部21を有する。また、読み込んだ入力データに最も近いカテゴリーAのプロトタイプを選択するプロトタイプ選択手段13と、選択したプロトタイプが妥当であるかを、プロトタイプと入力データの類似度から評価するプロトタイプ評価手段14を有している。さらに、カテゴリーAの新しいプロトタイプを新規に作成するプロトタイプ追加手段15と、領域決定パラメータとプロトタイプの少なくとも一方、及びカテゴリー対応マトリックスを補正する内部データ及びマトリックス補正手段18と、該選択されたカテゴリーAをカテゴリー対応マトリックスを用いてカテゴリーBに変換するカテゴリー変換手段20を有している。
内部データ及びマトリックス補正手段18が、カテゴリー対応マトリックスに選択されたカテゴリーAと予め設定したカテゴリーBの関係を追加する場合において、選択したカテゴリーAが既に別のカテゴリーBに対応している場合、対応関係の追加を拒否する。追加拒否された場合には、カテゴリーAのプロトタイプを、前記入力データから遠ざけるように補正し、該領域決定パラメータを、該領域決定パラメータが該カテゴリーAのプロトタイプと該入力データの距離と等しくなるように補正することを特徴とする。
第三の発明に係る設備診断装置の実施形態は、設備の診断システムにおいて、第一の発明であるデータ分類装置を有し、該設備の運転データを前記データ分類装置に入力し、分類されたカテゴリーに基づき設備の状態を診断することを特徴とする。
第四の発明に係る設備診断装置の実施形態は、第2の発明であるデータ分類装置を有し、設備の状態を教師パターンとして与え、設備の状態と該設備の運転データとの関係を前記データ分類装置により学習する。さらに学習後の前記データ分類装置に未学習の運転データを入力し、該データ分類装置が出力したカテゴリーBにより機器の状態を診断することを特徴とする。
図1は実施例1によるデータ分類装置の構成を示すブロック図である。本実施例は、入力データをいくつかのカテゴリーに分類するデータ分類装置である。予め分類したいカテゴリーを教師データとして与えておらず、教師なし分類である。
本データ分類装置は、入力データ正規化手段9、データ読込み手段10、内部データ初期化手段11、データ格納部12、プロトタイプ選択手段13、領域妥当性評価手段14、プロトタイプ追加手段15、内部データ補正手段16及び処理フロー制御手段17からなる。
入力データ正規化手段9では、入力データを正規化する。入力データは、一般に、温度、流量、電圧、信号の強度などの物理量であるため、分類する入力データの種類、特性によって、値の大きさ、変動量には、ばらつきが生じる。入力データ正規化手段9では、これらのばらつきを補正するために、分類する入力データの最大値と最小値を用いて、データを正規化する。
データ読込み手段10は、処理フロー制御手段の指令に応じて、正規化された入力データを読込む。内部データ初期化手段11は、データ分類処理の最初にのみ実行され、内部データ格納部12に格納されたデータを入力データに応じて初期化する。
内部データ格納部12には各カテゴリーのプロトタイプと、各カテゴリーの領域を決定するパラメータ(領域決定パラメータ)が格納されている。プロトタイプは各カテゴリーの代表例であり、カテゴリーと1対1に対応する。入力データがN次元のデータであった場合、プロトタイプもN次元のデータとなる。領域決定パラメータは、各カテゴリーの領域を規定するパラメータであり、カテゴリー毎に定義されている。
プロトタイプ選択手段13は、入力データと内部データ格納部12に格納されているプロトタイプを比較し、入力データに最も近いプロトタイプを選択する機能である。どのプロトタイプが入力データに近いかは、入力データとプロトタイプの距離で判断する。すなわち、データ格納部12に格納されているプロトタイプと入力データの距離を計算し、最も距離が近いプロトタイプを選択する。
プロトタイプ評価手段14では、プロトタイプ選択手段13で選択したプロトタイプが妥当であるかを評価する。選択したプロトタイプは内部データ格納部12に格納されているものの中では、最も入力データに近いが、十分に近いプロトタイプであるとは限らない。プロトタイプ評価手段13では、入力データと選択したプロトタイプjの距離rmjと領域決定パラメータRjとを比較し、(1)式を満足する場合、選択したプロトタイプjが妥当であると判断し、入力データが分類されるカテゴリーを決定する。また、同時に内部データ補正手段16の処理を実施する。
mj≦R …(1)
(1)式を満足しなかった場合、プロトタイプ追加手段15の処理を実施する。プロトタイプ追加手段15は、プロトタイプ評価手段14により、選択したプロトタイプが妥当でないと判断された場合に、プロトタイプを追加する。プロトタイプは入力データを代表するものでなければならないため、後述のように入力データの近傍のデータが新たなプロトタイプとして追加される。なお、入力データと全く同じデータをプロトタイプとして追加しても良い。
内部データ補正手段16は、選択したプロトタイプが妥当であった場合に、プロトタイプ、領域決定パラメータを補正することで、データの分類特性をより適切にする手段である。したがって、内部データ補正手段16は、領域決定パラメータ補正手段161とプロトタイプ補正手段162からなる。領域決定パラメータ補正手段161では、カテゴリー領域に含まれるデータの分布状態と領域決定パラメータを比較し、データの分布に対して、領域決定パラメータが大きい場合、領域決定パラメータを小さくする。プロトタイプ補正手段162では、プロトタイプを入力データに近づける。近づける度合いはパラメータで調整可能である。プロトタイプは複数の入力データの代表例であり、入力データは逐次入力される。プロトタイプを入力データに近づける処理をすることで、プロトタイプをより適切に設定することが可能となる。
処理フロー制御手段17では、データ分類装置における処理フローを制御する。主な機能は、入力データを最初に読み込んだ場合に内部データ初期化手段11を実行することと、プロトタイプ評価手段14から出力されるカテゴリーの変化から繰り返し処理の打ち切りを判断することである。
次に実施例1の処理フローについて詳細に説明する。本実施例では、入力データは2次元データであるが、3次元以上のデータであっても同様の処理となる。
図4は実施例1のデータ分類装置の動作フローを示す。ここでは、入力データ(X,Y)及び教師カテゴリーはM組あるとした。また、本データ分類方法は、M組のデータを繰り返し何度か与えることでデータを適切に分類する手法である。本実施例では、繰り返し回数をK回とした。以下、処理フローについて説明する。
Step0:入力データ(X,Y)を正規化する。例えば、データXが温度、データYが流量で、それぞれ、500℃〜560℃、2.5t/h〜3.5t/hまで変動したとする。Step0では、X、Yのどちらも、最小値が0.1、最大値が0.9となるように正規化する。
Step1:内部データであるプロトタイプと領域決定パラメータを初期化する。プロトタイプの初期化処理とは、新規のプロトタイプを作成することである。本実施例では、プロトタイプ(Xj,Yj)(j=1〜5)を作成した。初期のプロトタイプはできるだけ分散している方が望ましいため、乱数を使って、x、yのそれぞれが、0.1から0.9に入るx、yの組み合わせを作成した。プロトタイプは、例えば、(0.45,0.28),(0.78,0.31),(0.15,0.17),(0.54,0.39),(0.78,0.12)のようになる。
領域決定パラメータRjは(2)式で作成した。
=K_R × √N …(2)
K_Rは定数であり、Nは入力データの次元数である。これは、N次元の空間で各座標が0から1で囲まれた超立方体の最長の長さを1/(2×K_R)分割する分解能を示す。本実施例では、K_R=0.1,N=2であるため、Rの初期値は0.1414となる。
Step2:繰り返し回数1回目で、入力データ番号m=1のデータを読み込む。
Step3:読み込んだ入力データ(x,y)とプロトタイプ(Xj,Yj)の距離rmjを式(3)で計算する。
mj=√((x−X+(y−Y)) …(3)
距離rmjが、最小となるjをプロトタイプの候補として選択する。
Step4:プロトタイプの妥当性を評価する。具体的には、rmjを、基準となる領域決定パラメータRjと比較し、rmjがRjよりも小さければ、選択したプロトタイプは妥当であると評価し、Step6の処理を実行する。プロトタイプが妥当でなければ、Step5の処理を実行する。
Step5:ここでは新たにプロトタイプを1つ追加する。追加するプロトタイプは式(4)、(5)で決定する。
=kp×x (4)
=kp×y (5)
ここでkpはパラメータであり1近傍の値をとる。kp=1の場合は、プロトタイプは入力データxm,ymと等しくなる。
Step6:Step4でプロトタイプが妥当であると評価された場合の処理で、プロトタイプを入力データに合わせて補正する。具体的には、式(6)、(7)で補正する。
=X+kw×(x−X) …(6)
=Y+kw×(y−Y) …(7)
ここで、kwはパラメータであり、0から1範囲の値をとり、kwの値によりどの程度入力データに合わせて補正するのかが決定される。kw=1の場合は、プロトタイプを入力データと完全に一致するまで補正することを意味する。また、kw=0の場合はプロトタイプは補正されない。
kwの値はデータ分類処理の進行に合わせて段階的に変化させることとした。具体的には、処理の初期過程ではkwの値を大きくして、入力データに合わせてプロトタイプが変化するようにし、処理がある程度進むとkwの値を小さくし、プロトタイプが変化しないようにした。
Step7:選択されたカテゴリーの領域に含まれるデータから、領域決定パラメータRjが妥当であるかを判定する。ここでは選択されたカテゴリーのプロトタイプと、このカテゴリーに含まれる入力データの距離rmjの最大値rmj_maxを求め、Rjとの比率F_rを式(8)で計算する。
F_r=rmj_max/R …(8)
予め設定した閾値F_r_thと(8)式で求めたF_rを比較し、(9)式が成立すれば領域決定パラメータRjは妥当と判断し、Step9に進む。(9)式が成立しなければ、領域決定パラメータRjは妥当でないと判断し、Step8に進む。
F_r≧F_r_th …(9)
Step8:領域決定パラメータRjを(10)式にしたがって変更する。
=rmj_max/F_r_th …(10)
Step9:入力データがM組全て処理されたかどうかを判定し、処理されていない入力データがあれば、次の入力データをStep3で処理する。全ての入力データが処理されていれば、Step10に進む。
Step10:繰り返し回数が、設定したK回実施されたか、あるいはデータ分類処理が収束した場合に処理を終了させる。データ分類の収束判定は、入力データが分類されたカテゴリーが前回(k−1回目)と今回(k回目)が同じか否かで判定する。分類されたカテゴリーが少なくとも1つ以上変化した場合、処理は収束していないと判定し、分類されたカテゴリーが全て同じであれば、処理が収束したと判定する。
実施例1では、k=1から図4に示した処理を実施したが、kがある値になるまでは、Step7〜Step8の処理を実施せず、kがある値を超えてからStep7〜Step8の処理を実施する処理フローでも良い。
図5は実施例1による分類結果を示す概念図である。入力データは図2と同じであり、データは3つのカテゴリーに分類されている。しかしながら、カテゴリー2及びカテゴリー3の境界を表す破線は、図2に比べて、データに近いところに設定されている。これは、図4のStep7においてカテゴリーの領域の大きさを規定するRjの妥当性を判定した結果、Rjが大きすぎると判定され、Step8において、Rjの値が小さく補正されたためである。
このように、本実施例では、カテゴリーの境界を表す破線はデータの分布状態によって合わせて設定されるため、図2のように領域の中心にデータが偏っていることはない。すなわち、与えられた入力データに対して忠実にカテゴリーの領域を決定している。
その結果、本分類方法により、データの傾向の違いをより正確に捉えることができる。例えば、図5の点Aは、分類されたデータとは傾向が異なるが、従来の分類方法(図2)では、これまでに発生したカテゴリー2に分類されてしまうため、その傾向の変化を捉えることができなかった。一方、本実施例では、点Aは、カテゴリーの境界がより適切に設定されているため、新たなカテゴリー(カテゴリー4)に分類され、データの傾向の変化を捕らえることができる。
したがって、本実施例による分類方法を異常検知や異常診断に適用した場合、判定精度を向上させることができる。また、本実施例の処理は従来の方法に比べて単純化しているため、実装するハードの制約から処理の単純化が要求される場合でも、実装が容易となる。
次に本発明の実施例2について説明する。本実施例は、入力データが対応するカテゴリーを予め学習させるデータ分類方法である。ここで、実施例1での分類結果であるカテゴリーと予め学習させるカテゴリーは、必ずしも1対1に対応するものではない。そこで、実施例1の分類結果であるカテゴリーをカテゴリーA、予め学習させるカテゴリーをカテゴリーBと定義して説明する。
図6は実施例2によるデータ分類装置の構成を示すブロック図である。実施例2の構成要素の多くは実施例1と同じであるため、ここでは、実施例1との相違点を中心に説明する。実施例2で新規に追加された構成要素は、カテゴリーB読込み手段19、カテゴリー変換手段20及びカテゴリー対応マトリックス21である。また、実施例1の内部データ補正手段16は、内部データ及びマトリックス補正手段18に置き換わっている。
カテゴリーB読込み手段19は、予め学習しておくデータ(教師データ)であるカテゴリーBを読込む手段である。入力データ読込み手段10と同様に処理フロー制御手段17により、データの読込みタイミングを制御されている。
カテゴリー変換手段20はカテゴリーAをカテゴリーBに変換する手段である。ここで、カテゴリーAは、実施例1でデータを分類したカテゴリーと同じであり、いくつかの類似データを1つのグループに分類したものである。カテゴリーAにはカテゴリー番号が付与されるが、その番号自体には意味がない。一方、カテゴリーBは、人間が意味づけしたカテゴリーである。本データ分類方法を異常診断に利用した場合、カテゴリーBは、例えば、「正常」、「異常1」、「異常2」などの事象が割り当てられる。
カテゴリーAをカテゴリーBに変換するには、カテゴリーAとカテゴリーBの対応関係を表した、カテゴリー対応マトリックスを利用する。カテゴリー対応マトリックス格納部21にはカテゴリー対応マトリックスが格納されている。
図7にカテゴリー対応マトリックスの例を示す。この例で、カテゴリーBは「正常」、「異常1」、「異常2」の3種類である。カテゴリーAはカテゴリー1〜10の10種類である。複数のカテゴリーAが1つのカテゴリーBに対応している。また、各カテゴリーは必ず1つのカテゴリーBにのみ対応しており、2つ以上のカテゴリーBに対応していることはない。このカテゴリー対応マトリックスを利用することで、カテゴリーAを与えるとカテゴリーBに変換することが可能となる。
内部データ及びマトリックス補正手段18は、内部データ格納部12に格納されている内部データとカテゴリー対応マトリックス格納部21に格納されているカテゴリー対応マトリックスを補正する。
補正する内部データは、プロトタイプと領域決定パラメータであり、実施例1の内部データ補正手段16と同じである。ただし補正方法は内部データ補正手段16とは異なる。内部データ及びマトリックス補正手段18では、図7で示したように、カテゴリーAに対応するとカテゴリーBが2つ以上にならないように内部データを補正する。具体的な補正アルゴリズムについては後述する。
カテゴリー対応マトリックスの補正は、カテゴリーAとカテゴリーBの関係が常に最新の入力データの分類結果と一致するように補正する。各入力データに対応するカテゴリーBは教師データとして与えられるため、変更はない。しかし、プロトタイプまたは領域決定パラメータが変化した場合、同じ入力データであっても、カテゴリーAは変化する可能性がある。したがって、カテゴリーAが変更となった場合に、逐次、カテゴリーBとの対応関係を補正する。
次に、実施例2の動作について説明する。実施例2では、学習モードと判定モードの2種類の動作モードがある。学習モードでは、入力データとカテゴリーB(教師データ)を与え、入力データがカテゴリーBに分類されるように学習する動作モードである。判定モードは入力データのみを与え、入力データが分類されるカテゴリーBを判定する動作モードである。なお、入力データは、実施例1と同様に2次元データ(x,y)である。
図8に学習モードの処理フローを示す。図中の破線で囲んだ部分が、実施例1の処理フローと異なる部分である。異なる部分を中心に、処理フローを説明する。
Step0〜5:入力データを正規化し、プロトタイプなどの内部データを初期化し、入力データが分類されるカテゴリーAのプロトタイプを決定する。
Step6−1:入力データが分類されたカテゴリーAと、教師データとして与えられるカテゴリーBの関係をカテゴリー対応マトリックスに追加する。ただし、追加するカテゴリーAとカテゴリーBの組み合わせにおいて、選択されたカテゴリーAが既に別のカテゴリーBとの対応関係が記録されている場合には、追加が拒否される。また、カテゴリーAとカテゴリーBの対応関係が既にマトリックスに記録されている場合は、修正しない。
Step6−2:プロトタイプの補正は、Step6−1によって追加拒否されたか否かで処理が異なる。Step6−1で追加拒否されなかった場合には、式(6)、(7)でプロトタイプを修正する。追加拒否された場合には、入力データが分類されたカテゴリーAがふさわしくないことを意味する。したがって、対象の入力データが分類されたカテゴリーAに分類されないようにプロトタイプを補正する必要がある。具体的には式(11)、(12)によって、プロトタイプを補正する。
=X−kw×(x−X) …(11)
=Y−kw×(y−Y) …(12)
(11)、(12)式で、kw>0の場合、プロトタイプは入力データから離れる方向に補正される。kwの値が大きいほど、その度合いは大きくなる。なお、kw=0の場合、プロトタイプは変更されない。
Step7:Rjの妥当性判断は、(9)式の成立の有無及び追加拒否の有無によって異なる。(9)式が成立し、かつ追加拒否がない場合は、妥当であると判定し、Step9に進む。(9)式を満足しないか追加拒否があった場合は妥当でないと判定し、Step8に進む。
Step8:追加拒否があった場合は、入力データが分類されたカテゴリーAがふさわしくないことを意味する。したがって、対象の入力データが分類されたカテゴリーAに分類されないように領域決定パラメータを補正する必要がある。具体的には式(13)で補正する。
=rmj …(13)
また、(9)式を満足しない場合は、(10)式でRjを補正する。
Step9〜10:処理を繰り返すか否かを判定し、繰り返しが必要なければ、Step11に進む。Step10までの処理が全て終了すると、M個全ての入力データが、あるカテゴリーAに分類され、各カテゴリーAとカテゴリーBの対応関係がカテゴリー対応マトリックスに記録される。
Step11:カテゴリー対応マトリックスを利用してカテゴリーAをカテゴリーBに変換する。変換するデータはM個の入力データである。マトリックスとして図7の例を利用した場合、ある入力データのカテゴリーAがカテゴリー3とすると、対応するカテゴリーBは異常1であり、カテゴリー3は異常1に変換される。
以上の処理により、M個の入力データを、教師データとして与えたカテゴリーBに分類することができる。
なお、Step6-1〜Step8までの処理の中で、カテゴリー対応マトリックスに関連する処理を除くと実施例1のStep6〜Step8の処理と同じになる。実施例2では、k=1から図8に示した処理を実施したが、kがある値になるまでは、カテゴリー対応マトリックスに関連する処理を実施せず、実施例1のStep6〜Step8の処理のみを実施し、kがある値を超えてからカテゴリー対応マトリックスに関連する処理を追加する処理フローとしてもよい。
次に判定モードについて説明する。1つの入力データを判定する場合について説明する。Step21:内部データを学習モードが終了した状態にする。
Step22:入力データを読み込む。
Step23:学習モードのStep3と同じアルゴリズムでプロトタイプを選択する。
Step24:学習モードのStep4と同じアルゴリズムでプロトタイプの妥当性を判定する。妥当であれば、入力データのカテゴリーAは選択されたプロトタイプを持つカテゴリーAであると判定しStep25に進む。妥当でなければ、入力データのカテゴリーAは新規カテゴリーと判定しStep25に進む。
Step25:学習モードのStep11と同様のアルゴリズムで、カテゴリーAをカテゴリーBに変換する。ただし、入力データのカテゴリーAが新規カテゴリーであった場合には、カテゴリー対応マトリックスに対応関係が記録されていないため、カテゴリーBは不定となる。
実施例2の効果について説明する。図9に学習モードでデータを分類した結果を示す。図9の入力データ及び教師データは図3の例と同じである。図3の入力データではカテゴリーA2〜A5の4つのカテゴリーAに分類されていたが、図9入力データではカテゴリーA2という1つのカテゴリーAに分類されている。
従来の手法では、カテゴリーの領域の大きさを決定する領域決定パラメータが、全カテゴリーで共通であったために、あるカテゴリーの領域決定パラメータを小さくすると、全ての領域決定パラメータが小さくなり、不必要にカテゴリーを細かく分類していた。判定モードであらたなデータの診断をする場合のデータが図3のカテゴリーA2〜A4で囲まれた領域であったとすると、従来技術では異常とも正常とも判定できず(不定)、判定精度が低下する要因となっていた。
しかしながら、実施例2では、領域決定パラメータがカテゴリー毎に定義され、Step7、Step8において、カテゴリー毎に補正されるため、不必要にカテゴリーを細かく分類することがなくなった。その結果、実施例2では、図9のように、データが適切な領域で分類されるため、判定結果が不定となることが少なくなり、判定精度が向上する。また、カテゴリーの数が少なくなることで、実装する場合に必要なメモリー容量を小さくできる効果もある。したがって、実装するハードのメモリー容量に制約がある場合でも、実装が容易となる。
次に本発明の実施例3について説明する。実施例3は、本発明の実施例2であるデータ分類装置を利用した発電設備の遠隔診断システムである。
図10に実施例3の構成を示す。本実施例は、発電設備8a〜8nと監視センタからなり、発電設備8a〜8nと監視センタはインターネット7により接続されている。
発電設備8a〜8nはそれぞれガスタービン発電機81、制御装置82及びデータ送信装置83からなる。ガスタービン発電機81は圧縮機、燃焼器、タービン及び発電機からなる。圧縮機による圧縮空気は燃焼器に送られ、燃料と混合されて燃焼器で燃焼する。燃焼により発生した高圧ガスによりタービンが回転し発電する。
制御装置82では電力需要に応じてタービン発電機の出力を制御する。また、タービン発電機81に設置されたセンサーを用いてタービン発電機81の運転データを計測する。本実施例では、運転データとして吸気温度、燃料投入量、タービン排ガス温度、タービン回転数、発電機発電量等の状態量を1秒間隔で計測した。データ送信装置83では、制御装置82で計測した運転データをインターネット7経由で監視センターに送信する。
監視センターでは、インターネット7経由で受信した発電設備8a〜8nの運転データを受信し、発電設備8a〜8nの状態を監視する。監視センターは、データ受信装置2、運転データベース3、保守データベース4、データ制御装置5、データ分類装置1a〜1n及び操作端末6からなる。
データ受信装置2は受信したデータを各データベース及びデータ制御装置5に送る。発電設備8a〜8nから送信された運転データはデータ制御装置5に送ると同時に運転データベース3に送る。保守情報は保守データベース4に送る。また、保守員が携帯端末から入力した保守情報も保守データベース4に送る。
運転データベース3はデータ受信装置2から送られた運転データを発電設備8a〜8n毎に格納する。図11は運転データベースに格納されているデータの一例を示す。計測項目は吸気温度、燃料投入量、タービン排ガス温度、タービン回転数、発電機発電量等の状態量であり、1秒間隔で記録されている。また、これらの計測データの他に運転モードが記録されている。運転モードは「起動運転」、「定格運転」などに対応する数値で記録されており、図11の例では、「定格運転」に対応する「0」が記入されている。さらに、発電設備から送信されるデータの他に、データ分類装置1a〜1nによる分類結果も格納されている。分類結果は2種類ある。一つはデータ分類装置内部のカテゴリーAの番号が記録されている。もう一つは「正常」、「異常A」などのような機器の状態(カテゴリーB)であり、同じく状態に対応する番号で記録されている。
保守データベース4はデータ受信装置2から送られた保守情報を格納する。保守データベース4には保守員が行った保守情報が記録されている。図12に保守データベースに蓄積されている保守情報の一例を示す。図12の例では、実際の保守作業は次ぎのようになる。9:50にモニタリングによりアラームが発生し、異常が確認された。10:30に現地に保守員が到着し保守作業を開始した。10:45に部品を交換したのち、ガスタービン発電機の試運転を実施した。11:30に異常が復旧したことを確認し、保守作業を終了した。
データ制御装置5では、運転データ及び保守データをサイト、運転モードで分類し、データ分類装置1a〜1nに入力可能な形式に加工する。図13に加工したデータの例を示す。このデータの分類・加工方法の詳細については後述する。また、データ分類装置には推定モード、学習モード及び準備モードがある。データ制御装置5ではモードに合わせた入力データの制御を行う。
操作端末6では、データ制御装置5のモード切替え指令を入力する。また、運転データベース3や保守データベース4に記録された情報、あるいはデータ分類装置1a〜1nにより分類された結果をモニタ画面に出力することができる。
データ分類装置1a〜1nは、推定モードではデータ受信装置20から送られた運転データに基づき発電設備8a〜8nの状態を診断する。診断結果は運転データベース3に送られる。学習モードでは運転データベース3及び保守データベースに格納された情報を用いて運転データと発電設備の状態の関係を学習する。また、準備モードは学習も推定も行わない。このモードは新規サイトが設置された場合などに学習に必要なデータがない場合のモードである。これらのモードは診断装置1a〜1n毎に個別に設定可能である。モードの設定は操作端末6にて行う。
次に、監視センターの動作について説明する。データ分類装置1a〜1nが実際に動作するモードは学習モード及び推定モードの2つであるため、学習モード、推定モードの順で説明する。前述したように、学習モード、推定モードはサイト毎に個別に設定可能であるが、ここでは、複数のサイトが全て学習モードの場合および全て推定モードの場合を例に説明する。
学習モードでは、運転データベース3及び保守データベースに格納された情報を用いて運転データと発電設備の状態の関係を学習する。ただし、両データベースに格納された情報をそのままデータ分類装置1a〜1nに入力することはできない。そこで、データ制御装置5において、運転データ及び保守情報をデータ分類装置1a〜1nに入力するデータ形式に変換する。
図14にデータ分類装置の入力形式に変換する処理フローを示す。なお、以下の説明では、計測項目は図11に示した5項目(DATA1〜DATA5)のみとする。
ステップ111では、全運転データをサイトと運転モードでグループ分けし、各グループのデータのサンプリング間隔を決定する。データのグループ分けは、例えば、「サイト1」〜「サイト3」の3つのサイトで運転モードが「起動運転」、「定格運転」、「停止運転」の3モードであったとすると、運転データは合計9つのグループにグループ分けられる。データのサンプリング間隔は運転モードによって異なる。本実施例では運転データの変化が少ない「定格運転」では1分間隔とし、それ以外のモードでは1秒間隔とした。
ステップ112では、ステップ111で分類したグループのうち1つのグループを選択する。
ステップ113では、ステップ112で選択したグループに該当するデータを用いてDATA1〜DATA5の計測項目毎に最大値及び最小値を計算する。例えば、「サイト1」の「定格運転」モードのデータが100時間分あったとすると、各項目のデータ数は6000個となる。最大値、最小値は6000個のデータから計算する。なお、ステップ113で計算した最大値及び最小値はサイト毎にデータ制御装置5内に記憶される。
ステップ114ではステップ113で求めた最大値及び最小値を用いてデータを正規化する。その方法についてDATA1を例に説明する。DATA1のデータ数がM個でm番目の計測値をdata1(m)とする。また、M個のデータの中の最大値及び最小値をそれぞれMax_1,Min_1すると、正規化したデータNdata_1(m)は式(14)で計算する。
Ndata_1(m)=α+(1−α)×(data_1(m)−Min_1)/( Max_1−Min_1) …(14)
ここで、αは(0≦α<0.5)の定数であり、式1によりデータは[α,1−α]の範囲に正規化される。本実施例ではα=0.2とした。
ステップ114で作成したNdata_1(m)〜Ndata_5(m)の5項目のデータが入力データaとなり、データ分類装置1a〜1nに入力される。
ステップ115では機器状態データを変換してカテゴリーBのデータを作成する。保守データベース4には機器の状態が記録されている。例えば、状態として「正常」、「異常A」「異常B」の3種類があったとすると、それぞれを「1」、「2」、「3」のような番号データに変換する。ただし、保守データベース4には決まった時間間隔で設備の状態が記録されているわけではない。したがって、入力データaの時間間隔に合わせてデータを加工する。このように時間間隔を修正することで、同一時刻の運転データとそのときの設備の状態が対応したデータが得られる。
ステップ116ではステップ111で分類した全てのグループに対してステップ113〜ステップ115の処理を実行したかを判定する。残っているグループがあればそれらのグループに対応するデータについてステップ113〜115を実行する。全てのグループに対して処理が完了した場合は終了する。
以上の処理により、ステップ111で分類した個数だけ入力データとそのときのカテゴリーBのペアが作成される。これらはそれぞれ異なるデータ分類装置1a〜1nに入力される。
次にデータ分類装置1a〜1nの動作について説明する。データ分類装置1a〜1nでは、入力データとカテゴリーBの関係を学習する。入力データ、カテゴリーBは共にM個ある。本実施例では、M組のデータを順にデータ分類装置1a〜1nに入力した。M組の入力データとカテゴリーBの関係を学習するアルゴリズムについては実施例2において詳細に説明したため、本実施例での説明は割愛する。学習が終了すると、学習の結果得られたプロトタイプをデータ分類装置1a〜1n内の記憶領域に保存する。
次に推定モードの動作について説明する。推定モードでは、データ受信装置2から1分毎に送られる運転データに基づき発電設備8a〜8nの状態を診断する。データ受信装置2から送られたデータはデータ制御装置5により加工され、データ分類装置1a〜1nに送られる。
データ制御装置5にはサイト毎にデータを正規化するための最大値及び最小値が記憶されている。従って、データ受信装置2から送られたデータは、学習モードのステップ114の処理により瞬時にデータ変換され、データ分類装置1a〜1nに入力される。データ分類装置1a〜1nには学習モードで得られたプロトタイプが記憶されているので、実施例2の推定モードで説明した手順でカテゴリーA及び発電設備の状態(カテゴリーB)が推定される。推定されたカテゴリーA及び発電設備の状態は操作端末6のモニタ画面に出力される。また、運転データベース3に保存することもできる。
なお、実施例3では、実施例2のデータ分類装置を利用したが、実施例1のデータ分類装置を利用することも可能である。
本発明の実施例1によるデータ分類装置の構成を示すブロック図。 従来技術による分類結果の例を示す概念図。 他の従来技術による分類結果の例を示す概念図。 実施例1による学習動作を示す処理フロー図。 実施例1による分類結果を示す概念図。 本発明の実施例2によるデータ分類装置の構成を示すブロック図。 カテゴリー対応マトリックスの例を示す説明図。 実施例2による学習動作を示す処理フロー図。 実施例2による分類結果を示す概念図。 本発明の実施例3による設備診断装置の概要を示す構成図。 運転データの一例を示す説明図。 保守データの一例を示す説明図。 実施例3のデータ分類装置へ入力される入力データの一例を示す説明図。 実施例3のデータ制御装置のデータ変換を示す処理フロー図。
符号の説明
1…データ分類装置、2…データ受信装置、3…運転データベース、4…保守データベース、5…データ制御装置、6…操作端末、7…インターネット、8…発電設備、9…入力データ正規化装置、10…データ読込み装置、11…内部データ初期化手段、12…内部データ格納部、13…プロトタイプ選択手段、14…プロトタイプ評価手段、15…プロトタイプ追加手段、16…内部データ補正手段、17…処理フロー制御手段、18…内部データ及びマトリックス補正手段、19…カテゴリーB読込み手段、20…カテゴリー変換手段、21…カテゴリー対応マトリックス格納部。

Claims (10)

  1. コンピュータにより、自然界の複数個の入力データを複数個のカテゴリーに分類するデータ分類方法であって、
    予めカテゴリーのプロトタイプと、カテゴリーの領域の大きさを規定する領域決定パラメータを格納し、
    入力された入力データを正規化し、正規化された入力データに最も近いカテゴリーのプロトタイプを選択し、該選択されたプロトタイプと入力データとの距離から該プロトタイプが妥当であるかを評価し、該プロトタイプが妥当と判定された場合に、領域決定パラメータとプロトタイプの少なくとも一方を補正し、該プロトタイプが妥当と判定されなかった場合に、新しいプロトタイプを追加することを特徴とするデータ分類方法。
  2. 請求項1において、前記プロトタイプの評価は入力データとプロトタイプの距離で判定することを特徴とするデータ分類方法。
  3. コンピュータにより、自然界の複数個の入力データを予め設定した複数個のカテゴリーBに分類するデータ分類方法であって、
    前記カテゴリーBに関連するカテゴリーAのプロトタイプと、カテゴリーAの領域の大きさを規定する領域決定パラメータと、カテゴリーAをカテゴリーBに変換するためのカテゴリー対応マトリックスとを格納し、
    入力された入力データを正規化し、正規化された入力データに最も近いカテゴリーAのプロトタイプを選択し、該選択されたプロトタイプと入力データとの距離から該プロトタイプが妥当であるかを評価し、該プロトタイプが妥当と判定されなかった場合に、新しいプロトタイプを追加して前記プロトタイプの選択を繰り返し、該プロトタイプが妥当と判定された場合に、前記領域決定パラメータ及び/又は前記プロトタイプ、及び前記カテゴリー対応マトリックスを補正し、
    補正されたカテゴリー対応マトリックスを用いて、前記選択されたカテゴリーAをカテゴリーBに変換することを特徴とするデータ分類方法。
  4. 請求項3において、補正されたカテゴリー対応マトリックスに選択されたカテゴリーAと予め設定したカテゴリーBの関係を追加するときに、選択したカテゴリーAが既に別のカテゴリーBに対応している場合は対応関係の追加を拒否し、前記カテゴリーAのプロトタイプを前記入力データから遠ざけるように補正し、前記領域決定パラメータを、該領域決定パラメータが該カテゴリーAのプロトタイプと該入力データの距離と等しくなるように補正することを特徴とするデータ分類方法。
  5. 複数個の入力データを複数個のカテゴリーに分類するデータ分類装置であって、
    カテゴリーのプロトタイプと、カテゴリーの領域の大きさを規定する領域決定パラメータを格納する内部データ格納部と、
    読み込んだ入力データに最も近いカテゴリーのプロトタイプを選択するプロトタイプ選択手段と、
    前記プロトタイプと入力データの距離から該プロトタイプが妥当であるかを評価するプロトタイプ評価手段と、
    プロトタイプを新規に作成するプロトタイプ追加手段と、
    前記領域決定パラメータと前記プロトタイプを補正することができる内部データ補正手段を有し、
    前記プロトタイプ評価手段では、プロトタイプが妥当と判定された場合に、前記内部データ補正手段により、当該領域決定パラメータと当該プロトタイプの少なくとも一方を補正し、プロトタイプが妥当と判定されなかった場合に、前記プロトタイプ追加手段により新しいプロトタイプを作成することを特徴とするデータ分類装置。
  6. 複数個の入力データを予め設定した複数個のカテゴリーBに分類するデータ分類装置であって、
    前記カテゴリーBに関連するカテゴリーAのプロトタイプと、カテゴリーAの領域の大きさを規定する領域決定パラメータを格納する内部データ格納部と、
    カテゴリーAをカテゴリーBに変換するためのカテゴリー対応マトリックスを格納するカテゴリー対応マトリックス格納部と、
    読み込んだ入力データに最も近いカテゴリーAのプロトタイプを選択するプロトタイプ選択手段と、
    前記プロトタイプと前記入力データの距離から該プロトタイプが妥当であるかを評価するプロトタイプ評価手段と、
    カテゴリーAのプロトタイプを新規に作成するプロトタイプ追加手段と、
    前記領域決定パラメータ、前記プロトタイプ、及び前記カテゴリー対応マトリックスを補正する内部データ及びマトリックス補正手段と、
    前記選択されたカテゴリーAを前記カテゴリー対応マトリックスを用いてカテゴリーBに変換するカテゴリー変換手段を有し、
    前記内部データ及びマトリックス補正手段において、前記カテゴリー対応マトリックスに選択されたカテゴリーAと予め設定したカテゴリーBの関係を追加するときに、選択したカテゴリーAが既に別のカテゴリーBに対応している場合、対応関係の追加を拒否し、前記カテゴリーAのプロトタイプを、前記入力データから遠ざけるように補正し、該領域決定パラメータを、前記領域決定パラメータが前記カテゴリーAのプロトタイプと該入力データの距離と等しくなるように補正することを特徴とするデータ分類装置。
  7. 設備の運転データを入力して設備の診断を行う設備診断装置において、
    請求項5記載のデータ分類装置を備え、
    前記設備の運転データを前記データ分類装置に入力し、分類されたカテゴリーに基づき設備の状態を診断することを特徴とする設備診断装置。
  8. 請求項7において、前記設備の運転データは計測項目毎に最大値及び最小値を計算し、求めた最大値及び最小値を用いてデータを正規化することを特徴とする設備診断装置。
  9. 設備の運転データを入力して設備の診断を行う設備診断装置において、
    請求項6記載のデータ分類装置を備え、
    前記設備の状態を教師パターンとして与え、前記設備の状態と前記設備の運転データとの関係を前記データ分類装置により学習し、学習後の前記データ分類装置に未学習の運転データを入力し、前記データ分類装置が出力したカテゴリーBにより機器の状態を診断することを特徴とする設備の診断装置。
  10. 請求項9において、前記設備の運転データは計測項目毎に最大値及び最小値を計算し、求めた最大値及び最小値を用いてデータを正規化することを特徴とする設備診断装置。
JP2007206858A 2007-08-08 2007-08-08 データ分類方法および装置 Expired - Fee Related JP4641537B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007206858A JP4641537B2 (ja) 2007-08-08 2007-08-08 データ分類方法および装置
CN2008101298050A CN101364269B (zh) 2007-08-08 2008-08-07 数据分类方法及装置
US12/187,760 US8484139B2 (en) 2007-08-08 2008-08-07 Data classification method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007206858A JP4641537B2 (ja) 2007-08-08 2007-08-08 データ分類方法および装置

Publications (2)

Publication Number Publication Date
JP2009042997A true JP2009042997A (ja) 2009-02-26
JP4641537B2 JP4641537B2 (ja) 2011-03-02

Family

ID=40347430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007206858A Expired - Fee Related JP4641537B2 (ja) 2007-08-08 2007-08-08 データ分類方法および装置

Country Status (3)

Country Link
US (1) US8484139B2 (ja)
JP (1) JP4641537B2 (ja)
CN (1) CN101364269B (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244149A (ja) * 2009-04-02 2010-10-28 Hitachi Ltd データ分類方法,データ分類装置,診断方法,診断装置
WO2011039823A1 (ja) * 2009-10-02 2011-04-07 株式会社日立製作所 プラント診断装置
JP2011070334A (ja) * 2009-09-25 2011-04-07 Hitachi Ltd 異常診断装置及び異常診断方法
WO2012073289A1 (ja) * 2010-12-02 2012-06-07 株式会社日立製作所 プラントの診断装置及びプラントの診断方法
JP2013196698A (ja) * 2012-03-19 2013-09-30 Ge Aviation Systems Ltd システム監視
JP2017117034A (ja) * 2015-12-22 2017-06-29 株式会社日立製作所 診断装置及び診断方法
JP7568216B2 (ja) 2020-10-30 2024-10-16 ソフトバンクロボティクスグループ株式会社 学習装置、学習方法、及び学習プログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102252728B (zh) * 2007-01-17 2013-09-25 松下电器产业株式会社 流量测量设备以及流量测量方法
EP2965286A1 (en) * 2013-03-04 2016-01-13 Rite-Hite Holding Corporation Methods and apparatus for video based process monitoring and control
JP6188400B2 (ja) * 2013-04-26 2017-08-30 オリンパス株式会社 画像処理装置、プログラム及び画像処理方法
JP6553461B2 (ja) * 2015-09-17 2019-07-31 株式会社日立製作所 既存システム処理仕様抽出装置
JP6951202B2 (ja) * 2017-11-13 2021-10-20 株式会社日立製作所 データ分類装置
CN108268892B (zh) * 2017-12-29 2019-02-19 英特尔产品(成都)有限公司 生产故障管理分析方法
JP6703017B2 (ja) * 2018-01-22 2020-06-03 ファナック株式会社 計測結果分析装置、計測結果分析方法及びプログラム
CN115114981B (zh) * 2022-06-29 2024-10-18 苏州浪潮智能科技有限公司 一种Margin数据评价方法、装置、设备及介质
CN119513379B (zh) * 2024-10-16 2025-11-11 北京洛斯达科技发展有限公司 空气储能电站信息平台数据管理方法、装置、设备及介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3686051T2 (de) * 1985-11-27 1992-12-17 Univ Boston Mustererkennungssystem.
US5214715A (en) * 1991-01-31 1993-05-25 Trustees Of Boston University Predictive self-organizing neural network
US5596993A (en) * 1994-09-21 1997-01-28 Beth Israel Hospital Fetal data processing system and method
US7783581B2 (en) * 2005-01-05 2010-08-24 Nec Corporation Data learning system for identifying, learning apparatus, identifying apparatus and learning method
US20060210133A1 (en) * 2005-03-03 2006-09-21 Sriram Krishnan Performance adjustments in medical decision support systems
CN100470581C (zh) * 2005-12-29 2009-03-18 电子科技大学 基于轮廓的车型识别方法
CN100440089C (zh) * 2006-11-23 2008-12-03 浙江大学 一种基于fisher的工业过程非线性故障诊断系统及方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200100123008, 小坂 利寿 Toshihisa Kosaka, "信頼性評価規範を用いたLVQ法による米国ドル紙幣識別 US Dollar Classifications by the LVQ Method Ba", 電気学会論文誌C Vol.119−C No.11 The Transactions of The Institute of Electrical En, 19991101, 第119−C巻 第11号, pp.1359〜1364, JP, 社団法人電気学会 *
CSNG200700584018, 小倉 和貴 Tomotaka OGURA, "E−SOINN: Enhanced Self−Organizing Incremental Neural Network", 電子情報通信学会技術研究報告 Vol.106 No.589 IEICE Technical Report, 20070308, 第106巻 第589号, pp.147〜152, JP, 社団法人電子情報通信学会 The Institute of Electro *
JPN6009047629, 小倉 和貴 Tomotaka OGURA, "E−SOINN: Enhanced Self−Organizing Incremental Neural Network", 電子情報通信学会技術研究報告 Vol.106 No.589 IEICE Technical Report, 20070308, 第106巻 第589号, pp.147〜152, JP, 社団法人電子情報通信学会 The Institute of Electro *
JPN6009047630, 小坂 利寿 Toshihisa Kosaka, "信頼性評価規範を用いたLVQ法による米国ドル紙幣識別 US Dollar Classifications by the LVQ Method Ba", 電気学会論文誌C Vol.119−C No.11 The Transactions of The Institute of Electrical En, 19991101, 第119−C巻 第11号, pp.1359〜1364, JP, 社団法人電気学会 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244149A (ja) * 2009-04-02 2010-10-28 Hitachi Ltd データ分類方法,データ分類装置,診断方法,診断装置
JP2011070334A (ja) * 2009-09-25 2011-04-07 Hitachi Ltd 異常診断装置及び異常診断方法
WO2011039823A1 (ja) * 2009-10-02 2011-04-07 株式会社日立製作所 プラント診断装置
JP5199478B2 (ja) * 2009-10-02 2013-05-15 株式会社日立製作所 プラント診断装置
WO2012073289A1 (ja) * 2010-12-02 2012-06-07 株式会社日立製作所 プラントの診断装置及びプラントの診断方法
JP5484591B2 (ja) * 2010-12-02 2014-05-07 株式会社日立製作所 プラントの診断装置及びプラントの診断方法
JP2013196698A (ja) * 2012-03-19 2013-09-30 Ge Aviation Systems Ltd システム監視
JP2017117034A (ja) * 2015-12-22 2017-06-29 株式会社日立製作所 診断装置及び診断方法
JP7568216B2 (ja) 2020-10-30 2024-10-16 ソフトバンクロボティクスグループ株式会社 学習装置、学習方法、及び学習プログラム

Also Published As

Publication number Publication date
JP4641537B2 (ja) 2011-03-02
CN101364269A (zh) 2009-02-11
CN101364269B (zh) 2012-06-13
US20090043716A1 (en) 2009-02-12
US8484139B2 (en) 2013-07-09

Similar Documents

Publication Publication Date Title
JP4641537B2 (ja) データ分類方法および装置
CN110929918B (zh) 一种基于CNN和LightGBM的10kV馈线故障预测方法
CN106682814B (zh) 一种基于故障知识库的风电机组故障智能诊断方法
CN115712871B (zh) 一种结合重采样和集成学习的电力电子系统故障诊断方法
CN119151160A (zh) 一种新能源场站运行智慧管理方法及系统
CN112994101B (zh) 基于神经网络的风电场发电功率后评估及监测方法
CN118694615B (zh) 一种基于大数据的网络入侵检测方法及系统
CN119179919B (zh) 一种水电设备在线监测诊断系统
CN117231439A (zh) 风电机组的故障诊断和控制方法、装置和电子设备
CN119825733A (zh) 基于多头注意力生成对抗网络的大型火电机组送风机喘振故障预警方法
CN117948744A (zh) 一种基于云网互联的电子膨胀阀健康管理系统
CN120873766B (zh) 一种滚动轴承剩余寿命预测方法及系统
CN118194156A (zh) 知识和数据融合驱动迭代的核电站水泵故障诊断方法
CN111598161A (zh) 一种基于cnn迁移学习的发动机气路状态诊断系统
CN111062509A (zh) 一种基于改进神经网络的风功率中短期预测方法及系统
JP2010244149A (ja) データ分類方法,データ分類装置,診断方法,診断装置
US20180087489A1 (en) Method for windmill farm monitoring
CN120217244A (zh) 基于数字孪生的新能源电力装备状态判断方法及系统
CN118972262A (zh) 基于卷积神经网络的电力通信网故障诊断方法及装置
CN118836554A (zh) 一种中央空调安全控制方法及系统
CN111814393A (zh) 基于生成对抗网络的apu退化参数生成方法
JP4676149B2 (ja) データ分類装置
CN121027925A (zh) 基于油温以及绕组温度的变压器健康度评估方法
Chen et al. Research on intelligent fault identification technology of wind turbine supported by fault knowledge base
CN118606797B (zh) 一种考虑多电压等级耦合的供电路径溯源方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101129

R150 Certificate of patent or registration of utility model

Ref document number: 4641537

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees