JP2020201638A - 監視システムおよび監視プログラム - Google Patents
監視システムおよび監視プログラム Download PDFInfo
- Publication number
- JP2020201638A JP2020201638A JP2019106996A JP2019106996A JP2020201638A JP 2020201638 A JP2020201638 A JP 2020201638A JP 2019106996 A JP2019106996 A JP 2019106996A JP 2019106996 A JP2019106996 A JP 2019106996A JP 2020201638 A JP2020201638 A JP 2020201638A
- Authority
- JP
- Japan
- Prior art keywords
- fluctuation
- monitoring
- correlation
- abnormality
- metrics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
- H03M13/03—Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
- H03M13/05—Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
- H03M13/13—Linear codes
- H03M13/15—Cyclic codes, i.e. cyclic shifts of codewords produce other codewords, e.g. codes defined by a generator polynomial, Bose-Chaudhuri-Hocquenghem [BCH] codes
- H03M13/151—Cyclic codes, i.e. cyclic shifts of codewords produce other codewords, e.g. codes defined by a generator polynomial, Bose-Chaudhuri-Hocquenghem [BCH] codes using error location or error correction polynomials
- H03M13/1515—Reed-Solomon codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/064—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/065—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
- H04L43/045—Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/06—Generation of reports
- H04L43/067—Generation of reports using time frame reporting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Theoretical Computer Science (AREA)
- Debugging And Monitoring (AREA)
Abstract
【課題】 特定のシステムの異常の通知のための処理の負担を低減することができる監視システムおよび監視プログラムを提供する。【解決手段】 画像形成装置を遠隔管理する遠隔管理システムのシステム構成要素の監視メトリクスの変動を検知する監視システムは、S71において検知したオンライン数の変動が変動閾値以上である場合に(S73でYES)、検知した複数のシステム構成要素の監視メトリクスの変動に相関があると判断したとき(S77でYES)、遠隔管理システムに異常があることを示す異常通知を実行する(S83)ことを特徴とする。【選択図】 図7
Description
本発明は、特定のシステムの監視システムおよび監視プログラムに関する。
従来、システムの構成要素の複数のメトリクスの相関関係に基づいて、このシステムの異常を検出し、検出した異常を通知するものが知られている(例えば、特許文献1参照。)。
しかしながら、従来の技術においては、システムの構成要素の複数のメトリクスの相関関係を常時計算する必要があるので、処理の負担が大きいという問題がある。
そこで、本発明は、特定のシステムの異常の通知のための処理の負担を低減することができる監視システムおよび監視プログラムを提供することを目的とする。
本発明の監視システムは、特定のシステムの構成要素のメトリクスの変動を検知する変動検知部と、前記変動検知部によって検知された、複数の前記構成要素の前記メトリクスの変動に相関があるか否かを判断する相関判断部と、前記変動検知部によって検知された、特定の前記構成要素の前記メトリクスの変動が特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関があると前記相関判断部によって判断されたとき、前記特定のシステムに異常があることを示す異常通知を実行する通知実行部とを備えることを特徴とする。
この構成により、本発明の監視システムは、特定のシステムの特定の構成要素のメトリクスの変動が特定の閾値以上である場合に、特定のシステムの複数の構成要素のメトリクスの変動に相関があると判断したとき、特定のシステムに異常があることを示す異常通知を実行するので、特定のシステムの特定の構成要素のメトリクスの変動が特定の閾値未満である場合に、特定のシステムの複数の構成要素のメトリクスの変動に相関があるか否かを判断する必要がなく、その結果、特定のシステムの異常の通知のための処理の負担を低減することができる。
本発明の監視システムにおいて、前記特定のシステムは、電子機器を遠隔管理するシステムであり、前記特定の構成要素の前記メトリクスの少なくとも1つは、前記特定のシステムに接続している前記電子機器の数としてのオンライン数であり、前記通知実行部は、前記変動検知部によって検知された前記オンライン数の変動が前記特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関があると前記相関判断部によって判断されたとき、前記異常通知を実行しても良い。
この構成により、本発明の監視システムは、オンライン数の変動が特定の閾値以上である場合に、特定のシステムの複数の構成要素のメトリクスの変動に相関があると判断したとき、異常通知を実行するので、オンライン数の異常な変動が生じた場合の特定のシステムの異常の通知の信頼性を向上することができる。
本発明の監視システムにおいて、前記変動検知部は、前記メトリクスに対して特異スペクトル変換を用いることによって、前記メトリクスの変動を検知しても良い。
この構成により、本発明の監視システムは、メトリクスの異常な変動を検知することができるので、特定のシステムの異常の通知の信頼性を向上することができる。
本発明の監視システムにおいて、前記通知実行部は、前記変動検知部によって検知された、前記特定の構成要素の前記メトリクスの変動が前記特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関がないと前記相関判断部によって判断されたとき、前記特定のシステムに異常がある可能性があることを示す異常可能性通知を実行しても良い。
この構成により、本発明の監視システムは、特定のシステムの特定の構成要素のメトリクスの変動が特定の閾値以上である場合に、特定のシステムの複数の構成要素のメトリクスの変動に相関がないと判断したとき、特定のシステムに異常があることを示す異常通知ではなく、特定のシステムに異常がある可能性があることを示す異常可能性通知を実行するので、特定のシステムの異常の通知の信頼性を向上することができる。
本発明の監視システムにおいて、前記相関判断部は、前記変動検知部によって検知された、複数の前記構成要素の前記メトリクスの変動に相関があると判断した場合に、この判断の結果が信頼できるものであるか否かを、これらの前記構成要素の前記メトリクスの変動に基づいて判断し、前記通知実行部は、前記変動検知部によって検知された、前記特定の構成要素の前記メトリクスの変動が前記特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関があると前記相関判断部によって判断されたときであっても、この判断の結果が信頼できるものではないと前記相関判断部によって判断されたとき、前記異常通知を実行しなくても良い。
この構成により、本発明の監視システムは、特定のシステムの特定の構成要素のメトリクスの変動が特定の閾値以上である場合に、特定のシステムの複数の構成要素のメトリクスの変動に相関があると判断したときであっても、この判断の結果が信頼できるものではないと判断したとき、異常通知を実行しないので、特定のシステムの異常の通知の信頼性を向上することができる。
本発明の監視プログラムは、特定のシステムの構成要素のメトリクスの変動を検知する変動検知部と、前記変動検知部によって検知された、複数の前記構成要素の前記メトリクスの変動に相関があるか否かを判断する相関判断部と、前記変動検知部によって検知された、特定の前記構成要素の前記メトリクスの変動が特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関があると前記相関判断部によって判断されたとき、前記特定のシステムに異常があることを示す異常通知を実行する通知実行部とをコンピューターに実現させることを特徴とする。
この構成により、本発明の監視プログラムを実行するコンピューターは、特定のシステムの特定の構成要素のメトリクスの変動が特定の閾値以上である場合に、特定のシステムの複数の構成要素のメトリクスの変動に相関があると判断したとき、特定のシステムに異常があることを示す異常通知を実行するので、特定のシステムの特定の構成要素のメトリクスの変動が特定の閾値未満である場合に、特定のシステムの複数の構成要素のメトリクスの変動に相関があるか否かを判断する必要がなく、その結果、特定のシステムの異常の通知のための処理の負担を低減することができる。
本発明の監視システムおよび監視プログラムは、特定のシステムの異常の通知のための処理の負担を低減することができる。
以下、本発明の実施の形態について、図面を用いて説明する。
まず、本発明の一実施の形態に係るシステムの構成について説明する。
図1は、本実施の形態に係るシステム10のブロック図である。
図1に示すように、システム10は、電子機器としての画像形成装置を管理する業者(以下「管理業者」という。)の客のLAN(Local Area Network)などのネットワーク20を備えている。システム10は、ネットワーク20以外にも、ネットワーク20と同様の構成のネットワークを少なくとも1つ備えることが可能である。
ネットワーク20は、ネットワーク20の内部と、ネットワーク20の外部との間の通信を制御するファイアウォール21と、画像形成装置22とを備えている。ネットワーク20は、画像形成装置22以外にも、画像形成装置22と同様の構成の画像形成装置を少なくとも1つ備えることが可能である。ネットワーク20における画像形成装置は、例えば、MFP(Multifunction Peripheral)、プリンター専用機などによって構成されており、管理業者の客によって使用される。
システム10は、システム10における各画像形成装置を遠隔管理する特定のシステムとしての遠隔管理システム30を備えている。遠隔管理システム30は、例えば世界中に配置されている、例えば数百万台などの膨大な数の画像形成装置を管理することが可能である。遠隔管理システム30は、管理業者によって使用される。遠隔管理システム30は、1台のコンピューターによって構成されても良いし、複数台のコンピューターによって構成されても良い。以下において、遠隔管理システム30は、パブリッククラウドのクラウドプラットフォーム上で動作するものとして説明する。
遠隔管理システム30にはインターネット11を介して多数の画像形成装置が接続可能であるので、遠隔管理システム30を構成するサーバーの能力は、遠隔管理システム30に接続される画像形成装置の増加に伴って、機動的に拡大される。また、遠隔管理システム30が動作するクラウドプラットフォームは、このクラウドプラットフォームのシステム障害やメンテナンスのために、遠隔管理システム30が把握していないタイミングで、システムの一部がダウンする場合がある。
システム10は、遠隔管理システム30を監視する監視システム40を備えている。監視システム40は、管理業者によって使用される。監視システム40は、1台のコンピューターによって構成されても良いし、複数台のコンピューターによって構成されても良い。
システム10における各ネットワークと、遠隔管理システム30と、監視システム40とは、インターネット11を介して互いに通信可能である。
図2は、遠隔管理システム30のブロック図である。
図2に示すように、遠隔管理システム30は、画像形成装置に対する制御コマンドを発行するコマンドサーバー31を備えている。遠隔管理システム30は、コマンドサーバー31以外にも、コマンドサーバー31と同様の構成のコマンドサーバーを少なくとも1つ備えることが可能である。コマンドサーバーは、画像形成装置との接続が確立された場合に、この画像形成装置に対してファイアウォールを超えた制御コマンドの発行が可能になる。1つのコマンドサーバーは、例えば4000台の画像形成装置と同時に接続することが可能である。
遠隔管理システム30は、ファイアウォールを超えて接続してきた画像形成装置から送信されてきた、この画像形成装置の管理に必要な情報を処理し、この画像形成装置に対して適切なコマンドサーバーとの接続を確立するように指示するデバイス管理サーバー32を備えている。ここで、適切なコマンドサーバーとは、例えば、接続が確立されている画像形成装置の台数が最も少ないコマンドサーバーである。遠隔管理システム30は、デバイス管理サーバー32以外にも、デバイス管理サーバー32と同様の構成のデバイス管理サーバーを少なくとも1つ備えることが可能である。1つのデバイス管理サーバーは、例えば1分間当たり2000台の画像形成装置に対する処理を実行可能である。
遠隔管理システム30は、ファイアウォールを超えて接続してきた画像形成装置から送信されてきた、この画像形成装置の管理に必要な情報を適切なデバイス管理サーバーに割り振ることによって負荷を分散させるロードバランサー33を備えている。
遠隔管理システム30は、画像形成装置からの各種の情報の取得、画像形成装置の制御ソフトウェアの更新、画像形成装置の各種の設定など、画像形成装置の各種の遠隔操作を行うための操作を管理業者のサービスパーソンなどの利用者から受け付けるユーザー管理サーバー34を備えている。コマンドサーバーは、ユーザー管理サーバー34によって受け付けられた操作を制御コマンドとして画像形成装置に伝達することによって、この画像形成装置をメンテナンスする。
遠隔管理システム30は、画像形成装置の印刷カウンターや画像形成装置の認証に関する情報など、コマンドサーバーによって画像形成装置から収集された各種の情報を記憶するデータベース35およびキャッシュサーバー36を備えている。
データベース35は、例えば、コマンドサーバーと接続している画像形成装置の台数(以下「オンライン数」という。)と、コマンドサーバー、デバイス管理サーバー、ユーザー管理サーバー34、データベース35、キャッシュサーバー36など、遠隔管理システム30の構成要素(以下「システム構成要素」という。)のそれぞれを構成するサーバーのCPU(Central Processing Unit)の使用率と、システム構成要素のそれぞれを構成するサーバーのメモリーの使用率との履歴を記憶する。
図3は、1台のコンピューターによって構成される場合の監視システム40のブロック図である。
図3に示す監視システム40は、種々の操作が入力される例えばキーボード、マウスなどの操作デバイスである操作部41と、種々の情報を表示する例えばLCD(Liquid Crystal Display)などの表示デバイスである表示部42と、LAN、インターネット11などのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部43と、各種の情報を記憶する例えば半導体メモリー、HDD(Hard Disk Drive)などの不揮発性の記憶デバイスである記憶部44と、監視システム40全体を制御する制御部45とを備えている。
記憶部44は、遠隔管理システム30(図2参照。)を監視するための監視プログラム44aを記憶している。監視プログラム44aは、例えば、監視システム40の製造段階で監視システム40にインストールされていても良いし、CD(Compact Disk)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリーなどの外部の記憶媒体から監視システム40に追加でインストールされても良いし、ネットワーク上から監視システム40に追加でインストールされても良い。
記憶部44は、遠隔管理システム30の監視に使用するメトリクス(以下「監視メトリクス」という。)を示す監視メトリクス情報44bを記憶している。監視メトリクス情報44bは、システム構成要素毎に少なくとも1つの監視メトリクスを示すことが可能である。監視メトリクス情報44bによって示される監視メトリクスは、操作部41または通信部43を介した指示に応じて、新たに設定されたり、変更されたりすることが可能である。例えば、監視メトリクスとしては、オンライン数と、各システム構成要素を構成するサーバーのCPUの使用率と、インターネット11を介したデバイス管理サーバーへの入力およびデバイス管理サーバーからのインターネット11を介した出力の量(以下「ネットワークIN/OUT量」という。)と、データベース35のトランザクション数とが存在する。
記憶部44は、監視メトリクスの変動の履歴を示す変動履歴情報44cを記憶している。変動履歴情報44cは監視メトリクス毎に変動の履歴を示している。
記憶部44は、オンライン数の変動の閾値(以下「変動閾値」という。)44dを記憶している。変動閾値44dは、操作部41または通信部43を介した指示に応じて変更されることが可能である。
記憶部44は、遠隔管理システム30の異常を検出するための情報(以下「異常検出用情報」という。)44eを記憶している。異常検出用情報44eは、遠隔管理システム30の異常のシステム構成要素間での派生の伝播の経路(以下「派生伝播経路」という。)と、監視メトリクス情報44bに示す監視メトリクスのうち、派生伝播経路の各段階におけるシステム構成要素の監視メトリクスとを、遠隔管理システム30の異常がシステム構成要素間で派生していくパターン(以下「異常派生パターン」という。)毎に示している。異常検出用情報44eにおける異常派生パターン毎の情報は、操作部41または通信部43を介した指示に応じて、新たに設定されたり、変更されたりすることが可能である。
図4は、異常検出用情報44eに示される異常派生パターンの一例を示す図である。
図4に示す異常派生パターンは、オンライン数が低下した場合の異常派生パターンである。
図4に示す異常派生パターンにおいて、派生伝播経路の最初の段階におけるシステム構成要素は、コマンドサーバーであり、その監視メトリクスは、オンライン数である。何らかの異常によって遠隔管理システム30と、画像形成装置との接続が切断されることによって、オンライン数が大幅に低下すると、遠隔管理システム30への画像形成装置の再接続の処理が大量に発生する。遠隔管理システム30への画像形成装置の再接続の処理が大量に発生すると、画像形成装置と、コマンドサーバーとの接続を確立するためのデバイス管理サーバーへの負荷が増加する。
したがって、図4に示す異常派生パターンにおいて、派生伝播経路の2番目の段階におけるシステム構成要素は、デバイス管理サーバーであり、その監視メトリクスは、ネットワークIN/OUT量と、デバイス管理サーバーのCPUの使用率とである。画像形成装置と、コマンドサーバーとの、デバイス管理サーバーによる再接続の処理が大量に発生すると、再接続を依頼してきた画像形成装置の認証のための情報をデバイス管理サーバーがデータベース35から読み出したり、画像形成装置がコマンドサーバーに再接続した場合に画像形成装置がコマンドサーバーに再接続したことをデバイス管理サーバーがデータベース35に書き込んだり、コマンドサーバーに再接続した画像形成装置から送信されてきた、この画像形成装置の現在の各種の情報をデバイス管理サーバーがデータベース35に書き込んだりするので、データベース35への負荷が増加する。
したがって、図4に示す異常派生パターンにおいて、派生伝播経路の3番目の段階におけるシステム構成要素は、データベース35であり、その監視メトリクスは、データベース35へのデータの書き込みおよびデータベース35からのデータの読み出しの量と、データベース35のCPUの使用率とである。
図3に示すように、記憶部44は、各種の情報の連絡先を示す連絡先情報44fを記憶している。連絡先情報44fに示される連絡先は、例えば電子メールアドレスである。連絡先情報44fは、例えば、遠隔管理システム30の開発者の連絡先や、遠隔管理システム30の利用者の連絡先など、複数の連絡先を示しても良い。
制御部45は、例えば、CPUと、プログラムおよび各種のデータを記憶しているROM(Read Only Memory)と、制御部45のCPUの作業領域として用いられるメモリーとしてのRAM(Random Access Memory)とを備えている。制御部45のCPUは、記憶部44または制御部45のROMに記憶されているプログラムを実行する。
制御部45は、監視プログラム44aを実行することによって、遠隔管理システム30のシステム構成要素の監視メトリクスの変動を検知する変動検知部45aと、複数のシステム構成要素の監視メトリクスの変動に相関があるか否かを判断する相関判断部45bと、遠隔管理システム30に異常があることを示す異常通知を実行する通知実行部45cとを実現する。
次に、監視システム40の動作について説明する。
図5は、オンライン数以外の監視メトリクスの変動を検知する場合の監視システム40の動作のフローチャートである。
監視システム40の制御部45は、監視メトリクス毎に定期的に図5に示す動作を実行する。
図5に示すように、変動検知部45aは、対象の監視メトリクスの変動を検知する(S61)。すなわち、変動検知部45aは、対象の監視メトリクスの変動を計算によって取得する。
図6(a)は、オンライン数を時系列に示すグラフである。図6(b)は、図6(a)に示すオンライン数の変動を時系列に示すグラフである。
変動検知部45aは、図6(a)に示すオンライン数に対して、特異スペクトル変換を用いることによって、図6(b)に示す変動を計算する。なお、オンライン数の変動は、図6(a)に示すグラフにおいて僅かである場合には、図6(b)に示すグラフにおいて現れない。
図6はオンライン数の変動に関して示しているが、オンライン数以外の監視メトリクスの変動に関しても同様である。
以上においては、特異スペクトル変換を用いて監視メトリクスの変動を計算する例について説明している。しかしながら、変動検知部45aは、特異スペクトル変換を用いた方法以外の方法によって、監視メトリクスの変動を計算しても良い。
図5に示すように、変動検知部45aは、S61の処理の後、S61において検知した変動を変動履歴情報44cに記憶して(S62)、図5に示す動作を終了する。
図7は、オンライン数の変動を検知する場合の監視システム40の動作のフローチャートである。
監視システム40の制御部45は、定期的に図7に示す動作を実行する。
図7に示すように、変動検知部45aは、S61の処理と同様に、オンライン数の変動を検知する(S71)。
次いで、変動検知部45aは、S62の処理と同様に、S71において検知した変動を変動履歴情報44cに記憶する(S72)。
次いで、相関判断部45bは、S71において検知した変動が変動閾値44d以上であるか否かを判断する(S73)。
相関判断部45bは、S71において検知した変動が変動閾値44d以上ではないとS73において判断すると、図7に示す動作を終了する。
相関判断部45bは、S71において検知した変動が変動閾値44d以上であるとS73において判断すると、異常検出用情報44eに示される異常派生パターンのうち、今回の図7に示す動作において未だ対象にしていない異常派生パターンを1つのみ対象にする(S74)。ここで、相関判断部45bは、異常検出用情報44eにおいて異常派生パターンに対して優先順位が設定されている場合には、優先順位に応じて異常派生パターンを対象にしても良い。
相関判断部45bは、S74の処理の後、異常検出用情報44eに示す現在の対象の異常派生パターンの派生伝播経路における最初の段階を対象の段階にする(S75)。
次いで、相関判断部45bは、異常検出用情報44eに示す現在の対象の段階におけるシステム構成要素の監視メトリクスの、S71において変動を検知した時点を含む特定の期間での時系列上の変動と、異常検出用情報44eに示す現在の対象の段階の次の段階におけるシステム構成要素の監視メトリクスの、S71において変動を検知した時点を含む特定の期間での時系列上の変動との相互相関係数を変動履歴情報44cに基づいて算出する(S76)。ここで、S71において変動を検知した時点での変動だけでなく、S71において変動を検知した時点の近傍の期間での変動も用いて相互相関係数を算出する理由は、現在の対象の段階の次の段階におけるシステム構成要素の監視メトリクスの変動が、現在の対象の段階におけるシステム構成要素の監視メトリクスの変動より遅れて発生する場合があるからである。
相関判断部45bは、S76の処理の後、現在の対象の段階におけるシステム構成要素の監視メトリクスの変動と、現在の対象の段階の次の段階におけるシステム構成要素の監視メトリクスの変動との相関があるか否かを、S76において算出した相互相関係数に基づいて判断する(S77)。例えば、相関判断部45bは、相互相関係数の絶対値が0.7以上である場合に、現在の対象の段階におけるシステム構成要素の監視メトリクスの変動と、現在の対象の段階の次の段階におけるシステム構成要素の監視メトリクスの変動との相関があると判断し、相互相関係数の絶対値が0.7未満である場合に、現在の対象の段階におけるシステム構成要素の監視メトリクスの変動と、現在の対象の段階の次の段階におけるシステム構成要素の監視メトリクスの変動との相関がないと判断しても良い。
相関判断部45bは、現在の対象の段階におけるシステム構成要素の監視メトリクスの変動と、現在の対象の段階の次の段階におけるシステム構成要素の監視メトリクスの変動との相関があるとS77において判断すると、異常検出用情報44eに示す現在の対象の段階におけるシステム構成要素の監視メトリクスの、S71において変動を検知した時点を含む特定の期間での時系列上の変動と、異常検出用情報44eに示す現在の対象の段階の次の段階におけるシステム構成要素の監視メトリクスの、S71において変動を検知した時点を含む特定の期間での時系列上の変動との無相関係数を変動履歴情報44cに基づいて算出する(S78)。ここで、S71において変動を検知した時点での変動だけでなく、S71において変動を検知した時点の近傍の期間での変動も用いて無相関係数を算出する理由は、現在の対象の段階の次の段階におけるシステム構成要素の監視メトリクスの変動が、現在の対象の段階におけるシステム構成要素の監視メトリクスの変動より遅れて発生する場合があるからである。
相関判断部45bは、S77における判断の結果が信頼できるもの、すなわち、有意水準で棄却されないものであるか否かを、S76において算出した相互相関係数と、S78において算出した無相関係数とに基づいて判断する(S79)。
相関判断部45bは、現在の対象の段階におけるシステム構成要素の監視メトリクスの変動と、現在の対象の段階の次の段階におけるシステム構成要素の監視メトリクスの変動との相関がないとS77において判断するか、S77における判断の結果が信頼できるものではないとS79において判断すると、異常検出用情報44eに示される異常派生パターンのうち、今回の図7に示す動作において未だ対象にしていない異常派生パターンが存在するか否かを判断する(S80)。
相関判断部45bは、異常検出用情報44eに示される異常派生パターンのうち、今回の図7に示す動作において未だ対象にしていない異常派生パターンが存在するとS80において判断すると、S74の処理を実行する。
相関判断部45bは、S77における判断の結果が信頼できるものであるとS79において判断すると、異常検出用情報44eに示す現在の対象の異常派生パターンの派生伝播経路において、現在の対象の段階の2つ後の段階が存在するか否かを判断する(S81)。
相関判断部45bは、現在の対象の段階の2つ後の段階が存在するとS81において判断すると、異常検出用情報44eに示す現在の対象の段階の次の段階を新たな対象の段階にして(S82)、S76の処理を実行する。
通知実行部45cは、現在の対象の段階の2つ後の段階が存在しないとS81において判断されると、遠隔管理システム30に異常があることを示す異常通知を、連絡先情報44fに示す連絡先に対して実行する(S83)。異常通知には、例えば、「オンライン数などのシステム構成要素の監視メトリクスの変動から判断した結果、遠隔管理システム30に異常がある」という旨が含まれている。
通知実行部45cは、異常検出用情報44eに示される異常派生パターンのうち、今回の図7に示す動作において未だ対象にしていない異常派生パターンが存在しないとS80において判断されると、遠隔管理システム30に異常がある可能性があることを示す異常可能性通知を、連絡先情報44fに示す連絡先に対して実行する(S84)。異常可能性通知には、例えば、「オンライン数などのシステム構成要素の監視メトリクスの変動から判断した結果、オンライン数に変動があったものの、遠隔管理システム30に異常がない可能性がある」という旨が含まれている。
通知実行部45cは、S83またはS84の処理の後、図7に示す動作を終了する。
以上に説明したように、監視システム40は、オンライン数の変動が変動閾値44d以上である場合(S73でYES)に、遠隔管理システム30の複数のシステム構成要素の監視メトリクスの変動に相関があると判断したとき(S77でYES)、異常通知を実行する(S83)ので、オンライン数の変動が変動閾値44d未満である場合(S73でNO)に、遠隔管理システム30の複数のシステム構成要素の監視メトリクスの変動に相関があるか否かを判断する必要がなく、その結果、遠隔管理システム30の異常の通知のための処理の負担を低減することができる。
監視システム40は、オンライン数の変動が変動閾値44d以上である場合(S73でYES)に、遠隔管理システム30の複数のシステム構成要素の監視メトリクスの変動に相関があると判断したとき(S77でYES)、異常通知を実行する(S83)ので、オンライン数の異常な変動が生じた場合の遠隔管理システム30の異常の通知の信頼性を向上することができる。
なお、監視システム40は、異常派生パターンの派生伝播経路における最初の段階におけるシステム構成要素の監視メトリクスの変動がオンライン数以外の監視メトリクスの変動でも良い。
監視システム40は、監視メトリクスに対して特異スペクトル変換を用いることによって、監視メトリクスの変動を検知する(S61およびS71)ので、監視メトリクスの異常な変動を検知することができる。したがって、監視システム40は、遠隔管理システム30の異常の通知の信頼性を向上することができる。
監視システム40は、オンライン数の変動が変動閾値44d以上である場合(S73でYES)に、遠隔管理システム30の複数のシステム構成要素の監視メトリクスの変動に相関がないと判断したとき(S77でNO)、異常通知ではなく、異常可能性通知を実行する(S84)ので、遠隔管理システム30の異常の通知の信頼性を向上することができる。
監視システム40は、オンライン数の変動が変動閾値44d以上である場合(S73でYES)に、遠隔管理システム30の複数のシステム構成要素の監視メトリクスの変動に相関があると判断したとき(S77でYES)であっても、この判断の結果が信頼できるものではないと判断したとき(S79でNO)、異常通知を実行しないので、遠隔管理システム30の異常の通知の信頼性を向上することができる。
22 画像形成装置(電子機器)
30 遠隔管理システム(特定のシステム)
31 コマンドサーバー(構成要素)
32 デバイス管理サーバー(構成要素)
34 ユーザー管理サーバー(構成要素)
35 データベース(構成要素)
36 キャッシュサーバー(構成要素)
40 監視システム
44a 監視プログラム
44d 変動閾値(特定の閾値)
45a 変動検知部
45b 相関判断部
45c 通知実行部
30 遠隔管理システム(特定のシステム)
31 コマンドサーバー(構成要素)
32 デバイス管理サーバー(構成要素)
34 ユーザー管理サーバー(構成要素)
35 データベース(構成要素)
36 キャッシュサーバー(構成要素)
40 監視システム
44a 監視プログラム
44d 変動閾値(特定の閾値)
45a 変動検知部
45b 相関判断部
45c 通知実行部
Claims (6)
- 特定のシステムの構成要素のメトリクスの変動を検知する変動検知部と、
前記変動検知部によって検知された、複数の前記構成要素の前記メトリクスの変動に相関があるか否かを判断する相関判断部と、
前記変動検知部によって検知された、特定の前記構成要素の前記メトリクスの変動が特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関があると前記相関判断部によって判断されたとき、前記特定のシステムに異常があることを示す異常通知を実行する通知実行部と
を備えることを特徴とする監視システム。 - 前記特定のシステムは、電子機器を遠隔管理するシステムであり、
前記特定の構成要素の前記メトリクスの少なくとも1つは、前記特定のシステムに接続している前記電子機器の数としてのオンライン数であり、
前記通知実行部は、前記変動検知部によって検知された前記オンライン数の変動が前記特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関があると前記相関判断部によって判断されたとき、前記異常通知を実行することを特徴とする請求項1に記載の監視システム。 - 前記変動検知部は、前記メトリクスに対して特異スペクトル変換を用いることによって、前記メトリクスの変動を検知することを特徴とする請求項1または請求項2に記載の監視システム。
- 前記通知実行部は、前記変動検知部によって検知された、前記特定の構成要素の前記メトリクスの変動が前記特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関がないと前記相関判断部によって判断されたとき、前記特定のシステムに異常がある可能性があることを示す異常可能性通知を実行することを特徴とする請求項1から請求項3までのいずれかに記載の監視システム。
- 前記相関判断部は、前記変動検知部によって検知された、複数の前記構成要素の前記メトリクスの変動に相関があると判断した場合に、この判断の結果が信頼できるものであるか否かを、これらの前記構成要素の前記メトリクスの変動に基づいて判断し、
前記通知実行部は、前記変動検知部によって検知された、前記特定の構成要素の前記メトリクスの変動が前記特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関があると前記相関判断部によって判断されたときであっても、この判断の結果が信頼できるものではないと前記相関判断部によって判断されたとき、前記異常通知を実行しないことを特徴とする請求項1から請求項5までのいずれかに記載の監視システム。 - 特定のシステムの構成要素のメトリクスの変動を検知する変動検知部と、
前記変動検知部によって検知された、複数の前記構成要素の前記メトリクスの変動に相関があるか否かを判断する相関判断部と、
前記変動検知部によって検知された、特定の前記構成要素の前記メトリクスの変動が特定の閾値以上である場合に、複数の前記構成要素の前記メトリクスの変動に相関があると前記相関判断部によって判断されたとき、前記特定のシステムに異常があることを示す異常通知を実行する通知実行部と
をコンピューターに実現させることを特徴とする監視プログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019106996A JP2020201638A (ja) | 2019-06-07 | 2019-06-07 | 監視システムおよび監視プログラム |
| US16/893,681 US10986014B2 (en) | 2019-06-07 | 2020-06-05 | Monitoring system and non-transitory computer-readable recording medium storing monitoring program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019106996A JP2020201638A (ja) | 2019-06-07 | 2019-06-07 | 監視システムおよび監視プログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2020201638A true JP2020201638A (ja) | 2020-12-17 |
Family
ID=73651765
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019106996A Pending JP2020201638A (ja) | 2019-06-07 | 2019-06-07 | 監視システムおよび監視プログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US10986014B2 (ja) |
| JP (1) | JP2020201638A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP4002800A3 (en) * | 2020-11-17 | 2022-08-03 | Citrix Systems Inc. | Systems and methods for detection of degradation of a virtual desktop environment |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008146353A (ja) * | 2006-12-11 | 2008-06-26 | Internatl Business Mach Corp <Ibm> | 観測対象の異常を検出する技術 |
| JP2010009313A (ja) * | 2008-06-26 | 2010-01-14 | Mitsubishi Electric Corp | 障害予兆検知装置 |
| JPWO2012157471A1 (ja) * | 2011-05-13 | 2014-07-31 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 複数の制御システムの異常を検知する異常検知システム |
| US20170155570A1 (en) * | 2015-12-01 | 2017-06-01 | Linkedin Corporation | Analysis of site speed performance anomalies caused by server-side issues |
| JP2018028783A (ja) * | 2016-08-17 | 2018-02-22 | 富士通株式会社 | システム状態可視化プログラム、システム状態可視化方法及びシステム状態可視化装置 |
| JP2019507454A (ja) * | 2016-02-18 | 2019-03-14 | ニュー レリック インコーポレイテッド | アプリケーションの実行中に観察される問題の根本原因を特定する方法 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10938418B2 (en) * | 2005-09-30 | 2021-03-02 | Pure Storage, Inc. | Online disk replacement/removal |
| JP5590196B2 (ja) | 2013-07-22 | 2014-09-17 | 日本電気株式会社 | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム |
-
2019
- 2019-06-07 JP JP2019106996A patent/JP2020201638A/ja active Pending
-
2020
- 2020-06-05 US US16/893,681 patent/US10986014B2/en not_active Expired - Fee Related
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008146353A (ja) * | 2006-12-11 | 2008-06-26 | Internatl Business Mach Corp <Ibm> | 観測対象の異常を検出する技術 |
| JP2010009313A (ja) * | 2008-06-26 | 2010-01-14 | Mitsubishi Electric Corp | 障害予兆検知装置 |
| JPWO2012157471A1 (ja) * | 2011-05-13 | 2014-07-31 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 複数の制御システムの異常を検知する異常検知システム |
| US20170155570A1 (en) * | 2015-12-01 | 2017-06-01 | Linkedin Corporation | Analysis of site speed performance anomalies caused by server-side issues |
| JP2019507454A (ja) * | 2016-02-18 | 2019-03-14 | ニュー レリック インコーポレイテッド | アプリケーションの実行中に観察される問題の根本原因を特定する方法 |
| JP2018028783A (ja) * | 2016-08-17 | 2018-02-22 | 富士通株式会社 | システム状態可視化プログラム、システム状態可視化方法及びシステム状態可視化装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20200389362A1 (en) | 2020-12-10 |
| US10986014B2 (en) | 2021-04-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8949658B1 (en) | Load balancer host selection and fault detection | |
| EP2523115B1 (en) | Operation management device, operation management method, and program storage medium | |
| US20190068467A1 (en) | Cloud Network Stability | |
| US20150067147A1 (en) | Group server performance correction via actions to server subset | |
| JP2010526352A (ja) | 統計的な分析を利用した性能障害管理システム及びその方法 | |
| CN110377434A (zh) | 一种服务熔断方法、装置及消息中间件 | |
| JP7437145B2 (ja) | 監視サーバ、プログラム、及び監視方法 | |
| WO2015171860A1 (en) | Automatic alert generation | |
| JP2023553067A (ja) | トランザクション処理方法、装置、電子機器及びコンピュータプログラム | |
| JP7387469B2 (ja) | 通信装置、監視サーバ及びログ収集方法 | |
| KR102188987B1 (ko) | 서버 관리 장치를 구비한 클라우드 서버 및 로컬 서버를 이용하는 제로클라이언트 단말기용 클라우드 컴퓨팅 시스템의 운영 방법 | |
| JP2020201638A (ja) | 監視システムおよび監視プログラム | |
| JP2025094117A (ja) | 情報収集システム、情報収集方法、及び情報収集プログラム | |
| CN119814792A (zh) | 一种基于负载均衡器的网站流量管理方法及系统 | |
| KR102542149B1 (ko) | 우선순위 기반의 장애 모니터링을 통한 가상머신 통합관리 방법 및 이를 구현하는 가상머신 통합관리 시스템 | |
| JP2008191849A (ja) | 稼働管理装置、情報処理装置、稼働管理装置の制御方法、情報処理装置の制御方法及びプログラム | |
| JP2022044844A (ja) | 監視システムおよび監視プログラム | |
| KR20220055661A (ko) | 엣지 서비스 제어 처리 시스템 및 그 제어방법 | |
| JP2022044845A (ja) | 監視システムおよび監視プログラム | |
| WO2020138176A1 (ja) | 監視システム、監視方法および監視プログラム | |
| JP5384566B2 (ja) | フロントエンドサーバ、インタプリタ型プログラム及び方法 | |
| CN112804337A (zh) | 一种主节点压力分摊方法、装置、电子设备及存储介质 | |
| JP2009032052A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| TW202139142A (zh) | 監控告警方法及其伺服端 | |
| WO2020240766A1 (ja) | 評価装置、システム、制御方法、及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220531 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230331 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230405 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231004 |