JP2010141655A - ネットワーク監視装置 - Google Patents

ネットワーク監視装置 Download PDF

Info

Publication number
JP2010141655A
JP2010141655A JP2008316681A JP2008316681A JP2010141655A JP 2010141655 A JP2010141655 A JP 2010141655A JP 2008316681 A JP2008316681 A JP 2008316681A JP 2008316681 A JP2008316681 A JP 2008316681A JP 2010141655 A JP2010141655 A JP 2010141655A
Authority
JP
Japan
Prior art keywords
monitoring
network
prediction
policy
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008316681A
Other languages
English (en)
Inventor
So Kawamata
創 川俣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp filed Critical Yokogawa Electric Corp
Priority to JP2008316681A priority Critical patent/JP2010141655A/ja
Publication of JP2010141655A publication Critical patent/JP2010141655A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】障害解析に必要な監視データを適切に把握できるネットワーク監視装置を実現すること。
【解決手段】 ネットワークを介し被監視対象装置と接続され、監視ポリシーを設定する監視設定手段と、前記監視ポリシーに基づき前記ネットワークまたは前記被監視対象装置の状態を示す監視データを取得する監視手段とを有するネットワーク監視装置において、前記監視手段により得られた過去および/または現在の監視データに基づき、前記ネットワークまたは前記被監視対象装置の将来の状態を示す予測監視データを予測・算出する監視予測手段と、前記監視予測手段により算出された前記予測監視データに基づき前記監視ポリシーを変更する監視設定管理手段と、を具備することを特徴とする。
【選択図】 図1

Description

本発明は、各種機器が接続されるネットワークシステムの性能を把握するネットワーク監視装置に関し、特にネットワークの性能の変動をより精度高く予測することに関する。
ネットワークを介して複数のサーバ、ルータやスイッチなどの中継機器(以下、ネットワーク機器という)やサーバマシン、クライアントマシンなどの各種端末が接続されるネットワークシステムでは、サーバへの過大な要求や攻撃、故障の発生などによりその性能が劣化してしまうことがある。そこで、従来から、このようなネットワークシステムを理想的に稼動させるために、ネットワークシステムの性能を測定・監視・モニタリングするネットワーク監視装置が提案されている。
従来のネットワーク監視装置は、事前に定義されたモニタリング条件などの監視内容である監視ポリシーに従ってモニタリングを実行する。この監視ポリシーは監視対象、その監視対象に関する監視項目、監視する所定のインターバルなどがあらかじめ定められたものであり、ネットワーク・ネットワークシステムの状態が変化した場合でも不変のままモニタリングが実行されていた。
ところで、従来のネットワーク監視装置は、監視ポリシーの変更が必要となる場合は、ネットワーク管理者が手動で監視ポリシーの設定・変更を行っていた。しかしながら刻一刻と変化するネットワークに対する監視では、ネットワーク管理者が手動で設定・変更を行っていると、その時々の状況に応じて柔軟に適切な監視ポリシーを設定することが難しいという問題があった。
一方、可能な限りの監視対象および監視項目をあらかじめ設定しておき、常にネットワークの情報を漏れなくモニタリングする方法がある。しかしながら、監視対象であるネットワーク機器やネットワーク、ネットワークシステム全体に多大な負荷をかけてしまうといった新たな問題がある。
他方、従来のネットワーク監視装置では、ネットワークの状態に応じて動的に監視項目を変更する方法がある。この場合、監視対象機器などに与える負荷を最小限に抑えつつ、ネットワーク管理者による監視設定が行われるまでのタイムラグが無くなり、監視を常に効率良く行うことができるといったメリットがある。
このようなネットワーク監視装置に関連する先行技術文献として、下記の特許文献1がある。
特開2005−275815号公報
図6は従来のネットワーク監視装置の構成例を示す構成図であり、図6において、ネットワーク監視装置1は、イーサネット(登録商標)などの有線ネットワークであるネットワーク2を介してたとえばWebサーバなどを提供するサーバまたはネットワーク機器等である被監視対象装置3と接続されている。また特に図示していないが、ネットワーク2と、被監視対象装置3と、図示しないその他のネットワーク機器・各種端末装置とは、ネットワークシステムを構成する。
ネットワーク監視装置1は、ネットワーク2を介して被監視対象装置3とデータ通信を行う通信手段11、各部・各手段の動作を制御する演算制御部12、記憶手段13などから構成され、ネットワーク2およびネットワークシステム全体の動作を監視する。演算制御部12は、監視手段12Aと、監視設定手段12Bと、監視設定管理手段12Cとを有する。
監視手段12Aは、あらかじめ設定されている監視ポリシーに基づいて通信手段11を介して得られる監視対象である被監視対象装置3からのデータを収集し、被監視対象装置3、ネットワーク2およびネットワークシステムの挙動を監視・モニタリングする。
これらのデータに基づいてネットワーク2およびネットワークシステム全体の性能を示す性能評価値の基となる性能基礎データを算出し記憶手段13に記憶する。いいかえれば監視手段12Aはネットワーク2およびネットワークシステムの挙動を監視・モニタリングする。
監視設定手段12Bは、記憶手段13に記憶されている監視ポリシーを設定する。監視設定管理手段12Cは、監視手段12Aにより得られた監視結果に基づいて最適な監視内容を導き出し、記憶手段13に記憶されている監視ポリシーの再設定・変更を実行する。
記憶手段13は、監視対象・その監視対象に関する監視項目・監視する所定のインターバルなどが関連づけて格納されている監視ポリシー13Aと、監視手段12Aにより収集・算出された、たとえばレスポンスタイム、トラフィック量、エラーパケット数などの監視データと測定時の年月日などが関連づけて格納されている監視データDB13Bと、を有する。
図7は従来のネットワーク監視装置の動作を説明するフロー図である。ステップSP101において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、監視設定手段12Aにより設定された監視ポリシーに基づき被監視対象装置3の挙動を監視し、監視データを収集し得られたデータを記憶手段13に記憶する。
具体的には、監視手段12Aは監視ポリシーに基づき、図示しないWEBクライアント(またはネットワーク監視装置1)からのリクエストに応じてWEBサーバ(被監視対象装置3)が対応する処理を実行し、WEBクライアントが処理結果を受信するまでの時間(以下、レスポンスタイムという)を、当該WEBサーバにインストールされたソフトウエアなどを利用して10分間隔で測定し、得られたレスポンスタイムを記憶手段13に記憶する。
ステップSP102において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、収集した監視データに基づいて、ネットワーク2、被監視対象装置3、ネットワークシステムで障害が検知されたか否か判定する。障害が検知されればステップSP103に移行し、それ以外の場合はステップSP101に移行する。
ステップSP103において、ネットワーク監視装置1の演算制御部12の監視設定管理手段12Cは、障害が検知された監視データに基づき、新たに監視すべき監視項目を抽出し記憶手段13に記憶されている監視ポリシーに追加する。
具体的には、監視設定管理手段12Cは、図示しないクライアント(またはネットワーク監視装置1)から被監視対象装置3までのネットワーク経路のトラフィック量と被監視対象装置3のCPU使用率を監視項目として自動的に追加する。
ステップSP104において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、監視ポリシーに基づき、レスポンスタイムに加えてトラフィック量と被監視対象装置3のCPU使用率のモニタリングを開始し、得られた監視データを記憶手段13に記憶する。
ここで、ネットワーク管理者が新たに追加された監視項目であるトラフィック量の監視値に基づき検討すれば、あるネットワーク経路上での輻輳を見つけ出し、それを解決することが可能となる。
ステップSP105において、監視手段12Aは、収集した通信データに基づいて、ネットワークシステムで障害が検知されたか否か判定する。障害が検知されればステップSP103に移行し、それ以外の場合はステップSP106に移行する。
ステップSP106において、監視設定管理手段12Cは、被監視対象装置3における障害がないものと判断されると、ステップSP104にて新たに追加した監視項目を削除する。
具体的には、監視設定管理手段12Cは、レスポンスタイム(たとえば40ミリ秒など)が閾値(たとえば50ミリ秒など)を下回れば、ステップSP104にて新たに追加した監視項目である、トラフィック量とCPU使用率を監視ポリシーから削除する。
このように、従来のネットワーク監視装置では、ネットワークの状態に応じて動的に監視項目を変更できる。
しかしながら、従来のネットワーク監視装置は、障害を検知してから監視項目の追加を行うので、被監視対象装置3の障害が起きた時点での状況(いいかえればリアルタイムの状況)およびそれ以前の状況が分からないという問題点があった。そうすると、障害解析に必要な情報が抜けてしまい、適切な解析および監視項目の設定が行えないという問題点があった。
図8は従来のネットワーク監視装置の問題点の説明図であり、図8において、たとえば、以下のように状態推移していた場合であると障害の原因(輻輳発生)が特定できないという問題点があった。
時刻A) ネットワーク2上で輻輳が発生
時刻B) ネットワーク監視装置1がWebサーバである被監視対象装置3にHTTPリクエスト送信し、被監視対象装置3を監視
時刻B) ネットワーク監視装置1がHTTPレスポンスを受信しレスポンスタイムを取得。また監視手段12AはHTTPレスポンスタイムが閾値を超えたものと判断し障害を検知。
時刻D) ネットワーク2上に発生していた輻輳が一時的に解消
時刻E) 監視設定管理手段12Cは、監視ポリシーにトラフィック量とCPU使用率を監視項目として追加
時刻F) 監視手段12Aは、追加された監視項目についてもモニタリングを開始
時刻G) 監視手段12Aによりモニタリングされたトラフィック量は、輻輳が一時的に解消されているので、自動的に新たに追加された監視項目は削除される。
このように、監視手段12Aが障害を検知した後で一時的にネットワーク2上での輻輳が解消すると、問題無い監視データを取得することになるので、HTTPレスポンスタイムが閾値を超えた原因が特定できないという問題点があった。
そうすると、従来のネットワーク監視装置では、図8(B)のように、ネットワーク2上で短期間に繰り返し生じる輻輳(バースト的に発生する輻輳)についても、監視手段12Aが障害を検知した後で一時的にネットワーク2上での輻輳が解消するとあたかも問題無い監視データを取得することになり(これを繰り返すことになってしまい)障害の原因が特定できないという問題点があった。
本発明は上述の問題点を解決するものであり、その目的は、障害解析に必要な監視データを適切に把握できるネットワーク監視装置を実現することにある。
このような課題を達成するために、本発明のうち請求項1記載の発明は、
ネットワークを介し被監視対象装置と接続され、監視ポリシーを設定する監視設定手段と、前記監視ポリシーに基づき前記ネットワークまたは前記被監視対象装置の状態を示す監視データを取得する監視手段とを有するネットワーク監視装置において、
前記監視手段により得られた過去および/または現在の監視データに基づき、前記ネットワークまたは前記被監視対象装置の将来の状態を示す予測監視データを予測・算出する監視予測手段と、
前記監視予測手段により算出された前記予測監視データに基づき前記監視ポリシーを変更する監視設定管理手段と、
を具備することを特徴とするネットワーク監視装置である。
請求項2記載の発明は、請求項1記載のネットワーク監視装置において
前記監視予測手段は、
任意の予測モデルに基づき前記予測監視データを算出し、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする。
請求項3記載の発明は、請求項2記載のネットワーク監視装置において
前記監視設定管理手段は、
前記監視予測手段により算出された前記予測監視データに基づいて、前記ネットワークまたは前記被監視対象装置に将来障害が検出されるものと予測される場合は、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする。
請求項4記載の発明は、請求項1〜請求項3いずれかに記載のネットワーク監視装置において、
前記監視設定管理手段は、
前前記監視予測手段により算出された前記予測監視データに基づいて、前記ネットワークまたは前記被監視対象装置のサービスレベルが将来低下するものと予測される場合は、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする。
請求項5記載の発明は、請求項1〜請求項4いずれかに記載のネットワーク監視装置において、
前記監視予測手段は、
前記監視データに基づいてあらかじめ記憶されている複数の予測モデルを用いて同時に計算し、予測精度が最も高い予測モデルを選択して予測監視データを予測・算出することを特徴とする。
このように、本発明に係るネットワーク監視装置は、本発明に係るネットワーク監視装置は、監視手段が監視設定手段によって設定された監視ポリシーに基づき、ネットワークまたは被監視対象装置の状態を示す監視データを取得し、監視予測手段が得られた過去および現在の監視データから予測監視データを算出・予測し、監視設定管理手段がこの予測データに基づき監視ポリシーを変更することにより、ネットワークの状態を予測しこの予測された状態に応じて動的に監視項目を変更でき、障害解析に必要な監視データを適切に把握できる。
図1は本発明に係るネットワーク監視装置の一実施例を示す構成図であり、図6などと共通する部分には同一の符号を付けて適宜説明を省略する。図1と図6との相違点は、図1では監視手段12Aにより監視された過去の監視データおよび現在の監視データに基づき将来の監視データを予測する監視予測手段12Dを有する点、監視設定管理手段12Cが監視予測手段12Dで予測された将来の監視データに基づき将来検知されうる障害に応じた監視ポリシーの監視項目を設定する点などである。
図1において、ネットワーク監視装置1は、イーサネット(登録商標)などの有線ネットワークであるネットワーク2を介してたとえばWebサーバなどを提供するサーバまたはネットワーク機器等である被監視対象装置3と接続されている。また特に図示していないが、ネットワーク2と、被監視対象装置3と、図示しないその他のネットワーク機器・各種端末装置とは、ネットワークシステムを構成する。
ネットワーク監視装置1は、ネットワーク2を介して被監視対象装置3とデータ通信を行う通信手段11、各部・各手段の動作を制御する演算制御部12、記憶手段13などから構成され、ネットワーク2およびネットワークシステム全体の動作を監視する。演算制御部12は、監視手段12Aと、監視設定手段12Bと、監視設定管理手段12C、監視予測手段12Dとを有する。
監視手段12Aは、あらかじめ設定されている監視ポリシーに基づいて通信手段11を制御してネットワーク2を介して被監視対象装置3から監視データを収集し、被監視対象装置3、ネットワーク2およびネットワークシステムの挙動を監視・モニタリングする。
また監視手段12Aは、これらのデータに基づいてネットワーク2およびネットワークシステム全体の性能を示す性能評価値の基となる性能基礎データを算出し記憶手段13に記憶してネットワーク2およびネットワークシステムの挙動を監視・モニタリングするものでもよい。
監視設定手段12Bは、記憶手段13に記憶されている監視ポリシーを設定する。監視設定管理手段12Cは、監視手段12Aにより得られた監視結果に基づき最適な監視内容を導き出して記憶手段13に記憶されている監視ポリシーの再設定・変更を実行し、また監視予測手段12Dで予測された将来の監視データに基づき将来検知されうる障害に応じた監視ポリシーの監視項目を設定する。
たとえば、監視設定管理手段12Cは、監視予測手段12Dによりネットワーク2または被監視対象装置3のサービスレベルが低下するものと予測される場合は、監視ポリシー13Aで設定されている監視内容を変更して監視の頻度の増大、および監視対象と監視項目とを拡大するものでもよい。
監視予測手段12Dは、記憶手段13に記憶されている監視手段12Aが監視した過去の監視データおよび現在の監視データに基づき将来のネットワークまたは被監視対象装置3の状態を予測する、つまり将来得られる監視データ(以下予測監視データという)を予測する。
記憶手段13は、監視対象・その監視対象に関する監視項目・監視する所定のインターバルなどが関連づけて格納されている監視ポリシー13Aと、監視手段12Aにより収集・算出された、たとえばレスポンスタイム、トラフィック量、エラーパケット数などの監視データと測定時の年月日などが関連づけて格納されている監視データDB13Bと、を有する。
図2は本発明のネットワーク監視装置の動作を説明するフロー図である。ステップSP201において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、監視設定手段12Aにより設定された監視ポリシーに基づき被監視対象装置3の挙動を監視し、監視データを収集し得られたデータを記憶手段13に記憶する。
具体的には、監視手段12Aは監視ポリシーに基づき、図示しないWEBクライアント(またはネットワーク監視装置1)からのリクエストに応じてWEBサーバ(被監視対象装置3)が対応する処理を実行し、WEBクライアントが処理結果を受信するまでの時間(以下、レスポンスタイムという)を、当該WEBサーバにインストールされたソフトウエアなどを利用して10分間隔で測定し、得られたレスポンスタイムを記憶手段13に記憶する。
ステップSP202において、ネットワーク監視装置1の演算制御部12の監視予測手段12Dは、記憶手段13に格納されている監視手段12Aにより収集・監視した過去の監視データおよび現在の監視データに基づき将来の監視データ(以下、予測監視データという)を予測・算出する。(具体的な動作の一例については図3にて後述する。)
ステップSP203において、ネットワーク監視装置1の演算制御部12の監視予測手段12Dは、予測監視データに基づいて、ネットワーク2、被監視対象装置3、ネットワークシステムで将来障害が検知されるか否か判定する。障害が検知されればステップSP204に移行し、それ以外の場合はステップSP201に移行する。
たとえば監視予測手段12Dは、予測監視データに基づいて、予測監視データの一例である、レスポンスタイムが3時間後にあらかじめ記憶手段13に設定記憶されている閾値(例えば50ミリ秒など)を超えた場合には障害が検知されたものとして判定する。
ステップSP204において、ネットワーク監視装置1の演算制御部12の監視設定管理手段12Cは、将来障害が検知されうる予測監視データに基づき、新たに監視すべき監視項目を抽出し記憶手段13に記憶されている監視ポリシーに追加する。または監視ポリシーを変更するものでもよい。
具体的には、監視設定管理手段12Cは、図示しないクライアント(またはネットワーク監視装置1)から被監視対象装置3までのネットワーク経路のトラフィック量と被監視対象装置3のCPU使用率を監視項目として自動的に追加する。レスポンスタイムはデータ転送時間(リクエストにかかる時間+レスポンスにかかる時間)とWebサーバでの処理時間の和であるため、レスポンスタイムはトラフィック量とCPU使用率の影響を受けるためである。
なお、監視設定管理手段12Cは、監視予測手段12Dが将来ネットワークまたは前記被監視対象装置のサービスレベルが低下するものと予測する場合は、監視ポリシーを変更して監視の頻度を増大させ、監視対象および監視項目を拡大する。
また、監視設定管理手段12Cは、将来障害が検知されうる予測監視データおよび記憶手段13の監視ポリシー13Aに基づき、新たに監視すべき監視項目を抽出するものでもよい。
たとえば、あらかじめ監視ポリシー13Aには、ポリシーのひとつとしてレスポンスタイムの詳細な監視にはトラフィック量・CPU使用率などの監視項目を監視すべき旨が記憶されており、監視設定管理手段12Cは、レスポンスタイムに基づき障害検知がなされた場合は、監視ポリシー13Aに基づいて新たに監視すべき監視項目トラフィック量・CPU使用率を抽出するものでもよい。
ステップSP205において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、監視ポリシーに基づき、レスポンスタイムに加え、トラフィック量と被監視対象装置3のCPU使用率のモニタリングを開始し、得られた監視データを記憶手段13に記憶する。
ステップSP206において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、収集した監視データに基づいて、ネットワーク2、被監視対象装置3、ネットワークシステムで障害が検知されたか否か判定する。障害が検知されればステップSP207に移行し、それ以外の場合はステップSP209に移行する。
ステップSP207において、ネットワーク監視装置1の監視手段12Aは、通信手段11を制御しネットワーク2を介して接続されている特に図示していないユーザのネットワーク管理用の端末に、ネットワークシステムなどで障害が検知された旨を知らせるメッセージ(メールなど)を送信する。または、ネットワーク監視装置1の演算制御手段12は、ネットワーク監視装置1に備えられている表示手段(図示せず)に障害が検知された旨を表示する。
ここで、この通知/表示により、ネットワーク管理者が新たに追加された監視項目であるトラフィック量の監視データに基づき検討して、あるネットワーク経路上での輻輳を見つけ出し、それを解決する。
ステップSP208において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、収集した監視データに基づいて、ネットワーク2、被監視対象装置3、ネットワークシステムで障害が検知されたか否か判定する。障害が検知されればステップSP207に移行し、それ以外の場合はステップSP209に移行する。
ステップSP209において、ネットワーク監視装置1の演算制御部12の監視設定管理手段12Cは、被監視対象装置3における障害がなくなったものと判断し、ステップSP204にて新たに追加した監視項目を削除する。
具体的には、ネットワーク監視装置1の演算制御部12の監視設定管理手段12Cは、レスポンスタイム(たとえば4秒など)が閾値(たとえば50ミリ秒など)を下回れば、ステップSP204にて新たに追加した監視項目である、トラフィック量とCPU使用率を監視ポリシーから削除する。
この結果、本発明に係るネットワーク監視装置は、監視手段が監視設定手段によって設定された監視ポリシーに基づき、ネットワークまたは被監視対象装置の状態を示す監視データを取得し、監視予測手段が得られた過去および現在の監視データから予測監視データを算出・予測し、監視設定管理手段がこの予測データに基づき監視ポリシーを変更することにより、ネットワークの状態を予測しこの予測された状態に応じて動的に監視項目を変更でき、障害解析に必要な監視データを適切に把握できる。
なお、本発明に係るネットワーク監視装置は、監視予測手段12Dが予測した監視データにより問題発生が予測されうる場合は、その旨およびその監視データをネットワーク管理者に通知する予測監視データ通知手段を有するものであってもよい。この場合、予測監視データ通知手段は、通信手段12を制御してネットワーク2を介し接続されている特に図示していないユーザのネットワーク管理用の端末に、ネットワークシステムなどで障害が検知された旨を知らせるメッセージ(メールなど)を送信する。
このため、監視データにより問題発生が予測されうる場合に、監視データを障害発生前に事前にネットワーク管理者に通知することにより、障害の予知保全が可能となる。また、このような本発明による問題が生じうる予測監視データによる予知保全は、障害自体の予測に加えてさらにその障害解析に必要な情報を必要なタイミングで自動的に(効率良く)取得してできる点で、単なる未来予測による通常の予知保全よりも障害解析、障害の予防に有効である。これにより、障害が予知されてから実際に対応するまでの時間を短縮できる。
ここで、本発明に係るネットワーク監視装置は、監視予測手段12Dが過去の監視データおよび現在の監視データに基づき予測監視データを予測する一例について説明する。図3は本発明のネットワーク性能監視装置の動作を説明するフロー図である。
図3において、ステップSP301において、ネットワーク性能監視装置1の演算制御部12の監視手段12Aは、ネットワーク機器3の監視データ(たとえばレスポンスタイム)を収集する。
ステップSP302において、ネットワーク性能監視装置1の監視手段12Aは、監視データ(たとえばレスポンスタイム)とその測定を行った年月日などを関連づけて記憶手段13の蓄積情報DB13Bに蓄積・記憶する。
ステップSP303において、ネットワーク性能監視装置の監視予測手段12Cは、蓄積情報DB13Aに蓄積・記憶された複数の監視データ(たとえばレスポンスタイム)に基づいて、記憶手段13に格納されている特に図示しない予測モデルDBに格納されている複数の予測モデルを用いて将来の応答時間を予測する。
たとえば、監視予測手段12Cは、蓄積情報DB13Bに記憶されているレスポンスタイムに基づいて1ヶ月の平均レスポンスタイムを算出し、次月度の平均レスポンスタイムを算出(予測)する。図4は、過去の月間レスポンスタイムを示す説明図である。図5は各予測モデルによる予測監視データ(レスポンスタイム)を示す説明図であり、(A)は線形近似を用いたモデルによる予測結果、(B)は対数近似を用いたモデルによる予測結果、(C)は多項式近似を用いたモデルによる予測結果、(D)は累乗近似を用いたモデルによる予測結果、(E)は指数近似を用いたモデルによる予測結果である。
監視予測手段12Dは、図8のように過去7ヶ月分の月間平均レスポンスタイム(1月:14ミリ秒、2月:18ミリ秒、3月:24ミリ秒・・・)を算出して記憶手段13に記憶し、図5のように各予測モデルを用いて次月度(8月度)のレスポンスタイムを予測して(たとえば(A)線形近似:34ミリ秒、(B)対数近似:30.6ミリ秒、(C)多項式近似:31.7ミリ秒、(D)累乗近似:31.9ミリ秒、(E)指数近似:36.8ミリ秒)記憶手段13に記憶する。
ステップSP304において、監視予測手段12Dは、各モデルを用いて算出された予測結果の各予測精度を比較する。
具体的には、監視予測手段12Dは、各予測モデルにおけるR−2乗値を算出し、このR−2乗値を用いて予測精度を比較する。このR−2乗値は、値が1に近づくほど信頼性が高くなることを示す。
ステップSP305において、監視予測手段12Dは、予測精度を比較した結果、最も予測精度の高かった予測モデルを選択し、これより以降、応答時間の予測データを算出するための予測モデルとして設定・記憶する。たとえば図8の例では、R−2乗値が最も高い累乗近似を用いた予測モデルを選択する。
ステップSP306において、監視予測手段12Dは、ステップSP305で選択された予測モデルを用いてレスポンスタイムの予測データを算出し、記憶手段13に記憶する。また図示しない表示部などに表示する。
具体的には、監視予測手段12Dは、累乗近似を用いた予測モデルを用いて月間レスポンスタイムの予測値(31.9ミリ秒)を算出し、記憶手段13に記憶する。
このように本発明のネットワーク性能監視装置は、ネットワークシステムの将来の監視データを予測することができる。
また、上述の実施例のネットワーク性能監視装置では、被監視対象装置3(Webサーバ)が提供するWebサイトのリソースの取得にかかるレスポンスタイムに基づきネットワークの性能を把握すると説明しているが、特にこれに限定するものではなく、ICMPパケットを用いて応答時間を測定しネットワークの性能を把握するものであってもよい。
また、本発明のネットワーク監視装置の演算制御部12は、記憶部13に格納されているOSなどを起動して、このOS上で格納されたプログラムを読み出して実行することによりネットワーク監視装置1全体(たとえば、演算制御部12はプログラムを読み出し実行することにより監視手段12A、監視設定手段12B、監視設定管理手段12C、監視予測手段12Dなどの各手段)を制御し、ネットワーク監視装置固有の動作を行うものでもよい。
このとき記憶手段13は、演算制御手段12によって実行されるプログラムやアプリケーションをプログラム格納エリアに展開し、入力されたデータや、プログラムやアプリケーションの実行時に生じる処理結果などのデータをワークエリアに一時的に記憶する。
以上説明したように、本発明では、ネットワーク監視装置が、ネットワークの状態を予測しこの予測された状態に応じて動的に監視項目を変更でき、障害解析に必要な監視データを適切に把握できるので、ネットワークの障害をより精度高く解析でき、解析結果に基づいて最適に通信資源を制御してネットワークシステム全体の障害の除去および適切な運転に貢献することができる。
本発明に係るネットワーク監視装置の一実施例を示す構成図である。 本発明のネットワーク監視装置1の動作を説明するフロー図である。 本発明のネットワーク性能監視装置1の動作を説明するフロー図である。 過去の月間レスポンスタイムを示す説明図である。 各予測モデルによる予測監視データ(レスポンスタイム)を示す説明図である。 従来のネットワーク監視装置の構成例を示す構成図である。 従来のネットワーク監視装置の動作を説明するフロー図である。 従来のネットワーク監視装置の問題点の説明である。
符号の説明
1 ネットワーク監視装置
11 通信手段
12 演算制御部
12A 監視手段
12B 監視設定手段
12C 監視変更手段
12D 監視予測手段
13 記憶手段
13A 監視ポリシー
13B 監視データDB
2 ネットワーク
3 ネットワーク機器

Claims (5)

  1. ネットワークを介し被監視対象装置と接続され、監視ポリシーを設定する監視設定手段と、前記監視ポリシーに基づき前記ネットワークまたは前記被監視対象装置の状態を示す監視データを取得する監視手段とを有するネットワーク監視装置において、
    前記監視手段により得られた過去および/または現在の監視データに基づき、前記ネットワークまたは前記被監視対象装置の将来の状態を示す予測監視データを予測・算出する監視予測手段と、
    前記監視予測手段により算出された前記予測監視データに基づき前記監視ポリシーを変更する監視設定管理手段と、
    を具備することを特徴とするネットワーク監視装置。
  2. 前記監視予測手段は、
    任意の予測モデルに基づき前記予測監視データを算出し、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする
    請求項1記載のネットワーク監視装置。
  3. 前記監視設定管理手段は、
    前記監視予測手段により算出された前記予測監視データに基づいて、前記ネットワークまたは前記被監視対象装置に将来障害が検出されるものと予測される場合は、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする
    請求項1または請求項2記載のネットワーク監視装置。
  4. 前記監視設定管理手段は、
    前前記監視予測手段により算出された前記予測監視データに基づいて、前記ネットワークまたは前記被監視対象装置のサービスレベルが将来低下するものと予測される場合は、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする
    請求項1〜請求項3いずれかに記載のネットワーク監視装置。
  5. 前記監視予測手段は、
    前記監視データに基づいてあらかじめ記憶されている複数の予測モデルを用いて同時に計算し、予測精度が最も高い予測モデルを選択して予測監視データを予測・算出することを特徴とする
    請求項1〜請求項4いずれかに記載のネットワーク監視装置。
JP2008316681A 2008-12-12 2008-12-12 ネットワーク監視装置 Pending JP2010141655A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008316681A JP2010141655A (ja) 2008-12-12 2008-12-12 ネットワーク監視装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008316681A JP2010141655A (ja) 2008-12-12 2008-12-12 ネットワーク監視装置

Publications (1)

Publication Number Publication Date
JP2010141655A true JP2010141655A (ja) 2010-06-24

Family

ID=42351379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008316681A Pending JP2010141655A (ja) 2008-12-12 2008-12-12 ネットワーク監視装置

Country Status (1)

Country Link
JP (1) JP2010141655A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014507898A (ja) * 2011-01-31 2014-03-27 トムソン ライセンシング 診断情報のロギング
JP2016525828A (ja) * 2013-08-13 2016-08-25 エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. ソフトウェア定義による(software−defined)透過的なネットワーク管理
KR101782390B1 (ko) * 2011-06-30 2017-10-23 에스케이텔레콤 주식회사 네트워크 정보 수집 시스템 및 그 방법
JP2018018251A (ja) * 2016-07-27 2018-02-01 ファナック株式会社 数値制御装置
US20180091541A1 (en) * 2016-09-28 2018-03-29 International Business Machines Corporation Providing efficient information tracking with dynamically selected precision
US9948532B2 (en) 2013-12-11 2018-04-17 Mitsubishi Electric Corporation Information processing apparatus, information processing method, and computer readable medium
KR20180130295A (ko) * 2017-05-29 2018-12-07 주식회사 케이티 통신망의 장애를 예측하는 장치 및 방법
JP2019004249A (ja) * 2017-06-13 2019-01-10 日本電信電話株式会社 ブラックリスト設定装置、ブラックリスト設定方法およびブラックリスト設定プログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014507898A (ja) * 2011-01-31 2014-03-27 トムソン ライセンシング 診断情報のロギング
US10425277B2 (en) 2011-01-31 2019-09-24 Thomson Licensing Diagnostic information logging
KR101782390B1 (ko) * 2011-06-30 2017-10-23 에스케이텔레콤 주식회사 네트워크 정보 수집 시스템 및 그 방법
JP2016525828A (ja) * 2013-08-13 2016-08-25 エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. ソフトウェア定義による(software−defined)透過的なネットワーク管理
US9948532B2 (en) 2013-12-11 2018-04-17 Mitsubishi Electric Corporation Information processing apparatus, information processing method, and computer readable medium
JP2018018251A (ja) * 2016-07-27 2018-02-01 ファナック株式会社 数値制御装置
US20180091541A1 (en) * 2016-09-28 2018-03-29 International Business Machines Corporation Providing efficient information tracking with dynamically selected precision
US10701099B2 (en) * 2016-09-28 2020-06-30 International Business Machines Corporation Providing efficient information tracking with dynamically selected precision
KR20180130295A (ko) * 2017-05-29 2018-12-07 주식회사 케이티 통신망의 장애를 예측하는 장치 및 방법
KR102291615B1 (ko) * 2017-05-29 2021-08-18 주식회사 케이티 통신망의 장애를 예측하는 장치 및 방법
JP2019004249A (ja) * 2017-06-13 2019-01-10 日本電信電話株式会社 ブラックリスト設定装置、ブラックリスト設定方法およびブラックリスト設定プログラム

Similar Documents

Publication Publication Date Title
JP2010141655A (ja) ネットワーク監視装置
JP5418250B2 (ja) 異常検出装置、プログラム、及び異常検出方法
JP5767617B2 (ja) ネットワーク障害検出システムおよびネットワーク障害検出装置
EP2815538B1 (en) Method and apparatus for rapid disaster recovery preparation in a cloud network
US8161058B2 (en) Performance degradation root cause prediction in a distributed computing system
US9781040B2 (en) Congestion detection based on resource utilization information and user quality-of-experience indicators
KR20160042616A (ko) 시계열 데이터의 분석을 통한 이상 감지 및 예측 시스템 및 방법
JP2010231368A (ja) 監視方法及び監視プログラム
US11582154B2 (en) Method, apparatus, and system for adjusting routing of network traffic or utilization of network nodes
CN106487612A (zh) 一种服务器节点监控方法、监控服务器及系统
JP2004145536A (ja) 管理システム
JP4901796B2 (ja) ログレベル収集装置およびログレベル収集方法
JP5874234B2 (ja) 機器管理装置、機器管理方法および機器管理プログラム
JP6454133B2 (ja) 品質分析方法、品質分析装置、及びネットワークシステム
JP2009193238A (ja) システム負荷監視方法
JP2014112779A (ja) データ送信制御装置、データ送信制御方法、および、コンピュータ・プログラム
JP6792532B2 (ja) 異常検知装置および異常検知方法
JP6973405B2 (ja) 計測制御サーバ、通信品質計測システム、計測エージェント、方法およびプログラム
JP2010068367A (ja) ネットワーク性能監視装置
JP5677524B2 (ja) 通信制御装置、通信制御システム及び通信制御方法
JP2014010538A (ja) 運用管理装置、運用管理システム及び運用管理方法
JP2005236813A (ja) ネットワーク装置の制御装置及び通信システム並びに異常検出方法
JP2011114822A (ja) ネットワーク管理装置およびネットワーク管理方法
JP2008171104A (ja) 業務サービスとシステム性能を監視対象とする監視装置、監視システム、監視方法および監視プログラム
WO2019159966A1 (ja) 監視装置および監視方法