JP7720005B2 - 異常箇所推定装置、異常箇所推定方法、及びプログラム - Google Patents
異常箇所推定装置、異常箇所推定方法、及びプログラムInfo
- Publication number
- JP7720005B2 JP7720005B2 JP2024505678A JP2024505678A JP7720005B2 JP 7720005 B2 JP7720005 B2 JP 7720005B2 JP 2024505678 A JP2024505678 A JP 2024505678A JP 2024505678 A JP2024505678 A JP 2024505678A JP 7720005 B2 JP7720005 B2 JP 7720005B2
- Authority
- JP
- Japan
- Prior art keywords
- observation
- causal model
- anomaly
- anomaly location
- location estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集する観測データ収集部と、
各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する因果モデル推論部と
を備える異常箇所推定装置が提供される。
図1に、本実施の形態における異常箇所推定装置100の構成例を示す。図1に示すように、異常箇所推定装置100は、因果モデル構築エンジン110、因果モデル推論エンジン120、観測データ収集エンジン130、観測データDB140、及び出力インターフェース150を有する。
異常箇所推定装置100は、例えば、コンピュータにプログラムを実行させることにより実現できる。このコンピュータは、物理的なコンピュータであってもよいし、クラウド上の仮想マシンであってもよい。
以下では、異常箇所推定装置100の動作を、より具体的な例を用いて説明する。なお、本実施の形態では、ルータにより構成される通信ネットワークを示しているが、これは一例である。本発明は、通信ネットワークを構成するノードの種類に依らずに適用可能である。
図3に、観測データ収集エンジン130が観測データを収集する対象となる通信ネットワークの例を示す。図3に示すように、この通信ネットワークは、ルータ1~6が図示するとおりに接続されたネットワークである。例えば、ルータ1とルータ2は直接に接続されたおり、これらは互いに隣接関係にある。ルータ1とルータ4は直接には接続されておらず、これらは隣接関係にない。
本実施の形態では、IGPプロトコルより生成されるsyslogの中身を考慮して、因果モデルの観測ノードへの入力を定義することで、異常箇所の推定精度を向上させる。詳細は以下のとおりである。
syslogはiBGP/OSPFのバージョンや、iBGP/OSPFのsyslogを加工して生成されるアラームなどにより違いはあるものの、上記のように、タイムスタンプ、ホスト名、ホスト情報(IPアドレスなど)、疎通できなくなった対向ルータの情報(対向ルータのホスト名やIPアドレスなど)、などが記載されている。
因果モデルを用いた推論自体は従来技術(例えば非特許文献1)と同じであり、事前確率P(xi)と条件付き確率P(yj|xi)を規定し、推論を行う。以下、因果モデルを用いた推論処理の概要を説明する。
条件付き確率P(yj|X)の計算については、例えば、観測ノードyjに接続する全ての機器ノードの状態が正常であれば、観測ノードyjが0(正常)になる確率はほぼ1であり、観測ノードyjに接続する全ての機器ノードのうちの一部の機器ノードのみの状態が正常であれば、観測ノードyjが0(正常)になる確率は、全ての機器ノードのうちの正常な機器ノードの数に依存する値になる、といった計算ができる方法であればどのような方法で計算してもよい。
上記のように、あるルータiと疎通できないことを示す別のルータで発生したログにより、そのルータiの観測ノードの入力値(yiの値)を定めるので、i番目のルータが異常状態になり、リンクダウンに関するsyslogを生成できない場合においても、正常状態の対向ルータからの情報により異常箇所の推定が可能となり、異常箇所推定の精度向上が可能となる。
以上の実施形態に関し、更に以下の付記項を開示する。
(付記項1)
複数の機器を有する通信ネットワークにおける異常箇所を推定する異常箇所推定装置であって、
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、
前記プロセッサは、
第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集し、
各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する
異常箇所推定装置。
(付記項2)
前記プロセッサは、前記第1の機器に対応する観測ノードへの入力値として、異常を示す値を決定する
付記項1に記載の異常箇所推定装置。
(付記項3)
複数の機器を有する通信ネットワークにおける異常箇所を推定する異常箇所推定装置として使用されるコンピュータが実行する異常箇所推定方法であって、
第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集し、
各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する
異常箇所推定方法。
(付記項4)
コンピュータに、付記項1又は2に記載の異常箇所推定装置における各処理を実行させるプログラムを記憶した非一時的記憶媒体。
110 因果モデル構築エンジン
120 因果モデル推論エンジン
130 観測データ収集エンジン
140 観測データDB
150 出力インターフェース
1000 ドライブ装置
1001 記録媒体
1002 補助記憶装置
1003 メモリ装置
1004 CPU
1005 インターフェース装置
1006 表示装置
1007 入力装置
1008 出力装置
Claims (4)
- 複数の機器を有する通信ネットワークにおける異常箇所を推定する異常箇所推定装置であって、
第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集する観測データ収集部と、
各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する因果モデル推論部と
を備える異常箇所推定装置。 - 前記因果モデル推論部は、前記第1の機器に対応する観測ノードへの入力値として、異常を示す値を決定する
請求項1に記載の異常箇所推定装置。 - 複数の機器を有する通信ネットワークにおける異常箇所を推定する異常箇所推定装置として使用されるコンピュータが実行する異常箇所推定方法であって、
第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集し、
各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する
異常箇所推定方法。 - コンピュータを、請求項1又は2に記載の異常箇所推定装置における各部として機能させるためのプログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2022/009801 WO2023170760A1 (ja) | 2022-03-07 | 2022-03-07 | 異常箇所推定装置、異常箇所推定方法、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2023170760A1 JPWO2023170760A1 (ja) | 2023-09-14 |
| JP7720005B2 true JP7720005B2 (ja) | 2025-08-07 |
Family
ID=87936237
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024505678A Active JP7720005B2 (ja) | 2022-03-07 | 2022-03-07 | 異常箇所推定装置、異常箇所推定方法、及びプログラム |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7720005B2 (ja) |
| WO (1) | WO2023170760A1 (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101350739A (zh) | 2008-09-05 | 2009-01-21 | 北京邮电大学 | 一种ip网络中的故障定位方法 |
| JP2018124829A (ja) | 2017-02-01 | 2018-08-09 | 日本電信電話株式会社 | 状態判定装置、状態判定方法及びプログラム |
| WO2019104196A1 (en) | 2017-11-27 | 2019-05-31 | Google Llc | Real-time probabilistic root cause correlation of network failures |
-
2022
- 2022-03-07 JP JP2024505678A patent/JP7720005B2/ja active Active
- 2022-03-07 WO PCT/JP2022/009801 patent/WO2023170760A1/ja not_active Ceased
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101350739A (zh) | 2008-09-05 | 2009-01-21 | 北京邮电大学 | 一种ip网络中的故障定位方法 |
| JP2018124829A (ja) | 2017-02-01 | 2018-08-09 | 日本電信電話株式会社 | 状態判定装置、状態判定方法及びプログラム |
| WO2019104196A1 (en) | 2017-11-27 | 2019-05-31 | Google Llc | Real-time probabilistic root cause correlation of network failures |
Non-Patent Citations (1)
| Title |
|---|
| 渡辺 修 OSAMU WATANABE,多様な仮想網が構築されるMPLS障害に適した分散協調障害処理技術 Distributed and Co-operated Fault,情報処理学会論文誌 論文誌ジャーナル Vol.52 No.3 [CD-ROM] IPSJ Journal,日本,一般社団法人情報処理学会,2011年03月15日,P.1280-1290 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2023170760A1 (ja) | 2023-09-14 |
| WO2023170760A1 (ja) | 2023-09-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8583779B2 (en) | Root cause analysis approach with candidate elimination using network virtualization | |
| US9025434B2 (en) | Automated datacenter network failure mitigation | |
| US10728085B1 (en) | Model-based network management | |
| US8156378B1 (en) | System and method for determination of the root cause of an overall failure of a business application service | |
| CN104796273B (zh) | 一种网络故障根源诊断的方法和装置 | |
| CN113973042B (zh) | 用于网络问题的根本原因分析的方法和系统 | |
| JP7081741B2 (ja) | ネットワークデバイスの状態を判定するための方法及び装置 | |
| US8156319B2 (en) | Self-restarting network devices | |
| US10489232B1 (en) | Data center diagnostic information | |
| CN107210927A (zh) | 协议处理中的异常检测 | |
| JP2021010105A (ja) | 故障影響推定装置、故障影響推定方法、及びプログラム | |
| US20070174449A1 (en) | Method and system for identifying potential adverse network conditions | |
| Kobayashi et al. | Mining causes of network events in log data with causal inference | |
| Claise et al. | Service assurance for intent-based networking architecture | |
| JP7720005B2 (ja) | 異常箇所推定装置、異常箇所推定方法、及びプログラム | |
| Matsuo et al. | Root-cause diagnosis for rare failures using bayesian network with dynamic modification | |
| JP2018124829A (ja) | 状態判定装置、状態判定方法及びプログラム | |
| JP6787873B2 (ja) | 異常種別判定装置、異常種別判定方法及びプログラム | |
| Bennacer et al. | Scalable and fast root cause analysis using inter cluster inference | |
| JP2017521802A (ja) | スーパーコンピュータ監視用の相関イベントのためのアーキテクチャ | |
| WO2024252479A1 (ja) | ログ処理装置、ログ処理方法、及びプログラム | |
| JP6775452B2 (ja) | 監視システム、プログラムおよび監視方法 | |
| WO2025041236A1 (ja) | ログ処理装置、ログ処理方法、及びプログラム | |
| JP7414136B2 (ja) | モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム | |
| Kostopoulos | Intelligent Fault Detection in Enterprise Networks Using Py-thon-based Automation and Predictive Analytics |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240621 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20240701 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250624 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250707 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7720005 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |