JP7720005B2 - 異常箇所推定装置、異常箇所推定方法、及びプログラム - Google Patents

異常箇所推定装置、異常箇所推定方法、及びプログラム

Info

Publication number
JP7720005B2
JP7720005B2 JP2024505678A JP2024505678A JP7720005B2 JP 7720005 B2 JP7720005 B2 JP 7720005B2 JP 2024505678 A JP2024505678 A JP 2024505678A JP 2024505678 A JP2024505678 A JP 2024505678A JP 7720005 B2 JP7720005 B2 JP 7720005B2
Authority
JP
Japan
Prior art keywords
observation
causal model
anomaly
anomaly location
location estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024505678A
Other languages
English (en)
Other versions
JPWO2023170760A1 (ja
Inventor
洋一 松尾
敬志郎 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2023170760A1 publication Critical patent/JPWO2023170760A1/ja
Application granted granted Critical
Publication of JP7720005B2 publication Critical patent/JP7720005B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、通信ネットワークから収集したログから、通信ネットワークの異常箇所を推定する技術に関連するものである。
通信事業者にとって、通信ネットワーク内に発生する異常に対して、異常の状態の把握や迅速な対応は重要である。こうした中で、通信ネットワーク内の異常を早期に検知するための研究や、異常箇所の推定を行う研究が行われている。
異常箇所を推定する手法として、ベイジアンネットワークを用いて、異常箇所とそれによって引き起こされる通信ネットワーク内のデータ(観測データと呼ぶ)の変化の関係性をモデル化(因果モデルと呼ぶ)し、異常時の観測データから異常箇所を推定する手法が提案されている(非特許文献1)。
通信ネットワークはiBGP(https://datatracker.ietf.org/doc/html/rfc4271)やOSPF(https://datatracker.ietf.org/doc/html/rfc5340)などの自律システム(AS)内のルーティングを行うInterior Gateway Protocol(IGP)の通信プロトコルによって運用されており、ルータ間で通信ができなくなると、対向ルータと通信できなくなったことを表すsyslogが生成されるため、エキスパートオペレーターは異常時にはルータから発生するリンクダウンに関するsyslogを用いて、ルータの正常・異常を判定することができる。
従来技術では、エキスパートオペレーターの知識から、ルータの異常は、異常状態になったルータの観測データと隣接しているルータの観測データのみに影響があるという仮定をもとに、通信ネットワーク内の機器に対して、各機器の状態を表す機器ノードと、その機器からリンクダウンに関するsyslogが発生したかどうかを表す観測ノードからなる因果モデルを構築し、異常箇所の判定を行っている。
Srikanth Kandula, Dina Katabi, and Jean-philippe Vasseur. Shrink: A tool for failure diagnosis in IP networks. Proceedings of the 2005 ACM SIGCOMM workshop on Mining network data, pages 173-178, 2005.
従来技術では、ルータの異常は、異常状態になったルータの観測データと隣接しているルータの観測データのみに影響があるという仮定をもとに因果モデルを作成していたが、通信ネットワークの異常においては、異常状態となったルータがリンクダウンを表すsyslogを生成できるとは限らない。
例えば、CPUチップの故障などでは、故障が発生したそのルータではプログラムを処理できなくなるため、syslogを生成できなくなる。そのため、従来技術では、因果モデルへの入力(観測データ)が、仮定に反する(隣接ルータからはリンクダウンに関するsyslogが発生するが、異常ルータからはsyslogが発生しない)ものとなる場合があり、結果として異常箇所の推定精度が下がるという課題がある。
本発明は上記の点に鑑みてなされたものであり、通信ネットワークから収集したログを利用して、通信ネットワークの異常箇所推定を行う技術において、異常箇所の推定精度を向上させることを目的とする。
開示の技術によれば、複数の機器を有する通信ネットワークにおける異常箇所を推定する異常箇所推定装置であって、
第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集する観測データ収集部と、
各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する因果モデル推論部と
を備える異常箇所推定装置が提供される。
開示の技術によれば、通信ネットワークから収集したログを利用して、通信ネットワークの異常箇所推定を行う技術において、異常箇所の推定精度を向上させることが可能となる。
異常箇所推定装置の構成図である。 装置のハードウェア構成例を示す図である。 通信ネットワークの構成例を示す図である。 因果モデルを示す図である。 因果モデルへの入力を示す図である。 因果モデルへの入力を示す図である。
以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
(装置構成例)
図1に、本実施の形態における異常箇所推定装置100の構成例を示す。図1に示すように、異常箇所推定装置100は、因果モデル構築エンジン110、因果モデル推論エンジン120、観測データ収集エンジン130、観測データDB140、及び出力インターフェース150を有する。
なお、因果モデル構築エンジン110、因果モデル推論エンジン120、観測データ収集エンジン130をそれぞれ、因果モデル構築部110、因果モデル推論部120、観測データ収集部130と呼んでもよい。また、因果モデル構築エンジン110、因果モデル推論エンジン120、観測データ収集エンジン130をそれぞれ、因果モデル構築回路110、因果モデル推論回路120、観測データ収集回路130と呼んでもよい。異常箇所推定装置100の動作概要は下記のとおりである。
観測データ収集エンジン130は、通信ネットワークムから観測データ(機器から発生するログ等)を収集し、リンクダウンに関するログの発生状況を観測データDB140へ格納する。以降、本実施の形態では、ログとしてsyslogを例に挙げて説明する。
因果モデル構築エンジン110は、エキスパートの知識等を入力とし、観測データ収集エンジン130から取得された通信ネットワークの情報に基づいて、因果モデルを構築する。因果モデル推論エンジン120は観測データDB140へ格納されたリンクダウンに関するsyslogの発生状況をもとに、観測ノードの値を決定し、異常箇所の推定を実施し、出力インターフェース150に推定結果である異常箇所を出力する。
出力インターフェース150は、利用者に対して通信ネットワークの中の異常発生箇所とその際の最大事後確率等を表示する。また、出力インターフェース150は、運用システムに新たにマシンが追加された際などは、因果グラフへのノードの追加を行なったり、また、それに伴う因果関係の変化を利用者に修正させることもできる。
(ハードウェア構成例)
異常箇所推定装置100は、例えば、コンピュータにプログラムを実行させることにより実現できる。このコンピュータは、物理的なコンピュータであってもよいし、クラウド上の仮想マシンであってもよい。
すなわち、異常箇所推定装置100は、コンピュータに内蔵されるCPUやメモリ等のハードウェア資源を用いて、異常箇所推定装置100で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。
図2は、上記コンピュータのハードウェア構成例を示す図である。図2のコンピュータは、それぞれバスBSで相互に接続されているドライブ装置1000、補助記憶装置1002、メモリ装置1003、CPU1004、インターフェース装置1005、表示装置1006、入力装置1007、出力装置1008等を有する。
当該コンピュータでの処理を実現するプログラムは、例えば、CD-ROM又はメモリカード等の記録媒体1001によって提供される。プログラムを記憶した記録媒体1001がドライブ装置1000にセットされると、プログラムが記録媒体1001からドライブ装置1000を介して補助記憶装置1002にインストールされる。但し、プログラムのインストールは必ずしも記録媒体1001より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置1002は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置1003は、プログラムの起動指示があった場合に、補助記憶装置1002からプログラムを読み出して格納する。CPU1004は、メモリ装置1003に格納されたプログラムに従って、異常箇所推定装置100に係る機能を実現する。インターフェース装置1005は、ネットワークに接続するためのインターフェースとして用いられる。表示装置1006はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置1007はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。出力装置1008は演算結果を出力する。
(動作例)
以下では、異常箇所推定装置100の動作を、より具体的な例を用いて説明する。なお、本実施の形態では、ルータにより構成される通信ネットワークを示しているが、これは一例である。本発明は、通信ネットワークを構成するノードの種類に依らずに適用可能である。
<因果モデルについて>
図3に、観測データ収集エンジン130が観測データを収集する対象となる通信ネットワークの例を示す。図3に示すように、この通信ネットワークは、ルータ1~6が図示するとおりに接続されたネットワークである。例えば、ルータ1とルータ2は直接に接続されたおり、これらは互いに隣接関係にある。ルータ1とルータ4は直接には接続されておらず、これらは隣接関係にない。
因果モデル構築エンジン110は、エキスパートオペレーターの知識等に基づいて、図3に示す通信ネットワークに対して、図4に示す因果モデルを構築する。因果モデルは、通信ネットワーク内の機器(ルータ)に対して、各機器の状態を表す機器ノードと、その機器からリンクダウンに関するsyslogが発生したかどうかを表す観測ノードからなる。つまり、観測ノードは、各機器の観測結果を表す。なお、因果モデルをベイジアンネットワークと呼んでもよい。
図3の通信ネットワークに対する因果モデルは、図4に示すとおりとなる。例えば、図4の因果モデルにおいて、機器ノードのルータ1は、観測ノードのルータ1、2と接続されている。これは、ルータ1に異常が発生した場合に、ルータ1の観測データとルータ2の観測データに影響する可能性があるということを示している。
また、例えば、図4の因果モデルにおいて、機器ノードのルータ2は、観測ノードのルータ1、2、3、6と接続されている。これは、ルータ2に異常が発生した場合に、ルータ1、2、3、6のそれぞれの観測データに影響する可能性があるということを示している。
<因果モデルへの入力について>
本実施の形態では、IGPプロトコルより生成されるsyslogの中身を考慮して、因果モデルの観測ノードへの入力を定義することで、異常箇所の推定精度を向上させる。詳細は以下のとおりである。
なお、本実施の形態では、IGPプロトコルのiBGPとOSPFを例にとって説明するが、他のプロトコルに対しても同様に実施可能である。また、本実施の形態では、iBGPとOSPFが生成するsyslogを例にとって説明するが、通信ネットワークの監視においては、生成されたsyslogを基にメッセージ等を正規化し新たなログとして生成しオペレーターへ通知する場合や、ping等のツールを用いて死活監視を実施し、その結果をアラームとしてオペレーターへ通知する場合もある。その場合のアラームにおいてもメッセージ内に対向ルータ(あるルータに隣接する他のルータ)の情報がある限り、本発明に係る技術を実施可能である。
まず、iBGPとOSPFのsyslogについて説明する。iBGPやOSPFでは通信ネットワークの異常により、あるルータから隣接ルータに疎通できない場合、syslogが生成される。syslogメッセージの一例を以下に示す。
2021-12-21 13:00:00 Router1 192.168.10.1 OSPF neighbor down (Router2 192.168.10.2)
syslogはiBGP/OSPFのバージョンや、iBGP/OSPFのsyslogを加工して生成されるアラームなどにより違いはあるものの、上記のように、タイムスタンプ、ホスト名、ホスト情報(IPアドレスなど)、疎通できなくなった対向ルータの情報(対向ルータのホスト名やIPアドレスなど)、などが記載されている。
本実施の形態では、対向ルータの情報をもとに観測ノードの値を定義することで、課題を解決する。
ここで、異常箇所推定の対象となるシステム(通信ネットワーク)の因果モデルにおける機器ノードをx、観測ノードをy、i∈(1,…N)とする。Nは機器数である。
各xは0(正常状態)か1(異常状態)の値を取るとする。なお、0か1の2値ではなく、3値以上の多値を取ることも可能であり、その場合は最小値が正常状態、最大値が異常状態、その間の値cは、「c/(最大値-最小値)」の割合で異常となっていることを意味する値、などのように定義する。
各yは0か1の値を取るとし、i番目のルータと疎通できなくなったことを表すBGP/OSPFのsyslogがi番目以外のルータで発生していた場合、yを1とし、そうでない場合を0とすることとする。なお、0か1の2値ではなく、3値以上の多値を取ることも可能であり、その場合はi番目のルータのリンクダウンに関するsyslogの他ノードでの発生件数を値とするなどのように定義する。
上記の因果モデルへの入力値については、因果モデル推論エンジン120が、観測データDB140から読み出したsyslogから決定(計算)する。あるいは、観測データ収集エンジン130が、収集したsyslogから入力値を決定し、それを観測データDB140に格納してもよい。この場合、因果モデル推論エンジン120は、観測データDB140から読み出した値をyの値としてそのまま使用できる。
因果モデルへの入力に関して、従来技術(非特許文献1)と本発明に係る技術との違いを図5、図6を用いて説明する。ここでは、ルータ1、3,6において、対向ルータ(ルータ2)と疎通できないことを示すsyslogが発生した場合の観測ノードへの入力を説明する。図5、図6の観測ノードにおいて、網掛けのされたノードが値1(異常状態)を示し、網掛けなしのノードが値0(正常状態)を示す。
図5は、従来技術での因果モデルへの入力を示している。図5に示すとおり、syslogを観測したルータ1、3、6の観測ノードとしての入力値が1となり、異常が発生した可能性が高いと考えられるルータ2の観測ノードとしての入力値が0となる。
図6は、本発明に係る技術での因果モデルへの入力を示している。図6に示すとおり、syslogを観測したルータ1、3、6の観測ノードとしての入力値が0となり、異常が発生した可能性が高いと考えられるルータ2の観測ノードとしての入力値が1となる。このように、実際に発生した可能性が高い事象に合った入力値を得ることができるので、推定精度を高めることができる。
<因果モデルを用いた推論>
因果モデルを用いた推論自体は従来技術(例えば非特許文献1)と同じであり、事前確率P(x)と条件付き確率P(y|x)を規定し、推論を行う。以下、因果モデルを用いた推論処理の概要を説明する。
図4に示した因果モデル(どのノード間をエッジで接続するかを示す情報)は、通信ネットワークから得られる情報に基づいて、因果モデル構築エンジン110が作成し、因果モデル推論エンジン120へ渡す。なお、因果モデル(どのノード間をエッジで接続するかを示す情報)を予め作成しておき、因果モデル推論エンジン120が備える記憶部(メモリ等)に格納しておくこととしてもよい。
事前確率P(x)は予め定めておき、例えば、因果モデル推論エンジン120が備える記憶部(メモリ等)に格納しておく。
ここで、X=(x,x,…,x),x∈{0,1}、Y=(y,y,…,y),y∈{0,1}とする。Xは機器ノード、すなわち推定対象であり、Yは観測ノード、すなわちログに基づき得られた観測結果の値である。
因果モデル推定エンジン120は、観測結果(因果モデルへの入力値Y)を用いて、下記の式で示されるX'を求める。下記の式のargmaxはXについてのargmaxであり、X'は事後確率P(X|Y)を最大にするXである。
X'=argmaxP(X|Y)=argmax(P(Y|X)P(X))
条件付き確率P(y|X)の計算については、例えば、観測ノードyに接続する全ての機器ノードの状態が正常であれば、観測ノードyが0(正常)になる確率はほぼ1であり、観測ノードyに接続する全ての機器ノードのうちの一部の機器ノードのみの状態が正常であれば、観測ノードyが0(正常)になる確率は、全ての機器ノードのうちの正常な機器ノードの数に依存する値になる、といった計算ができる方法であればどのような方法で計算してもよい。
因果モデル推定エンジン120により得られた推定結果に関して、出力インターフェース150は、値が1の機器を推定故障個所として出力してもよいし、値が1の機器と、当該機器に接続される対向機器との間のリンクを推定故障個所として出力してもよい。
(効果について)
上記のように、あるルータiと疎通できないことを示す別のルータで発生したログにより、そのルータiの観測ノードの入力値(yの値)を定めるので、i番目のルータが異常状態になり、リンクダウンに関するsyslogを生成できない場合においても、正常状態の対向ルータからの情報により異常箇所の推定が可能となり、異常箇所推定の精度向上が可能となる。
(付記)
以上の実施形態に関し、更に以下の付記項を開示する。
(付記項1)
複数の機器を有する通信ネットワークにおける異常箇所を推定する異常箇所推定装置であって、
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、
前記プロセッサは、
第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集し、
各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する
異常箇所推定装置。
(付記項2)
前記プロセッサは、前記第1の機器に対応する観測ノードへの入力値として、異常を示す値を決定する
付記項1に記載の異常箇所推定装置。
(付記項3)
複数の機器を有する通信ネットワークにおける異常箇所を推定する異常箇所推定装置として使用されるコンピュータが実行する異常箇所推定方法であって、
第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集し、
各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する
異常箇所推定方法。
(付記項4)
コンピュータに、付記項1又は2に記載の異常箇所推定装置における各処理を実行させるプログラムを記憶した非一時的記憶媒体。
以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
100 異常箇所推定装置
110 因果モデル構築エンジン
120 因果モデル推論エンジン
130 観測データ収集エンジン
140 観測データDB
150 出力インターフェース
1000 ドライブ装置
1001 記録媒体
1002 補助記憶装置
1003 メモリ装置
1004 CPU
1005 インターフェース装置
1006 表示装置
1007 入力装置
1008 出力装置

Claims (4)

  1. 複数の機器を有する通信ネットワークにおける異常箇所を推定する異常箇所推定装置であって、
    第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集する観測データ収集部と、
    各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する因果モデル推論部と
    を備える異常箇所推定装置。
  2. 前記因果モデル推論部は、前記第1の機器に対応する観測ノードへの入力値として、異常を示す値を決定する
    請求項1に記載の異常箇所推定装置。
  3. 複数の機器を有する通信ネットワークにおける異常箇所を推定する異常箇所推定装置として使用されるコンピュータが実行する異常箇所推定方法であって、
    第1の機器と通信できなくなったことを示す、第2の機器から発生したログを収集し、
    各機器の状態を表す機器ノードと、各機器の観測結果を表す観測ノードからなる因果モデルにおいて、前記ログに基づいて前記第1の機器に対応する観測ノードへの入力値を決定し、決定した入力値を適用した因果モデルから異常箇所を推定する
    異常箇所推定方法。
  4. コンピュータを、請求項1又は2に記載の異常箇所推定装置における各部として機能させるためのプログラム。
JP2024505678A 2022-03-07 2022-03-07 異常箇所推定装置、異常箇所推定方法、及びプログラム Active JP7720005B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/009801 WO2023170760A1 (ja) 2022-03-07 2022-03-07 異常箇所推定装置、異常箇所推定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2023170760A1 JPWO2023170760A1 (ja) 2023-09-14
JP7720005B2 true JP7720005B2 (ja) 2025-08-07

Family

ID=87936237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024505678A Active JP7720005B2 (ja) 2022-03-07 2022-03-07 異常箇所推定装置、異常箇所推定方法、及びプログラム

Country Status (2)

Country Link
JP (1) JP7720005B2 (ja)
WO (1) WO2023170760A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350739A (zh) 2008-09-05 2009-01-21 北京邮电大学 一种ip网络中的故障定位方法
JP2018124829A (ja) 2017-02-01 2018-08-09 日本電信電話株式会社 状態判定装置、状態判定方法及びプログラム
WO2019104196A1 (en) 2017-11-27 2019-05-31 Google Llc Real-time probabilistic root cause correlation of network failures

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350739A (zh) 2008-09-05 2009-01-21 北京邮电大学 一种ip网络中的故障定位方法
JP2018124829A (ja) 2017-02-01 2018-08-09 日本電信電話株式会社 状態判定装置、状態判定方法及びプログラム
WO2019104196A1 (en) 2017-11-27 2019-05-31 Google Llc Real-time probabilistic root cause correlation of network failures

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
渡辺 修 OSAMU WATANABE,多様な仮想網が構築されるMPLS障害に適した分散協調障害処理技術 Distributed and Co-operated Fault,情報処理学会論文誌 論文誌ジャーナル Vol.52 No.3 [CD-ROM] IPSJ Journal,日本,一般社団法人情報処理学会,2011年03月15日,P.1280-1290

Also Published As

Publication number Publication date
JPWO2023170760A1 (ja) 2023-09-14
WO2023170760A1 (ja) 2023-09-14

Similar Documents

Publication Publication Date Title
US8583779B2 (en) Root cause analysis approach with candidate elimination using network virtualization
US9025434B2 (en) Automated datacenter network failure mitigation
US10728085B1 (en) Model-based network management
US8156378B1 (en) System and method for determination of the root cause of an overall failure of a business application service
CN104796273B (zh) 一种网络故障根源诊断的方法和装置
CN113973042B (zh) 用于网络问题的根本原因分析的方法和系统
JP7081741B2 (ja) ネットワークデバイスの状態を判定するための方法及び装置
US8156319B2 (en) Self-restarting network devices
US10489232B1 (en) Data center diagnostic information
CN107210927A (zh) 协议处理中的异常检测
JP2021010105A (ja) 故障影響推定装置、故障影響推定方法、及びプログラム
US20070174449A1 (en) Method and system for identifying potential adverse network conditions
Kobayashi et al. Mining causes of network events in log data with causal inference
Claise et al. Service assurance for intent-based networking architecture
JP7720005B2 (ja) 異常箇所推定装置、異常箇所推定方法、及びプログラム
Matsuo et al. Root-cause diagnosis for rare failures using bayesian network with dynamic modification
JP2018124829A (ja) 状態判定装置、状態判定方法及びプログラム
JP6787873B2 (ja) 異常種別判定装置、異常種別判定方法及びプログラム
Bennacer et al. Scalable and fast root cause analysis using inter cluster inference
JP2017521802A (ja) スーパーコンピュータ監視用の相関イベントのためのアーキテクチャ
WO2024252479A1 (ja) ログ処理装置、ログ処理方法、及びプログラム
JP6775452B2 (ja) 監視システム、プログラムおよび監視方法
WO2025041236A1 (ja) ログ処理装置、ログ処理方法、及びプログラム
JP7414136B2 (ja) モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム
Kostopoulos Intelligent Fault Detection in Enterprise Networks Using Py-thon-based Automation and Predictive Analytics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240621

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20240701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250707

R150 Certificate of patent or registration of utility model

Ref document number: 7720005

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150