JP6481299B2 - 監視装置、サーバ、監視システム、監視方法および監視プログラム - Google Patents

監視装置、サーバ、監視システム、監視方法および監視プログラム Download PDF

Info

Publication number
JP6481299B2
JP6481299B2 JP2014185981A JP2014185981A JP6481299B2 JP 6481299 B2 JP6481299 B2 JP 6481299B2 JP 2014185981 A JP2014185981 A JP 2014185981A JP 2014185981 A JP2014185981 A JP 2014185981A JP 6481299 B2 JP6481299 B2 JP 6481299B2
Authority
JP
Japan
Prior art keywords
server
request
attention
unit
operation plan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014185981A
Other languages
English (en)
Other versions
JP2016058005A (ja
Inventor
好大 岡田
好大 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014185981A priority Critical patent/JP6481299B2/ja
Priority to US14/826,728 priority patent/US20160080267A1/en
Priority to CN201510582672.2A priority patent/CN105426284A/zh
Publication of JP2016058005A publication Critical patent/JP2016058005A/ja
Application granted granted Critical
Publication of JP6481299B2 publication Critical patent/JP6481299B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • H04L67/125Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/508Monitor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Cardiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、Webシステムにおいて、蓄積された情報に基づいてオートスケーリングを実施する技術に関する。
近年、クラウド・コンピューティング技術を用いたシステムモデルの構築が増えてきている。このようなシステムは、大多数のサーバマシンから構成され、また、それらのサーバを構成するアプリケーション層は、互いに同じ構成を取ることが多い。
昨今のWebシステムにおいては、Webアプリケーションサーバの負荷が高まると、関連するパラメータをチューニングしたり、あるいは、それを契機としてシステムのスケールアウトを実施したりすることが一般的である。
Webアプリケーションサーバの負荷が高まる要因は様々である。例えば、予め見積もったリクエスト量を超えたリクエストがWebアプリケーションサーバに同時に要求された場合、Webアプリケーションサーバの負荷が高まる。このような場合、チューニング不足が負荷の高まりの原因であるので、関連するパラメータをチューニングすることで対処できる。
しかしながら、ショッピングサイトや動画投稿サイト、オークションサイトなどのように、世間の注目度とコンテンツの関連性が深く、それに伴う負荷の増減が発生すると、その傾向を予測しない限り、負荷の増減に柔軟に対処することは困難である。
また、その予測には、専門的あるいは熟練した分析スキルに加え、多大な労力を要するので、その実現は現実的ではない。
このような予測が難しい負荷に対処する分散システムにおける一般的なアプローチとして、システムのスケールアウト/スケールインの手法がある。この手法では、Webアプリケーションサーバや、それが動作するマシンの負荷状況を測定し、予め定めた閾値を超えた負荷が検出された際に、監視システムが自動的にWebアプリケーションサーバの稼働数を増減させる。
しかしながら、上記手法では、最近の主流となりつつあるクラウドサービス型のシステムにおいては、運用面で以下の課題が生じる。すなわち、(1)閾値監視によるオートスケーリングの限界、(2)サーバマシンのウォームアップ期間の考慮不足、である。
以下、上記(1)および(2)について、具体的に説明する。(1)に関して、クラウドサービス型のシステムでは、大抵の場合、従量課金制を採用しているので、CPU(Central Processing Unit)やメモリなどマシンリソースの消費量に応じて費用が生じる。ここで、上述したような閾値監視によるスケールイン/スケールアウトを実施する場合、リクエスト量の増減が激しいシステムにおいては、サーバマシンの追加/削除が頻繁に実施されるので、マシンリソースの消費が激しくなる可能性が高い。よって、マシンリソースの消費量の増大に伴い、費用も増大してしまう。
(2)に関して、クラウドサービスでのスケールアウトにおけるサーバマシンの追加処理は、メジャーなサービスにおいても俊敏ではない場合が多い。すなわち、サーバマシンの追加処理は、サーバの起動処理に伴い一定のウォームアップ期間(システム構成に応じて数分〜数十分)を必要する。
この期間サーバマシンは本来の処理性能を発揮できないので、当該期間は、オートスケーリングに伴う判断ロス時間ともみなすことができる。そのため、サーバ負荷の検知を契機にオートスケーリングを実施していると、システムは、突発的な負荷の上昇に対処しきれないことになり得る。一方で、常に想定される最大のサーバマシン数でシステムを稼働し続けていると、余剰なシステムリソースに対する課金が発生してしまう。
これらの課題に対して、特許文献1は、過去に収集した負荷情報から複数のクラスタシステム間で負荷変動の類似度を導出し、収集した負荷情報からスケールアウトの必要性を判断する手法を開示する。
また、特許文献2は、アクセスログを読み込み、時刻や曜日などの統計的な手法で必要なサーバ台数を予測してサーバの運用計画を作成する手法を開示する。
特開2011−090594号公報 特開2005−141441号公報
上記特許文献1に開示される手法では、負荷変動が時刻と因果関係を持つ場合には有効であるが、Webコンテンツに含まれる人気商品に関するキーワードや、閲覧数が多い特定のストリーミング動画など、コンテンツと負荷変動との関係性は考慮されない。したがって、例えば世の中の流行や注目度を起因とする負荷変動には、本手法では柔軟に対処できないという課題がある。加えて、上述したサーバの起動処理に伴うウォームアップ期間も考慮されていない。
また、上記特許文献2に開示される手法も、上記と同様に、コンテンツと負荷変動との関係性や、サーバの起動処理に伴うウォームアップ期間は考慮されていない。
本願発明は、上記課題を鑑みてなされたものであり、コンテンツと負荷変動との関係性を考慮したサーバ負荷の制御を実施可能な監視装置等を提供することを主要な目的とする。
本発明の第1の監視装置は、クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信する1または複数のサーバを監視する監視装置であって、前記サーバから収集した、前記リクエストに関連するアクセス情報と前記リクエストを解析した結果であるリクエスト解析結果に基づいて、注目情報または時刻情報に応じたサーバ負荷の制御を実施する運用計画を作成する運用計画手段と、前記注目情報または前記時刻情報が、前記運用計画に含まれる実行条件を満たした場合、当該運用計画に基づいて前記サーバ負荷の制御を実施する制御手段とを備える。
本発明の第1のサーバは、クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信するサーバであって、前記リクエストを解析した結果であるリクエスト解析結果から注目情報を抽出し、前記リクエストに関連するアクセス情報に基づいて、前記注目情報に対する注目度を算出する統計手段と、ネットワークを介して自サーバを監視する監視装置に、前記統計手段が算出した前記注目情報に対する注目度を送信する送信手段とを備える。
本発明の第1の監視システムは、クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信する1または複数のサーバと、当該サーバを監視する監視装置とを備えた監視システムであって、前記サーバは、前記リクエストを解析した結果であるリクエスト解析結果から注目情報を抽出し、前記リクエストに関連するアクセス情報に基づいて、前記注目情報に対する注目度を算出する統計手段と、前記監視装置に、前記統計手段が算出した前記注目情報に対する注目度を送信する送信手段とを備え、前記監視装置は、前記サーバから収集した、前記アクセス情報と前記リクエスト解析結果に基づいて、注目情報または時刻情報に応じたサーバ負荷の制御を実施する運用計画を作成する運用計画手段と、前記注目情報または前記時刻情報が、前記運用計画に含まれる実行条件を満たした場合、当該運用計画に基づいて前記サーバ負荷の制御を実施する制御手段とを備える。
本発明の第1の監視方法は、クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信する1または複数のサーバを監視する監視方法であって、前記サーバから収集した、前記リクエストに関連するアクセス情報と前記リクエストを解析した結果であるリクエスト解析結果に基づいて、注目情報または時刻情報に応じたサーバ負荷の制御を実施する運用計画を作成し、前記注目情報または前記時刻情報が、前記運用計画に含まれる実行条件を満たした場合、当該運用計画に基づいて前記サーバ負荷の制御を実施する。
なお同目的は、上記の各構成を有する監視方法を、コンピュータによって実現するコンピュータ・プログラム、およびそのコンピュータ・プログラムが格納されている、コンピュータ読み取り可能な記憶媒体によっても達成される。
本願発明によれば、コンテンツと負荷変動との関係性を考慮したサーバ負荷の制御を実施できるという効果が得られる。
本発明の第1の実施形態に係る情報処理システムの構成を示す図である。 本発明の第1の実施形態に係る情報処理システムが備えるサーバマシンとシステム監視装置の詳細な構成を示すブロック図である。 本発明の第1の実施形態に係るサーバマシンのアプリケーションサーバにおけるリクエスト受信の動作を示すフローチャートである。 本発明の第1の実施形態に係るサーバマシンのアプリケーションサーバにおけるリクエストデータを解析する動作を示すフローチャートである。 本発明の第1の実施形態に係るシステム監視装置が運用条件を生成する動作を示すフローチャートである。 本発明の第1の実施形態に係るシステム監視装置が運用条件生成の際に相関関係を導出する動作を示すフローチャートである。 本発明の第1の実施形態に係るシステム監視装置が生成する運用条件の一例を示す図である。 本発明の第1の実施形態に係るアプリケーションサーバが生成する監視情報の一例を示す図である。 本発明の第1の実施形態に係るシステム監視装置によるスケーリングの要否を決定する動作を示すフローチャートである。 本発明の第1の実施形態に係るシステム監視装置によるスケーリングの要否を決定する動作を示すフローチャートである。 本発明の第2の実施形態に係る情報処理システムの構成を示す図である。 本発明の各実施形態に係る情報処理装置のハードウエア構成を例示する図である。
以下、本発明の実施形態について図面を参照して詳細に説明する。
第1の実施形態
図1は、本発明の第1の実施形態に係る情報処理システム100の構成を示す図である。図1に示すように、情報処理システム100は、サーバマシン200、システム監視装置300およびクライアント400を備える。
サーバマシン200は、業務用等のWebシステムを稼働し、ユーザが使用するクライアント400からのアクセスを受け付ける。Webシステムは、複数のサーバマシン200により構築される。サーバマシン200は、物理サーバであっても、仮想サーバであってもよい。
システム監視装置300は、複数のサーバマシン200を統合的に監視する。システム監視装置300は、インターネットに接続される。クライアント400は、Webシステムを利用するブラウザ等のクライアントアプリケーションを搭載する。
図2は、図1に示したサーバマシン200とシステム監視装置300の詳細な構成を示すブロック図である。図2では、Webシステムを構築する複数のサーバマシン200のうちの1つを示す。
図2に示すように、サーバマシン200は、Webシステムで動作する各種アプリケーションの実行基盤となるアプリケーションサーバ210を搭載する。
アプリケーションサーバ210は、リクエスト受付部211、アプリケーション実行制御部212、統計データ出力部213、操作命令受付部214、監視情報転送部215および解析データ転送部216を備える。
サーバマシン200は、また、記憶装置220を備える。
サーバマシン200を監視するシステム監視装置300は、図2に示すように、サーバマシン計測部310、事象予測部320、運用計画生成部330、運用実行制御部340、操作命令発行部350、解析データ収集部360および記憶装置370を備える。
次に、アプリケーションサーバ210の各構成要素の概略について説明する。
リクエスト受付部211は、クライアントアプリケーションを介して送られる、システム利用者からの要求(リクエスト)を受け付ける。アプリケーション実行制御部212は、リクエストに対応するアプリケーションロジックを実行する。統計データ出力部213は、アプリケーションサーバ210におけるリクエスト処理数などの実行情報をファイルに出力する。操作命令受付部214は、アプリケーションサーバ210に対する外部からの操作命令を受け付ける。
監視情報転送部215は、アプリケーションサーバ210内で監視中の情報を、外部からの操作命令の呼び出し結果に含める。解析データ転送部216は、アプリケーションサーバ210が出力したリクエストデータやアクセスログ、統計データなどを、外部からの操作命令の呼び出し結果に含める。
次に、アプリケーションサーバ210が備えるアプリケーション実行制御部212の構成について説明する。
アプリケーション実行制御部212は、リクエストデータ解析部231、リクエストデータ統計部232、アクセスログ出力部233および記憶部234を備える。
リクエストデータ解析部231は、システム利用者からのリクエストに含まれるパラメータ情報を解析する。リクエストデータ統計部232は、リクエストに含まれるパラメータ情報の統計を取る。アクセスログ出力部233は、リクエストに関連するアクセス情報(時刻、URL(Uniform Resource Locator)、実行結果など)をログファイルに出力する。記憶部234は、統計処理における各種データを記憶する。
記憶装置220は、アプリケーションサーバ210が出力したリクエストデータやアクセスログ、統計データなどを保存する。
次に、システム監視装置300の各構成要素の概略について説明する。
サーバマシン計測部310は、サーバマシン200の稼働数や起動処理にかかるウォームアップ(初期化)時間を計測する。事象予測部320は、サーバマシンのスケーリング条件を予測する。運用計画生成部330は、データ分析部322によって予測分析されたサーバマシンのスケーリング条件を基に、運用条件(運用計画)を定義する。運用実行制御部340は、運用計画生成部330が生成した運用条件に従って運用制御を実施する。
操作命令発行部350は、運用実行制御部340からの指示に応じて、サーバマシン200内のアプリケーションサーバ210に対して操作命令を発行する。解析データ収集部360は、サーバマシン内のアプリケーションサーバ210が出力したリクエストデータやアクセスログ、統計データなどを収集する。記憶装置370は、解析データ収集部360が収集したデータや、運用計画生成部330が生成した運用条件を保存する。
次に、システム監視装置300が備える事象予測部320の構成について説明する。事象予測部320は、データ解析部321、データ分析部322および注目ワード収集部323を備える。
データ解析部321は、サーバマシン200から収集したデータ構造を解析する。データ分析部322は、データ解析部321によって解析されたデータ構造を基に、将来のWebシステムにおける負荷状況と適切なサーバマシン数を予測分析する。注目ワード収集部323は、インターネットを介して、Google(登録商標)などの主要な情報検索サイトから現在注目されている商品や人物などの注目ワードを収集する。
次に、運用実行制御部340について、具体的に説明する。運用実行制御部340は、サーバマシン制御部341および記憶部342を備える。サーバマシン制御部341は、運用条件に従ってサーバマシンを制御する。記憶部342は、制御に必要な一時的なデータを記憶する。
図3および図4は、サーバマシン200のアプリケーションサーバ210におけるリクエスト受信の動作を示すフローチャートである。図3および図4を参照して、アプリケーションサーバ210におけるリクエスト受信の動作について説明する。
各サーバマシン200において動作するアプリケーションサーバ210は、クライアント400に搭載されるクライアントアプリケーションからのリクエストを、リクエスト受付部211において受信する。リクエスト受付部211は、受信したリクエストに含まれるリクエストパラメータ(以下、「リクエストデータ」とも称する)をアプリケーション実行制御部212に供給する。
アプリケーション実行制御部212は、リクエストパラメータに関連する業務処理を呼び出すと共に、それを実行する(S410)。業務処理の実行が正常に終了すると(S420においてYes)、アプリケーション実行制御部212内のリクエストデータ解析部231は、リクエストデータを解析する(S430)。
具体的には、図4に示すように、リクエストデータ解析部231は、リクエストに対応するURL(Uniform Resource Locator)コンテキストを抽出する(S431)。リクエストデータ解析部231は、リクエストデータにユーザパラメータが含まれる場合(S432においてYes)、そのユーザパラメータ内のキーワードを抽出する(S433)。ユーザパラメータとは、例えば、通信プロトコルとしてHTTP(Hypertext Transfer Protocol)が使用される場合、”GET”や”POST”に含まれる任意のデータである。
ここで、抽出されたURLコンテキストやキーワードが記憶部234に格納されている場合(S434においてYes)、リクエストデータ統計部232は、該当するカウンタをインクリメントする(S435)(詳細は後述する)。リクエストデータ統計部232は、解析した結果を記憶部234に格納する。
その後、図3に示すように、アプリケーション実行制御部212内のアクセスログ出力部233は、リクエストに関するアクセスログを、記憶装置220に格納する(S440)。そして、アプリケーション実行制御部212は、レスポンスデータをクライアントアプリケーションに返却する。
なお、リクエストデータの解析とアクセスログの出力は、性能面を考慮して必ずしも直列に実行される必要はなく、並列に実行されてもよい。また、本実施形態では、解析結果を記憶装置220に格納する際のフォーマットなどは限定せず、任意とする。
上記一連の処理が、リクエストごとに、アプリケーションサーバ210を動作するプロセス、またはそのスレッドにより実行される。
以上の処理が、Webシステム運用中に繰り返し発生することで、サーバマシン200の記憶装置220に、リクエストデータを解析した解析データやアクセスログが蓄積されていく。
また、アプリケーションサーバ210は、内部を構成する機能に対するパフォーマンス情報として、統計データ出力部213により、統計データを定期的に記憶装置220に格納する。統計データは、プロセスのメモリ消費量や、クライアントからのリクエストを処理するワーカースレッド数などの計測データを含む。
次に、システム監視装置300の動作について、図5および図6を参照して説明する。
まず、システム監視装置300に関する前提事項について説明する。システム監視装置300は、予めシステム運用者の運用作業によって、分散配置されたアプリケーションサーバ210の構成に関する情報を適切に管理している。また、システム監視装置300は、管理下のサーバマシン200と、その内部で動作するアプリケーションサーバ210に対して、ネットワークを介して、必要となる操作命令を指示できる。
また、システム監視装置300が備える記憶装置370には、次の情報が予め格納されているか、システム運用者が格納する。すなわち、過去の業務システムの稼働実績を含むアクセスログ、統計データ、サーバマシン数の推移を識別できるデータ、およびオートスケーリングのための典型的な初期運用計画である。初期運用計画とは、例えば、「CPU使用率が所定値を超えたらスケールアウトを実施する」等の運用条件に関する定義である。
さらに、システム監視装置300内のサーバマシン計測部310は、管理対象のサーバマシン200の稼働台数や、各サーバマシン200の起動処理にかかる時間を計測する。これらの情報は、記憶装置370に格納されているものとする。
上記を前提事項として、システム監視装置300が運用条件を生成する動作について、図5および図6を参照して説明する。
システム監視装置300の解析データ収集部360は、予めシステム運用者によって設定されたタイミング(例えば1時間ごと)で、操作命令を操作命令発行部350に発行する。操作命令とは、各サーバマシン200から、リクエストデータの解析データ、統計データ、およびアクセスログを収集する命令である。
上記操作命令は、各サーバマシン200のアプリケーションサーバ210内の操作命令受付部214により受信される。操作命令受付部214は、解析データ転送部216に操作命令を転送する。解析データ転送部216は、記憶装置220から、アプリケーションサーバ210によって生成されたリクエストデータの解析データ、統計データ、およびアクセスログを収集し、システム監視装置300に解析データを返却する(S510)。システム監視装置300は、受け取った解析データを、記憶装置370に格納する(S520)。システム監視装置300は、S510とS520の処理を、サーバマシンの数分実行する(S530)。
上記実行の後、システム監視装置300は、記憶装置370に格納された前回の分析結果を一旦削除する(S540)。
次に、システム監視装置300の事象予測部320は、記憶装置370から解析対象のデータを読み出す。データ解析部321は、必要なデータを解析し、それをデータ分析部322に転送する。データ分析部322は、既存のデータ分析技術によって、データ間の相関関係を導出する(S550)。
図6は、事象予測部320が相関関係を導出する動作を示すフローチャートである。図6に示すように、まず、データ分析部322は、データ分析を実施する(S551)。データ分析部322は、導出において、具体的には、まず次の観点から分析する。
・特定の期間に稼働するサーバマシン数の関係(例えば、平日、休日、特定日、特定曜日と、それらの期間に稼働するサーバマシン数との関係)
・特定のキーワードと、稼働するサーバマシン数との関係(例えば、「XXX」というキーワードを含むと、サーバマシンがX台稼働する等)
・特定のURLコンテキストと稼働するサーバマシン数との関係(例えば、「jpn.nec.com/xxx/」というURLコンテキスト配下のWebページにアクセスが発生すると、サーバマシンがX台稼働する等)
なお、上記のような分析結果の導出手段については任意である。
次に、事象予測部320内の注目ワード収集部323は、インターネットを介して、Google Trendsなどの情報検索サイトが提供するサービスや、関連するAPI(Application Programming Interface)を利用して、世の中の注目度が高いキーワード(注目ワード)を収集する(S552)。事象予測部320は、収集したキーワードに対して、上記の分析結果にまだ含まれていない注目ワードがある場合(S553においてYes)、その注目ワードを分析結果の一部として追加する(S554)。事象予測部320は、S553とS554の処理を、収集したすべての注目ワードが分析結果に含まれるように実行する(S555)。
続いて、図5に示すように、データ分析部322によって得られた上記の分析結果を基に、システム監視装置300内の運用計画生成部330は、順に図7に示すような運用条件を生成し(S560)、それを記憶装置370に格納する(S570)。
図7は、運用計画生成部330により生成された運用条件の一例を示す図である。図7に示すように、運用条件は、「スケーリングポリシー」、「カテゴリ」、「実行条件」、「キーワード」および「予測サーバ数」を含む。「スケーリングポリシー」は、スケーリング実施の指標を示し、例えば、時刻または注目度である。「カテゴリ」は、スケーリングポリシーの分類を示す情報であり、例えば、スケーリングポリシーが時刻の場合は平日、特定日等であり、スケーリングポリシーが注目度の場合はワード、URL等である。
「実行条件」は、スケーリング実施の条件(トリガ)であり、スケーリング実施の開始時刻や、ワードやURLに対するアクセス数(注目度)が上昇傾向にある等の条件である。「キーワード」は、コンテンツに関するキーとなる情報であり、例えば、日付に関する情報、コンテンツに含まれる文言、あるいはユーザリクエストにより指定されるURL等の情報である。「予測サーバ数」は、上記各項目に含まれる条件を満たした状況において、必要となるサーバの数を、データ分析部322により予測された値である。データ分析部322は、アクセスログ等に基づいて、必要となるサーバ数を予測する。
運用計画生成部330は、データ分析部322によって得られたすべての分析結果から、上記のような運用条件を作成する(S580)。
さらに、特定のキーワードと稼働するサーバマシン数の関係が分析結果に含まれる場合(S590においてYes)、操作命令発行部350は、各サーバマシン200に対して、以下の操作命令を発行する(S591)。すなわち、操作命令発行部350は、各サーバマシン200に対して、監視すべきキーワード情報をアプリケーションサーバ210内の記憶部234に含める操作命令を発行する。このとき、記憶部234には、図8に示すような監視情報が格納される。
図8は、監視情報の一例を示す図である。図8に示すように、監視情報は、「カテゴリ」、「キーワード」、「カウンタ(現在)」、「カウンタ(前回)」、「カウンタ(前々回)」を含む。「カテゴリ」と「キーワード」は、上述した運用条件に含まれる「カテゴリ」と「キーワード」と同様である。カウンタは、図8に示す監視情報に含まれるキーワードを含んでいるアクセスの数であり、現在、前回および前々回の監視タイミングにおけるアクセス数を保持する。
以上の処理により、システム監視装置300は、運用条件を生成する。
次に、システム監視装置300によるスケーリングの動作について説明する。
システム監視装置300は、予めシステム運用者によって設定された定期的なタイミング(例えば1分間隔)で、運用実行制御部340において記憶装置370からそれぞれの運用条件を読み出し、それに基づいてスケーリング実施の要否とスケーリングの最適条件(必要サーバ数等)を決定する。このとき、運用実行制御部340は、記憶部342に、これから稼働すべきサーバマシンの数を意味する変数「必要サーバ数」を格納すると共に、その値を「1」で初期化しておく。
図9および図10は、運用条件に基づくスケーリングの動作を示すフローチャートである。図9および図10を参照して、スケーリングの動作について説明する。
運用実行制御部340は、最適条件を決定するにあたり、記憶装置370に格納された図7に示すような運用条件を順に調べる。まず、運用条件に含まれるスケーリングポリシー(SP)が「時刻」の場合(S601においてYes)、運用実行制御部340は、現在の時刻が、運用条件に含まれる実行条件として指定された時刻に達したかどうかを調べる。より厳密には、運用実行制御部340は、上記指定された時刻に対して、サーバマシンの起動処理にかかるウォームアップ時間(起動時間)、およびこのスケーリングの最適条件を決定するための定期的な監視間隔を差し引いた時刻に達したかどうかを調べる。これは、業務が実行できるようになるまでのサーバマシンの準備期間を考慮するためである。
上記時刻に達している場合(S602においてYes)、運用実行制御部340は、運用条件に含まれるカテゴリと、現在時刻が示すカテゴリとを比較して、両者が一致しているかを調べる。カテゴリが一致している場合(S603においてYes)、サーバマシン計測部310によって得られた稼働中のサーバマシン数と、運用条件に含まれる予測サーバ数とを比較する。予測サーバ数が”0”より大きい場合(S604においてYes)、運用実行制御部340は、さらに予測サーバ数と現在稼働中のサーバマシン数とを比較する。
予測サーバ数の方が大きい場合(S605においてYes)、運用実行制御部340は、変数「必要サーバ数」を予測サーバ数で更新する(S606)。一方、予測サーバ数が”0”の場合(S604においてNo)、運用実行制御部340は、変数「必要サーバ数」を、現在のサーバ数に1を加えた値で更新する(S607)。
一方、運用条件に含まれるスケーリングポリシーが、「時刻」でなく「注目度」の場合(S601においてNo)、運用実行制御部340は、各サーバマシンからURLコンテキストまたはワードに対する監視情報を、以下のように取得する(S608)。
すなわち、運用実行制御部340は、監視情報を収集するため、操作命令発行部350に、監視情報を収集する操作命令の発行を要求する。操作命令発行部350は、監視情報を収集する操作命令を各サーバマシンに送信する。各サーバマシンは、操作命令受付部214において操作命令を受信し、監視情報転送部215に監視情報の転送を要求する。監視情報転送部215は、その要求に応じて、記憶部234から操作命令を読み出すと共に、読み出した監視情報を操作命令の返答に含める。操作命令受付部214は、監視情報を含む操作命令の返答を、システム監視装置300に送信する。システム監視装置300は、操作命令発行部350において上記返答を受信すると共に、それを運用実行制御部340に供給する。
運用実行制御部340は、取得した監視情報に基づいて、運用条件に含まれるキーワードを含んでいるアクセス数が、すべてのサーバマシンにおいて上昇していると判定した場合(S609においてYes)、上記S604からS606と同様の処理により、変数「必要サーバ数」を更新する。
なお、運用実行制御部340は、アクセス数が上昇していることを、図8に示す監視情報に含まれる「カウンタ(現在)」、「カウンタ(前回)」、「カウンタ(前々回)」から得られる増加傾向に基づいて判断することを示したが、これに限らない。すなわち、運用実行制御部340は、例えば、二次関数を用いて上昇かどうかをチェックしてもよい。
運用実行制御部340は、上記S601からS609の処理を、記憶装置370に格納されるすべての運用条件に関して実行する(S610)。
続いて、変数「必要サーバ数」が、現在稼働中のサーバマシン数を超えている場合(S611においてYes)、サーバマシン制御部341は、その差分となる数のサーバマシンを追加で起動するためのスケールアウト処理を実行する(S616)。一方、変数「必要サーバ数」が、現在稼働中のサーバマシン数以下である場合、運用実行制御部340は、さらに各サーバマシンの負荷状況を計測する(S612)。運用実行制御部340は、この負荷状況を、上述したオートスケーリングのための典型的な初期運用計画に含まれる条件に基づいて判断する。すなわち、運用実行制御部340は、サーバが初期運用計画に含まれる条件を満たした場合、高負荷であるとみなす。
運用実行制御部340は、高負荷であるとみなすサーバ数と、変数「必要サーバ数」から”1”を引いた値とを比較し、前者が大きい場合(S613においてYes)、過去の稼働実績に沿わない突発的な負荷とみなして、実働に基づいてスケールアウト処理を実施する(S616)。一方、後者が大きい場合(S614においてYes)、運用実行制御部340は、その差分となる数のサーバマシンを停止するためのスケールイン処理を実施する(S615)。
以上のように、本第1の実施形態によれば、システム監視装置300は、ユーザリクエスト内に含むパラメータなどをリクエスト受付の際に解析し、それを用いてWebページの内容や特定のWebページと負荷変動との関係を導き出した結果に基づいて、オートスケーリングの実施計画を生成する。この構成を採用することにより、本第1の実施形態によれば、コンテンツと負荷変動との関係、すなわち、世間の流行や動向の変化を起因とした特定ページや特定サーバへの負荷の集中を考慮したスケーリングを実施できるという効果が得られる。
システム監視装置300は、実施計画にしたがってスケーリングを実施しているので、本第1の実施形態によれば、スケーリングを自動化でき、SI(System Integration)コストやメンテナンスコストを削減できるという効果が得られる。
また、システム監視装置300は、事前にサーバマシンが使用可能になるまでのウォームアップ(初期化)時間を計測しておき、それを考慮して、スケールアウト処理を開始するように制御する。これにより、本第1の実施形態によれば、急速なアクセス増加のように、サーバの初期化時間に対するスケーリング処理の準備不足を発端とする性能劣化やアクセスエラーを防ぐことができる。したがって、サーバマシンの起動期間を起因とした高負荷によるシステム障害の発生を抑えられるという効果が得られる。
第2の実施形態
図11は、本発明の第2の実施形態に係るシステム監視装置700の構成を示す図である。図11に示すように、監視装置700は、運用計画部710および制御部720を備える。
監視装置700は、クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信する1または複数のサーバを監視する。
運用計画部710は、サーバから収集した、リクエストに関連するアクセス情報とリクエストを解析した結果であるリクエスト解析結果に基づいて、注目情報または時刻情報に応じたサーバ負荷の制御を実施する運用計画を作成する。
制御部720は、注目情報または時刻情報が、運用計画に含まれる実行条件を満たした場合、当該運用計画に基づいてサーバ負荷の制御を実施する。
運用計画部710は、上記第1の実施形態における運用計画作成部330に相当し、制御部720は、運用実行制御部340に相当する。
上記構成を採用することにより、本第2の実施形態によれば、コンテンツと負荷変動との関係性を考慮したサーバ負荷の制御を実施できるという効果が得られる。
なお、図2等に示したサーバマシンおよびシステム監視装置の各部は、図12に例示するハードウエア資源において実現される。すなわち、図12に示す構成は、CPU10、RAM(Random Access Memory)11、ROM(Read Only Memory)12、外部接続インタフェース13および記憶媒体14を備える。CPU10は、ROM12または記憶媒体14に記憶された各種ソフトウエア・プログラム(コンピュータ・プログラム)を、RAM11に読み出して実行することにより、サーバマシンおよびシステム監視装置の全体的な動作を司る。すなわち、上記各実施形態において、CPU10は、ROM12または記憶媒体14を適宜参照しながら、サーバマシンおよびシステム監視装置が備える各機能(各部)を実行するソフトウエア・プログラムを実行する。
また、上述した各実施形態では、図2等に示したサーバマシンおよびシステム監視装置における各ブロックに示す機能を、図12に示すCPU10が実行する一例として、ソフトウエア・プログラムによって実現する場合について説明した。しかしながら、図2等に示した各ブロックに示す機能は、一部または全部を、ハードウエアとして実現してもよい。
また、各実施形態を例に説明した本発明は、サーバマシンおよびシステム監視装置に対して、上記説明した機能を実現可能なコンピュータ・プログラムを供給した後、そのコンピュータ・プログラムを、CPU10がRAM11に読み出して実行することによって達成される。
また、係る供給されたコンピュータ・プログラムは、読み書き可能なメモリ(一時記憶媒体)またはハードディスク装置等のコンピュータ読み取り可能な記憶デバイスに格納すればよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムを表すコード或いは係るコンピュータ・プログラムを格納した記憶媒体によって構成されると捉えることができる。
本発明は、例えば、ショッピングサイト、動画サイト、オークションサイトのWebシステムを構築する情報処理システムに適用できる。
10 CPU
11 RAM
12 ROM
13 外部接続インタフェース
14 記憶媒体
100 情報処理システム
200 サーバマシン
210 アプリケーションサーバ
211 リクエスト受付部
212 アプリケーション実行制御部
213 統計データ出力部
214 操作命令受付部
215 監視情報転送部
216 解析データ転送部
220 記憶装置
231 リクエストデータ解析部
232 リクエストデータ統計部
233 アクセスログ出力部
234 記憶部
300 システム監視装置
310 サーバマシン計測部
320 事象予測部
321 データ解析部
322 データ分析部
323 注目ワード収集部
330 運用計画生成部
340 運用実行制御部
341 サーバマシン制御部
342 記憶部
350 操作命令発行部
360 解析データ収集部
370 記憶装置

Claims (9)

  1. クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信する1または複数のサーバを監視する監視装置であって、
    前記サーバから収集した、前記リクエストに関連するキーワードに対するアクセス数である注目度と前記リクエストを解析した結果であるリクエスト解析結果に基づいて、前記注目度に応じたサーバのスケールアウトの運用計画を作成する運用計画手段と、
    前記注目度が上昇した場合、当該運用計画に基づいて前記サーバにスケールアウトを実施させる制御手段と
    を備えた監視装置。
  2. 前記運用計画手段は、前記注目度と前記リクエスト解析結果とに基づいて、前記キーワードと稼働中のサーバ数との関係導出することにより、前記注目度に応じて必要となるサーバ数を予測し、その予測サーバ数を含む前記運用計画を作成する
    請求項記載の監視装置。
  3. 前記制御手段は、稼働中のサーバ数が、前記運用計画に含まれる予測サーバ数よりも少ない場合、前記サーバのスケールアウト処理を実施させる
    請求項記載の監視装置。
  4. 前記制御手段は、前記注目度の上昇を判定する
    請求項1ないし請求項3のいずれか1項記載の監視装置。
  5. 前記運用計画手段は、ネットワークを介して情報検索サイトから収集された所定の条件を満たすワードに対する前記注目度に応じて前記運用計画を作成する
    請求項1ないし請求項のいずれか1項記載の監視装置。
  6. クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信する1または複数のサーバと、当該サーバを監視し、前記サーバから収集した、前記リクエストに関連するキーワードに対するアクセス数である注目度と前記リクエストを解析した結果であるリクエスト解析結果に基づいて、前記注目度が上昇した場合、前記サーバのスケールアウトを実施させる監視装置とを有する監視システムにおけるサーバであって、
    前記リクエスト解析結果から前記キーワードを抽出し、前記アクセス数である注目度の統計を取る統計手段と、
    ネットワークを介して自サーバを監視する監視装置に、前記注目度を送信する送信手段と
    を備えたサーバ。
  7. クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信する1または複数のサーバと、当該サーバを監視する監視装置とを備えた監視システムであって、
    前記サーバは、
    前記リクエストを解析した結果であるリクエスト解析結果から前記リクエストに関連するキーワードを抽出し、前記キーワードに対するアクセス数である注目度の統計を取る統計手段と、
    前記監視装置に、前記注目度を送信する送信手段と
    を備え、
    前記監視装置は、
    前記サーバから収集した、前記注目度と前記リクエスト解析結果に基づいて、前記注目度に応じたサーバのスケールアウトの運用計画を作成する運用計画手段と、
    前記注目度が上昇した場合、当該運用計画に基づいて前記サーバのスケールアウトを実施させる制御手段と
    を備えた
    監視システム。
  8. クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信する1または複数のサーバを監視装置が監視する監視方法であって、
    前記監視装置が、
    前記サーバから収集した、前記リクエストに関連するキーワードに対するアクセス数である注目度と前記リクエストを解析した結果であるリクエスト解析結果に基づいて、前記注目度に応じたサーバのスケールアウトの運用計画を作成し、
    前記注目度が上昇した場合、当該運用計画に基づいて前記サーバのスケールアウトを実施させる
    監視方法。
  9. クライアントからのリクエストに応じて処理を実行し、当該クライアントに応答を送信する1または複数のサーバを監視する監視プログラムであって、
    前記サーバから収集した、前記リクエストに関連するキーワードに対するアクセス数である注目度と前記リクエストを解析した結果であるリクエスト解析結果に基づいて、前記注目度に応じたサーバのスケールアウトの運用計画を作成する処理と、
    前記注目度が上昇した場合、当該運用計画に基づいて前記サーバのスケールアウトを実施させる処理と
    をコンピュータに実行させる監視プログラム。
JP2014185981A 2014-09-12 2014-09-12 監視装置、サーバ、監視システム、監視方法および監視プログラム Active JP6481299B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014185981A JP6481299B2 (ja) 2014-09-12 2014-09-12 監視装置、サーバ、監視システム、監視方法および監視プログラム
US14/826,728 US20160080267A1 (en) 2014-09-12 2015-08-14 Monitoring device, server, monitoring system, monitoring method and program recording medium
CN201510582672.2A CN105426284A (zh) 2014-09-12 2015-09-14 监视设备、服务器、监视系统、监视方法和程序记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014185981A JP6481299B2 (ja) 2014-09-12 2014-09-12 監視装置、サーバ、監視システム、監視方法および監視プログラム

Publications (2)

Publication Number Publication Date
JP2016058005A JP2016058005A (ja) 2016-04-21
JP6481299B2 true JP6481299B2 (ja) 2019-03-13

Family

ID=55455935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014185981A Active JP6481299B2 (ja) 2014-09-12 2014-09-12 監視装置、サーバ、監視システム、監視方法および監視プログラム

Country Status (3)

Country Link
US (1) US20160080267A1 (ja)
JP (1) JP6481299B2 (ja)
CN (1) CN105426284A (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3482554B1 (en) * 2016-07-08 2021-07-07 Convida Wireless, LLC Methods and servers to monitor resources through http/2
JP6812787B2 (ja) 2016-12-27 2021-01-13 富士通株式会社 情報処理装置、フェールオーバ時間測定方法及びフェールオーバ時間測定プログラム
CN107018012A (zh) * 2017-03-09 2017-08-04 贵州黔源电力股份有限公司 一种梯级电站工业电视集中监视主站系统
US11126927B2 (en) * 2017-11-24 2021-09-21 Amazon Technologies, Inc. Auto-scaling hosted machine learning models for production inference
JP6699676B2 (ja) * 2018-01-25 2020-05-27 トヨタ自動車株式会社 サーバ装置、情報収集システム、およびプログラム
JP7010096B2 (ja) * 2018-03-19 2022-01-26 株式会社リコー 情報処理システム、情報処理装置及びプログラム
JP7092345B2 (ja) * 2018-07-27 2022-06-28 Necプラットフォームズ株式会社 サーバ制御装置、サーバ制御方法およびサーバ制御プログラム
CN113986655B (zh) * 2021-10-11 2022-08-30 上海轻迅信息科技有限公司 一种基于监控设备数据采集分析系统及平台

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6957390B2 (en) * 2000-11-30 2005-10-18 Mediacom.Net, Llc Method and apparatus for providing dynamic information to a user via a visual display
GB0220846D0 (en) * 2002-09-07 2002-10-16 Ibm Remote dynamic configuration of a web server to facilitate capacity on demand
JP2005141411A (ja) * 2003-11-05 2005-06-02 Fujikura Ltd 光コネクタの識別方法および画像照合装置
JP2005141441A (ja) * 2003-11-06 2005-06-02 Hitachi Ltd 負荷分散システム
US9021094B1 (en) * 2005-04-28 2015-04-28 Hewlett-Packard Development Company, L.P. Allocation of resources for tiers of a multi-tiered system based on selecting items from respective sets
US20070233866A1 (en) * 2006-03-28 2007-10-04 Karen Appleby Method and system for dynamically allocating servers to compute-resources using capacity thresholds
JP4952309B2 (ja) * 2007-03-09 2012-06-13 日本電気株式会社 負荷分析システム、方法、及び、プログラム
JP5050627B2 (ja) * 2007-04-26 2012-10-17 日本電気株式会社 リソース割当システム、リソース割当方法及びリソース割当プログラム
US7970892B2 (en) * 2007-06-29 2011-06-28 Microsoft Corporation Tuning and optimizing distributed systems with declarative models
US20090199192A1 (en) * 2008-02-05 2009-08-06 Robert Laithwaite Resource scheduling apparatus and method
CN101321181A (zh) * 2008-07-17 2008-12-10 上海交通大学 基于模糊控制的分布式服务流程引擎管理系统
JP5378946B2 (ja) * 2009-10-26 2013-12-25 株式会社日立製作所 サーバ管理装置およびサーバ管理方法
CN102447719A (zh) * 2010-10-12 2012-05-09 上海遥薇(集团)有限公司 Web GIS服务的动态负载均衡信息处理系统
US8788654B2 (en) * 2010-12-07 2014-07-22 Cisco Technology, Inc. System and method for allocating resources based on events in a network environment
JP5342615B2 (ja) * 2011-08-15 2013-11-13 株式会社日立システムズ 仮想サーバ制御システム及びプログラム
EP2608029A1 (en) * 2011-12-19 2013-06-26 Siemens Aktiengesellschaft Method and system for managing resources among different clients for an exclusive use
US20140078911A1 (en) * 2012-09-17 2014-03-20 Fluke Corporation Method and apparatus to determine the amount of delay in round trip latency for a connection where the tcp traffic does not contain multi-packet responses or may not be transaction oriented traffic.
CN103179217B (zh) * 2013-04-19 2016-01-13 中国建设银行股份有限公司 一种用于web应用服务器群组的负载均衡方法和装置

Also Published As

Publication number Publication date
CN105426284A (zh) 2016-03-23
US20160080267A1 (en) 2016-03-17
JP2016058005A (ja) 2016-04-21

Similar Documents

Publication Publication Date Title
JP6481299B2 (ja) 監視装置、サーバ、監視システム、監視方法および監視プログラム
JP6457447B2 (ja) データセンターのネットワークトラフィックスケジューリング方法及び装置
US10289973B2 (en) System and method for analytics-driven SLA management and insight generation in clouds
US10210036B2 (en) Time series metric data modeling and prediction
US11431582B2 (en) Systems and methods for context aware adaptation of services and resources in a distributed computing system
WO2013072232A1 (en) Method to manage performance in multi-tier applications
US12225096B2 (en) Configuration of event data communication in computer networks
US20180205666A1 (en) Application workload prediction
CN117972367B (zh) 一种数据存储预测方法、数据存储子系统及智能计算平台
US20220303361A1 (en) Resiliency Control Engine for Network Service Mesh Systems
CN110990138A (zh) 资源调度方法、装置、服务器及存储介质
CN106797399B (zh) 确定计算资源的新配置的配置方法、设备、系统和计算机可读介质
Copil et al. Advise–a framework for evaluating cloud service elasticity behavior
Thota Optimizing Kubernetes workloads with AI-driven performance tuning in AWS EKS
US20140258382A1 (en) Application congestion control
Zhou et al. Cushion: A proactive resource provisioning method to mitigate SLO violations for containerized microservices
Liu et al. A virtual machine migration strategy based on time series workload prediction using cloud model
CN119814792B (zh) 一种基于负载均衡器的网站流量管理方法及系统
Pham et al. CIRUS: an elastic cloud-based framework for Ubilytics
EP4016963A1 (en) Method of managing resources of an infrastructure for network function virtualization
Giannakopoulos et al. Smilax: statistical machine learning autoscaler agent for Apache Flink
Omoregbee et al. Performability requirements in making a rescaling decision for streaming applications
CN117635206A (zh) 一种用电行为预测方法及装置、设备、存储介质
US20170372334A1 (en) Agent-based monitoring of an application management system
KR102448702B1 (ko) 엣지 서비스 증설 제어 시스템 및 그 제어방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170809

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190128

R150 Certificate of patent or registration of utility model

Ref document number: 6481299

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150