CN105681077A - 故障处理方法、装置及系统 - Google Patents

故障处理方法、装置及系统 Download PDF

Info

Publication number
CN105681077A
CN105681077A CN201511032571.4A CN201511032571A CN105681077A CN 105681077 A CN105681077 A CN 105681077A CN 201511032571 A CN201511032571 A CN 201511032571A CN 105681077 A CN105681077 A CN 105681077A
Authority
CN
China
Prior art keywords
reconstruction
vnf
vnfm
fault
reparation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201511032571.4A
Other languages
English (en)
Other versions
CN105681077B (zh
Inventor
原守东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201511032571.4A priority Critical patent/CN105681077B/zh
Publication of CN105681077A publication Critical patent/CN105681077A/zh
Priority to EP16881114.9A priority patent/EP3386170B1/en
Priority to PCT/CN2016/111936 priority patent/WO2017114325A1/zh
Priority to US16/022,392 priority patent/US11032130B2/en
Application granted granted Critical
Publication of CN105681077B publication Critical patent/CN105681077B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/24Testing correct operation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • H04L41/0886Fully automatic configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Hardware Redundancy (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种故障处理方法、装置及系统,属于故障处理领域。所述方法包括:虚拟网络功能VNF监测内部的至少一个虚拟机VM的运行情况;在所述VM存在故障时,所述VNF根据所述故障决策是否进行VM重建修复;在决策进行所述VM重建修复时,所述VNF向虚拟网络功能管理VNFM发送重建修复请求。本发明通过在VNF根据VM存在的故障决策对VM进行重建修复时,向VNFM发送重建修复请求,VNFM根据重建修复请求指示VIM对VM进行重建修复,实现了在VM存在故障时,通过VNFM与VIM之间的交互,实现VIM对VM进行自动重建修复的效果,而且VNFM根据重建修复请求指示VIM对VM进行重建修复,减少了VM故障处理的响应时间,同时自动重建修复也降低了管理该系统的资源。

Description

故障处理方法、装置及系统
技术领域
本发明实施例涉及故障处理领域,特别涉及一种故障处理方法、装置及系统。
背景技术
传统的电信网络采用各种专用的硬件设备组成,不同的应用采用不同的硬件设备。随着电信网络规模的增长,传统的电信系统越来越复杂,带来了诸多的挑战。
网络功能虚拟化(NetworkFunctionVirtualization,NFV)技术可以简单地理解为将电信网络中使用的各个网元的功能从专用的硬件平台迁移至通用的商用货架产品(Commercial-off-the-shelf,COTS)。首先通过COTS搭建硬件平台,再通过NFV技术将电信网络中使用的各个网元转变为独立的虚拟应用运行在硬件平台上。每个网元可以由一个或多个虚拟机(VirtualMachine,VM)来实现。
VM在运行过程中会发生故障,比如:操作系统卡死、两个VM之间的通信处于亚健康状态等,现有技术中主要通过技术人员的人工修复来解决VM的故障问题。
发明内容
本发明实施例提供了一种故障处理方法、装置及系统,旨在解决现有技术中主要通过技术人员的人工修复来解决VM的故障问题。所述技术方案如下:
第一方面,提供了一种故障处理方法,该方法包括:
虚拟网络功能(VirtualNetworkFunction,VNF)监测内部的至少一个虚拟机VM的运行情况;
在所述VM存在故障时,所述VNF根据所述故障决策是否进行VM重建修复;
在决策进行所述VM重建修复时,所述VNF向虚拟网络功能管理(VirtualNetworkFunctionManager,VNFM)发送重建修复请求,所述VNFM用于根据所述重建修复请求指示虚拟基础设施管理器(VirtualizedInfrastructureManager,VIM)对所述VM进行重建修复。
在VNF根据VM存在的故障决策对VM进行重建修复时,向VNFM发送重建修复请求,VNFM根据重建修复请求指示VIM对VM进行重建修复,实现了在VM存在故障时,通过VNFM与VIM之间的交互,实现VIM对VM进行自动重建修复的效果,而且VNFM根据重建修复请求指示VIM对VM进行重建修复,减少了VM故障处理的响应时间,同时自动重建修复也降低了管理该系统的资源。
在第一方面的第一种可能的实施方式中,所述在所述VM存在故障时,所述VNF根据所述故障决策是否进行VM重建修复,包括:
在所述VM存在操作系统类故障时,所述VNF决策对所述VM进行本地重建修复;
其中,所述本地重建修复是在所述VM原始所属的物理计算机上对所述VM进行的重建修复。
在VM存在操作系统类故障时,VNF决策对VM进行本地重建修复,利用在VM原始所属的物理计算机上对VM进行重建修复,降低了对VM故障的处理时间,实现了对VM故障的自动重建修复。
在第一方面的第二种可能的实施方式中,所述在所述VM存在故障时,所述VNF根据所述故障决策是否进行VM重建修复,包括:
在所述VM存在通信亚健康故障时,所述VNF对所述VM决策进行异地重建修复;
其中,所述通信亚健康故障是VM之间的网络通信质量差于预设条件的故障,所述异地重建修复是在除所述VM原始所属的物理计算机的其它物理计算机上对所述VM进行的重建修复。
在VM存在通信亚健康故障时,VNF决策对VM进行异地重建修复,实现了VNF针对不同的VM故障,决策利用不同的重建修复方式对VM进行重建修复,提高了VM故障的重建修复率,也提高了对VM重建修复的效率。
结合第一方面、第一方面的第一种可能的实施方式或者第一方面的第二种可能的实施方式,在第三种可能的实施方式中,所述方法还包括:
所述VNF接收所述VNFM发送的重建修复反馈;
其中,所述重建修复反馈包括:重建失败反馈或重建成功反馈,所述重建失败反馈是所述VIM根据所述VNFM的指示对所述VM重建失败时的反馈,所述重建成功反馈是所述VIM根据所述VNFM的指示对所述VM重建成功时的反馈。
VNFM在根据重建修复请求指示VIM对VM进行重建修复后,将重建修复的结果发送给VNF,针对不同的重建修复结果,向VNF发送不同的反馈,有利于VNF及时了解故障VM的处理结果,同时可以及时了解重建修复后的VM的属性信息。
第二方面,提供了一种故障处理装置,所述装置包括至少一个单元,该至少一个单元用于实现上述第一方面或第一方面的可能的实施方式中所提供的故障处理方法。
第三方面,提供了一种故障处理系统,所述系统包括:VNF、VNFM和VIM;
所述VNF,用于监测内部的至少一个虚拟机VM的运行情况,在所述VM存在故障时根据所述故障决策是否进行VM重建修复,在决策进行所述VM重建修复时向所述VNFM发送重建修复请求;
所述VNFM,用于根据重建修复请求指示所述VIM对所述VM进行重建修复;
所述VIM,用于根据所述VNFM的指示对所述VM进行重建修复。
本发明实施例提供的技术方案带来的有益效果是:
通过VNF监测内部的至少一个虚拟机VM的运行情况;在所述VM存在故障时,所述VNF根据所述故障决策是否进行VM重建修复;在决策进行所述VM重建修复时,所述VNF向VNFM发送重建修复请求,所述VNFM用于根据所述重建修复请求指示VIM对所述VM进行重建修复,解决了现有技术中VM发生故障时需要通过技术人员的人工修复来解决VM故障的问题;达到了在VM存在故障时,通过VNFM与VIM之间的交互,实现VIM对VM进行自动重建修复的效果,而且VNFM根据重建修复请求指示VIM对VM进行重建修复,减少了VM故障处理的响应时间,同时自动重建修复也降低了管理该系统的资源的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一示例性实施例提供的一种NFV系统架构的示意图;
图2是本发明一个示例性实施例提供的一种故障处理方法的流程图;
图3A是本发明另一个示例性实施例提供的一种故障处理方法的流程图;
图3B是本发明一个示例性实施例提供的本地重建修复前后VNF内部结构的示意图;
图3C是本发明一个示例性实施例提供的异地重建修复前后VNF内部结构的示意图;
图4是本发明一个示例性实施例提供的一种故障处理装置的框图;
图5是本发明一个示例性实施例提供的一种故障处理系统的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在本文中提及的“单元”是指按照逻辑划分的功能性结构,该“单元”可以由纯硬件实现,或者,软硬件的结合实现。
请参考图1,其示出了本发明一示例性实施例提供的一种NFV系统架构的示意图。该实施环境可以包括:一个NFV管理和编排系统(NFVManagementandOrchestration,NFVMANO)101、NFV基础设施层(NFVInfrastructure,NFVI)130、多个虚拟网络功能(VirtualNetworkFunction,VNF)108和多个网元管理(ElementManagement,EM)122。
其中,NFVMANO101包括NFV编排器(NFVOrchestrator,NFVO)102,一个或多个VNFM104和VIM106。NFVI130包括计算硬件112、存储硬件114、网络硬件116、虚拟化层(VirtualizationLayer)、虚拟计算110、虚拟存储118和虚拟网络120。
NFVMANO101用于执行对VNF108和NFVI130的监视和管理。NFVO102可以实现在NFVI130上的网络服务,也可以执行来自一个或多个VNFM104的资源相关请求,发送配置信息到VNFM104,并收集VNF108的状态信息。VNFM104可以管理一个或多个VNF108。VNFM104可以执行各种管理功能,如实例化、更新、查询、缩放和/或终止VNF108等。VIM106可以执行资源管理的功能。VNFM104和VIM106可以相互通信进行资源分配和交换虚拟化硬件资源的配置和状态信息。
NFVI130包括硬件资源、软件资源或两者的组合来完成虚拟化环境的部署。硬件资源包括计算硬件112、存储硬件114和网络硬件116。计算硬件112用于提供处理和计算资源。存储硬件114可以是位于服务器内的本地存储器。网络硬件116可以是交换机、路由器和/或配置成具有交换功能的任何其他网络设备。
可选的,计算硬件112和存储硬件114的资源可以被集中在一起。
NFVI130里面的虚拟化层可以从物理层抽象硬件资源和解耦VNF108,以便向VNF108提供虚拟化资源。虚拟资源层包括虚拟计算110,虚拟存储器118和虚拟网络120。虚拟计算110和虚拟存储118可以以虚拟机、和/或其他虚拟容器的形式提供给VNF108。例如,一个或一个以上的VNF108可以部署在一个VM上。
虚拟化层抽象网络硬件116从而形成虚拟网络120,虚拟网络120可以包括虚拟交换机,虚拟交换机用来提供虚拟机和其他虚拟机之间的连接。此外,网络硬件116中的传输网络,可以采用集中式控制平面和一个单独的转发平面虚拟化。
如图1所示,VNFM104可以与VNF108和EM122交互来对VNF的生命周期进行管理以及交换配置和状态信息。VNF108可以被配置为通过一个物理网络设备执行的至少一个网络功能的虚拟化。例如,在一个实现方案中,所述VNF108可以经过配置以提供IMS网络中的不同网元具备的功能,如P-SCSCF,S-CSCF或HSS的网络功能等。EM122经过配置以对一个或一个以上的VNF108进行管理。
需要说明的一点是,本发明实施例中仅涉及到VNF108、VNFM104和VIM106之间的信息交互。本发明实施例中,一个VNF108中包含有至少一个VM(图中未示出)。VNF108用于监测内部的至少一个VM的运行情况;在VM存在故障时,VNF108根据VM发生的故障决策是否进行VM重建修复;在VNF108决策进行VM重建修复时,VNF向VNFM104发送重建修复请求;VNFM104根据重建修复请求指示VIM106对发生故障的VM进行重建修复。
请参考图2,其示出了本发明一个示例性实施例提供的一种故障处理方法的流程图。本实施例以该方法用于图1所示的实施环境中来举例说明,该方法可以包括以下几个步骤:
步骤201,VNF监测内部的至少一个VM的运行情况。
步骤202,在VM存在故障时,VNF根据故障决策是否进行VM重建修复。
步骤203,在决策进行VM重建修复时,VNF向VNFM发送重建修复请求,VNFM用于根据重建修复请求指示VIM对VM进行重建修复。
综上所述,本发明实施例提供的故障处理方法,通过VNF监测内部的至少一个VM的运行情况;在VM存在故障时,VNF根据故障决策是否进行VM重建修复;在决策进行VM重建修复时,VNF向VNFM发送重建修复请求,VNFM用于根据重建修复请求指示VIM对VM进行重建修复;解决了现有技术中VM发生故障时需要通过技术人员的人工修复来解决VM故障的问题;达到了在VM存在故障时,通过VNFM与VIM之间的交互,实现VIM对VM进行自动重建修复的效果,而且VNFM根据重建修复请求指示VIM对VM进行重建修复,减少了VM故障处理的响应时间,同时自动重建修复也降低了管理该系统的资源的效果。
需要说明的一点是:VM存在的故障类型包括:操作系统类故障和通信亚健康故障。其中,操作系统类故障是指VM内部的操作系统出现故障,也可以称之为OS(OperatingSystem,操作系统)故障;通信亚健康故障是指VM之间的网络通信质量差于预设条件的故障。
在另一种可能的实现方式中,VM只存在操作系统类故障,或者,VM只存在通信亚健康故障,本实施例中,以VM同时存在操作系统类故障和通信亚健康故障进行举例说明,对VM存在的故障类型不作具体限定。
需要说明的第二点是:VNF根据不同的故障类型决策对VM进行不同的重建修复。当VM存在操作系统类故障时,VNF根据操作系统类故障决策对VM进行本地重建修复,当对VNF进行N次本地重建修复失败时,VNF决策对存在操作系统类故障的VM进行异地重建修复;当VM存在通信亚健康故障时,VNF根据通信亚健康故障决策直接对VM进行异地重建修复。
其中,本地重建修复是在VM原始所属的物理计算机上对VM进行的重建修复;异地重建修复是在除VM原始所属的物理计算机的其它物理计算机上对VM进行的重建修复。
需要说明的第三点是:重建修复后的VM的预定属性信息保持不变。
其中,预定属性信息包括:处理器参数、内存参数、硬盘参数和网络接口参数中的部分参数或全部参数。
本实施例中以预定属性信息包括:处理器参数、内存参数、硬盘参数和网络接口参数中的全部参数进行举例说明,本实施例中对预定属性信息包括的参数内容不作具体限定。
请参考图3A,其示出了本发明另一个示例性实施例提供的一种故障处理方法的流程图。本实施例以该方法用于图1所示的实施环境中来举例说明,该方法可以包括以下几个步骤:
步骤301,VNF监测内部的至少一个VM的运行情况。
故障处理系统在运行过程中,通过VNF监测内部的至少一个VM的运行情况。
一个VNF中包括有至少一个VM。可选的,当一个VNF中仅包含有一个VM时,VNF监测内部一个VM是否处于正常运行;当一个VNF中包含有多个VM时,多个VM之间可以进行通信,VNF监测内部的多个VM之间的通信是否处于正常,同时也要监测内部的每一个VM是否处于正常运行。
可选的,故障处理系统中包含有多个VNF,每个VNF中包含有至少一个VM,每个VNF只能监测自身内部的至少一个VM的运行情况。
比如:VNF监测到内部一个VM的运行情况出现故障;又比如:VNF监测到内部的两个VM之间的通信出现故障。
步骤302,VNF检测存在故障的VM属于的故障类型。
当VNF监测到内部的至少一个VM的运行情况出现异常时,根据出现的异常运行情况,检测存在故障的VM属于的故障类型。
VM的故障类型包括:操作系统类故障和/或通信亚健康故障。其中,操作系统类故障是指VM内部的操作系统出现故障,也可以称之为OS故障;通信亚健康故障是指VM之间的网络通信质量差于预设条件的故障。
当VNF检测到VM内部的操作系统出现故障时,确定该VM存在操作系统类故障;当VNF检测到VM之间的网络通信质量差于预设条件时,确定该VM之间存在通信亚健康故障。
当VM存在操作系统类故障时,进入步骤303;当VM存在通信亚健康故障时,进入步骤307。
步骤303,当VM存在操作系统类故障时,VNF决策对VM进行本地重建修复。
其中,本地重建修复是在VM原始所属的物理计算机上对VM进行的重建修复。如图3B所示,本地重建修复前,VNF内部包含有VM1,对应VM1的处理器参数1、内存参数1和网络接口参数1,在本地重建修复前,VM1所属的物理计算机为物理服务器1;则本地重建修复后,VNF内部包含有重建修复后的VM1,对应VM1的处理器参数1、内存参数1、网络接口参数1和所属的物理服务器1仍然保持不变。
当VNF监测出内部的至少一个VM中存在一个VM出现了操作系统类故障时,VNF将监测到的操作系统类故障发送给VNF内部的仲裁者组件,该仲裁者组件用于根据VNF发送的操作系统类故障决策对该VM进行本地重建修复。其中,VNF内部的仲裁者组件可以由软件实现。
可选的,仲裁者组件可以根据VNF发送的操作系统类故障和配置文件决策对该VM进行自动下电。其中,配置文件可以由用户自身配置,也可以由操作系统预先配置。
比如:VNF监测到内部的一个VM出现操作系统类故障,VNF将操作系统类故障发送给仲裁者组件,仲裁者组件根据操作系统类故障和配置文件,决策对出现操作系统类故障的VM进行本地重建修复;又比如:VNF监测到内部的多个VM出现操作系统类故障,VNF将操作系统类故障发送给仲裁者组件,仲裁者组件根据操作系统类故障和配置文件决策对出现故障的多个VM进行自动下电。
步骤304,在决策进行本地重建修复时,VNF向VNFM发送重建修复请求。
在VNF内部的仲裁者组件根据接收到的操作系统类故障决策对VM进行本地重建修复时,VNF向VNFM发送重建修复请求。
可选的,在VNF内部的仲裁者组件根据接收到的操作系统类故障决策对VM进行本地重建修复时,VNF调用VNFM提供的重建接口,通过重建接口向VNFM发送重建修复请求。
其中,重建接口是用于VNF与VNFM之间处理VM故障时通信的接口。
可选的,重建修复请求中包含:重建类型、进行VM修复的个数以及进行VM修复的VM标识。
其中,重建类型用于VNFM根据重建类型指示VIM对VM进行与重建类型对应的重建修复。进行VM修复的个数用于VNFM确定需要进行重建修复的VM的个数。VM标识用于确定需要进行重建修复的VM的位置。可选的,VIM可以根据VNFM的指示同时对多个VM进行本地重建修复。其中,多个VM可以是一个VNF内部的VM,也可以是多个VNF中的VM。
VNFM根据重建修复请求中包含的重建类型、进行VM修复的个数以及进行VM修复的VM标识指示VIM对与重建修复请求对应的VM进行重建修复。
步骤305,VNFM根据重建修复请求指示VIM对VM进行本地重建修复。
VNFM根据接收到的本地重建修复的重建修复请求指示VIM对VM进行本地重建修复。
步骤306,VNFM向VNF发送重建失败反馈。
重建失败反馈是VIM根据VNFM的指示对VM重建失败时的反馈。
当VNFM根据接收到的本地重建修复的重建修复请求指示VIM对VM进行本地重建修复失败时,VNFM向VNF发送重建失败反馈。
步骤307,在对VM进行N次本地重建修复失败时,VNF决策对VM进行异地重建修复,N为预定阈值。
其中,异地重建修复是在除VM原始所属的物理计算机的其它物理计算机上对VM进行的重建修复。
在对VM进行N次本地重建修复失败时,VNF决策对VM进行异地修复,其中,N为预先设置的阈值。如图3C所示,异地重建修复前,VNF内部包含有VM1,对应VM1的处理器参数1、内存参数1和网络接口参数1,在异地重建修复前,VM1所属的物理计算机为物理服务器1;则异地重建修复后,VNF内部包含有VM1,对应VM1的处理器参数1、内存参数1和网络接口参数1仍然保持不变,但是VM1所属的物理计算机由物理服务器1变为物理服务器2。
当VNF监测出内部的VM出现操作系统类故障时,首先决策对出现故障的VM进行本地重建修复,当对出现故障的VM进行N次的本地重建修复失败后,VNF再次决策对出现故障的VM进行异地重建修复。
其中,本地重建修复用于在VM原始所属的物理计算机上对VM进行重建修复;而异地重建修复用于在除VM原始所属的物理计算机的其它物理计算机上对VM进行的重建修复。
可选的,重建修复后的VM的预定属性信息保持不变。
其中,预定属性信息包括:处理器参数、内存参数、硬盘参数和网络接口参数中的至少一种。
步骤308,在决策进行异地重建修复时,VNF向VNFM发送重建修复请求。
在对VM进行N次本地重建修复失败后,VNF向VNFM发送异地重建修复的重建修复请求,VNFM根据重建修复请求指示VIM对VM进行异地重建修复。
步骤309,VNFM根据重建修复请求指示VIM对VM进行异地重建修复。
VNFM根据接收到的异地重建修复的重建修复请求,指示VIM对VM进行异地重建修复。
在对VM进行N次本地重建修复失败时,进行异地重建修复,无论异地重建修复成功或失败均转至步骤313。
步骤310,当VM存在通信亚健康故障时,VNF对VM决策进行异地重建修复。
其中,通信亚健康故障是VM之间的网络通信质量差于预设条件的故障,异地重建修复是在除VM原始所属的物理计算机的其它物理计算机上对VM进行的重建修复。
可选的,故障处理系统中包含有多个VNF,每个VNF中包含有至少一个VM,一个VNF内部的多个VM之间可以通过VNF内部的网络进行通信;多个VNF中的VM之间可以通过VNF之间的网络进行通信。
当VNF内部的多个VM之间的网络通信质量差于预设条件时,则确定该多个VM之间存在通信亚健康故障。
可选的,当多个VNF中的VM之间的网络通信质量差于预设条件时,则确定该多个VNF中进行网络通信的VM之间存在通信亚健康故障。
当VNF监测出内部存在至少一个VM出现了通信亚健康故障时,则VNF将监测到的通信亚健康故障发送给VNF内部的仲裁者组件,该仲裁者组件用于根据VNF发送的通信亚健康故障决策对该VM进行异地重建修复。其中,VNF内部的仲裁者组件可以由软件实现。
可选的,仲裁者组件可以根据VNF发送的通信亚健康故障和配置文件决策对该VM进行自动下电。其中,配置文件可以由用户自身配置,也可以由操作系统预先配置。
比如:VNF监测到内部的多个VM在通信过程中出现了通信亚健康故障,则VNF将通信亚健康故障发送给仲裁者组件,仲裁者组件根据通信亚健康故障和配置文件决策对出现通信亚健康故障的所有VM进行异地重建修复;可选的,仲裁者组件根据通信亚健康故障和配置文件决策对出现通信亚健康故障的部分VM进行异地重建修复。
步骤311,在决策进行异地重建修复时,VNF向VNFM发送重建修复请求。
在VNF内部的仲裁者组件根据接收到的通信亚健康故障决策对VM进行异地重建修复时,VNF向VNFM发送重建修复请求。
可选的,在VNF内部的仲裁者组件根据接收到的通信亚健康故障决策对VM进行异地重建修复时,VNF调用VNFM提供的重建接口,通过重建接口向VNFM发送重建修复请求。其中,重建接口用于VNF与VNFM之间处理VM故障时通信的接口。
可选的,VNFM提供一个共用的重建接口,该重建接口用于VNF向VNFM发送本地重建修复的请求和异地重建修复的请求。
可选的,VNFM提供多个重建接口,VNF向VNFM发送本地重建修复的请求时调用VNFM提供的重建接口A;VNF向VNFM发送异地重建修复的请求时调用VNFM提供的重建接口B。
可选的,VNF向VNFM发送的重建修复请求中包含有重建类型、进行VM修复的个数以及进行VM修复的VM标识。
其中,重建类型用于VNFM根据重建类型指示VIM对VM进行与重建类型对应的重建修复。进行VM修复的个数用于VNFM确定需要进行重建修复的VM的个数。VM标识用于确定需要进行重建修复的VM的位置。可选的,VIM可以根据VNFM的指示同时对多个VM进行异地重建修复。其中,多个VM可以是一个VNF内部的VM,也可以是多个VNF中的VM。
VNFM根据重建修复请求中包含的重建类型、进行VM修复的个数以及进行VM修复的VM标识指示VIM对与重建修复请求对应的VM进行重建修复。
步骤312,VNFM根据重建修复请求指示VIM对VM进行异地重建修复。
VNFM根据接收到的异地重建修复的重建修复请求,指示VIM对VM进行异地重建修复。
步骤313,VNFM向VNF发送重建修复反馈。
其中,重建修复反馈包括:重建失败反馈或重建成功反馈,重建失败反馈是VIM根据VNFM的指示对VM重建失败时的反馈,重建成功反馈是VIM根据VNFM的指示对VM重建成功时的反馈。
VNFM根据重建修复请求指示VIM对VM进行重建修复后,VNFM将重建修复后的结果反馈给VNF。
对应地,VNF接收VNFM发送的重建修复反馈。
重建修复反馈包括:重建失败反馈或重建成功反馈。当VIM根据VNFM指示对VM进行的重建修复并未成功时,VNFM向VNF发送重建失败反馈;当VIM根据VNFM指示对VM进行的重建修复成功后,VNFM向VNF发送重建成功反馈。
其中,若VIM根据VNFM指示对VM进行的重建修复成功,VNFM向VNF发送的重建成功反馈中携带有重建修复后的VM的预定属性信息。
其中,预定属性信息包括:处理器参数、内存参数、硬盘参数和网络接口参数中的至少一种。
其中,网络接口参数包括:每个VNF内部VM之间进行通信的接口参数和VNF之间VM进行通信的接口参数。
若VIM根据VNFM指示对VM进行的重建修复未成功时,VNFM向VNF发送的重建失败反馈中携带有未成功重建修复的VM的个数和对应的VM的标识。
可选的,重建修复反馈中还携带有重建修复后的VM所属的物理计算机的名称。
综上所述,本发明实施例提供的故障处理方法,通过VNF监测内部的至少一个VM的运行情况;在VM存在故障时,VNF根据故障决策是否进行VM重建修复;在决策进行VM重建修复时,VNF向VNFM发送重建修复请求,VNFM用于根据重建修复请求指示VIM对VM进行重建修复;解决了现有技术中VM发生故障时需要通过技术人员的人工修复来解决VM故障的问题;达到了在VM存在故障时,通过VNFM与VIM之间的交互,实现VIM对VM进行自动重建修复的效果,而且VNFM根据重建修复请求指示VIM对VM进行重建修复,减少了VM故障处理的响应时间,同时自动重建修复也降低了管理该系统的资源的效果。
另外,在VM存在操作系统类故障时,VNF决策对VM进行本地重建修复,利用在VM原始所属的物理计算机上对VM进行重建修复,降低了对VM故障的处理时间,实现了对VM故障的自动重建修复。
VNFM在根据重建修复请求指示VIM对VM进行重建修复后,将重建修复的结果发送给VNF,针对不同的重建修复结果,向VNF发送不同的反馈,有利于VNF及时了解故障VM的处理结果,同时可以及时了解重建修复后的VM的属性信息。
在一个具体的例子中,VNF监测内部的至少一个VM的运行情况,当VNF监测出内部的一个VM存在故障时,VNF根据VM存在的故障决策对VM进行重建修复;在VNF决策出对VM进行重建修复后,VNF调用VNFM提供的重建接口,通过重建接口向VNFM发送重建修复请求;其中,重建修复请求中包含:重建类型、进行VM修复的个数以及进行VM修复的VM标识。
示例性的,重建修复请求中包含的参数如下表一所示:
表一
VNF调用VNFM提供的重建接口向VNFM发送重建修复请求后,VNFM根据重建修复请求指示VIM对VM进行重建修复。进行重建修复后,VNFM向VNF发送重建修复反馈,该重建修复反馈中包括有重建修复后的VM的预定属性信息和所属的物理计算机的名称。其中,预定属性信息包括:处理器参数、内存参数、硬盘参数和网络接口参数中的至少一种。
示例性的,重建修复反馈中包含的参数如下表二所示:
表二
示例性的,VNF调用VNFM提供的重建接口,通过重建接口向VNFM发送重建修复请求的实现代码为:
示例性的,重建修复成功后,VNFM向VNF发送重建修复反馈的实现代码为:
请参考图4,其示出了本发明一个示例性实施例提供的一种故障处理装置的框图。该故障处理装置可以通过软件、硬件或者两者的结合实现成为故障处理系统的全部或者一部分。该故障处理装置可以包括:监测单元410、决策单元420和发送单元430。
监测单元410,用于VNF监测内部的至少一个VM的运行情况。
决策单元420,用于在VM存在故障时,VNF根据故障决策是否进行VM重建修复。
发送单元430,用于在决策进行VM重建修复时,VNF向VNFM发送重建修复请求,VNFM用于根据重建修复请求指示VIM对VM进行重建修复。
相关细节可结合参考上述方法实施例。
在另一个可选的实施例中,上述决策单元420,还用于在VM存在操作系统类故障时,VNF决策对VM进行本地重建修复。
其中,本地重建修复是在VM原始所属的物理计算机上对VM进行的重建修复。
在另一个可选的实施例中,上述发送单元430,还用于在对VM进行N次本地重建修复失败时,VNF决策对VM进行异地重建修复,N为预定阈值。
异地重建修复是在除VM原始所属的物理计算机的其它物理计算机上对VM进行的重建修复。
在另一个可选的实施例中,上述决策单元420,还用于在VM存在通信亚健康故障时,VNF对VM决策进行异地重建修复。
其中,通信亚健康故障是VM之间的网络通信质量差于预设条件的故障,异地重建修复是在除VM原始所属的物理计算机的其它物理计算机上对VM进行的重建修复。
在另一个可选的实施例中,上述发送单元430,还用于VNF调用VNFM提供的重建接口,通过重建接口向VNFM发送重建修复请求。
在另一个可选的实施例中,重建修复后的VM的预定属性信息保持不变。
预定属性信息包括:处理器参数、内存参数、硬盘参数和网络接口参数中的至少一种。
在另一个可选的实施例中,上述故障处理装置还包括:接收单元440。
接收单元440,用于VNF接收VNFM发送的重建修复反馈。
其中,重建修复反馈包括:重建失败反馈或重建成功反馈,重建失败反馈是VIM根据VNFM的指示对VM重建失败时的反馈,重建成功反馈是VIM根据VNFM的指示对VM重建成功时的反馈。
综上所述,本发明实施例提供的故障处理装置,通过VNF监测内部的至少一个VM的运行情况;在VM存在故障时,VNF根据故障决策是否进行VM重建修复;在决策进行VM重建修复时,VNF向VNFM发送重建修复请求,VNFM用于根据重建修复请求指示VIM对VM进行重建修复;解决了现有技术中VM发生故障时需要通过技术人员的人工修复来解决VM故障的问题;达到了在VM存在故障时,通过VNFM与VIM之间的交互,实现VIM对VM进行自动重建修复的效果,而且VNFM根据重建修复请求指示VIM对VM进行重建修复,减少了VM故障处理的响应时间,同时自动重建修复也降低了管理该系统的资源的效果。
另外,在VM存在操作系统类故障时,VNF决策对VM进行本地重建修复,利用在VM原始所属的物理计算机上对VM进行重建修复,降低了对VM故障的处理时间,实现了对VM故障的自动重建修复。
VNFM在根据重建修复请求指示VIM对VM进行重建修复后,将重建修复的结果发送给VNF,针对不同的重建修复结果,向VNF发送不同的反馈,有利于VNF及时了解故障VM的处理结果,同时可以及时了解重建修复后的VM的属性信息。
请参考图5,其示出了本发明一个示例性实施例提供的一种故障处理系统的框图,该故障处理系统可以包括VNF510、VNFM520和VIM530。
VNF510,用于在VM存在故障时,根据故障决策是否进行VM重建修复;
VNFM520,用于根据重建修复请求指示VIM对VM进行重建修复;
VIM530,用于根据VNFM的指示对VM进行重建修复。
综上所述,本发明实施例提供的故障处理系统,通过VNF监测内部的至少一个VM的运行情况;在VM存在故障时,VNF根据故障决策是否进行VM重建修复;在决策进行VM重建修复时,VNF向VNFM发送重建修复请求,VNFM用于根据重建修复请求指示VIM对VM进行重建修复;解决了现有技术中VM发生故障时需要通过技术人员的人工修复来解决VM故障的问题;达到了在VM存在故障时,通过VNFM与VIM之间的交互,实现VIM对VM进行自动重建修复的效果,而且VNFM根据重建修复请求指示VIM对VM进行重建修复,减少了VM故障处理的响应时间,同时自动重建修复也降低了管理该系统的资源的效果。
需要说明的是:上述实施例提供的故障处理装置在处理故障时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的故障处理装置与故障处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种故障处理方法,其特征在于,所述方法包括:
虚拟网络功能VNF监测内部的至少一个虚拟机VM的运行情况;
在所述VM存在故障时,所述VNF根据所述故障决策是否进行VM重建修复;
在决策进行所述VM重建修复时,所述VNF向虚拟网络功能管理VNFM发送重建修复请求,所述VNFM用于根据所述重建修复请求指示虚拟基础设施管理器VIM对所述VM进行重建修复。
2.根据权利要求1所述的方法,其特征在于,所述在所述VM存在故障时,所述VNF根据所述故障决策是否进行VM重建修复,包括:
在所述VM存在操作系统类故障时,所述VNF决策对所述VM进行本地重建修复;
其中,所述本地重建修复是在所述VM原始所属的物理计算机上对所述VM进行的重建修复。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在对所述VM进行N次所述本地重建修复失败时,所述VNF决策对所述VM进行异地重建修复,N为预定阈值;
所述异地重建修复是在除所述VM原始所属的物理计算机的其它物理计算机上对所述VM进行的重建修复。
4.根据权利要求1所述的方法,其特征在于,所述在所述VM存在故障时,所述VNF根据所述故障决策是否进行VM重建修复,包括:
在所述VM存在通信亚健康故障时,所述VNF对所述VM决策进行异地重建修复;
其中,所述通信亚健康故障是VM之间的网络通信质量差于预设条件的故障,所述异地重建修复是在除所述VM原始所属的物理计算机的其它物理计算机上对所述VM进行的重建修复。
5.根据权利要求1至4任一所述的方法,其特征在于,所述VNF向虚拟网络功能管理VNFM发送重建修复请求,包括:
所述VNF调用所述VNFM提供的重建接口,通过所述重建接口向所述VNFM发送重建修复请求。
6.根据权利要求1至4任一所述的方法,其特征在于,重建修复后的所述VM的预定属性信息保持不变;
所述预定属性信息包括:处理器参数、内存参数、硬盘参数和网络接口参数中的至少一种。
7.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:
所述VNF接收所述VNFM发送的重建修复反馈;
其中,所述重建修复反馈包括:重建失败反馈或重建成功反馈,所述重建失败反馈是所述VIM根据所述VNFM的指示对所述VM重建失败时的反馈,所述重建成功反馈是所述VIM根据所述VNFM的指示对所述VM重建成功时的反馈。
8.一种故障处理装置,其特征在于,所述装置包括:
监测单元,用于虚拟网络功能VNF监测内部的至少一个虚拟机VM的运行情况;
决策单元,用于在所述VM存在故障时,所述VNF根据所述故障决策是否进行VM重建修复;
发送单元,用于在决策进行所述VM重建修复时,所述VNF向虚拟网络功能管理VNFM发送重建修复请求,所述VNFM用于根据所述重建修复请求指示虚拟基础设施管理器VIM对所述VM进行重建修复。
9.根据权利要求8所述的装置,其特征在于,所述决策单元,还用于在所述VM存在操作系统类故障时,所述VNF决策对所述VM进行本地重建修复;
其中,所述本地重建修复是在所述VM原始所属的物理计算机上对所述VM进行的重建修复。
10.根据权利要求9所述的装置,其特征在于,所述发送单元,还用于在对所述VM进行N次所述本地重建修复失败时,所述VNF决策对所述VM进行异地重建修复,N为预定阈值;
所述异地重建修复是在除所述VM原始所属的物理计算机的其它物理计算机上对所述VM进行的重建修复。
11.根据权利要求8所述的装置,其特征在于,所述决策单元,还用于在所述VM存在通信亚健康故障时,所述VNF对所述VM决策进行异地重建修复;
其中,所述通信亚健康故障是VM之间的网络通信质量差于预设条件的故障,所述异地重建修复是在除所述VM原始所属的物理计算机的其它物理计算机上对所述VM进行的重建修复。
12.根据权利要求8至11任一所述的装置,其特征在于,所述发送单元,还用于所述VNF调用所述VNFM提供的重建接口,通过所述重建接口向所述VNFM发送重建修复请求。
13.根据权利要求8至11任一所述的装置,其特征在于,重建修复后的所述VM的预定属性信息保持不变;
所述预定属性信息包括:处理器参数、内存参数、硬盘参数和网络接口参数中的至少一种。
14.根据权利要求8至11任一所述的装置,其特征在于,所述装置还包括:
接收单元,用于所述VNF接收所述VNFM发送的重建修复反馈;
其中,所述重建修复反馈包括:重建失败反馈或重建成功反馈,所述重建失败反馈是所述VIM根据所述VNFM的指示对所述VM重建失败时的反馈,所述重建成功反馈是所述VIM根据所述VNFM的指示对所述VM重建成功时的反馈。
15.一种故障处理系统,其特征在于,所述系统包括:VNF、VNFM和VIM;
所述VNF,用于监测内部的至少一个虚拟机VM的运行情况,在所述VM存在故障时根据所述故障决策是否进行VM重建修复,在决策进行所述VM重建修复时向所述VNFM发送重建修复请求;
所述VNFM,用于根据重建修复请求指示所述VIM对所述VM进行重建修复;
所述VIM,用于根据所述VNFM的指示对所述VM进行重建修复。
CN201511032571.4A 2015-12-31 2015-12-31 故障处理方法、装置及系统 Active CN105681077B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201511032571.4A CN105681077B (zh) 2015-12-31 2015-12-31 故障处理方法、装置及系统
EP16881114.9A EP3386170B1 (en) 2015-12-31 2016-12-24 Fault processing method, device and system
PCT/CN2016/111936 WO2017114325A1 (zh) 2015-12-31 2016-12-24 故障处理方法、装置及系统
US16/022,392 US11032130B2 (en) 2015-12-31 2018-06-28 Troubleshooting method, apparatus, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511032571.4A CN105681077B (zh) 2015-12-31 2015-12-31 故障处理方法、装置及系统

Publications (2)

Publication Number Publication Date
CN105681077A true CN105681077A (zh) 2016-06-15
CN105681077B CN105681077B (zh) 2019-04-05

Family

ID=56189985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511032571.4A Active CN105681077B (zh) 2015-12-31 2015-12-31 故障处理方法、装置及系统

Country Status (4)

Country Link
US (1) US11032130B2 (zh)
EP (1) EP3386170B1 (zh)
CN (1) CN105681077B (zh)
WO (1) WO2017114325A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107222352A (zh) * 2017-06-30 2017-09-29 郑州云海信息技术有限公司 一种管理网恢复方法及装置
WO2018023217A1 (zh) * 2016-07-30 2018-02-08 华为技术有限公司 一种建立虚拟机的方法、装置和系统
CN109995568A (zh) * 2018-01-02 2019-07-09 中国移动通信有限公司研究院 故障联动处理方法、网元及存储介质
CN109995574A (zh) * 2018-01-02 2019-07-09 中兴通讯股份有限公司 一种修复vnfm故障的方法、监测器、vim、vnfm及存储介质
CN110618884A (zh) * 2018-06-19 2019-12-27 中国电信股份有限公司 故障监控方法、虚拟化的网络功能模块管理器和存储介质
CN110661641A (zh) * 2018-06-29 2020-01-07 华为技术有限公司 一种虚拟网络功能vnf部署方法及装置
CN114416284A (zh) * 2021-12-24 2022-04-29 北京百度网讯科技有限公司 分布式作业系统控制方法、装置、设备、介质及程序产品

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10761934B2 (en) 2018-05-16 2020-09-01 Hewlett Packard Enterprise Development Lp Reconstruction of data of virtual machines
US10666497B2 (en) * 2018-06-22 2020-05-26 Intel Corporation Localized service resiliency
US10929250B2 (en) * 2018-09-27 2021-02-23 EMC IP Holding Company LLC Method and system for reliably restoring virtual machines
DE112018008114B4 (de) * 2018-11-01 2024-06-13 Hewlett Packard Enterprise Development Lp Reaktion einer virtuellen netzwerkfunktion auf eine dienstunterbrechung
CN113039763B (zh) * 2018-11-14 2024-05-24 瑞典爱立信有限公司 使用nf之间的直接信令的nf服务消费者重启检测
US10880370B2 (en) 2018-11-27 2020-12-29 At&T Intellectual Property I, L.P. Virtual network manager system
GB2583904B (en) * 2019-04-23 2023-03-08 Metaswitch Networks Ltd Commissioning a virtualised network function
CN110308969B (zh) * 2019-06-26 2025-05-30 深圳前海微众银行股份有限公司 故障演练方法、装置、设备及计算机存储介质
US12081386B2 (en) * 2021-02-12 2024-09-03 Rakuten Symphony Singapore Pte. Ltd. Network service management apparatus and network service management method for identifying a failure

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801806A (zh) * 2012-08-10 2012-11-28 薛海强 一种云计算系统及云计算资源管理方法
CN104170323A (zh) * 2014-04-09 2014-11-26 华为技术有限公司 基于网络功能虚拟化的故障处理方法及装置、系统
CN104468181A (zh) * 2013-09-23 2015-03-25 英特尔公司 虚拟网络设备故障的检测和处理
WO2015109443A1 (zh) * 2014-01-21 2015-07-30 华为技术有限公司 网络服务故障处理方法,服务管理系统和系统管理模块
CN105187249A (zh) * 2015-09-22 2015-12-23 华为技术有限公司 一种故障恢复方法及装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0112781D0 (en) * 2001-05-25 2001-07-18 Global Continuity Plc Method for rapid recovery from a network file server failure
US8554981B2 (en) * 2007-02-02 2013-10-08 Vmware, Inc. High availability virtual machine cluster
US8381032B2 (en) * 2008-08-06 2013-02-19 O'shantel Software L.L.C. System-directed checkpointing implementation using a hypervisor layer
US8689211B2 (en) * 2009-05-25 2014-04-01 International Business Machines Corporation Live migration of virtual machines in a computing environment
US8873375B2 (en) * 2009-07-22 2014-10-28 Broadcom Corporation Method and system for fault tolerance and resilience for virtualized machines in a network
US8789041B2 (en) * 2009-12-18 2014-07-22 Verizon Patent And Licensing Inc. Method and system for bulk automated virtual machine deployment
US8510590B2 (en) * 2010-03-17 2013-08-13 Vmware, Inc. Method and system for cluster resource management in a virtualized computing environment
CN104685830B (zh) * 2013-09-30 2018-03-06 华为技术有限公司 故障管理的方法、实体和系统
US9841991B2 (en) * 2014-05-12 2017-12-12 Netapp, Inc. Techniques for virtual machine migration
US9678838B2 (en) * 2014-06-20 2017-06-13 Vmware, Inc. Protecting virtual machines from network failures
US9971660B2 (en) * 2014-09-12 2018-05-15 Vmware, Inc. Virtual machine network loss detection and recovery for high availability
US9594649B2 (en) * 2014-10-13 2017-03-14 At&T Intellectual Property I, L.P. Network virtualization policy management system
WO2016071736A1 (en) * 2014-11-04 2016-05-12 Telefonaktiebolaget L M Ericsson (Publ) Network function virtualization service chaining
WO2016093861A1 (en) * 2014-12-12 2016-06-16 Nokia Solutions And Networks Oy Alarm correlation in network function virtualization environment
US9946614B2 (en) * 2014-12-16 2018-04-17 At&T Intellectual Property I, L.P. Methods, systems, and computer readable storage devices for managing faults in a virtual machine network
KR20170109603A (ko) * 2015-01-28 2017-09-29 닛본 덴끼 가부시끼가이샤 가상 네트워크 기능 관리 장치, 시스템, 힐링 방법 및 프로그램
US10089123B2 (en) * 2015-05-04 2018-10-02 Cisco Technology, Inc. Virtual cable modem termination system redundancy in a cable modem network environment
US9921885B2 (en) * 2015-06-19 2018-03-20 Vmware, Inc. Resource management for containers in a virtualized environment
KR101714522B1 (ko) * 2015-11-10 2017-03-09 현대자동차주식회사 가상화 프레임웍 기반 차량 avn 스마트폰 연동 서비스 제공 방법 및 그를 위한 장치
US10154087B2 (en) * 2016-01-15 2018-12-11 Affirmed Networks, Inc. Database based redundancy in a telecommunications network

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801806A (zh) * 2012-08-10 2012-11-28 薛海强 一种云计算系统及云计算资源管理方法
CN104468181A (zh) * 2013-09-23 2015-03-25 英特尔公司 虚拟网络设备故障的检测和处理
WO2015109443A1 (zh) * 2014-01-21 2015-07-30 华为技术有限公司 网络服务故障处理方法,服务管理系统和系统管理模块
CN104170323A (zh) * 2014-04-09 2014-11-26 华为技术有限公司 基于网络功能虚拟化的故障处理方法及装置、系统
CN105187249A (zh) * 2015-09-22 2015-12-23 华为技术有限公司 一种故障恢复方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018023217A1 (zh) * 2016-07-30 2018-02-08 华为技术有限公司 一种建立虚拟机的方法、装置和系统
CN107222352A (zh) * 2017-06-30 2017-09-29 郑州云海信息技术有限公司 一种管理网恢复方法及装置
CN107222352B (zh) * 2017-06-30 2020-09-18 苏州浪潮智能科技有限公司 一种管理网恢复方法及装置
CN109995568B (zh) * 2018-01-02 2022-03-29 中国移动通信有限公司研究院 故障联动处理方法、网元及存储介质
CN109995568A (zh) * 2018-01-02 2019-07-09 中国移动通信有限公司研究院 故障联动处理方法、网元及存储介质
CN109995574A (zh) * 2018-01-02 2019-07-09 中兴通讯股份有限公司 一种修复vnfm故障的方法、监测器、vim、vnfm及存储介质
WO2019134461A1 (zh) * 2018-01-02 2019-07-11 中兴通讯股份有限公司 一种修复vnfm故障的方法、监测器、vim、vnfm及存储介质
CN110618884A (zh) * 2018-06-19 2019-12-27 中国电信股份有限公司 故障监控方法、虚拟化的网络功能模块管理器和存储介质
CN110661641A (zh) * 2018-06-29 2020-01-07 华为技术有限公司 一种虚拟网络功能vnf部署方法及装置
US11886904B2 (en) 2018-06-29 2024-01-30 Huawei Technologies Co., Ltd. Virtual network function VNF deployment method and apparatus
CN114416284A (zh) * 2021-12-24 2022-04-29 北京百度网讯科技有限公司 分布式作业系统控制方法、装置、设备、介质及程序产品
WO2023115836A1 (zh) * 2021-12-24 2023-06-29 北京百度网讯科技有限公司 分布式作业系统控制方法、装置、设备、介质及程序产品
US12298839B2 (en) 2021-12-24 2025-05-13 Beijing Baidu Netcom Science Technology Co., Ltd. Method for controlling distributed operation system, device, and medium

Also Published As

Publication number Publication date
WO2017114325A1 (zh) 2017-07-06
US20180309621A1 (en) 2018-10-25
EP3386170B1 (en) 2021-10-27
EP3386170A4 (en) 2018-12-26
CN105681077B (zh) 2019-04-05
US11032130B2 (en) 2021-06-08
EP3386170A1 (en) 2018-10-10

Similar Documents

Publication Publication Date Title
CN105681077A (zh) 故障处理方法、装置及系统
US11429369B2 (en) Distributed upgrade in virtualized computing environments
US10644952B2 (en) VNF failover method and apparatus
EP3182678B1 (en) Method for upgrading network function virtualization application, and related system
JP6026705B2 (ja) 更新管理システムおよび更新管理方法
EP3291499A1 (en) Method and apparatus for network service capacity expansion
CN106134141B (zh) 一种更新网络服务描述器nsd的方法及装置
US9634886B2 (en) Method and apparatus for providing tenant redundancy
WO2017107656A1 (zh) 虚拟化网元故障自愈方法及装置
CN107332814B (zh) 一种请求消息传输方法及装置
CN104038376A (zh) 一种管理真实服务器的方法、装置及lvs集群系统
CN108471373B (zh) 一种资源申请、vnf实例创建方法及装置
CN105049293A (zh) 监控的方法及装置
WO2018137520A1 (zh) 一种业务恢复方法及装置
CN102882698B (zh) 虚拟机管理方法及系统
US12386649B2 (en) Server maintenance control device, server maintenance system, server maintenance control method, and program
CN105187482B (zh) 一种PaaS平台故障自愈实现的方法及消息服务器
WO2018010068A1 (zh) 网络功能虚拟化环境中的报警方法及装置
CN111669290A (zh) 网元管理方法、管理服务器和存储介质
JP2015170344A (ja) スタック管理装置、スタック管理方法、および、スタック管理プログラム
CN120029828B (zh) 进程状态的恢复方法和装置、存储介质及电子设备
CN104333459A (zh) 云数据中心故障管理方法和装置
US9690614B1 (en) Methods, systems, and computer readable mediums for orchestrating the automated installation of an application in a virtual environment
US20240378044A1 (en) Parallel multi-rack dataplane upgrades
CN117579465A (zh) 一种故障处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant