BRPI0721371A2

BRPI0721371A2 - método para localizar uma falha em uma rede, e, gerenciamento de rede

Info

Publication number: BRPI0721371A2
Application number: BRPI0721371-9A
Authority: BR
Inventors: Janos Farkas; Wei Zhao
Original assignee: Ericsson Telefon Ab L M
Priority date: 2007-02-08
Filing date: 2007-02-08
Publication date: 2013-01-01
Also published as: US8174992B2; BRPI0721371B1; WO2008095538A1; EP2109958B1; ATE495607T1; US20100177641A1; CN101601228B; EP2109958A1; DE602007011987D1; CN101601228A; ES2359097T3

Abstract

MéTODO PARA LOCALIZAR UMA FALHA EM UMA REDE, E, GERENCIAMENO DE REDE. Um método para localizar a falha em uma rede é divulgado. A rede compreende nós (SW4), enlaccs, e nós de borda )ENI...EN4) arranjada como uma pluralidade de árvores geradoras (T1, T2, T3) , as àrvores geradoras sendo parcialmente disjuntas. A rede ainda compreende meios de gerenciamento de rde. O método compreendendo os passos de receber informação sobre a configuração da pluralidade de topologias de árvore em uma rede; monitorar conectividade em uma rede; quando da detecção de uma perda de conctividade na rede, identificar a árvore(s) falhada(s), e determinar um elemento de rede comum para árvore(s) falhada(s).

Description

"MÉTODO PARA LOCALIZAR UMA FALHA EM UMA REDE, E, GERENCIAMENTO DE REDE" Campo técnico

A presente invenção se refere à um método para localização de falha em redes. Em particular se refere à um método para localizar falhas em múltiplas arquiteturas baseadas em árvore geradora múltiplas. Fundamento

Para a rede de acesso de Ethernet ser capaz de entregar serviços graduados de transporte, rápida detecção de falha e tempo de superação de falha estão se tornando mais e mais importante. Após a falha ser detectada e dados comutados para trajetos alternativos, há necessidade de ter um mecanismo para localizar a falha em uma rede e então corrigi-la.

Protocolo de Gerenciamento de Rede Simples (SNMP), RFCl 157, fornece o mecanismo de armadilha para elementos de rede gerenciados acionarem alarmes para um sistema de gerenciamento quando uma falha ocorre. Armadilhas de SNMP são eventos pré-definidos, entre os quais por exemplo, "enlace derrubado" é um dos eventos mais comuns definido pela RFCl 157 e suportado por todos os vendedores. Quando uma falha de enlace ocorre, o dispositivo de rede gerenciado associado com este enlace vai emitir um evento de notificação para o sistema de gerenciamento. Quando recebendo o evento, o sistema de gerenciamento pode escolher fazer algumas ações baseadas no evento, por exemplo, corrigindo a falha do enlace, etc.

Uma abordagem mais nova especificada através da IEEE 802.1ag ("Draft Standard for Local and Metropolitan Área Networks - Virtual

T

Bridged Local Area Networks - Amendment 5: Connectivity Fault Management", IEEE 802. lag, 2005) tenta abordar o gerenciamento da falha, incluindo localização de falha, da camada 2. Isto fornece ambos, uma arquitetura e mensagens de trabalho que são em correspondência com Camada-2 para IP Ping e TraceRoute. A essência da arquitetura do 802.1ag está nos domínios de gerenciamento em ninho e a designação de pontos finais de manutenção e pontos intermediários de manutenção. A arquitetura em ninhos fornece ambos uma vista fim a fim da rede completa ao longo do trajeto de aprovisionamento de serviço e tocador responsável detalhada de cada parte da rede. Então, quando uma falha de enlace ocorre, é fácil aborda a falha em uma base de camada à camada e atinge o nível onde responsabilidade existem e ações têm de ser tomadas. Á parte da própria arquitetura, 802.1ag também define quatro mensagens para troca de informação e localização de falha:

Mensagens de verificação de continuidade:

Essas são mensagens "batida de coração" emitidas periodicamente através de pontos finais de manutenção. Elas permitem pontos finais de manutenção para detectar perda de conectividade de serviço entre elas mesmas. Elas também permitem pontos finais de manutenção para descobrir outros pontos finais de manutenção dentro de um domínio, e permite pontos intermediários de manutenção para descobrir pontos finais de manutenção.

Mensagens de rastreio de enlace: Elas são transmitidas por um ponto final de manutenção

quando da solicitação do administrador para rastrear o trajeto (salto à salto) para um ponto final de manutenção de destino. Elas permitem ao nó de transmissão descobrir dados vitais de conectividade sobre o trajeto. É similar em conceito ao IP TraceRoute. Mensagens de laço para trás:

Elas são transmitidas por um ponto de manutenção quando da solicitação do administrador para verificar a conectividade para um particular ponto intermediário de manutenção ou ponto final de manutenção. Laço para trás indica se o ponto de manutenção alvo é alcançável ou não; isto não permite descoberto salto à salto do trajeto. Isto é similar em conceito ao ICMP Echo (Ping). Mensagens de AIS:

Essas fornecem notificação assíncrona para outros elementos em uma rede que há uma falha na rede metro Ethernet. AIS é tipicamente usado para suprimir alarmes nos elementos de rede outros do que os uns que diretamente detectam a falha .

Nas redes onde nós são interconectado através de múltiplos trajetos o Protocolo de Árvore geradora (STP) pode prevenir laços de serem formados. Isto assegura que haja somente um trajeto ativo entre qualquer dois dispositivos de redes. A totalidade de trajetos ativos forma uma assim chamada árvore geradora. O Protocolo de Árvore geradora Múltiplo (MSTP) permite várias VLANs serem mapeadas para um reduzido número de árvores geradoras. Isto é possível já que a maioria das redes não requer mais do que umas poucas tecnologias lógicas. Cada árvore trata múltiplas VLANs que têm a mesma topologia. Nestas condições, um número de múltiplas árvores geradoras baseadas em arquiteturas tolerantes a falha tem sido proposto.

Como descrito por S. Sharama, K. Gopalan, S. Nanda, e T. Chiueh in "Viking: A multi-spanning-tree Ethernet architecture for metropolitan area and cluster networks", IEEE INFOCOM 2004, a arquitetura Viking usa múltiplas árvores geradoras que são re-configuradas após um evento de falha. O Viking Manager (VM) é notificado através de armadilhas de SNMP se uma falha acontece. VM então notifica aos nós de bordas da rede que eles têm de redirecionar o tráfego para árvores não danificadas e inicia o recálculo e re-configuração das árvores.

Ao contrário, o conceito de Ethernet elástica de baixo custo é baseado em árvores geradoras estática que são configuradas antes da operação de rede e não muda apesar das ocorrências de falha (J. Farkas, C. Antal, G. Toth e L. Westberg, "Distributed Resilient Architecture for Ethernet Networks", Proceedings of Designs of REliable Communications Networks, 16-19 October 2005, pp. 512-522; J. Farkas, C. Antal, L. Westberg, A. Paradisi, T. R. Tronco e V. G. Oliveira, "Fast Failure Handling in Ethernet Networks", Proceedings of IEEE International Conference on Communications, 11-15 June 2006; J. Farkas, A. Paradisi, e C. Antal, "Low- cost survivable Ethernet architecture over fiber", J. Opt. Netw. 5, pp. 398-409, 2006). Nesta arquitetura, detecção de falha e tratamento de falha são implementados em uma maneira distribuída nos nós de borda. Esta arquitetura consiste de comutadores de padrão Ethernet comerciais e de baixo custo disponíveis no mercado; quaisquer soluções confiando na nova funcionalidade nos comutadores Ethernet são excluídas de modo a manter a vantagem de processamento de produtos de Ethernet correntes. As funcionalidades extras que são necessárias para fornecer elasticidade são implementadas como um protocolo de software nos nós de borda da rede Ethernet.

Fig. 2 mostra um exemplo para tal arquitetura. Múltiplas árvores geradoras pré-definidas são estatisticamente configuradas através de uma rede para servir como ou trajeto primário ou alternativo que podem ser usados para encaminhar tráfego na rede, assim sendo capaz de tratar as falhas possíveis. Para alcançara a proteção contra qualquer falha única de enlace ou nó, a topologia das árvores geradoras precisa ser tal que permanece pelo menos, uma completa árvore funcional no evento de falha de qualquer único rede elemento de rede único. Por conseguinte as árvores geradoras têm de ser parcialmente disjuntas, i. e. elas precisam compreender diferentes elementos de rede, elas não podem ser idênticas. Por exemplo, as árvores geradoras podem ser calculadas. Múltiplas falhas podem ser tratadas com mais árvores; isto é uma questão de projeto de árvore. As árvores geradoras são configuradas antes do lançamento inicial da rede, permanecendo imutável durante a operação, mesmo na presença de uma falha. No evento de uma falha, cada nó de borda precisa parar de encaminhar quadros para as árvores afetadas e redirecionar tráfego para árvores não danificadas. Por conseguinte, um protocolo é necessário para detecção de falha e para notificar todos os nós de borda sobre as árvores interrompidas. Tempo de superação de falha principalmente depende no tempo passado entre o evento da falha e sua detecção pelos nós de borda porque comutação de proteção de uma árvore para uma outra é feita sem qualquer re-configuração dos comutadores Ethernet.

O Protocolo de Tratamento de Falha (FHP) é um simples e

leve protocolo distribuído implementado nos nós de borda que se baseiam em poucas mensagens de radiodifusão para fornecer rápida proteção contra uma falha única de enlace ou nó ocorrido na rede.

O protocolo basicamente define três tipos de mensagens de

radiodifusão:

- Vivo: mensagem enviada periodicamente por um ou mais nós

de borda, referenciado como emissor, sobre cada VLAN de acordo com um intervalo de tempo pré-definido TVívo;

- Falha: mensagem emitida por um nó de borda, denominado notificador, quando uma mensagem de Vivo não chega sobre uma VLAN

dentro de um intervalo de detecção pré-definido TDi, para informar todos os outros nós de borda de um falha naquela VLAN;

- Reparada: mensagem emitida pelo mesmo notificador que detectou uma falha quando uma mensagem de Vivo chega sobre uma VLAN anteriormente falha para informar todos os outros nós de borda sobre o reparo

da VLAN falha.

Dois tipos de notificadores são distinguidos com base em suas configurações de contador de tempo: primário e secundário. Poucos notificadores são configurados como primários; todos os outros que são nem emissores nem notificadores primários são chamados notificadores secundários. A razão de diferenciar notificadores primários e secundários é para reduzir o número de mensagens de notificação concorrentes durante um evento de falha, como detalhado abaixo.

Conforme mostrado na Fig. 3, mensagens de Vivo são radiodifundidas periodicamente pelo nó de borda emissor sobre cada VLAN no começo do intervalo de tempo de Tvivo. O requisito é que mensagens de Vivo são recebidas em todas VLANs em cada outro nó de borda (notificador) dentro do intervalo de tempo TDI pré-definido. Como o retardo da transmissão é, em geral, diferente para cada notificador e intervalos de tempo de protocolo são curtos, o sincronismo de notificadores com relação para o emissor tem importância básica. Por conseguinte, cada notificador inicia um contador de tempo quando a primeira mensagem de Vivo chegou de modo a medir quando o Tdi passou, i. e. a primeira mensagem de Vivo recebida sincroniza o notificador com o emissor. Assim sendo, o efeito da diferença no retardo de transmissão entre diferentes notificadores foi eliminado. Subseqüentes mensagens de Vivo sofrem retardos um pouco diferentes conforme elas viajam por trajetos diferentes, que têm de ser levados em conta durante a configuração do TDi. A chegada de todas as mensagens de Vivo é registrada em cada nó de borda nofificador. Se há mensagens de Vivo que não chegara dentro de TDI, então as correspondentes VLANs são consideradas derrubadas. Isto é, a perda de uma única mensagem de Vivo é interpretada como o colapso de uma VLAN. Contudo, para evitar alarmes falsos devido a uma queda de quadro de Vivo, notificadores podem ser configurados para esperar dois ou três subseqüentes períodos de Vivo e marcar uma VLAN interrompida somente se mensagem de Vivo é consistentemente perdida em cada período.

Todos os nós de borda, exceto o emissor, supervisionam a recepção de mensagens de Vivo. Contudo, para evitar carga de protocolo excessiva após uma falha, há somente uns poucos nós de borda notificadores primários cuja tarefa é notificar outros nós de borda sobre a falha. O intervalo de detecção de notificadores primários é mais curto do que aquele de notificadores secundários, e isto pode ser ajustado dependendo do tamanho da rede e outros parâmetros. Quando um nó de borda notificador detecta uma falha, ele radiodifunde uma mensagem de Falha sobre cada VLAN operando que é considerada não danificadas, que contém os IDs das VLANs interrompidas. Como cada nó de borda recebe as mensagens de falha, todos eles se tornam cientes da VLANs falhas.

Como o número de notificadores primários é intencionalmente limitada, algumas falhas poderiam ser não detectadas dependendo de uma topologia de rede. Por conseguinte, se um notificador secundário detecta uma falha baseada na chegada perdida de uma mensagem de Vivo, então este nó radiodifunde a mensagem de falha para informar a todos os outros nós de borda da falha na mesma maneira como descrito acima. Abordagens baseadas em SNMP e CFM têm suas limitações.

Por exemplo, SNMP é dependente no apropriado funcionamento de IP, que não é sempre válido no ambiente de acesso Ethernet de camada-2. Armadilhas de SNMP podem ser usados para localização de falha como proposto por exemplo, na arquitetura de Viking discutido acima. Contudo, pode haver nós de rede que não são capazes de enviar armadilhas de SNMP, e. g. nós não gerenciáveis, não configurados ou nós configurados errados. Neste caso, a localização de falha não pode ser resolvida pelas armadilhas de SNMP. O 802.Iag é um padrão relativamente novo e o mecanismo especificado é complexo, e sua eficácia ainda não foi comprovado. Contudo, ambas as abordagens baseadas em SNMP e CFM têm um problema em comum: falta- lhes o apropriado mecanismo de superação da falha. Ambas soluções podem identificar quando e onde uma falha de enlace ocorre, mas nenhuma delas tem uma solução completa quanto a como conduzir a rede para contornar a falha. Sumário É um objeto da presente invenção para evitar pelo menos, algumas das desvantagens acima e fornecer uma método melhorado de localizar uma falha em uma rede.

De acordo com um primeiro aspecto da presente invenção, é fornecido um método para localizar uma falha em uma rede. A rede compreende nós, enlaces, e nós de borda configurados como uma pluralidade de árvores geradoras. As árvores geradoras são parcialmente disjuntas. O método compreende receber informação na configuração da pluralidade de topologias de árvore em uma rede e monitorar conectividade na rede. Quando da detecção de uma perda de conectividade na rede, a árvore(s) falhada(s) é identificada em uns elementos de rede comum para a árvore(s) falhada(s) é determinadas.

Em uma primeira configuração do aspecto acima, elementos de rede que são partes de árvores não falhadas podem ser determinados e excluídos.

Em uma outra configuração do aspecto acima, os elementos remanescentes de rede podem ser verificados para uma falha .

Em uma ainda configuração do aspecto acima, o passo de monitorar conectividade na rede pode ainda compreender monitorar por uma notificação de perda de conectividade em uma ou mais árvores.

Em ainda uma outra configuração do aspecto acima, a notificação mencionada pode compreender uma identificação da árvore falhada.

Em uma ainda configuração do aspecto acima, a notificação mencionada pode ainda compreender informação de trajeto a partir de um nó de borda de radiodifusão para um nó de borda reportando falha.

Em uma outra configuração do aspecto acima, monitoração de conectividade ponto a ponto pode ser aplicada e a notificação mencionada pode ainda compreender informação relacionando para os quais as conexões ponto a ponto falharam.

Em ainda uma configuração adicional do aspecto acima, a informação de trajeto é recuperada através de mensagens de Rastreio de Enlace.

De acordo com um segundo aspecto da presente invenção, é

fornecido um método de notificar perda de conectividade em uma rede. A rede compreende nós, enlaces, e nós de borda arranjados como uma pluralidade de árvores geradoras, as árvores geradoras sendo parcialmente disjuntas, a rede ainda compreendendo meios para gerenciamento de rede. O método compreende monitorar por radiodifusão de mensagens de Vivo através de um outro nó de borda. Quando da detecção de uma mensagem de Vivo perdida, o gerenciamento de rede é notificado de uma perda de conectividade.

Em uma primeira configuração do aspecto acima, o passo de notificar o gerenciamento de rede pode compreender enviar identificação da árvore(s) falhada(s).

Em uma outra configuração do aspecto acima, a notificação mencionada pode ainda compreende a informação de trajeto a partir do nó de borda de radiodifusão para o nó de borda reportando a falha.. Em uma configuração adicional do aspecto acima, quando da

detecção de perda de conectividade em uma árvore, os nós de borda podem redirecionar o tráfego para árvores não afetadas pela perda de conectividade.

De acordo com um terceiro aspecto da presente invenção, é fornecido um gerenciamento de rede adaptado para operar de acordo com o primeiro aspecto ou qualquer de suas configurações.

Em uma configuração do terceiro aspecto, um gerenciamento de rede compreende um servidor.

De acordo com um quarto aspecto da presente invenção é fornecido um nó de borda adaptado para operar de acordo com o segundo aspecto ou qualquer de suas configurações.

A presente invenção pode fornecer eficiente falha localização de falha eficiente onde múltiplas topologias de árvore lógica são usadas. Mais ainda, isto não introduz sobrecarga extra para as funções de tratamento de falha dos nós de bordas.

Descrição Breve dos Desenhos

Fig. 1 ilustra um exemplo de uma topologia física. Fig. 2 ilustra um exemplo de topologias lógicas. Fig. 3 mostra um gráfico esquemático de seqüência no tempo das mensagens de protocolo mensagens e funções do nó.

Fig. 4 mostra um fluxograma para notificar uma falha em uma rede de acordo com a presente invenção.

Fig. 5 mostra um fluxograma para localizar uma falha em uma rede de acordo com a presente invenção. Descrição Detalhada

Uma arquitetura de rede baseada em múltipla árvore geradora é descrita em detalhe em J. Farkas, C. Antal, G. Toth, L. Westberg, acima; J. Farkas, C. Antal, L. Westberg, A. Paradisi, T. R. Tronco, V. G. Oliveira, acima; e J. Farkas, A. Paradisi, e C. Antal, acima. Conseqüentemente topologias de árvore lógica são implementada em uma rede de modo a fornecer elasticidade. As árvores não são completamente, mas parcialmente disjuntas de modo a evitar complexidade de gerenciamento significante causado pelas árvores. O método de acordo com a presente invenção trabalha independentemente do projeto de topologias de árvore. A arquitetura sobrejacente consiste de nós internos e nós de

borda (EN) e os enlaces de interconexão. Nós internos podem ser equipamentos comerciais sem qualquer funcionalidade especial relacionada à arquitetura. Ao contrário, nós de borda implementam o Método de Tratamento de Falha (FHM) descrito acima . De acordo com este método, uma assim chamada mensagem de Vivo é radiodifundida em cada árvore e a chegada dessas mensagens é monitorada nos nós de borda. Baseada em mensagens de Vivo perdidas, colapso (ou perda de conectividade) de árvores pode ser detectada e nós de borda podem redirecionar o tráfego para árvores não danificadas. Restauração também pode ser resolvida com base em mensagens de Vivo aparecidas recentemente em árvores anteriormente interrompidas.

Outros métodos de monitorar a conectividade podem ser também aplicados e. g. CFM ou BFD, que são métodos de monitoração ponto

r

a ponto. E requisitado que todas as árvores tenham de ser monitoradas entre cada par de nó de borda e falha tem de ser reportada a um sistema de gerenciamento. Então o método de localização de falha descrito na presente invenção pode ser aplicado.

Assumindo que o método de tratamento de falha descrito acima seja aplicado em uma rede, a localização da falha pode ser determinada. Como uma mensagem de falha contendo o ID das topologias (árvores) lógicas interrompidas é radiodifundida após a falha, cada nó de borda está ciente das árvores interrompidas, que pode ser propagada ao sistema de gerenciamento que calculou e configurou as árvores. Cada árvore é um conjunto de nós e enlaces. O elemento interrompido está na interseção de árvores interrompidas, que pode ser um único nó ou enlace ou muito poucos nós ou enlaces. Conseqüentemente a localização da falha está em um dos elementos de rede na interseção das árvores interrompidas.

O conjunto de elementos interrompidos pode ser restrito mesmo ainda porque o sistema de gerenciamento também conhece que cada nó e enlace das árvores operacionais que sobreviveram à falha estão também operando. Por conseguinte, um menor conjunto de elementos possivelmente interrompidos pode ser obtido se todos aqueles enlaces e nós sejam subtraídos, os quais são parte de qualquer das árvores operando, da interseção das árvores interrompidas.

Um refinamento adicional pode ser que durante a geração de múltiplas árvores, em cada nó de borda, à parte do ID da árvore, a informação de caminha do emissor para o nó de borda é também armazenada. Quando uma falha de enlace ou de nó ocorre, o nó de borda envia uma mensagem de falha com ambos o ID da árvore e a informação de trajeto. Assim sendo a possível falha pode ser ainda reduzida a um trajeto de uma árvore ou vários trajetos de múltiplas árvores. Árvores geradoras tolerante à falhas são calculadas off-line e configuradas antes do lançamento inicial da rede e permanecem estáticas durante a operação da rede. A informação de trajeto em direção ao emissor pode ser armazenada em cada nó de borda durante esta fase de configuração. Uma outra possibilidade de recuperar a informação de trajeto pode ser com a ajuda de mensagens de rastreio de enlace se IEEE 802.1ag é aplicado em uma rede. Como mostrado na Fig. 4, falhas são tratadas por nós de borda

como descrito brevemente na seção anterior. No passo 410, nós de borda estão monitorando por mensagens de Vivo perdidas. Nós de borda estão cientes de topologias de árvore interrompida e não danificadas e podem direcionar tráfego para áreas disponíveis que fornecem conectividade em uma rede. Se a informação de trajeto é armazenada, o nó de borda também terá conhecimento de seu trajeto para o emissor.

Já que os nós de borda têm conhecimento de que topologias lógicas estão interrompidas, eles são capazes de notificar um gerenciamento de rede (NM) sobre as topologias interrompidas, no passo 420. Se a informação de trajeto é também armazenada então nós de borda também informam ao NM sobre o trajeto(s) interrompido das árvore(s). O gerenciamento de rede tem conhecimento de todas as topologias lógicas na rede, já que a rede fio configurada antes pelo gerenciamento de rede antes. Por conseguinte, possivelmente elementos de rede interrompidos podem ser determinados com base nesta informação, como a seguir:

Somente aqueles enlaces ou nós poderiam ser interrompidos, os quais são incluídos em todas as topologias lógicas interrompida.

Com referência à Fig. 5, o método de localização de falha de acordo com a presente invenção opera da seguinte maneira:

• No passo 510, o gerenciamento de rede recebe informação sobre a configuração das topologias de árvore configuradas na rede.

• No passo 520, a conectividade na rede é monitorada.

• No passo 530, o gerenciamento de rede é informado sobre as árvores que estão interrompidas no caso de um evento de falha. Esta informação pode ser recebida proveniente dos nós de borda. Se a informação de trajeto também está disponível então a informação sobre o trajeto(s) falho ou interrompido também pode ser enviado ao Gerenciamento de Rede.

• No passo 540, o elemento(s) de rede comum de todas as árvores danificadas é determinado.

Adicionalmente aqueles elementos que são parte de árvores não afetadas podem ser excluídos do conjunto de elementos possivelmente falhos.

Ainda mais, a informação sobre qual nó de borda reportou a falha e que nó de borda é o um que radiodifunde as mensagens de Vivo, também pode ser levada em conta: elemento(s) de rede comum em árvores danificadas no trajeto entre nós radiodifusor e relator da falha. Se monitoração de conectividade ponto a ponto é aplicada, e. g. CFM, então também é informação útil para localização de falha que os nós de borda reportem o trajeto entre qual par de nós de borda está interrompido. Se informação de trajeto sobre o trajeto(s) interrompido também está disponível então ela também pode ser usada para determinar o elemento(s) interrompido

Os elementos de rede assim identificados como possivelmente falhos podem ser verificados. Localização de falha de acordo com a presente invenção é ilustrado no seguinte exemplo de rede, a qual topologia física é mostrada na Fig. 1. O exemplo de rede consiste de quatro nós internos SWl, SW2, SW3 e SW4, quatro nós de borda ENl, EN2, EN3 e EN4, e nove enlaces interconectando esses nós.

Com referência à Fig. 2, uma arquitetura de rede baseada em múltipla árvore geradora é assumida, como descrito em detalhe em J. Farkas, C. Antal, G. Toth, L. Westberg, acima; J. Farkas, C. Antal, L. Westberg, A. Paradisi, T.R. Tronco, V. G. Oliveira, acima; e J. Farkas, A. Paradisi, e C. Antal, acima. Topologias de árvores são determinadas conseqüentemente de modo a tratar falhas únicas como representado na Fig. 2, que ilustra um exemplo das topologias lógicas básicas da presente invenção. Três árvores (TI, T2, e T3) são necessária para tratar todas as possíveis falhas únicas nesta rede de exemplo. A rede e seus elementos são idênticos à representação na Fig. 1.

Se uma falha ocorre, então pelo menos, uma das árvores será

derrubada.

Por exemplo, se um dos nós de borda informa ao gerenciamento de rede que a árvore T2 foi derrubada (e assumindo que somente esta árvore está interrompida, i. e. nenhum relatório de falha recebido sobre outras árvores) então o gerenciamento de rede conclui que somente um elemento da árvore T2 pode estar em falha : ENl, SWl, EN2, SW4, EN4, EN3 e os respectivos enlaces entre eles.

Eliminando ainda aqueles elementos da árvore T2 que também são parte de árvores não afetadas Tl e T3, o conjunto de elementos possivelmente em falha pode ser ainda limitado ao enlace entre o nó SWl e o nó SW4 e / ou o enlace entre o nó de borda EN2 e o nó SWl.

Aplicando as funções do Método de Tratamento de Falha (FHM) dos nós de borda, o local da falha pode ser determinado mesmo com mais precisão. Se o nó de borda ENl radiodifunde as mensagens de Vivo e o nó de borda EN2 reporta a falha, então se segue que o enlace entre nó de borda EN2 e nó SWl foi derrubado.

Esta falha também pode ser localizada com base na informação de trajeto se esta informação também é implementada na rede e incluída nas mensagens de falha. Então a mensagem de falha é notificada ao sistema de gerenciamento junto com a seguinte informação de trajeto: EN2- SWl-ENl. o nó SWl5 nó de borda ENl e o enlace entre esses dois nós são também parte da árvore Tl, e é conhecido que árvore Tl esta viva. Por conseguinte, segue que ou EN2 ou o enlace entre EN2 e nó SWl está interrompido.

Usando o mesmo método, se segue que se o nó de borda EN3 ou nó de borda EN4 reporta a falha, então o enlace entre o nó SWl e o nó SW4 está interrompido. Um mais complexo caso surge se somente a árvore T2

sobrevive a falha, i. e. ambas, a árvore Tlea árvore T3 estão interrompidas. Neste caso, ou nó SW2 ou nó SW3 ou o enlace entre o nó de borda EN2 e o nó SW3 podem estar interrompido, mas não é possível identificar o elemento de rede preciso causando a falha . A situação mais difícil pode surgir quando o nó de borda EN2

radiodifunde as mensagens de Vivo. Se qualquer outro nó de borda radiodifunde as mensagens de Vivo, então o local da falha pode ser localizada com base em qual nó de borda reporta a falha. Não obstante, se o nó de borda EN2 radiodifunde as mensagens de Vivo então é fácil descobrir quando o nó SW2 está interrompido, porque naquele caso o nó de borda ENl reporta a colapso da árvore T3 e o nó de borda EN3 reporta a colapso da árvore Tl. Por outro lado, não é possível determinar se o nó SW3 ou somente o enlace entre SW3 e EN2 está interrompido porque, neste caso, todos os outros nós de borda reportam falha de ambas a árvore Tl e a árvore T3, mas o gerenciamento de rede pode verificar se o nó SW3 está disponível. Isto é, neste caso, o exato elemento de rede pode não ser encontrado, mas o local da falha é determinado.

Neste exemplo, todos os outros elementos de rede interrompidos podem ser determinados com base na informação das árvores interrompidas e dos relatório(s) das falha(s) e o nó de borda de radiodifusão. Em redes maiores, o conjunto de elementos de rede possivelmente interrompidos pode ser limitado a alguns usando este método.

O método proposto executa um passo adicional com base nas funções do Método de Tratamento de Falha (FHM) dos nós de borda e junto com eles pode fornecer uma solução completa para rápida superação da falha e detecção de falha. Isto não introduz sobrecarga extra para funções de FHM dos nós de borda, assim sendo herdando todas as vantagens, tal como carga leve, velocidade, e eficácia.

O método proposto é simples e pode ser eficientemente aplicado para localização de falha onde múltiplas topologias de árvore lógica são usadas para encaminhamento de tráfego e a disponibilidade dessas topologias é monitorada. Assim sendo o método proposto pode ser facilmente aplicado em uma arquitetura de baixo custo que somente fornece recursos básicos. Ainda mais, o método proposto pode ser também aplicado em redes consistindo de nós fornecendo recursos aprimorados como IEEE 802.1ag.

Um outro possível benefício que a proposta pode trazer é que o cálculo efetuado pelo sistema de gerenciamento para propósitos de localização de falha pode dar informações estatísticas sobre o uso do enlace e sobre possível gargalo da rede, que pode ser muito útil para alocação e otimização dos recursos da rede.

Claims

1. Método para localizar uma falha em uma rede, a rede compreendendo nós, enlaces, e nós de borda configurados como uma pluralidade de árvores geradoras, as árvores geradoras sendo parcialmente disjuntas; caracterizado pelo fato de compreender os passos de: - receber informação sobre a configuração da pluralidade de topologias de árvore na rede; - monitorar conectividade na rede; - quando da detecção de uma perda de conectividade na rede, identificar a(s) árvore(s) falhada(s); e - determinar os elementos de rede comuns à(s) árvore(s) falhada(s);

2. Método de acordo com a reivindicação 1, caracterizado pelo fato de ainda compreender determinar e excluir elementos de rede que são parte de árvores não falhadas.

3. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de ainda compreender o passo de verificar os elementos de rede remanescentes à uma falha.

4. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o passo de monitorar conectividade na rede ainda compreende monitorar por uma notificação de perda de conectividade em uma ou mais árvores.

5. Método de acordo com a reivindicação 4, caracterizado pelo fato de que a notificação mencionada compreende uma identificação da árvore falhada.

6. Método de acordo com a reivindicação 5, caracterizado pelo fato de que a notificação mencionada ainda compreende informação de trajeto de um nó de borda de radiodifusão para um nó de borda reportando falha.

7. Método de acordo com a reivindicação 5, caracterizado pelo fato de que a monitoração de conectividade ponto a ponto é aplicada e a notificação mencionada ainda compreende informação relacionando que conexões ponto a ponto falharam.

8. Método de acordo com a reivindicação 5, caracterizado pelo fato de que informação de trajeto é recuperada através das mensagens de Rastreio de Enlace.

9. Método para notificar perda de conectividade em uma rede, a rede compreendendo nós, enlaces, e nós de borda arranjados como uma pluralidade de árvores geradoras, as árvores geradoras sendo parcialmente disjuntas, a rede ainda compreendendo meios para gerenciamento de rede, caracterizado pelo fato de compreender os passos de: - monitorar por radiodifusão de mensagens de Vivo através de um nó de borda; - quando da detecção de uma mensagem de Vivo perdida, notificar o gerenciamento de rede de uma perda de conectividade.

10. Método de acordo com a reivindicação 9, caracterizado pelo fato de que o passo de notificar o gerenciamento de rede compreende enviar a identificação da árvore(s) falhada(s).

11. Método de acordo com a reivindicação 9, caracterizado pelo fato de que a notificação mencionada ainda compreende informação relacionando o trajeto do nó de borda de radiodifusão para o nó de borda reportando a falha.

12. Método de acordo com qualquer das reivindicações 9 a 11, caracterizado pelo fato de que quando da detecção de perda de conectividade em uma árvore, nós de borda redirecionam o tráfego para árvores não afetadas pela perda de conectividade.

13. Gerenciamento de rede, caracterizado pelo fato de estar adaptado para operar de acordo com qualquer uma das reivindicações 1 a 8.

14. Gerenciamento de rede de acordo com reivindicação 13, caracterizado pelo fato de que o gerenciamento de rede compreende um servidor.

15. Nó de borda, caracterizado pelo fato de estar adaptado para operar de acordo com qualquer uma das reivindicações 9 a 12.