EP1803261B1 - Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem - Google Patents

Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem Download PDF

Info

Publication number
EP1803261B1
EP1803261B1 EP05797012A EP05797012A EP1803261B1 EP 1803261 B1 EP1803261 B1 EP 1803261B1 EP 05797012 A EP05797012 A EP 05797012A EP 05797012 A EP05797012 A EP 05797012A EP 1803261 B1 EP1803261 B1 EP 1803261B1
Authority
EP
European Patent Office
Prior art keywords
nodes
message distribution
distribution system
system components
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
EP05797012A
Other languages
English (en)
French (fr)
Other versions
EP1803261A1 (de
Inventor
Jonas HÖF
Norbert LÖBIG
Jürgen TEGELER
Michael Tinnacher
Dieter Wallner
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Solutions and Networks GmbH and Co KG
Original Assignee
Nokia Siemens Networks GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Siemens Networks GmbH and Co KG filed Critical Nokia Siemens Networks GmbH and Co KG
Publication of EP1803261A1 publication Critical patent/EP1803261A1/de
Application granted granted Critical
Publication of EP1803261B1 publication Critical patent/EP1803261B1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/14Multichannel or multilink protocols

Definitions

  • the invention relates to a method for error detection in a packet-based message distribution system, wherein messages are distributed over several nodes and other system components and each node has at least two addressable interfaces, and for system security the message distribution paths are redundant and in case of failure of one or more connections of nodes and / or system components in the message distribution system redundancy paths are present.
  • the correct function of redundant communication devices also depends on the correct cabling, for example the cabling of the switches and the communication nodes with each other.
  • Unrecognized errors in a high availability redundant message distribution system A hardware failure can lead to loss of stable calls, operational restrictions, and unreachability in a communication system. Incorrect cabling and / or faulty component configuration may result in loss of set up data during new and expansion of the communication system.
  • the services offered may function smoothly. The effect of the wrong wiring or the physical cable error would then only affect the failure of the first connection path between two points by then no redundancy can be switched.
  • cabling error means that there is no path redundancy, at least on one route, although this supposedly occurs in the redundancy system is designed.
  • the redundancy that does not exist is not automatically detected yet. Cabling faults can lead to a system failing to achieve its specified level of reliability, which in the ideal case would also be achieved, in practical operation. They represent a significant risk for the reliability of communication equipment.
  • the inventors have recognized that it is advantageous if the nodes present in the message distribution system, preferably computers, know the logical structure of the proposed topology structure of the message distribution system in which they are to be integrated.
  • This setup should be administrable that is, can be changed by a system monitor so that the topology can be changed while the node is running.
  • the nodes can determine the network addresses of the neighboring nodes and system components.
  • they have the option of addressing and interrogating interposed network elements which serve only for the forwarding of messages. This information is sufficient to verify the logical structure of the topology. If the monitoring node is also granted to switch off individual ports of the interposed network elements, routine tests for checking the redundancy properties of the system can also be initiated in this way.
  • Faults in the cabling or lack of redundancy capability compared to the topology image in the controlling node can be detected and optionally alerted. In this way, the operator of the message distribution system can be made aware of a lack of redundancy and / or a physical error before this is detected only when a connection failure of a system component.
  • the inventors propose the known method for error detection in a packet-based message distribution system, wherein messages are distributed over several nodes and other system components and each node has at least two addressable interfaces, and for system security the message distribution paths are redundantly established and one or more connections fail the node and / or system components in the message distribution system redundancy paths are present, to improve that the topology of the message distribution system, the node is known and the nodes verify the availability of the other nodes through communication tests and intermediate system components over existing interfaces query their connection status with other nodes and / or system components and signal any existing misconfigurations, physical errors and / or missing redundancy paths of the message distribution system.
  • the communication path between two ATM-based nodes can be checked concurrently. If the test result is negative, the switching information of upstream devices of the message distribution system can be queried. Interfaces can be turned on for testing purposes, and holding memory information can be reintroduced in a corrective manner. All of this is possible by the method according to the invention because of the topology information which is present in the nodes communicating via the message distribution system.
  • the method is also suitable, for example, in IP-based message distribution systems, preferably in a LAN or a VLAN, wherein each node is assigned at least two one-to-one network addresses, preferably IP and / or MAC addresses.
  • One possible variant of the method provides for automatic correction of existing misconfigurations of the message distribution system after recognition.
  • the configuration data of the message distribution system may be modified.
  • an equivalent cross-link functionality that is to say a communication path between upstream devices, for example switches, can be made available.
  • applications may be executed on the nodes that check the bridge tables of the neighboring system components and the network addresses actually present therein. These applications can be run independently of the applications of the message delivery system to minimize disruption to the operation of the message delivery system.
  • the communication tests and / or the applications of the nodes are switched off during ongoing operation of the message distribution system and are switched back on as required, for example to suppress unwanted alarms of the system during maintenance.
  • LAN local area network
  • the above-described monitoring communication test should be deactivated to suppress the alerting of inconsistencies during the conversion.
  • the structure does not only have to be changed physically, but the new system structure on the node must also be administered and adapted.
  • the node immediately checks the consistency between the physical topology and the logical structure it has as soon as the check is reactivated.
  • the disconnected node (s) and / or system component (s) can not be released for traffic until this consistency check has been successful. In this way, there would be no restriction during ongoing operation due to a possibly occurring wiring problem.
  • the communication tests can be performed during the system startup of the message distribution system and routinely using the control interfaces of upstream system components. As a result, the operation of the message distribution system is least affected by the active communication tests.
  • the FIG. 1 shows a redundant communication device that is correctly wired.
  • four nodes designated by the reference numerals 3 to 6, arranged, which are connected via the links 3.1, 4.1, 5.1, 6.1 and 3.2, 4.2, 5.2, 6.2 respectively to the first and second switches 1 and 2 are.
  • the nodes 3 to 6 may be computers, for example.
  • Various applications 7 to 10 run on the nodes 3 to 6 or via these nodes 3 to 6.
  • the two switches 1 and 2 are connected directly to one another via a cross-link 11 for securing purposes.
  • IP address reconfiguration can be in this configuration every single error, for example, the failure of a link between the switches and a node, the failure of an Ethernet port, or the failure an entire switch, fix or bridge.
  • one or more Ethernet Interfaces fall on the nodes 3 to 6, the communication can be continued via the duplicated cross-link 11.
  • FIG. 1 is the topology of the highly redundant configuration properly wired. This configuration is resilient to all single hardware failures, with the help of IP address reconfiguration from one Ethernet port to another. The (news) traffic always has a way out.
  • FIG. 2 shows the same redundant structure of a communication device with two switches 1 and 2 of FIG. 1 , unlike FIG. 1 the connection of the second node 4 to the switch 1 is not correctly wired. The wrong cabling / wrong link 4.12 is accidentally placed on the second switch 2.
  • the second node 4 is therefore appended to the second switch 2 with both links 4.2 and 4.12. This error does not occur in normal operation, since the entire communication traffic via the switch 2 is running and both routers 12 and 13 can be reached either via the direct path or the indirect path via cross-link 11. But now fails the second switch 2, the second node 4 is completely isolated because he has physically no way to send traffic through the switch 1 to the router. The nodes 3, 5 and 6 are still connected via the first switch 1 to the first router in the event of failure of the switch 2.
  • This (cabling) error 4.12 of the second node 4 can now be easily detected using the new method and then corrected.
  • an application here application 4 on the switches 1 and 2
  • can query the bridge tables ( connection tables). It then recognizes that the network addresses from the second node 4 at the switch 1 not at all and twice present at the switch 2 and can alarm this fact.
  • the wrong cabling / the wrong link 4.12 can then be corrected manually.
  • the topology is known at system startup and can then be administered. When the topology changes, the logical model is updated via an operator interface. Since false alarms would be sent during maintenance work, the alarming or routine check should be able to be switched off via an operator interface.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Description

  • Die Erfindung betrifft ein Verfahren zur Fehlererkennung in einem paketbasierten Nachrichtenverteilsystem, wobei Nachrichten über mehrere Knoten und weitere Systemkomponenten verteilt werden und jeder Knoten mindestens zwei adressierbare Schnittstellen aufweist, und zur Systemsicherheit die Nachrichtenverteilerwege redundant aufgebaut sind und beim Ausfall einer oder mehrerer Verbindungen der Knoten und/oder Systemkomponenten im Nachrichtenverteilsystem Redundanzwege vorhanden sind.
  • In der Veröffentlichung US-B1-6-581 166 (Hirst Michael et al, 17.06.2003 ) ist ein Verfahren zur Fehlererkennung und Wiederherstellung beschrieben, welches zur Bereitstellung von Fehlertoleranz duale unabhängige Netze nutzt. Ein primäres und ein alternatives Netz werden so genutzt, dass die Kommunikationen für einen bestimmten Computer über das per Voreinstellung für diesen Computer bevorzugte Netz stattfinden. Mit Erkennung eines Fehlers wird eine Routingtabelle in dem erkennenden Computer geändert, so dass das voreingestellte Netz des den Fehler erkennenden Computers auf das zuvor nicht voreingestellte Netz gesetzt wird. Zusätzlich wird ein Gateway-Paket übertragen, welches es erlaubt, dass andere Netz Computer ihre Routingtabellen modifizieren, um mit dem den Fehler erkennenden Computer über sein gegenwärtig voreingestelltes Netz zu kommunizieren.
  • Die korrekte Funktion von redundant aufgebauten Kommunikationseinrichtungen, zum Beispiel eines IP basierten Nachrichtenverteilsystems, hängt auch von der richtigen Verkabelung ab, zum Beispiel der Verkabelung der Switche und der Kommunikationsknoten untereinander. Unerkannte Fehler in einem für hohe Verfügbarkeit ausgelegten redundanten Nachrichtenverteilsystem können mit einem Hardwareausfall zum Verlust von stabilen Calls, Betriebseinschränkungen und Nichterreichbarkeiten in einem Kommunikationssystem führen. Falschverkabelung und/oder fehlerhafte Konfiguration der Komponenten können bei Neu- und Erweiterungsbaumaßnahmen des Kommunikationssystems zu Verlust der Einstelldaten führen. Nun kann es sein, dass aufgrund der Systemredundanz trotz falscher Verkabelung oder eines physischen Kabelfehlers vor dem Eintritt eines Ausfalls einer Systemkomponente die angebotenen Dienste reibungslos funktionieren. Der Effekt der falschen Verkabelung oder des physischen Kabelfehlers würde sich dann erst beim Ausfall des ersten Verbindungsweges zwischen zwei Punkten auswirken, indem dann kein Redundanzweg geschaltet werden kann. Das heißt ein solcher Verkabelungsfehler führt dazu, dass tatsächlich zumindest auf einer Strecke keine Wege-redundanz vorhanden ist, obwohl diese vermeintlich im Redundanzsystem konzipiert ist. Die nicht vorhandene Redundanz wird bisher nicht automatisch erkannt. Verkabelungsfehler können so dazu führen, dass ein System seine spezifizierte Ausfallsicherheit, die es im Idealfall auch erreichen würde, im praktischen Betrieb nicht erreicht. Sie stellen damit ein erhebliches Risiko für die Zuverlässigkeit von Kommunikationseinrichtungen dar.
  • Bei bisher bekannten redundant aufgebauten Nachrichtenverteilsystemen musste man sich darauf verlassen, dass beim Aufbau des Systems gewissenhaft gearbeitet wurde und keine (Verkabelungs-)Fehler eingearbeitet wurden. Eventuell vorhandene Fehlkonfigurationen, ein physische (Verkabelungs-)Fehler oder fehlende Redundanzwege, äußerten sich erst bei einem auftretenden Ausfall einer Systemkomponente, indem die vermeintliche Systemredundanz dann nicht gegeben ist. Dieser unsichere Zustand beziehungsweise dieser Unsicherheitsfaktor ist unter dem Gesichtspunkt der Zuverlässigkeit des Systems nicht besonders befriedigend.
  • Es ist daher Aufgabe der Erfindung, ein Verfahren zur Fehlererkennung in einem paketbasierten Nachrichtenverteilsystem vorzustellen, welches bereits vor dem Eintritt eines Ausfalls einer Systemkomponente, eventuell vorhandene Fehlkonfigurationen oder physische Fehler, zum Beispiel Verkabelungsfehler, oder nicht vorhandene Redundanzfähigkeit des Nachrichtenverteilsystems erkennt.
  • Diese Aufgabe wird durch die Merkmale des unabhängigen Patentanspruches 1 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand untergeordneter Ansprüche.
  • Die Erfinder haben erkannt, dass es günstig ist, wenn die im Nachrichtenverteilsystem vorhandenen Knoten, vorzugsweise Computer, den logischen Aufbau der vorgesehenen Topologiestruktur des Nachrichtenverteilsystems kennen, in die sie eingebunden sein sollen. Dieser Aufbau sollte administrierbar sein, das heißt von einem Systemüberwacher verändert werden können, damit die Topologie im laufenden Betrieb des Knotens geändert werden kann. Durch Kommunikationstests der Knoten untereinander und mit den benachbarten Systemkomponenten können die Knoten die Netzwerkadressen der benachbarten Knoten und Systemkomponenten bestimmen. Weiterhin haben sie die Möglichkeit, zwischengelagerte Netzelemente, welche nur der Weiterleitung von Nachrichten dienen, anzusprechen und abzufragen. Diese Informationen reichen bereits, den logischen Aufbau der Topologie zu verifizieren. Falls den überwachenden Knoten auch gewährt wird, einzelne Ports der zwischengelagerten Netzelemente abzuschalten, können auf diese Weise auch Routinetests zur Überprüfung der Redundanzeigenschaften des Systems angestoßen werden.
  • Fehler in der Verkabelung beziehungsweise nicht vorhandene Redundanzfähigkeit im Vergleich zum Topologiebild im kontrollierenden Knoten können erkannt und optional alarmiert werden. Auf diese Weise kann das Bedienpersonal des Nachrichtenverteilsystems auf eine nicht vorhandene Redundanz und/oder einen physischen Fehler aufmerksam gemacht werden, bevor diese/dieser erst beim Verbindungsausfall einer Systemkomponente erkannt wird.
  • Demgemäss schlagen die Erfinder vor, das bekannte Verfahren zur Fehlererkennung in einem paketbasierten Nachrichtenverteilsystem, wobei Nachrichten über mehrere Knoten und weitere Systemkomponenten verteilt werden und jeder Knoten mindestens zwei adressierbare Schnittstellen aufweist, und zur Systemsicherheit die Nachrichtenverteilerwege redundant aufgebaut sind und beim Ausfall einer oder mehrerer Verbindungen der Knoten und/oder Systemkomponenten im Nachrichtenverteilsystem Redundanzwege vorhanden sind, dahingehend zu verbessern, dass die Topologie des Nachrichtenverteilsystems den Knoten bekannt ist und die Knoten durch Kommunikationstests die Erreichbarkeit der weiteren Knoten verifizieren und zwischengelagerte Systemkomponenten über vorhandene Schnittstellen bezüglich deren Verbindungsstatus mit anderen Knoten und/oder Systemkomponenten abfragen und eventuell vorhandene Fehlkonfigurationen, physische Fehler und/oder fehlende Redundanzwege des Nachrichtenverteilsystems signalisieren.
  • Hierdurch werden physische Fehler, wie Verkabelungsfehler, die zum Verlust der Wege-Redundanz führen, sehr schnell erkannt und können in aller Regel behoben werden, bevor sie zum Verbindungsausfall führen. Im Normalfall wird so eine Reparatur bereits bei der Inbetriebnahme eines Systems erfolgen, bevor es seinen regulären Betrieb aufnimmt. Somit sollte das oben beschriebene Szenario im laufenden Betrieb überhaupt nicht auftreten. Aber auch Konfigurationsfehler können auf diese Weise erkannt und durch die Systemadministrierbarkeit schnell behoben werden.
  • So kann mit dem neuen Verfahren der Kommunikationsweg zwischen zwei ATM basierten Knoten mitlaufend geprüft werden. Bei negativem Prüfergebnis kann die Durchschalteinformation vorgelagerter Einrichtungen des Nachrichtenverteilsystems abgefragt werden. Schnittstellen können zu Prüfungszwecken abund eingeschaltet werden sowie Haltespeicherinformation in korrigierender Weise wieder eingebracht werden. Dies alles ist aufgrund der Topologieinformation, welche in den über das Nachrichtenverteilsystem kommunizierenden Knoten vorhanden ist, nach dem erfindungsgemäßen Verfahren möglich.
  • Mit dem beschriebenen Überwachungsverfahren kann eine Destabilisierung des Systems aufgrund von Verkabelungsfehlern praktisch ausgeschlossen werden. Dies erhöht die Zuverlässigkeit von Systemen im realen Einsatz, weil eine Lücke zwischen theoretisch erreichbarer Verfügbarkeit und der tatsächlich vor Ort erreichten Verfügbarkeit geschlossen wird. Ein Risiko, das schwer kalkulierbar ist, wird durch die Erfindung eliminiert. Ein weiterer Vorteil des neuen Verfahrens ist, dass es ohne Implementierung von zusätzlicher neuer Hardware bereits mit der vorhandenen Hardware des Nachrichtenverteilsystems durchführbar ist.
  • Das Verfahren eignet sich beispielsweise auch bei IP basierten Nachrichtenverteilsystemen, vorzugsweise bei einem LAN oder einem VLAN, wobei jedem Knoten mindestens zwei eineindeutige Netzwerkadressen, vorzugsweise IP- und/oder MAC-Adressen, zugeordnet werden.
  • Es ist günstig, wenn die Daten, die die Topologie beschreiben, über eine Bedienschnittstelle verändert werden. Somit kann die Topologie des Nachrichtenverteilsystems einfach verändert werden.
  • Eine mögliche Variante des Verfahren sieht vor, vorhandene Fehlkonfigurationen des Nachrichtenverteilsystems nach Erkennung automatisch zu korrigieren. Zum Beispiel kann im neuen Verfahren im Falle einer physischen Falschverkabelung eines oder mehrerer Knoten und/oder der Systemkomponenten alternativ zur Neuverdrahtung von Hand die Konfigurationsdaten des Nachrichtenverteilsystems modifiziert werden. Hierdurch kann beispielsweise eine äquivalente Cross Link Funktionalität, also ein Kommunikationsweg zwischen vorgelagerten Einrichtungen, zum Beispiel Switches, verfügbar gemacht werden.
  • Der Verbindungsstatus der Knoten und/oder Systemkomponenten ist meist in Verbindungstabellen (= Bridge-Tables) hinterlegt. Im Verfahren ist es dann günstig, wenn die Knoten den Zustand anzeigen, wenn sie ihre Netzwerkadressen in den Verbindungstabellen benachbarten Systemkomponenten gar nicht oder mehrfach vorfinden. Sind die Netzwerkadressen eines Knotens gar nicht oder mehrfach in den Verbindungstabellen benachbarten Systemkomponenten vorhanden, so kann ein Redundanzweg nicht geschaltet werden.
  • Bei Bedarf, vorzugsweise bei Wartungsarbeiten, Um- und Erweiterungsbaumaßnahmen, können die Funktionen der Signalisierung und Änderung der Fehlkonfiguration deaktiviert werden. Hierdurch werden unerwünschte Alarme des Systems bei Wartungsarbeiten unterdrückt.
  • Ergänzend dazu, können bei Bedarf einzelne Knoten und/oder zwischengelagerte Systemkomponenten abgeschaltet werden. Diese Option ist zur Verifizierung der gewünschten Topologie und damit einhergehenden Verschaltung und Konfiguration vorgesehen. Sofern die Fehler nur konfigurativ bedingt sind, können diese selbsttätig beseitigt werden.
  • In einer besonderen Ausführung des Verfahrens, können auf den Knoten Anwendungen ausgeführt werden, die die Bridge-Tables der benachbarten Systemkomponenten und die darin tatsächlich vorhandenen Netzwerkadressen überprüfen. Diese Anwendungen können unabhängig von den Anwendungen des Nachrichtenverteilsystems ausgeführt werden, um den Betrieb des Nachrichtenverteilsystems möglichst wenig zu stören.
  • Es ist von Vorteil, wenn im Verfahren die Kommunikationstests und/oder die Anwendungen der Knoten im laufenden Betrieb des Nachrichtenverteilsystems abgeschaltet werden und bei Bedarf wieder zugeschaltet werden, um zum Beispiel unerwünschte Alarme des Systems bei Wartungsarbeiten zu unterdrücken.
  • Dies bietet beispielsweise große Vorteile bei Reparaturarbeiten am System oder Umbau einer Local Area Network (= LAN) Topologie. Vor Beginn einer solchen Maßnahme sollte der oben beschriebene überwachende Kommunikationstest deaktiviert werden, um die Alarmierung von Inkonsistenten während des Umbaus zu unterdrücken. Beispielsweise bei einem Umbau einer LAN Topologie muss der Aufbau nicht nur physikalisch verändert werden, sondern es muss auch der neue Systemaufbau auf dem Knoten administriert und angepasst werden. Der Knoten überprüft sofort die Konsistenz zwischen physikalischer Topologie und dem logischen Aufbau, den er hat, sobald die Prüfung bei ihm wieder aktiviert ist.
  • Im neuen Verfahren sollen einzelne Knoten, benachbarte Knoten und/oder Systemkomponenten bei Bedarf abgeschaltet werden können. Hierdurch können Routinetests der Redundanzeigenschaften der Redundanzwege des Systems überprüft werden, die diese Knoten und/oder Systemkomponenten beinhalten.
  • Optional kann der oder die abgeschalteten Knoten und/oder Systemkomponenten erst dann wieder für den Verkehr freigegeben werden, wenn diese Konsistenzprüfung erfolgreich war. Auf diese Weise hätte man im laufenden Betrieb keinerlei Einschränkung durch ein eventuell auftretendes Verkabelungsproblem.
  • Die Kommunikationstests können während des Systemstarts des Nachrichtenverteilsystems und routinemäßig unter Zuhilfenahme der Steuerschnittstellen vorgelagerter Systemkomponenten durchgeführt werden. Hierdurch wird der Betrieb des Nachrichtenverteilsystems durch die aktiven Kommunikationstests am wenigsten beeinträchtigt.
  • Im Folgenden wird die Erfindung anhand der bevorzugten Ausführungsbeispiele mit Hilfe der Figuren näher beschrieben, wobei darauf hingewiesen wird, dass nur die für das unmittelbare Verständnis der Erfindung wesentlichen Elemente gezeigt sind. Hierbei werden die folgenden Bezugszeichen verwendet: 1: erster Switch; 2: zweiter Switch; 3: erster Knoten; 3.1: Link erster Knoten zum ersten Switch; 3.2: Link erster Knoten zum zweiten Switch; 4: zweiter Knoten; 4.1: Link zweiter Knoten zum ersten Switch; 4.12: Falsche Verkabelung /Falscher Link des zweiten Knotens; 4.2: Link zweiter Knoten zum zweiten Switch; 5: dritter Knoten; 5.1: Link dritter Knoten zum ersten Switch; 5.2: Link dritter Knoten zum zweiten Switch; 6: vierter Knoten; 6.1: Link vierter Knoten zum ersten Switch; 6.2: Link vierter Knoten zum zweiten Switch; 7: erste Anwendung; 8: zweite Anwendung; 9: dritte Anwendung; 10: vierte Anwendung; 11: gedoppelter Crosslink zwischen erstem und zweitem Switch; 12: erster Router 13: zweiter Router.
  • Im Übrigen werden folgende Abkürzungen verwendet:
  • ATM =
    asynchronous transfer mode
    IP =
    internet protocol
    LAN =
    local area network
    MAC =
    message authentication code
    VLAN =
    very local area network.
  • Es zeigen im Einzelnen:
  • Figur 1:
    Redundante Kommunikationseinrichtungen, die korrekt verkabelt sind;
    Figur 2:
    Zwei Switche einer redundanten Kommunikationseinrichtung, wobei ein Knoten zwischen den Switchen fehlerhaft verkabelt ist.
  • Die Figur 1 zeigt eine redundante Kommunikationseinrichtung, die korrekt verkabelt ist. Zwischen den Switchen 1 und 2 sind vier Knoten, mit den Bezugszeichen 3 bis 6 benannt, angeordnet, die über die Links 3.1, 4.1, 5.1, 6.1 und 3.2, 4.2, 5.2, 6.2 jeweils an den ersten und zweiten Switch 1 und 2 angebunden sind. Die Knoten 3 bis 6 können beispielsweise Computer sein. Auf den Knoten 3 bis 6 beziehungsweise über diese Knoten 3 bis 6 laufen verschiedene Anwendungen 7 bis 10. Weiterhin sind die beiden Switche 1 und 2 zur Absicherung über einen Crosslink 11 direkt miteinander verbunden.
  • Die Anbindung der Kommunikationseinrichtung an das externe Netz erfolgt über die Router 12 und 13. Durch IP Adressrekonfiguration kann man in dieser Konfiguration jeden Einzelfehler, zum Beispiel den Ausfall eines Links zwischen den Switchen und eines Knotens, den Ausfall eines Ethernet-Ports, oder den Ausfall eines gesamten Switches, beheben oder überbrücken. Fallen beispielsweise ein oder mehrere Ethernet Interfaces auf den Knoten 3 bis 6 aus, so kann die Kommunikation über den gedoppelten Crosslink 11 weitergeführt werden.
  • Diese Redundanz entfällt, wenn beide Ethernet-Ports eines Knotens, verursacht durch falsche Verkabelung, am selben Switch 1 oder Switch 2 hängen. Dieser Fehler tritt aufgrund der redundanten Ausführung der Kommunikationseinrichtung allerdings erst dann zutage, wenn genau dieser Switch 1 oder 2 ausfällt. Ein Verkabelungsfehler dieser Art kann relativ leicht auftreten und verhindert dann unnötigerweise sämtliche Redundanzeigenschaften des Systems. In Figur 1 ist die Topologie der hochredundanten Konfiguration richtig verkabelt. Diese Konfiguration ist unter Zuhilfenahme von IP Adressenrekonfiguration von einem Ethernet-Port auf das andere resistent gegenüber allen Einzelfehlern der Hardware. Der (Nachrichten-)Verkehr hat immer einen Weg nach außen.
  • Die Figur 2 zeigt den gleichen redundanten Aufbau einer Kommunikationseinrichtung mit zwei Switches 1 und 2 der Figur 1, wobei im Unterschied zu Figur 1 die Verbindung des zweiten Knotens 4 an den Switch 1 nicht korrekt verkabelt ist. Die falsche Verkabelung / falsche Link 4.12 ist versehentlich auf den zweiten Switch 2 gelegt.
  • Der zweite Knoten 4 ist also mit beiden Links 4.2 und 4.12 an den zweiten Switch 2 angehängt. Dieser Fehler fällt im Normalbetrieb nicht auf, da der gesamte Kommunikationsverkehr über den Switch 2 läuft und beide Router 12 und 13 entweder über den direkten Weg oder den indirekten Weg über Crosslink 11 erreichbar sind. Fällt nun aber der zweite Switch 2 aus, so ist der zweite Knoten 4 vollständig isoliert, da er physikalisch keine Möglichkeit hat, den Verkehr über den Switch 1 zum Router zu schicken. Die Knoten 3, 5 und 6 sind beim Ausfall des Switches 2 immer noch über den ersten Switch 1 an den ersten Router angebunden.
  • Dieser (Verkabelungs-)Fehler 4.12 des zweiten Knoten 4 kann mit Hilfe des neuen Verfahrens nun leicht detektiert und dann behoben werden. In einer möglichen Ausführungsvariante des neuen Verfahrens kann eine Anwendung, hier Anwendung 4 auf den Switchen 1 und 2 die Bridge-Tables (= Verbindungstabellen) abfragen. Sie erkennt dann, dass die Netzwerkadressen vom zweiten Knoten 4 am Switch 1 gar nicht und am Switch 2 doppelt vorhanden ist und kann diesen Sachverhalt alarmieren. Es kann dann die falsche Verkabelung / der falsche Link 4.12 manuell behoben werden.
  • Dies ist natürlich nur ein einfaches Beispiel, um das Prinzip zu demonstrieren. Die Topologien können jedoch beliebig komplex werden, indem man zum Beispiel kaskadierende Switche und mehr als zwei Interfaces/Ethernet-Ports pro Host hat, wo dann natürlich die Wahrscheinlichkeit einer fehlerhaften Konfiguration zunimmt.
  • Tritt ein Fehler auf, wird die Auswirkung der Falschverkabelung sofort in die Entscheidung zur Ersatzschaltung/Alarmierung einbezogen, was die Verfügbarkeit der Anordnung erhöht.
  • Die Topologie wird beim Systemstart bekannt und ist dann administrierbar. Bei Änderungen der Topologie erfolgt eine Aktualisierung des logischen Models über eine Bedienschnittstelle. Da bei Wartungsarbeiten falsche Alarme gesendet werden würden, sollte die Alarmierung beziehungsweise routinemäßige Überprüfung über eine Bedienschnittstelle abschaltbar sein.
  • Es versteht sich, dass die vorstehend genannten Merkmale der Erfindung nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der Erfindung zu verlassen.

Claims (12)

  1. Verfahren zur Fehlererkennung in einem paketbasierten Nachrichtenverteilsystem, wobei Nachrichten über mehrere Knoten (3, 4, 5, 6) und weitere Systemkomponenten (1, 2, 11, 12, 13) verteilt werden und jeder Knoten (3, 4, 5, 6) mindestens zwei adressierbare Schnittstellen aufweist, und zur Systemsicherheit die Nachrichtenverteilerwege redundant aufgebaut sind und beim Ausfall einer oder mehrerer Verbindungen der Knoten (3, 4, 5, 6) und/oder Systemkomponenten (1, 2, 11, 12, 13) im Nachrichtenverteilsystem Redundanzwege vorhanden sind und die Topologie des Nachrichtenverteilsystems den Knoten (3, 4, 5, 6) bekannt ist,
    dadurch gekennzeichnet,
    dass die Knoten (3, 4, 5, 6) durch Kommunikationstests die Erreichbarkeit der weiteren Knoten (3, 4, 5, 6) verifizieren, die Knoten (3, 4, 5, 6) zwischengelagerte Systemkomponenten (1, 2, 11, 12, 13) über vorhandene Schnittstellen (3.1 bis 6.1 und 3.2 bis 6.2) bezüglich deren Verbindungsstatus mit anderen Knoten (3, 4, 5, 6) und/oder Systemkomponenten (1, 2, 11, 12, 13) abfragen, die Knoten (3, 4, 5, 6) eventuell vorhandene Fehlkonfigurationen, physische Fehler (4.12) und/oder fehlende Redundanzwege des Nachrichtenverteilsystems signalisieren.
  2. Verfahren nach dem voranstehenden Anspruch 1,
    dadurch gekennzeichnet,
    dass das Nachrichtenverteilsystem ein IP basiertes Nachrichtenverteilsystem, ein LAN oder ein VLAN ist, wobei jedem Knoten (3, 4, 5, 6) mindestens zwei eineindeutige Netzwerkadressen, IP- und/oder MAC-Adressen, zugeordnet werden.
  3. Verfahren nach einem der voranstehenden Ansprüche 1 und 2,
    dadurch gekennzeichnet,
    dass die Daten, die die Topologie beschreiben, über eine Bedienschnittstelle verändert werden.
  4. Verfahren nach einem der voranstehenden Ansprüche 1 bis 3,
    dadurch gekennzeichnet,
    dass vorhandene Fehlkonfigurationen des Nachrichtenverteilsystems nach Erkennung automatisch korrigiert werden.
  5. Verfahren nach dem voranstehenden Anspruch 4,
    dadurch gekennzeichnet,
    dass im Falle einer physischen Falschverkabelung eines oder mehrerer Knoten (3, 4, 5, 6) und/oder der Systemkomponenten (1, 2, 11, 12, 13) die Konfigurationsdaten des Nachrichtenverteilsystems automatisch ohne Bedienereingriff modifiziert werden.
  6. Verfahren nach einem der voranstehenden Ansprüche 1 bis 5,
    dadurch gekennzeichnet,
    dass der Verbindungsstatus der Knoten (3, 4, 5, 6) und/oder Systemkomponenten (1, 2, 11, 12, 13) in Verbindungstabellen (= Bridge-Tables) hinterlegt ist und die Knoten (3, 4, 5, 6) signalisieren, wenn sie ihre Netzwerkadresse in den Verbindungstabellen benachbarten Systemkomponenten gar nicht oder mehrfach vorfinden.
  7. Verfahren nach einem der voranstehenden Ansprüche 1 bis 6,
    dadurch gekennzeichnet,
    dass bei Bedarf, bei Wartungsarbeiten, Um- und Erweiterungsbaumaßnahmen, die Signalisierung und Änderung der Fehlkonfiguration deaktiviert wird.
  8. Verfahren nach einem der voranstehenden Ansprüche 1 bis 7,
    dadurch gekennzeichnet,
    dass zur Fehlererkennung und Verifikation der durch die Topologie verlangten Verschaltung und Konfiguration einzelne Knoten (3, 4, 5, 6) und/oder zwischengelagerte Systemkomponenten (1, 2, 11, 12, 13) abgeschaltet werden.
  9. Verfahren nach Anspruch 6,
    dadurch gekennzeichnet,
    dass auf den Knoten (3, 4, 5, 6) Anwendungen (7, 8, 9, 10) ausgeführt werden, die die Bridge-Tables der benachbarten Systemkomponenten (1, 2) und die darin tatsächlich vorhandenen Netzwerkadressen überprüfen.
  10. Verfahren nach Anspruch 9,
    dadurch gekennzeichnet,
    dass die Kommunikationstests und/oder die Anwendungen (7, 8, 9, 10) der Knoten (3, 4, 5, 6) im laufenden Betrieb des Nachrichtenverteilsystems abgeschaltet und bei Bedarf wieder zugeschaltet werden.
  11. Verfahren nach einem der voranstehenden Ansprüche 1 bis 10,
    dadurch gekennzeichnet,
    dass die Kommunikationstests während des Systemstarts des Nachrichtenverteilsystems oder dem Anlauf weiterer Systemkomponenten (1, 2, 11, 12, 13) durchgeführt werden.
  12. Verfahren nach einem der voranstehenden Ansprüche 1 bis 11,
    dadurch gekennzeichnet,
    dass die Kommunikationstests routinemäßig unter Zuhilfenahme der Steuerschnittstellen vorgelagerter Systemkomponenten (1, 2, 11, 12, 13) durchgeführt werden.
EP05797012A 2004-10-20 2005-09-19 Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem Expired - Lifetime EP1803261B1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004051167 2004-10-20
PCT/EP2005/054649 WO2006042776A1 (de) 2004-10-20 2005-09-19 Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem

Publications (2)

Publication Number Publication Date
EP1803261A1 EP1803261A1 (de) 2007-07-04
EP1803261B1 true EP1803261B1 (de) 2008-11-12

Family

ID=35482834

Family Applications (1)

Application Number Title Priority Date Filing Date
EP05797012A Expired - Lifetime EP1803261B1 (de) 2004-10-20 2005-09-19 Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem

Country Status (4)

Country Link
US (1) US8406121B2 (de)
EP (1) EP1803261B1 (de)
DE (1) DE502005005971D1 (de)
WO (1) WO2006042776A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10868708B2 (en) 2015-11-02 2020-12-15 Google Llc System and method for handling link loss in a network
US12081407B2 (en) 2022-02-08 2024-09-03 Ciena Corporation Updating configuration settings of network elements when a network is changed to a planned topology
WO2023154221A1 (en) * 2022-02-08 2023-08-17 Ciena Corporation Updating configuration settings of network elements when a network is changed to a planned topology
US12445348B2 (en) 2023-07-21 2025-10-14 Bank Of America Corporation Electronic system for proactive resiliency, redundancy and security remediation across a network based on dynamic analysis of technology applications
CN121210218B (zh) * 2025-11-28 2026-03-03 苏州元脑智能科技有限公司 存储系统的故障检测方法和数据管理平台

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5379278A (en) * 1993-07-16 1995-01-03 Honeywell Inc. Method of automatic communications recovery
JP3432664B2 (ja) * 1996-02-14 2003-08-04 富士通株式会社 通信ノード及び障害復旧方法並びに通信ネットワーク
US6208856B1 (en) * 1997-12-08 2001-03-27 Telefonaktiebolaget L M Ericsson Method for maintaining service nodes in a telecommunications network
US6662217B1 (en) * 1999-01-19 2003-12-09 Microsoft Corporation Distributed and automated test administration system for administering automated tests on server computers over the internet
US6393478B1 (en) * 1999-02-22 2002-05-21 Mediaone Group, Inc. Cable modem and personal computer troubleshooting tool
US6581166B1 (en) * 1999-03-02 2003-06-17 The Foxboro Company Network fault detection and recovery
DE19928484A1 (de) 1999-06-22 2000-12-28 Bosch Gmbh Robert Datenübertragung in einem duplizierten Übertragungsnetzwerk
US6625728B1 (en) * 1999-11-02 2003-09-23 International Business Machines Corporation Method and apparatus for locating and displaying a defective component in a data processing system during a system startup using location and progress codes associated with the component
WO2001063850A1 (en) * 2000-02-25 2001-08-30 Honeywell International Inc. Multiple network fault tolerance via redundant network control
US6901443B1 (en) * 2000-03-10 2005-05-31 Honeywell International Inc. Non-fault tolerant network nodes in a multiple fault tolerant network
US7327683B2 (en) * 2000-03-16 2008-02-05 Sri International Method and apparatus for disseminating topology information and for discovering new neighboring nodes
DE10142372B4 (de) 2001-01-05 2005-03-03 Siemens Ag Vorrichtung und Verfahren zum Wiederherstellen von Verbindungen in automatisch schaltbaren optischen Netzen
US7149430B2 (en) * 2001-02-05 2006-12-12 Finsiar Corporation Optoelectronic transceiver having dual access to onboard diagnostics
WO2002065661A1 (en) * 2001-02-12 2002-08-22 Maple Optical Systems, Inc. System and method for fast-rerouting of data in a data communication network
WO2004010625A2 (en) 2002-07-24 2004-01-29 Meriton Networks Inc. Automatic detection and resolution of fiber cabling errors in optical networks
US7672226B2 (en) 2002-09-09 2010-03-02 Xiotech Corporation Method, apparatus and program storage device for verifying existence of a redundant fibre channel path
US7385931B2 (en) * 2003-08-22 2008-06-10 Fujitsu Limited Detection of network misconfigurations
US7844439B2 (en) * 2006-03-10 2010-11-30 Edsa Micro Corporation Systems and methods for real-time protective device evaluation in an electrical power distribution system

Also Published As

Publication number Publication date
DE502005005971D1 (de) 2008-12-24
US8406121B2 (en) 2013-03-26
WO2006042776A1 (de) 2006-04-27
EP1803261A1 (de) 2007-07-04
US20070263547A1 (en) 2007-11-15

Similar Documents

Publication Publication Date Title
EP2343857B1 (de) Netzwerkknoten für ein Kommunikationsnetzwerk
EP2070256B1 (de) Verfahren zum rekonfigurieren eines kommunikationsnetzwerks
EP2169882B1 (de) Schiffsruder-Steuerung mit einem CAN-Bus
EP1062787A1 (de) Lokales netzwerk, insbesondere ethernet-netzwerk, mit redundanzeigenschaften sowie redundanzmanager
EP2693700A1 (de) Verfahren zur Nachrichtenübermittlung in einem redundant betreibbaren industriellen Kommunikationsnetz und Kommunikationsgerät für ein redundant betreibbares industrielles Kommunikationsnetz
EP1394985A1 (de) Testverfahren für Nachrichtenpfade in Kommunikationsnetzen sowie Netzelement
DE19752792B4 (de) Einrichtung zur Selbstdiagnose von im wesentlichen sporadischen Fehlern in seriellen Übertragungssystemen
WO2021037466A1 (de) Verfahren zur datenübermittlung in einem redundant betreibbaren kommunikationsnetz und koppel-kommunikationsgerät
DE102010029301B4 (de) Netzwerk und Erweiterungseinheit sowie Verfahren zum Betreiben eines Netzwerks
EP1803261B1 (de) Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem
DE10305415B4 (de) Verfahren und Vorrichtung zum medienredundanten Betreiben eines Endgeräts in einem Netzwerk
EP2028791B1 (de) Erkennung von Fehlkonfigurationen auf Netzwerkinfrastrukturgeräten
EP2704370A1 (de) Verfahren zur Nachrichtenübermittlung in einem redundant betreibbaren industriellen Kommunikationsnetz und Kommunikationsgerät für ein redundant betreibbares industrielles Kommunikationsnetz
EP1869839B1 (de) Verfahren, Computerprogrammprodukt und Netzknotenelement zur schnelleren Erkennung von Störungen auf Übertragungswegen und oder in Knoten
DE10243384A1 (de) Verfahren zur permanenten redundanten Übertragung von Datentelegrammen in Kommunikationssystemen
EP3457232B1 (de) Verfahren zum betrieb eines hochverfügbaren automatisierungssystems
EP2750310A1 (de) Verfahren zur Synchronisierung lokaler Uhren in einem Kommunikationsnetz eines industriellen Automatisierungssystems und Netzinfrastrukturgerät
EP1851934B1 (de) Verfahren zur fehlererkennung eines nachrichteninterfaces in einer kommunikationseinrichtung
EP2182680B1 (de) Verfahren zum Betrieb eines Kommunikationsnetzwerkes und Kommunikationskomponente
EP3739822A1 (de) Koppeln eines kommunikationsnetzwerks mit einem kommunikationsendgerät
EP2817923B1 (de) Rechnernetzwerk mit einer ringförmigen busverbindung
EP2290882B1 (de) Verfahren zur mehrfachen Fehlerredundanz in Netzwerken mit Ringtopologien
DE102007021922B4 (de) Paketvermitteltes Kommunikationsnetzwerk und Verfahren zum Rekonfigurieren des Kommunikationsnetzwerks
EP1394995B1 (de) Redundate Netzwerkanordnung
DE4328068C1 (de) Verfahren zum Ermitteln eines Ersatzweges in einem gedoppelten ringförmigen Kommunikationsnetz

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20070122

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE FR GB

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: NOKIA SIEMENS NETWORKS GMBH & CO. KG

17Q First examination report despatched

Effective date: 20070830

RAP3 Party data changed (applicant data changed or rights of an application transferred)

Owner name: NOKIA SIEMENS NETWORKS S.P.A.

RAP3 Party data changed (applicant data changed or rights of an application transferred)

Owner name: NOKIA SIEMENS NETWORKS GMBH & CO. KG

DAX Request for extension of the european patent (deleted)
RBV Designated contracting states (corrected)

Designated state(s): DE FR GB

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE FR GB

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REF Corresponds to:

Ref document number: 502005005971

Country of ref document: DE

Date of ref document: 20081224

Kind code of ref document: P

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20090813

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20121010

Year of fee payment: 8

REG Reference to a national code

Ref country code: FR

Ref legal event code: ST

Effective date: 20140530

REG Reference to a national code

Ref country code: DE

Ref legal event code: R079

Ref document number: 502005005971

Country of ref document: DE

Free format text: PREVIOUS MAIN CLASS: H04L0012560000

Ipc: H04L0012751000

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FR

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20130930

REG Reference to a national code

Ref country code: DE

Ref legal event code: R079

Ref document number: 502005005971

Country of ref document: DE

Free format text: PREVIOUS MAIN CLASS: H04L0012560000

Ipc: H04L0012751000

Effective date: 20140801

Ref country code: DE

Ref legal event code: R081

Ref document number: 502005005971

Country of ref document: DE

Owner name: NOKIA SOLUTIONS AND NETWORKS GMBH & CO. KG, DE

Free format text: FORMER OWNER: NOKIA SIEMENS NETWORKS GMBH & CO. KG, 81541 MUENCHEN, DE

Effective date: 20140731

REG Reference to a national code

Ref country code: FR

Ref legal event code: CD

Owner name: NOKIA SOLUTIONS AND NETWORKS GMBH & CO.KG, DE

Effective date: 20150211

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20190903

Year of fee payment: 15

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20190919

Year of fee payment: 15

REG Reference to a national code

Ref country code: DE

Ref legal event code: R119

Ref document number: 502005005971

Country of ref document: DE

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20200919

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20210401

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20200919