EP1803261B1 - Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem - Google Patents
Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem Download PDFInfo
- Publication number
- EP1803261B1 EP1803261B1 EP05797012A EP05797012A EP1803261B1 EP 1803261 B1 EP1803261 B1 EP 1803261B1 EP 05797012 A EP05797012 A EP 05797012A EP 05797012 A EP05797012 A EP 05797012A EP 1803261 B1 EP1803261 B1 EP 1803261B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- nodes
- message distribution
- distribution system
- system components
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/40—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/14—Multichannel or multilink protocols
Definitions
- the invention relates to a method for error detection in a packet-based message distribution system, wherein messages are distributed over several nodes and other system components and each node has at least two addressable interfaces, and for system security the message distribution paths are redundant and in case of failure of one or more connections of nodes and / or system components in the message distribution system redundancy paths are present.
- the correct function of redundant communication devices also depends on the correct cabling, for example the cabling of the switches and the communication nodes with each other.
- Unrecognized errors in a high availability redundant message distribution system A hardware failure can lead to loss of stable calls, operational restrictions, and unreachability in a communication system. Incorrect cabling and / or faulty component configuration may result in loss of set up data during new and expansion of the communication system.
- the services offered may function smoothly. The effect of the wrong wiring or the physical cable error would then only affect the failure of the first connection path between two points by then no redundancy can be switched.
- cabling error means that there is no path redundancy, at least on one route, although this supposedly occurs in the redundancy system is designed.
- the redundancy that does not exist is not automatically detected yet. Cabling faults can lead to a system failing to achieve its specified level of reliability, which in the ideal case would also be achieved, in practical operation. They represent a significant risk for the reliability of communication equipment.
- the inventors have recognized that it is advantageous if the nodes present in the message distribution system, preferably computers, know the logical structure of the proposed topology structure of the message distribution system in which they are to be integrated.
- This setup should be administrable that is, can be changed by a system monitor so that the topology can be changed while the node is running.
- the nodes can determine the network addresses of the neighboring nodes and system components.
- they have the option of addressing and interrogating interposed network elements which serve only for the forwarding of messages. This information is sufficient to verify the logical structure of the topology. If the monitoring node is also granted to switch off individual ports of the interposed network elements, routine tests for checking the redundancy properties of the system can also be initiated in this way.
- Faults in the cabling or lack of redundancy capability compared to the topology image in the controlling node can be detected and optionally alerted. In this way, the operator of the message distribution system can be made aware of a lack of redundancy and / or a physical error before this is detected only when a connection failure of a system component.
- the inventors propose the known method for error detection in a packet-based message distribution system, wherein messages are distributed over several nodes and other system components and each node has at least two addressable interfaces, and for system security the message distribution paths are redundantly established and one or more connections fail the node and / or system components in the message distribution system redundancy paths are present, to improve that the topology of the message distribution system, the node is known and the nodes verify the availability of the other nodes through communication tests and intermediate system components over existing interfaces query their connection status with other nodes and / or system components and signal any existing misconfigurations, physical errors and / or missing redundancy paths of the message distribution system.
- the communication path between two ATM-based nodes can be checked concurrently. If the test result is negative, the switching information of upstream devices of the message distribution system can be queried. Interfaces can be turned on for testing purposes, and holding memory information can be reintroduced in a corrective manner. All of this is possible by the method according to the invention because of the topology information which is present in the nodes communicating via the message distribution system.
- the method is also suitable, for example, in IP-based message distribution systems, preferably in a LAN or a VLAN, wherein each node is assigned at least two one-to-one network addresses, preferably IP and / or MAC addresses.
- One possible variant of the method provides for automatic correction of existing misconfigurations of the message distribution system after recognition.
- the configuration data of the message distribution system may be modified.
- an equivalent cross-link functionality that is to say a communication path between upstream devices, for example switches, can be made available.
- applications may be executed on the nodes that check the bridge tables of the neighboring system components and the network addresses actually present therein. These applications can be run independently of the applications of the message delivery system to minimize disruption to the operation of the message delivery system.
- the communication tests and / or the applications of the nodes are switched off during ongoing operation of the message distribution system and are switched back on as required, for example to suppress unwanted alarms of the system during maintenance.
- LAN local area network
- the above-described monitoring communication test should be deactivated to suppress the alerting of inconsistencies during the conversion.
- the structure does not only have to be changed physically, but the new system structure on the node must also be administered and adapted.
- the node immediately checks the consistency between the physical topology and the logical structure it has as soon as the check is reactivated.
- the disconnected node (s) and / or system component (s) can not be released for traffic until this consistency check has been successful. In this way, there would be no restriction during ongoing operation due to a possibly occurring wiring problem.
- the communication tests can be performed during the system startup of the message distribution system and routinely using the control interfaces of upstream system components. As a result, the operation of the message distribution system is least affected by the active communication tests.
- the FIG. 1 shows a redundant communication device that is correctly wired.
- four nodes designated by the reference numerals 3 to 6, arranged, which are connected via the links 3.1, 4.1, 5.1, 6.1 and 3.2, 4.2, 5.2, 6.2 respectively to the first and second switches 1 and 2 are.
- the nodes 3 to 6 may be computers, for example.
- Various applications 7 to 10 run on the nodes 3 to 6 or via these nodes 3 to 6.
- the two switches 1 and 2 are connected directly to one another via a cross-link 11 for securing purposes.
- IP address reconfiguration can be in this configuration every single error, for example, the failure of a link between the switches and a node, the failure of an Ethernet port, or the failure an entire switch, fix or bridge.
- one or more Ethernet Interfaces fall on the nodes 3 to 6, the communication can be continued via the duplicated cross-link 11.
- FIG. 1 is the topology of the highly redundant configuration properly wired. This configuration is resilient to all single hardware failures, with the help of IP address reconfiguration from one Ethernet port to another. The (news) traffic always has a way out.
- FIG. 2 shows the same redundant structure of a communication device with two switches 1 and 2 of FIG. 1 , unlike FIG. 1 the connection of the second node 4 to the switch 1 is not correctly wired. The wrong cabling / wrong link 4.12 is accidentally placed on the second switch 2.
- the second node 4 is therefore appended to the second switch 2 with both links 4.2 and 4.12. This error does not occur in normal operation, since the entire communication traffic via the switch 2 is running and both routers 12 and 13 can be reached either via the direct path or the indirect path via cross-link 11. But now fails the second switch 2, the second node 4 is completely isolated because he has physically no way to send traffic through the switch 1 to the router. The nodes 3, 5 and 6 are still connected via the first switch 1 to the first router in the event of failure of the switch 2.
- This (cabling) error 4.12 of the second node 4 can now be easily detected using the new method and then corrected.
- an application here application 4 on the switches 1 and 2
- can query the bridge tables ( connection tables). It then recognizes that the network addresses from the second node 4 at the switch 1 not at all and twice present at the switch 2 and can alarm this fact.
- the wrong cabling / the wrong link 4.12 can then be corrected manually.
- the topology is known at system startup and can then be administered. When the topology changes, the logical model is updated via an operator interface. Since false alarms would be sent during maintenance work, the alarming or routine check should be able to be switched off via an operator interface.
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
Description
- Die Erfindung betrifft ein Verfahren zur Fehlererkennung in einem paketbasierten Nachrichtenverteilsystem, wobei Nachrichten über mehrere Knoten und weitere Systemkomponenten verteilt werden und jeder Knoten mindestens zwei adressierbare Schnittstellen aufweist, und zur Systemsicherheit die Nachrichtenverteilerwege redundant aufgebaut sind und beim Ausfall einer oder mehrerer Verbindungen der Knoten und/oder Systemkomponenten im Nachrichtenverteilsystem Redundanzwege vorhanden sind.
- In der Veröffentlichung
US-B1-6-581 166 (Hirst Michael et al, 17.06.2003 ) ist ein Verfahren zur Fehlererkennung und Wiederherstellung beschrieben, welches zur Bereitstellung von Fehlertoleranz duale unabhängige Netze nutzt. Ein primäres und ein alternatives Netz werden so genutzt, dass die Kommunikationen für einen bestimmten Computer über das per Voreinstellung für diesen Computer bevorzugte Netz stattfinden. Mit Erkennung eines Fehlers wird eine Routingtabelle in dem erkennenden Computer geändert, so dass das voreingestellte Netz des den Fehler erkennenden Computers auf das zuvor nicht voreingestellte Netz gesetzt wird. Zusätzlich wird ein Gateway-Paket übertragen, welches es erlaubt, dass andere Netz Computer ihre Routingtabellen modifizieren, um mit dem den Fehler erkennenden Computer über sein gegenwärtig voreingestelltes Netz zu kommunizieren. - Die korrekte Funktion von redundant aufgebauten Kommunikationseinrichtungen, zum Beispiel eines IP basierten Nachrichtenverteilsystems, hängt auch von der richtigen Verkabelung ab, zum Beispiel der Verkabelung der Switche und der Kommunikationsknoten untereinander. Unerkannte Fehler in einem für hohe Verfügbarkeit ausgelegten redundanten Nachrichtenverteilsystem können mit einem Hardwareausfall zum Verlust von stabilen Calls, Betriebseinschränkungen und Nichterreichbarkeiten in einem Kommunikationssystem führen. Falschverkabelung und/oder fehlerhafte Konfiguration der Komponenten können bei Neu- und Erweiterungsbaumaßnahmen des Kommunikationssystems zu Verlust der Einstelldaten führen. Nun kann es sein, dass aufgrund der Systemredundanz trotz falscher Verkabelung oder eines physischen Kabelfehlers vor dem Eintritt eines Ausfalls einer Systemkomponente die angebotenen Dienste reibungslos funktionieren. Der Effekt der falschen Verkabelung oder des physischen Kabelfehlers würde sich dann erst beim Ausfall des ersten Verbindungsweges zwischen zwei Punkten auswirken, indem dann kein Redundanzweg geschaltet werden kann. Das heißt ein solcher Verkabelungsfehler führt dazu, dass tatsächlich zumindest auf einer Strecke keine Wege-redundanz vorhanden ist, obwohl diese vermeintlich im Redundanzsystem konzipiert ist. Die nicht vorhandene Redundanz wird bisher nicht automatisch erkannt. Verkabelungsfehler können so dazu führen, dass ein System seine spezifizierte Ausfallsicherheit, die es im Idealfall auch erreichen würde, im praktischen Betrieb nicht erreicht. Sie stellen damit ein erhebliches Risiko für die Zuverlässigkeit von Kommunikationseinrichtungen dar.
- Bei bisher bekannten redundant aufgebauten Nachrichtenverteilsystemen musste man sich darauf verlassen, dass beim Aufbau des Systems gewissenhaft gearbeitet wurde und keine (Verkabelungs-)Fehler eingearbeitet wurden. Eventuell vorhandene Fehlkonfigurationen, ein physische (Verkabelungs-)Fehler oder fehlende Redundanzwege, äußerten sich erst bei einem auftretenden Ausfall einer Systemkomponente, indem die vermeintliche Systemredundanz dann nicht gegeben ist. Dieser unsichere Zustand beziehungsweise dieser Unsicherheitsfaktor ist unter dem Gesichtspunkt der Zuverlässigkeit des Systems nicht besonders befriedigend.
- Es ist daher Aufgabe der Erfindung, ein Verfahren zur Fehlererkennung in einem paketbasierten Nachrichtenverteilsystem vorzustellen, welches bereits vor dem Eintritt eines Ausfalls einer Systemkomponente, eventuell vorhandene Fehlkonfigurationen oder physische Fehler, zum Beispiel Verkabelungsfehler, oder nicht vorhandene Redundanzfähigkeit des Nachrichtenverteilsystems erkennt.
- Diese Aufgabe wird durch die Merkmale des unabhängigen Patentanspruches 1 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand untergeordneter Ansprüche.
- Die Erfinder haben erkannt, dass es günstig ist, wenn die im Nachrichtenverteilsystem vorhandenen Knoten, vorzugsweise Computer, den logischen Aufbau der vorgesehenen Topologiestruktur des Nachrichtenverteilsystems kennen, in die sie eingebunden sein sollen. Dieser Aufbau sollte administrierbar sein, das heißt von einem Systemüberwacher verändert werden können, damit die Topologie im laufenden Betrieb des Knotens geändert werden kann. Durch Kommunikationstests der Knoten untereinander und mit den benachbarten Systemkomponenten können die Knoten die Netzwerkadressen der benachbarten Knoten und Systemkomponenten bestimmen. Weiterhin haben sie die Möglichkeit, zwischengelagerte Netzelemente, welche nur der Weiterleitung von Nachrichten dienen, anzusprechen und abzufragen. Diese Informationen reichen bereits, den logischen Aufbau der Topologie zu verifizieren. Falls den überwachenden Knoten auch gewährt wird, einzelne Ports der zwischengelagerten Netzelemente abzuschalten, können auf diese Weise auch Routinetests zur Überprüfung der Redundanzeigenschaften des Systems angestoßen werden.
- Fehler in der Verkabelung beziehungsweise nicht vorhandene Redundanzfähigkeit im Vergleich zum Topologiebild im kontrollierenden Knoten können erkannt und optional alarmiert werden. Auf diese Weise kann das Bedienpersonal des Nachrichtenverteilsystems auf eine nicht vorhandene Redundanz und/oder einen physischen Fehler aufmerksam gemacht werden, bevor diese/dieser erst beim Verbindungsausfall einer Systemkomponente erkannt wird.
- Demgemäss schlagen die Erfinder vor, das bekannte Verfahren zur Fehlererkennung in einem paketbasierten Nachrichtenverteilsystem, wobei Nachrichten über mehrere Knoten und weitere Systemkomponenten verteilt werden und jeder Knoten mindestens zwei adressierbare Schnittstellen aufweist, und zur Systemsicherheit die Nachrichtenverteilerwege redundant aufgebaut sind und beim Ausfall einer oder mehrerer Verbindungen der Knoten und/oder Systemkomponenten im Nachrichtenverteilsystem Redundanzwege vorhanden sind, dahingehend zu verbessern, dass die Topologie des Nachrichtenverteilsystems den Knoten bekannt ist und die Knoten durch Kommunikationstests die Erreichbarkeit der weiteren Knoten verifizieren und zwischengelagerte Systemkomponenten über vorhandene Schnittstellen bezüglich deren Verbindungsstatus mit anderen Knoten und/oder Systemkomponenten abfragen und eventuell vorhandene Fehlkonfigurationen, physische Fehler und/oder fehlende Redundanzwege des Nachrichtenverteilsystems signalisieren.
- Hierdurch werden physische Fehler, wie Verkabelungsfehler, die zum Verlust der Wege-Redundanz führen, sehr schnell erkannt und können in aller Regel behoben werden, bevor sie zum Verbindungsausfall führen. Im Normalfall wird so eine Reparatur bereits bei der Inbetriebnahme eines Systems erfolgen, bevor es seinen regulären Betrieb aufnimmt. Somit sollte das oben beschriebene Szenario im laufenden Betrieb überhaupt nicht auftreten. Aber auch Konfigurationsfehler können auf diese Weise erkannt und durch die Systemadministrierbarkeit schnell behoben werden.
- So kann mit dem neuen Verfahren der Kommunikationsweg zwischen zwei ATM basierten Knoten mitlaufend geprüft werden. Bei negativem Prüfergebnis kann die Durchschalteinformation vorgelagerter Einrichtungen des Nachrichtenverteilsystems abgefragt werden. Schnittstellen können zu Prüfungszwecken abund eingeschaltet werden sowie Haltespeicherinformation in korrigierender Weise wieder eingebracht werden. Dies alles ist aufgrund der Topologieinformation, welche in den über das Nachrichtenverteilsystem kommunizierenden Knoten vorhanden ist, nach dem erfindungsgemäßen Verfahren möglich.
- Mit dem beschriebenen Überwachungsverfahren kann eine Destabilisierung des Systems aufgrund von Verkabelungsfehlern praktisch ausgeschlossen werden. Dies erhöht die Zuverlässigkeit von Systemen im realen Einsatz, weil eine Lücke zwischen theoretisch erreichbarer Verfügbarkeit und der tatsächlich vor Ort erreichten Verfügbarkeit geschlossen wird. Ein Risiko, das schwer kalkulierbar ist, wird durch die Erfindung eliminiert. Ein weiterer Vorteil des neuen Verfahrens ist, dass es ohne Implementierung von zusätzlicher neuer Hardware bereits mit der vorhandenen Hardware des Nachrichtenverteilsystems durchführbar ist.
- Das Verfahren eignet sich beispielsweise auch bei IP basierten Nachrichtenverteilsystemen, vorzugsweise bei einem LAN oder einem VLAN, wobei jedem Knoten mindestens zwei eineindeutige Netzwerkadressen, vorzugsweise IP- und/oder MAC-Adressen, zugeordnet werden.
- Es ist günstig, wenn die Daten, die die Topologie beschreiben, über eine Bedienschnittstelle verändert werden. Somit kann die Topologie des Nachrichtenverteilsystems einfach verändert werden.
- Eine mögliche Variante des Verfahren sieht vor, vorhandene Fehlkonfigurationen des Nachrichtenverteilsystems nach Erkennung automatisch zu korrigieren. Zum Beispiel kann im neuen Verfahren im Falle einer physischen Falschverkabelung eines oder mehrerer Knoten und/oder der Systemkomponenten alternativ zur Neuverdrahtung von Hand die Konfigurationsdaten des Nachrichtenverteilsystems modifiziert werden. Hierdurch kann beispielsweise eine äquivalente Cross Link Funktionalität, also ein Kommunikationsweg zwischen vorgelagerten Einrichtungen, zum Beispiel Switches, verfügbar gemacht werden.
- Der Verbindungsstatus der Knoten und/oder Systemkomponenten ist meist in Verbindungstabellen (= Bridge-Tables) hinterlegt. Im Verfahren ist es dann günstig, wenn die Knoten den Zustand anzeigen, wenn sie ihre Netzwerkadressen in den Verbindungstabellen benachbarten Systemkomponenten gar nicht oder mehrfach vorfinden. Sind die Netzwerkadressen eines Knotens gar nicht oder mehrfach in den Verbindungstabellen benachbarten Systemkomponenten vorhanden, so kann ein Redundanzweg nicht geschaltet werden.
- Bei Bedarf, vorzugsweise bei Wartungsarbeiten, Um- und Erweiterungsbaumaßnahmen, können die Funktionen der Signalisierung und Änderung der Fehlkonfiguration deaktiviert werden. Hierdurch werden unerwünschte Alarme des Systems bei Wartungsarbeiten unterdrückt.
- Ergänzend dazu, können bei Bedarf einzelne Knoten und/oder zwischengelagerte Systemkomponenten abgeschaltet werden. Diese Option ist zur Verifizierung der gewünschten Topologie und damit einhergehenden Verschaltung und Konfiguration vorgesehen. Sofern die Fehler nur konfigurativ bedingt sind, können diese selbsttätig beseitigt werden.
- In einer besonderen Ausführung des Verfahrens, können auf den Knoten Anwendungen ausgeführt werden, die die Bridge-Tables der benachbarten Systemkomponenten und die darin tatsächlich vorhandenen Netzwerkadressen überprüfen. Diese Anwendungen können unabhängig von den Anwendungen des Nachrichtenverteilsystems ausgeführt werden, um den Betrieb des Nachrichtenverteilsystems möglichst wenig zu stören.
- Es ist von Vorteil, wenn im Verfahren die Kommunikationstests und/oder die Anwendungen der Knoten im laufenden Betrieb des Nachrichtenverteilsystems abgeschaltet werden und bei Bedarf wieder zugeschaltet werden, um zum Beispiel unerwünschte Alarme des Systems bei Wartungsarbeiten zu unterdrücken.
- Dies bietet beispielsweise große Vorteile bei Reparaturarbeiten am System oder Umbau einer Local Area Network (= LAN) Topologie. Vor Beginn einer solchen Maßnahme sollte der oben beschriebene überwachende Kommunikationstest deaktiviert werden, um die Alarmierung von Inkonsistenten während des Umbaus zu unterdrücken. Beispielsweise bei einem Umbau einer LAN Topologie muss der Aufbau nicht nur physikalisch verändert werden, sondern es muss auch der neue Systemaufbau auf dem Knoten administriert und angepasst werden. Der Knoten überprüft sofort die Konsistenz zwischen physikalischer Topologie und dem logischen Aufbau, den er hat, sobald die Prüfung bei ihm wieder aktiviert ist.
- Im neuen Verfahren sollen einzelne Knoten, benachbarte Knoten und/oder Systemkomponenten bei Bedarf abgeschaltet werden können. Hierdurch können Routinetests der Redundanzeigenschaften der Redundanzwege des Systems überprüft werden, die diese Knoten und/oder Systemkomponenten beinhalten.
- Optional kann der oder die abgeschalteten Knoten und/oder Systemkomponenten erst dann wieder für den Verkehr freigegeben werden, wenn diese Konsistenzprüfung erfolgreich war. Auf diese Weise hätte man im laufenden Betrieb keinerlei Einschränkung durch ein eventuell auftretendes Verkabelungsproblem.
- Die Kommunikationstests können während des Systemstarts des Nachrichtenverteilsystems und routinemäßig unter Zuhilfenahme der Steuerschnittstellen vorgelagerter Systemkomponenten durchgeführt werden. Hierdurch wird der Betrieb des Nachrichtenverteilsystems durch die aktiven Kommunikationstests am wenigsten beeinträchtigt.
- Im Folgenden wird die Erfindung anhand der bevorzugten Ausführungsbeispiele mit Hilfe der Figuren näher beschrieben, wobei darauf hingewiesen wird, dass nur die für das unmittelbare Verständnis der Erfindung wesentlichen Elemente gezeigt sind. Hierbei werden die folgenden Bezugszeichen verwendet: 1: erster Switch; 2: zweiter Switch; 3: erster Knoten; 3.1: Link erster Knoten zum ersten Switch; 3.2: Link erster Knoten zum zweiten Switch; 4: zweiter Knoten; 4.1: Link zweiter Knoten zum ersten Switch; 4.12: Falsche Verkabelung /Falscher Link des zweiten Knotens; 4.2: Link zweiter Knoten zum zweiten Switch; 5: dritter Knoten; 5.1: Link dritter Knoten zum ersten Switch; 5.2: Link dritter Knoten zum zweiten Switch; 6: vierter Knoten; 6.1: Link vierter Knoten zum ersten Switch; 6.2: Link vierter Knoten zum zweiten Switch; 7: erste Anwendung; 8: zweite Anwendung; 9: dritte Anwendung; 10: vierte Anwendung; 11: gedoppelter Crosslink zwischen erstem und zweitem Switch; 12: erster Router 13: zweiter Router.
- Im Übrigen werden folgende Abkürzungen verwendet:
- ATM =
- asynchronous transfer mode
- IP =
- internet protocol
- LAN =
- local area network
- MAC =
- message authentication code
- VLAN =
- very local area network.
- Es zeigen im Einzelnen:
- Figur 1:
- Redundante Kommunikationseinrichtungen, die korrekt verkabelt sind;
- Figur 2:
- Zwei Switche einer redundanten Kommunikationseinrichtung, wobei ein Knoten zwischen den Switchen fehlerhaft verkabelt ist.
- Die
Figur 1 zeigt eine redundante Kommunikationseinrichtung, die korrekt verkabelt ist. Zwischen den Switchen 1 und 2 sind vier Knoten, mit den Bezugszeichen 3 bis 6 benannt, angeordnet, die über die Links 3.1, 4.1, 5.1, 6.1 und 3.2, 4.2, 5.2, 6.2 jeweils an den ersten und zweiten Switch 1 und 2 angebunden sind. Die Knoten 3 bis 6 können beispielsweise Computer sein. Auf den Knoten 3 bis 6 beziehungsweise über diese Knoten 3 bis 6 laufen verschiedene Anwendungen 7 bis 10. Weiterhin sind die beiden Switche 1 und 2 zur Absicherung über einen Crosslink 11 direkt miteinander verbunden. - Die Anbindung der Kommunikationseinrichtung an das externe Netz erfolgt über die Router 12 und 13. Durch IP Adressrekonfiguration kann man in dieser Konfiguration jeden Einzelfehler, zum Beispiel den Ausfall eines Links zwischen den Switchen und eines Knotens, den Ausfall eines Ethernet-Ports, oder den Ausfall eines gesamten Switches, beheben oder überbrücken. Fallen beispielsweise ein oder mehrere Ethernet Interfaces auf den Knoten 3 bis 6 aus, so kann die Kommunikation über den gedoppelten Crosslink 11 weitergeführt werden.
- Diese Redundanz entfällt, wenn beide Ethernet-Ports eines Knotens, verursacht durch falsche Verkabelung, am selben Switch 1 oder Switch 2 hängen. Dieser Fehler tritt aufgrund der redundanten Ausführung der Kommunikationseinrichtung allerdings erst dann zutage, wenn genau dieser Switch 1 oder 2 ausfällt. Ein Verkabelungsfehler dieser Art kann relativ leicht auftreten und verhindert dann unnötigerweise sämtliche Redundanzeigenschaften des Systems. In
Figur 1 ist die Topologie der hochredundanten Konfiguration richtig verkabelt. Diese Konfiguration ist unter Zuhilfenahme von IP Adressenrekonfiguration von einem Ethernet-Port auf das andere resistent gegenüber allen Einzelfehlern der Hardware. Der (Nachrichten-)Verkehr hat immer einen Weg nach außen. - Die
Figur 2 zeigt den gleichen redundanten Aufbau einer Kommunikationseinrichtung mit zwei Switches 1 und 2 derFigur 1 , wobei im Unterschied zuFigur 1 die Verbindung des zweiten Knotens 4 an den Switch 1 nicht korrekt verkabelt ist. Die falsche Verkabelung / falsche Link 4.12 ist versehentlich auf den zweiten Switch 2 gelegt. - Der zweite Knoten 4 ist also mit beiden Links 4.2 und 4.12 an den zweiten Switch 2 angehängt. Dieser Fehler fällt im Normalbetrieb nicht auf, da der gesamte Kommunikationsverkehr über den Switch 2 läuft und beide Router 12 und 13 entweder über den direkten Weg oder den indirekten Weg über Crosslink 11 erreichbar sind. Fällt nun aber der zweite Switch 2 aus, so ist der zweite Knoten 4 vollständig isoliert, da er physikalisch keine Möglichkeit hat, den Verkehr über den Switch 1 zum Router zu schicken. Die Knoten 3, 5 und 6 sind beim Ausfall des Switches 2 immer noch über den ersten Switch 1 an den ersten Router angebunden.
- Dieser (Verkabelungs-)Fehler 4.12 des zweiten Knoten 4 kann mit Hilfe des neuen Verfahrens nun leicht detektiert und dann behoben werden. In einer möglichen Ausführungsvariante des neuen Verfahrens kann eine Anwendung, hier Anwendung 4 auf den Switchen 1 und 2 die Bridge-Tables (= Verbindungstabellen) abfragen. Sie erkennt dann, dass die Netzwerkadressen vom zweiten Knoten 4 am Switch 1 gar nicht und am Switch 2 doppelt vorhanden ist und kann diesen Sachverhalt alarmieren. Es kann dann die falsche Verkabelung / der falsche Link 4.12 manuell behoben werden.
- Dies ist natürlich nur ein einfaches Beispiel, um das Prinzip zu demonstrieren. Die Topologien können jedoch beliebig komplex werden, indem man zum Beispiel kaskadierende Switche und mehr als zwei Interfaces/Ethernet-Ports pro Host hat, wo dann natürlich die Wahrscheinlichkeit einer fehlerhaften Konfiguration zunimmt.
- Tritt ein Fehler auf, wird die Auswirkung der Falschverkabelung sofort in die Entscheidung zur Ersatzschaltung/Alarmierung einbezogen, was die Verfügbarkeit der Anordnung erhöht.
- Die Topologie wird beim Systemstart bekannt und ist dann administrierbar. Bei Änderungen der Topologie erfolgt eine Aktualisierung des logischen Models über eine Bedienschnittstelle. Da bei Wartungsarbeiten falsche Alarme gesendet werden würden, sollte die Alarmierung beziehungsweise routinemäßige Überprüfung über eine Bedienschnittstelle abschaltbar sein.
- Es versteht sich, dass die vorstehend genannten Merkmale der Erfindung nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der Erfindung zu verlassen.
Claims (12)
- Verfahren zur Fehlererkennung in einem paketbasierten Nachrichtenverteilsystem, wobei Nachrichten über mehrere Knoten (3, 4, 5, 6) und weitere Systemkomponenten (1, 2, 11, 12, 13) verteilt werden und jeder Knoten (3, 4, 5, 6) mindestens zwei adressierbare Schnittstellen aufweist, und zur Systemsicherheit die Nachrichtenverteilerwege redundant aufgebaut sind und beim Ausfall einer oder mehrerer Verbindungen der Knoten (3, 4, 5, 6) und/oder Systemkomponenten (1, 2, 11, 12, 13) im Nachrichtenverteilsystem Redundanzwege vorhanden sind und die Topologie des Nachrichtenverteilsystems den Knoten (3, 4, 5, 6) bekannt ist,
dadurch gekennzeichnet,
dass die Knoten (3, 4, 5, 6) durch Kommunikationstests die Erreichbarkeit der weiteren Knoten (3, 4, 5, 6) verifizieren, die Knoten (3, 4, 5, 6) zwischengelagerte Systemkomponenten (1, 2, 11, 12, 13) über vorhandene Schnittstellen (3.1 bis 6.1 und 3.2 bis 6.2) bezüglich deren Verbindungsstatus mit anderen Knoten (3, 4, 5, 6) und/oder Systemkomponenten (1, 2, 11, 12, 13) abfragen, die Knoten (3, 4, 5, 6) eventuell vorhandene Fehlkonfigurationen, physische Fehler (4.12) und/oder fehlende Redundanzwege des Nachrichtenverteilsystems signalisieren. - Verfahren nach dem voranstehenden Anspruch 1,
dadurch gekennzeichnet,
dass das Nachrichtenverteilsystem ein IP basiertes Nachrichtenverteilsystem, ein LAN oder ein VLAN ist, wobei jedem Knoten (3, 4, 5, 6) mindestens zwei eineindeutige Netzwerkadressen, IP- und/oder MAC-Adressen, zugeordnet werden. - Verfahren nach einem der voranstehenden Ansprüche 1 und 2,
dadurch gekennzeichnet,
dass die Daten, die die Topologie beschreiben, über eine Bedienschnittstelle verändert werden. - Verfahren nach einem der voranstehenden Ansprüche 1 bis 3,
dadurch gekennzeichnet,
dass vorhandene Fehlkonfigurationen des Nachrichtenverteilsystems nach Erkennung automatisch korrigiert werden. - Verfahren nach dem voranstehenden Anspruch 4,
dadurch gekennzeichnet,
dass im Falle einer physischen Falschverkabelung eines oder mehrerer Knoten (3, 4, 5, 6) und/oder der Systemkomponenten (1, 2, 11, 12, 13) die Konfigurationsdaten des Nachrichtenverteilsystems automatisch ohne Bedienereingriff modifiziert werden. - Verfahren nach einem der voranstehenden Ansprüche 1 bis 5,
dadurch gekennzeichnet,
dass der Verbindungsstatus der Knoten (3, 4, 5, 6) und/oder Systemkomponenten (1, 2, 11, 12, 13) in Verbindungstabellen (= Bridge-Tables) hinterlegt ist und die Knoten (3, 4, 5, 6) signalisieren, wenn sie ihre Netzwerkadresse in den Verbindungstabellen benachbarten Systemkomponenten gar nicht oder mehrfach vorfinden. - Verfahren nach einem der voranstehenden Ansprüche 1 bis 6,
dadurch gekennzeichnet,
dass bei Bedarf, bei Wartungsarbeiten, Um- und Erweiterungsbaumaßnahmen, die Signalisierung und Änderung der Fehlkonfiguration deaktiviert wird. - Verfahren nach einem der voranstehenden Ansprüche 1 bis 7,
dadurch gekennzeichnet,
dass zur Fehlererkennung und Verifikation der durch die Topologie verlangten Verschaltung und Konfiguration einzelne Knoten (3, 4, 5, 6) und/oder zwischengelagerte Systemkomponenten (1, 2, 11, 12, 13) abgeschaltet werden. - Verfahren nach Anspruch 6,
dadurch gekennzeichnet,
dass auf den Knoten (3, 4, 5, 6) Anwendungen (7, 8, 9, 10) ausgeführt werden, die die Bridge-Tables der benachbarten Systemkomponenten (1, 2) und die darin tatsächlich vorhandenen Netzwerkadressen überprüfen. - Verfahren nach Anspruch 9,
dadurch gekennzeichnet,
dass die Kommunikationstests und/oder die Anwendungen (7, 8, 9, 10) der Knoten (3, 4, 5, 6) im laufenden Betrieb des Nachrichtenverteilsystems abgeschaltet und bei Bedarf wieder zugeschaltet werden. - Verfahren nach einem der voranstehenden Ansprüche 1 bis 10,
dadurch gekennzeichnet,
dass die Kommunikationstests während des Systemstarts des Nachrichtenverteilsystems oder dem Anlauf weiterer Systemkomponenten (1, 2, 11, 12, 13) durchgeführt werden. - Verfahren nach einem der voranstehenden Ansprüche 1 bis 11,
dadurch gekennzeichnet,
dass die Kommunikationstests routinemäßig unter Zuhilfenahme der Steuerschnittstellen vorgelagerter Systemkomponenten (1, 2, 11, 12, 13) durchgeführt werden.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102004051167 | 2004-10-20 | ||
| PCT/EP2005/054649 WO2006042776A1 (de) | 2004-10-20 | 2005-09-19 | Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| EP1803261A1 EP1803261A1 (de) | 2007-07-04 |
| EP1803261B1 true EP1803261B1 (de) | 2008-11-12 |
Family
ID=35482834
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| EP05797012A Expired - Lifetime EP1803261B1 (de) | 2004-10-20 | 2005-09-19 | Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US8406121B2 (de) |
| EP (1) | EP1803261B1 (de) |
| DE (1) | DE502005005971D1 (de) |
| WO (1) | WO2006042776A1 (de) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10868708B2 (en) | 2015-11-02 | 2020-12-15 | Google Llc | System and method for handling link loss in a network |
| US12081407B2 (en) | 2022-02-08 | 2024-09-03 | Ciena Corporation | Updating configuration settings of network elements when a network is changed to a planned topology |
| WO2023154221A1 (en) * | 2022-02-08 | 2023-08-17 | Ciena Corporation | Updating configuration settings of network elements when a network is changed to a planned topology |
| US12445348B2 (en) | 2023-07-21 | 2025-10-14 | Bank Of America Corporation | Electronic system for proactive resiliency, redundancy and security remediation across a network based on dynamic analysis of technology applications |
| CN121210218B (zh) * | 2025-11-28 | 2026-03-03 | 苏州元脑智能科技有限公司 | 存储系统的故障检测方法和数据管理平台 |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5379278A (en) * | 1993-07-16 | 1995-01-03 | Honeywell Inc. | Method of automatic communications recovery |
| JP3432664B2 (ja) * | 1996-02-14 | 2003-08-04 | 富士通株式会社 | 通信ノード及び障害復旧方法並びに通信ネットワーク |
| US6208856B1 (en) * | 1997-12-08 | 2001-03-27 | Telefonaktiebolaget L M Ericsson | Method for maintaining service nodes in a telecommunications network |
| US6662217B1 (en) * | 1999-01-19 | 2003-12-09 | Microsoft Corporation | Distributed and automated test administration system for administering automated tests on server computers over the internet |
| US6393478B1 (en) * | 1999-02-22 | 2002-05-21 | Mediaone Group, Inc. | Cable modem and personal computer troubleshooting tool |
| US6581166B1 (en) * | 1999-03-02 | 2003-06-17 | The Foxboro Company | Network fault detection and recovery |
| DE19928484A1 (de) | 1999-06-22 | 2000-12-28 | Bosch Gmbh Robert | Datenübertragung in einem duplizierten Übertragungsnetzwerk |
| US6625728B1 (en) * | 1999-11-02 | 2003-09-23 | International Business Machines Corporation | Method and apparatus for locating and displaying a defective component in a data processing system during a system startup using location and progress codes associated with the component |
| WO2001063850A1 (en) * | 2000-02-25 | 2001-08-30 | Honeywell International Inc. | Multiple network fault tolerance via redundant network control |
| US6901443B1 (en) * | 2000-03-10 | 2005-05-31 | Honeywell International Inc. | Non-fault tolerant network nodes in a multiple fault tolerant network |
| US7327683B2 (en) * | 2000-03-16 | 2008-02-05 | Sri International | Method and apparatus for disseminating topology information and for discovering new neighboring nodes |
| DE10142372B4 (de) | 2001-01-05 | 2005-03-03 | Siemens Ag | Vorrichtung und Verfahren zum Wiederherstellen von Verbindungen in automatisch schaltbaren optischen Netzen |
| US7149430B2 (en) * | 2001-02-05 | 2006-12-12 | Finsiar Corporation | Optoelectronic transceiver having dual access to onboard diagnostics |
| WO2002065661A1 (en) * | 2001-02-12 | 2002-08-22 | Maple Optical Systems, Inc. | System and method for fast-rerouting of data in a data communication network |
| WO2004010625A2 (en) | 2002-07-24 | 2004-01-29 | Meriton Networks Inc. | Automatic detection and resolution of fiber cabling errors in optical networks |
| US7672226B2 (en) | 2002-09-09 | 2010-03-02 | Xiotech Corporation | Method, apparatus and program storage device for verifying existence of a redundant fibre channel path |
| US7385931B2 (en) * | 2003-08-22 | 2008-06-10 | Fujitsu Limited | Detection of network misconfigurations |
| US7844439B2 (en) * | 2006-03-10 | 2010-11-30 | Edsa Micro Corporation | Systems and methods for real-time protective device evaluation in an electrical power distribution system |
-
2005
- 2005-09-19 DE DE502005005971T patent/DE502005005971D1/de not_active Expired - Lifetime
- 2005-09-19 US US11/665,866 patent/US8406121B2/en not_active Expired - Fee Related
- 2005-09-19 WO PCT/EP2005/054649 patent/WO2006042776A1/de not_active Ceased
- 2005-09-19 EP EP05797012A patent/EP1803261B1/de not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| DE502005005971D1 (de) | 2008-12-24 |
| US8406121B2 (en) | 2013-03-26 |
| WO2006042776A1 (de) | 2006-04-27 |
| EP1803261A1 (de) | 2007-07-04 |
| US20070263547A1 (en) | 2007-11-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP2343857B1 (de) | Netzwerkknoten für ein Kommunikationsnetzwerk | |
| EP2070256B1 (de) | Verfahren zum rekonfigurieren eines kommunikationsnetzwerks | |
| EP2169882B1 (de) | Schiffsruder-Steuerung mit einem CAN-Bus | |
| EP1062787A1 (de) | Lokales netzwerk, insbesondere ethernet-netzwerk, mit redundanzeigenschaften sowie redundanzmanager | |
| EP2693700A1 (de) | Verfahren zur Nachrichtenübermittlung in einem redundant betreibbaren industriellen Kommunikationsnetz und Kommunikationsgerät für ein redundant betreibbares industrielles Kommunikationsnetz | |
| EP1394985A1 (de) | Testverfahren für Nachrichtenpfade in Kommunikationsnetzen sowie Netzelement | |
| DE19752792B4 (de) | Einrichtung zur Selbstdiagnose von im wesentlichen sporadischen Fehlern in seriellen Übertragungssystemen | |
| WO2021037466A1 (de) | Verfahren zur datenübermittlung in einem redundant betreibbaren kommunikationsnetz und koppel-kommunikationsgerät | |
| DE102010029301B4 (de) | Netzwerk und Erweiterungseinheit sowie Verfahren zum Betreiben eines Netzwerks | |
| EP1803261B1 (de) | Verfahren zur fehlererkennung in einem paketbasierten nachrichtenverteilsystem | |
| DE10305415B4 (de) | Verfahren und Vorrichtung zum medienredundanten Betreiben eines Endgeräts in einem Netzwerk | |
| EP2028791B1 (de) | Erkennung von Fehlkonfigurationen auf Netzwerkinfrastrukturgeräten | |
| EP2704370A1 (de) | Verfahren zur Nachrichtenübermittlung in einem redundant betreibbaren industriellen Kommunikationsnetz und Kommunikationsgerät für ein redundant betreibbares industrielles Kommunikationsnetz | |
| EP1869839B1 (de) | Verfahren, Computerprogrammprodukt und Netzknotenelement zur schnelleren Erkennung von Störungen auf Übertragungswegen und oder in Knoten | |
| DE10243384A1 (de) | Verfahren zur permanenten redundanten Übertragung von Datentelegrammen in Kommunikationssystemen | |
| EP3457232B1 (de) | Verfahren zum betrieb eines hochverfügbaren automatisierungssystems | |
| EP2750310A1 (de) | Verfahren zur Synchronisierung lokaler Uhren in einem Kommunikationsnetz eines industriellen Automatisierungssystems und Netzinfrastrukturgerät | |
| EP1851934B1 (de) | Verfahren zur fehlererkennung eines nachrichteninterfaces in einer kommunikationseinrichtung | |
| EP2182680B1 (de) | Verfahren zum Betrieb eines Kommunikationsnetzwerkes und Kommunikationskomponente | |
| EP3739822A1 (de) | Koppeln eines kommunikationsnetzwerks mit einem kommunikationsendgerät | |
| EP2817923B1 (de) | Rechnernetzwerk mit einer ringförmigen busverbindung | |
| EP2290882B1 (de) | Verfahren zur mehrfachen Fehlerredundanz in Netzwerken mit Ringtopologien | |
| DE102007021922B4 (de) | Paketvermitteltes Kommunikationsnetzwerk und Verfahren zum Rekonfigurieren des Kommunikationsnetzwerks | |
| EP1394995B1 (de) | Redundate Netzwerkanordnung | |
| DE4328068C1 (de) | Verfahren zum Ermitteln eines Ersatzweges in einem gedoppelten ringförmigen Kommunikationsnetz |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
| 17P | Request for examination filed |
Effective date: 20070122 |
|
| AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): DE FR GB |
|
| RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: NOKIA SIEMENS NETWORKS GMBH & CO. KG |
|
| 17Q | First examination report despatched |
Effective date: 20070830 |
|
| RAP3 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: NOKIA SIEMENS NETWORKS S.P.A. |
|
| RAP3 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: NOKIA SIEMENS NETWORKS GMBH & CO. KG |
|
| DAX | Request for extension of the european patent (deleted) | ||
| RBV | Designated contracting states (corrected) |
Designated state(s): DE FR GB |
|
| GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
| GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
| GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
| AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): DE FR GB |
|
| REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
| REF | Corresponds to: |
Ref document number: 502005005971 Country of ref document: DE Date of ref document: 20081224 Kind code of ref document: P |
|
| PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
| STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
| 26N | No opposition filed |
Effective date: 20090813 |
|
| PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20121010 Year of fee payment: 8 |
|
| REG | Reference to a national code |
Ref country code: FR Ref legal event code: ST Effective date: 20140530 |
|
| REG | Reference to a national code |
Ref country code: DE Ref legal event code: R079 Ref document number: 502005005971 Country of ref document: DE Free format text: PREVIOUS MAIN CLASS: H04L0012560000 Ipc: H04L0012751000 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: FR Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20130930 |
|
| REG | Reference to a national code |
Ref country code: DE Ref legal event code: R079 Ref document number: 502005005971 Country of ref document: DE Free format text: PREVIOUS MAIN CLASS: H04L0012560000 Ipc: H04L0012751000 Effective date: 20140801 Ref country code: DE Ref legal event code: R081 Ref document number: 502005005971 Country of ref document: DE Owner name: NOKIA SOLUTIONS AND NETWORKS GMBH & CO. KG, DE Free format text: FORMER OWNER: NOKIA SIEMENS NETWORKS GMBH & CO. KG, 81541 MUENCHEN, DE Effective date: 20140731 |
|
| REG | Reference to a national code |
Ref country code: FR Ref legal event code: CD Owner name: NOKIA SOLUTIONS AND NETWORKS GMBH & CO.KG, DE Effective date: 20150211 |
|
| PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 20190903 Year of fee payment: 15 |
|
| PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: GB Payment date: 20190919 Year of fee payment: 15 |
|
| REG | Reference to a national code |
Ref country code: DE Ref legal event code: R119 Ref document number: 502005005971 Country of ref document: DE |
|
| GBPC | Gb: european patent ceased through non-payment of renewal fee |
Effective date: 20200919 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20210401 |
|
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20200919 |