Beschreibung
Parallelisierte Programmsteuerung
Stand der Technik
Die Erfindung betrifft ein Steuerverfahren und ein Verfahren zum Ausführen mehrerer Programme auf mehreren parallel arbei- tenden Verarbeitungseinrichtungen.
Steuerungen von Maschinen und Anlagen erfolgen häufig auf der Basis von speicherprogrammierbaren Steuerungen (SPS) . Dabei wird üblicherweise ein Mikrocomputer verwendet, um ein Pro- gramm auszuführen, welches die Zustände einer Anzahl von mit der Maschine, bzw. Anlage verbundenen Sensoren abfragt, und auf der Basis der bestimmten Zustände eine Anzahl von mit der Maschine bzw. Anlage verbundenen Aktoren ansteuert. Komplexe Maschinen bzw. Anlagen können eine Vielzahl von Sensoren und Aktoren umfassen und hohe Anforderungen an die Leistungsfähigkeit des Mikrocomputers stellen.
Häufig führt der Mikrocomputer zur Steuerung der Maschine bzw. Anlage mehrere Programme parallel aus. Die Programme können miteinander in Wechselwirkung stehen oder unabhängig voneinander sein. Unterschiedliche Programme stellen unterschiedliche Anforderungen an den Mikrocomputer, was beispielsweise eine minimal zu garantierende Reaktionszeit auf eine Statusänderung eines Sensors oder eine Häufigkeit eines Abtastens eines Sensors bzw. Ausgebens eines Aktorwerts anbe¬ langt .
Bis zu einem gewissen Grad kann den gesteigerten Anforderungen an die Steuerung mit einem höher getakteten Mikroprozes- sor in dem Mikrocomputer begegnet werden. Aufgrund von physikalischen Gegebenheiten lässt sich diese Art der Leistungssteigerung jedoch nicht beliebig fortführen, so dass aktuelle
Mikroprozessoren zur Leistungssteigerung vorwiegend darauf bauen, mehrere parallel arbeitende Rechenkerne zu beschäfti¬ gen. Verfahren, die in der Vergangenheit dazu verwendet wur¬ den, eine geregelte Abfolge mehrerer Programme zur Steuerung von Maschinen auf nur einem Rechenkern zu steuern, sind nur schlecht geeignet, eine Verteilung von Programmen auf mehrer Rechenkerne durchzuführen.
In der DE 196 48 422 C2 wird vorgeschlagen, mittels einer Zeitscheibensteuerung eine verfügbare Rechenzeit eines Re¬ chenkerns alternierend auf ein echtzeitfähiges Programm zur Steuerung einer solchen Maschine und ein nicht echtzeitfähiges Betriebssystem zu verteilen. Die vorgeschlagene Zeit¬ scheibensteuerung wird durch einen programmierbaren Zeitgeber gesteuert, der im Rechenkern nach Ablauf einer vorbestimmten Zeit eine Unterbrechung (Interrupt, INT) auslöst. Die dem Be¬ triebssystem zugeordnete Rechenzeit kann unabhängig von der dem Steuerprogramm zugeordneten Rechenzeit festgelegt werden.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren und ein System anzugeben, um mehrere Programme zur Steuerung einer Maschine auf mehreren parallel arbeitenden Verarbeitungs¬ einrichtungen effizient auszuführen.
Offenbarung der Erfindung
Die Aufgabe wird gelöst durch ein Steuerverfahren mit den Merkmalen des Anspruchs 1 und durch ein System mit den Merkmalen des Anspruchs 12. Unteransprüche geben vorteilhafte Ausführungsformen der Erfindung wieder.
Nach einem ersten Aspekt ist jeder von mehreren parallel arbeitenden Verarbeitungseinrichtungen jeweils ein Zeitsignalgeber zugeordnet, bei dessen Ablaufen auf der zugeordneten Verarbeitungseinrichtung ein Steuerverfahren zum Ausführen von Programmen ausgeführt wird. Dabei umfasst das Steuerver¬ fahren Schritte des Auswählens eines zur Ausführung auf der
Verarbeitungseinrichtung bereitstehenden Programms, des Setzens des abgelaufenen Zeitsignalgebers auf eine vorbestimmte Zeitdauer und des Startens des ausgewählten Programms auf der Verarbeitungseinrichtung .
Dadurch kann erreicht werden, dass das Steuerverfahren jeweils bei Ablauf einer durch den Zeitsignalgeber gesteuerten Zeitdauer auf derjenigen Verarbeitungseinrichtung aufgerufen wird, auf der ein Wechsel des gerade ausgeführten Programms zu steuern ist. So kann ein gängiger Mikroprozessor mit mehreren Verarbeitungseinrichtungen verwendet werden, bei dem vorgesehen ist, dass ein Programm auf einer der Verarbeitungseinrichtungen des Mikroprozessors nur mittels Steuerbe¬ fehlen gestartet werden kann, die auf dieser Verarbeitungs- einrichtung ausgeführt werden. Insbesondere Mikroprozessoren der x86-Familie mit mehreren Rechenkernen sind derart aufge¬ baut und lassen sich vorteilhaft zur Ausführung des Steuerverfahrens verwenden. Um nach herkömmlichen Verfahren ein Starten eines Programms auf einer ersten Verarbeitungseinrichtung des Mikroprozessors durch ein Steuerprogramm zu steuern, das auf einer zweiten Verarbeitungseinrichtung des Mikroprozessors abläuft, ist ein großer Aufwand zu treiben, der üblicherweise bedingt, dass ein weiteres Steuerprogramm auf der ersten Verarbeitungseinrichtung gestartet wird und die beiden Steuerprogramme mit¬ einander kommunizieren. Durch den damit verbundenen Synchro- nisierungsaufwand stehen beide Verarbeitungseinrichtungen für eine relativ lange Zeit nicht zur Ausführung anderer Program- me des Mikroprozessors zur Verfügung, so dass nicht die ge¬ samte Rechenleistung des Mikroprozessors ausgenützt werden kann .
Das zur Ausführung bereitstehende Programm kann echtzeitfähig sein und zusätzlich kann ein nicht echtzeitfähiges Betriebs¬ system zur Ausführung auf dem Rechenkern bereitstehen. Bei aufeinanderfolgenden Durchführungen des Steuerverfahrens auf
derselben Verarbeitungseinrichtung kann abwechselnd das echt- zeitfähige Programm und das nicht echtzeitfähige Betriebssys¬ tem ausgewählt werden. Durch entsprechende Wahl der vorbestimmten Zeitdauern, auf die der Zeitsignalgeber gesetzt wird, kann dem ausgewählten Programm bzw. dem Betriebssystem jeweils eine Zeitdauer zugeteilt werden, während derer die Verarbeitungseinrichtung durch das Programm bzw. das Betriebssystem genutzt werden kann. Dadurch kann beeinflusst werden, in welchen Abständen das Programm aufgerufen wird, wie lange das Programm maximal auf eine Ausführung warten muss und wie viel Rechenzeit dem Programm nach dessen Aufruf zur Verfügung steht. Parallel zur Ausführung des Programms kann das nicht echtzeitfähige Be- triebssystem dazu verwendet werden, Standard-Aufgaben durchzuführen, wie beispielsweise eine Ein- bzw. Ausgabe von Daten des Programms an eine Festplatte oder eine Anzeige. Das Be¬ triebssystem bzw. von ihm gesteuerte Programme können auf einem oder mehreren Rechenkernen parallel ablaufen.
Die Zeitdauern können in weiten Grenzen frei eingestellt werden. Die vorbestimmten Zeitdauern des Betriebssystems und des echtzeitfähigen Programms können sich zu einer Zykluszeit ergänzen, welche der Verarbeitungseinrichtung zugeordnet ist. Unterschiedliche Verarbeitungseinrichtungen können unterschiedliche zugeordnete Zykluszeiten aufweisen. Ein Verhält¬ nis, in welchem eine Zykluszeit auf das Betriebssystem und das echtzeitfähige Programm verteilt wird, kann beispielswei¬ se auf der Basis eines Parameters verändert werden. Dieser Parameter kann im laufenden Betrieb der Verarbeitungseinrichtung bzw. des Mikroprozessors veränderbar sein, um veränderliche Lastbedingungen einer durch das Programm gesteuerten Maschine zu berücksichtigen. Vor dem Setzen des abgelaufenen Zeitsignalgebers auf die be¬ stimmte Zeitdauer kann die vorbestimmte Zeitdauer derart an- gepasst werden, dass das geplante Ende der Zeitdauer um nicht
weniger als eine vorbestimmte Zeitdauer von einem geplanten Ablaufen des Zeitsignalgebers einer anderen Verarbeitungseinrichtung entfernt liegt. Dadurch kann sichergestellt werden, dass das Steuerverfahren nicht auf mehr als einer Verarbei- tungseinrichtung zur gleichen Zeit aufgerufen wird. Dies ist besonders vorteilhaft, wenn das Steuerprogramm noch weitere Aufgaben durchführt, die zur Koordination mehrerer Programme auf den mehreren Verarbeitungseinrichtungen erforderlich sind, und die eine Nebenläufigkeit mehrerer Instanzen des Steuerprogramms ausschließen. Solche Aufgaben können bei¬ spielsweise ein Zuteilen von gemeinsam genutzten Ressourcen an das Programm bzw. das Betriebssystem oder eine Steuerung von Kommunikation zwischen Programmen umfassen. Durch das beschriebene Anpassen der vorbestimmten Zeitdauer kann eine Gesamtleistung der Verarbeitungseinrichtungen maxi- miert werden, indem ein Warten einer Verarbeitungseinrichtung auf eine Ausführung des Steuerprogramms vermieden wird. Das Anpassen kann durch ein einmaliges Verändern der geplanten Zeitdauer erfolgen; alternativ dazu kann eine vorbestimmte Zeitdauer, die dem Programm zugeordnet ist, verändert wer¬ den, so dass sich die Anpassung bei allen folgenden Aufrufen des Programms auswirkt. Die Zykluszeit des zugeordneten Re- chenkerns kann dadurch verändert werden, so dass dauerhaft weniger Kollisionen mit den Zyklen einer anderen Verarbeitungseinrichtung erfolgen. Insbesondere Zykluszeiten, deren Enden periodisch kollidieren, können so vermieden werden, wodurch eine Anpassung im Einzelfall weniger wahrscheinlich wird.
In einer weiteren Ausführungsform kann das Steuerverfahren einen vorausgehenden Schritt des Verhinderns weiterer Aufrufe des Steuerverfahrens sowie einen abschließenden Schritt des Ermöglichens weiterer Aufrufe des Steuerverfahrens umfassen. Soll das Steuerverfahren, wie oben beschrieben ist, nicht parallel auf mehreren Verarbeitungseinrichtungen ausgeführt
werden, kann durch diese Schritte eine zusätzliche Absiche¬ rung gegen Verarbeitungsfehler erfolgen.
Durch die dadurch hergestellte mehrfache Aufrufbarkeit des Steuerprogramms zur gleichen Zeit kann das Steuerverfahren beispielsweise auch auf der Basis von Ereignissen aufgerufen werden, die asynchron zu den Zeitsignalgebern erfolgen, beispielsweise durch einen aktiven Aufruf eines auf einer Verarbeitungseinrichtung ablaufenden Programms.
Jeder Verarbeitungseinrichtung kann eine Liste zugeordnet sein, in die Programme eingetragen sind, die zur Ausführung auf dieser Verarbeitungseinrichtung bereitstehen. Das Auswählen des Programms erfolgt dann unter den Einträgen dieser Liste. Ein einzelnes Programm kann so einer bestimmten Verarbeitungseinrichtung zugeordnet sein. Programme, die bevorzugt parallel zueinander ablaufen sollen, können unterschiedlichen Verarbeitungseinrichtungen zugeordnet werden, während Programme, die bevorzugt sequenziell ausgeführt werden sollen, der gleichen Verarbeitungseinrichtung zugeordnet werden können. Abhängigkeiten zwischen den Programmen, die beispielsweise durch eine durch mehrere Programme gesteuerte Maschine bedingt sind, können auf diese Weise berücksichtigt werden. Die Zuordnung eines Programms zu einer Verarbeitungseinrichtung kann durch einen Benutzer durchgeführt werden, so dass ein Systemwissen des Benutzers genutzt werden kann; in einer anderen Ausführungsform kann die Zuordnung durch das Steuerprogramm erfolgen, indem das Steuerprogramm beispielsweise eine zurückliegende Auslastung wenigstens einer der Verarbei¬ tungseinrichtungen als Entscheidungsbasis für die Zuordnung verwendet. Mit Hilfe der Zuordnung durch das Steuerprogramm kann eine gleichmäßige Auslastung der Verarbeitungseinrichtungen erzielt werden. Ferner ist es möglich, eine der Verar- beitungseinrichtungen teilweise oder ganz von der Ausführung von Programmen bzw. des Betriebssystems freizustellen, so
dass die Verarbeitungseinrichtung in einen Energiesparmodus versetzt werden kann.
Die Einträge der Programme in der Liste können eine Priorität des Programms umfassen und das Auswählen des Programms kann auf der Basis der Priorität erfolgen. So kann es ermöglicht werden, dass ein Programm hoher Priorität ein Programm niedriger Priorität von einem Rechenkern verdrängt. Durch die Beachtung der Prioritäten können Zeitvorgaben einer gesteuerten Maschine eingehalten werden, wodurch Flexibilität und Zuverlässigkeit der Steuerung gesteigert sein können. Da die Lis¬ ten jeweils nur lokal für den jeweiligen Rechenkern ausgewertet werden, können Programme unterschiedlicher Prioritäten auf unterschiedlichen Rechenkernen gleichzeitig ausgeführt werden.
Das Steuerverfahren kann in Form eines Computerprogrammpro¬ dukts auf einem Computersystem ablaufen oder auf einem computerlesbaren Aufzeichnungsmedium abgespeichert sein.
Nach einem zweiten Aspekt umfasst ein System zum Ausführen mehrer Programme mehrere Verarbeitungseinrichtungen, wobei jeder Verarbeitungseinrichtung ein Zeitsignalgeber zugeordnet ist, sowie das oben beschriebene Steuerverfahren. Die Verar- beitungseinrichtungen können von einem integrierten Schaltkreis umfasst sein. Insbesondere können die Verarbeitungseinrichtungen Rechenkerne (Cores) oder virtuelle Rechenkerne, wie sie beispielsweise bei Hyperthreading verwendet werden, umfassen. Dadurch kann von der engen Vernetzung der Verarbei- tungseinrichtungen auf dem integrierten Schaltkreis Gebrauch gemacht werden, so dass beispielsweise eine Steuerung einer komplexen technischen Anlage durch eine Vielzahl von miteinander in Verbindung stehenden Programmen effizienter bewerkstelligt werden kann.
Die Zeitsignalgeber können in Form von Zählern implementiert sein, die mit einem Taktsignal betrieben sind, wobei jeder
Zähler in der ihm zugeordneten Verarbeitungseinrichtung eine Unterbrechung (Interupt, INT) auslöst, sobald der Zähler ei¬ nen vorbestimmten Wert erreicht. Insbesondere kann der Zähler abwärts zählen und der vorbestimmte Wert kann Null sein. Der¬ artige Zähler sind in gängigen Mikroprozessoren mit mehreren Verarbeitungseinrichtungen bereits vorgesehen.
Jeder Zähler kann einen programmierbaren Teiler zum Teilen eines für alle Zähler gleichen Systemtakts in ein dem Zähler zugeordnetes Taktsignal umfassen. Dadurch werden alle Zeit¬ dauern von der selben Zeitbasis abgeleitet und stehen in bekannten Verhältnissen zueinander. Durch Wahl des Werts, auf den ein Zähler gesetzt wird, und entsprechendes Programmieren des zugeordneten Teilers kann die Zeitdauer des Zählers in einem weiten Bereich eingestellt werden, so dass sich ein flexibles System zur Bearbeitung von Programmen mit stark unterschiedlichen Anforderungen ergeben kann.
Kurze Beschreibung der Figuren
Im Folgenden wird die Erfindung mit Bezug auf die beigefügten Figuren genauer beschrieben, in denen:
Fig. 1 eine schematische Übersicht über eine gesteuerte
technische Anlage;
Fig. 2 eine schematische Darstellung eines Prozessors aus
Fig. 1;
Fig. 3 ein Ablaufdiagramm eines Verfahrens zur Ausführung auf dem Prozessor aus Fig. 2 ;
Fig. 4 eine beispielhafte Prozesstabelle für das Verfahren aus Fig. 3 und
Fig. 5 verschiedene Heuristiken zur Vermeidung von Kollisionen der Enden von gesetzten Zeitdauern auf dem Prozessor aus Fig. 2 zeigen .
Beschreibung von Ausführungsbeispielen
Fig. 1 zeigt eine schematische Übersicht über eine gesteuerte technische Anlage 100. Die gesteuerte technische Anlage 100 umfasst einen Mikrocomputer 110, der auf bekannte Weise mit einem Arbeitsspeicher 120, einem Festspeicher 130, einer Anzeige 140 und einem Eingabegerät 150 verbunden ist. Der Mik¬ rocomputer 110 umfasst üblicherweise wenigstens einen Mikro¬ prozessor (Prozessor, Central Processing Unit, CPU) und di- verse zusätzliche Bauteile wie beispielsweise eine Spannungs¬ versorgung und Schnittstellen zum Arbeitsspeicher 120 und dem Festspeicher 130. Die Anzeige 140 und das Eingabegerät 150 sind dazu vorgesehen, einem Benutzer eine Bedienung des Mikrocomputers 110 zu ermöglichen. Eine Bedienung des Mikrocom- puters 110 kann optional oder zusätzlich auch mittels eines Zugangs über eine Netzwerk-Schnittstelle und eines daran an¬ geschlossenen weiteren Computersystems erfolgen. In einer Ausführungsform können dementsprechend die Anzeige 140 und das Eingabegerät 150 entfallen. .
Eine Produktionsmaschine 160 umfasst eine Vielzahl Sensoren 165, die mit einer Sensorschnittstelle 170 verbunden sind, sowie eine Vielzahl Aktoren 175, die mit einer Aktorschnitt¬ stelle 180 verbunden sind. Die Schnittstellen 170 und 180 sind jeweils mit dem Mikrocomputer 110 verbunden. Es kann ein echtzeitfähiges Netzwerk vorgesehen sein, um die Sensoren 165 mit der Sensorschnittstelle 170 bzw. die Aktoren 175 mit der Aktorschnittstelle 180 und/oder die Schnittstellen 170 und 180 mit dem Mikrocomputer 110 zu verbinden, beispielsweise EtherCat.
Die dargestellte Produktionsmaschine 160 steht stellvertre¬ tend für eine beliebige Maschine oder Anlage, die mittels des Mikrocomputers 110 gesteuert wird. Die Produktionsmaschine 160 kann beispielsweise eine CNC-Werkzeugmaschine oder ein
Walzwerk zur Produktion von Stahlblechen sein. In alternativen Ausführungen können auch weniger als die dargestellten
Sensoren 165 und/oder Aktoren 175 umfasst sein. Die Sensoren 165 können analoge und/oder digitale Sensoren sein, beispielsweise in Form von Weg-, Licht-, Temperatur-, Geschwin- digkeits-, Schall oder anderen Sensoren. An einer komplexen Produktionsmaschine 160 kann die Zahl der Sensoren 165 mehr als 100 betragen. Die Aktoren 175 können analoge und/oder digitale Aktorwerte umsetzen, beispielsweise in Form von Venti¬ len, Antrieben, Licht- und Wärmesteuerungen und anderen Aktoren. Eine komplexe Produktionsmaschine 160 kann Aktoren zur Steuerung von 80 Achsen oder mehr umfassen.
Das aus den Komponenten 110-150 gebildete Computersystem tastet die Sensoren 165 ab und steuert in Abhängigkeit von den abgetasteten Werten die Aktoren 175 an. Je nach Beschaffen- heit der Produktionsmaschine 160 laufen zur Bestimmung der
Ansteuerung der Aktoren 175 eines oder mehrere Programme auf dem Computersystem 110-150 ab.
Fig. 2 zeigt eine schematische Darstellung eines Prozessors 200 des Mikrocomputers 110 aus Fig. 1. Der Prozessor 120 um¬ fasst ein Gehäuse 210, in dem vier Rechenkerne (Cores) C0-C3 angeordnet sind. In anderen Ausführungsformen kann eine andere Anzahl Rechenkerne C0-C3 von dem Prozessor 200 umfasst sein, übliche Zahlen von Rechenkernen C0-C3 in einem Prozes- sor 200 sind 2, 4, 8, 16 oder 32. Eine obere Grenze für Re¬ chenkerne C-0C3 im Prozessor 200 besteht nicht; ferner muss die Zahl der Rechenkerne C0-C3 im Prozessor 200 nicht auf ei¬ ne Zweierpotenz fallen. Die Rechenkerne C0-C3 können physika¬ lisch im Prozessor 200 implementiert oder durch eine virtuel- le Technik wie Hyperthreading bereitgestellt sein. Jeder der Rechenkerne C0-C3 ist jeweils mit einem ihm zugeordneten Zäh¬ ler T0-T3 verbunden, der wiederum mit einem ihm zugeordneten Teiler D0-D3 verbunden ist. Alle Teiler D0-D3 sind mit einem gemeinsamen Taktgeber 220 verbunden. Der Taktgeber 220 kann sich beispielsweise im Mikrocomputer 110 aus Fig. 1 oder in einer alternativen Ausführungsform auch innerhalb des Gehäuses 210 des Prozessors 200 befinden. In einer bevorzugten
Ausführungsform werden Taktsignale, die zur Taktung der Rechenkerne C0-C3 verwendet werden, und das vom Taktgeber 220 bereitgestellte Taktsignal aus einem gemeinsamen Taktsignal bereitgestellt .
Jeder der Rechenkerne C0-C3 kann schreibend und vorzugsweise auch lesend auf den ihm zugeordneten Zähler T0-T3 und Teiler D0-D3 zugreifen. Die Teiler D0-D3 können durch Beschreiben durch den zugeordneten Rechenkern C0-C3 auf einen Divisor programmiert werden, so dass das vom Taktgeber 220 bereitge¬ stellte Taktsignal in seiner Frequenz durch den programmierten Divisor geteilt wird und das resultierende Taktsignal dem jeweiligen Zähler T0-T3 bereitgestellt wird. Die Zähler T0-T3 sind Abwärtszähler, die bei Erreichen eines Zählerstandes von Null eine Unterbrechung (Interrupt) im zu¬ geordneten Rechenkern C0-C3 auslösen. Ein Zählerstand, von dem aus das Abwärtszählen erfolgt, kann von dem zugeordneten Rechenkern C0-C3 in den Zähler T0-T3 geschrieben werden. In einer bevorzugten Ausführungsform können die Zähler T0-T3 von dem zugeordneten Rechenkern C0-C3 auch angehalten und gestartet werden.
Die Zuordnung der Teiler D0-D3 und Zähler T0-T3 zu den Re- chenkernen C0-C3 ist transparent, das heißt, dass ein auf ei¬ nem der Rechenkerne Cl bis C3 ablaufendes Programm lediglich Zugriff auf den Teiler D0-D3 und den Zähler T0-T3 hat, der dem Rechenkern C0-C3 zugeordnet ist, auf dem das Programm ab¬ läuft. Die Programmbefehle zum Zugriff auf den zugeordneten Teiler D0-D3 und Zähler T0-T3 sind für alle Rechenkerne C0-C3 identisch. Ein Zugriff auf einen Teiler D0-D3 oder einen Zähler T0-T3 eines anderen Rechenkerns C0-C3 ist aufgrund der Architektur des Prozessors 200 nicht möglich. Soll ein beispielsweise auf dem Rechenkern Cl ablaufendes
Programm den Zähler TO beschreiben, der dem Rechenkern CO zugeordnet ist, so muss das auf dem Rechenkern Cl ablaufende
Programm entweder dafür sorgen, dass es den Rechenkern wechselt und auf dem Rechenkern CO ausgeführt wird, oder das auf dem Rechenkern Cl ablaufende Programm muss ein weiteres, auf dem Rechenkern CO ablaufendes Programm kontaktieren, damit dieses den gewünschten Zugriff auf den Zähler TO durchführt.
Erfolgt eine Unterbrechung (Interrupt) auf einem der Rechenkerne C0-C3, so wird auf dem betreffenden Kern C0-C3, bei¬ spielsweise durch vorheriges Setzen eines Interrupt-Vektors, ein Steuerprogramm (Scheduler) aufgerufen, welches ein Programm auswählt, welches auf dem betreffenden Rechenkern C0-C3 ausgeführt werden soll. Anschließend setzt das Steuerprogramm den zugeordneten Zähler T0-T3 und/oder den zugeordneten Teiler D0-D3 erneut und startet das ausgewählte Programm. Auf diese Weise wird ein Zeitschreiben-Mechanismus implementiert, der dem ausgewählten Programm nur eine begrenzte Rechenzeit zur Verfügung stellt, bevor eine neuerliche Unterbrechung (Interrupt) das Steuerprogramm erneut aufruft und das Steuer¬ programm überprüft, welches Programm im Folgenden weiter aus- geführt werden soll.
Das Steuerprogramm ist das selbe für alle Rechenkerne C0-C3. Im Ergebnis vergibt das Steuerprogramm den Rechenkern C0-C3, der durch seinen ihm zugeordneten Zähler T0-T3 zuletzt unter- brochen wurde, an ein Programm, das zur Ausführung auf diesem Rechenkern C0-C3 bereit steht. So ist ein Zeitscheibenmechanismus implementiert, um mehrere Programme verteilt auf den mehreren Rechenkernen C0-C3 ablaufen zu lassen. Durch das Auswählen eines auszuführenden Programms jeweils lokal auf demjenigen Rechenkern C0-C3, auf dem das Steuerprogramm läuft, wird das Steuerprogramm effektiv auf allen Rechenkernen C0-C3 ausgeführt wodurch bereits eine Lastverteilung von Programmen auf die Rechenkerne C0-C3 erzielt werden kann und ein komplexes Verfahren zur Steuerung aller im Prozessor 200 ablaufenden Programmen durch ein zentrales, auf einem einzigen Rechenkern ablaufendes Steuerprogramm nicht erforderlich ist .
Fig. 3 zeigt ein Ablaufdiagramm eines Verfahrens 300 zur Aus¬ führung auf dem Prozessor 200 aus Fig. 2 im Mikrocomputer 110 aus Fig. 1. Das Verfahren 300 bildet die wesentlichen Schrit- te des oben mit Bezug auf Fig. 2 beschriebenen Steuerpro¬ gramms (Scheduler) ab.
Im ersten Schritt 305 befindet sich das Verfahren 300 im Startzustand . Der Schritt 305 ist der erste vom Verfahren 300 ausgeführte Schritt, nachdem das Verfahren 300, beispielswei¬ se durch eine Unterbrechung (Interrupt) eines der Zähler T0- T3 aus Fig. 2, aufgerufen wurde. In einem folgenden Schritt 310 blockiert das Verfahren 300 zunächst weitere Aufrufe des Verfahrens 300, um zu verhindern, dass auf mehreren der Re- chenkerne C0-C3 mehrere Instanzen des Verfahrens 300 parallel ablaufen. Das Blockieren kann beispielsweise mittels eines bekannten Synchronisierungsmechanismus des Prozessors 200 er¬ folgen, etwa durch einen Semaphor oder ein entsprechendes Register, das dazu vorgesehen ist, konkurrierende Zugriffe der Rechenkerne C0-C3 auf nicht gleichzeitig nutzbare Ressourcen zu koordinieren. Der Schritt 310 ist nur dann erforderlich, wenn das Verfahren 300 über das Zuordnen von Programmen zu Rechenkernen C0-C3 hinaus noch Dienste bereitstellt, die eine parallele Ausführung des Verfahrens 300 verbieten. Zu solchen Diensten kann beispielsweise eine Zuteilung von exklusiv genutzten Ressourcen, wie dem Festspeicher 130, an auf den Rechenkernen C0-C3 ablaufende Programme zählen. Für die bloße Zuteilung eines Programms an einen Rechenkern C0-C3 können unter Umständen mehrere gleichzeitig ablaufende Verfahren 300 auf unterschiedlichen Rechenkernen C0-C3 zugelassen werden und das im Schritt 310 beschriebene Blockieren ist nicht er¬ forderlich .
In einem folgenden Schritt 315 wird überprüft, ob auf dem betreffenden Rechenkern C0-C3 als nächstes ein echtzeitfähiges Programm oder ein nicht echtzeitfähiges Betriebssystem ausgeführt werden soll. Das Verfahren 300 ist so ausgelegt,
dass bei aufeinanderfolgenden Aufrufen des Verfahrens 300 auf dem selben Rechenkern C0-C3 alternierend das Betriebssystem und ein echtzeitfähiges Programm ausgeführt wird. Soll ein echtzeitfähiges Programm ausgeführt werden, so verzweigt das Verfahren 200 in einen Schritt 320 und wählt aus einer Tabel¬ le, die dem Rechenkern C0-C3 zugeordnet ist, auf dem das Ver¬ fahren 300 ausgeführt wird, einen Eintrag aus, der eines von potentiell mehreren zur Ausführung auf dem Rechenkern C0-C3 bereitstehenden Programm repräsentiert, wie unten mit Bezug zu Fig. 4 näher ausgeführt wird.
In einem folgenden Schritt 325 wird bestimmt, welche Zeitdau¬ er dem ausgewählten Programm zur Verfügung gestellt wird, bevor das Verfahren 300 zeitgesteuert erneut aufgerufen wird, um eine erneute Zuteilung eines Programms an den Rechenkern C0-C3 durchzuführen.
Wird im Schritt 315 hingegen bestimmt, dass das Betriebssys¬ tem ausgeführt werden soll, so verzweigt das Verfahren 300 zum Schritt 330 und wählt das Betriebssystem als nächstes auszuführendes Programm aus. Das Betriebssystem kann weitere Programme koordinieren, deren Zuordnung zu einem der Rechenkerne C0-C3 nicht durch das Verfahren 300 gesteuert wird, sondern durch das Betriebssystem selbst. Solche vom Betriebs- System abhängigen Programme laufen innerhalb der Zeit ab, die dem Betriebssystem durch das Steuerprogramm des Verfahrens 300 bereitgestellt wird. Analog zum oben beschriebenen
Schritt 325 wird im folgenden Schritt 335 bestimmt, welche Zeitdauer dem Betriebssystem zur Ausführung zugeordnet ist.
Nach Durchführung des Schritts 325 bzw. 335 fährt das Verfahren mit einem Schritt 340 fort, in welchem überprüft wird, ob ein Ende der bestimmten Zeitdauer mit einem Ende einer anderen Zeitdauer kollidiert, auf die einer der Zeitgeber T0-T3 programmiert ist. Hierfür können Ablaufzeiten aller Zähler T0-T3 in einem Speicherbereich hinterlegt sein, auf den von jedem der Rechenkerne C0-C3 aus zugegriffen werden kann.
Eine Kollision der Enden von Zeitdauern bedeutet in diesem Zusammenhang, dass das Ende der in einem der Schritte 325 o- der 335 bestimmten Zeitdauer näher als ein vorbestimmtes Maß an einem Zeitpunkt liegt, zu dem einer der Zeitgeber T0-T3 abläuft und zu dem ein Aufruf des Verfahrens 300 erfolgt. Dieses vorbestimmte Maß ist mindestens so groß wie eine Zeit, die das Verfahren 300 üblicherweise zur einmaligen Ausführung benötigt .
Wird im Schritt 240 eine Kollision des Endes der vorbestimm¬ ten Zeitdauer mit dem Ende einer anderen Zeitdauer festgestellt, so wird in einem Schritt 345 die vorbestimmte Zeit¬ dauer angepasst. Dazu kann die vorbestimmte Zeitdauer um ei- nen vorbestimmten Betrag vergrößert oder verkleinert werden. Die im Schritt 345 verwendete Heuristik zum Anpassen der vorbestimmten Zeitdauer kann auch eine Periodizität der Zeitpunkte, zu denen die Zähler T0-T3 Unterbrechungen auslösen, berücksichtigen. In einer Ausführungsform werden die Schritte 340 und 345 so oft durchlaufen, bis eine Anpassung der Zeit¬ dauer erfolgt ist, die eine Kollisionsfreiheit sicher stellt. Übliche Schutzmaßnahmen zur Verhinderung einer Endlosschleife über die Schritte 340 und 345 können verwendet werden. In einem Schritt 350 wird der Zähler T0-T3, der dem Rechenkern C0-C3 zugeordnet ist, auf dem das Verfahren 300 abläuft, auf einen Wert gesetzt, der der vorbestimmten Zeitdauer entspricht . Schließlich wird in einem Schritt 355 die im Schritt 310 ge¬ setzte Blockade entfernt, so dass weitere Aufrufe des Verfah¬ rens 300 möglich sind, und das in einem der Schritte 320 oder 330 ausgewählte Programm oder Betriebssystem gestartet. Vorzugsweise erfolgen diese beiden Aktionen unteilbar in einem einzigen Schritt, so dass das Verfahren 300 nicht erneut ge¬ startet wird, bevor das ausgewählte Programm bzw. das Be¬ triebssystem auf dem Rechenkern C0-C3 gestartet ist.
Fig. 4 zeigt eine beispielhafte Prozesstabelle 400 zur Ver¬ wendung mit dem Verfahren 300 aus Fig. 3. Jedem der Rechenkerne C0-C3 aus Fig. 2 ist eine individuelle Prozesstabelle 400 zugeordnet. Durch Eintragen eines Programms 410-450 in die Prozesstabelle 400 erfolgt eine Zuordnung des Programms 410-450 zu dem jeweiligen Rechenkern C0-C3.
In der Tabelle 400 sind Programme 410 bis 450 eingetragen. Jedem eingetragenen Programm 410-450 ist eine Priorität, eine Wartezeit, ein Status und eine Anzahl von Ticks zugeordnet. Die Priorität gibt an, mit welcher Dringlichkeit das Programm 410-450 ausgeführt werden soll, wobei eine hohe Priorität ei¬ ner hohen Dringlichkeit entspricht. Von mehreren zur Ausfüh- rung bereitstehenden Programmen 410-450 wird durch das Steuerprogramm des Verfahrens 300 das Programm 410-450 ausge¬ wählt, das die höchste Priorität aufweist. Die Wartezeit des Programms 410-450 gibt an, wie viel Zeit zwischen aufeinander folgenden Aufrufen des Programms 410-450 vergehen soll. Die Wartezeit wird üblicherweise in Einheiten eines für den Re¬ chenkern C0-C3 einstellbaren Systemtakts angegeben, wobei der Systemtakt beispielsweise zwischen 10μ3 und 100 ms, bevorzugt zwischen 100 μ3 und 1 ms betragen kann. In einer Ausführungsform wird der Systemtakt auf die kürzeste Wartezeit aller in der Tabelle 400 eingetragenen Programme 410-450 gesetzt. Wei¬ terhin kann vorgesehen sein, den Systemtakt mit einem anderen Takt zu synchronisieren, um beispielsweise eine Kommunikation mit einer anderen Verarbeitungssystem, das mit der Produktionsmaschine 160 aus Fig. 1 integriert sein kann, zu erleich- tern. So können im Rahmen der technischen Anlage 100 mehrere verteilte Taktgeber bzw. Uhren vorgesehen sein, die Zeitbasen für unterschiedliche Steuerprozesse bereitstellen. Die Syn¬ chronisation kann beispielsweise durch Einschieben von Wartezyklen erfolgen.
Der Status eines Programms 410-450 gibt an, ob das Programm 410-450 zur Ausführung bereitsteht, wartet oder gerade ausge-
führt wird. Ist der Status eines Programms 410-450 HIGH
READY, so hat es lange genug auf einer Ausführung gewartet und steht zur Ausführung bereit. Erfordert das Programm 410- 450 keine Rechenzeit und wartet seinen nächsten Aufruf ab, so ist der Status WAITING. Wird das Programm 410-450 ausgeführt, so ist sein Status EXECUTING. Die Anzahl der Ticks jedes Pro¬ gramms 410-450 wird mit jedem Systemtakt um Eins verringert.
Erreicht die Zahl der Ticks eines Programms 410-450 Null, so wird der Status des Programms 410-450 auf HIGH READY gesetzt. Die Ticks werden jedoch weiter gezählt, bis das Programm 410- 450 durch das Steuerprogramm des Verfahrens 300 auf Fig. 3 zur Ausführung ausgewählt wird. Dann wird der Status des Pro¬ gramms 410-450 auf EXECUTING gesetzt und die Anzahl der Ticks des Programms 410-450 auf seine Wartezeit gesetzt.
Eine Statusänderung eines Programms 410-450 von WAITING auf HIGH READY hat somit nicht unmittelbar ein Ausführen des Programms 410-450 auf einem der Rechenkerne C0-C3 auf Fig. 2 zur Folge. Stattdessen signalisiert der Status des Programms 410- 450 dessen Ausführbarkeit, und beim nächsten Aufruf des Steu¬ erprogramms des Verfahrens 300 gelangt dasjenige Programm 410-450 zur Ausführung, dessen Status HIGH READY ist und das gleichzeitig die höchste Priorität hat.
Hat das ausgeführte Programm 410-450 seine Aufgabe erledigt und benötigt bis zu seinem nächsten Aufruf keine weitere Re¬ chenzeit, so ruft das Programm 410-450 das Steuerprogramm des Verfahrens 300 aus Fig. 3 auf. Der Status des Programms 410- 450 in der Prozesstabelle 400 wird von EXECUTING auf WAITING gesetzt .
In einer Ausführungsform erfolgt eine Zuordnung eines Programms 410-450 zu einer Tabelle 400 bzw. zu einem Rechenkern C0-C3 durch das Steuerprogramm des Verfahrens 300. Das Steu-
erprogramm protokolliert bei jedem Aufruf, welches Programm 410-450 wann ausgewählt wird. Kann kein Programm 410-450 aus¬ gewählt werden, weil keines zur Ausführung bereit steht, so wird eine Leerlaufzeit des Rechenkerns protokolliert. Aus den protokollierten Zeiten des Arbeitens und der Leerlaufzeiten bestimmt das Steuerprogramm eine Auslastung des Rechenkerns und weist im Bedarfsfall ein Programm 410-450 einem Rechen¬ kern C0-C3 zu, dessen Auslastung niedriger als die anderer Rechenkerne C0-C3 war.
Die Zuordnung kann auch derart erfolgen, dass eine minimale Anzahl Rechenkerne C0-C3 eine möglichst hohe Auslastung auf¬ weisen, so dass verbleibende Rechenkerne C0-C3 nicht oder nur wenig benutzt werden und in einen stromsparenden Modus ver- setzt werden können.
In einer weiteren Ausführungsform erfolgt eine Zuordnung eines Programms 410-450 zu einer Tabelle bzw. zu einem Rechen¬ kern C0-C3 manuell durch einen Benutzer des Mikrocomputers 110. Das Steuerprogramm des Verfahrens 300 kann, wie oben ausgeführt, trotzdem entsprechende Protokolleinträge sammeln, auf deren Basis der Benutzer die Zuordnung treffen kann. Eine Aufbereitung der protokollierten Daten, beispielsweise in Listenform oder graphisch, kann hierfür unterstützend erfol- gen. In einer Variante werden Auslastungsgrade mehrerer Re¬ chenkerne C0-C3 dem Benutzer als zeitliche Verläufe darge¬ stellt, gegebenenfalls zusammen mit durchschnittlichen Aus¬ lastungsgraden der Rechenkerne C0-C3. Eine Zuordnung eines Programms 410-450 zu einer Tabelle 400 bzw. zu einem Rechen- kern C0-C3 kann im laufenden Betrieb des Mikrocomputers 110 auf Fig. 1 geändert werden, so dass eine Anpassung an veränderliche Bedingungen oder Anforderungen des Mikrocomputers 110 möglich ist. Beide Ansätze können auch nebeneinander durchgeführt werden, indem beispielsweise einige Programme 410-450 manuell durch einen Benutzer und andere Programme 410-450 automatisch durch
das Steuerprogramm des Verfahrens 300 einer Tabelle 400 bzw. einem Rechenkern C0-C3 zugeordnet werden.
Fig. 5 zeigt verschiedene Heuristiken zur Vermeidung von Kol- lisionen der Enden gesetzter Zeitdauern auf dem Prozessor 200 aus Fig. 2. In horizontaler Richtung ist ein Zeitverlauf angetragen. Vertikal sind in vier Zeilen Ausführungsreihenfol¬ gen eines Programms 410-450 und eines Betriebssystems 510 auf einem der beispielhaften Rechenkerne CO oder Cl angegeben. Dunkle Flächen repräsentieren eine Ausführung des Betriebssystems, helle Flächen eine Ausführung eines echtzeitfähigen Programms 410-450.
Bei jedem Wechsel zwischen einer hellen und einer dunklen Fläche erfolgt ein Aufruf des Steuerprogramms des Verfahrens 300 aus Fig. 3. Im Vergleich zu den Zeiten, die das Betriebs¬ system und das echtzeitfähige Programm 410-450 auf dem jewei¬ ligen Rechenkern C0-C3 verwenden, sind die Ausführungszeiten des Verfahrens 300 so gering, dass sie in der Darstellung in Fig. 5 nicht angegeben sind.
In der ersten Zeile ist eine Abfolge von Ausführungen des Betriebssystems und eines echtzeitfähigen Programms 410-450 auf den Rechenkern CO dargestellt. In der zweiten Zeile ist eine entsprechende Abfolge von Ausführungen des Betriebssystems und eines echtzeitfähigen Programms 410-450 auf den Rechen¬ kern Cl dargestellt. An den gestrichelten vertikalen Linien, welche die beiden Zeilen miteinander verbinden, kollidieren Aufrufe des Verfahrens 300 auf den Rechenkernen CO und Cl miteinander.
In der dritten Zeile ist der Ablauf der zweiten Zeile um einen Betrag entlang der Zeitachse verschoben. Diese Verschie¬ bung ergibt sich dadurch, dass die dem Programm 410-450 zuge- ordnete Zeitdauer um eine vorbestimmte Zeit Δ verlängert wird, um eine Kollision am rechten Ende der Darstellung in
Fig. 5 zu vermeiden (gestrichelte vertikale Linien) . Das Ein¬ fügen der Zeit Δ erfolgt nur einmalig.
In der vierten Zeile ist eine alternative Herangehensweise zur Vermeidung von Kollisionen skizziert. Hier wird eine Verlängerung der dem Programm 410-450 zugeordneten Zeitdauer um die Zeit Δ bei jedem Ablauf der dem Programm 410-450 zuge¬ ordneten Zeitdauer vorgenommen. Die Heuristik zur Vermeidung von Kollisionen nach der dritten Zeile erscheint einfacher, da nur der nächste Aufruf des Ver¬ fahrens 300 auf dem anderen Rechenkern CO betrachtet wird.
Die Vorgehensweise nach der vierten Zeile hat den Vorteil, dass die Zykluszeiten, die sich jeweils als Summe der dem Be¬ triebssystem zugeordneten Zeitdauer und der dem Programm 410- 450 zugeordneten Zeitdauer ergeben, gegeneinander verstimmt werden können. Je nachdem, in welchem Verhältnis die Zykluszeiten der Abläufe der ersten und der zweiten Zeile zueinander stehen, kann die Herangehensweise der dritten oder vierten Zeile gewählt werden, um zeitliche Kollisionen des Verfahrens 300 auf den Kernen CO und Cl zu vermeiden. Eine Kombination beider Heu- ristiken ist ebenfalls möglich, beispielsweise indem die Zyk¬ luszeiten durch ein erstes Anpassen linear abhängig gemacht werden und in einem zweiten Anpassen einmalig gegeneinander verschoben werden.