Zum Inhalt

Maβgeschneiderte Entwicklung sicherheitskritischer ML-Controller

Design und Verifizierung von Cyber-Physischen Systemen

Beispiel eines KI-gesteuerten Cartpole-Systems

Das System besteht aus einem beweglichen, magnetisch angetriebenem Cart auf einer XTS-Transportschiene der Firma Beckhoff GmbH. Auf dem Cart ist eine frei schwingende Pole montiert. Sowohl die Position des Carts als auch der Winkel der Pole werden von Sensoren gemessen. Die folgende Sequenz soll ausgeführt werden:

  • Aufschwingen der Pole unter Verwendung eines sensorbasierten SwingUp-Modells (Position und Polewinkel).
  • Balancing der Pole unter Verwendung des sensorbasierten Balance-Modells. Dieser Schritt wird für eine vordefinierte Anzahl von Zeitschritten durchgeführt.
  • Balancing der Pole mit Hilfe eines bildbasierten Balance-Modells (die Bildverarbeitung kann entweder über OpenCV oder ein CNN erfolgen).
 

Unsichere Zustände im Cartpole-System

Während des Aufschwingens dieses Cartpole-Systems ist eine starke Beschleunigung des Carts in beide Richtungen erforderlich. Um die Sicherheit sowohl der Hardware als auch der nebenstehenden Personen zu gewährleisten, ist es wichtig, die Sicherheit des Systems zu testen. Der Begriff “Sicherheit” setzt voraus, dass die Position des Carts zu keinem Zeitpunkt während des Aufschwingvorgangs die physikalischen Grenzen der Schiene überschreitet. 

Aufgrund der großen Verzögerung durch die Bildverarbeitung bei der Steuerung des Carts zum Balancieren bei Verwendung des Videos als Eingabe, wird ein anderes Modell als das sensorgestützte Balance-Modell verwendet. Dieses unterschiedliche Verhalten der beiden Steuerungen und der daraus resultierende harte Übergang zwischen winkel- und videobasiertem Balancing erfordert ebenfalls eine Analyse der Sicherheit des Systems durch TraceTube. Der Begriff “Sicherheit” impliziert in diesem Fall nicht nur, dass der Wagen nicht die physikalischen Grenzen der Schiene überschreitet, sondern auch, dass das Pendel während dieser Übergangsphase in der aufrechten Position bleibt.

 

Verifizierung des KI-gesteuerten Systems

Das Beckhoff-System demonstriert die Fähigkeiten von TraceTube anhand eines KI-gesteuerten Simulators für ein umgekehrtes Pendel – das klassische Problem, ein Pendel auf einem sich bewegenden Wagen auszubalancieren. Der KI-Controller hält das Pendel aufrecht, während TraceTube seine Robustheit bewertet, indem es Grenzwerte generiert, die den sicheren Betriebsbereich des Systems zeigen. Diese Demo unterstreicht TraceTubes Fähigkeit, KI-Modelle zu verifizieren und Sicherheit in dynamischen Echtzeitanwendungen zu gewährleisten. 

Der Controller wurde mit Hilfe von Reinforcement Learning Methoden auf einer simulierten Umgebung mit physikalischen Gleichungen trainiert, die den Aufbau beschreiben. Die Länge der Stange, die Masse der Stange, die Beschleunigung des Wagens (die Reaktionsfähigkeit des Wagens), die Position des Wagens und der Winkel des Pendels wurden als Parameter zur Modellierung und Steuerung des Systems verwendet. Das TraceTube-Tool wurde separat für die Verifizierung der Aufschwing- und der Ausgleichsphase verwendet. 

Der Ausbalancierungsprozess wurde verifiziert, als er einem Wechsel von Sensordaten zu Kameradaten ausgesetzt war. Dieser Umschaltpunkt ist in der Grafik mit einer höheren Variation im Systemverhalten zu erkennen. Dieser Prozess beweist die Fähigkeit von TraceTube, komplexe Systeme zu verifizieren, wenn sich die Bedingungen ändern und die Umgebungsattribute unterschiedlich sind. Dieser Anwendungsfall stellt ein generisches Beispiel für die Einsatzgebiete von TraceTube dar.