Lernende Verfahren

Algorithmen der künstlichen Intelligenz und des maschinellen Lernens gewinnen auch in der Regelungstechnik zunehmende Bedeutung. Am Lehrstuhl wird vor allem an der Ergänzung von regelungstechnischen Methoden durch lernende Komponenten geforscht.

Ansprechpartner

Prof. Dr.-Ing. Knut Graichen
Tel.: +49 9131 85-27127
E-Mail | Homepage


Lernende Verfahren in der Modellbildung

Mit Regressionsverfahren ist es möglich, eine unbekannte Funktion aus einzelnen Datenpunkten zu approximieren. Die Gaußprozessregression (Engl. Gaussian Process Regression) verwendet dazu eine Mittelwertfunktion, welche das Vorwissen beschreibt, und eine Kovarianzfunktion, welche die Korrelation zwischen den Datenpunkten beschreibt. Der Vorteil gegenüber anderen Regressionsverfahren besteht darin, dass mit der Kovarianz ein direktes Maß für die Modellgüte gelernt wird und somit Aussagen zur Zuverlässigkeit einer Prädiktion getroffen werden können.

Im Kontext der Regelungstechnik kann die Gaußprozessregression vielfältig angewendet werden. Ein Schwerpunkt der Forschung stellt die Identifikation von Systemen dar, die schlecht oder nur mit hohem Aufwand physikalisch modelliert werden können. Außerdem können solche Modelle im Betrieb adaptiert werden, um Effekte von Alterung und Verschleiß abzubilden. Eine besondere Herausforderung stellt die echtzeitfähige Implementierung dar, wofür die Anzahl der Datenpunkte geeignet begrenzt werden muss.

Wenn das Modell Informationen über die Zuverlässigkeit beinhaltet, so kann diese zum Beispiel durch eine stochastische modellprädiktive Regelung verwendet werden. Dabei wird neben dem Mittelwert auch die Unsicherheit prädiziert, wodurch Beschränkungen mit einer vorgegebenen Wahrscheinlichkeit eingehalten werden können.

Eingebettetes Lernen von Verbrennungsmodellen

 

Stochastisches NMPC zur Kollisionsvermeidung mit einer Wahrscheinlichkeit von 99,9%

Lernende Verfahren in der Optimierung

Das bestärkende Lernen (Engl. Reinforcement Learning) zielt darauf ab, durch wiederholte Interaktion mit einem System eine optimale Regelstrategie zu erlernen. Konkret wird für jeden Zustand diejenige Aktion gesucht, welche die erwartete Belohnung maximiert. In der Formulierung als Optimierungsproblem zeigt sich die konzeptuelle Nähe zur modellprädiktiven Regelung, wobei das bestärkende Lernen jedoch kein Modellwissen über das System voraussetzt.

Bei der inversen Optimalsteuerung (Engl. Inverse Optimal Control) wird ein Kostenfunktional gesucht, so dass die Lösung des zugehörigen Optimierungsproblems ein vorgegebenes Systemverhalten bestmöglich nachbildet. Dadurch kann z.B. Expertenwissen genutzt werden, um die Gewichtungsfaktoren einer modellprädiktiven Regelung automatisiert zu bestimmen.

Zwar lassen sich viele technische Aufgaben als Optimierungsproblem formulieren, aber in manchen Fällen können die Kostenfunktion oder die Beschränkungen nur durch aufwändige numerische Simulationen ausgewertet werden. Die Bayessche Optimierung ermöglicht es hier, das komplexe Optimierungsproblem durch eine begrenzte Anzahl von Auswertungen der Kostenfunktion und der Beschränkungen zu lösen. Dabei können Verfahren wie die Monte Carlo-Simulation oder auch die Approximation von unbekannten Funktionen durch Gaußprozessregression eingesetzt werden.

Bestärkendes Lernen eines hydraulischen Schaltvorgangs

 

Bayessche Optimierung unter Berücksichtigung einer unbekannten Gleichungsbeschränkung