Erkennung und Klassifizierung der Fehlerarten
In beiden Fällen lässt sich auf Basis der historischen Daten der Anlage mittels eines Machine Learning Algorithmus ein Modell generieren, das durch Trainieren befähigt wird, anormales Verhalten zu erkennen respektive zukünftiges Verhalten vorherzusagen. Dabei kann der Anwender überwacht (supervised) vorgehen. Zu diesem Zweck wird das Modell sowohl mit Daten über das korrekte ebenso wie über das falsche Verhalten der Anlage trainiert, sodass es diese Situationen in Zukunft unterscheiden kann. Zudem lässt sich so eine Klassifizierung der Fehlerarten durchführen. Allerdings sind lediglich die Fehler detektierbar, die in den Trainingsdaten vorhanden sind.
Alternativ gibt es unüberwachte (unsupervised) Ansätze, bei denen in der Trainingsphase nur Daten verwendet werden, die das Normalverhalten beschreiben. Dadurch detektiert das Modell alle Abweichungen von diesem Verhalten, eine Differenzierung der Fehlerarten ist jedoch nicht möglich. In der Praxis haben sich die überwachten neuronalen Netze durchgesetzt. Ferner können weitere Modelle, beispielsweise Isolation Forest oder Autoencoder, gute Ergebnisse liefern. Einerseits lassen sich die bereits in der Anlage montierten Sensoren nutzen oder es werden spezielle neue Sensoren eingebaut. Im ersten Fall spart der Anwender die Installationskosten ein, während sich beim zweiten Szenario in der Regel genauere Ergebnisse erzielen.
Datenvorverarbeitung durch einen Experten
Die Daten stellen in den meisten Fällen die größten Probleme dar, wenn sie nicht in ausreichendem Umfang und guter Qualität zur Verfügung stehen. Denn es erfordert eine bestimmte Datenmenge, die sämtliche möglichen Fälle beinhaltet, sowie bei einem überwachten Modell außerdem eine gewisse Datenmenge über das Fehlverhalten, damit das Modell sie korrekt lernen kann. Fehlen diese Daten, treten später Fehlklassifikationen (Fehlalarme) oder Fehler auf, die das ML-Modell nicht ermittelt. Darüber hinaus muss die Datenqualität hoch sein, sodass das Modell auch die korrekte Funktionsweise der Anlage lernt. Um dies sicherzustellen, bedarf es der Datenvorverarbeitung vor dem Training des Modells durch eine Person, die sich sowohl mit der Anlage oder dem Prozess ebenso wie mit den Daten auskennt. Dieses Wissen wird ebenfalls zur korrekten Parametrierung der Modelle benötigt.