Cross Industry Standard for Data Mining (CRIPS-DM)

Cross Industry Standard for Data Mining (CRIPS-DM) (Quelle: PDV, Adobe Stock, Rawpixel.com angelehnt an Wikipedia)

In den letzten Jahren wurden viele technologische Grundlagen geschaffen, auf deren Basis KI ihren Nutzen ausspielen kann. Zudem ist die Akzeptanz von Kundenseite gestiegen. Der Weg, KI als Standardprodukt in der Smart Factory zu nutzen, scheint aber noch weit zu sein. Und es stellt sich die Frage: Warum lässt sich KI eigentlich nicht einfach zuschalten wie ein LED-Blitz am Handy, der zumindest im näheren Umfeld eine bessere Belichtung verspricht? Ein Blick „hinter die Kulissen“ sorgt für Klarheit.

Im Jahr 1996 wurde ein branchenübergreifendes Standardvorgehen für den Umgang mit großen Datenmengen entwickelt, das auch heute noch in KI-Projekten genutzt wird – Cross Industry Standard for Data Mining (Crisp-DM). Darin ist anwendungsneutral beschrieben, was getan werden muss, bevor man aus großen Datenmengen einen Nutzen ziehen kann. Hierbei sind sechs Phasen zu durchlaufen, die sich teilweise überlappen bzw. bedingen:

  • Geschäftsverständnis (Business Understanding),
  • Datenverständnis (Data Understanding),
  • Datenvorbereitung (Data Preparation),
  • Modellierung (Modeling),
  • Evaluierung (Evaluation) und
  • Bereitstellung (Deployment).

Insbesondere die Phasen vor der Modellierung – also das Aufbereiten der Daten stellen in typischen KI-Projekten einen großen Zeit und Kostenfaktor dar. Und diesen meist manuellen Aufwand muss ein Data Scientist für jedes Projekt von Neuem betreiben. Ist ein KI-Modell fertig, kann es ausgerollt und solange genutzt werden, bis sich die Rahmenbedingungen so weit geändert haben, dass das Modell überarbeitet oder erweitert werden muss. Denn wie von ChatGPT bekannt ist, lernt ein KI-System nicht per se kontinuierlich dazu. Ideal und kostensparend wäre es, wenn man sowohl das Erstellen als auch das Erweitern von KI-Modellen einfach automatisieren könnte also quasi Automated Data Science. Man kann die Daten aber auch so zur Verfügung stellen, dass die Phasen eins bis drei überflüssig werden und sofort mit dem Modellieren begonnen werden kann.

1 / 3

Ähnliche Beiträge