Weil die Datenqualität die wichtigste Determinante in einem Machine Learning-Prozess ist, sollte man sich schon vor Beginn eines solchen Projekts über die gewünschten Ziele im Klaren sein. Hängt doch von dieser Erwartung ab, welche Daten in welcher Form nötig sind, um den erforderlichen Machine Learning-Prozess aufzusetzen. Denn es gibt durchaus Prozesse, bei denen Machine Learning bereits mit nur wenigen Daten zu validen Ergebnissen führen.

An der Funktionsweise eines Kühltransporters lässt sich der Ablauf beispielhaft veranschaulichen: Das ‚System' erkennt anhand der Sensorwerte, welche Temperatur im Inneren des Transporters herrscht, und es kann bei Veränderungen entsprechend reagieren. Die Herausforderung in diesem Fall ist die Konvertierung der Sen-sordaten zu Informationen, die der Rechner verarbeiten und auswerten kann. In diesem Beispiel ist die Datenqualität zwar wichtig, die Datenmenge aber eher sekundär.

Störende Daten entfernen

Betrachtet man dagegen die Funktionsweise einer Spritzgießmaschine, zeigt sich eine andere Situation. Hier wird der Prozess nicht mit einfachen Temperatursensoren, sondern per Ultraschall überprüft. Dabei fallen bereits innerhalb kurzer Zeitfenster eine Vielzahl von Daten an. Diese Daten sind wesentlich aufwendiger so aufzubereiten, damit Algorithmen erkennen können, in welchem Zustand sich das gerade gefertigte Bauteil befindet.

Ohne Regeln keine Algorithmen

Essenziell ist eine regelbasierte Vorgehensweise. Nur dann lassen sich Korrelationen oder Anomalien erkennen. In diesem Fall hat vor allem die Quantität der Daten Auswirkungen auf das Ergebnis: ...

