Digging for Gold – oder Datenquantität vs. Datenqualität

Projektmanagement

Unter dem Schlagwort „Industrie 4.0“ ist derzeit die Vernetzung der Produktion in aller Munde. Das Kernthema dabei ist die Vernetzung der Produktion, also von Produktionsmitteln, Logistik und Planung/Verwaltung. Ihr Mehrwert resultiert aus der Erfassung, Übertragung und Auswertung der vorhandenen Daten. Soweit ist das allgemein bekannt, doch die Frage die sich stellt ist: Wie müssen die Daten beschaffen sein, um wirklichen Mehrwert zu ermöglichen?

Hier scheiden sich die Geister: Sollen möglichst alle Daten erfasst werden („Datalake“) oder ist ein gezieltes Speichern und Bearbeiten ausgewählter Daten sinnvoller und effizienter? Vor- und Nachteile werden im Folgenden gegenübergestellt:

1) Erfassung aller Daten:

Eine immer höhere Dichte an Sensoren und Vernetzung in der Produktion lässt das Datenaufkommen und die Verfügbarkeit von Daten signifikant ansteigen. Diese Datenerfassung ist nicht auf einzelne Maschinen beschränkt, sondern erfolgt in unterschiedlichsten Bereichen wie bspw. Wetterdaten, Logistik- und Infrastrukturinformationen oder Maschinenzustände und Sensorwerte. Die große Herausforderung besteht darin, diese Daten aus unterschiedlichsten Fachdomänen so zu verknüpfen, dass sich ein Mehrwert generieren lässt. Die Motivation dafür lässt sich aus der allgemeinen These ableiten: Wenn ich die Ursache meines Problems nicht kenne, nach welchen Kriterien schränke ich dann meinen Suchraum ein?

Als konkretes Beispiel möge hier der folgende Fall dienen, der allein durch die Erfassung von Maschinendaten nicht lösbar ist.

Eine Maschine zeigt nicht reproduzierbare Probleme mit dem Kühlkreislauf. Die Auswertung von Maschinendaten und Sensorwerten ergaben keinen konkreten Hinweis auf eine mögliche Ursache. Erst ein Vor-Ort-Termin gab eine erste Ursachenidee, da die Maschine direkt neben dem Hallentor stand. Bei sehr tiefen Temperaturen im Winter löste ein Öffnen des Hallentors bspw. aufgrund einer Materiallieferung die Kühlungsprobleme aus. Somit ermöglicht erst diese Kombination aus Wetter-, Logistik-, Infrastruktur- und Maschinendaten eine Ursachenermittlung.

Wirklich alle Informationen zu speichern und in Bezug zueinander zu setzen, erfordert einen großen Aufwand an Ressourcen und Kapazität. Oft ist daher ein gezieltes und selektives Speichern und Auswerten von Daten naheliegender.

2) Gezieltes Erfassen von Daten:

Hier werden explizit nur die Daten erfasst, welche für die Aufgabenlösung oder zur Generierung von Mehrwert als relevant erscheinen. Dies reduziert den Verwaltungsaufwand und auch die notwendigen Ressourcen für die Erfassung und Speicherung drastisch.

Logischen Ausgangspunkt bilden bereits vorhandene ERP-, MES- oder Sensordaten. Untersuchungen von TRUMPF in Zusammenarbeit mit dem Fraunhofer IPA zeigten jedoch, dass eine reine Verfügbarkeit umfangreicher Daten zu kurz greift, um einen Mehrwert zu generieren. Vielmehr ist die Datenqualität dabei von entscheidender Bedeutung, die weit über eine reine Vollständigkeit hinaus geht.

Zwei reale Beispiele illustrieren dies eindrücklich:

  • Grundsätzlich werden die zu produzierenden Aufträge im Planungssystem mit voraussichtlichen Bearbeitungszeiten versehen (SOLL-Zeiten). Die Maschine oder der Werker melden die realen Bearbeitungszeiten ins System zurück (IST-Zeiten). Übernimmt beispielsweise der Werker die IST-Zeiten aus unterschiedlichsten Gründen lediglich aus den SOLL-Zeiten, weisen die Daten eine perfekte Zeiteinhaltung für jeden Auftrag aus. Das macht jeden Praktiker misstrauisch, denn typischerweise sieht die Realität anders aus. Doch die fehlende Abbildung im Datenbestand verhindert Verbesserungen – in der Ausführung oder der Planung.
  • Ein anderes Beispiel stellen die sogenannten Sammelrückmeldungen dar: Unterscheidet sich beispielsweise das Rückmeldeverhalten der Mitarbeiter von Schicht 1 (Buchung nach jedem Teil) zu Schicht 2 (Buchung immer nach 10 fertigen Teilen), ergibt sich auch hier trotz vollständiger Daten ein verzerrtes Bild bezogen auf die tatsächliche Bearbeitungszeit.

Beide Beispiele verdeutlichen, dass eine reine Vollständigkeit von Daten zu kurz greift. Deshalb muss im Zuge der Datenerfassung zum Analysezweck ein besonderes Augenmerk auf die Auswahl und die Korrektheit der Daten gelegt werden. Zur Verbesserung sind hier sowohl technische als auch organisatorische Lösungsmöglichkeiten zu berücksichtigen.

Fazit

Die Ausführungen verdeutlichen die altbekannte Erkenntnis: Grundsätzlich bestimmen Anwendungsfall und Zielsetzung Datenumfang und erforderliche Datenqualität.

Im Grunde gleicht die Idee eines Datalake dem bekannten „Fischen im Trüben“, erfordert also vergleichsweise geringes Domänenwissen. Zunächst birgt eine breite Datenbasis die Chance, aktuell noch nicht absehbare Zusammenhänge zwischen Daten zu erkennen, um daraus Erkenntnisse abzuleiten. Also ist zu prüfen, ob der aktuelle Datensammel- und -archivierungsaufwand dem künftig angestrebten – eher unklaren – Nutzen rechtfertigt.

Pragmatischer erscheint die genauere Betrachtung bereits vorhandener ggf. aggregierter Daten: Ihre Qualitätsbewertung unter Berücksichtigung spezifischen Domänenwissens ermöglicht Abschätzungen über die Ergebnisgüte von Auswertungen und identifiziert so Handlungsfelder, die oft mit überschaubarem Aufwand realisierbar sind. So ergibt sich ein konkret abschätzbarer Mehrwert durch eine gezielte Datenerfassung und -analyse.

Autoren

Dr.-Ing. Christian Bauer
Lead Developer 5G
Entwicklung Basistechnologien
TRUMPF Werkzeugmaschinen GmbH & Co. KG

Dr.-Ing. Hans-Hermann Wiendahl
Gruppenleiter Produktionsplanung und -steuerung
Fraunhofer Institut für Produktionstechnik und Automatisierung (IPA)

Diese Veranstaltungen könnten Sie auch interessieren

Workshop
in English
International VDI Workshop - Leading Teams in Agile Working Environments
  • 05.11. - 06.11.2019 in Düsseldorf
  • 03.03. - 04.03.2020 in Hamburg
  • 26.05. - 27.05.2020 in Nürnberg
  • 30.09. - 01.10.2020 in Frankfurt am Main

This workshop includes knowledge about group psychology, self-organization and agile leadership. Read more now.

Informieren & Buchen

Seminar
© iStock – Jirsak
Moderne Teamführung im technischen Bereich
  • 14.11. - 15.11.2019 in Wien
  • 21.01. - 22.01.2020 in Berlin

VDI-Seminar „Teamführung von heute!“: Methoden für moderne Teamführung ✓ Bringen Sie Ihr Team zielsicher zum Erfolg! Jetzt buchen!

Informieren & Buchen

Konferenz
#nwing - Das New Work Event für Ingenieure

26.11. - 27.11.2019
Düsseldorf

Die DIGITALE EVOLUTION der Ingenieurs-Arbeitswelten! Für Impulsgeber, Querdenker, First Mover und alle, die mit der #nwing Community bewegen, verändern und begeistern wollen.

Informieren & Buchen

Der für Sie ausgewählte Bereich

  • Management für Ingenieure