Big Data ist der Begriff für Datenmengen, die aufgrund ihrer Fülle oder Art nicht mehr mit herkömmlichen Mitteln bewältigt werden, sondern zu deren Verarbeitung auf digitale Hilfsmittel zurückgegriffen wird. Im Bereich der Industrie finden sich diese Datenmengen und die Technologien zu ihrer Verarbeitung häufig in der Produktion. Die Richtlinienreihe VDI 3714 widmet sich daher eingehend den unterschiedlichen Aspekten von Big-Data-Anwendungen in der produzierenden Industrie. Ihr Ziel ist die Harmonisierung der verfügbaren Technologien, um Kooperation und Implementierung zu erleichtern.
Die bis dato über sieben Blätter verfügende Richtlinienreihe spannt den thematischen Bogen von den Grundlagen der Durchführung über die Datenqualität und -bewirtschaftung, Analyse- und Modellierungsverfahren und die Validierung von Modellen bis hin zur Online-Anwendung von datengetriebenen Modellen. Sie bietet damit Verantwortlichen und Praktikern in der produzierenden Industrie einen umfassenden Einblick in die Materie und will damit zu einer Verbreitung von Big Data in diesem Bereich beitragen.
Der Anwendungsbereich der neuen VDI 3714 Blatt 1 ist die Durchführung von Big-Data-Projekten. Die Richtlinie definiert Big Data als Technologien zur Datenanalyse. Darunter sind Tools zu verstehen, die Daten über Betriebsabläufe erheben, diese Daten analysieren und interpretieren. VDI 3714 Blatt 1 leitet bei der Planung des Big-Data-Einsatzes an, sowie bei der Auswahl der Methoden und Werkzeuge. Die Richtlinie informiert über die notwendigen Rahmenbedingungen und spezifische Voraussetzungen. Sie weist in die Sondierung der Datenlage und in die Bewertung der Datenqualität ein, sowie in die Bewirtschaftung der erhobenen Daten. Es werden konkrete Hinweise zur Umsetzung und Einführung von Big-Data-Technologien in Projekten gegeben.
Die neue VDI 3714 Blatt 2 behandelt die Qualität von Daten in Big-Data-Projekten, wobei eine hohe Qualität direkt der Erleichterung von Vorbereitung, Entwicklung, Inbetriebnahme und Betrieb von Big-Data-Anwendungen dienen soll. Die Richtlinie stellt die Struktur zur Beschreibung der Datenqualität dar, und nennt die verschiedenen Dimensionen der Datenqualität. Diese Dimensionen sind beispielsweise: die Zugänglichkeit, die Verfügbarkeit, die Bearbeitbarkeit, die Fehlerfreiheit und der zu erwartende Informationsgehalt. Zu den Qualitätsdimensionen zählen auch die Synchronität, die Objektivität und die Glaubwürdigkeit. Diese und weitere Parameter werden in der Richtlinie vorgestellt.
Quelle: VDI