Die durch die Sensoren erfassten Daten weisen hinsichtlich der Datenquantität und -qualität signifikante Unterschiede zwischen den einzelnen Anwendungen auf. Eine weiterführende Nutzung und Zusammenführung der Daten erfordert in der Regel eine Aufbereitung, um sicherzustellen, dass diese den jeweiligen Anforderungen entsprechen. Eine effiziente Erhebung und Nutzung der Daten setzt voraus, dass unnötige Datenmengen vermieden und vorhandene Daten optimal eingesetzt werden. In diesem Zusammenhang ist zudem zu überprüfen, ob Daten aus anderen Bereichen abgeleitet oder für weitere Anwendungen verwendet werden können.
Eine gelungene Datenintegration ist insbesondere dann erforderlich, wenn eine große Anzahl unterschiedlicher Bereiche und Datenquellen zu integrieren ist. In vielen Unternehmen werden Daten in verschiedenen Datensilos gespeichert, was dazu führen kann, dass wertvolle Informationen ungenutzt bleiben und wichtige Zusammenhänge nicht erkannt werden. Der Prozess der Datenintegration umfasst Methoden und Tools, die eine korrekte Erfassung, Konsolidierung und Zusammenführung von Daten ermöglichen.* SAP (2024): Datenintegration: Der Schlüssel zum Verknüpfen Ihrer Daten | SAP (online) (abgerufen am: 26.09.2024).
Der ETL-Prozess (Extract, Transform, Load) stellt einen zentralen Bestandteil der Datenintegration dar und findet häufig bei der Aufbereitung großer Datenmengen Anwendung. Dabei werden Daten aus verschiedenen Quellen zusammengeführt und für die weitere Verarbeitung nutzbar gemacht.* Litzel, N. und Luber, S.: Was ist ETL (Extract, Transform, Load)? (online) (abgerufen am: 26.09.2024).
Im ersten Schritt werden Daten aus verschiedenen Quellen ausgewählt und extrahiert. Dies können unterschiedliche Systeme aus verschiedenen Abteilungen, Datenbanken oder Sensoren sein. Die Datenquellen liefern oft heterogene Informationen, z. B. in unterschiedlichen Formaten oder Strukturen.
Beispiel: Ein Unternehmen, das seinen Energieverbrauch optimieren möchte, bezieht Daten aus mehreren Quellen:
Bei der Transformation werden die extrahierten Daten in ein einheitliches Format gebracht, bereinigt und gruppiert. Zur effizienten Nutzung der Daten werden diese auf Duplikate oder überflüssige Daten überprüft. Dadurch wird sichergestellt, dass die Daten für das Zielsystem kompatibel sind und die Qualität der Daten den spezifischen Anforderungen entspricht.
Mögliche Transformationen:
Der letzte Schritt besteht darin, die transformierten Daten in das Zielsystem zu laden. Dies kann eine zentrale Datenbank oder ein Data Warehouse sein, wo die Daten gespeichert werden und für Analysen oder Berichte zur Verfügung stehen.