Analytische Datenbanken zur Miete

Das Data Warehouse wandert in die Cloud

von - 02.07.2018
Data Warehouse
Foto: cybrain / shutterstock.com
Datenverwaltung und -analyse als Service spart Kosten und bringt Vorteile. Data Warehouses in der Cloud spielen eine immer wichtigere Rolle für Unternehmen.
Es ist ein Traum, den Unternehmen schon seit Jahrzehnten träumen: Alle Firmendaten sind in einem zentralen, konsistenten, vollständigen und normalisierten Datenbestand auf SQL-Basis (Structured Query Language) zusammengefasst und Abfragen lassen sich über eine zentrale Bedienoberfläche erstellen und schnell durchführen.
Ein solches Data Warehouse ist allerdings eine Utopie geblieben, beobachtet Stefan Sexl, Mitgründer der pmOne AG, die sich auf Software-Lösungen im Bereich Business Intelligence spezialisiert hat: „Daten sind zu dynamisch und beweglich, um das Ideal eines Data Warehouse erfüllen zu können.“
Stefan Sexl
Stefan Sexl
Mitgründer von pmOne
www.pmone.com
Foto: pmOne AG
„Ein Cloud-Data-Warehouse bietet enorme Flexibilitätsvorteile.“
Die Idee einer konsolidierten und harmonisierten Datensammlung ist aber noch längst nicht tot, sagt Carsten Bange, Geschäftsführer des Business Application Research Centers (BARC): „Wenn die Definition nicht ganz so eng ausgelegt wird, ist das Data Warehouse nach wie vor ein attraktives Konzept.“ Im Unterschied zum Data Lake, der nur Rohdaten sammelt, sind Abfragen in einem solchen Konstrukt deutlich schneller und komfortabler auszuführen: „Ein Data Ware­house verwaltet Informationen in einer organisierten Weise, die für Berichte und Datenanalysen leichter zugänglich ist“, erklärt Thomas Steinborn, Senior Director Product Management bei Talend, Anbieter von Cloud- und Big-Data-Integrations-Software.

Data Warehouse bleibt beliebt

Entsprechend hoch ist die Nachfrage nach Data-Warehouse-Lösungen. Das Marktforschungsinstitut Market Research Media prognostiziert, dass der Umsatz in diesem Segment von 2017 bis 2022 um 8,3 Prozent steigen wird. Das Marktvolumen soll bis 2022 mehr als 20 Milliarden Dollar betragen. Wie in vielen anderen Bereichen spielen auch hier Cloud-Lösungen eine immer wichtigere Rolle. Laut der BARC-Studie „Cloud BI and Data Management“ nutzen bereits 42 Prozent der befragten Unternehmen ein Data Warehouse in der Cloud. „Mit dem Aufkommen von großen Datenmengen, von Cloud-Systemen sowie von Technologien wie IoT und mobilen Lösungen sind die meisten herkömmlichen lokalen Data Warehouses nicht mehr in der Lage, das Volumen, die Vielfalt und die Komplexität der Anforderungen zu bewältigen“, weiß Talend-Manager Steinborn.
Thomas Steinborn
Thomas Steinborn
Senior Director Product Management bei Talend
https://de.talend.com
Foto: Raphael Dunand
„Ein modernes Cloud Data Warehouse kann Abläufe im gesamten Unternehmen … erheblich optimieren.“
Erschwerend kommt hinzu, dass diese Datenmassen meist nicht in der strukturierten Form einer SQL-Tabelle vorliegen. „Moderne Anwendungen nutzen semistrukturierte Datenformate wie JSON, Apache Parquet oder ORC“, erklärt Artin Avanes, Director Product Management beim Cloud-Data-Warehouse-Anbieter Snowflake. „Für die Verarbeitung solcher Dateien sind traditionelle Data-Warehouse-Systeme nicht ausgelegt.“ Während sich für transaktionale OLTP-Aufgaben (Online Transaction Processing) nicht relationale No-SQL-Systeme als Alternative anbieten, sind sie für OLAP (Online Analytical Processing) und Business Intelligence (BI) meist nicht performant genug. „Wir haben immer wieder Kunden, die aus der NoSQL-Welt zu uns kommen, weil sie mit der Abfragegeschwindigkeit nicht zufrieden waren“, berichtet Avanes, „für analytische Zwecke bleiben relationale Datenbanken das Mittel der Wahl.“
Ein weiteres Argument, das für ein cloudbasiertes Data Warehouse spricht, ist laut Avanes die Unterstützung vieler paralleler Zugriffe: „In modernen Unternehmen sollte jeder Mitarbeiter Zugang zu den für ihn relevanten Daten haben und Analysen durchführen können.“ Traditionelle Systeme könnten jedoch mit vielen gleichzeitig aktiven Anwendern nicht umgehen, so Avanes weiter. „Das kann zu erheblichen Performance-Einbußen führen.“
Verwandte Themen