Bewertung
Marktsegment

Data Warehouse Software & Tools im Vergleich

Data-Warehouse-System bedeutet zu Deutsch so viel wie Datenlager und bezeichnet eine Software-Lösung, die Daten verarbeitet, transformiert und erfasst. Data Warehouses dienen als zentraler Speicher von Daten aus verschiedenen Quellen, die integriert und mithilfe von Big-Data-Analysesoftware oder Datenvisualierungssoftware aufbereitet werden. Dadurch ermöglichen sie datenbasierte Entscheidungsfindungen und liefern wertvolle Geschäftseinblicke. In Data-Warehouse-Softwares finden sich Daten aus allen Unternehmensbereichen wie Vertrieb, Finanzen und Marketing wieder.

Die Datenmanagement-Softwares können Daten aus CRM-Systemen, Marketing-Automation-Softwares, ERP-Systemen und Supply-Chain-Management-Softwares kombinieren und bieten die Grundlage für präzise Reportings und Analysen. Unternehmen können zudem Predictive Analytics oder Artificial Intelligence (AI) einsetzen, um Trends und Muster aus den Daten zu erschließen. Ein wichtiger Teil des Funktionsumpfangs von Data-Warehouse-Anbietern sind  Integrationen zu Business-Intelligence-Plattformen, Data Lakes, Data-Science-Workflows, Machine Learning und AI-Technologie. 

Moderne Data-Warehouse-Tools kommen in Unternehmen zum Einsatz, die große Mengen komplexer Daten verarbeiten müssen und werden in einer Vielzahl von Branchen eingesetzt. Dazu zählen unter anderem der Einzelhandel, Banken, das Finanzwesen, das Gesundheitswesen und Medienunternehmen. Die Softwares werden entweder als On-Premise, Private Cloud, Public Cloud oder Hybrid Cloud von Data-Warehouse-Anbietern zur Verfügung gestellt und können je nach Geschäftswachstum, Datenmengen und -komplexität skaliert werden.

Data-Management-Systeme führen schnelle, analytische Abfragen durch, konsolidieren Daten aus mehreren oder allen Unternehmensniederlassungen und integrieren Daten bevor sie durch den Extraktions-, Transformations- und Ladeprozess (ETL) in das Data Warehouse gelangen. Benutzer:innen können zudem Abfragen durchführen und mit diesen im Data Warehouse gespeicherten Daten analysieren und reporten. Zudem bieten die Tools Integration mit Reporting- und Business Intelligence-Tools von Drittanbietern und fungieren als Archiv für historische Daten.

Tableau Server

Was ist Tableau Server?

An Daten dürfte es den wenigsten Unternehmen mangeln; eher an der Fähigkeit, diese quellenübergreifend auszuwerten und zu visualisieren. Genau hier möchte die Business-Intelligence- und Analytics-Plattform von Tableau ansetzen. Das 2003 in Kalifornien gegründete Unternehmen bietet verschiedenste Produkte und Tools an, um Daten in individuellen Dashboards zu bündeln, visuell aufzubereiten und Reportings und Ergebnisse zu erstellen. Mit dem browser-basierten Tableau Server können diese mit der gesamten Organisation geteilt werden – egal, ob mobil oder auf Desktop. Mitte 2019 hat Salesforce Tableau für rund 15,7 Milliarden US-Dollar übernommen.

Microsoft Azure CDN

Was ist Microsoft Azure CDN?

Azure CDN ist eine globale CDN-Lösung von Microsoft für die Übermittlung von Inhalten mit hoher Bandbreite. Gehostet werden kann die Lösung in Azure oder einem anderen beliebigen Ort. Damit lassen sich u.a. statische Objekte, die über Azure Blob Storage, eine Webanwendung oder einen öffentlich zugänglichen Webserver geladen wurden, zwischenspeichern. Darüber hinaus kann Azure CDN dynamische Inhalte, die nicht zwischengespeichert werden können, beschleunigen. Das Tool bietet Nutzer:innen ein kostenloses Konto, das 12 Monate lang beliebte Azure CDN Dienste für sie bereithält.

BigQuery: Cloud Data Warehouse

Was ist BigQuery: Cloud Data Warehouse?

BigQuery: Cloud Data Warehouse ist ein vollständig verwaltetes, serverloses Data Warehouse auf der Google Cloud Platform Infrastruktur. Streamingdaten können in Echtzeit abrufen und aktuelle Informationen zu allen Geschäftsvorgängen erhalten werden. Geschäftsergebnisse lassen sich im integriertem Machine Learning prognostizieren, ohne dass dabei Daten verschoben werden müssen. BigQuery bietet eine robuste Steuerung von Sicherheit, Data Governance und einem SLA für 99,9 % Betriebszeit. Daten können mit standardmäßiger Verschlüsselung und von Kund:innen verwalteten Verschlüsselungsschlüsseln gesichert werden. BigQuery bietet verschieden Pakete und Preislisten an. Neukund:innen erhalten ein Guthaben von 300 $ für Google Cloud während der ersten 90 Tage. Alle Kund:innen erhalten kostenlos 10 GB Speicher und bis zu 1 TB Abfragen pro Monat. Individuelle Kosten können auf der Website angefragt werden. Ebenso kann BigQuery kostenlos getestet werden.

SAS® Customer Intelligence 360

Was ist SAS® Customer Intelligence 360?

Das hinter der ‚SAS® Customer Intelligence 360‘ stehende SAS Institute gilt als Pionier im Bereich Customer Analytics und unterstützt über 1.000 Kunden weltweit, Mehrwerte aus Kundendaten zu generieren. Die Lösung soll Unternehmen dabei helfen, die Customer Experience ihrer Endkunden über alle Kanäle umfassend zu personalisieren und zu optimieren. Dabei deckt die modular aufgebaute Plattform die gesamte Wertschöpfungskette im Marketing ab, von der Planung über die Aufzeichnung des Kundenverhaltens, die effektive Aussteuerung im Kanal bis hin zur Erfolgsmessung. Die Vorteile der mit jeder Menge analytischen Funktionen gespickten Plattform: Präzise Vorhersagemodelle, selbstlernende Systeme, kontinuierliche Optimierung der Customer Journey sowie eine schnellere und bessere Entscheidungsfindung.

Teradata

Was ist Teradata?

Teradata ist eine Cloud Data Analytics-Plattform. Teradata verbindet Data Lakes, Data Warehouses, Analysen und neue Datenquellen und -typen miteinander. Teradata besteht aus verschiedenen Analytics-Engines in einer relationalen Datenbank. Dazu gehören eine SQL-, Machine-Learning- und Graph-Engine. Teradata bietet ebenso eine Analysesoftware an. Unter anderem für die Kommunikations-, Medien-, Finanzdienstleistungs-, Gesundheits- und Einzelhandelsindustrie. Das Unternehmen bietet unterschiedliche und individuelle Pakete an. Die Kosten dazu können auf der Website angefragt werden.

Amazon Redshift

Was ist Amazon Redshift?

Amazon Redshift ist ein vollständig verwalteter Data-Warehouse-Service in Petabytegröße in der Cloud. Amazon Redshift verwendet SQL, um strukturierte und halbstrukturierte Daten in Data Warehouses, Betriebsdatenbanken und Data Lakes zu analysieren. Business Intelligence Tools und SQL-Clients können sich mit Amazon Redshift verbinden. Amazon Redshift wird von Amazon auf einer Cloud-Infrastruktur bereitgestellt. Die Preise fangen bei $ 0,25 pro Stunde in einem kleinen Umfang an. Weitere Kosten können auf der Website im Preisrechner berechnet werden.

Dremio

Was ist Dremio?

Dremio ist eine auf SQL zugeschnittene Datenanalyse- und BI-Plattform. Mit Dremio können SQL-Workloads, von geschäftskritischen BI-Dashboards bis hin zu Ad-hoc-/Explorations-Workloads, mit Warehouse-Performance und -Funktionalität, direkt im Lakehouse bereitgestellt werden. Erstellen von Datenmodellen und der Export von Daten in Tableau-Extrakte/Power BI-Importe ist möglich.
Ebenso das Kuratieren, Analysieren und Freigeben von Datensätzen auf Self-Service-Basis. Dremio bietet zwei Preispakete an. Die Standardversion steht kostenfrei zur Verfügung. Die Kosten für die Enterprise-Lösung lassen sich auf der Website anfragen.

Snowflake

Was ist Snowflake?

Snowflake ist eine Cloud-Datenplattform. Snowflake schafft eine zentrale, kontrollierte und abfragbare Quelle für Daten, einschließlich JSON- und XML-Dateien, mit kosteneffizienten Speicherkapazitäten. Semistrukturierte Daten können direkt mit SQL und Tools für Business Intelligence und maschinelles Lernen abgefragt werden. Snowflake bietet einen Cloud-Speicher zu niedrigen Preisen mit 2- bis 3-facher Kompression.
Ebenso bietet Snowflake eine native Unterstützung für Geodaten und -analysen an. Die gespeicherten Daten werden dynamisch maskiert und tokenisiert. Ebenso ist Snowflake SOC 2 Type 2, ISO 27001, PCI, HIPAA FedRAMP usw. zertifiziert. Snowflake ist 30-Tage kostenlos nutzbar. Individuelle Preise können auf der Website angefordert werden.

Exasol

Was ist Exasol?

Exasol ist ein Softwareunternehmen für Analysedatenbankmanagement. Exasol bietet eine In-Memory-Verarbeitung, spaltenorientierte Speicherung und massiv parallele Verarbeitung (MPP), basierend auf einer Shared-Nothing-Architektur für höhere Abfrageleistungen. Exasol ist erweiterbar und kann bei Bedarf mit weiteren Server(kapazitäten) erweitert werden. Exasol bietet verschiedene Preissegmente an, die individuell auf der Website berechnet werden können. Die Exasol SaaS Edition starte bei $ 2 die Stunde pro Abrechnung. Die Kosten für ein umfassenderes Paket, lassen sich auf der Website anfragen. Ebenso kann Exasol 30 Tage kostenlos getestet werden.

Oracle Data Warehouse

Was ist Oracle Data Warehouse?

Oracle Data Warehouse ist ein Cloud-Data Warehouse-Service, der beim Betreiben eines Data Warehouse, beim Sichern von Daten und beim Entwickeln von datengesteuerten Anwendungen hilft. Es enthält Tools für das Self-Service-Laden von Daten, Datentransformationen, Geschäftsmodelle und automatische Einblicke sowie integrierte konvergierte Datenbankfunktionen, die Abfragen über mehrere Datentypen hinweg und eine Machine Learning-Analyse ermöglichen. Oracle Data Warehouse bietet verschiedene Preismodelle. Die Kosten können auf der Website angefragt werden.

PostgreSQL

Was ist PostgreSQL?

PostgreSQL ist ein leistungsfähiges, objektrelationales Open-Source-Datenbanksystem. PostgreSQL läuft auf allen gängigen Betriebssystemen, ist seit 2001 ACID-konform und verfügt über leistungsstarke Add-ons wie die PostGIS Geodatenbankerweiterung. PostgreSQL entspricht dem SQL-Standard und wurde von einer Open Source-Community entwickelt . Ebenso beinhaltet das Open-Source-Datenbanksystem eine Server-Client-Architektur. PostgreSQL kann kostenlos getestet werden. Dazu steht PostgreSQL kostenlos zur Verfügung und ist frei von Lizenzen.

Solver

Was ist Solver?

Solver ist eine Cloud-basierte Lösung zur Automatisierung von Berichts-, Konsolidierungs-, Budgetierungs- und Prognoseprozessen. Die Cloud-basierte CPM-Suite (Corporate Performance Management), umfasst mit einem Excel-Add-In für das Berichtsdesign und einem vollständigen Web-Portal, das Reporting und Planung, Power BI Dashboard-Integration und ein vorkonfiguriertes Daten-Warehouse. Solver lässt sich dazu mit der Microsoft Power BI Dashboard-Lösung integrieren. Die Kosten lassen sich persönlich auf der Website anfragen. Ebenso bietet Solver ein Demo zum Testen an.

ZAP Data Hub

Was ist ZAP Data Hub?

ZAP Data Hub ist eine Datenmanagementlösung für Business Intelligence. ZAP Data Hub verbindet, sammelt und vereinheitlicht Geschäftsdaten. Ebenso werden diese im Hub sicher integriert und verwaltet. ZAP Data Hub arbeitet mit einer Vielzahl von Anwendungen und Datenquellen zusammen, bewältigt die Herausforderungen von Datensilos und manueller Aufbereitung. Dazu ermöglicht ZAP Data Hub die Analyse nach Geschäftsprozessen oder Teamzielen. Die Kosten von ZAP Data Hub lassen sich auf der Website anfragen. Dazu steht ein Demo zum Testen zu Verfügung.

Mehr über Data Warehouse Software & Tools im Vergleich

Data-Warehouse-Definition: Was ist ein Data Warehouse, was sind Data-Warehouse-Systeme und wozu werden sie benötigt?

Ein Data Warehouse ist wortwörtlich übersetzt und allgemein definiert ein Datenlager. Es handelt sich hierbei um einen Speicherort für verschiedenste Informationen, die in Unternehmen typischerweise anfallen und die für unterschiedliche Zwecke und als Entscheidungsgrundlage, wie beispielsweise in der Produktentwicklung bzw. -weiterentwicklung oder im (Online-)Marketing, genutzt werden können. Ein Data-Warehouse-System schließt einen solchen Speicherort in aller Regel ein. Grundsätzlich bildet es ein Medium, über welches Informationen in das Lager gelangen oder auch von dort heraus an andere Software (insbesondere spezielle Analytics-Tools) weitergegeben werden können und umfasst - je nach Funktionsumfang der Lösung - diverse Werkzeuge für die Datenverwaltung innerhalb des Warehouses. Dementsprechend werden Data-Warehouse-Tools häufig auch Datenmanagement-Software oder Datenmanagement-Plattform genannt. Kernziel bei der Verwendung eines Data-Management-Tools ist die zentrale Zusammenführung aller für ein Unternehmen relevanter Daten und deren Analyse sowie Auswertung hinsichtlich bestimmter Unternehmensanliegen oder Maßnahmen, welche diese stützen. Ohne eine solche Anwendung wäre die effiziente Erfassung und eine zweckdienliche Verwendung der vielen heute zusammenkommenden Daten praktisch nicht möglich. Auf der anderen Seite können sich Betriebe durch die für ihre Zwecke „richtige“ Nutzung von Daten – Stichwort „Big Data“ – bzw. den Einsatz einer Datenmanagement-Software und genauer durch die damit zu erzielenden Erkenntnisse sowie datenbasierten Entscheidungen signifikante Wettbewerbsvorteile verschaffen.

Wie funktionieren Data-Warehouse-Systeme?

Der Funktionsprozess eines Data-Warehouse-Systems lässt sich typischerweise in vier verschiedenen Bereichen fassen:

  • Quellsysteme
  • Data Staging
  • Data Presentation
  • Data Access

Informationen strömen von verschiedenen Quellsystemen in das Datenlager. Nutzer:innen können Daten von ihrer Website, ihrer App sowie von praktisch allen anderen Plattformen, die sie verwenden, zusammenführen. Per Data Staging werden die Daten aus den unterschiedlichen Systemen geladen, extrahiert, strukturiert und transformiert. Sie gelangen so in die eigentliche Datenbank des Data Warehouse. Die Datenbank, die sogenannte Data-Presentation-Area, ist praktisch eine parallele Speicherplattform zu den Quellsystemen, welche die Informationen normalerweise ebenfalls sichern und bereitstellen. Sie ermöglicht den Datenzugriff für Anwendungen und nachgelagerte Systeme. Der Zugriff auf die Informationen erfolgt über verschiedene Data-Access-Tools auf diversen Ebenen, den Data Marts. In aller Regel nutzt das Data Warehouse relationalen Datenbanken, welche sich mittels SQL-Abfragen auslesen lassen. Besonders große Datenmengen (Big-Data-Warehouse bzw. Big Data-Warehouse-Lösungen) werden auf OLAP-Datenbanken organisiert. Ein Data Warehouse wird im Normalfall regelmäßigen mit neuen Daten bestückt. Es sorgt für die Aufbereitung der Informationen und ermöglicht spezifische Analysen (in Echtzeit) oder lässt diese auch über Drittsysteme zu. Entsprechende Erkenntnisse sind wiederum auf vielfältige Weise nutzbar.

Welche Vor- und Nachteile bieten Data-Management-Systeme?

  • Verbesserte Business Intelligence (BI): Unternehmen nutzen Data Warehouses hauptsächlich zur Unterstützung ihrer Analyse- und BI-Anforderungen. Data Warehouses ermöglichen eine zentrale Datenspeicherung mit schnellem und einfachem Zugriff, was sich wiederum positiv auf die BI-Implementierung auswirkt, da somit generell effektivere Analysen und eine bessere Entscheidungsfindung möglich sind. So helfen Data-Warehouse-Systeme nicht nur, schnelle, genaue und relevante Einblicke in Daten zu gewinnen, sondern stützen zudem noch ganzheitlich optimale BI-Strukturen.
  • Gesteigerter Return-on-Investment (ROI): Unternehmen können mithilfe von datenbasierten Entscheidungen oftmals Kosten einsparen und dennoch ihren Umsatz signifikant steigern. Der Einsatz von Data-Warehouse-Lösungen bildet hier einen wichtigen Schlüssel. Ein Tool für Data-Management trägt schließlich auch zur Verbesserung der betrieblichen Effizienz und Produktivität bei.
  • Wettbewerbsvorteile: Die Nutzung eines Data Warehouses ermöglicht einen schnellen und einfachen Zugriff auf Daten und spart viel Zeit bei der Ableitung von Erkenntnissen. Somit erhalten Verantwortliche die Chance, wichtige geschäftliche Chancen oder auch Gefahren vielleicht vor der Konkurrenz durch spezifische Geschäftsdatenanalysen zu identifizieren und entsprechend vorteilhaft zu handeln.
  • Optimierte betriebliche Arbeitsabläufe: Die Daten in einem Data Warehouse werden normalerweise aufgearbeitet bzw. transformiert und bereinigt, bevor sie zur Weiterverarbeitung bereitstehen. Dadurch wird sichergestellt, dass die verwendeten Daten von guter Qualität und die schließlich aus ihnen gewonnenen Erkenntnisse zuverlässig sind. Derartig fundierte Einblicke bzw. daraus wiederum abgeleitete Entscheidungen können die betriebliche Effizienz natürlich stark verbessern.

Wirkliche Nachteile haben Unternehmen durch den Einsatz eines Datenmanagement-Tools nicht – solange sie es passend für ihre Zwecke wählen und richtig einsetzen. Dennoch können entsprechende Software-Lösungen immerhin eine Reihe von Herausforderungen mit sich bringen.

  • On-Premise-Aufwände: On-Premise- oder Vor-Ort-Data-Warehouse-Lösungen erfordern die Verwaltung und Wartung von Hardware- und Softwareinfrastrukturen im eigenen Haus. Unternehmen benötigen spezielle Teams für die Implementierung und den langfristig reibungslosen Betrieb dieser Anwendungen. Mit einem Data Warehouse on Cloud bzw. Data Warehouse as a Service werden Betrieben diese Herausforderungen abgenommen.
  • Datenqualität: Die Daten in Data Warehouses stammen aus verschiedenen Quellen innerhalb des Unternehmens. Inkonsistente Informationen, wie beispielsweise Duplikate und fehlende Facts, werden idealerweise ausgemerzt, können aber zu Fehlern führen. Eine schlechte oder fehleranfällige Datenqualität kann ungenaue Berichte, Erkenntnisse und Entscheidungen nach sich ziehen. Daher sollten Verantwortliche darauf achten, dass bereits die Quellsysteme möglichst hochwertige Daten liefern und bei der Wahl eines Data-Management-Systems auf starke Aufbereitungsfunktionen setzen.

Wie wählt man die passende Data-Warehouse-Software aus bzw. worauf sollte man besonders achten?

Daten und deren maximal zweckdienliche Nutzung für Entscheidungen auf unterschiedlichen Betriebsebenen sind heute tatsächlich für immer mehr Unternehmen absolut relevant. Um ganz an der Basis abschätzen zu können, ob ein Data Warehouse wirklich eine sinnvolle Investition darstellt, sollten sich Verantwortliche zunächst folgende Fragen stellen:

  • Sollen alle geschäftskritischen Daten zentral gespeichert werden?
  • Sollen Daten der Website, von Mobilanwendungen, CRM-Systemen und anderen Anwendungen gemeinsam an einem Ort analysiert werden?
  • Ist es gewünscht oder erforderlich, tiefere und ganzheitlichere Einblicke zu erhalten, als es einzelne Analyse-Tools ermöglichen?
  • Muss mehreren Personen oder Tools gleichzeitig Zugriff auf eine Vielzahl von Daten gewährt werden?

Schon dann, wenn nur eine dieser Fragen mit „ja“ beantwortet wird, ist es durchaus angebracht, sich Gedanken über die Anschaffung eines Datenmanagement-Tools zu machen. Steht schließlich fest, dass eine Software für Datenmanagement für das eigene Unternehmen hilfreich oder notwendig ist, gibt es eine Reihe wichtiger Faktoren, die bei der Auswahl zu berücksichtigen sind. Nachfolgende Aspekten sollte besondere Aufmerksamkeit geschenkt werden.

  • Datentypen: Welche Art von Daten soll im Data Warehouse gespeichert werden – ist die angepeilte Lösung ideal für diese aufgestellt?
  • Umfang und Skalierung: Welche Menge an Daten soll (zukünftig) gespeichert werden – bietet das ins Auge gefasste System passende (skalierbare) Kapazitäten?
  • Leistung: Wie schnell müssen Daten verarbeitet werden – kann die Software die Anforderungen in spezifischen Kontexten erfüllen?
  • Wartung: Wie viel Aufwand darf der Betrieb des Datenmanagement-Programms mit sich bringen?
  • Kosten: Wie viel Budget steht für das Data Warehouse (langfristig) zur Verfügung?
  • Schnittstellen: Wie stark muss das Datenmanagement-System mit anderen wichtigen Tools und/oder Diensten verbunden werden – stehen die passenden Schnittstellen bereit?

Interessierte sollten daran denken, dass sich viele der aufgeführten Faktoren direkt gegenseitig beeinflussen und Kompromisse erforderlich sein können. Wenn man sich beispielsweise für eine geringere Skalierung entscheidet, kann dies die Leistung beeinträchtigen, ist aber in der Regel kostengünstiger. Ein besonderes Augenmerk muss stets auf die Funktionen gerichtet werden, die zur Bedienung der jeweiligen Unternehmensanforderungen erforderlich oder in irgendeiner Weise vorteilhaft sind. Daher im Folgenden eine Auflistung typischer Features von Data-Warehouse-Solutions, die immer zumindest berücksichtigt werden sollten.

  • Verbindungen zu Datenquellen: Data Warehouses ziehen Informationen in der Regel aus unterschiedlichen Quellen, beispielsweise aus Webseiten, Apps, aber auch aus Tabellenkalkulationen, Banksystemen oder anderer Software. Mit entsprechenden Verbindungen können Benutzer:innen genau die Daten abrufen, die sie im Entscheidungsprozess verwenden möchten - vorausgesetzt, es werden die passenden Schnittstellen geboten.
  • Segmentierungen: Data Warehouses sind meistens in einzelne Teilbereiche untergliedert. Diese segmentierten Speicherorte sind in der Regel für einzelne Teams oder Abteilungen relevant. Data-Warehouse-Lösungen ermöglichen es Verantwortlichen, frei Segmentierungen durchzuführen.
  • Skalierung: Die Skalierung ermöglicht es Unternehmen, die Speicherkapazität und die Funktionalität ihres Virtual-Data-Warehouse zu erweitern, wenn sich die Anforderungen in puncto Datenaufkommen und/oder Analysedetails mit der Zeit ändern.
  • Automatisierung: Während viele Tools es Administrator:innen ermöglichen, die Skalierung manuell zu steuern, tragen Autoscaling-Funktionen dazu bei, die händischen Aspekte zu reduzieren. Eine automatische Skalierung von Diensten und Daten nach Bedarf bringt mehr Komfort und nicht zuletzt Funktionssicherheit. Generell können moderne Data-Warehouse-Automation-Tools immer mehr Aufgaben vollkommen eigenständig übernehmen.
  • Gemeinsame Nutzung von Daten: Funktionen zur gemeinsamen Nutzung von Daten bieten neue kollaborative Möglichkeiten. So können Benutzer:innen ganz an der Basis besonders effizient und fehlerresistent – weil zentralisiert – zusammen an Daten arbeiten.
  • Datenermittlung: Suchwerkzeuge bieten die Möglichkeit, große Datensätze zu durchforsten, um im spezifischen Fall relevante Informationen schnell zu finden.
  • Datenmodellierung: Datenmodellierungs-Tools helfen den Benutzer:innen, Daten so zu strukturieren und zu bearbeiten, dass sie besonders schnell und präzise Erkenntnisse gewinnen können. Sie unterstützen auch bei der Übersetzung von Rohdaten in ein besser auslesbares Format.
  • Compliance: Compliance-Funktionen überwachen Datenbestände und setzen Sicherheitsrichtlinien im Umgang mit diesen um. Solche Features sind nach dem Inkrafttreten der DSGVO besonders wichtig.
  • Daten-Staging: Daten-Staging-Bereiche werden zur Normalisierung und Strukturierung von Informationen verwendet. Diese Übergangsspeicherbereiche kommen bei Extraktions-, Transformations- und Ladeprozessen (ETL) zum Einsatz, bei denen Informationen aufbereitet und schließlich exportiert werden.
  • Präsentationswerkzeuge: Sobald die Daten im Staging-Bereich bereinigt und normalisiert wurden, werden sie in Data Marts übertragen, damit die Benutzer:innen die Möglichkeit erhalten, darauf zuzugreifen. Sie können zu diesem Zeitpunkt exportiert oder mit BI-Tools zur weiteren Visualisierung und Datenanalyse gekoppelt werden.
  • Integrationswerkzeuge: Integrationswerkzeuge werden sowohl bei der Sammlung von Daten aus den verschiedenen Quellen als auch bei der Ausgabe nach ihrer Normalisierung oder Modellierung eingesetzt. Diese Werkzeuge erleichtern die Nutzung der in einem Data Warehouse gespeicherten Daten.
  • Datentransformation: Diese Funktion schafft die Möglichkeit, die Daten zu bereinigen, zu deduplizieren, zu validieren, zu verdichten und mehr. Die Datentransformation ist zum Beispiel erforderlich, um die Informationen in ein Format umzuwandeln, das von BI-Tools verwendet werden kann.
  • Echtzeit-Analysen: Echtzeit-Analysefunktionen stellen Informationen bzw. Erkenntnisse unmittelbar sowie stets aktuell bereit und setzen die Benutzer:innen in Kenntnis, sobald sich etwas Wichtiges ändert. Datensätze und Analytics müssen somit nicht ständig manuell aktualisiert werden.

Was kostet moderne Data-Warehouse-Software – gibt es auch Daten-Management-Software-Freeware?

Die beiden Hauptfaktoren, welche den Preis eines Datenmanagement-Programms bestimmen, sind die Umgebung, in der die Lösung gehostet wird, und natürlich deren Funktionsumfang. Nicht zu vergessen: Es gibt tatsächlich auch Datenmanagement-Software als Freeware. Hierbei handelt es sich jedoch zumeist um zeitlich begrenzte Trial-Versionen, funktional stark eingeschränkte Tools, die für geschäftliche Zwecke nur sehr bedingt nützlich sind, oder Open-Source-Systeme ohne oft wichtige Zusatzservices. Also zurück zu den zentralen Kostenfaktoren: Wie bei den meisten Unternehmenstechnologien können sich Interessierte für Software vor Ort (on-premise) entscheiden, die Sie kaufen bzw. mieten und selbst warten, oder für ein Data Warehouse via Cloud. Ein Cloud-Data-Warehouse wird online als Software-as-a-Service (SaaS) bereitgestellt. Datenmanagement-Lösungen in der Cloud funktionieren ohne die unternehmensinterne Schaffung spezifischer Hardwareressourcen, bedürfen keiner laufenden In-House-Wartung und reduzieren nicht zuletzt den Bedarf an entsprechenden Fachkräften. All das ist dagegen bei der Nutzung einer einer On-Premise-Software erforderlich, was die Kosten hier immer stark über den reinen Anschaffungspreis der Anwendung hinauswachsen lässt. Die Nutzung der Cloud bedeutet für Unternehmen praktisch, dass sie bereits Geld sparen. Data-Warehouse-Systems in der Cloud können schon zwischen rund 15 und 85 Euro pro Terabyte und Monat in Anspruch genommen werden, während Vor-Ort-Lösungen schnell bis zu 1.000 Euro monatlich kosten. Dennoch gibt es einige gute Gründe, sich anstatt für ein Cloud-Based-Data-Warehouse für ein On-Premise-System zu entscheiden. In Sachen Geschwindigkeit und Funktionssicherheit sind Vor-Ort-Softwares Cloud-Lösungen oftmals voraus. Daten sind sofort – weil im eigenen System und nicht auf Servern an mehreren Standorten vorliegend - verfügbar. Dabei läuft die Anwendung auch ohne Internetverbindung. Darüber hinaus haben Unternehmen bei einer lokalen Lösung mehr Kontrolle und Flexibilität – insbesondere dann, wenn es sich noch dazu um ein Open-Source-Data-Warehouse handelt. Zu den Funktionen als Kostenaspekt: Standardfunktionen bilden bei Data-Warehouse-Anbietern in aller Regel keine großen Preisdifferenzen. Es sind – wie zu erwarten – vor allem die spezielleren Features, welche den Unterschied machen. So kann beispielsweise Data-Warehouse-Software mit integrierter Business-Intelligence-Solution anstatt rund 50 Euro durchaus 250 Euro pro Monat und mehr kosten.