Data Warehouse

Was ist ein Data Warehouse?

Nils Martens 19.8.2022

Verschafft Euch mit einem Data Warehouse den absoluten Überblick über Euer Unternehmen

Das Data Warehouse fungiert als Single Source of Truth in einem Unternehmen. Es verschafft der Geschäftsführung und anderen Abteilungen entscheidende Einblicke in zahlreiche relevante Daten. Daraus resultieren viele Vorteile für Euer Business. Statt alles selbst zu sammeln bzw. von Mitarbeiter:innen über unterschiedliche Kanäle dezentralisiert an Euch herantragen zu lassen, zentralisiert Ihr die Geschichte.

Wie das genau aussieht, welche Systeme Euch dabei helfen und wie ein Data Warehouse genau funktioniert, verraten wir Euch jetzt.

Was ist ein Data Warehouse (DWH)?

Die Definition eines Data Warehouse ist simpel, das was wirklich dahintersteckt dagegen schon etwas umfassender und nicht in einem Satz erklärbar. Kurz gesagt – und gleichzeitig übersetzt – erklärt sich der Begriff mit „Lagerdatenhaus“. Dort werden alle Daten aus den unterschiedlichsten Quellen gesammelt und anschließend könnt Ihr sie abfragen. Zum Beispiel in Form von Analysen.

Dadurch könnt Ihr im Business fundierte Entscheidungen treffen, die besonders durch Verlaufsdatensätze begünstigt werden. Alles automatisch, mit KI-Algorithmen sowie mit mehreren nützlichen Anwendungsmöglichkeiten ausgestattet.

Wie funktioniert ein Data Warehouse?

Stellt Euch eine riesige Halle vor, in denen die Wände mit zahlreichen Fächern gespickt sind und das meterhoch. Jedes Fach trägt eine Information über Eure Company, dem Markt oder andere relevante Bereiche. In der Mitte des Raumes ist ein Display, durch das Ihr nun abfragt, was Ihr wollt, um beispielsweise eine Unternehmensentscheidung zu treffen. Zahlreiche Roboter werden sich daraufhin sämtliche notwendigen Informationen holen und sie Euch aufbereiten. Durch künstliche Intelligenz werden die Informationen logisch geordert sowie zusammengefügt.

Das war die bildliche Darstellung. Münzt es in ein digitales System um und Ihr erhaltet ein Data Warehouse. Zentralisiert, Daten aufbereitend, speichernd, verwaltend und Analysen visualisierend. Ganz gleich wie groß die Datenmenge ist: Dank intelligenter Algorithmen wird die Software immer den Überblick haben, wo menschliche Möglichkeiten ihre Grenzen finden. Euer Resultat sind Bestandsanalysen und daraus folgende Potenziale, die Eurem Fortschritt immer wieder einen Kick geben.

Der Zugriff auf ein Data Warehouse erfolgt via Business Intelligence Software (BI) oder einer anderen Art von Analyseanwendung. Damit bereitet Ihr Eure Daten aus allen Abteilungen für Eure Entscheidungsfindung auf.

 

Wie ist ein Data Warehouse aufgebaut?

Damit ein Data Warehouse nicht in völligem Chaos aufgrund Unmengen an Daten verfällt, unterliegt es gewissen Regeln. Diese können sich je nach System, Unternehmen und Anforderungen der User:innen unterscheiden. Die Grundlage dafür bildet die Architektur eines Data Warehouse. Insgesamt spricht man von vier Architektur-Typen.

  • Einfaches System – Das grundlegende System besteht aus den drei Stufen Data-Mining und Analysen erstellen, Analyse der Daten im Data Warehouse und der Datenbankserver, in dem verwaltet und gespeichert wird.
  • Einfaches System + Staging-Area – Um die Daten besser fürs Speichern vorzubereiten, nutzen einige Systeme eine Staging-Area. Meist geschieht das automatisiert durch das installierte System.
  • Hub-and-Spoke-System – Hierbei werden Stationen (Data Marts) zwischen Verwaltung und User:in eingerichtet, die sich an die unterschiedlichen Anforderungen der Abteilungen im Unternehmen orientieren. Somit werden die Datenpakete nicht ungefiltert in ausschließlich eine Richtung ausgespuckt, sondern dort, wo sie relevant sind.
  • Sandbox – Wie der Name verrät, können sich User:innen in diesem Teil der Architektur ohne Regeln austoben. Es sind sichere Bereiche, in denen nach neuen Datenparallelen gefahndet werden kann, ohne das eigentliche System zu beeinträchtigen.

In allen vier Strukturen sortiert ein Data Warehouse in der dritten Stufe, dem Datenbankserver, u. a. nach Priorität. Werden gewisse Datenpakete oft abgerufen, werden sie in schnell zugänglichen Speichern abgelegt. Datenpakete, die selten von Interesse sind, kommen hingegen in eine simplere Speicherinfrastruktur. Dadurch werden Ressourcen zielführend eingesetzt und die Abfrage relevanter Daten geht schneller vonstatten. In unserem vorher erwähnten Bild einer großen Halle, wären das somit weitere Hallen darüber. Stark frequentierte Daten kommen unten hin (schnell erreichbar), weniger frequentierte weiter oben (langsamer erreichbar). Dadurch wird kein Prozess des Data Warehouse zugunsten eines anderen jemals beeinträchtigt.

Was ist der Unterschied zwischen Data Warehouse, Datenbank und Data Lake?

Bisher haben wir uns mit bildlicher Darstellung (für die simplicity) und der Architektur beschäftigt. Doch was haben nun Datenbanken und Data Lakes mit einem Data Warehouse am Hut? An diesem Punkt gehen wir weiter ins Detail.

Daten können direkt in einem Data Warehouse landen, wo sie analysiert und für die weitere Verarbeitung durch Big-Data-Analyse-Softwares oder Machine Learning aufbereitet werden. In dem Fall müssen die Daten nicht sonderlich gut strukturiert sein. Ebenso kommt es nicht besonders stark auf das tabellarische Schema an, das ein Data Warehouse ausmacht. Demnach reicht ein Data Lake allein aus.

Wer es genauer braucht, lässt Daten zunächst in einen Data Lake oder eine Datenbank speisen, die Daten aufbereiten und sortiert im Data Warehouse stapeln. Anschließend erhalten User:innen fundiertere Reportings. Auf diese Weise können Data Lakes, Datenbanken und Data Warehouses ergänzend zusammenarbeiten.

So gesehen hängen alle drei zusammen, sind jedoch in ihrer Funktionsweise unterschiedlich. Ob sie miteinander oder nur einzeln gebraucht werden, entscheiden die Nutzer:innen, die das Ergebnis benötigen. Kurz gesagt: Umso mehr Daten hinzukommen, desto schlüssiger erscheint die Aufteilung der Last auf mehrere Systeme.

Data Warehouse.png

Der Aufbau eines Data Warehouses mit den Zwischenstationen Staging-Area und Data-Marts.

Welche 5 Vorteile haben Data Warehouses

Vorteile helfen bei der Entscheidungsfindung, ob ein Tool notwendig ist oder eben nicht. Demnach wollen wir Euch mindestens 5 Vorteile verraten, die ein Data Warehouse mit sich bringt.

  1. Datenbasierte Entscheidungsfindung ist durch keine andere Methode gleichwertig ersetzbar.
  2. Sämtliche Daten aus allen Quellen finden sich an einem Ort.
  3. Für jeden Geschäftsbereich könnt Ihr Daten genau analysieren.
  4. Die Daten im Data Warehouse werden stetig analysiert und der Veränderungsverlauf gespeichert.
  5. Die unterschiedlichen Aufgaben innerhalb eines Data Warehouses werden von verschiedenen Systemen betrieben, was die Leistung der einzelnen Systeme stärkt. Die Zusammenarbeit, nicht die Leistung einer einzigen Software, macht ein DWH aus.

Welche Arten von Data-Warehouse-Lösungen gibt es?

Als in den 1980er Jahren die ersten Data Warehouses entstanden, waren das noch On-Premise-Lösungen. Sie waren ineffizient und entwickelten sich daher in Richtung anderer Anwendungen wie BI-Plattformen. Somit schlugen sie den Weg der Transformation von einfachen Speichern zu infrastrukturellen, kooperativen Systemen für datenfundierte Reports und Analysen ein.

Im Normalfall werden Data-Warehouse-Systeme auch heutzutage vorzugsweise on-premise im Unternehmen gelöst. Die Gründe dafür liegen vor allem in der Sicherheit und in der Schnelligkeit, welche sich auf die Latenz des Datenaustausches bezieht. Alternativ können jedoch auch Cloud-Data-Warehouse-Systeme zum Tragen kommen. Sie gelten als besonders anfängerfreundlich, da sie mit mehreren Klicks eingerichtet sind. Auch mit Blick auf die Kosten hat eine Cloud-Lösung Vorteile, da Ihr nur das bezahlt, was Ihr benötigt. In der anschließenden Tabelle zeigen wir Euch im direkten Vergleich zwischen Cloud- und On-Premise-Data-Warehouse die jeweiligen Vorteile auf:

Tabelle-data-warehouse.png

Welche Data-Warehouse-Systeme gibt es?

Ganz gleich, welche Richtung Ihr einschlagt, es gibt zahlreiche Software-Anbieter auf dem Markt, die Euch geeignete Lösungen zur Verfügung stellen. Auf OMR Reviews findet Ihr daher unterschiedliche Systeme, welche je nach Bedarf zu Eurer Unternehmensinfrastruktur passen. Gleichzeitig bekommt Ihr auch Rückmeldungen von anderen Usern zu jeder Lösung, um im Vorfeld herauszufinden, ob sie für Eure Company ebenfalls ein Match sind.

Folgende 10 Data-Warehouse-Systeme empfehlen OMR Reviews Usern:

amazon-redshift-screenshot.png

Die Struktur des Data-Warehouse-Systems Redshift von Amazon.

Fazit

Wir haben Euch das Thema Data Warehouse so simpel wie möglich darstellen wollen. Doch es ist deutlich komplexer als eben mal ein CRM oder eine HR-Software zu installieren. Diverse Anbieter liefern Euch ausreichend Support, Euren Anfang damit zu machen. Vor allem Cloud-Data-Warehouses eignen sich dabei für Anfänger:innen.

Doch Fakt ist: Wächst Euer Unternehmen, wachsen auch die Datenmengen. Dabei den Überblick mit Excel-Tabellen oder einfachen Tools zu behalten, ist unmöglich. Zumal die Anforderungen, Daten zu verwalten und zu analysieren, für jeden Bereich des Unternehmens unterschiedlich sein können. Ein Data-Warehouse bringt in diesem Fall die richtige Lösung, verwaltet, speichert sowie analysiert Eure Daten und wächst mit Eurem Unternehmen. Es gibt Euch die optimale Möglichkeit, datenfundierte Entscheidungen zu treffen.

FAQ

  1. Was ist ein Data Warehouse?
    • Ein Data Warehouse speichert, verwaltet und analysiert die Datenmengen, die in Eurem Unternehmen anfallen. Durch ein tabellarisches Schema können diese Daten mittels Analyse-Tool einfach und KI-gesteuert aufbereitet werden, wodurch Ihr fundierte Geschäftsentscheidungen treffen könnt.
  2. Was ist der Unterschied zwischen Data Warehouse, Data Lake und Datenbank?
    • Im Grunde ist die Funktionsweise der wesentliche Unterschied. Data Lakes können zum Beispiel auch unstrukturierte Daten speichern, was jedoch die weitere Verarbeitung durch Big-Data-Analyse-Softwares beschränkt. Ein Data Warehouse ist komplexer und strukturierter. Im besten Fall wird ein Data Warehouse mit Data Lakes und Datenbanken kombiniert. Sie dienen als erste Instanz, bevor Daten ins Data Warehouse gespeist werden.
  3. Welche Data-Warehouse-Systeme gibt es?
    • Es gibt sowohl On-Premise- als auch Cloud-Lösungen für Data Warehouses. Beide haben ihre Vorteile. On-Premise-Systeme besitzen die Vorzüge starker Sicherheit und guter Latenz, während Cloud-Systeme vor allem mit Kosteneffizienz und Anfängerfreundlichkeit punkten.
  4. Wie funktioniert ein Data Warehouse?
    • Ein Data Warehouse speichert große Datenmengen, die in Unternehmen heutzutage aufkommen, strukturiert, sortiert und verwaltet sie mittels KI-Algorithmen sowie vorgegebenen individualisierten Regeln. Anschließend können die Daten durch integrierte Analyse-Tools den User aufbereitet werden.
  5. Was sind Data Marts?
    • Data Marts sind Knoten zwischen Data Warehouse und Endbenutzer:in. Sie sortieren die Daten einem entsprechenden Unternehmensbereich gerecht. Je nach Abteilung herrschen unterschiedliche Anforderungen an Datenpakete, weshalb Data Marts eine große Hilfe sind, Daten nicht ausschließlich einheitlich analysieren zu müssen.
  6. Wo finde ich das richtige Data-Warehouse-System?
    • Auf OMR Reviews erhaltet Ihr in der Kategorie Data Warehouse einen Überblick passender Systeme – von verifizierten User bewertet und mit ihren Erfahrungsberichten ergänzt.

Nils Martens
Autor:In
Nils Martens
Autor:In
Nils Martens

Verfolgt die Software-Welt schon seit Windows 3.1 – als Slack, Google Meets und Ahrefs noch nicht existierten. Für OMR Reviews ist Nils als Redakteur mit Hype auf Technik, Internetkultur und Software unterwegs. Außerdem kümmert er sich als Freelancer um die Content Creation & das Personal Branding von CEOs auf LinkedIn. In seiner Freizeit findet ihr ihn gerne mal beim FPS-Zocken.

Im Artikel erwähnte Softwares

Im Artikel erwähnte Software-Kategorien