Empfohlen, 2019

Tipp Der Redaktion

Unterschied zwischen Data Warehouse und Data Mart

Data Warehouse und Data Mart werden als Datenrepository verwendet und dienen demselben Zweck. Diese können durch die Menge an Daten oder Informationen, die sie speichern, unterschieden werden. Der entscheidende Unterschied zwischen einem Data Warehouse und einem Data Mart besteht darin, dass ein Data Warehouse eine Datenbank ist, in der informationsorientiert gespeichert wird, um die Anforderungen der Entscheidungsfindung zu erfüllen, während der Data Mart vollständige logische Teilmengen eines gesamten Data Warehouse ist.

In einfachen Worten handelt es sich bei einem Data Mart um ein Data Warehouse mit beschränktem Umfang, dessen Daten durch Zusammenfassen und Auswählen der Daten aus dem Data Warehouse oder mit Hilfe verschiedener Extraktions-, Transformations- und Ladeprozesse aus dem Quelldatensystem erhalten werden können.

Vergleichstabelle

Basis zum VergleichData WarehouseDatenmarkt
BasicData Warehouse ist anwendungsunabhängig.Datamart ist spezifisch für die Anwendung des Entscheidungsunterstützungssystems.
Art des SystemsZentralisiertDezentral
Form der DatenDetailliertZusammengefasst
Verwendung der DenormalisierungDie Daten sind leicht denormalisiert.Die Daten sind stark denormalisiert.
DatenmodellVon oben nach untenProst
NaturFlexibel, datenorientiert und langlebig.Restriktiv, projektorientiert und kurze Lebensdauer.
Typ des verwendeten SchemasFaktenkonstellationStern und Schneeflocke
Leichtes BauenSchwer zu bauenEinfach zu bauen

Definition von Data Warehouse

Der Begriff Data Warehouse bedeutet eine zeitvariante, themenorientierte, nichtflüchtige und eine integrierte Datengruppe, die den Entscheidungsprozess des Managements unterstützt. Alternativ handelt es sich um ein Repository mit Informationen, die aus mehreren Quellen gesammelt wurden, die in einem einheitlichen Schema an einem einzigen Standort gespeichert sind und die Integration einer Vielzahl von Anwendungssystemen ermöglichen. Sobald diese Daten gesammelt sind, werden sie für eine lange Zeit gespeichert, sind daher langlebig und ermöglichen den Zugriff auf historische Informationen.

Data Warehouse bietet dem Benutzer somit eine einzige integrierte Schnittstelle zu den Daten, über die der Benutzer Entscheidungsunterstützungsabfragen problemlos schreiben kann. Data Warehouse hilft dabei, Daten in Informationen umzuwandeln. Die Gestaltung eines Data Warehouse umfasst einen Top-Down-Ansatz.

Es sammelt Informationen zu Themen, die sich auf die gesamte Organisation beziehen, wie z. B. Kunden, Umsatz, Vermögenswerte, Artikel, und daher ist das Angebot unternehmensweit. In der Regel wird hier ein Konstellationsschema für Fakten verwendet, das eine Vielzahl von Themen abdeckt. Ein Data Warehouse ist keine statische Struktur und wird kontinuierlich weiterentwickelt .

Definition von Data Mart

Ein Data Mart kann als eine Untermenge eines Data Warehouse oder einer Untergruppe von unternehmensweiten Daten entsprechend einer bestimmten Gruppe von Benutzern aufgerufen werden. Data Warehouse umfasst mehrere abteilungsspezifische und logische Datamarts, die in ihrer Datendarstellung persistent sein müssen, um die Robustheit eines Data Warehouse sicherzustellen. Ein Data Mart ist eine Gruppe von Tabellen, die sich auf eine einzige Aufgabe konzentrieren. Diese werden mit einem Bottom-Up-Ansatz entworfen.

Die Ausdehnung des Datamart ist auf ein bestimmtes ausgewähltes Thema beschränkt, daher ist der Umfang abteilungsübergreifend. Diese werden normalerweise auf kostengünstigen Abteilungsservern implementiert. Der Implementierungszyklus von Data Marts wird in Wochen statt in Monat und Jahr überwacht.

Da das Stern- und Schneeflockenschema auf die Modellierung einzelner Subjekte abzielt, werden diese häufig im Data Mart verwendet. Das Sternschema ist zwar beliebter als das Schneeflockenschema. Je nach Datenquelle können die Data Marts in zwei Typen eingeteilt werden: abhängige und unabhängige Data Marts.

Hauptunterschiede zwischen Data Warehouse und Data Mart

  1. Data Warehouse ist anwendungsunabhängig, wohingegen Data Mart spezifisch für die Anwendung von Decision Support System ist.
  2. Die Daten werden in einem einzigen zentralen Repository in einem Data Warehouse gespeichert. Im Gegensatz dazu speichert Data Mart Daten dezentral im Benutzerbereich.
  3. Data Warehouse enthält eine detaillierte Form von Daten. Im Gegensatz dazu enthält der Datamart zusammengefasste und ausgewählte Daten.
  4. Die Daten in einem Data Warehouse werden geringfügig denormalisiert, während sie im Fall von Data Mart stark denormalisiert sind.
  5. Der Aufbau eines Data Warehouse erfordert einen Top-Down- Ansatz. Umgekehrt wird beim Aufbau eines Data Mart der Bottom-Up- Ansatz verwendet.
  6. Data Warehouse ist flexibel, informationsorientiert und seit langem vorhanden. Im Gegenteil, ein Data Mart ist restriktiv, projektorientiert und hat eine kürzere Existenz.
  7. Das Fakten-Konstellationsschema wird normalerweise für die Modellierung eines Data-Warehouse verwendet, wohingegen im Data-Mart-Star-Schema populärer ist.

Fazit

Data Warehouse bietet Enterprise View, ein einzelnes und zentralisiertes Speichersystem, eine inhärente Architektur und Anwendungsunabhängigkeit, während Data Mart eine Teilmenge eines Data Warehouse ist, die Abteilungsansicht und dezentralen Speicher bietet. Da das Data Warehouse sehr groß und integriert ist, besteht ein hohes Ausfallrisiko und Schwierigkeiten bei der Erstellung. Auf der anderen Seite ist der Data Mart leicht zu erstellen und das damit verbundene Ausfallrisiko ist ebenfalls geringer, aber im Data Mart kann eine Fragmentierung auftreten.

Top