In einfachen Worten handelt es sich bei einem Data Mart um ein Data Warehouse mit beschränktem Umfang, dessen Daten durch Zusammenfassen und Auswählen der Daten aus dem Data Warehouse oder mit Hilfe verschiedener Extraktions-, Transformations- und Ladeprozesse aus dem Quelldatensystem erhalten werden können.
Vergleichstabelle
Basis zum Vergleich | Data Warehouse | Datenmarkt |
---|---|---|
Basic | Data Warehouse ist anwendungsunabhängig. | Datamart ist spezifisch für die Anwendung des Entscheidungsunterstützungssystems. |
Art des Systems | Zentralisiert | Dezentral |
Form der Daten | Detailliert | Zusammengefasst |
Verwendung der Denormalisierung | Die Daten sind leicht denormalisiert. | Die Daten sind stark denormalisiert. |
Datenmodell | Von oben nach unten | Prost |
Natur | Flexibel, datenorientiert und langlebig. | Restriktiv, projektorientiert und kurze Lebensdauer. |
Typ des verwendeten Schemas | Faktenkonstellation | Stern und Schneeflocke |
Leichtes Bauen | Schwer zu bauen | Einfach zu bauen |
Definition von Data Warehouse
Der Begriff Data Warehouse bedeutet eine zeitvariante, themenorientierte, nichtflüchtige und eine integrierte Datengruppe, die den Entscheidungsprozess des Managements unterstützt. Alternativ handelt es sich um ein Repository mit Informationen, die aus mehreren Quellen gesammelt wurden, die in einem einheitlichen Schema an einem einzigen Standort gespeichert sind und die Integration einer Vielzahl von Anwendungssystemen ermöglichen. Sobald diese Daten gesammelt sind, werden sie für eine lange Zeit gespeichert, sind daher langlebig und ermöglichen den Zugriff auf historische Informationen.
Data Warehouse bietet dem Benutzer somit eine einzige integrierte Schnittstelle zu den Daten, über die der Benutzer Entscheidungsunterstützungsabfragen problemlos schreiben kann. Data Warehouse hilft dabei, Daten in Informationen umzuwandeln. Die Gestaltung eines Data Warehouse umfasst einen Top-Down-Ansatz.
Es sammelt Informationen zu Themen, die sich auf die gesamte Organisation beziehen, wie z. B. Kunden, Umsatz, Vermögenswerte, Artikel, und daher ist das Angebot unternehmensweit. In der Regel wird hier ein Konstellationsschema für Fakten verwendet, das eine Vielzahl von Themen abdeckt. Ein Data Warehouse ist keine statische Struktur und wird kontinuierlich weiterentwickelt .
Definition von Data Mart
Ein Data Mart kann als eine Untermenge eines Data Warehouse oder einer Untergruppe von unternehmensweiten Daten entsprechend einer bestimmten Gruppe von Benutzern aufgerufen werden. Data Warehouse umfasst mehrere abteilungsspezifische und logische Datamarts, die in ihrer Datendarstellung persistent sein müssen, um die Robustheit eines Data Warehouse sicherzustellen. Ein Data Mart ist eine Gruppe von Tabellen, die sich auf eine einzige Aufgabe konzentrieren. Diese werden mit einem Bottom-Up-Ansatz entworfen.
Da das Stern- und Schneeflockenschema auf die Modellierung einzelner Subjekte abzielt, werden diese häufig im Data Mart verwendet. Das Sternschema ist zwar beliebter als das Schneeflockenschema. Je nach Datenquelle können die Data Marts in zwei Typen eingeteilt werden: abhängige und unabhängige Data Marts.
Hauptunterschiede zwischen Data Warehouse und Data Mart
- Data Warehouse ist anwendungsunabhängig, wohingegen Data Mart spezifisch für die Anwendung von Decision Support System ist.
- Die Daten werden in einem einzigen zentralen Repository in einem Data Warehouse gespeichert. Im Gegensatz dazu speichert Data Mart Daten dezentral im Benutzerbereich.
- Data Warehouse enthält eine detaillierte Form von Daten. Im Gegensatz dazu enthält der Datamart zusammengefasste und ausgewählte Daten.
- Die Daten in einem Data Warehouse werden geringfügig denormalisiert, während sie im Fall von Data Mart stark denormalisiert sind.
- Der Aufbau eines Data Warehouse erfordert einen Top-Down- Ansatz. Umgekehrt wird beim Aufbau eines Data Mart der Bottom-Up- Ansatz verwendet.
- Data Warehouse ist flexibel, informationsorientiert und seit langem vorhanden. Im Gegenteil, ein Data Mart ist restriktiv, projektorientiert und hat eine kürzere Existenz.
- Das Fakten-Konstellationsschema wird normalerweise für die Modellierung eines Data-Warehouse verwendet, wohingegen im Data-Mart-Star-Schema populärer ist.
Fazit
Data Warehouse bietet Enterprise View, ein einzelnes und zentralisiertes Speichersystem, eine inhärente Architektur und Anwendungsunabhängigkeit, während Data Mart eine Teilmenge eines Data Warehouse ist, die Abteilungsansicht und dezentralen Speicher bietet. Da das Data Warehouse sehr groß und integriert ist, besteht ein hohes Ausfallrisiko und Schwierigkeiten bei der Erstellung. Auf der anderen Seite ist der Data Mart leicht zu erstellen und das damit verbundene Ausfallrisiko ist ebenfalls geringer, aber im Data Mart kann eine Fragmentierung auftreten.