Data-Warehouse

Ein Data-Warehouse (deutsch Datenlager) ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten von unterschiedlichen Datenquellen zusammensetzt. Die Daten werden von den Datenquellen in das Data-Warehouse kopiert und dort vor allem für die Datenanalyse und zur betriebswirtschaftlichen Entscheidungshilfe in Unternehmen langfristig gespeichert. Der Begriff stammt aus dem Informationsmanagement in der Betriebswirtschaft. Bei der Erstellung eines Data-Warehouse handelt es sich um eine Form der materialisierten Informationsintegration.

Der Erstellung eines Data-Warehouses liegen zwei Leitgedanken zugrunde:

  1. Integration von Daten aus verteilten und unterschiedlich strukturierten Datenbeständen, um im Data-Warehouse eine globale Sicht auf die Quelldaten und damit übergreifende Auswertungen zu ermöglichen.
  2. Trennung der Daten, die i.w. für das operative Geschäft genutzt werden, von solchen Daten, welche im Data-Warehouse z.B. für Zwecke des Berichtswesens, der Entscheidungsunterstützung, der Geschäftsanalyse sowie des Controlling und der Unternehmensführung verwendet werden.

Ein Data-Warehouse ist die zentrale Komponente eines Data-Warehouse-Systems. Daten werden im Rahmen des ETL-Prozesses aus verschiedenen Quellen extrahiert, durch Transformation bereinigt und vereinheitlicht, um danach in das Data-Warehouse geladen zu werden. Dieser Prozess kann turnusgemäß durchgeführt werden, so dass im Data-Warehouse nicht nur Daten nach inhaltlichen Aspekten sondern auch nach dem Aspekt Zeit - also langfristig - gehalten werden, was auch Analysen über die Zeit ermöglicht.

In den letzten Jahren hat sich mehr und mehr die Abkehr von turnusmäßiger Beladung hin zum Real-Time-Data-Warehousing vollzogen. Manche Branchen wie die Telekom-Industrie und der Einzelhandel (z.B. Walmart) hatten Bedarf nach sofort verfügbaren Daten unter Wahrung der Trennung von operativen und auswertenden Systemen.

Inhaltsverzeichnis

Definition

Es gibt derzeit keine einheitliche Definition für den Data-Warehouse-Begriff. Weitgehend einig ist man sich in Folgendem:

Die anderen Definitionen unterscheiden sich vor allem im generellen Zweck eines Data-Warehouse, im Umfang und Umgang der Daten im Data-Warehouse.

Die Einschränkung „physisch“ ist notwendig, um das Data-Warehouse von dem „logischen“ föderierten Datenbanksystem abzugrenzen.

Geschichte des Begriffs

Der 'Data-Warehouse-Begriff wurde Mitte der 1980er Jahre bei IBM geprägt und mit Information-Warehouse bezeichnet. Der Terminus Data-Warehouse wurde erstmals 1988 von Devlin verwendet. In jüngerer Zeit werden Data-Warehouse-Systeme auch als Business-Warehouse-Systeme oder als Business-Intelligence-Systeme bezeichnet, wodurch die geschäftliche Bedeutung derartiger Systeme betont werden soll.

Betrieb eines Data-Warehouse (Data-Warehousing)

Der Gesamtprozess der Datenbeschaffung, Verwaltung und Auswertung eines Data-Warehouses wird auch als Data-Warehousing bezeichnet. Zum Data-Warehousing gehören:

Im Data-Warehouse wie auch in den Data-Marts werden die Daten häufig als mehrdimensionale Matrizen im sog. Sternschema oder in verwandten Datenschemata wie Snowflake- und Galaxy-Schema abgelegt.

Data-Warehouse-Anwendungen

thumb|Ausschnitt aus dem Data-Warehouse-System

Weiterführendes

Literatur

  1. Inmon, W. H.; Hackethorn, R. D.: Using the Data Warehouse. New York: John Wiley & Sons, 1994, ISBN 0-471-05966-8
  2. Bauer, A., Günzel, H.: Data Warehouse Systeme – Architektur, Entwicklung, Anwendung, dpunkt, 2000, ISBN 3-898642-51-8
  3. Zeh, T.: Data Warehousing als Organisationskonzept des Datenmanagements. Eine kritische Betrachtung der Data-Warehouse-Definition von Inmon. In: Informatik, Forschung und Entwicklung, Band 18, Heft 1, Aug. 2003
  4. Kimball, R., Ross, M.: The Data Warehouse Toolkit. The Complete Guide to Dimensional Modeling. 2nd Edition, New York et al.: John Wiley & Sons, 2002 ISBN 0-471-20024-7
  5. Devlin, B.: Data Warehouse: from Architecture to Implementation. Massachusetts: Addison-Wesley, 1997
  6. Lehner, W.: Datenbanktechnologie für Data-Warehouse-Systeme, Konzepte und Methoden, dpunkt, 2002, ISBN 3-89864-177-5
  7. Schweizer, A.: Data Mining, Data Warehousing: Datenschutzrechtliche Orientierungshilfen für Privatunternehmen, Orell Füssli, Zürich, ISBN 3-280-02540-0


Kategorie:Data Warehouse Kategorie:Wirtschaftsinformatik

See also: Data-Warehouse, 1980er, 1988, Aggregation (Informatik), Analyse, Betriebswirtschaft, Business-Intelligence, Common Warehouse Metamodel, Controlling, Data-Mart