+ All Categories
Home > Documents > Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema...

Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema...

Date post: 21-Aug-2019
Category:
Upload: duongkhuong
View: 216 times
Download: 0 times
Share this document with a friend
24
Seminar: Business Intelligence Teil I: OLAP & Data Warehousing Data-Warehouse-Design Jörg Ramser 18.07.2003
Transcript
Page 1: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

Seminar: Business Intelligence −Teil I: OLAP & Data Warehousing

Data-Warehouse-Design

Jörg Ramser18.07.2003

Page 2: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

2

Übersicht

Umsetzung des multidimensionalen DatenmodellsRelationale Speicherung (ROLAP)Multidimensionale Speicherung (MOLAP)Hybride Lösung (HOLAP)

MetadatenRolle der MetadatenAnforderungen an RepositorienStandards

Zusammenfassung

Page 3: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

3

ROLAP: Faktentabelle

03.01.2000Lavamat S

Duett

München, IsartorNürnberg,

Breite Gasse

02.01.200001.01.2000

Produkt

Geographie

Zeit

Ohne KlassifikationshierarchienInterpretation der Spalten als

Dimension bzw.Kenngröße

1500201.01.2000München, IsartorLavamat S1200302.01.2000München, IsartorDuett800203.01.2000Nürnberg, Breite GasseDuett

Preis(Kenngröße)

Verkäufe(Kenngröße)

Zeit(Dimension)

Geographie(Dimension)

Produkt(Dimension)

Page 4: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

4

KlassifikationshierarchienSnowflake-SchemaStar-SchemaMischformen von Star- und Snowflake-SchemaGalaxie

2000

1. Quartal

Februar ´00Januar ´00

01.01.2000 02.01.2000 10.02.2000 23.02.2000

Page 5: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

5

Snowflake-Schema

ProduktGrIDProduktgruppeBranche

ProduktGr

ProduktNrProduktnameProduktGrIDHerstellerFarbePreis

Produkt

DatumTagMonat

Zeit MonatQuartal

MonatQuartalQuartal Jahr

JahrFür jede Klassifikationsstufe eigene RelationFremdschlüssel von tiefer liegender Stufe auf höhere StufeKennzahlen mittels Faktentabellenormalisiert

FilialeIDFilialeStadtID

Filialen

StadtIDStadtRegionID

Stadt

Verkauf

ProduktNrDatumFilialeID

AnzahlUmsatz

Faktentabelle Region

LandIDLand

LandRegionIDRegionLandID

Page 6: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

6

Star-Schema

ProduktNrDatumFilialeID

AnzahlUmsatz

Verkauf

ProduktNrProduktNameProduktGruppeBrancheHerstellerFarbePreis

Produkt n

DatumTagMonatQuartalJahr

Zeit1

n

FilialeIDFilialeOrtLandRegion

Filialenn

1

Denormalisierung von Snowflake-SchemaPro Dimension nur noch eine TabelleRedundanzen

Kennzahlen durch Faktentabelle

1

Dimensionstabellen DimensionstabellenFaktentabelle

Page 7: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

7

Star-SchemaVorteile

Weniger teure VerbundoperationenStar-Schema besitzt einfachere Struktur

NachteileRedundanzen → Änderungsanomalien

Trotz Redundanzen häufig Star-Schema, daRedundanzen nur in DimensionstabellenÄnderungen an Dimensionstabellen selten

Page 8: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

8

VariantenMischformen von Star- und Snowflake-Schema

Vereinigung der Vorteile beider SchemataSnowflake-Schema, falls

Frequenz der Änderungen hochGroße Anzahl von Dimensionselementen auf niedrigster StufeAnzahl der Stufen innerhalb einer Dimension hochInnerhalb einer Dimension viele Aggregate materialisiert

Galaxien bzw. Multi-Faktentabelle

Page 9: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

9

Versionisierungs-/Evolutionsaspekte

Klassifikationshierarchieänderungen„Update in place“TupelversionierungZeitattribute

SchemaänderungenSchemaevolutionSchemaversionierung

Page 10: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

10

Tupelversionierung – Beispiel

............MobiltelefonDualbandQuickphone 2001239-002MobiltelefonSinglebandQuickphone 1001237-001MobiltelefonDualbandQuickphone 1501235-002MobiltelefonSinglebandQuickphone 1501235-001ProduktfamilieProduktgruppeArtikelANR_VNR

...............99,003507.03.2003500151239-002

53503160Verkäufe

199,0006.03.2003500151235-002199,0005.03.2003500151235-002599,0002.03.2003500151237-001299,0002.03.2003500151235-001PreisDatumFiliale_IDANR_VNR

Faktentabelle

Produkt

Page 11: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

11

Zeitbehaftete Schemabeschreibung

BeispielAttribut(AttributDefName, RelationDefName, GA, GE)

„Artikel“ „Produkt“ 1999-07-01, ∞„Marke“ „Produkt“ 1999-07-01, 1999-12-31„Produktgruppe“ „Produkt“ 1999-08-01, ∞„Produktfamilie“ „Produkt“ 1999-08-01, ∞„Artikel_ID“ „Produkt“ 1999-08-01, ∞

Relation (RelationDefName, GA, GE)„Produkt“ 1999-07-01, ∞„Verkäufe“ 1999-07-01, ∞

Page 12: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

12

Multidimensionale Speicherung

Hosen

Hemden

Kleidung

VideorecorderUnterhaltungs-elektronik

Jan.

Feb.

Mrz.Qua

rtal 1

Speicherung der DatenstrukturenDimension (inklusive Hierarchien)Würfel

⇒ Speicherung in multidimensionaler Matrix⇒ Problem: Speicherung nur linear möglich

Page 13: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

13

LinearisierungsreihenfolgeD3

Index(z) = x1 + (x2-1) · |D1| + (x3-1) · |D1| · |D2| + ... + (xn-1) · |D1| · ... · |Dn-1|

= 1 + , wobei z = (x1, x2, ... xn)∑ ∏⋅− ii Dx )1(=

=

n

i

i

j1

1

1

D2

D1

Page 14: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

14

relational vs multidimensional

Nachteile

Vorteile

Dünnbesetzte WürfelKein AnfragesprachenstandardSkalierbarkeit eingeschränkt

Standard SQL nur bedingtausreichendSemantikverlustePerformanzverluste beiAbbildung

Hohe AnfragegeschwindigkeitEffiziente multidimensionaleSpeicherungsstrukturenMultidimensionale Anfragesprache

Bewährte TechnologieStandard SQLDatenimport einfachVorhandeneSicherheitsmechanismenVerarbeitung großerDatenmengenLeichte Skalierbarkeit

MultidimensionalRelational

Page 15: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

15

Hybride Speicherung

Ziel: Vereinigung der Vorteile beider Welten

→Detaildaten relational speichernAggregierte Daten multidimensional speichernForderung: Zugriffstransparenz für Benutzer

Page 16: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

16

Übersicht

Umsetzung des multidimensionalen DatenmodellsRelationale SpeicherungMultidimensionale SpeicherungHybride Lösung

MetadatenRolle der MetadatenAnforderungen an RepositorienStandards

Zusammenfassung

Page 17: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

17

Rolle der MetadatenHaltung der Metadaten im Metadaten-Warehouse bzw. Repositorium

Zweck der Metadaten

Effektive Beschaffung von InformationenDatenqualitätTerminologieDatenanalyse

Unterstützung des laufenden BetriebsAutomatisierung der AdministrationsprozesseSystemintegrationSchutz und SicherheitsaspekteFlexibler Softwareentwurf

Page 18: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

18

Modellierung MetadatenMindestens 4 Ebenen zur Modellierung komplexer Informationssysteme

Daten

Metadaten

Metamodelle

Metametamodelle

KUNDE_TABELLE, STRASSE_ATTRIBUT

Kundendaten (Müller, Blumenstr)

Repositorium-Schema (TABELLE, ATTRIBUT)

Page 19: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

19

Funktionalitäten der RepositorienAnwenderzugriff

NavigationSelektionFilterungManuelle Aktualisierung

Interoperabilität und WerkzeugunterstützungAustauschformatProgrammierschnittstelle (API)Erweiterbares Metamodell

ChangemanagementVersions- undKonfigurationsverwaltungNotifikationsdienstAuswirkungsanalyse

Page 20: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

20

Realisierung Metadatenverwaltung

Zentrale MetadatenverwaltungZentral und konsistent verwaltet

Dezentrale MetadatenverwaltungRepositorien komplett unabhängigZusammenarbeit durch Austausch

Föderierte MetadatenverwaltungMischung aus zentraler und dezentraler VerwaltungGlobale, konzeptionelle Sicht auf Metadaten

Page 21: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

21

Föderierte Metadatenverwaltung

Administrations-werkzeug

REP REP REP REP

Metadatenmanager

Repositoriumsföderation

Datenfluss

Datenbeschaffungswerkzeug

AnalysewerkzeugData-Warehouse-

ManagerAnwender-

zugriffswerkzeug

Entwicklungswerkzeug

Autonomes Werkzeug

Kontrollfluss

Page 22: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

22

StandardsRepositoriumstandards

Information Ressource Dictionary System (IRDS)Portable Common Tool Environment (PCTE)

AustauschstandardsXML-basiertCase Data Interchange Format (CDIF)

Standard MetamodelleCWM (Common Warehouse Metamodel)OIM (Open Information Metamodel)Zachman Framework

Page 23: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

23

CWM

RecordOriented

Model

CWM Foundation

Model

XMLModel

Foundation

Resource

RelationalModel

WarehouseDeployment

ModelAnalysis

Management

WarehouseProcessModel

WarehouseOperation

Model

TransformationModel

A BA ist abhängig von B

MDDBModel

OLAPModel

Page 24: Data-Warehouse-Design · Produkt (Dimension) 4 Klassifikationshierarchien Snowflake-Schema Star-Schema Mischformen von Star- und Snowflake-Schema Galaxie 2000 1. Quartal Januar ´00

24

Zusammenfassung

Umsetzung des multidimensionalen DatenmodellsRelationale SpeicherungMultidimensionale SpeicherungHybride Lösung

MetadatenRolle der MetadatenAnforderungen an RepositorienStandards


Recommended