+ All Categories
Home > Documents > Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju...

Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju...

Date post: 17-Jul-2020
Category:
Upload: others
View: 1 times
Download: 0 times
Share this document with a friend
20
Skladištenje podataka Prof.dr.sc. Dražena Gašpar 24.10.2016.
Transcript
Page 1: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Skladištenje podataka

Prof.dr.sc. Dražena Gašpar

24.10.2016.

Page 2: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Sadržaj

• Uvod i definiranje pojmova• Izvori podataka• Osnove i geneza skladišta podataka• Arhitektura skladišta podataka• Pro iš avanje podataka – ETL• Dimenzijsko modeliranje

Page 3: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Literatura

• Inmon, W.H.: Building the Data Warehouse – 4th Edition, Wiley Inc. USA, 2005.

• Inmon, W.H., Strauss, D., Neushloss,G.: DW2.0 – The Architecture for the Next Generation of Data Warehousing, 2008.

• Kimball,R., Ross,M.: The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, Wiley

• Kimball,R., Ross,M., Thornthwaite,W., Mundy,J., Becker,B.: The Data Warehouse Lifecycle Toolkit, Wiley Inc. USA, 2008

Page 4: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

OCJENJIVANJE• Priprema za svako predavanje na zadanu temu

+• Projekt - implementacija – od problema do skladišta podataka i izvješ a

Dimenzijskimodel

ETL, Data mart, Izvješ a (min 5)

Aktivnost na nastavi

max. 20 bodovamax. 60 bodova max. 20 bodova

Page 5: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

PROJEKT: Implementacija – od problema do skladišta podataka i izvješ a

• Definirati i opisati problem (dijagrami: use case, aktivnosti i klasa)• Napraviti bazu podataka (relacijsku) u Access-u• Razviti dimenzijski model podataka• Pomo u ETL alata provesti ETL proceshttp://butleranalytics.com/5-free-open-source-etl-tools/• Formirati kocku pomo u CubeIt alata• Napraviti najmanje 8-10 razli itih izvješ a koriste i dimenzijske

operatore

Page 6: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Evolucija digitalne pohrane podataka

Page 7: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Evolucija digitalne pohrane podataka

Page 8: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Evolucija digitalne pohrane podataka

Page 9: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

ZAŠTO

baze podataka nisu dovoljne

??

Page 10: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Podatkovna eksplozija• Kvantiteta podataka, i onih koji su potrebni i

digitaliziranih je enormno pove ana• Donositelji odluka trebaju pristup sve ve em broju

podataka i izvora podataka • IT tj. pohranjivanje podataka omogu ava izniman

porast digitalno pohranjenih podataka (relativno jeftino)

• Na jednoj strani su ogromne koli ine podataka, dok s druge strane postoji stalni nedostatak kvalitetnih podataka

Page 11: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

www.internetlivestats.com

Page 12: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

ZAŠTO skladištenje podataka

??

Page 13: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

13

Istraživa i, Farmeri i Turisti

Istraživa i: Pronalaze nepoznate i neo ekivane informacije skrivene u detaljnim podacima

Farmeri: Sakupljaju informacije Kroz poznate pristupe

Turisti: Pretražuju informacije dobivene of farmera

Page 14: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Definicija Inmon-a

Skladište podataka je predmetno orijentirani, integrirani, relativno stabilni i vremenski orijentirani skup podataka u funkciji potpore odlu ivanja menadžera.

Page 15: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

2 osnovna tipa podataka

Primitivni/Operativni podaci Izvedeni/DSS podaci

Aplikacijski orijentirani Predmetno orijentirani

Detaljni Sumarni, redefinirani

Mogu se mijenjati Ne mogu se mijenjati

Izvršavanje je kontinuirano Izvršavanje je heuristi ko

Zahtjevi za obradu su unaprijed poznati

Zahtjevi za obradu nisu unaprijed poznati

Transakcijski orijentirani Analiti ki orijentirani

Visoka raspoloživost Raspoloživost nije kriti na

Page 16: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

2 osnovna tipa podataka

Primitivni/Operativni podaci Izvedeni/DSS podaci

Cjelovitost održavanja Održavanje po podskupovima

Neredundantni Redundancija kao životna istina

Struktura stati na, sadržaj promjenjiv Fleksibilna struktura

Obrade koriste manju koli inu podataka

Obrade koriste ogromne koli ine podataka

Podržavaju dnevne operacije Podržavaju potrebe menadžera

Odnose se na kra i vremenski period(naj eš e jednu godinu)

Nemaju vremensku ograni enost, prate povijest podataka u poduze u

Page 17: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Mjerne jedinice - DW

• Terabytes -- 10^12 bytes:

• Petabytes -- 10^15 bytes:

• Exabytes -- 10^18 bytes:

• Zettabytes -- 10^21 bytes:

• Zottabytes -- 10^24 bytes:

Walmart -- 24 Terabytes

Geographic Information Systems

National Medical Records

Weather images

Intelligence Agency Videos

Page 18: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

18

• OLTP sustavi “vode” poslovanje

• Skladište podataka omogu ava inteligentnije poslovanje

Page 19: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

Za sljede e predavanje

• Datum: 07.11.2016.

1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju

2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:- minimalno 1 vanjski izvor- podaci iz baze podataka

Page 20: Skladištenje podataka - SUM · 1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju 2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:

PITANJA


Recommended