Post on 03-Jul-2015
description
transcript
강성욱 E-mail : jevida@naver.com Blog : http://sqlmvp.kr Datawaffle : http://datawaffle.com
OLAP 테크놀로지
OLAP과 데이터웨어하우스
OLAP 정의
OLAP (On-Line Analytical Processing) OLAP 용어 창시자 : E.F. Codd WIKI : http://en.wikipedia.org/wiki/Edgar_F._Codd
OLAP 정의
• 최종 사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사 결정에 활용하는 과정 – 조재희/박성진 1996
• 직접 접근 - 전산 부서와 같은 정보 매개자를 거치지 않고 자신이 원하는 정보에 직접 접근
OLAP 정의
• 대화식 분석- 시스템과 상호 작용을 통하여 정보를 분석하고 원하는 결과 도출
• 의사 결정 활용 - 기업의 방향을 설정
OLAP 역사
출처- www.olapreport.com
OLAP 역사
OLAP 역사
OLAP과 EIS
• EIS 용어는 1980년 초반 록커트와 트레이시에 의해 처음 사용.
• EIS의 목표 - 최고 경영자에게 통합된 정보를 신속하게 제공하는 것.
• 오늘날 EIS는 데이터 웨어하우스를 기반으로 접근.
OLAP의 확산
• 관계형 데이터베이스는 OLTP에는 적합하지만 OLAP에는 적합하지 못하므로
새로운 형태의 모델이 필요
• 단순히 데이터를 축적하는 데서 벗어나 어떻게 효과적으로 활용 할 것인가
에 대한 욕구
• 기업간 경쟁이 치열해 지고 기업의 데이터가 매우 중요한 자산으로 인식.
OLTP / OLAP
OLTP : 짧은 시간에 끝나는 간단한 트랜잭션들이 대량으로 발생한다. 많은 사용자들이 동시에 데이터베이스에 접근하여 레코드를 읽거나 갱신. 단위 시간에 처리되는 트랜잭션의 수와 응답이 매우 중요하다. OLAP : OLTP에 비해 동시에 접근하는 사용자 수가 적은 반면 다양한 관점에서 데이터 분석을 지원. 질의 내용이 복잡하고 대화식으로 수행되며 질의 응답을 위해 한번에 매우 많은 양의 데이터를 처리. 기업들은 위의 두 시스템 특징 차이로 인하여 실제 업무 시 분리하여 운영.
데이터웨어하우스
• 기존의 의사 결정 지원 시스템 한계를 극복하기 위해 출현.
• 기업이 축적한 많은 데이터를 사용자 관점에서 주제별로 통합하여 별도의 장소에 저장해 놓은 데이터베이스.
데이터 웨어하우스 장점
• 운영시스템을 보호
• 사용자 질의에 신속한 응답
• 데이터들의 통합으로 관리성
증대
• 통합 시 정제 및 검증 과정을
통한 양질의 데이터 사용
데이터 추출 및 가공(DQ)
• 단순 복제가 아닌 정제 및 변형과정 이루어 짐.
• 중복된 데이터 제거 및 다양한 포맷을 정형화된 포맷으로 통일.
• 필요에 따라 데이터 집계 및 연산과정 발생
M, F
1, 2 남, 여
남:1, 여:0
데이터 마트
데이터 마트 필요성 • 사용자에게 친절하지 않다. 데이터웨어하우스는 최종 사용자와의 인터페이스보다는 방대한 분량의 데이터를 효율적으로 통합하고 관리하는 측면에 초점을 맞춘다. 따라서 사용자 측면에서 편리하게 설계되지 않을 수 있다.
데이터 마트
• 데이터웨어하우스는 전사적인 용도로 구축 도기 때문에 각 개별 부서나 사용자 집단에 적합한 형태로 데이터가 저장되지 않는다. 따라서 사용자 질의에 최적의 성능을 제공하지 못할 수 있다.
• 대부분 사용자들이 일부분만 사용한다. 기업의 사용자들이 웨어하우스에 직접 질의를 수행하는 것은 많은 시스템 자원을 필요로 하며 성능에 심각한 부하를 줄 수 있다.
데이터 마트
하향식 접근법(Top-Down) • 데이터웨어하우스가 먼저 구축된 다음 각 부서나 사용자 집단의 필요에 의해
구축하는 방법.
데이터 마트
상향식 접근법(Bottom_Up Approach) • 데이터마트를 먼저 구축 하고 나중에 데이터웨어하우스로 통합하는 구축 방법.
데이터 마트
중속형 데이터 마트(Dependent Datamart) • 중앙의 데이터웨어하우스로 부터 데이터를 공급받는 형태
데이터 마트
독립형 데이터 마트(Independent Datamart) • 중앙의웨어하우스 없이 데이터 마트 만으로 존재하는 형태
메타데이터 관리
• 데이터에 대한 데이터로서 올바르게 사용하고 관리 할 수 있도록 하
위 레벨 데이터를 기술하는 하위 레벨 데이터로 이해
• 제품마다 고유한 양식이 있으나 메타 데이터를 교환하기 위한 표준
화 노력이 이루어지고 있음.