상세 컨텐츠

본문 제목

데이터 웨어하우스 멘토: 실용적 DW/ BI 시스템 구축을 위한 통찰

전체 출간 도서

by 비제이퍼블릭 2013. 2. 26. 08:54

본문

데이터 웨어하우스 멘토

 

 

부제 실용적 DW/BI 시스템 구축을 위한 통찰

저자 로버트 라베르지

역자 장효성

출간일: 2013314()

정가: 30,000

페이지: 427

판형: 190 x 245

ISBN: 978-89-94774-32-9 (93560)

 

원서정보: The Data Warehouse Mentor: Practical Data Warehouse and Business Intelligence Insights

 

 

책 소개

 

 

사용 목적에 맞는 데이터 웨어하우스과 비즈니스 인텔리전스

 

아키텍처 구축하기

 

전문 개발자와 트레이너들의 상세한 안내와 모범사례를 통해 회사 전반에 걸쳐 사용자의 선택의 폭을 넓히고 의사결정을 더욱 합리적으로 이끌어내자. 《데이터 웨어하우스 멘토: 실용적 DW/BI 시스템 구축을 위한 통찰》은 통합된 DW/BI 솔루션의 시작부터 끝까지, 계획하고 디자인하고 구축하고 관리하는 방법을 보여준다. 이 책을 통해 적절한 구성요소를 선택하고, 기업 데이터 모델을 구축하고, 데이터 마트와 데이터 웨어하우스를 구성하고, 데이터 흐름을 확립하고 위험을 완화하는 방법에 대해 배워보자. 이 책은 또한 변경관리, 데이터 거버넌스, 보안관리에 대해서도 폭넓게 다루고 있다.

 

이 책에서 다루는 내용:

 

- BI DW 시스템의 구성요소에 대해 이해하기

- 프로젝트의 목표를 확립하고 효율적인 개발 계획 시행하기

- 데이터 마이닝을 이용하여 회사의 트랜잭션에 대한 통찰력 획득하기

- ETL(Extract: 추출, Transform: 변환, Load: 적재) 테크닉을 이용하여 데이터의 입력, 수정, 표준화

  달성하기

- 데이터 요구사항을 정의하기 위해 구조화된 입력 파일 사용하기

- 상향식(top-down), 하향식(bottom-up)의 복합 디자인 방법론 활용하기

- 데이터 관리 툴을 이용하여 최적화된 성능과 보안 통제하기

 

 

독자 대상

 

초중급

 

 

 

저자소개

 

 

로버트 라베르지

여러 인터넷 벤처 회사의 설립자이며 DW BI 솔루션에 포커스를 맞추고 있는 IBM 산업 자산 산업 모델 연구실 수석 컨설턴트다. 밥은 빌 게이츠가 겨우 백만장자였을 때인 70년대 후반에 경력을 시작했고, 개발자, DBA, 데이터 모델러, 프로젝트 관리자, 데이터 설계자, 전사 정보 설계자, DW/BI 감사관으로 근무했으며 혁신적인 기업의 전략가이기도 했다. 이후 최적화, 모범 사례, 개념적인 지식, 디자인을 통한 논리적/물리적 수준의 DW BI 구현의 시연, 멘토링, 교육을 위하여 전 세계를 여행했다. 밥은 소매, 보험, 의료, 철도, 통신, 공공, 온라인 사업, 금융 분야 전반에 걸쳐 50개 이상의 기업에서 성공적으로 프로젝트를 수행하였다. 밥은 영국의 더럼(Durham) 대학에서 경영학 석사 학위를 취득하였다.

 

 

 

역자소개

 

 

장효성

2007 SK C&C에 입사하여 DBA로 첫 업무를 시작하였으며, 현재 인프라 서비스 팀에서 Oracle Database 성능 진단/튜닝 및 Trouble shooting 업무를 수행한다. 다양한 인더스트리의 DB 성능 분석 패턴을 연구하며 Oracle DB 성능 진단/분석 사내강사다. 저서에 《오라클 AWR을 이용한 고성능 데이터베이스》(공저)가 있다.

 

 

 

 

목차

 

 

PART I. 준비

 

CHAPTER 1. 데이터 웨어하우스와 비즈니스 인텔리전스 개관

비즈니스 인텔리전스 개요

정의

BI 가치

비즈니스와 인텔리전스의 분리

BI 성공 요소

BI 목적

BI 사용자 프레젠테이션

BI 툴과 아키텍처

세계화에 따른 발전

DW 개요

정의

데이터 웨어하우스 시스템

DW 아키텍처

데이터 흐름 용어

DW 목적

데이터 구조화 전략

DW 비즈니스

FAQ

현재 시스템이 충분하지 않은가?

DW 가치는 무엇인가?

비용은 얼마나 소요될까?

구축 시간은 얼마나 소요되나?

무엇이 성공으로 이끄는가?

 

CHAPTER 2. 조직의 데이터

기업 자산

데이터의 맥락(Context)

데이터 품질

데이터 용어

데이터 구성요소

데이터 구성

데이터의 구조화

데이터 모델

데이터 아키텍처

경쟁우위

데이터 모델 구축 또는 구입

비즈니스 멘토링

 

CHAPTER 3. DW 구축하는 이유

플랫폼 마이그레이션

비즈니스 연속성

역공학

데이터 품질

병렬 환경

부가가치

DW 중앙집중화

법인합병

내부합병

중앙 디자인과 지역적 사용

데이터 마트 통합

새로운 계획

새로운 계획: 동적 보고

바로구축

데이터Floundation

DW 구축하지 말아야 이유

수준 낮은 데이터 품질

비즈니스의 관심 부족

후원의 부족

불분명한 목적

시스템에서의 자급자족

인력 부족

불안정한 환경

과도한 비용

관리 부재

 

CHAPTER 4. DW BI 전략

BI 전략

비즈니스 목적

비즈니스 사용

아키텍처 개요

DW 전략

사용

DW 아키텍처

데이터 흐름 아키텍처

기술 아키텍처

중점과 성공

전사 또는 사업부문?

중점 목표

성공: 언제 완료되는가?

어디서 시작할 것인가?

BI에서 시작

DW에서 시작

어떻게 시작할 것인가?

BI 관하여

DW 관하여

프로젝트 단계적 진행

얼마나 수행할 것인가?

주의 사항

일반적인 실패 이유

기본 가치

 

CHAPTER 5. 프로젝트 인력: 역할과 이에 대한 통찰

핵심 내용

프로젝트

고급 전문가

리더십

프로젝트 후원자

DW 임원

구조

경영층 후원

데이터 담당자

기본 인력

주기적인 점검: 감사의 진행

역량센터

 

CHAPTER 6. 상세 내용 개관

프로젝트 차터

프로젝트 범위

업무기술서

 

 

PART II. 구성요소

 

CHAPTER 7. BI: 데이터 마트와 사용

데이터를 모델 하는가?

데이터 모델의 종류

데이터 디자인

팩트 테이블

팩트의 종류

팩트 테이블의 종류

수치의 소스

팩트 테이블

팩트 테이블의 최소 단위

팩트 테이블 밀도

가상의 팩트 테이블

디멘션

디멘션 또는 수치

히스토리와 날짜

디멘션 테이블

디멘션의 단위

디멘션 속성의 소스와

디멘션의 종류

계층 구조 도움 테이블

프로파일 테이블

디멘션의

용량 산정(Sizing)

 

CHAPTER 8. 전사 데이터 모델

데이터 모델 개요

인먼과 킴벌

EDM 목적

EDM 장점

데이터 모델: 어디에서 시작할까

완전 하향식 데이터 모델

주제 영역 모델

개념 모델

엔티티 관계 모델 (ERD)

버스 아키텍처

구입된 데이터 모델

모델 통찰력

데이터 구성요소

데이터 모델 정규화

상위유형/하위유형(Supertype/subtype) 모델

정규화 데이터 모델에서 히스토리 저장

대체키

논리적 vs. 물리적 데이터 모델

참조 무결성 여부

다른 데이터 모델

입력 데이터 모델

스테이징 데이터 모델

최종 결론

 

CHAPTER 9. 데이터 웨어하우스 아키텍처: 구성요소

아키텍처 개요

설계자(아키텍터) 역할

솔루션 설계자

DW 설계자

기술 설계자

데이터 설계자

ETL 설계자

BI 설계자

개요

아키텍처 계층

단일 계층 아키텍처

고전적인 2계층 아키텍처

향상된 3계층 아키텍처

DW 아키텍처

단독 데이터 마트 아키텍처

버스 아키텍처

중앙 저장소 아키텍처

연합 아키텍처

구성요소( 계층)

데이터 소스

데이터 공급

데이터 조직

데이터 유통(분배)

정보 제공

구현 접근법

데이터 디자인과 데이터 흐름

논리적 vs. 물리적 모델

하향식 접근법

상향식 접근법

복합 접근법

촉진

데이터 획득 계층

중앙화된 데이터 계층

데이터 유통 계층

성능 계층

사용자 프레젠테이션 계층

방법론

격이 다른 솔루션(최고의 솔루션)

 

CHAPTER 10. ETL 데이터 품질

아키텍처

데이터 공급

데이터 유통

ETL 매핑

초기 증분 적재

ETL vs. ELT vs. ETTL

병렬 작업

ETL 역할

데이터 흐름 다이어그램

운영 데이터 저장소

소스 시스템

소스 없음

복수 소스

대체 소스(SIFs)

구조화되지 않은 데이터

데이터 프로파일링

데이터 저장

복수의 파일

파일 전환

안전전략

변환과 스테이징

준비

대체

참조 무결성

통합, 프로파일링, 요약

코드 테이블

적재

히스토리 vs. 노히스토리

입력/갱신/입력갱신/삭제

공급정보

적재 스케줄링

EDW 위한 스테이징 vs. 버스 아키텍처를 위한 스테이징

데이터 유통

3정규형에서 스타 스키마

데이터 품질

ETL

 

CHAPTER 11. 프로젝트 계획과 방법론

기본요인

위험 요소: 단계별 개발

위험 요소: 데이터 품질

위험 요소: 인력

위험 요소: 비용

변화관리

모범 사례

실수

프로젝트 계획 방법론

비즈니스 요구사항

전략과 계획

솔루션 개요

디자인

구축

배포

사용

 

 

PART III. 구축을 시작하자

 

CHAPTER 12. 구축 시나리오

셰프: 요리를 해보자!

하향식(기업 저장소)

용어

중앙화된 데이터 모델

데이터 아키텍처

소스

데이터 모델

데이터베이스

획득

솔루션 개요

상향식(OLAP 보고서)

최종 결과물

용어

데이터 아키텍처

맞춰진 디멘션 관리

소스

솔루션 개요

복합(정규화 디자인과 OLAP)

초기 구축

데이터 모델

데이터 아키텍처

솔루션 개요

병합

행동 계획

입력 없음: 구조화된 입력파일들

통합 단계 2

변화관리

DW 넘어서는 그림: 전사 정보 아키텍처(EIA)

 

CHAPTER 13. 데이터 관리

데이터 관리란 무엇인가?

정의

데이터 관리의 이유

조직 구조

감독 전략

데이터 관리: 핵심 요소

보안 민감성

데이터 품질

책임

변경 통제

데이터 관리 준비사항

 

CHAPTER 14. 프로젝트 이후 검토

개요

프로젝트 검토

다음 단계

 

 

 

이 책의 구성

 

 

파트 I: 준비

파트 I 비즈니스 인텔리전스와 데이터 웨어하우징에 대한 기본개념과 통찰력을 제공한다. 파트의 기본 목적은 관리 고려사항에 대한 기본적인 내용 소개이다.

 

1 데이터 웨어하우스와 비즈니스 인텔리전스 개관

1장은 비즈니스 인텔리전스와 데이터 웨어하우스의 개요를 제공하며 DW 시스템의 구현과 관련된 FAQ 마무리된다.

 

2 조직의 데이터

2장은 기업 자산으로서의 데이터와 조직화된 데이터에 대한 통찰력을 논의한다.

 

3 DW 구축하는 이유

3장에서는 DW 구축하거나 구축하지 않는 이유를 논의한다. DW 구축하는 이유로는 통상적인 DW 구축 시나리오에 대해 설명하며, 구축하지 않는 이유 부분에서는 조직의 문화와 제한사항 안에서 개발 프로젝트를 진행시키기 위한 능력을 이야기한다.

 

4 DW BI 전략

4장은 구축의 목적이 비즈니스 보고 솔루션을 위한 것인지 혹은 데이터 조직과 구조화 작업을 위한 것인지에 따라 프로젝트를 시작하는 방법에 대한 논의와 실천계획에 대한 통찰력을 제공한다.

 

5 프로젝트 인력: 역할과 이에 대한 통찰

5장은 DW 프로젝트 작업과 최선의 구조에 대한 핵심 역할을 논의한다.

 

6 상세 내용에 대한 개관

6장은 일반적인 프로젝트 차터, 프로젝트 범위, 업무기술서에 대한 간략한 개요를 제공한다.

 

파트 II: 구성요소

파트 II DW 시스템의 기본적인 구성요소를 설명한다. 파트의 핵심은 DW BI 시스템의 기술적인 측면에 더욱 친숙해지는 것이다. 파트는 기업 자산과 BI 구축을 지원하기 위한 DW 시스템의 통합을 논의한다.

 

7 BI: 데이터 마트와 사용

7장은 데이터 모델의 성능 고려사항에 대하여 데이터 마트와 사용에 관한 자세한 내용을 설명한다.

 

8 전사 데이터 모델

8장은 보편적인 문제와 요령에 대한 간단한 예제를 포함한 전사 데이터 모델링에 대하여 논의한다.

 

9 데이터 웨어하우스 아키텍처: 구성요소

9장은 데이터 모델링과 데이터 흐름 관점에서 서로 다른 유형의 DW 아키텍처에 대하여 논의한다.

 

10 ETL 데이터 품질

10장은 테이터 품질을 포함한 DW 시스템의 획득 계층과 유통(분배) 계층에 대한 일반론을 논의한다.

 

11 프로젝트 계획과 방법론

11장은 DW BI 프로젝트 계획 방법론을 논의한다.

 

파트 III: 구축을 시작하자

파트 III DW 시스템 구축에 대한 실용적인 관점을 제공한다. 파트는 일반적인 구축 시나리오와 데이터 관리 구축 이후에 대한 검토를 포함한다.

 

12 구축 시나리오

12장은 상향식, 하향식, 복합 방법론을 이용한 DW BI 시스템 구축을 논의하며 전사 정보 아키텍처와 같은 여러 다른 주제에 대하여 논의한다.

 

13 데이터 관리

13장은 조직 구조, 데이터 품질, 책임, 변화관리를 포함하는 전세 데이터 관리를 논의한다.

 

14 프로젝트 이후 검토

14장에서는 DW BI 프로젝트 개발 이후를 논의한다.

 

저자는 DW 시스템 구축을 위한 가이드로 사용될 있도록 이러한 내용을 모두 통합했다. 책의 목표는 오늘날 데이터 웨어하우징에서 발생하는 수많은 문제에 답변하고 다양한 관점의 통찰력을 소개하는 것이다. 책이 독자의 데이터 웨어하우징을 위한 노력에 도움이 되길 바란다

 

 

 

출판사 리뷰

 

 

많은 IT인들이 데이터 웨어하우스(Data Warehouse, DW)라는 말을 들었을 때 단지 OLTP와 반대되는 개념으로 쉽게 생

각한다. 하지만 DW IT가 비즈니스의 가치를 창출하는 가장 극적인 개념이다. 다양한 IT 현업 관계자들과의 미팅은 “그래서 결론이 뭐냐?”라는 질문으로 귀결되며, 서로 커뮤니케이션이 매끄럽지 않다며 답답해하는 경우가 많다. 이 책의 저자인 로버트 또한 이러한 맥락에서 책을 집필하게 되었음을 1장에서 밝힌다.

 

이 책에서는 IT가 고도화될수록 IT인들은 기술뿐만 아니라 비즈니스에 대한 감각이 있어야 함을 암시하며, 저자는 DW를 통해 이를 제시한다. 책에서 언급하듯이, DW에는 경험 많은 고급인력들이 참여해야 한다고 설명하면서도 주니어 레벨의 엔지니어들도 쉽게 이해할 수 있게 꾸며졌다. 다시 한 번 강조하지만 이 책은 DW를 구축하려는 현업 담당자나 DW 구축에 투입될 IT 인들에게 엄청나게 큰 도움을 줄 것이다.

 

관련글 더보기

댓글 영역