데이터 웨어하우스 멘토
부제 실용적 DW/BI 시스템 구축을 위한 통찰
저자 로버트 라베르지
역자 장효성
출간일: 2013년 3월 14일 (목)
정가: 30,000원
페이지: 427
판형: 190 x 245
ISBN: 978-89-94774-32-9 (93560)
원서정보: The Data Warehouse Mentor: Practical Data Warehouse and Business Intelligence Insights
책 소개
사용 목적에 맞는 데이터 웨어하우스과 비즈니스 인텔리전스
아키텍처 구축하기
전문 개발자와 트레이너들의 상세한 안내와 모범사례를 통해 회사 전반에 걸쳐 사용자의 선택의 폭을 넓히고 의사결정을 더욱 합리적으로 이끌어내자. 《데이터 웨어하우스 멘토: 실용적 DW/BI 시스템 구축을 위한 통찰》은 통합된 DW/BI 솔루션의 시작부터 끝까지, 계획하고 디자인하고 구축하고 관리하는 방법을 보여준다. 이 책을 통해 적절한 구성요소를 선택하고, 기업 데이터 모델을 구축하고, 데이터 마트와 데이터 웨어하우스를 구성하고, 데이터 흐름을 확립하고 위험을 완화하는 방법에 대해 배워보자. 이 책은 또한 변경관리, 데이터 거버넌스, 보안관리에 대해서도 폭넓게 다루고 있다.
이 책에서 다루는 내용:
- BI와 DW 시스템의 구성요소에 대해 이해하기
- 프로젝트의 목표를 확립하고 효율적인 개발 계획 시행하기
- 데이터 마이닝을 이용하여 회사의 트랜잭션에 대한 통찰력 획득하기
- ETL(Extract: 추출, Transform: 변환, Load: 적재) 테크닉을 이용하여 데이터의 입력, 수정, 표준화
달성하기
- 데이터 요구사항을 정의하기 위해 구조화된 입력 파일 사용하기
- 상향식(top-down), 하향식(bottom-up)의 복합 디자인 방법론 활용하기
- 데이터 관리 툴을 이용하여 최적화된 성능과 보안 통제하기
독자 대상
초중급
저자소개
로버트 라베르지
여러 인터넷 벤처 회사의 설립자이며 DW와 BI 솔루션에 포커스를 맞추고 있는 IBM 산업 자산 산업 모델 연구실 수석 컨설턴트다. 밥은 빌 게이츠가 겨우 백만장자였을 때인 70년대 후반에 경력을 시작했고, 개발자, DBA, 데이터 모델러, 프로젝트 관리자, 데이터 설계자, 전사 정보 설계자, DW/BI 감사관으로 근무했으며 혁신적인 기업의 전략가이기도 했다. 이후 최적화, 모범 사례, 개념적인 지식, 디자인을 통한 논리적/물리적 수준의 DW와 BI 구현의 시연, 멘토링, 교육을 위하여 전 세계를 여행했다. 밥은 소매, 보험, 의료, 철도, 통신, 공공, 온라인 사업, 금융 분야 전반에 걸쳐 50개 이상의 기업에서 성공적으로 프로젝트를 수행하였다. 밥은 영국의 더럼(Durham) 대학에서 경영학 석사 학위를 취득하였다.
역자소개
장효성
2007년 SK C&C에 입사하여 DBA로 첫 업무를 시작하였으며, 현재 인프라 서비스 팀에서 Oracle Database 성능 진단/튜닝 및 Trouble shooting 업무를 수행한다. 다양한 인더스트리의 DB 성능 분석 패턴을 연구하며 Oracle DB 성능 진단/분석 사내강사다. 저서에 《오라클 AWR을 이용한 고성능 데이터베이스》(공저)가 있다.
목차
PART I. 준비
CHAPTER 1. 데이터 웨어하우스와 비즈니스 인텔리전스 개관
비즈니스 인텔리전스 개요
정의
BI의 가치
비즈니스와 인텔리전스의 분리
BI 성공 요소
BI의 목적
BI 사용자 프레젠테이션
BI 툴과 아키텍처
세계화에 따른 발전
DW 개요
정의
데이터 웨어하우스 시스템
DW 아키텍처
데이터 흐름 용어
DW 목적
데이터 구조화 전략
DW 비즈니스
FAQ
현재 시스템이 충분하지 않은가?
DW의 가치는 무엇인가?
비용은 얼마나 소요될까?
구축 시간은 얼마나 소요되나?
무엇이 성공으로 이끄는가?
CHAPTER 2. 조직의 데이터
기업 자산
데이터의 맥락(Context)
데이터 품질
데이터 용어
데이터 구성요소
데이터 구성
데이터의 구조화
데이터 모델
데이터 아키텍처
경쟁우위
데이터 모델 구축 또는 구입
비즈니스 멘토링
CHAPTER 3. DW를 구축하는 이유
플랫폼 마이그레이션
비즈니스 연속성
역공학
데이터 품질
병렬 환경
부가가치
DW 중앙집중화
법인합병
내부합병
중앙 디자인과 지역적 사용
데이터 마트 통합
새로운 계획
새로운 계획: 동적 보고
“바로구축”
데이터 “Floundation”
DW를 구축하지 말아야 할 이유
수준 낮은 데이터 품질
비즈니스의 관심 부족
후원의 부족
불분명한 목적
현 시스템에서의 자급자족
인력 부족
불안정한 환경
과도한 비용
관리 부재
CHAPTER 4. DW와 BI 전략
BI 전략
비즈니스 목적
비즈니스 사용
아키텍처 개요
DW 전략
사용
DW 아키텍처
데이터 흐름 아키텍처
기술 아키텍처
중점과 성공
전사 또는 사업부문?
중점 목표
성공: 언제 완료되는가?
어디서 시작할 것인가?
BI에서 시작
DW에서 시작
어떻게 시작할 것인가?
BI 관하여
DW에 관하여
프로젝트 단계적 진행
얼마나 수행할 것인가?
주의 사항
일반적인 실패 이유
기본 가치
CHAPTER 5. 프로젝트 인력: 역할과 이에 대한 통찰
핵심 내용
프로젝트 팀
고급 전문가
리더십
프로젝트 후원자
DW 임원
팀 구조
경영층 후원
데이터 담당자
기본 인력
주기적인 점검: 감사의 진행
역량센터
CHAPTER 6. 상세 내용 개관
프로젝트 차터
프로젝트 범위
업무기술서
PART II. 구성요소
CHAPTER 7. BI: 데이터 마트와 사용
왜 데이터를 모델 하는가?
데이터 모델의 종류
데이터 디자인
팩트 테이블
팩트의 종류
팩트 테이블의 종류
수치의 소스
팩트 테이블 키
팩트 테이블의 최소 단위
팩트 테이블 밀도
가상의 팩트 테이블
디멘션
디멘션 또는 수치
히스토리와 날짜
디멘션 테이블 키
디멘션의 단위
디멘션 속성의 소스와 값
디멘션의 종류
계층 구조 및 도움 테이블
프로파일 테이블
디멘션의 수
용량 산정(Sizing)
CHAPTER 8. 전사 데이터 모델
데이터 모델 개요
인먼과 킴벌
EDM 목적
EDM의 장점
데이터 모델: 어디에서 시작할까
완전 하향식 데이터 모델
주제 영역 모델
개념 모델
엔티티 관계 모델 (ERD)
버스 아키텍처
구입된 데이터 모델
모델 통찰력
데이터 구성요소
데이터 모델 정규화
상위유형/하위유형(Supertype/subtype) 모델
정규화 데이터 모델에서 히스토리 저장
대체키
논리적 vs. 물리적 데이터 모델
참조 무결성 여부
다른 데이터 모델
입력 데이터 모델
스테이징 데이터 모델
최종 결론
CHAPTER 9. 데이터 웨어하우스 아키텍처: 구성요소
아키텍처 개요
설계자(아키텍터) 역할
솔루션 설계자
DW 설계자
기술 설계자
데이터 설계자
ETL 설계자
BI 설계자
개요
아키텍처 계층
단일 계층 아키텍처
고전적인 2계층 아키텍처
향상된 3계층 아키텍처
DW 아키텍처
단독 데이터 마트 아키텍처
버스 아키텍처
중앙 저장소 아키텍처
연합 아키텍처
구성요소(각 계층)
데이터 소스
데이터 공급
데이터 조직
데이터 유통(분배)
정보 제공
구현 접근법
데이터 디자인과 데이터 흐름
논리적 vs. 물리적 모델
하향식 접근법
상향식 접근법
복합 접근법
촉진
데이터 획득 계층
중앙화된 데이터 계층
데이터 유통 계층
성능 계층
사용자 프레젠테이션 계층
방법론
격이 다른 솔루션(최고의 솔루션)
CHAPTER 10. ETL과 데이터 품질
아키텍처
데이터 공급
데이터 유통
ETL 매핑
초기 및 증분 적재
ETL vs. ELT vs. ETTL
병렬 작업
ETL 역할
데이터 흐름 다이어그램
운영 데이터 저장소
소스 시스템
소스 없음
복수 소스
대체 소스(SIFs)
구조화되지 않은 데이터
데이터 프로파일링
데이터 저장
복수의 큰 파일
파일 전환
안전전략
변환과 스테이징
준비
대체 키
참조 무결성
통합, 프로파일링, 요약
코드 테이블
적재
히스토리 vs. 노히스토리
입력/갱신/입력갱신/삭제
공급정보
적재 스케줄링
EDW를 위한 스테이징 vs. 버스 아키텍처를 위한 스테이징
데이터 유통
제3정규형에서 스타 스키마
데이터 품질
ETL 툴
CHAPTER 11. 프로젝트 계획과 방법론
기본요인
위험 요소: 단계별 개발
위험 요소: 데이터 품질
위험 요소: 인력
위험 요소: 비용
변화관리
모범 사례
실수
프로젝트 계획 방법론
비즈니스 요구사항
전략과 계획
솔루션 개요
디자인
구축
배포
사용
PART III. 구축을 시작하자
CHAPTER 12. 구축 시나리오
셰프: 요리를 해보자!
하향식(기업 저장소)
용어
중앙화된 데이터 모델
데이터 아키텍처
소스
데이터 모델
데이터베이스
획득
솔루션 개요
상향식(OLAP 보고서)
최종 결과물
용어
데이터 아키텍처
맞춰진 디멘션 관리
소스
솔루션 개요
복합(정규화 디자인과 OLAP)
초기 구축
데이터 모델
데이터 아키텍처
솔루션 개요
병합
행동 계획
입력 없음: 구조화된 입력파일들
통합 단계 2
변화관리
DW를 넘어서는 큰 그림: 전사 정보 아키텍처(EIA)
CHAPTER 13. 데이터 관리
데이터 관리란 무엇인가?
정의
데이터 관리의 이유
조직 구조
감독 및 전략
데이터 관리: 핵심 요소
보안 및 민감성
데이터 품질
책임
변경 통제
데이터 관리 준비사항
CHAPTER 14. 프로젝트 이후 검토
개요
프로젝트 검토
다음 단계
이 책의 구성
파트 I: 준비
파트 I은 비즈니스 인텔리전스와 데이터 웨어하우징에 대한 기본개념과 통찰력을 제공한다. 이 파트의 기본 목적은 관리 고려사항에 대한 기본적인 내용 소개이다.
1장 데이터 웨어하우스와 비즈니스 인텔리전스 개관
1장은 비즈니스 인텔리전스와 데이터 웨어하우스의 개요를 제공하며 DW 시스템의 구현과 관련된 FAQ로 마무리된다.
2장 조직의 데이터
2장은 기업 자산으로서의 데이터와 조직화된 데이터에 대한 통찰력을 논의한다.
3장 DW를 구축하는 이유
3장에서는 DW를 구축하거나 구축하지 않는 이유를 논의한다. DW를 구축하는 이유로는 통상적인 DW 구축 시나리오에 대해 설명하며, 구축하지 않는 이유 부분에서는 조직의 문화와 제한사항 안에서 개발 프로젝트를 진행시키기 위한 능력을 이야기한다.
4장 DW와 BI 전략
4장은 구축의 목적이 비즈니스 보고 솔루션을 위한 것인지 혹은 데이터 조직과 구조화 작업을 위한 것인지에 따라 프로젝트를 시작하는 방법에 대한 논의와 그 실천계획에 대한 통찰력을 제공한다.
5장 프로젝트 인력: 역할과 이에 대한 통찰
5장은 DW 프로젝트 작업과 최선의 팀 구조에 대한 핵심 역할을 논의한다.
6장 상세 내용에 대한 개관
6장은 일반적인 프로젝트 차터, 프로젝트 범위, 업무기술서에 대한 간략한 개요를 제공한다.
파트 II: 구성요소
파트 II는 DW 시스템의 기본적인 구성요소를 설명한다. 이 파트의 핵심은 DW와 BI 시스템의 기술적인 측면에 더욱 친숙해지는 것이다. 이 파트는 기업 자산과 BI 구축을 지원하기 위한 DW 시스템의 통합을 논의한다.
7장 BI: 데이터 마트와 사용
7장은 데이터 모델의 성능 고려사항에 대하여 데이터 마트와 그 사용에 관한 자세한 내용을 설명한다.
8장 전사 데이터 모델
8장은 보편적인 문제와 요령에 대한 간단한 예제를 포함한 전사 데이터 모델링에 대하여 논의한다.
9장 데이터 웨어하우스 아키텍처: 구성요소
9장은 데이터 모델링과 데이터 흐름 관점에서 서로 다른 유형의 DW 아키텍처에 대하여 논의한다.
10장 ETL과 데이터 품질
10장은 테이터 품질을 포함한 DW 시스템의 획득 계층과 유통(분배) 계층에 대한 일반론을 논의한다.
11장 프로젝트 계획과 방법론
11장은 DW와 BI 프로젝트 계획 방법론을 논의한다.
파트 III: 구축을 시작하자
파트 III은 DW 시스템 구축에 대한 실용적인 관점을 제공한다. 이 파트는 일반적인 구축 시나리오와 데이터 관리 및 구축 이후에 대한 검토를 포함한다.
12장 구축 시나리오
12장은 상향식, 하향식, 복합 방법론을 이용한 DW와 BI 시스템 구축을 논의하며 전사 정보 아키텍처와 같은 여러 다른 주제에 대하여 논의한다.
13장 데이터 관리
13장은 조직 구조, 데이터 품질, 책임, 변화관리를 포함하는 전세 데이터 관리를 논의한다.
14장 프로젝트 이후 검토
14장에서는 DW와 BI 프로젝트 개발 이후를 논의한다.
저자는 DW 시스템 구축을 위한 가이드로 사용될 수 있도록 이러한 내용을 모두 통합했다. 이 책의 목표는 오늘날 데이터 웨어하우징에서 발생하는 수많은 문제에 답변하고 다양한 관점의 통찰력을 소개하는 것이다. 이 책이 독자의 데이터 웨어하우징을 위한 노력에 도움이 되길 바란다
출판사 리뷰
많은 IT인들이 데이터 웨어하우스(Data Warehouse, DW)라는 말을 들었을 때 단지 OLTP와 반대되는 개념으로 쉽게 생
각한다. 하지만 DW는 IT가 비즈니스의 가치를 창출하는 가장 극적인 개념이다. 다양한 IT 현업 관계자들과의 미팅은 “그래서 결론이 뭐냐?”라는 질문으로 귀결되며, 서로 커뮤니케이션이 매끄럽지 않다며 답답해하는 경우가 많다. 이 책의 저자인 로버트 또한 이러한 맥락에서 책을 집필하게 되었음을 1장에서 밝힌다.
이 책에서는 IT가 고도화될수록 IT인들은 기술뿐만 아니라 비즈니스에 대한 감각이 있어야 함을 암시하며, 저자는 DW를 통해 이를 제시한다. 책에서 언급하듯이, DW에는 경험 많은 고급인력들이 참여해야 한다고 설명하면서도 주니어 레벨의 엔지니어들도 쉽게 이해할 수 있게 꾸며졌다. 다시 한 번 강조하지만 이 책은 DW를 구축하려는 현업 담당자나 DW 구축에 투입될 IT 인들에게 엄청나게 큰 도움을 줄 것이다.
실전 SQL Server MVP 53 & 61 (0) | 2013.03.04 |
---|---|
하루 한 시간, HTML5 모바일 앱 프로그래밍 (0) | 2013.02.22 |
해커의 언어, 치명적 파이썬 (2) | 2013.02.13 |
댓글 영역