상세 컨텐츠

본문 제목

랄프 킴벌의 데이터 웨어하우스 툴킷

전체 출간 도서

by 비제이퍼블릭 2015. 6. 12. 12:12

본문

 

 

랄프 킴벌의 데이터 웨어하우스 툴킷

 

저자 랄프 킴벌, 마기 로스

역자 김현도, 류진수, 양재영, 양흥순, 오세중, 이영록, 전병욱, 정동식, 정현일, 하수곤

출판사 비제이퍼블릭

 

출간 2015629()

정가 36,000

페이지 624

판형 188*245

ISBN 978-89-94774- 98-5 (93000)

원서정보 The Data Warehouse Toolkit - Third Edition

 

 

책 소개

 

최신 내용으로 완벽하게 업데이트된

종합적인 다차원 모델링 가이드

 

The Date Warehouse Toolkit』 초판(1996)에서 랄프 킴벌이 다차원 모델링의 기법을 소개한 뒤, 다차원 모델링은 데이터 웨어하우스와 비즈니스 인텔리전스(DW/BI) 시스템에서 가장 널리 적용되는 방법론이 됐다. 그와 더불어 『The Date Warehouse Toolkit』은 다차원 모델링 기법과 패턴의 모범 사례의 결정판이 됐다.

 

『랄프 킴벌의 데이터 웨어하우스 툴킷』 은 고전적인 참고서로써 다차원 모델링 기법들을 정리해 제공하고 있다. 또한 새로운 통찰과 모범 사례들로 전체를 업데이트하여 다차원 모델 설계를 위한 명확한 가이드라인을 제공한다. 경험 많은 전문가뿐만 아니라 데이터 웨어하우스 신규 입문자도 만족할 수 있도록 쉽게 구성했다.

 

이 책의 모든 기법들은 저자의 DW/BI 설계 경험을 바탕으로 한 실제 사례 연구들로 설명되어 있다. 추가적으로, 킴벌 그룹의 공식적인 다차원 모델링 기법들을 별도로 요약해 하나의 장으로 만들었다. 또한 각 기법들마다 사례 연구를 쉽게 찾을 수 있도록 참조 페이지를 표시했다.

 

《랄프 킴벌의 데이터 웨어하우스 툴킷》은 다음의 내용을 포함한다.

 

- 디멘션과 팩트 테이블의 기초 및 고급 설계 기법

 - 소매업, 전자상거래, 고객관계관리(CRM), 조달, 재고, 주문관리, 회계, 인적자원관리(HR), 금융 서비스, 의료, 보험, 교육, 통신, 운송을 포함하는 14가지 사례 연구

- 12가지 사례 연구의 데이터 웨어하우스 버스 매트릭스 예제

- 다차원 모델링의 함정과 피해야 할 실수들

- 더욱 향상된 디멘션 이력 관리 기법(타입0부터 타입7까지)

- 가변 레벨 계층과 다중 값 속성을 위한 브리지 테이블

- 빅데이터 분석을 위한 모범 사례

- 비즈니스 이해관계자가 참여한 설계 워크숍 가이드라인

- 킴벌 DW/BI 프로젝트 생명주기 방법론

- ETL 시스템의 종합적인 설명과 설계 고려 사항

- 34개의 ETL 서브시스템과 디멘션, 팩트 테이블의 생성 기법

 

독자대상

중급

 

 

저자 소개

 

랄프 킴벌 Ralph Kimball

 

킴벌 그룹의 설립자이다. 스탠포드 대학에서 전기공학 박사 학위를 받았으며, 1980년대 중반 이후부터 DW BI 업계에서 선구자 역할을 하고 있다. 그는 수만 명의 IT전문가들을 교육해 왔으며 그와 그의 동료들이 쓴 툴킷 시리즈는 1996년 이래 업계의 베스트 셀러가 되었다. 이전에는 메타포에서 근무했으며 레드 브릭 시스템(Red Brick System)을 설립하고, 팔로알토 연구소(PARC Palo Alto Research Center)에서 윈도우, 아이콘, 마우스를 가진 최초의 상용 제품 스타 워크스테이션을 공동 개발했다.

 

마기 로스 Margy Ross

 

킴벌 그룹의 대표이다. 노스웨스턴 대학에서 산업공학 학사 학위를 받았으며, 비즈니스 요구 사항과 다차원 모델링에 중점을 두고 1982년부터 데이터 웨어하우징과 BI 분야에 주력하고 있다. 랄프 킴벌과 마찬가지로 수천 명에게 다차원 모델링에 대한 선진 사례를 강의했다. 또한 랄프 킴벌과 함께 5권의 툴킷 시리즈를 저술했다. 메타포에서 근무했으며 디시젼 웍스 컨설팅사를 공동 설립했다.

 

 

역자 소개

 

김현도

고려대학교 산업공학과 대학원을 졸업했다. 졸업 후 LG CNS에 입사해 BI/DW 관련 공공/은행/카드/통신 사업에 참여하여 개발부터 대형 정보계 사업의 PM까지 수행하였다.

 

류진수

인하대 공과대학과 경영대학원을 졸업했다. 2003 LG CNS에 입사하여 DWBI 프로젝트 및 빅데이터 관련 업무를 담당하고 있다.

 

양재영

조지아 공대에서 컴퓨터과학 석사 학위를 받았다. 1996년부터 LG CNS에서 데이터 웨어하우스, 비즈니스 인텔리전스 등에 대한 연구 개발 및 구축 프로젝트를 수행하고 있다.

 

양흥순

다우기술에서 RDBMS Unix 기반의 인프라 아키텍처를 설계/구축했다.  LG CNS에서 시스템통합(SI) 프로젝트를 담당했다. 현재는 빅데이터 기술을 전통적인 DW에 적용하는 프로젝트를 수행하고 있다.

 

오세중

홍익대학교 및 동 대학원에서 컴퓨터공학 및 전자계산학을 전공했다. 현재 LG CNS에서 빅데이터 관련 업무를 담당하고 있다.

 

이영록

LG CNS에서 17년째 BI/DW, 빅데이터 관련 업무을 수행하고 있다. 지금은 LG Display에서 DW Renewal을 위한 아키텍처 업무를 수행하고 있다.

 

전병욱

포항공대에서 생명과학을 전공했다. 현재 CNS에서 DW/BI 및 빅데이터 관련 업무를 담당하고 있다.

 

정동식

LG CNS에서 20여년간 국내와 해외의 제조, 금융, 등 다양한 산업영역에서 데이터 웨어하우스, 비즈니스 인텔리전스, 빅데이터 분석, CRM, SCM에 관련된 컨설팅, 아키텍처 정의 및 시스템 구축을 수행하고 있다.

 

정현일

LG CNS에서 빅데이터 구축 사업을 수행 중이며96 LG CNS 입사 이후 국민은행, 동부화재, 건강보험공단, 국민연금공단 등에서 DW 구축 사업을 수행했다.

 

하수곤

CNS에서 16년째 근무 중이며, DW/BI 분야의 솔루션 컨설턴트로 활동 중이다. DW/BI 시스템 성능 관리, 통합 메타데이터 리포지토리 및 BI 포털 분야의 전문가이다.

 

 

목차

 

1. 데이터 웨어하우징, 비즈니스 인텔리전스, 다차원 모델링 입문

 

- 데이터 수집과 데이터 분석이라는 서로 다른 세계

- 데이터 웨어하우스와 비즈니스 인텔리전스의 목표

- 다차원 모델링 소개

- 킴벌의 DW/BI 아키텍처

- 대안적 DW/BI 아키텍처

- 다차원 모델링에 대한 오해

- 다차원적으로 생각해야 하는 더 많은 이유

- 애자일 고려사항

- 요약  

 

2. 킴벌 다차원 모델링 기법 개요

 

- 기본 개념

- 팩트 테이블 기본 기법

- 디멘션 테이블 기본 기법

- 표준 디멘션을 통한 통합

- 디멘션 이력 관리(SCD, Slowly Changing Dimension) 속성 다루기

- 디멘션 계층 다루기

- 고급 팩트 테이블 기법

- 디멘션 고급기법

- 특수 목적 스키마

 

3. 소매업

 

- 다차원 모델을 설계하는 4단계 절차

- 소매업 사례 연구

- 디멘션 테이블 상세

- 소매업 모델 적용하기

- 소매 다차원 모델의 확장성

- 팩트 없는 팩트 테이블

- 디멘션과 팩트 테이블의 키

- 정규화 회피하기

- 요약

 

4. 재고

 

- 가치 사슬 소개

- 재고 모델

- 팩트 테이블 유형

- 가치 사슬 통합

- 전사적 데이터 웨어하우스 버스 아키텍처

- 표준 디멘션

- 표준 팩트

- 요약

 

5. 조달

 

- 조달 사례 연구

- 조달 트랜잭션과 버스 매트릭스

- 디멘션 이력 관리 개요

- 하이브리드 디멘션 이력 관리 기법

- 디멘션 이력 관리 요약

- 요약

 

6. 주문관리

 

- 주문관리 버스 매트릭스

- 주문 트랜잭션

- 송장 트랜잭션

- 주문처리 파이프라인을 위한 점진적 스냅샷

- 요약

 

7. 회계

 

- 회계 사례 연구와 버스 매트릭스

- 총계정원장 데이터

- 예산 프로세스

- 디멘션 속성 계층

- 통합 팩트 테이블

- OLAP과 패키지 분석 솔루션의 역할

- 요약

 

8. 고객관계관리

 

- 고객관계관리 개요

- 고객 디멘션 속성

- 다중 값 디멘션을 위한 브리지 테이블

- 복잡한 고객 행동 분석

- 고객 데이터 통합 방안

- 실시간 분석 요건 고려 사항

- 요약

 

9. 인적자원관리

 

- 직원 프로파일 추적

- 직원수에 대한 주기적 스냅샷

- HR 프로세스 버스 매트릭스

- 패키지화된 분석 솔루션과 데이터 모델

- 재귀적 직원 계층  

- 다중 값 스킬 키워드 속성

- 설문조사 데이터

- 요약

 

10. 재무 서비스

 

- 은행 사례연구와 버스 메트릭스

- 너무 적은 디멘션을 피하기 위한 디멘션 세분화

- 이기종 상품을 위한 슈퍼타입과 서브타입 스키마

- 핫 스와퍼블 디멘션

- 요약

 

11. 통신

 

- 통신 사례 연구와 버스 매트릭스

- 설계 검토 시 일반적 고려 사항

- 설계 검토 가이드라인

- 설계 초안에 대한 논의

- 기존 데이터 구조의 재설계

- 지리적 위치 디멘션

- 요약

 

12. 운송

 

- 항공사 사례 연구와 버스 매트릭스

- 다른 산업으로의 확장

- 상호 연관 있는 디멘션들 결합하기

- 일자와 시간에 대한 더 많은 고려

- 현지화 개요

- 요약

 

13. 교육

 

- 대학 사례 연구와 버스 매트릭스

- 점진적 스냅샷 팩트 테이블

- 팩트 없는 팩트 테이블

- 그 외의 교육 관련 분석 기회

- 요약

 

14. 의료

 

- 의료산업 사례 연구와 버스 매트릭스

- 청구 및 지불 요청

- 전자 의무 기록

- 시설 및 장비 사용률

- 소급 변경 관리

- 요약

 

15. 전자상거래

 

- 클릭스트림 원천 데이터

- 클릭스트림 다차원 모델

- 클릭스트림을 웹 기반 소매점의 버스 매트릭스와 통합하기

- 웹을 포함한 채널 간의 수익성

- 요약

 

16. 보험

 

- 보험 업무 사례 연구

- 보험 트랜잭션

- 보험료 주기적 스냅샷 팩트 테이블

- 보험 사례 연구 배경 추가 설명

- 보상 트랜잭션 데이터

- 보상 점진적 스냅샷

- 보험/보상 통합 주기적 스냅샷

- 팩트 없는 사고 이벤트

- 다차원 모델링에서 흔히 하는 실수들

- 요약

 

17. 킴벌 DW/BI 생명주기 개요

 

- 생명주기 로드맵

- 생명주기 착수 활동

- 생명주기 기술 트랙

- 생명주기 데이터 트랙

- BI 애플리케이션 트랙의 생명주기

- 생명주기 마무리 활동

- 일반 함정 피하기

- 요약

 

18. 다차원 모델링 프로세스와 태스크

 

- 모델링 프로세스 개요

- 조직 구성하기

- 다차원 모델 설계하기

- 요약

 

19. ETL 서브시스템과 기법들

 

- 요구 사항 수집

- 34개의 ETL 서브시스템

- 추출: 데이터 웨어하우스로 데이터를 가져 오는 것

- 데이터 정제와 표준화

- 데이터 변환/적재: 프레젠테이션 계층을 위한 준비

- ETL 환경 관리

- 요약

 

20. ETL 시스템 설계와 개발프로세스 및 태스크

 

- ETL 프로세스 개요

- ETL 계획 수립

- 초기 적재 프로세스 개발

- 변경 ETL 프로세스 개발

- 실시간 구현

- 요약

 

21. 빅데이터 분석

- 빅데이터 현황 요약

- 빅데이터 우수 사례

- 요약

 

 

출판사 리뷰

 

이 책은 업무를 설명하는 삽화와 사례 연구 시리즈로 구성되었다. 저자는 예제를 통해 설계 기법을 배우는 것이 구체적인 지침과 실제 경험을 전달하는 가장 효과적인 방법이라고 믿고 많은 예제들을 제공한다. 실제 애플리케이션 프로그램이나 산업 솔루션을 목적으로 하지는 않더라도, 이 예제들은 다차원 모델링에서 나타나는 패턴들을 논하는 프레임워크 역할을 한다. 저자는 자신의 경험상 스스로 친숙한 비즈니스로부터 한 발 떨어졌을 때 설계 기법의 핵심 요소를 익히기가 더 쉽다고 말한다.

 

2장에서는 사례 연구가 아닌 킴벌 다차원 모델링 기법의 개요를 소개한다. 킴벌 그룹에 의해 발명된 다차원 모델링 기법이 광범위하게 업계에 수용된 점을 감안하여 간결한 설명과 좀 더 자세한 적용 범위, 그리고 뒷장에서 이 기법들의 실례와 함께 저자들의 기법들을 공인된 목록으로 제공한다. 2장은 다른 장들처럼 처음부터 끝까지 읽을 필요는 없지만, 이 기술중심의 장은 유용한 참조 자료이자 DW/BI설계자를 위한 전문 체크 리스트로도 활용될 수 있을 것으로 예상한다.

 

2장을 제외하면 이 책의 다른 장은 서로 개별적으로 구성되어 있다. 이 책은 기본개념으로 시작해서 좀 더 고급내용을 소개한다. 독자들은 각 장을 앞에서부터 순서대로 읽어야 한다. 예를 들어 앞 부분에 있는 소매, 조달, 주문관리, CRM의 장들을 읽지 않는다면 16장의 보험을 이해하기 어려울 것이다.

 

이 책의 대상 독자

 

이 책은 DW/BI설계자, 개발자, 관리자를 독자로 한다. 추가적으로, DW/BI 이니셔티브에 적극적으로 참여하는 비즈니스 분석가와 데이터 담당자에게 유용한 내용이 될 것이다.

 

관련글 더보기

댓글 영역