데이터가 보인다

: 원리로 깨우치는 데이터 분석 기법

 

저자 히라이 아키오, 오카야스 유이치

역자 진명조

출간일 20131213()

정가 20,000

페이지 305

판형 150 * 210

ISBN 978-89-94774-53-4 (93000)

원서정보 分析基本業務

 

 

책 소개

 

윤곽을 파악하고 업무에 활용한다!

— 데이터 과학자와 분석가가 알아야 할 데이터 분석의 기초와 활용

 

요즘 IT 관련 매체뿐만 아니라 일반 미디어에서도 「빅데이터」라는 말이 거론되고 있다. 다만, 빅데이터의 존재 자체가 중요해서 일반 미디어에서도 거론되는 것은 아니다. 빅데이터가 정도로 주목 받게 배경에는 이를 분석해서 얻어지는 새로운 지식, 그리고 이를 기반으로 고안된 새로운 서비스가 앞으로의 사회를 변화시키지 않을까라는 기대감 때문이다. , 빅데이터가 분석되어 이제 도움이 되고 있는 것이다.

 

그렇다면 빅데이터를 분석하기 위기 위한 방법, 분석 시스템의 기반이 되는 기술이 최근에야 등장했는가라고 생각할 있지만, 결코 그렇지는 않다. 대부분은 빅데이터의 등장 이전부터 존재해서 활용되어온 것들이다.

 

그리고 빅데이터 분석이나 분석 시스템 구축에 직접적으로 관련이 없는 사람들에게도 이러한 방법이나 기술은 업무 또는 경영을 수행하면서 앞으로 더욱 중요해질 것이다. 반대로 말하면, 데이터 분석이나 데이터 분석 시스템의 내용에 대한 이해는 이미 일반적인 지식이 되어가고 있다는 것이다.

 

이 책은 이러한 데이터 분석 방법과 분석 시스템의 기반기술을 일반인도 이해할 있게 설명하는 것을 목적으로 집필되었다.

 

1장에서는 데이터 분석 방법과 분석 시스템의 기반기술의 전체 모습을, 2장에서는 데이터 분석의 기초지식을, 3~6장은 데이터 분석의 기본적인 방법을, 7~9장은 분석 시스템의 기반기술을 IT 전문지식이나 통계분석에 대한 지식이 없는 사람도 이해할 있도록 설명하고 있다. 또한 마지막으로 10장에서는 현재 크게 주목 받고 있는 빅데이터의 개념과 분석을 뒷받침하는 최신 시스템 기반기술을 다루고 있다.

 

 

독자대상

 초중급

저자들은 데이터 분석 방법과 분석 시스템의 기반 기술을 일반인도 이해할 수 있게 설명하는 것을 목적으로 이 책을 집필했다.

 

 

 

이 책의 구성

 

1. 데이터 분석의 개요

정보시스템이 보급, 발전되면서 비즈니스 환경에 따라 방대한 데이터를 얻을 수 있게 되고 이러한 데이터를 활용하기 위해 다양한 데이터 분석 방법이 사용되고 있다.

 

2. 데이터 분석의 기초지식

데이터 분석에는 기하평균, 조화평균, 가중평균 등 다양한 평균이나 도수분포, 정규분포, 표준편차 등의 분포·편차를 사용한다. 이 장에서는 이들에 대한 이론을 예제와 함께 설명한다.

 

3. 상관관계와 회귀 분석

이 장에서는 데이터 또는 속성값 사이의 다양한 상관관계를 수치화하고 분석하는 툴을 소개한다.

 

4. 시계열 분석

이 장에서는 시간 경과에 따른 실적이나 경향의 변화를 분석하는 데 사용하는 툴과 방법론을 소개한다.

 

5. 다차원 분석

이 장에서는 분석 대상이 되는 수치를 복수의 단면으로 분석하는 다차원 분석의 개요와 이용 방법을 소개한다.

 

6. 시뮬레이션

이 장에서는 데이터의 속성이나 값을 시뮬레이션하는 What-If 분석, 선형 계획법 등을 소개한다.

 

7. 데이터 마이닝

이 장에서는 대량의 데이터에서 보이지 않는 관련성이나 경향을 찾아내는 데이터 마이닝을 소개한다.

 

8. 비즈니스 인텔리전스

BI에서는 기업의 업무를 PDCA 사이클의 단계별로 분석하고 활용하기 쉬운 형태로 제공한다.

 

9. 데이터 웨어하우스

BI 툴을 이용한 분석에서는 이용 가능한 데이터를 저장하는 데이터 웨어하우스를 이용한다.

 

10. 데이터 분석의 미래

현재, 데이터 분석이 예전보다 더 주목 받고 있는 배경에는 SNS, 휴대전화, 스마트폰, IC 카드의 보급에 따라 활용되기 시작한 빅데이터라는 존재가 있다.

 

 

저자소개

 

히라이 아키오

소프트웨어 벤더 및 컨설팅 회사에서 20년 이상에 걸쳐 컨설팅과 경영관리를 담당했다. 현재는 IT 기업의 신규사업 도입, 사업 재편을 지원함과 동시에 데이터 분석에 관한 강연, 집필 활동을 하고 있다. 저서로는 『BI시스템 구축 실전입문』(번영사), 『불황에 지지 않는 Excel 데이터 분석 기법』(번영사), 『데이터 분석을 못하는 사원은 필요 없다』(크로스미디어 퍼블리싱) 등이 있다.

 

오카야스 유이치

그룹사 지원 시스템 개발 회사 및 컨설팅 회사에서 10년 이상에 걸쳐 시스템 개발, 영업, 사업운영을 담당했다. 현재는 교육관련 벤처기업에서 신규 서비스 도입을 맡고 있다.

 

 

역자소개

 

진명조

㈜오늘과내일 연구소의 책임연구원을 거쳐 현재는 씨디네트웍스에서 근무하고 있다. 옮긴 책으로는 『프로세서를 지탱하는 기술』(제이펍), 『대규모 서비스를 지탱하는 기술』(제이펍), 『클라우드의 충격』(제이펍), 『서버/인프라를 지탱하는 기술』(제이펍), DEBUG HACKS(와우북스), 『입문자를 위한 루비』(아이티씨), Binary Hacks(아이티씨), C언어로 배우는 알고리즘 입문』(한빛미디어) 등이 있다. IT 산업의 미시적인 영역과 거시적인 영역을 아우르는 통찰력을 갖게 되기를 꿈꾸고 있고, 최근 모바일 생태계를 향해 작은 보폭으로 한걸음씩 내딛고 있다.

 

 

목차

 

1. 데이터 분석의 개요

1.1 데이터 분석의 개념

__데이터 분석이란 무엇인가?

 

1.2 데이터 분석 시스템의 구성 요소

__데이터 분석을 실현하는 다양한 IT 기술

 

 

2. 데이터 분석의 기초 지식

 

2.1 기하평균

__기업의 성장성 분석

 

2.2 조화평균

__프로그램 개발 생산성 분석

 

2.3 가중평균

__주식의 기대수익률 분석

 

2.4 도수분포와 히스토그램

__점포 방문객수 분석

 

2.5 분산과 표준편차

__생산 리드타임 분석

 

2.6 정규분포와 표준정규분포

__재고의 발주점 계산

 

 

3. 상관관계와 회귀 분석

 

3.1 산포도와 버블차트

__재고의 편향을 분석한다

 

3.2 상관계수

__추천상품을 분석한다

 

3.3 회귀 분석

__가격탄력성을 분석한다

 

3.4 결정계수

__앙케이트 결과에서 반복구매 고객을 찾는다

 

 

4. 시계열 분석

 

4.1 Z 차트

__사업부별 매출경향을 분석한다

 

4.2 차트

__성장률이 높은 상품을 분석한다

 

4.3 지수평활법

__재고 수요를 예측한다

 

4.4 이동평균법

__장래 유망한 사업 찾기

 

 

5. 다차원 분석

 

5.1 다차원 분석

__매출전망을 확실도 관점에서 분석한다

 

5.2 RFM 분석

__고객을 그룹화해서 분석한다

 

5.3 세그먼트그룹별 손익분석

__기업의 업적을 다각적으로 분석한다

 

 

6. 시뮬레이션

 

6.1 What-If 분석

__손익분기점을 시뮬레이션한다

 

6.2 선형 계획법

__매출을 최대로 하는 생산계획을 세운다

 

6.3 주성분 분석

__앙케이트 응답을 분류한다

 

 

7. 데이터 마이닝

 

7.1 데이터 마이닝이란?

__손익분기점을 시뮬레이션한다

 

7.2 어소시에이션

__동시에 발생하는 현상을 분석한다

 

7.3 시퀀스

__다음 행동을 예측한다

 

7.4 클러스터

__카테고리를 검출한다

 

7.5 디시전 트리

__주요한 영향원을 분석한다

 

 

8. 비즈니스 인텔리전스

 

8.1 PDCA 사이클과 BI

__단계별로 다른 BI 목적

 

8.2 PLAN 단계에서의 BI

__계획의 근거를 얻는다

 

8.3 DO 단계에서의 BI

__문제의 조짐을 발견한다

 

8.4 CHECK 단계에서의 BI

__문제의 요인을 검증한다

 

8.5 ACT 단계에서의 BI

__대처방안에 대한 힌트를 얻는다

 

8.6 마케팅 믹스와 BI

__앙케이트 분석에서 프로모션 효과 측정까지

 

 

9. 데이터 웨어하우스

 

9.1 데이터 웨어하우스란?

__데이터 웨어하우스의 아키텍처

 

9.2 데이터 스테이징 영역

__ETL 처리를 수행하는 데이터 영역

 

9.3 스타 스키마

__데이터 웨어하우스의 표준 스키마

 

9.4 다차원 데이터베이스

__OLAP 툴의 기반 데이터베이스

 

 

10. 데이터 분석의 미래

 

10.1 빅데이터란?

__보다 대량으로, 보다 실시간으로

 

10.2 빅데이터와 BI

__사람의 손을 거치지 않고 자동화되는 BI

 

10.3 Hadoop MapReduce

__빅데이터를 일괄적으로 고속 처리하는 구조

 

10.4 CEP

__빅데이터를 실시간으로 처리하는 구조

 

10.5 빅데이터와 데이터 웨어하우스

__빅데이터에 대응하는 3가지 접근방법

 

10.6 NoSQL 데이터베이스

__비관계형 데이터베이스

 

10.7 컬럼형 데이터베이스

__컬럼 단위 저장방식으로 고속 처리 실현

 

10.8 데이터 웨어하우스·어플라이언스

__하드웨어 레벨의 고속화 기술

 

 

 

상세 이미지

 

 

 

 

Trackbacks 1 | Comments 0

퍼블릭's Blog is powered by Daum & tistory