부제 실무 데이터를 통해 데이터 분석 마스터하기
저자 노수영
출간/배본가능일 2020년 1월 31일
정가 24,000원
페이지 308
판형 크라운판 (173 * 230)
ISBN 979-11-90014-69-4 (93000)
SQL을 이용하여 현업에서 자주 사용되는
KPI 지표를 직접 추출해본다!
데이터 분석을 하기 위해서는 데이터베이스에 존재하는 데이터를 직접 추출할 수 있어야 한다. SQL은 우리가 데이터베이스에 접근하여 필요한 데이터를 조회하고 조작할 수 있도록 해주는 언어이다. 즉 SQL은 사람이 데이터베이스와 소통할 수 있게 해주는 도구이자 데이터 분석의 시작점이라고 볼 수 있다.
이 책은 현업에서 서비스 분석에 자주 사용되는 KPI 지표들을 직접 추출하며 SQL을 익힐 수 있도록 구성되어 있다. 기존의 간단한 문법 수준을 다루는 SQL 저서와는 자동차 매출, 상품 리뷰, 식품 배송 데이터 등 실무에 가까운 자료를 분석하는 예제들을 포함하고 있어 SQL을 학습하는 데 보다 도움이 될 것이다.
이 책의 특징
- 실습 위주로 SQL을 더 깊이 있게 학습한다.
- 현업에서 실제로 사용되는 지표들로 구성했다.
- 다양한 주제의 데이터 세트를 다루어 본다.
이 책이 필요한 독자
- SQL을 이용한 데이터 추출이 필요한 사람
- SQL 기본 문법은 알지만 실무 경력이 부족한 사람
- 데이터 분석에 처음 입문하는 사람
독자대상
초중급
소스코드 다운로드
https://github.com/bjpublic/sqldata
노수영
수학과를 다니면서 데이터 분석에 관심을 가지게 된 것을 계기로 지금까지 데이터 분석 업무를 맡고 있다. CRM, 전략실, AI 파트에서 근무하면서 다양한 분석 사례를 경험했으며, 현재는 모빌리티 회사에서 머신 러닝 모델을 개발하고 있다. 데이터에 접근하는 것을 두려워하는 동료들을 보면서 SQL 관련 서적을 집필해보고 싶다는 생각을 하게 되었고, 데이터 분석을 시작하고자 하는 모든 사람들에게 도움이 되길 바라는 마음을 담아 이 책을 출간했다.
1장 데이터베이스와 SQL
1. 데이터베이스
2. 데이터베이스 종류
3. 데이터베이스와 서버
4. SQL
5. MySQL, MySQL Workbench 설치
6. MySQL Workbench 구성
7. 서버, GUI
8. 분석가, SQL
9. SQL 쿼리 작성법
2장 SQL 문법
1. SQL Syntax
2. SELECT
3. FROM
4. WHERE
5. GROUP BY
6. JOIN
7. CASE WHEN
8. RANK, DENSE_RANK, ROW_NUMBER
9. SUBQUERY
3장 데이터 추가, 삭제, 갱신, 데이터 정합성
1. Import CSV
2. Insert, 행 추가하기
3. Delete, 행 삭제하기
4. Update, 데이터 갱신하기
5. Procedure
6. View
7. 데이터 정합성
4장 자동차 매출 데이터를 이용한 리포트 작성
1. 데이터 생성
2. 구매 지표 추출
3. 그룹별 구매 지표 구하기
4. 재구매율
5. Best Seller
6. Churn Rate(%)
5장 상품 리뷰 데이터를 이용한 리포트 작성
1. 데이터 생성
2. Division별 평점 분포 계산
3. 평점이 낮은 상품의 주요 Complain
4. 연령별 Worst Department
5. Size Complain
6. Clothing ID별 Size Review
6장 식품 배송 데이터 분석
1. 데이터 생성
2. Instacart Dataset
3. 지표 추출
4. 구매자 분석
5. 상품 분석
6. 다음 구매까지의 소요 기간과 재구매 관계
7장 UK Commerce 데이터를 이용한 리포트 작성
1. 데이터 생성
2. 국가별, 상품별 구매자 수 및 매출액
3. 특정 상품 구매자가 많이 구매한 상품은?
4. 국가별 재구매율 계산
5. 코호트 분석
6. 고객 세그먼트
7. 일자별 첫 구매자 수
8. 상품별 첫 구매 고객 수
9. 첫 구매 후 이탈하는 고객의 비중
10. 판매 수량이 20% 이상 증가한 상품 리스트(YTD)
11. 주차별 매출액
12. 신규/기존 고객의 2011년 월별 매출액
13. 기존 고객의 2011년 월 누적 리텐션
14. LTV(Life Time Value)
8장. 타이타닉 호 데이터 분석
1. 데이터 생성
2. 요인별 생존 여부 관계
3. EMBARKED
4. 탑승객 분석
5. 상관 분석(Correlation Analysis)
6. 데이터 분석 및 시각화
9장 R, Python 연동
1. Import CSV(turnover.csv)
2. MySQL과 R, Python 연동하기
3. 근무 시간과 직업 만족도의 관계(선형 회귀 분석)
4. Python 연동하기
5. SQL – Python, R
6. R vs Python
데이터 분석 전문 인력만으로 데이터 기반의 조직 문화가 완성되지는 않는다. 의사 결정을 내리는 모두가 데이터에 접근할 수 있어야 한다. 그러기 위해서는 DB에 적재되어 있는 수많은 데이터를 조회하는 언어이자 데이터 접근의 시작점인 SQL은 필수라고 할 수 있다.
이 책은 원하는 데이터를 찾지 못해 어려움을 겪는 마케팅, 기획, UI/UX 등의 담당자를 위한 도서로, SQL을 통해 철저하게 예제와 사례 중심으로 데이터 전처리 분석을 실습할 수 있도록 구성하였다. 실제 현업에서 자주 분석하는 지표들을 다루었기 때문에 실무를 진행하는 데에도 도움이 되도록 했다. 데이터에 첫발을 디디는 모든 사람들에게 이 책은 큰 보탬이 될 것이다.
머신러닝을 위한 파이썬 한 조각 (2) | 2020.02.06 |
---|---|
태블로 굿모닝 굿애프터눈 (2) | 2019.12.23 |
맛있는 MongoDB (0) | 2019.12.20 |
댓글 영역