데이터 분석, R고 싶니
부제 마케터가 알려주는 데이터 분석 이야기
저자 백종일
출간/배본가능일 2018년 1월 31일
정가 25,000원
페이지 428
판형 4*6배판 188*245mm
ISBN 979-11-86697-49-8 (93000)
책 소개
마케터가 알려주는 데이터 분석 이야기
IT 또는 서비스 관련 회사를 다녀본 분들이라면 “SQL 할 수 있는 서비스 기획자는 날개 달린 기획자이다”라는 말을 들어보았을 것입니다. 마케터도 마찬가지입니다. 마케터 중에서도 데이터 마이닝을 도와주는 SQL과 체계화된 데이터 분석을 도와주는 R을 쓸 수 있다면 ‘날개 달린 마케터’가 되는 것입니다. 기업에서 데이터를 다루는 능력이 그만큼 중요해졌기 때문입니다.
모든 업무 회의에서 의사 결정은 데이터를 기반으로 이루어집니다. 이제 모든 마케팅 계획이 수치를 기반으로 만들어집니다. 데이터가 이끄는 마케팅(Data-driven Marketing) 시대가 온 것입니다.
R은 강력하면서 누구나 무료로 이용할 수 있는 오픈소스로 데이터 수집부터 통계모델, 머신러닝, 그리고 ggplot으로 대표되는 강력한 시각화 도구까지 지원됩니다. 또한 인터프린터 언어로, 컴퓨터와 내가 대화하는 형식을 통해 실시간으로 분석 결과를 얻을 수 있습니다.
이 책에서는 R을 사용해서 어떻게 데이터를 다룰 수 있는지 기초부터 하나씩 설명해보았습니다. 이 책을 통해 R을 쉽게 배우는 동시에 일상에서의 데이터 활용법을 터득하길 진심으로 바랍니다.
이 책의 특징
- R의 설치 방법 및 기능부터 R을 활용해 무엇을 할 수 있는지 살펴본다.
- 데이터 분석의 기초인 기초통계부터 통계모델까지 다룬다.
- SQL 기초 코드를 살펴보고 R에서의 활용 방법을 알아본다.
이 책이 필요한 독자
- 체계적인 데이터 분석을 위한 도구를 새롭게 익히고자 하는 마케터
- 코드라는 개념조차도 생소한 프로그래밍 비전공자
- R을 일에 접목하여 시너지를 내고자 하는 데이터 관련 업무 종사자
대상독자
초중급
예제코드 다운로드
https://github.com/bjpublic/R_Programming
저자 소개
백종일
스타트업 미디어 벤처스퀘어에서 사외 필진으로 데이터 관련 글을 몇 편 썼다. 지금은 국내 통신사 중 한 곳에서 데이터 분석 및 마케팅을 담당하고 있다. 분석가이자 마케터이면서 회사 사이트의 팝업 및 배너 광고까지 담당한다. 어쩌다 보니 사내에서 BI 강사로도 역할을 하고 있다.
또한 Tedx 기획자, Microsoft Student Partners, ADsP(데이터분석준전문가), SQLD(SQL개발자) 등의 이력을 가지고 있다.
IT와 스타트업에 관심이 많으며 시장의 움직임을 숫자로 보는 것을 좋아한다. 개인적으로는 웹툰과 미드 광팬이기도 하다.
목차
Chapter 1 R
1.1. 왜 R인가?
1.2. R 프로그램 다운로드 및 설치
1.3. R. Studio 화면 구성 및 설정
1.4. working directory 설정
Chapter 2 Basic
2.1. 패키지와 라이브러리
2.2. 패키지 설치 및 라이브러리 로드
2.3. 객체와 벡터
2.4. 벡터의 종류 (integer, numeric, character, factor)
2.5. 객체의 속성
2.6. 데이터셋 불러오기, 저장하기
2.7. 데이터셋 구성요소
2.8. 데이터셋, 객체의 구조 확인하기
2.9. 데이터셋의 분할과 통합
2.10. 데이터 선택하기
2.11. 데이터셋의 행/열 추가 및 삭제
2.12. 자주 쓰는 함수_apply
2.13. 자주 쓰는 함수_subset
2.14. 알면 좋은 함수_dplyr
2.15. 조건문과 반복문
2.16. 도움말 검색
Chapter 3 차트 및 시각화
3.1. 스캐터 플롯(점그래프)
3.2. 바 플롯(막대그래프)
3.3. 히스토그램
3.4. 파이 차트
3.5. 박스 플롯
3.6. 모자이크 플롯
3.7 ggplot
3.8. 실습_구글맵에 전기차 충전소 표시하기(ggmap)
3.9. 네트워크 그래프_미드 ‘Suits’ 인물 관계도 그리기
Chapter 4 통계적 기계학습
4.1. 통계적 기계학습의 세상
4.2. 기계학습 종류(지도학습, 비지도학습)
4.3. 지도학습_예측: 단순선형 회귀분석
4.4. 지도학습_예측: 다중선형 회귀분석
4.5. 지도학습_분류: 의사결정나무
4.6. 지도학습_분류: 랜덤 포레스트
4.7 비지도학습: k. means clustering
Chapter 5 SQL
5.1. SQL은 왜?
5.2. RDBMS 테이블 형식과 구조는?
5.3. R에서 SQL 시작하기
5.4. SQLDF 패키지 기본 문법
Chapter 6 데이터 분석 실습(IMDB 영화 평점 데이터 분석)
6.1. 영화 평점(score) 예측
6.2. 캐글(Kaggle) 로그인
6.3. IMDB 데이터셋 다운로드
6.4. 데이터셋 구성도 확인하기
6.5. 탐색적 데이터 분석(EDA)_변수
6.6. 탐색적 데이터 분석(EDA)_상관관계
6.7. 평점 예측 통계 모델: 회귀분석