부제 종이와 연필로 익히는 데이터 분석
저자 고추 다이스케 외 5명
역자 김지윤
출판사 비제이퍼블릭(BJ퍼블릭)
출간/배본가능일 2024년 2월 8일
정가 20,000원
페이지 272쪽
판형 152*225
ISBN 979-11-6592-256-6(93000)
국내도서 > 자연과학 > 과학 > 재미있는 과학이야기
국내도서 > 자연과학 > 수학 > 확률/통계학
국내도서 > IT 모바일 > 컴퓨터 공학 > 개발방법론
국내도서 > IT 모바일 > 컴퓨터 공학 > 데이터베이스 일반
국내도서 > IT 모바일 > 컴퓨터 공학 > 자료구조/알고리즘
#데이터과학자 #데이터사이언티스트 #데이터과학 #데이터사이언스 #사고과정 #데이터분석
“프로그래밍 용어를 사용하지 않고, 데이터 과학자의 사고를 배운다.”
데이터를 읽고 분석하는 능력은 누구나 익혀야 할 기본 소양이 되었습니다. 하지만 파이썬, R과 같은 프로그래밍 언어 때문에 공부를 포기하기도 합니다. 이 책은 복잡한 계산, 엑셀, 프로그래밍 언어를 사용하지 않고, 종이와 연필만으로 데이터 과학자의 사고를 알려줍니다. 데이터 기본 개념을 쉽게 이해하고, 40개의 퀴즈를 풀면서 데이터 과학자 사고 과정을 직접 체험해 보시기 바랍니다.
들어가며
저자 소개
베타리더
이 책을 활용하는 방법
제1장 디지털 시대에 필요한 데이터 리터러시
1-1. 디지털 시대의 도래
DX 시대의 빅데이터의 역할
Society 5.0의 실현
1-2. 데이터 리터러시는 미래의 직장인에게 필수 스킬
디지털 시대의 「읽기·쓰기·셈하기」 같은 소양
모든 대학생·고등학생이 배우는 데이터 리터러시
신입사원이 더 뛰어난 데이터 리터러시
column: 모든 직장인이 익혀야 할 DX 리터러시
1-3. 데이터 리터러시를 익히자
직장인이 익혀야 할 데이터 리터러시
column: 데이터 과학자란?
제2장 데이터를 읽는 힘을 기른다
2-1. 생각하면서 데이터를 읽자!
퀴즈1 : 데이터를 목적에 맞게 보는 방법을 배운다
퀴즈2 : 데이터의 특징과 경향을 파악하는 방법을 배운다
퀴즈3 : 데이터에서 착안점을 찾는 방법을 배운다
2-2. 전체의 경향을 파악하자!
데이터의 대푯값 : 평균값·최빈값·중앙값
퀴즈4 : 평균값·최빈값·중앙값 산출 방법을 배운다
퀴즈5 : 대푯값과 데이터 분포의 관계를 배운다
데이터 분포를 확인한다
column: 히스토그램의 폭
실제 사회에서는 평균값=최빈값이 아닌 경우가 많다
일본 국민의 대부분은 552만 3천 엔의 소득이 있다?
대부분의 세대는 1,791만 엔을 저축해 놓았다?
2-3. 데이터의 세부 내용을 확인하자!
퀴즈6 : 상이값·이상값을 배운다
존재하지 않는 데이터(결측값)
2-4. 데이터의 관계성을 파악하자!
퀴즈7 : 두 개의 데이터의 관계성을 배운다
두 데이터의 관계성 : 상관
상관관계와 인과관계
퀴즈8 : 상관과 인과를 배운다
상관관계를 어떻게 볼 것인가?
제3장 데이터를 설명하는 힘을 기른다
3-1. 데이터를 시각화해보자!
퀴즈1 : 적절한 그래프 표현을 배운다
적절한 그래프 표현
column: 시계열 데이터를 시각화할 때는 꺾은선 그래프?
column: 데이터 과학자는 원 그래프를 쓰지 않는다?
퀴즈2 : 부적절한 그래프 표현을 배운다
3-2. 데이터를 비교한다는 것은?
퀴즈3 : 적절한 비교 대상 설정 방법을 배운다
적절한 비교 대상 설정
데이터를 비교하는 4가지 시점
퀴즈4 : 어떤 시점과의 비교 방법을 배운다
퀴즈5 : 타자와의 비교 방법을 배운다
곱셈에 의한 분해
덧셈에 의한 분해
3-3. 데이터에서 과제를 찾아낸다
퀴즈6~9 : 데이터에서 과제를 찾아내는 순서를 배운다
매출 데이터에서 과제를 찾아내는 순서
포인트 3배 DAY의 매출 증가 효과
운동회의 매출 증가 효과
제4장 데이터를 분류하는 힘을 기른다
4-1. 특징이 비슷한 데이터를 그룹으로 만들자!
퀴즈1 : 데이터를 그룹으로 나누는 의미를 배운다
데이터를 그룹으로 나누는 의미
그룹별 해결 방안을 생각한다
column: 고객의 잠재적인 니즈를 파악한다
데이터의 특징이 비슷하다는 판단
퀴즈2 : 데이터 사이의 거리를 배운다
퀴즈3 : 거리를 계산할 때의 주의사항을 배운다
column: 스케일이 다른 데이터
4-2. 목적에 맞게 데이터를 분류하자!
퀴즈4 : 데이터를 분류하기 위한 관점을 배운다
데이터 분류의 어려움
4-3. 데이터를 기계적으로 분류하자!
퀴즈5 : 그룹의 중심을 배운다
데이터를 분류하는 방법 : k-means법
column: k-means법의 초깃값 문제
4-4. 데이터 분류를 체험하자!
퀴즈6~8 : 데이터를 분류하는 순서를 배운다
제5장 데이터에서 법칙을 발견하는 힘을 기른다
5-1. 데이터에서 법칙을 발견한다!
퀴즈1 : 데이터에서 법칙을 발견하는 방법을 배운다
퀴즈2 : 발견한 법칙을 적용하는 방법을 배운다
판별 문제의 특징
5-2. 판별 문제를 푸는 의사결정 트리 모델
퀴즈3 : 의사결정 트리 모델을 만드는 방법을 배운다
의사결정 트리 모델을 성장시킨다
퀴즈4 : 의사결정 트리 모델을 이용해 결과를 추측하는 방법을 배운다
5-3. 판별 문제의 정밀도를 평가해보자!
퀴즈5 : 판별 문제의 평가 방법을 배운다
2×2칸 크로스 표로 정리한다
판별 문제의 정밀도를 평가하는
적합률과 재현율 가운데 어느 쪽이 중요할까?
5-4. 의사결정 트리 모델을 활용해보자!
퀴즈6 : 데이터에서 법칙을 발견해서 판별 문제를 푸는 순서를 배운다
제6장 데이터를 보고 예측하는 힘을 기른다
6-1. 수치 데이터의 관계성을 확인하자!
퀴즈1 : 수치 데이터의 관계성을 확인하는 방법을 배운다
퀴즈2 : 수치 데이터의 관계성이 좁혀지지 않을 때의 대처 방법을 배운다
수치 이외의 데이터와의 관계성을 확인한다
퀴즈3 : 수치 이외의 데이터와의 관계성을 확인하는 방법을 배운다
6-2. 내삽과 외삽에 주의하자!
퀴즈4 : 데이터를 보고 예측할 때 주의해야 할 내삽과 외삽을 배운다
데이터를 보고 찾아낸 관계성을 적용할 수 있는 경우와 적용할 수 없는 경우
외삽에 의한 예측 예
6-3. 데이터의 치우침에 주의하자!
퀴즈5 : 데이터에 치우침이 있을 때의 주의사항을 배운다
데이터에 치우침이 없는지 확인한다
식료품점의 캠페인 실패
6-4. 시간 변화에 주목하자!
퀴즈6 : 시계열 데이터의 트렌드와 주기성을 배운다
시계열 데이터에서는 다양한 변동을 발견할 수 있다
6-5. 데이터를 보고 예측하자!
퀴즈7~9 : 데이터를 보고 예측하는 순서를 배운다
제7장 업무에서 데이터 리터러시를 활용한다
7-1. 데이터를 읽는 힘을 활용한다
데이터를 읽는 힘을 활용한 사례 : 앙케트 조사
데이터를 읽는 힘을 활용한 사례 : 상권 분석
7-2. 데이터를 설명하는 힘을 활용한다
데이터를 설명하는 힘을 활용한 사례 : 매출 분석
데이터를 설명하는 힘을 활용한 사례 : 품질 관리
7-3. 데이터를 분류하는 힘을 활용한다
데이터를 분류하는 힘을 활용한 사례 : 고객 세그먼테이션
데이터를 분류하는 힘을 활용한 사례 : 점포 뭉치기
7-4. 데이터에서 법칙을 발견하는 힘을 활용한다
데이터에서 법칙을 발견하는 힘을 활용한 사례 : 설비 이상
데이터에서 법칙을 발견하는 힘을 활용한 사례 : 고객 이탈
7-5. 데이터를 보고 예측하는 힘을 활용한다
데이터를 보고 예측하는 힘을 활용한 사례 : 상품 수요 예측
데이터를 보고 예측하는 힘을 활용한 사례 : 이용객 수 예측
맺는 말
참고문헌
편저자
고추 다이스케
일본 전기 주식회사 AI·애널리틱스 사업통괄부 수석 데이터 과학자.
2003년 4월 일본 전기 주식회사 입사. 유통·서비스업을 중심으로 분석 컨설팅을 제시하였고, 2016년 NEC프로페셔널 인정 제도 ‘시니어 데이터 애널리스트’ 초대 인정자가 되었다. 2018년 NEC그룹의 AI인재 육성을 통괄하는 AI 인재 육성 센터의 센터장으로 취임하여 AI인재 육성에 힘썼다. 2019년 AI인재를 육성하기 위한 NEC아카데미 for AI를 개설해 학장을 지냈다. 저서로는 『AI 인재를 기르는 방법』, 『교양으로서의 데이터 과학』, 『데이터 과학자 검정공식 레퍼런스북』이 있다.
저자
가와치 아키오
일본 전기 주식회사 AI·애널리틱스 사업통괄부 리드 데이터 과학자.
2009년 4월 일본 전기 주식회사 입사. 통신 사업자를 위한 SE로 활동하다가 2015년 10월부터 데이터 과학자로 활동하기 시작했다. 지금까지 유통, 제조, 전력, 부동산, 관공서 등 폭넓은 업계에서 분석에 종사했다. 현재는 주로 분석을 제안하거나 인재를 육성하며 분석 어드바이저로 일한다.
고노 슌스케
일본 전기 주식회사 AI·애널리틱스 사업통괄부 데이터 과학자.
2014년 4월 일본 전기 주식회사 입사. 업무 개선을 위한 과제·요건 분석 기술연구 개발에 종사하다가 철도·제조 영역의 고객을 중심으로 데이터 분석 프로젝트에 관여하고 있다. 분석 검증부터 적용까지 폭넓은 단계를 담당한다. 또, 고객 기업의 데이터 분석팀 설립과 육성 지원도 하고 있다.
스즈키 가이리
일본 전기 주식회사 AI·애널리틱스 사업통괄부 데이터 과학자.
2020년 4월 일본 전기 주식회사 입사. 데이터 과학자로서 데이터 분석 업무와 기술 검증 업무에 종사. 현재는 주로 관공서의 고객 데이터 분석 지원에 관여하고 있으며 요건 정의와 분석 검증, 적용을 담당한다.
나가키 사키
일본 전기 주식회사 AI·애널리틱스 사업통괄부 데이터 과학자.
2018년 4월 일본 전기 주식회사 입사. 입사 이래로 데이터 과학자로서 여러업계의 AI기술을 활용한 데이터 분석 업무에 종사하였고, 현재는 제조업·에너지업·철도업 고객을 중심으로 한 AI 활용 안건 제안부터 고객 데이터를 이용한 검증, AI를 활용한 시스템 제안, AI 인재 육성 지원 등 폭넓게 활동하고 있다. 일본 데이터베이스 학회 회원이다.
나카노 준이치
일본 전기 주식회사 AI·애널리틱스 사업통괄부 데이터 과학자.
2007년 4월 일본 전기 주식회사 입사. 데이터웨어 하우스 시스템 설계·개발·보수 경험을 거쳐서 데이터 과학자로서 CRM 영역의 데이터 해석을 담당하고 있다. 현재는 NEC의 AI사업 확대에 공헌하는 한편, 데이터 분석을 이용한Well-Being 향상 연구 등에도 몰두하고 있다. 2022년 3월 게이오대학 대학원 경영 관리 연구과 수료, 경영학 석사를 취득하였다.
역자
김지윤
가톨릭대학교 졸업. 세이신여자대학교에서 교환 유학 후 와세다대학교 대학원에서 공부한 뒤, 글밥아카데미를 수료하고 바른번역 소속 번역가로 활동하고 있다. 비 온 뒤 맑게 갠 하늘처럼 개운한 번역을 하고 싶다는 의미에서 번역가 이름을 순우리말인 ‘해밀’로 지었다. 한 문장 한 문장 저자의 마음으로 공들여 번역하는 번역가, 원작을 통해 받은 느낌과 감동을 한국 독자들에게도 전달하는 번역가이다. 데이터 사이언스를 포함한 다양한 학문에 관심이 있다.
“누구나 쉽게 배우는 데이터 과학자의 가설 사고”
직장인은 빠르게 변하는 디지털 사회를 살아가기 위해 데이터 리터러시(데이터를 읽는 힘, 데이터를 설명하는 힘, 데이터를 다루는 힘, 데이터를 분류하는 힘, 데이터에서 법칙을 발견하는 힘, 데이터를 보고 예측하는 힘)를 익혀야 합니다. 하지만 Python이나 R 등의 프로그래밍 언어의 장벽으로 데이터 과학에 입문조차 하지 못하고 포기하는 사람이 대다수입니다.
이런 사태가 발생하지 않도록 프로그래밍 언어를 사용하지 않고 종이와 연필로 데이터 과학자의 사고 과정을 체험할 수 있는 책을 만들었습니다. 데이터 과학자가 어떤 사고 회로로 데이터와 마주하는지 이 책을 통해 알 수 있습니다. 이 책에 있는 40개의 퀴즈를 풀면서 데이터 과학자의 사고 과정을 직접 체험해보시기를 바랍니다.
이 책의 구성은 다음과 같습니다. 제1장에서 미래의 디지털 사회에서 필수 기술이 될 디지털 리터러시에 관해 설명합니다. 제2장에서 직장인이 익혀야 할 데이터를 읽는 힘을 배웁니다. 제3장에서 데이터를 설명하는 힘을 배웁니다. 제4장에서 데이터를 분류하는 힘을 배웁니다. 제5장에서 법칙을 발견하는 힘을 배웁니다. 제6장에서 데이터를 보고 예측하는 힘을 배웁니다. 다양한 주제와 실제 사례들을 통해 독자들은 데이터 과학에 대한 입문부터 심도 있는 이해를 할 수 있습니다.
이 책을 추천합니다.
- 데이터 관련된 일을 하고, 데이터 과학자의 사고를 알고 싶은 분
- 데이터를 읽어내는 기술을 익히고 싶은 분
- 데이터를 보고 논리적으로 생각하고 싶은 분
- 어떤 데이터를 봐야 할지 모르는 분
- 예스24: https://www.yes24.com/Product/Goods/124777927
- 교보문고: https://product.kyobobook.co.kr/detail/S000212170349
- 알라딘: https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=333018576
스마트 홈 불 좀 꺼줘 (0) | 2024.02.07 |
---|---|
현장 밀착, 피그마로 협업하기 (0) | 2024.01.19 |
사장님 몰래하는 파이썬 업무 자동화 (0) | 2024.01.12 |
댓글 영역