손에 잡히는 판다스
부제 주피터 노트북과 파이썬을 이용한 데이터 분석
저자 문용준
출간/배본가능일 2018년 11월 30일
정가 32,000원
페이지 548
판형 4*6배판 188*257
ISBN 979-11-86697-72-6 (93000)
책 소개
주피터 노트북과 파이썬을 이용한 데이터 분석
파이썬 코드를 읽고 작성이 가능한 개발자라면 데이터의 가공, 변환, 정제를 판다스 라이브러리를 이용해서 잘 다루고 싶을 것이다. 이 책에서는 판다스 내의 시리즈와 데이터프레임 클래스의 속성, 메소드의 기능 설명과 예제를 통해 사용법을 이해할 수 있다.
이 책은 정돈된 데이터를 만드는 다양한 사례를 보여주고 주피터 노트북을 이용해서 직접 실습할 수 있는 구성으로 데이터 과학을 배우고자 하는 분들에게 출발점이 되어줄 것이다.
이 책의 특징
- 데이터 정제, 변형 등의 예제를 통해 판다스 모듈 내의 함수와 클래스에 대한 개념을 쉽게 이해할 수 있다.
- 시리즈와 데이터프레임 내의 메소드 작동 원리를 알 수 있다.
- 데이터 정돈과 시각화를 연계한 예제를 제공해 실무로 확장할 수 있다.
이 책이 필요한 독자
- 파이썬 개발이 가능하고 데이터 분석에 관심을 가진 개발자
- R뿐만 아니라 파이썬으로도 데이터 분석 기법을 확대하려는 데이터 분석가
- 기존 엑셀 매크로를 활용한 작업이 가능한 일반인
독자대상
초중급
소스코드 다운로드
https://github.com/bjpublic/handinpandas
추천사
이 책은 판다스의 전체 영역을 방대하게 다루어서 프로젝트의 필요에 의해 판다스를 학습하고자 하는 분들께 큰 도움이 될 것으로 생각합니다.
- <파이썬으로 데이터 주무르기> 저자, 로봇앤모어 수석연구원 민형기
데이터 분석을 하면서 항상 해외 웹사이트나 번역서에 의존해야 했었는데, 판다스에 대한 기초 개념부터 SQL, 통계 및 시각화 등을 간결한 예제들을 통해 쉽게 익힐 수 있습니다.
- 네이버 서치앤클로바 챗봇 개발자 신성진
한국에 판다스를 폭넓고 깊게 다루는 책이 나와 기쁩니다. 그리고 이 책을 통해 데이터 분석의 묘미를 파이썬과 판다스로 충분히 즐길 수 있기를 진심으로 바라겠습니다.
- Elastic 시니어 서포트 엔지니어 조인석
저자 소개
문용준
은행, SI 기업, 컨설팅 회사 등 20년 넘게 여러 회사를 다녔다. 금융기관 관련 ISP, EA 및 차세대 프로젝트에서 주로 비즈니스나 애플리케이션 아키텍처를 설계했고, 프로젝트에서 데이터 모델링, 객체 모델링, 서비스 모델링과 아키텍트 역할을 했다. 요즘 주 관심 분야는 금융권에 적용하는 핀테크, 빅데이터, 인공지능이며 아마도 평생 파이썬을 하면서 살 것 같다. 저서로는 <손에 잡히는 파이썬>이 있다.
목차
Chapter 1 데이터 구조에 익숙해지기
1.1 데이터 분석 과정 이해하기
1.2 판다스를 사용하는 이유 - 클래스
1.3. 판다스를 사용하는 이유 – 메소드나 함수
Chapter 2 판다스의 기본 클래스 알아보기
2.1 시리즈와 데이터 프레임 구조
2.2 시리즈 생성 방법
2.3 데이터 프레임 생성
2.4 인덱스 검색
2.5 인덱서 검색
2.6 갱신과 삭제 처리
2.7 문자열 데이터 처리
Chapter 3 판다스 시리즈와 데이터 프레임 실행하기
3.1 메소드
3.2 인덱스 레이블과 누락 값 처리
3.3 범주형 데이터 처리
Chapter 4 판다스 Index 클래스 이해하기
4.1 숫자와 문자 인덱스 처리
4.2 날짜 및 범주형 인덱스 처리
4.3 멀티인덱스 처리
Chapter 5 데이터 재구성하기
5.1 정렬 처리
5.2 데이터 구조 변경
Chapter 6 쿼리처럼 데이터 처리하기
6.1 데이터 연결
6.2 조건절 처리하기
6.3 내부의 값을 그룹화 처리
Chapter 7 통계 및 샘플링 처리 알아보기
7.1 기본 통계 메소드
7.2 샘플링 메소드 적용
Chapter 8 문자열과 일반 함수 벡터화 처리하기
8.1 일반 함수를 정의해 적용
8.2 사용자 정의 함수를 인자로 전달해 처리
8.3 문자열 로직 실행
Chapter 9 데이터 시각화 알아보기
9.1 그래프
9.2 판다스 선 그래프 작성
9.3 판다스의 기타 형태 그래프 작성
Chapter 10 데이터 정돈 사례 분석하기
10.1 농구 데이터 정리
10.2 주가 데이터로 시계열 처리
10.3 맛집 데이터를 이용한 한글 변환 처리
10.4 음악 데이터를 이용한 연도별 인기 경황 파악
10.5 항공사 데이터를 이용한 항로 정보 처리