파이썬으로 완성하는 비지도 학습 알고리즘
파이썬으로 완성하는 비지도 학습 알고리즘
부제 비감독 모형과 텐서플로 2를 이용한 전처리 기법의 머신러닝 구현
저자 송동근
출간/배본가능일 2021년 12월 31일
정가 34,000원
페이지 560쪽
판형 크라운판 (173 * 230)
ISBN 979-11-6592-110-1 (93000)
책 소개
다양한 비지도 학습 문제들을
이제 실제 파이썬 코드로 구현한다!
실제 이론을 코드로 구현하는 데에는 많은 현실적인 격차가 존재하고, 이론을 완벽히 이해한다고 해도 코드로 구현한다는 건 또 다른 문제이다. 그래서 이 책에서는 비지도 학습의 이론을 간단하게 살펴본 후에 알고리즘의 이론과 수식을 여러 단계로 나누고 파이썬 코드로 단계별 결과들을 최대한 상세하게 다루었다.
또한 텐서플로 2의 오토 인코더와 함께 사용하는 주요 딥러닝 이론들을 실습하고 딥러닝의 활성화 함수, 손실 함수, RNN, CNN, LSTM 등을 소개한다. 마지막으로 다양한 예제 데이터와 함께 그동안 배웠던 이론을 적용하고 머신러닝으로 직접 코딩하면서 결과물을 완성할 수 있도록 했다. 이 책을 통해 여러분도 머신러닝에서 비지도 학습이 갖는 역할을 익혀 나가길 바란다.
이 책의 특징
- 비지도 학습의 이론과 코드의 간격을 줄였다.
- 자신만의 머신러닝 단계를 완성할 수 있다.
- 최대한 해석이 용이한 코드를 사용하였다.
이 책이 필요한 독자
- 파이썬을 데이터 분석에 활용하고자 하는 분
- 비지도 학습에 대해 더 자세히 알고 싶은 분
- 더 높은 수준의 머신러닝 기법이 필요한 분
소스코드 다운로드
https://github.com/bjpublic/unsupervised
저자 소개
송동근
한림대학교 학사부터 중앙대학교 석사까지 통계학을 전공하였고, 위메프를 거쳐 현재는 버즈니에서 데이터 분석가로 활동 중이다. 파이썬을 주 코드로 사용하고 있으며 개발에도 참여 중이다. 주로 커머스 계열의 데이터를 많이 다루었고 추천과 고객 세그먼트, 카테고리 분류, 빅데이터 처리 등의 경력을 갖고 있다.
목차
서문
저자 소개
베타 리더 리뷰
Chapter 01 비지도 학습 개요
1.1 비지도 학습이란?
1.2 주요 주제 소개
1.3 비지도 학습의 장단점
1.4 비지도 학습의 시작
Chapter 02 차원 축소
2.1 주성분분석
2.2. 특이값 분해
2.3 차원 축소의 성능 평가를 위한 재구축 오차
2.4 다른 차원 축소 기법들
Chapter 03 이상치 탐지
3.1 데이터 불러오기
3.2 데이터 표준화와 분할
3.3 주성분분석의 적용과 해석
3.4 마할라노비스 거리 측정법
3.5 재구축 오차
3.6 답을 안다는 가정에서 성능 평가하기
3.7 데이터 탐색과 이상치 탐지
3.8 지도 학습을 이용한 최적화와 결과 해석
3.9 그 외 sklearn 내장된 이상치 탐지
Chapter 04 군집화
4.1 군집화 과정
4.2 희소행렬(Sparse Matrix) 만들기
4.3 거리 측정법의 소개
4.4 군집화 알고리즘
Chapter 05 군집화의 응용
5.1 상위 군집 만들기
5.2 군집별 등급 지정하기
5.3 군집별 중요도 구하기
5.4 텍스트 데이터를 이용한 군집 특성 이해하기
5.5 군집화 결과 해석하기
Chapter 06 텐서플로 2 소개
6.1 텐서플로2의 장점과 강점
6.2 케라스 소개(Keras API)
6.3 합성곱 신경망(CNN) 소개
6.4 순환 신경망(RNN)과 장단기 기억 모델(LSTM) 소개
6.5 모델의 시각화, 저장, 불러오기
Chapter 07 오토 인코더(Auto Encoder)
7.1 바닐라 오토 인코더(with keras)
7.2 다양한 오토 인코더의 구조
Chapter 08 오토 인코더의 응용
8.1 오토 인코더 은닉층을 이용한 군집화 예제
8.2 오토 인코더의 이상치 탐지
8.3 오토 인코더에 범주형 변수 추가
8.4 변분 오토 인코더
8.5 앙상블 결과
출판사 리뷰
우리가 머신러닝을 하는 대부분의 경우, 적게는 수천 개에서 많게는 수천만 개의 데이터를 가지고 있다. 모든 문항의 답안을 만드는 일은 현실적으로 불가능하다. 매번 결과가 쉽게 바뀌고, 원하던 혹은 찾으려던 답을 들여다보는 데 많은 노력이 필요하다. 비지도 학습은 이처럼 데이터가 있지만 명확한 답안이 없이 정보를 추출해 내려 할 때 사용한다. 새롭게 보이는 최근 트렌드는 무엇인지, 데이터에 어느 이상한 부분이 있는지, 어떻게 변화하고 있는지 쉽게 파악할 수 있게 해준다.
비지도 학습은 답안을 이끌어 내는 것을 최대한 유추하고, 일반화하는 과정이라고 할 수 있다. 데이터에서 패턴을 찾아 정의하고, 결과로 도출하는 과정을 반복해서 시행하여야 하며, 데이터의 수많은 경우의 수로부터 원하는 패턴이라 판단하고 추론하는 것도 데이터를 다루는 독자의 몫이 된다. 하지만, 이 책을 통해 비지도 학습의 사용법을 익힌다면 답안을 하나씩 확인하는 것보다 수십, 수백 배는 빠르게 목적에 도달할 수 있게 해줄 것이다.