머신 러닝

전체 출간 도서

by 비제이퍼블릭 2016. 1. 13. 09:25

머신 러닝

: 데이터를 이해하는 알고리즘의 예술과 과학

저자 피터 플래치

역자 최재영

출간일 2016년 1월 27일 (수)

정가 33,000원

페이지 512

판형 173 * 230

ISBN 979-11-86697-09- 2(93000)

책 소개

데이터를 이해하는 알고리즘의 예술과 과학

이 책은 가장 종합적인 머신 러닝 도서 중 하나로 통일성 원리의 시각에서 벗어나지 않으면서도 머신 러닝이 가진 믿을 수 없는 풍부함을 잘 정당화한다. 명백한 사례에 기반을 둔 피터 플래치의 설명은 어떻게 스팸 필터가 동작하는지 설명하면서 시작한다. 이러한 접근 방식은 최소한의 기술적 지식을 통해 실용성 있는 머신 러닝의 즉각적인 소개를 제공한다. 이 책은 논리적, 기하학적, 통계학적인 모델들의 광범위한 주제들을 포함하며, 행렬 인수분해와 ROC 곡선 분석 같은 최신 주제를 다루었다. 특히 머신 러닝에서 특징들이 수행하는 중심적 역할에 대해 특별한 주의를 기울여 설명했다.

이 책은 입문서로써 새로운 표준을 확립할 것이다.

-정립된 전문 용어들을 새롭고 유용한 개념들의 소개와 적절하게 조화시켜 활용했다.

-적절한 예제들과 관련 사례들은 이 책의 필수적인 부분을 형성한다.

-박스 안에 있는 내용들은 배경 지식 자료와 검토를 위한 지침을 제공한다.

-각 장의 결론 부분에서는 요약과 추가적인 추천 문헌을 포함했다.

-뒤쪽에 수록된 ‘기억해야 할 핵심 요점들’이라는 장을 통해 독자들은 책 내용을 쉽게 찾을 수 있다..

독자대상

중고급

저자 소개

피터 플래치

머신 러닝 교육 및 연구 분야에서 20년 이상의 경력을 가지고 있다. 그는 머신 러닝 저널의 편집장 및 2009 ACM Conference on knowledge discovery and data mining과 2012 European Conference on Machine Learning and Data Mining의 프로그램 공동 의장이다. 그의 연구는 고도로 구조화된 데이터로부터 학습을 위한 지식 표현 및 논리의 사용, 머신 러닝 모델과 방법의 분석과 평가, 대규모 데이터 마이닝까지 머신 러닝의 모든 면에 걸쳐있다. 특히 머신 러닝 방법을 이해하고 향상하기 위한 반응자 작용 특성(ROC) 분석에서 그만의 혁신적인 사용법으로 정평이 나 있다. 이런 혁신들은 다수의 초대 강연 및 강좌에서 그 효과가 입증되었고, 현재 이 책의 근간을 형성하고 있다.

역자 소개

최재영

2011년 8월 KAIST에서 박사 학위를 받았다. 2013년 8월까지 캐나다 토론토대학교와 미국 펜실베니아대학교에서 박사 후 연구원으로 있었으며, 2013년 9월에 귀국하여 삼성전자 책임연구원을 거쳐, 2014년 9월부터 중원대학교 교수로 재직 중이다. 패턴 인식과 머신 러닝에 기반한 얼굴인식 시스템과 지능형 유방암 진단시스템 소프트웨어 설계방법론을 연구해왔다. 패턴 인식 및 머신 러닝에 관한 여러 국제학술대회의 프로그램 위원과 국제학술지의 논문 심사위원으로 활동하고 있다.

프롤로그: 머신 러닝 활용 실제 사례

1장. 머신 러닝 구성요소

1.1 작업: 머신 러닝으로 해결되는 문제들

1.2 모델들: 머신 러닝 출력 결과

1.3 특징: 머신 러닝의 워크호스

1.4 요약과 전망

2장. 이진 분류와 관련 작업들

2.1 분류

2.2 스코어링과 등급화

2.3 부류 확률 추정

2.4 이진 분류 문제와 관련 작업들: 요약과 추천 문헌

3장. 다-부류 분류 기법

3.1 두 부류 이상을 갖는 분류 문제

3.2 회귀

3.3 자율형과 기술형 학습

3.4 다-부류 분류 기법: 요약과 추천 문헌

4장. 개념 학습

4.1 가설 공간

4.2 가설 공간 경로

4.3 논리곱 개념을 넘어서

4.4 학습 용이성

4.5 개념 학습: 요약과 추천 문헌

5장. 트리 모델

5.1 판정 트리

5.2 랭킹과 확률 추정 트리

5.3 분산 감소를 통한 트리 학습

5.4 트리 모델: 요약과 추천 문헌

6장. 룰 모델

6.1 순서화된 룰 리스트 기반 학습

6.2 비순서화된 룰 집합 학습

6.3 기술적 룰 학습

6.4 1차 룰 학습

6.5 룰 모델: 요약과 추천 문헌

7장. 선형 모델

7.1 최소 제곱 방법

7.2 퍼셉트론

7.3 지원 벡터 기계

7.4 선형 분류기에서 확률 계산

7.5 비선형 커널 방법

7.6 선형 모델: 요약과 추천 문헌

8장. 거리 기반 모델

8.1 수많은 도로들…

8.2 이웃과 이그젬플러

8.3 최근접 이웃 기반 분류

8.4 거리 기반 군집

8.5 계층적 군집

8.6 커널에서 거리까지

8.7 거리 기반 모델: 요약과 추천 문헌

9장. 확률 모델

9.1 정규 분포와 기하학적 해석

9.2 분류형 데이터에서 확률 모델

9.3 조건부 우도 최적화에 의한 판별 학습

9.4 은닉 변수를 갖는 확률 모델

9.5 압축 기반 모델

9.6 확률 모델: 요약과 추천 문헌

10장. 특징

10.1 특징의 종류

10.2 특징 변환

10.3 특징 구성과 선택

10.4 특징: 요약과 추천 문헌

11장. 모델 앙상블

11.1 배깅과 랜덤 포레스트

11.2 부스팅

11.3 앙상블 랜드스케이프로 사상하기

11.4 앙상블 분류기 모델: 요약과 추천 문헌

12장. 머신 러닝 실험

12.1 무엇을 측정할 것인가

12.2 그것을 어떻게 측정할 것인가

12.3 그것을 어떻게 해석할 것인가

12.4 머신 러닝 실험: 요약과 추천 문헌

에필로그: 그다음엔 어디로 갈 것인가

기억해야 할 핵심 요점들

참고 문헌

출판사 리뷰

이 책을 읽으려는 독자들은 머신 러닝 분야를 처음 접하는 독자일 수도 있고, 이미 머신 러닝 분야의 전문가일 수도 있다. 현재 대부분의 이메일 클라이언트 시스템은 정크(junk) 이메일이나 원하지 않는 벌크(bulk) 이메일로 알려진 스팸(spam) 이메일을 인식하고 차단하기 위한 컴퓨터 알고리즘을 사용하고 있다. 초기에 스팸 이메일 필터 기술은 정규 표현식 같은 수작업으로 코드화된 패턴을 정합하는 기술에 의존했다. 그러나 이와 같은 초창기 기술들은 유지보수가 어렵고 불완전한 유연성을 제공한다는 문제가 있었다. 결국, 어떤 사람에게 스팸인 메일이 다른 사람에게는 햄 메일일 수도 있다는 것이다. 이와 관련하여 머신 러닝 기술을 도입함으로써 추가적인 적응성과 유연성을 성취할 수 있었다.

머신 러닝의 주요 구성 성분은 작업, 모델, 특징이라고 할 수 있다. 이 책에서는 모델이 단지 분류기의 매개 변수의 집합이나 특징에 의해 정의된 것이 아니라, 어떤 식으로 중심 단계를 차지하고 있는지를 여러 가지 그림과 예제를 통해 보여준다. 매우 넓은 범위의 모델들을 머신 러닝에 도입하기 위해서는 이런 유연성이 필수다. 작업과 학습 문제의 차이점을 강조할 필요가 있다. 작업은 모델들에 의해 다루어지고, 학습 문제는 모델들을 생성하는 학습 알고리즘들에 의해 해결된다.

‘머신 러닝은 정확한 작업을 성취할 수 있는 올바른 모델들을 구축하기 위해 올바른 특징들을 활용하는 것이다’라고 말할 수 있다. 성공적인 ‘요리’를 만들기 위한 구성 재료들은 매우 다른 형태일 수 있다. 재료들은 신중하게 선택되고 결합되어야 한다는 점을 강조하기 위해, 이 책의 저자는 이 재료들을 ‘구성요소들(ingredients)’이라고 칭한다. 머신 학습자들은 요리를 응용(application)이라고 칭한다. 이는 작업 영역에서 생성된 데이터를 활용한 머신 러닝 방법을 통해 실질적인 작업을 해결하는 모델의 구성이다. 자신이 사용할 재료들에 대해 잘 모른다면 좋은 요리사가 될 수 없으며, 이것은 머신 러닝 전문가에게도 동일하게 적용된다.

상세페이지

'전체 출간 도서' 카테고리의 다른 글

고성능 .NET 코드 프로그래밍 (0)	2016.01.18
소프트웨어 작동법 (2)	2015.12.11
프로 자바스크립트 테크닉 (0)	2015.12.10

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

상세 컨텐츠

본문 제목

본문

'전체 출간 도서' 카테고리의 다른 글

관련글 더보기

댓글 영역

추가 정보

인기글

티스토리툴바