실시간 데이터 파이프라인 아키텍처

새로 나온 책

by 비제이퍼블릭 2023. 1. 26. 09:59

제목 실시간 데이터 파이프라인 아키텍처

부제 대규모 시스템 설계를 위한 스트리밍 데이터의 개념과 동작 원리

저자 앤드류 살티스

역자 최원영

출판사 비제이퍼블릭

출간/배본가능일 2023년 1월 25일

정가 27,000원

페이지 260쪽

판형 188*235

ISBN 979-11-6592-194-1(93000)

책 소개

비즈니스 요구사항에 따른 아키텍처의 가이드라인을 제시하는

'실시간 데이터 처리' 완벽 입문서

이제는 '실시간'의 시대다. 사용자의 반응에 빠르게 대응해야 하는 현대 인터넷 환경에서 스트리밍 데이터 파이프라인에 대한 요구는 꾸준히 커지고 있으며, 어느새 실시간 데이터를 잘 다루는 것이 업계에서 승리를 가져갈 수 있는 중요한 요건이 되었다. 하지만 이러한 시대적인 흐름에도 불구하고 아직까지 실시간 데이터를 어떻게 다룰지에 대한 명확한 가이드라인이나 경험이 없어서 도입하지 못한 곳들이 많다. 게다가 많은 개발자가 기존의 ‘동기(Sync) 방식’으로 데이터 처리하는 것에는 익숙하지만 ‘실시간(Streaming)’으로 데이터를 처리하는 데에는 어려움을 느낀다. 현재 업계 내 스트리밍 파이프라인에 대해 잘 알고 있는 전문가는 매우 부족한 실정이며, 책이나 영상 등의 콘텐츠 역시 찾아보기 힘들다.

이 책은 비즈니스 목표를 달성하기 위해 어떤 실시간 데이터 아키텍처로 구성하고 운영해야 할지 명확한 가이드라인을 제시한다. 스트리밍 데이터에 대한 정의부터 시작하여 단계별로 세분화된 아키텍처의 역할, 동작 방식, 각 장단점과 상황에 맞는 선택지를 보여준다. 그리고 스트리밍 데이터 아키텍처에 대해 공부한 지식을 기반으로 코드로 실습해 보는 시간을 가지면서 마무리한다. 기본 개념부터 아키텍처 구성, 코드 실습까지 구성되어 있으므로 실시간 데이터 처리에 대해 고민하는 개발자, 엔지니어, 조직장 등 모든 분들에게 큰 도움이 될 것이다.

소스 코드 다운로드 https://github.com/bjpublic/streaming-data

저자 소개

앤드류 살티스Andrew Psaltis

스트리밍 시스템 개발 전문가로서 이미 풍부한 경력을 가진 그는, 실시간 데이터에서 인사이트를 찾아내는 애플리케이션 개발에 주력하고 있다. 잠잘 때를 제외한 거의 모든 시간을 스트리밍 시스템에 대한 생각과 구현에 쏟으며, 고객들을 위해 다양한 규모의 스트리밍 시스템을 만들거나 개선한다. 또한 국내외 학술 대회를 통해 스트리밍 관련 내용을 발표하고 있으며, 다른 개발자들을 위한 강의도 진행하고 있다. 여가 시간에는 사랑스러운 아내와 두 명의 아이들과 함께 시간을 보내며, 자투리 시간 대부분은 라크로스를 시청하곤 한다.

역자 소개

최원영

카카오 광고추천팀에서 카프카 기반 실시간 데이터 파이프라인을 다루는 데이터 엔지니어. 최근에는 스트림 데이터 거버넌스를 달성하기 위한 아키텍처를 고민하며, 다양한 스트림 프로세싱 방법에 대해 학습하고 개발하고 있다. 궁금증과 도전 그리고 공유를 모토로 삼고 있으며 새로운 것에 호기심이 많으며 항상 적극적으로 탐구하는 개발자로 지내고 있다. 습득한 지식을 지속적으로 사내외로 공유하고자 노력하고 있으며 최근에는 『아파치 카프카 애플리케이션 프로그래밍 with 자바』를 집필했다. 옮긴이와 개발 관련 지식을 논의하고 싶다면 옮긴이가 운영 중인 개발 블로그나 개발 유튜브(데브원영 DVWY)을 방문하는 것을 추천한다.

•개발 블로그 : https://blog.voidmainvoid.net

•개발 유튜브 : https://bit.ly/devwonyoung

데브원영 DVWY

#Bigdata #DevOps #Hackathon #Blog #Tips 개발하면서 겪었던 많은 경험들을 공유하고자 합니다. 개발관련 다양한 내용에 대해서 알고싶으시다면 구독🔔 질문은 댓글💬 감사합니다!! contact : devwonyoung.biz@gm

www.youtube.com

출판사 리뷰

실시간 데이터를 완벽히 이해하고 잘 다루고 싶은

모든 사람들을 위한 지침서!

엄청난 양과 속도로 생성되는 실시간 데이터를 이해하고 처리해야 하는 '빅데이터 시대'가 도래했습니다. 실시간 위치 데이터를 토대로 주변 맛집을 추천하고, 센서 데이터를 통해 기계의 결함을 추적하고, 고객이 매장을 떠나기 전에 디지털 영수증을 발급하는 등의 놀라운 작업들이 실시간으로 이루어집니다. 하지만 실시간 데이터를 처리하려면 스트리밍 파이프라인을 반드시 구축해야 하며, 스트리밍 파이프라인 구축 방법은 기존 동기 방식 데이터 처리와는 다르기 때문에 개발자들에게 많은 혼동을 야기하고 있습니다.

이 책은 빠르게 흐르는 스트리밍 데이터를 처리하는 방법을 알려 주는 입문서입니다. 풍부한 그림과 함께 실시간 데이터 처리에 필요한 다양한 개념을 설명하며, 예제 코드와 활용 사례들을 통해 스트리밍 데이터를 분석하고 공유 및 저장하는 애플리케이션을 만드는 방법도 학습합니다. 또한 스트리밍 애플리케이션에서 스파크, 스톰, 아파치 카프카, 플링크, 레빗엠큐 등 다양한 기술의 역할을 소개하고, 기술 종류별로 발생할 수 있는 여러 장애물들과 그에 따른 해결 방안을 알려줍니다. 최종적으로 스트리밍 데이터 아키텍처를 그리는 방법과 세부 구축 방법들도 배우게 됩니다. 이 책을 통해 실시간 데이터 수집, 처리, 저장에 대한 아키텍처를 완벽히 이해하고 현업 실무에 적용해 보세요.

<이 책이 필요한 사람>

• 데이터 파이프라인을 개발하고 구축해야 하는 데이터 엔지니어 및 백엔드 엔지니어

• 스트리밍 애플리케이션 기반의 엔터프라이즈 아키텍처를 구축하고 싶은 개발자

• 데이터 플랫폼 팀을 이끌고, 데이터 기반 의사결정을 내려야 하는 기업 임원

• 데이터 기반 엔지니어링 및 데이터 플랫폼 아키텍처에 관심 있는 모든 사람

[도서 오탈자 제보 & 질의응답 게시판 바로가기]

'새로 나온 책' 카테고리의 다른 글

아이패드로 시작하는 음악 프로듀싱 with 개러지밴드 (1)	2023.01.26
파이썬으로 배우는 음성인식 (2)	2023.01.06
데이터를 엮는 사람들, 데이터 과학자 (0)	2022.12.29

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

상세 컨텐츠

본문 제목

본문