상세 컨텐츠

본문 제목

데이터 리터러시 쑥쑥 올리고 데이터 드리븐 문화를 정착시키기 위한 기초 지식

책 속으로

by 비제이퍼블릭 2023. 4. 24. 15:07

본문

데이터의 시대! 데이터는 금광에 비유되곤 합니다. 방대한 데이터 속 금을 캐낸다면 세계를 이해하는 것도 미래를 예상하는 것도 가능합니다. 데이터 분석을 통해 기업은 매출을 개선하고 유망한 사업 분야를 개척할 수도 있습니다.

기업만이 아닙니다. 곧 도래할 데이터를 마주해야만 하는 시대에서 살아남기 위해 누구나 데이터 문해력을 기를 필요가 있습니다. 데이터 분석법을 모른다면 데이터를 잘 다루는 일부 사람들이 모든 의사 결정을 독점하는 양극화가 도래할지도 모릅니다.

또한 제대로 그리고 깊게 데이터를 분석하는 방법을 배운다면 방대한 데이터로 보석을 만들 수 있겠죠?

특히 성과를 개선하고 싶은 마케팅 담당자 혹은 시각적 효과를 극대화하고 싶은 데이터 분석가, 사내에 데이터 드리븐 문화를 공유하고 싶은 관리자라면 데이터 분석법과 시각화를 꾸준히 연습하면 좋습니다!

 

오늘은 데이터 분석법과 시각화를 학습하기 이전에 꼭 알아야 하는 그동안 아리송했던 관련 개념을 확실히 정리해보려고 합니다.

 

시작하기 전에 퀴즈를 하나 풀어볼까요?

정답은 바로 ‘YES’입니다. 사실 상인들은 대부분 훌륭한 데이터 분석가인데요. 고객 정보를 기억하는 일에 누구보다 유능하기 때문입니다. 예를 들어 수요일마다 시장에 오는 여성이 있는데 상인은 주변을 관찰하다가 그 여성이 칭찬에 약하다는 걸 알게 됐죠. 그러면 다음 주 수요일 여성이 가게 앞을 지나갈 때 “안녕하세요 부인! 오늘 입은 드레스 색상이 너무 고급스러워요. 오늘 저희 가게의 토마토는 최상급이랍니다.”라고 말을 걸면 부인은 구매를 하게 되고 매출이 오르게 됩니다.

 

또 다른 부인이 아이를 정말 아끼고 아이는 단 과일을 좋아한다는 걸 기억해둔 상인은 다시 한번 말을 겁니다. “부인 오늘 저희 가게에 청포도가 정말 달고 맛있어요! 사탕처럼 달콤해 아이들이 좋아하더라고요.” 이 모든 행동은 바로 훌륭한 데이터 분석과 행동의 사례가 될 수 있습니다.

 

데이터 관련 지식과 상식

빠른 처리와 효율을 위해 데이터를 개선하는 법: 정규화

 

정규화는 무엇인가요?

우리가 상품을 구입하면 어떤 일이 벌어질까요? 데이터가 생성됩니다. 고객 정보와 구매한 상품 정보가 어떠한 곳에 저장되어야 판매자가 그 정보를 필요할 때마다 읽어서 상품을 제대로 배송할 수 있습니다. 보통 이러한 데이터를 저장하는 장소를 데이터베이스(DB)라고 부릅니다!

 

끊임없이 대량의 데이터가 쌓이면 컴퓨터에도 부담이 될 수 있습니다. 정규화는 같은 정보를 최대한 효율적으로 저장해 데이터를 컴퓨터에 최소한으로 적재하는 기술을 말합니다.

 

아래 그림을 참고하면 이해가 쉬우실 거예요. 데이터베이스를 상상하기 어렵다면 흔하게 사용되는 엑셀을 떠올리며 개념을 적용합시다!

출처-데이터 드리븐 분석 비법, DAY4.데이터란 무엇인가

 

쌓여가는 방대한 데이터를 활용하기: 정보시스템

정보시스템은 보관된 데이터를 활용해 정보를 만들어 내기 위한 구조를 말합니다. 데이터의 삽입, 삭제, 수정 중심인 운영 시스템과 함께 운영됩니다. 기업 데이터에서 정보를 얻기 위해 필요로 하는 구조라고 할 수 있는 정보 시스템을 위해서는 주로 다음 세 가지 요소가 필요합니다.

 

📌 ETL (Extract Transform Load) 시스템: 운영 시스템에서 데이터를 얻는다.

📌 DWH(데이터 웨어하우스): 취득한 데이터를 모아두기 위한 장소

📌 BI (비즈니스 인텔리전스): 모아둔 데이터를 조회해 참조하고 분석, 의사 결정에 활용한다.

 

아래 그림과 설명을 보면 운영 시스템에서 데이터를 변환 및 추출해 정보 시스템을 만들고 비즈니스 인텔리전스 툴로 가공해 사용자가 인사이트를 얻는 과정을 이해할 수 있을 거예요.

출처-데이터 드리븐 분석 비법, DAY4.데이터란 무엇인가

방대해지는 데이터를 보관하기 위한 데이터 저장소: 데이터 웨어하우스

위에서 데이터베이스를 정규화하는 방법을 알아봤어요. 정규화는 테이블에 입력할 데이터양을 줄이고 빠르게 처리하는 구조라고 했습니다. 그런데 반대로 데이터 조회 시 여러 테이블을 함께 조회해야 해서 시간이 걸리고 성능 이슈가 생깁니다.

반응 속도 및 성능은 시스템의 성공과 실패를 가를 수 있는 중요한 문제입니다. 처리 속도가 느려서 웹상에 정보가 늦게 뜬다면 고객을 잃을 수도 있죠. 검색 위주의 의사 결정 업무를 위한 정보 시스템 구축을 위해서는 비정규화된 테이블을 운영하는 게 좋습니다.

그래서 정보 시스템 데이터베이스는 크기가 커지게 됩니다. 비정규화로 중복 데이터가 들어가게 되고 과거 트렌드 분석 등을 위해 장기간의 데이터를 보관하기 때문입니다. 이 데이터들을 어디에 보관해야 할까요? 데이터 창고가 있으면 좋지 않을까요? 이런 생각에서 데이터 웨어하우스(data warehouse)가 탄생했습니다.

데이터 웨어하우스의 데이터들은 방대하기에 조회 전 사전 집계해두면 성능을 올릴 수 있습니다. 대량의 데이터 중 필요한 부분을 집계하는 시스템이 바로 데이터 마트(DM)큐브입니다. 그럼 데이터 마트와 큐브는 어떻게 다를까요? 큐브는 데이터 마트보다 집계 조건이 더 복잡하다고 생각하시면 돼요. 복수의 차원을 조합해 집계하는 멀티 차원 데이터베이스가 바로 큐브입니다.

 

BI 솔루션으로 시작하는 데이터 드리븐

BI 툴은 사용자가 데이터를 입맛에 맞게 눈으로 확인하고 분석할 수 있도록 도와주는 솔루션입니다. 데이터베이스에 저장된 데이터를 정보시스템으로 구축한 이유가 인사이트를 얻기 위해서라는 걸 생각하면 BI 솔루션을 잘 다룰 수 있어야 한다는 생각이 드네요. 열심히 저장하고 집계한 데이터에서 의미 있는 결론을 도출할 수 있다면 수준 높은 데이터 문해력을 지닌 사람으로 성장할 수 있겠죠?

 

다양한 BI 솔루션 중 태블로를 이용하는 법을 배우고 싶다면 데이터 드리븐 분석비법을 읽어보세요! 태블로와 샘플 데이터로 훌륭한 인사이트를 도출하는 방법을 자세히 다루고 있어요.

 

육하원칙을 응용해 데이터로 스토리텔링 하는 법, 차트를 해석할 때 의식해야 할 사항, 분석 결과를 시연할 때 유용하게 쓸 수 있는 아이디어, 타인의 행동을 이끌어내는 강력한 스토리 만드는 법, 수준 높은 데이터 시각화 방법을 위한 자세한 정보를 담았습니다.

데이터 드리븐 문화를 위해 각 부서가 협력하기 위한 분석 플랫폼 구축하는 법도 알 수 있어요!

단순 태블로 사용법을 소개하는 것이 아닌 데이터로 의사 결정하고 데이터 문해력을 키우는데 필요한 내용을 깊이 있게 학습할 수 있습니다.

 

저자인 Master KT(다나카 가오리)는 2015년부터 태블로를 활용해 연간 300명이 넘는 고객에게 비즈니스 컨설팅을 진행한 데이터 분석 고수입니다. KT의 T를 태블로에서 가져왔을 정도로 태블로에 대한 애정이 남다릅니다. 태블로가 저자의 일부라고 표현할 수 있을 정도라고 하는데요. 저자의 8년 노하우를 얼른 배워 봐야겠죠?

 

*태블로는 비즈니스 인텔리전스(BI) 솔루션이자 툴로 코딩 없이 쉽고 빠르게 데이터 분석을 도와줍니다. BI 솔루션에는 태블로 이외에 파워 BI, 스팟파이어(Spotfire)가 있습니다.

 

- 이 글은 데이터 드리븐 분석 비법 도서 내용의 일부를 편집해 작성했습니다.

 

▼책 구매하러 가기▼

 

관련글 더보기

댓글 영역