한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
데이터 드리븐 리포트 책을 처음 봤을 때, 소제목이 굉장히 매력적으로 다가왔습니다. 상사와 고객을 설득하는 데이터 기반의 의사결정은 데이터분석가에게 회사 생활에서 가장 중요한 부분이라고 생각합니다. 데이터 분석가는 늘 많은 데이터 속에서 새로운 인사이트를 찾아내지만, 이 내용을 어떻게 효과적으로 전달할 지 고민하는 경우가 많습니다. 개인적으로는 저처럼 주변 동료들이 데이터 전문가보다는 도메인 전문가들이 많은 곳은 더더욱 중요한 것 같습니다.
1. 대상 독자
이 책은 의사결정을 위해 다양한 데이터를 사용하고 분석하시는 분들에게 도움이 될 만한 책이라고 생각합니다. 당연히, 파이썬을 다루시는 분이라면 더 잘 이해가 되고 도움이 많이 되실 것입니다. 그럼에도 데이터를 통해 효과적으로 보고서를 작성하고 싶으신 분들에게도 도움이 될만한 것이 많이 있습니다. 한 예로, 책의 내용을 살펴보다보면 독자가 matplotlib이라는 시각화 라이브러리를 몰라도, gpt를 활용해서 효과적으로 시각화하는 방법을 알려줍니다.
특히나, 책에서는 다양한 상황을 가정하여, 회사에서 일어날 법한 대화들을 통해 어떻게 효과적으로 전달할 수 있는 지에 대해서 소개하고 있습니다.
2. 책의 내용 및 장단점
책의 목차는 다음과 같습니다.
- 1장. 데이터 드리븐 보고
- 일상의 보고 상황
- 데이터 드리븐 의사결정이란
- 데이터 드리븐 보고란
- 데이터 드리븐 보고 5원칙
- 2장. 데이터 드리븐 보고 절차
- 데이터 드리븐 보고 전략
- 분석 전 알아야 하는 용어
- 분석 목표 설정
- 계획서 작성
- 데이터 선정
- 분석방법 결정 및 해석/검증
- 보고 대상자에 따른 보고 방식
- 3장. 데이터 드리븐 보고 실전 사례 with 챗GPT
- 데이터와 친해지자: EDA & 기술통계
- 데이터도 백문이 불여일견: 데이터 시각화
- 당신의 질문에 데이터가 답한다: 가설검정
- 데이터에 맞는 직선을 찾아라: 선형회귀분석
- 합격이냐 불합격이냐: 분류 예측
- 대량의 텍스트 데이터를 이해하다: 토픽 모델링
- 4장. 데이터 드리븐 커뮤니케이션
- 데이터 드리븐 커뮤니케이션의 필요성
- 데이터 드리븐 커뮤니케이션 구성요소
- 데이터 드리븐 커뮤니케이션 방법
- 스토리텔링
- 데이터 드리븐 커뮤니케이션 체크리스트
- 부록
- 구글 코랩 시작하기
- 라이브러리 설치하기
- 데이터 훑어보기
파이썬에 익숙하지 않고, 데이터 분석을 해보지 않으신 분이라면, 2장에서 기본적인 내용에 대해서 소개하고 있으니, 그것들을 참고하면서 읽어보시면 도움이 많이 될 것 같습니다. 주의해야할 점은 회사의 데이터로 직접 적용을 시키고자 한다면, 3장에서 챗GPT에 고스란히 데이터를 넣는 것은 위험할 수 있습니다. 일부 변환시키거나 동일한 포멧이지만 임의의 숫자를 넣은 데이터로 변경한 뒤 활용하시는 것을 추천드립니다.
이 책을 읽으면서 가장 좋았던 일부분을 발췌했습니다. 단순히 결과만 도출하는 것에서 끝나는 것이 아니라, 어떤식으로 해석하고, 인사이트를 줄 것인지에 대해 디테일하게 적힌 부분이 좋았습니다.
또한 다양한 시각화를 진행할 때, 어떻게 전달하느냐에 따라 어떤 차트를 사용하는 것이 좋을 지를 알려주는 내용도 포함되어 있습니다. 이러한 내용은 특히나 초년생인 데이터 분석가들에게는 도움이 많이 되는 부분이라고 생각합니다.
당연하게도, 어떻게 전달하느냐에 초점이 맞춰져있다보니, 깊은 분석 방법들을 다루지는 않습니다. 그럼에도 데이터분석가라면 한번 쯤은 반드시 읽어보면 좋을 책임은 분명한 것 같습니다. 단순하게 팩트만 전달하는 사람들에게 좋은 가이드가 될 수 있을 것 같습니다.
3. 총평
많은 초년생 분석가들은 다양한 데이터 중에서 어떠한 내용을 강조시켜야할 지, 어떻게 내용을 전달할 지에 대한 고민을 많이 하고 계실 것 같습니다. 데이터 드리븐 리포트는 이러한 궁금증에 대해 어느 정도 해소시켜줄 수 있는 책이라고 말할 수 있습니다. 이론만 주구장창 들어있기보다는 실제 상황을 가정해서 기술하고 있어서, 생각보다 쉽게 읽어지는 책입니다. 이 책은 실무에서 충분히 도움될 수 있는 책이므로 꼭 한번쯤은 읽어보시기를 추천드립니다. 비록 다양한 통계적인 기법 부분에서는 부족한 부분이 있으나, 그런 것들을 어떻게 활용해서 근거자료로 사용하게 되는 지를 알려주는 책입니다. 지식의 깊이보다는 실제 업무 과정 속에서 어떻게 해야 하는가에 집중해보면서 읽으시면 많은 도움이 될 것 같습니다.