한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
처음 책의 제목을 들었을 때, "엑셀, 파이썬, R을 다 활용한다고? 파이썬 하나로도 부족할텐데.."라는 생각이 가장 먼저 들었습니다. 하지만, 실제로 제가 업무하는 환경에서는 엑셀로 데이터를 확인할 때도 있고, 파이썬으로 확인할 때도 있었습니다. 기본적으로 "데이터 분석은 파이썬이나 R로 해야되는 것 아니야?"라는 자주했었던 것 같은데, 책의 저자는 엑셀과 코딩은 서로 경쟁의 대상이 아닌, 상호 보완적인 관계라고 설명하고 있습니다. 이 말을 곱씹어보니, 저도 늘 데이터 분석은 파이썬으로 해야지! 라고 생각하면서 실제로는 엑셀 스프레드시트로 확인하는 것이 더 직관적이고 빠를 때가 있다는 것을 알게 되었습니다. 아래에서 이 책의 특징과 어떤 분들이 읽어보면 좋을 지 등 다양한 내용을 소개하도록 하겠습니다
1. 대상 독자 및 목차 소개
이 책은 파이썬이나 R은 다뤄보지 않았고 설치조차 해보지 않은 분, 데이터 분석을 해보고 싶은 분에게 추천해드릴 수 있을 것 같습니다. 실제로 현업에서 데이터 분석을 파이썬이나 R로 하시는 분보다는 엑셀로 데이터를 다루고 있지만, 데이터분석을 따로 배워보지 않은 분이라면 유용할 책입니다! 엑셀, 파이썬, R을 모두 다루다보니 깊은 내용을 다루고 있지는 않습니다. 만약, 파이썬이나 R로 깊이 있는 데이터 분석을 진행하시는 분이라면 이 책보다는 해당 언어를 더 깊게 다룬 다른 책을 추천드릴 것 같습니다. 이 책을 읽어보신 후에는 파이썬, R을 활용하여 간단한 가설검정을 진행해볼 수 있는 수준이 될 것입니다.
책 이름에서 알 수 있듯이, 책은 크게 엑셀(데이터 분석 기초), R, 파이썬 순으로 소개합니다.
Part 1에서는 엑셀로 배우는 분석의 기초 내용을 다룹니다. 데이터 분석을 하기 전에 알아야 할 기본 지식들을 엑셀 실습과 병행하여 소개하고 있습니다. EDA(탐색적 데이터 분석), 확률분포, 통계적 추론의 기초, 상관 분석과 회귀 분석 등 기초적인 내용을 소개합니다.
Part 2, Part 3에서는 Part 1에서 다뤘던 내용들을 R, 파이썬을 다루는 파트입니다. 특히, 처음에 R이나 파이썬을 시작할 때, 프로그램 설치부터 각 언어의 특징, 시각화, 간단한 데이터 분석까지 진행합니다.
2. 이 책의 특징
데이터 분석을 처음 공부할 때, (개인적으로) 이론을 다 채우고 하나씩 프로그램으로 옮기는 것보다는 직접 부딪혀보며 느끼는 것이 더 좋은 방법이라고 생각합니다. 이 책에서는 적당한 설명과 실습을 병행하고 있다는 점에서 처음 공부하시는 분들에게 도움이 될 것이라 생각합니다. 그리고 무엇보다 좋았던 것은 연습 문제를 제공하고 있다는 점입니다. 독자로 하여금 그냥 읽고 넘어가기 보단 직접 실습을 해볼 수 있도록 데이터와 정답을 깃헙을 통해 제공합니다. 추가적으로 처음 공부하시는 분들이 쉽게 실수할 만한 내용(파이썬 인덱싱 부분)은 다양하게 접하게 하여 익숙하도록 도와주고 있습니다.
3. 총평
처음으로 데이터 분석을 배워보고 싶다고 생각하는 분에게 도움이 될 수 있는 책입니다. 데이터 분석은 직접 데이터를 다뤄보고 변형해보는 과정 등을 통해서 배우는 것이 많다고 생각하기에 이 책을 추천드립니다. 책 중간 중간에 존재하는 연습 문제들을 직접해보시는 것만으로도 많은 것을 얻어가실 것이라고 생각합니다.