한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
우선 이번 달에 이 책을 리뷰할 수 있어서 너무 좋았습니다. 회사 업무적으로도 머신러닝을 사용하기 시작하면서 실무에 적용해 볼 수 있었습니다. 또한 ADP라는 자격증을 준비하고 있는데, 보통회차와는 다르게 이번 시험에서는 전처리가 기본 조건으로 주어졌습니다. 시간 부족으로 아쉽게 이번 회차에 ADP 실기에 떨어지게 되었는데, 이 책을 공부하면서 확실히 돌아오는 회차에서는 합격할 수 있다고 확신할 만큼 좋은 책입니다. 혹시나 ADP 실기 시험에 어떤 책을 가져갈까 고민이시라면, 이 책을 꼭 추천드립니다.
1. 대상 독자
이 책은 머신러닝과 딥러닝에 대해 공부해보고 싶은 분이라면 가장 먼저 추천할 만큼 좋은 책입니다. 물론, 파이썬에 대한 활용법은 어느 정도 알고 있는 분들(라이브러리 활용, 기본 문법)에게 확실히 도움이 될 것입니다. 보통 머신러닝이나 딥러닝 책이라고 하면, 모델을 주로 다루는 경우가 많습니다만, 이 책은 머신러닝이나 딥러닝을 사용하기 위한 처음부터 끝과정까지 모두 다루는 책이라고 볼 수 있습니다. 또한 현업에서 머신러닝 모델링하시거나 관련된 업무를 하신다면, 하나쯤 가지고 있으면 업무에 도움이 될 수 있을 것 같습니다.
2. 책에서 다루고 있는 내용 소개
이 책에서는 데이터 불러오는 방법부터 전처리, 모델링, 모델 평가, 신경망 모델링, 서빙까지 실무에서 필요한 일련의 과정을 처음부터 끝까지 다루고 있습니다.
우선, 데이터를 불러오는 방법 중 흔히 알고있는 엑셀, csv 이외의 JSON, SQLite DB, 구글 시트 등 다양한 소스로부터 불러오는 방법도 소개하고 있습니다. 이 부분에서는 단순히 pd.read_csv 만 하셨던 분이라면, 다양한 환경으로부터 원하는 정보를 가져오는 방법을 배울 수 있습니다.
데이터를 불러왔으면, 데이터를 우리가 활용할 수 있도록 전처리하게 됩니다. 저도 이 책을 읽으면서 생각보다 알고 있지 못한 전처리 방법을 습득할 수 있었습니다. 테이블 형태의 데이터에서 주로 다루는 수치형, 범주형 외에도 가장 번거로운 날짜형태의 데이터, 이미지, 텍스트까지 많은 영역에서의 전처리 방법을 다룹니다. 단순하게, 1가지 방법에 대해서 소개하기 보다는 다양한 방법을 소개하고, 어떤 부분에서 다른지, 참고할 만한 자료를 제공하고 있는 점이 가장 좋았습니다.
텍스트 처리와 이미지처리 파트에서는 전처리에 필요한 내용뿐 아니라, 간단하게 분류기를 만들어보는 예제까지 진행할 수 있도록 구성되어 있습니다. 특히, 저의 경우에는 다양한 이미지처리를 많이 해본 경험이 있는데 이미지의 특징을 추출하기 좋은 과제 및 예시들이 많이 포함되어 있습니다.
모델링 부분에서는 각각의 내용에 대해 굉장히 디테일하게 설명하고 있어서, 이 책 한 권이면 ADP 시험에서 서술형 문제들은 충분히 설명할 만하다고 느껴졌습니다.
또한 마지막 장에서는 훈련한 모델을 저장하고 불러와서 바로 prediction 하는 방법, flask로 구성된 웹서버에 훈련한 모델을 서빙하는 방법 등 미니 프로젝트로 서비스 만들 때 필요한 내용이 담겨있어서 좋았습니다.
3. 책의 특징
책은 기본적으로 과제 - 해결 - 설명 - 참고 순으로 216개의 과제를 풀어가는 방식으로 서술하고 있습니다. 모델링하거나, 전처리할 때, Min-Max Scaler를 쓸까, Standard Scaler를 쓸까 등 어떤 방법을 써야 할지 고민이 되는 문제들 위주로 작성되어 있어서, 읽어보면서 실무에 바로바로 적용할 수 있는 좋은 책입니다. 각 모델에 대한 설명도 충분하게 들어있으며, 적절한 그림과 코드가 배치되어 있어서 이해하기에도 수월한 책입니다.
4. 정리하기
머신러닝을 위주로 잘 공부하고 싶은 분, ADP 실기 보러 가야 되는데 머신러닝 교재로 뭘 쓸지 고민이 되시는 분, 업무에 머신러닝을 도입하려고 하시는 분들에게 도움이 될 책입니다. 꼭 한번 읽어보시길 추천드립니다. 저도 이번 기회에 이 책으로 10월에 있는 ADP 실기를 차근차근 준비해보려 합니다. 긴 글 읽어주셔서 감사합니다.