1 min to read
<나는 리뷰어다> SQL로 시작하는 데이터 분석
Review
서평
바야흐로 빅데이터의 시대를 맞이하여 여러 IT기업에서 지원자격과 우대사항으로 SQL(Structured Query Languange)에 대한 역량을 제시하는 것을 볼 수 있습니다. 개발자가 아니더라도 기본적인 수준의 SQL에 대한 역량은 중요해지고 있습니다. SQL이란 무엇이고, 데이터 분석에서 어떻게 활용될 수 있을까요?
최근 몇 년 사이에 컴퓨팅 성능은 급성장했고, 데이터 웨어하우스와 데이터 인프라스트럭처는 이러한 컴퓨팅 성능을 최대한 활용하도록 발전되어왔습니다. 이러한 흐름에 발맞춰 SQL은 데이터베이스에 접근하고, 데이터를 관리 및 처리하기 위해서 설계된 언어입니다.
책에서는 SQL이 무엇이고, 어떻게 활용되는지 그리고 실험을 위한 설계 방법까지 자세히 설명해주고 있습니다.
- SQL을 활용한 분석
- 데이터 준비
- 시계열 분석
- 코호트 분석
- 텍스트 분석
- 이상 탐지
- 실험 분석
- 복잡한 데이터셋 생성
- 결론
SQL은 다른 개발 언어에 비해 직관적이고, 상대적으로 쉬운 문법을 가지고 있기 때문에 기초적인 개념을 여러 웹사이트에서도 찾아 볼 수 있습니다. 하지만 분석을 주 업무로 하는 SQL사용자를 위한 자료는 전무합니다. 실습으로 활용할 수 있는 데이터가 많지도 않고, 왜 분석이 수행되어야 하는지에 대한 명확한 목적이 없는 경우가 대부분입니다.
물론 SQL문법을 잘 쓰는 것과 실제 데이터를 분석하고 인사이트를 도출하는 것은 완전히 다른 문제입니다. 저자는 이러한 점에 초점을 맞춰 실제 분석에서 활용되는 업무인 시계열 분석, 코호트 분석, 이상 탐지 등을 주제로 다루면서 SQL이 실제 데이터 분석을 하기 위해 어떻게 활용하는지 저자의 경험을 살려 자세히 설명해주고 있습니다.
더 나아가 이 책은 단순히 분석에서 끝나지 않습니다. 어떻게 A/B테스트를 설계하고 수행해야하는지에 대한 실험과정과 검정결과를 제시함으로써 분석에 대한 인사이트를 높일 수 있습니다. 또한 ETL을 통해 테이블을 언제 옮겨야 하지는지, 쿼리에 대한 포메팅 요령, 쿼리 실행 순서등을 소개함으로써 깊이 있는 과정을 소개합니다.
SQL를 단순히 학습하는 것을 넘어서 어떻게 사용되고, 분석에 활용될 수 있는지를 알려주는 깊이 있는 책이라고 생각합니다. SQL을 업무에 사용하는 데이터 분석가나 데이터 사이언티스트들은 탄탄한 기본기를 갖출 수 있고, 다양한 분석방법을 알아나갈 수 있는 좋은 책이기에 읽어보시기를 추천합니다.
* 한빛미디어 [나는 리뷰어다] 활동을 위해서 책을 제공받아 작성된 서평입니다.
Comments