데이터 분석 기법의 바이블!
데이터 과학 분야의 살아있는 전설이자 R 사용자들의 영웅으로도 불리는 해들리 위컴의 대표작인 《R for Data Science》의 번역서를 소개합니다. 개럿 그롤문드와 함께 쓴 이 책은 저자들의 경험뿐만 아니라 R 커뮤니티의 많은 사람과 나눈, 수많은 (직접 및 온라인) 대화의 결과물입니다. 한국어판을 기다리시다 출판사로 문의하시는 분들도 참 많으셨는데요. 드디어 발간됩니다.
R로 시작하는 데이터 과학의 여정
《R을 활용한 데이터 과학》은 R을 활용하여 원 데이터로부터 지식과 통찰을 끌어내는, 데이터 과학의 분석 기법을 알려주는 길잡이 책입니다. R, RStudio와 R 패키지 모음인 tidyverse를 중심으로, 데이터 분석을 빠르고 능숙하고 재미있게 작업할 수 있도록 설명합니다. 제목부터 왠지 이 책 한 권만 읽어도 R와 데이터 과학을 모두 알 수 있을 것 같은 느낌이 들지 않으신가요? 하지만 두 저자들은 ‘서문’에서 다음과 같이 조언합니다.

이 주요 도구를 사용하는 방법은 아래 그림처럼, 데이터를 불러오고(import) 정리한 후(tidy) 변형(transform), 시각화(visualize), 모델링(model)을 반복하여, 의미 있는 분석을 한 후에 이를 남들과 공유(communicate)하는 것을 말합니다.

데이터 과학자로서 사고하고 문제 해결책을 찾아가는 로드맵
두 저자는 앞서 밝힌 목표대로 데이터 과학의 전반적인 과정을 다루는 동시에 R의 주요 도구를 상세히 설명합니다. 데이터 과학 프로젝트의 전 과정을 단계별로 나누어 각 장마다 예제로 시작한 다음, 각 절의 연습문제를 통해 학습한 내용을 확인할 수 있도록 구성하여, 일련의 과정을 큰 그림으로 이해할 수 있도록 돕습니다. 처음 R을 접하는 독자들이라도 꾸준히, 차근차근 연습하고, 또 연습하기를 반복한다면 이 도구들을 사용하여 데이터 과학을 빠르게 수행할 수 있게 될 것입니다.
이 책에서 다루는 내용입니다.
- 길들이기: 데이터셋을 분석에 편리한 방식으로 변형하기
- 프로그래밍: 데이터 분석 문제를 더 쉽고 명확하게 해결할 수 있는 강력한 R 도구 습득하기
- 탐색하기: 데이터를 탐색하고 가설을 생성하여 빠르게 테스트하기
- 모델링: 데이터셋에서 실제 ‘신호’를 포착하는 저차원의 요약 제공하기
- 의사소통: 설명글, 코드, 결과를 통합하는 R Markdown 배우기
이 책을 추천해주신 분들의 이야기입니다.


번역서도 웹북으로 부분 공개!
이 책의 저자들은 R 패키지 생태계를 함께 이루고 있으며, 책에서도 소개된 bookdown 패키지를 활용하여 책 내용을 웹북으로 제작하여 공개(https://r4ds.had.co.nz)해 놓았습니다. 한국어로 공역하신 김설기 님께서도 이 중 가장 실무에 도움이 될 만한 ‘2부 데이터 길들이기(7장~13장)’ 부분을 웹북으로(https://sulgik.github.io/r4ds) 공개해 주셨습니다. 미리보기 클릭! 😎
데이터 과학 입문자와 실무자 모두의 필독서
이 책은 데이터 과학에 입문하는 이들에게는 훌륭한 안내서가, 이미 어느 정도 알고 있는 이들에게는 그 내용을 체계적으로 정리해 줄 핵심 활용서가 될 것입니다.
《R을 활용한 데이터 과학》은 다음 서점에서 구입하실 수 있습니다. 🙂
Yes24 | 교보문고 | 알라딘 | 인터파크
정오표는 여기에서 보실 수 있습니다.