프로그래밍 언어들이 대부분 범용 언어를 지향하는 데 반해 R은 통계 분야에 특화된 언어로 인기를 끌고 있습니다. 특히 오픈 소스로 개발되는 언어여서 비싼 상용 솔루션에 의존하지 않고도 R이 제공하는 풍부한 패키지로 다양한 통계 분석을 할 수 있다는 점이 큰 장점입니다.

인사이트에서도 그동안 R 책 여러 권(『R Cookbook』, 『R Graphics Cookbook』, 『R을 활용한 데이터 시각화』)과 R 관련 책(『해커 스타일로 배우는 기계 학습』)을 소개했는데요. 이번에는 조금 독특한 R 책을 소개하려고 합니다. 바로 『데이터 분석으로 배우는 알짜 R 테크닉』입니다.

이 책의 지은이 재리드 랜더는 랜더 애널리틱스 대표로 일하면서 대학에서 외래 교수로 학생들을 가르치는 이력을 보유하고 있습니다. 재리드 랜더는 평소에 ‘대학원에서 R을 이렇게 배우면 좋을 텐데’ 하는 생각을 하게 되었고 실제 컬럼비아 대학교에서 학생들을 가르치면서 이 책을 구상, 집필하게 되었습니다.

사람은 말, 즉 자연 언어를 배울 때 처음부터 모든 발음과 문법을 익히고 언어생활을 하지 않습니다. 처음에는 엄마가 들려주는 말소리 중에서 자신이 따라 할 수 있는 것을 시작으로 발음을 익히고 좀 더 자라서 교육 과정에 편입되면 단계별로 문법을 배우게 됩니다. 프로그래밍 언어도 마찬가지로 모든 문법을 처음부터 모조리 머릿속에 집어넣고 코딩을 하는 경우는 별로 없습니다.

이 책은 이렇듯 R의 모든 문법을 시시콜콜하게 다 다루는 것이 아니라 R에서 자주 쓰고 핵심적인 기능에 집중해 책의 내용을 전개합니다. R의 핵심 기능으로 필요한 작업의 80%를 해 낼 수 있게 안내하는 것입니다.

R의 기초적이고 핵심적인 문법을 소개한 후에는 R의 실제 쓰임새에 집중합니다. 앞서 R은 통계에 특화된 언어라고 말씀드렸는데 이 책에서는 실제 데이터 분석 프로세스와 비슷한 예제를 통해 R의 주요 기법을 적용해 가며 익힐 수 있도록 이끕니다. 기초 분석, 모델링, 모델 선택 및 정교화, 모델 검증 등의 과정이 순서대로 잘 설명되어 있어 책을 따라가다 보면 자연스럽게 데이터 분석 과정을 몸에 익힐 수 있게 됩니다.

이 책의 또 다른 특징으로는 실제 업무에서 부딪히게 되는 다양한 문제를 풀어가기 위한 주요한 접근 방법이 선별되어 제시되어 있다는 점입니다. 재리드 랜더는 자신의 현업 경험을 바탕으로 현실 생활에서 흔히 접할 수 있는 예제를 들어 실용적이고 실질적인 알고리즘과 분석 기법들을 제시하고 있습니다.

물론 한 분야를 파고들어가는 책이라고 볼 수는 없지만 더 깊이 있고 자세한 내용을 찾으려면 뭘 알아야 하는지 알려주는 데 충실하다는 점도 이 책의 장점이라고 볼 수 있습니다.

R의 핵심 기능을 빨리 공부하고 싶거나 현대적인 통계 분석·데이터 처리 기법에 R을 어떻게 적용하는지 관심 있는 분들에게 권합니다.

다음 인터넷 서점에서 구입하실 수 있습니다.

[ Yes24 ] [ 교보문고 ] [ 알라딘 ] [ 인터파크 ]

정오표