우리 모두는 날마다 데이터를 활용한 편리한 서비스 속에서 살고 있습니다. 구글 검색 기능, 넷플릭스에서 새로운 영화를 추천해 주는 서비스, 쇼핑몰에서 내가 구매할 만한 상품을 추천해 주는 기능 등은 모두 빅데이터 분석에 기반한 서비스입니다. 이들은 모두 엄청난 양의 데이터를 분석해서 사용자가 선호할 만한 아이템을 추측하고 제시합니다.
데이터 과학은 빅데이터 시대에 생겨난 학문 분야로, 기존에는 볼 수 없던 거대한 데이터를 다룬다는 점이 특징입니다. 컴퓨터 하드웨어 기술과 웹 관련 기술의 비약적인 발전으로 과거와는 비교할 수 없는 규모의 데이터가 생성되고, 그 데이터를 저장하는 것이 가능해졌습니다. 하지만 데이터를 한곳에 모아놓는다고 해서 저절로 의미 있는 정보가 되는 것이 아닙니다. 가설을 세우고 모델을 만들어서 데이터를 처리하고, 이를 분석해서 유의미한 결과를 얻어내야 합니다. 데이터 과학은 대량의 데이터를 가공하고 처리하고 분석, 활용하기 위해 필요한 모든 기술을 통틀어 지칭합니다. 여기에는 통계학, 수학, 프로그래밍, 기계학습 등의 분야가 포함됩니다.

《데이터 과학 트레이닝 북》은 저자가 도쿄대학에서 진행한 강좌를 바탕으로 하고 있습니다. 내용은 파이썬을 바탕으로 진행합니다. 파이썬은 코딩이 쉽고 데이터 분석에 편리한 라이브러리가 많아 데이터 과학에서 널리 쓰이고 있습니다. 이 책에서는 파이썬과 파이썬 라이브러리인 넘파이, 사이파이, 판다스, 매트플롯립을 활용해 실제 데이터를 처리하고 분석하고 시각화하는 방법을 다룹니다. 파이썬의 기본 문법, 파이썬 라이브러리의 기본적인 사용법부터 수학, 확률 통계, 머신러닝까지 데이터 과학에 필요한 내용들을 폭넓게 살펴봅니다. 되도록 현장에서 사용할 수 있는 실용적인 내용으로 구성했고, 수많은 연습문제를 제공하여 문제를 풀어보면서 데이터 분석에 필요한 기초적인 지식을 이해하고 습득하도록 했습니다.
이 책은 파이썬 기초부터 사이킷런을 통한 머신러닝 모델 구현까지 정리한 데이터 과학 필독서다. 중요한 내용들만 간결하면서도 명확하게 정리했고, 체계적인 연습 문제와 해답을 제공하여 독자들이 부담 없이 데이터 과학을 연습할 수 있다. 단기간에 데이터 과학의 기초를 다지고 싶은 모두에게 이 책을 추천한다.
김한결(서울대학교병원 연구원)
《데이터 과학 트레이닝 북》은 이론과 파이썬 프로그래밍을 접목하여, 수학적 증명이 아닌 데이터 실습으로 이론을 이해할 수 있도록 구성되었습니다. 풍부한 예제를 통해 자연스럽게 파이썬 문법을 익힐 수 있는 실용적인 책입니다.
안세진(SK 텔레콤)
이 책의 저자는 데이터 과학자를 길러내는 것을 목표로 이 책을 집필했습니다. 데이터 분석에 필요한 기초적인 지식을 살펴보고 연습문제를 통해 직접 실습해 보도록 하여 독자를 데이터 과학자로 훈련시킵니다. 또한 추가적으로 어떤 것을 공부해야 하는지, 어떻게 공부해야 하는지까지 조언해 줍니다. 데이터 과학자로서 기본기를 다지고 싶다면 《데이터 과학 트레이닝 북》으로 시작해 보세요.
이 책에서 다루는 내용
▶ 파이썬, 넘파이, 사이파이, 판다스, 매트플롯립 사용법
▶ 확률, 통계, 추정, 회귀 기초
▶ 넘파이, 사이파이를 활용한 과학 계산
▶ 판다스를 이용한 데이터 다루기
▶ 매트플롯립을 이용한 데이터 시각화
▶ 주피터 노트북 사용법
▶ 사이킷런을 이용한 머신러닝 모델 구현
《데이터 과학 트레이닝 북》은 다음 서점에서 구입하실 수 있습니다.