조엘 그루스 지음 | 김한결 , 하성주 , 박은정 옮김 | 인사이트 | 2020년 3월 | 미리보기
데이터 과학의 기본 개념을 잡는 입문서
이 책은 데이터와 관련해서 가장 넓은 개념이라고 볼 수 있는 ‘데이터 과학’에서 쓰이는 모든 기초적인 기법을, 파이썬을 이용해서 가장 기초적인 것부터 구현한다. 정말 거의 모든 데이터 과학의 영역을 다룬다. 파이썬, 통계학, 머신러닝, 네트워크 분석, 데이터베이스, 데이터 엔지니어링 그리고 심지어 2판에서는 데이터에 대한 윤리까지 말이다. 데이터 과학에 입문하면서 거의 모든 내용을 두루 살펴보기에 이것만큼 좋은 책이 있을까?
최성철, 가천대 산업경영공학과 교수
세계적인 데이터 과학자인 조엘 그루스(Joel Grus)가 쓴 《밑바닥부터 시작하는 데이터 과학 2판》은 라이브러리나 프레임워크와 같은 도구를 사용하지 않고 ‘밑바닥부터’ 만들어 보며 데이터 과학과 관련된 알고리즘을 알려 주는 기본서입니다.
데이터 과학을 배우기 위해 꼭 필요한 기본적인 내용을 중심으로, 파이썬 프로그래밍과 수학, 통계학 기초를 다루며, 데이터 과학의 어려운 개념을 모두 설명하기보다는 꼭 알고 넘어가야 할 내용을 중심으로 담아냈습니다.
파이썬으로 익히는 데이터 과학의 기본 원리
수많은 데이터 과학 관련 책 사이에서 헤매고 있는, 데이터 과학에 발을 들이고자 하는 사람이라면 일단 이 책을 집어 들어도 좋을 것이다. 데이터에 대한 해박한 지식과 실무 감각을 모두 갖춘 저자는 데이터 과학 업무에서 실제로 꼭 필요한 지식을 잘 간추렸다. 파이썬 코드로 많은 내용을 효과적으로 설명하여, 데이터 분석의 기본 개념을 다지면서 흥미를 키우도록 도와준다.
권정민, ODK Media, 데이터 과학자
이 책은 크게 세 가지 내용으로 나눌 수 있습니다.
먼저 본격적으로 데이터 과학에 뛰어들기 전, 기본적인 파이썬 프로그래밍을 배웁니다. 데이터 과학자에게 필요한 내용을 짚어 주는 속성 강좌로, 파이썬에 익숙하지 않은 독자라면 일독을 권합니다.
이후에는 선형대수, 통계, 확률 등 데이터 과학 개념과 기술을 뒷받침하는 핵심적인 내용을 학습합니다. 샘플 데이터와 예제를 통해 원리를 들여다 보는 방식으로 기초적인 내용을 다룹니다.
여기에 추가적으로 다양한 통계와 확률 이론을 바탕으로 하는 분석 모델과 알고리즘에 대해서도 알아봅니다. 머신러닝의 기본 개념을 살펴보고, k-NN, 나이브 베이즈, 선형 및 로지스틱 회귀 분석, 의사결정나무, 신경망 및 클러스터링 모델 등을 배웁니다. 또한 추천 시스템, 자연어 처리, 네트워크 분석, 맵리듀스 등의 알고리즘을 살펴봅니다.
새로워진 2판
이번 2판에서 저자는 모든 코드와 예시를 파이썬 3.6으로 수정했고 타입 어노테이션 등 새로운 기능을 활용했습니다. 1판의 간단한 예시들을 ‘진짜’ 데이터셋을 사용하여 조금 더 현실적인 예시로 교체했습니다. 1판에서 훑었던 데이터 과학과 기계학습의 중요한 알고리즘들을 다듬고, 오늘날의 데이터 과학자들이 다루어야 할 딥러닝, 통계, 자연어 처리 등의 주제도 추가했습니다.
수학과 프로그래밍에 관해 관심 있는 독자라면, 데이터 과학자가 되기 위한 기초 이론과 기본적인 프로그래밍을 차근차근 익힐 수 있습니다.
데이터 과학 분야를 처음 접하는 분들이 보면 매우 좋은 책이다. 파이썬, 데이터 시각화, 선형대수, 통계, 데이터 전처리, 기계학습, 데이터베이스, 맵리듀스, 데이터 윤리 등 광범위한 주제를 명확히 설명하여, 데이터 과학에 대한 큰 그림을 그릴 수 있다. 특히 각 장 끝에 있는 “더 공부해 보고 싶다면”을 꼭 읽어보자. 사이킷런이나 텐서플로를 접하기 전에 먼저 이 책을 읽는 것을 추천한다.
변성윤, 쏘카 데이터 그룹, 머신러닝 엔지니어 & 데이터 과학자
이 책에서 다루는 내용
- 속성으로 파이썬 배우기
- 선형대수, 통계, 확률에 관한 기초와 데이터 과학에서 활용하는 법 배우기
- 데이터를 수집, 탐색, 정제, 가공, 조작하기
- 기계학습의 원리 탐색하기
- k-근접 이웃, 나이브 베이즈, 선형 회귀 분석, 로지스틱 회귀 분석, 의사결정나무, 인공신경망, 군집화 등 구현하기
- 추천 시스템, 자연어 처리, 네트워크 분석, 맵리듀스, 데이터베이스 등 살펴보기
데이터 분석에 필요한 해킹과 수학·통계학 이론을 살펴보려는 프로그래머라면 기초부터 잡아 주는 강력하고도 친절한 도구로써 이 책의 일독을 권합니다.
《밑바닥부터 시작하는 데이터 과학 2판》은 다음 서점에서 구입하실 수 있습니다. 🙂
교보문고 | 예스24 | 알라딘 | 인터파크