왼쪽부터 순서대로 ESL, ISLR, ISLP

통계 학습에 관한 최초의 책 중 하나인 헤이스티(Hastie), 팁시라니(Tibshirani), 프리드먼(Friedman)의 《The Elements of Statistical Learning(ESL)》은 2001년에 처음 출판되었습니다. 이 책은 통계적 기계학습의 기초를 다지기 위한 중요한 참고도서가 됐습니다. 그러나 이 책에 잘 어울리는 독자는 수리과학 분야에서 고급 훈련을 받은 전문가들입니다.

이후 2013년에 출간된 《An Introduction to Statistical Learning with Applications in R(ISLR)》은 ESL의 통계 이론을 근간으로 하면서도, 통계 이론이 다양한 분야에서 응용되고 있는 현실에 맞게 좀 더 실용적인 접근법을 모색한 책입니다. 이 책에는 해당 통계적 도구를 활용해 현실 문제를 해결할 수 있도록 R을 이용한 실습 예제가 장마다 포함되어 있습니다. ISLR은 출간과 동시에 전 세계 학부와 대학원 강좌의 대들보가 됐으며, 데이터 과학자를 위한 중요한 참고문헌이 되었습니다.

오늘날 데이터과학이 급속히 발전하면서 통계적 학습의 중요한 기법들을 파이썬으로 구현하려는 요구 역시 높아져 왔습니다. 이런 요구에 발맞추어 ISLR의 저자들과 파이썬 전문가가 결합해 《An Introduction to Statistical Learning with Applications in Python(ISLP)》을 2023년에 출간하게 되었습니다. 이 책은 통계 이론을 학습하고 이를 파이썬으로 구현해 보려는 통계학 및 다양한 비통계학 분야 사람들을 위한 책입니다.

이 책에는 마케팅, 금융, 생물학, 공학 등 다양한 분야의 실습 사례들이 풍부하게 실려 있어 통계 학습 효과를 배가시켜 줍니다. 보스턴 인구 조사를 바탕으로 하는 주택 가치 예측, 뇌종양 진단 환자 사례를 통한 생존시간 예측, 400여명의 신용카드 부채 정보를 활용한 연체 예측, 2,000명의 헤지펀드 매니저의 수익률 예측, 유전자 발현 측정 자료를 토대로 한 암 분류 예측 등 여러 분야의 비즈니스 요구와 데이터 실태를 파악하는 안목을 갖게 합니다.

데이터설명
Auto자동차의 연비, 마력 등 정보
Bikeshare워싱턴 DC 자전거 공유 프로그램의 시간별 사용량
Carseats400개 매장의 카시트 판매에 대한 정보
College미국 대학의 인구학적 특성, 등록금 등
Hitters야구 선수들의 기록과 연봉
Wage미국 중부 대서양 지역 남성의 소득 조사 데이터
Weekly21년간 1,089개의 주별 주식 시장 수익률
NCI6064개 암 세포계에 대한 유전자 발현 측정
————

위 그래프는 통계 기법의 하나인 군집화가 이루어지는 과정을 단계적으로 보여 주는 그림입니다. 통계학은 추상 수준이 높은 학문인 관계로 그 이론과 기법을 이해하는 데 있어 시각적인 자료는 무엇보다 중요합니다. 이 책에서는 200여 개에 달하는 컬러 그래프를 요소요소 배치해 통계학의 이론과 실습을 이해하는 데 많은 도움을 줍니다.

책의 실습에 사용한 코드와 기타 자료: https://github.com/KoISLP

원서의 저자가 지원하는 사이트: https://www.statlearning.com/

《기초부터 다지는 통계학 교과서 with 파이썬》은 다음 서점에서 구입하실 수 있습니다.

교보문고 | YES24 | 알라딘

정오표

실습 교안 다운로드
강의 교안 신청하기