나도 하는 파이썬 데이터 분석 리뷰

Activities / Reviews

나도 하는 파이썬 데이터 분석 리뷰

Google Colab과 실제 공공 데이터를 활용해 파이썬 기초부터 데이터 수집, 상관관계, 회귀, 시계열 분석까지 따라가는 입문서 리뷰입니다.

나도 하는 파이썬 데이터 분석 리뷰

“한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

나도 하는 파이썬 데이터 분석 – 한빛미디어

1. Intro

바야흐로 데이터 분석의 시대다.

데이터를 단순히 DB나 엑셀로 저장해두기만 한다면 큰 효용이 없을것이다.

그러나 단순 저장되어있는 데이터를 꺼내와서 분석하고, 의미있는 결과를 도출한다면, 이는 큰 이득을 가져다 줄것이다.

이러한 데이터 분석활용의 사례는 공공분석 데이터 분석활용 우수 사례집, 2021 빅데이터 플랫폼 활용 사례등 많이 찾아 볼 수 있다.

그렇다면 데이터 분석을 어떻게 시작할 수 있을까? 이 지점에서 많은 답안으로 나오는게 파이썬을 활용한 데이터 분석이다. 다른 코딩 언어에 비해서 파이썬은 문법이 간단하고, numpy,pandas와 같은 빅데이터 분석 / 인공지능 예측등과 같은 라이브러리가 잘 구성되어있다는 장점이 있다.

본 책은, 이러한 파이썬과 데이터분석을 쉽고 간단하게 알려준다.


2. 책 구성

본 책은 크게 2파트로 나뉘어져있다.

파트1은 자료형/조건문,반복문/함수,클래스 등과 같은 파이썬 기초 문법을 설명한다

파트2는 정형,비정형 데이터 분석/크롤링/상관관계,회귀,시계열 분석들을 다룬다.

이 책의 제목인 ‘나도 하는 파이썬 데이터 분석’임을 미루어 보았을때, 전반부는 파이썬을 잘 모르거나 친숙하지 않은 일반 독자를 대상으로 간략히 기초 문법을 소개하고, 후반부부터 관련 데이터와 라이브러리를 활용한 데이터 분석을 수행한다.

PART 1 생활 데이터로 배우는 파이썬 기초 문법

1장 4차 산업혁명과 빅데이터
_1.1 4차 산업혁명과 기술의 변화
_1.2 빅데이터란?

2장 연필 없이 복잡한 수학 문제를 풀어보자_연산자, 변수, 자료형
_2.1 1 더하기 1은?
_2.2 a 더하기 b는?
_2.3 1+1=2는 True or False?
Google Colab on Smartphone

3장 갖고 싶은 위시 리스트 아이템 있어?_튜플, 리스트, 딕셔너리
_3.1 내가 갖고 싶은 물건은 확실하다!
_3.2 내가 갖고 싶은 물건은 변할 수 있다!
_3.3 내가 갖고 싶은 물건이 얼만지 알고 싶어?
Google Colab on Smartphone

4장 철수야, 맨날 학원 가고 독서실만 가니?_조건문, 반복문
_4.1 파이썬 도서, 다 읽었어?
_4.2 오늘은? 내일은? 모레는?
Google Colab on Smartphone

5장 업무는 효율이 핵심이야!_함수, 클래스
_5.1 작년에 용돈 얼마 썼어?
_5.2 요리는 내가 직접 한다
_5.3 냉장고를 정리하자
Google Colab on Smartphone

PART 2 데이터 수집 및 분석하기

6장 코로나 시기에 한적한 곳으로 여행 가고 싶다면?_정형 데이터 분석
_6.1 정형 데이터 수집하기
_6.2 지역별/연령별 방문객 순위는?
_6.3 지도 위에 표현해보자
_6.4 코로나 확진자 수 통계 분석하기
Google Colab on Smartphone

7장 우표 수집하니? 난 데이터 수집한다!_비정형 데이터 분석, 크롤링
_7.1 웹 기반의 비정형 데이터 수집하기
_7.2 애국가에서 ‘대한’은 몇 번 등장할까?
_7.3 나만의 빅데이터 저장소를 만들자
Google Colab on Smartphone

8장 너와 나의 연결고리_상관관계 분석
_8.1 M세대와 Z세대의 취업률 상관계수는?
_8.2 대출 이율이 오르면 우리 집값은?
_8.3 집이 비어 있을 땐 허수아비라도 설치해야 할까?
Google Colab on Smartphone

9장 아니 땐 굴뚝에 연기 날까_회귀 분석
_9.1 모든 일에는 다 이유가 있다
_9.2 집 앞에 어린이집이 생기면 집값에 어떤 영향을 미칠까?
_9.3 내일은 비가 올까요?
_9.4 회귀 분석과 인공지능 예측 차이
Google Colab on Smartphone

10장 앞만 보는 것이 아니라 뒤도 살펴봐야 한다_시계열 분석
_10.1 과거는 미래에 영향을 줄까?
_10.2 ARIMA와 인공지능 기반 시계열 예측의 차이
_10.3 이 아파트를 지금 팔아야 할까? 보유해야 할까?
Google Colab on Smartphone


3. 인상적인 부분

3.1. Google Colab 기반의 실습 환경

실습이 포함된 강의/교재의 경우, 강의자의 환경과 실습자의 환경이 달라서 실습에 어려움을 겪는 사례가 종종있다. 사용자의 OS가 Windows/MacOS 인지, 사용중인 프로그램의 버전은 무엇인지가 그것이다.

이를 위해, 이 책에서는 실습을 클라우드 기반의 파이썬 개발 툴 Google Colab에서 진행한다. 작업환경을 구축하는 시간을 줄이고, 교재의 내용을 쉽고 간단하게 따라해 볼 수 있다.

3.2. 실제 데이터를 사용한 가공

Part2에 들어서, 데이터 수집 및 분석으로 들어가면 실제 데이터 기반의 예시들이 제시된다.

실제로 책을 읽어보기전에는, 단순히 테스트만을 위한 테스트 데이터를 제시하고, 그에 기반한 분석을 보여주지않을까, 실무에 적용할 수 있을까라는 우려가 있었다.

공공데이터 포탈의 경기도 수원시_어린이보호구역 내 일평균 유동인구 데이터, 교육통계서비스의 년도별 대학 졸업자 수와 같이, 실제로 접근/사용가능한 데이터에 기반한 실습이 이루어진다.

8.3 집이 비어 있을 땐 허수아비라도 설치해야 할까? 중 일부 내용

4. Outro

설명과 실습에 사용된 모든 소스 코드실습 데이터는 별도의 Git Repository를 통해 제공된다.

쉽게 준비할 수 있는 구글 콜랩 환경에서, 여러 시나리오를 상정한 데이터 분석 실습을 통해 기본기를 익히기에는 충분할 듯 하다.

다만 기초 파이썬 문법부터 실제 라이브러리 활용까지 이 한권으로 익히기에는 조금 어려움이 따를 수 있을 듯하다.

본 책을 통해 기본적인 개념과 흐름을 파악한 뒤, 조금 더 심화 영역에 관심이 생기면 해당 부분에 대한 공부를 이어가는것이 적절할 듯 하다.

Leave A Comment