도서목록

아이콕스

본문

데이터 시각화 with 파이썬

지은이설진욱

쪽수308

초판2021년 3월 20일

ISBN979-11-6426-160-4 (93000)

판형188mm x 257mm (46배판)

기타애프터스킬 시리즈

정가28,000원

  • 책소개
  • 목차
  • 저자 소개
  • 상세이미지

파이썬을 사용하여 데이터 시각화를 시작하는 분에게 권장하는 필독서!

 

기존 전공자들의 주된 영역이었던 빅데이터, 머신 러닝 등은 이제 전공자가 아니더라도 쉽게 접근할 수 있는 영역이 되었고 행정, 교육, 경제, 경영, 의학, 공학, 과학, 예술, 스포츠 등에서 많은 사람들이 다룰 수 있는 영역으로 보편화 되었습니다.

 

빅데이터, 머신 러닝 과정에서 도출되는 광범위한 데이터들은 엑셀과 같은 표 형태의 데이터, 그래프 등의 형태로 표현이 가능해졌습니다. 데이터를 표현하는 여러 가지 방법 중 가장 빠른 의미 전달의 도구는 역시 시각적인 기법으로 보여 주는 것입니다.

 

이 책은 파이썬을 사용하여 데이터를 시각화하는 데 초점을 두었으며, 일반적으로 자주 사용되는 그래프를 항목 별로 나누어 설명하였고 파이썬에서 제공하는 matplotlib, seaborn 라이브러리로 작성하였습니다. 파이썬의 기초적인 문법을 학습하신 분이라면 이 책을 통해 자신의 상황에 맞는 다양한 분야에서 데이터 분석을 위한 시각화 과정에 응용할 수 있을 것입니다.


들어가며

 

Chapter 01 파이썬 프로그래밍 개요

1.1 Python의 개요

1.2 Python의 특징

__1.2.1 주요 특징

__1.2.2 쉬운 문법

__1.2.3 무료 프로그램

__1.2.4 간결성

__1.2.5 개발 속도의 신속성

1.3 Python의 종류

1.4 Python의 사용처

__1.4.1 파이썬으로 할 수 있는 것

1.5 Python 설치하기

__1.5.1 홈페이지를 이용한 Python 설치

__1.5.2 Python을 위한 환경 변수 설정하기

1.6 파이썬의 코딩 구조

1.7 Jupyter Notebook

__1.7.1 쥬피터 노트북 설치

__1.7.2 새 노트 만들기

__1.7.3 주석과 문서 입력하기

__1.7.4 노트 저장하기

__1.7.5 출력이 제대로 되지 않는 경우

__1.7.6 데이터 시각화

__1.7.7 ipynb2py

1.8 통합 개발 도구(IDE)를 사용한 Python 실행

__1.8.1 PyCharm 설치

__1.8.2 PyCharm 설정

__1.8.3 PyCharm 실행

요약

 

Chapter 02 판다스 패키지

2.1 Series(시리즈)

__2.1.1 시리즈 생성 방법

2.2 Series의 데이터 읽기와 쓰기

2.3 DataFrame(데이터 프레임)

__2.3.1 DataFrame 생성 방법

2.4 DataFrame 데이터 읽기와 쓰기

2.5 함수 적용과 매핑(apply 함수)

2.6 데이터 병합하기

__2.6.1 merge( ) 함수

2.7 다양한 방식의 데이터 추출

2.8 GroupBy 메카닉

__2.8.1 그룹핑 관련 함수

연습 문제

요약

 

Chapter 03 데이터 시각화

3.1 matplotlib API

__3.1.1 plt와 연관된 함수

__3.1.2 이미지로 저장하기

3.2 변수 개수 및 형태별 그래프 종류

3.3 꺽은 선 그래프

__3.3.1 특정 국가의 특정 일자에 대한 꺽은 선 그래프

__3.3.2 이중 축 꺽은 선 그래프

3.4 산점도 그래프

__3.4.1 엔진 크기에 대한 주행 마일수의 산점도 그래프

__3.4.2 구동 방식에 의한 색상 구분하기

__3.4.3 산점도와 히스토그램 동시에 그리기

__3.4.4 다이어몬드 데이터 셋과 산점도

3.5 막대 그래프

__3.5.1 특정 일자 일변량 막대 그래프

__3.5.2 특정 국가별 일별 다변량 막대 그래프

__3.5.3 일별 국가별 다변량 막대 그래프

__3.5.4 일별 국가별 누적 막대 그래프

__3.5.5 국가별 일별 누적 가로 막대 그래프

__3.5.6 서브 플로팅 사용하기

__3.5.7 Table이 존재하는 막대 그래프

3.6 파이 그래프

__3.6.1 사용자 정의 비율 지정

__3.6.2 사용자 정의 포지셔닝

__3.6.3 도우넛 파이 그래프

__3.6.4 국가별 중첩 파이 그래프

__3.6.5 특정 파이 영역의 세부 내역 보이기

3.7 상자 수염 그래프

__3.7.1 상자 수염(사용자 정의 색상)

__3.7.2 상자 수염과 바이올린 그래프

3.8 히스토그램

__3.8.1 남자들의 신장

__3.8.2 남자와 여자의 다중 히스토그램 그리기

__3.8.3 총 결재 금액

__3.8.4 총 결재 금액(계급 구간 조정)

__3.8.5 거인국과 소인국의 신장 히스토그램

__3.8.6 거인국과 소인국의 히스토그램을 동일 화면에 그리기

__3.8.7 히스토그램의 누적

연습 문제

요약

 

Chapter 04 한국 복지 패널 데이터

4.1 seaborn 라이브러리

4.2 한국 복지 패널 데이터 개요

__4.2.1 데이터 파일

__4.2.2 데이터 분석 준비하기

__4.2.3 복지 데이터 전처리

__4.2.4 척도에 대한 이해

__4.2.5 결혼 유무와 종교 유무에 따른 빈도(countplot)

__4.2.6 나이에 따른 히스토그램(distplot)

__4.2.7 결혼 유무와 성별에 따른 히트맵(heatmap)

__4.2.8 두 컬럼간의 짝 그래프(pairplot)

__4.2.9 성별과 나이에 따른 바이올린 그래프(violinplot)

__4.2.10 선형 회귀 모델 그래프(lmplot)

__4.2.11 나이와 소득에 따른 산점도(replot)

__4.2.12 나이와 소득에 따른 산점도와 히스토그램(jointplot)

__4.2.13 성별에 따른 소득 그래프(barplot)

__4.2.14 성별에 따른 소득 상자 수염 그래프(boxplot)

__4.2.15 소득에 따른 나이(이차원 밀집도_kdeplot)

연습 문제

요약

 

Chapter 05 자동차 데이터 셋

5.1 자동차 데이터 셋 개요

__5.1.1 데이터 파일

__5.1.2 산점도와 Rug Plot(scatterplot)

__5.1.3 엔진 크기 히스토그램(histplot)

__5.1.4 구동 방식에 따른 주행 마일수(stripplot)

__5.1.5 구동 방식에 따른 주행 마일수(swarmplot)

연습 문제

요약

 

Chapter 06 특별한 그래프

6.1 개요

__6.1.1 성적표 향상 그래프(경사 그래프)

__6.1.2 리본 박스 그래프

__6.1.3 범주형 플로팅

__6.1.4 Density Plotting

__6.1.5 Lollipop Chart

__6.1.6 Ordered Bar Chart

__6.1.7 TreeMap

__6.1.8 Stem Plotting

연습 문제

요약

 

Chapter. A 연습 문제 해답

판다스 패키지

데이터 시각화

한국 복지 패널 데이터

자동차 데이터 셋

특별한 그래프

 

Chapter. B 부록

B.1 plot( ) 함수

B.2 Series와 그래프

B.3 DataFrame과 그래프

B.4 서브 플로팅

 

Chapter. C 찾아보기

지은이 : 설진욱

 

기계 공학을 전공하였으며, LG 전자에 입사하여 세탁기 사업부 전산부에서 근무하였습니다. 이후 약국 도매상 프로그램을 2년 정도 개발하였고, PC방 메인/클라이언트 관리 프로그램 개발을 7년 정도 근무하였습니다.

프로그래밍 강의 경력은 12년째 진행 중이며,강의가 가능한 과목은 자바, 파이썬, R, 데이터베이스, vba 등입니다. 미래 소년 코난, 로봇 태권 V를 좋아했었고, 심형래의 코미디, 변진섭의 노래를 보고 듣는 것을 좋아합니다.

상세 이미지 1