본문 바로가기

프로그래밍 언어/Python

[Python] 데이터 시각화: 개념,plt.plot(x,y), plt.show(), plt.savefig()

반응형

Tidy Data

- 깔끔한 데이터. 이하는 깔끔한 데이터의 특징

- 변수는 컬럼이다

- 데이터가 행으로 되어있다.

- 만약 여러개의 표가 존재한다면, 적어도 하나 이상의 컬럼이 공유되어야 한다. 

 

- 이러한 타입의 데이터만이 차트로 그릴수 있다. 

ㄴ 판다스 데이터프레임으로 작업을 하면, 차트를 그릴 수 있다.

 

데이터 시각화:  

- Matplotlib 라이브러리

ㄴ 파이썬에서 수학적 확장 넘파이 라이브러리를 활용한 플로팅 라이브러리. 

ㄴ 넘파이나 판다스에서 사용되는 자료구조를 쉽게 시각화 가능

 

- seaborn 라이브러리

ㄴ Matplotlin을 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지로, 유익한 통계 그래픽을 그리기 위한 고급 인터페이스 제공

 

-> 함수 파라미터에 뭐만 쓰면 된다를 알면 됨. 

-> 차트는 그리는 역할만 한다.

-> 차트 함수를 사용하기 전에 내가 필요한 데이터가 먼저 준비되어 있어야한다.

 

- 참고자료:

https://matplotlib.org/gallery.html#scales

https://seaborn.pydata.org/



 

가장 기본적인 Plot

 

import matplotlib.pyplot as plt
import numpy as np

x = np.arange(0,9+1)
y = x

plt.plot(x,y)
plt.savefig('test1.jpg')
plt.show()

plt.plot(x,y)

ㄴ 1차원 그래프

 

ex) 

data_result['소계'].plot(kind = 'bar')

컬럼명. plot(kind = ‘bar’)

ㄴ plot은 플롯인데, 선 말고 bar 차트로 해달라.

 

ex) 

data_result['소계'].plot(kind = 'barh')

컬럼명. plot(kind = ‘barh’)

ㄴ 수평으로 세운다는 뜻. bar+h.

 

plt.show()

ㄴ 사용하지 않으면, 결과 그래프 위에 문자열이 뜰 텐데, 그건 메모리 저장소를 보여주는 것임.

ㄴ 그래프 함수와 같은 셀에 명령을 해야 효과가 있음

 

plt.savefig('test1.jpg')

ㄴ 그래프를 따로 해당 디바이스에다가 저장하겠다는 뜻

 

 

반응형