Tidy Data
- 깔끔한 데이터. 이하는 깔끔한 데이터의 특징
- 변수는 컬럼이다
- 데이터가 행으로 되어있다.
- 만약 여러개의 표가 존재한다면, 적어도 하나 이상의 컬럼이 공유되어야 한다.
- 이러한 타입의 데이터만이 차트로 그릴수 있다.
ㄴ 판다스 데이터프레임으로 작업을 하면, 차트를 그릴 수 있다.
데이터 시각화:
- Matplotlib 라이브러리
ㄴ 파이썬에서 수학적 확장 넘파이 라이브러리를 활용한 플로팅 라이브러리.
ㄴ 넘파이나 판다스에서 사용되는 자료구조를 쉽게 시각화 가능
- seaborn 라이브러리
ㄴ Matplotlin을 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지로, 유익한 통계 그래픽을 그리기 위한 고급 인터페이스 제공
-> 함수 파라미터에 뭐만 쓰면 된다를 알면 됨.
-> 차트는 그리는 역할만 한다.
-> 차트 함수를 사용하기 전에 내가 필요한 데이터가 먼저 준비되어 있어야한다.
- 참고자료:
https://matplotlib.org/gallery.html#scales
가장 기본적인 Plot
import matplotlib.pyplot as plt import numpy as np x = np.arange(0,9+1) y = x plt.plot(x,y) plt.savefig('test1.jpg') plt.show() |
plt.plot(x,y)
ㄴ 1차원 그래프
ex)
data_result['소계'].plot(kind = 'bar')
ㄴ 컬럼명. plot(kind = ‘bar’)
ㄴ plot은 플롯인데, 선 말고 bar 차트로 해달라.
ex)
data_result['소계'].plot(kind = 'barh')
ㄴ 컬럼명. plot(kind = ‘barh’)
ㄴ 수평으로 세운다는 뜻. bar+h.
plt.show()
ㄴ 사용하지 않으면, 결과 그래프 위에 문자열이 뜰 텐데, 그건 메모리 저장소를 보여주는 것임.
ㄴ 그래프 함수와 같은 셀에 명령을 해야 효과가 있음
plt.savefig('test1.jpg')
ㄴ 그래프를 따로 해당 디바이스에다가 저장하겠다는 뜻