본문 바로가기

프로그래밍 언어/Python

[Python] 판다스 Pandas 개념: 판다스 시리즈

반응형

Pandas Series 데이터 생성하기

import pandas as pd 

index = ['eggs', 'apples', 'milk', 'bread']
data = [30, 6, 'Yes', 'No']

import numpy as np
np.array(data)

- 리스트가 있어야 판다스를 만든다.

- 판다스의 1차원 데이터를 시리즈라고 부른다.

 

- 여태까지 배웠던 인덱스는? 컴퓨터가 자동으로 메기는 인덱스.

- 판다스를 배우는 이제부터는, 판다스를 다룰때는 인덱스! 라는 용어는 왼쪽에 붙어있는 것을 가리킨다!! -> 사람용 인덱스 !!

 

- values: 판다스에서 데이터라는 뜻.

 

변수명 = pandas.Series(data = 데이터 스트럭쳐, index = 인덱스명)

( index를 입력하지 않을경우, 기본으로 컴퓨터용 인덱스로 표시가 된다. 인덱스를 입력했을 경우, 사람이 보기 간편한 지정된 인덱스로 표시가 된다.)

 

- 기본적으로 Numpy가 가지고 있는 속성은 이용가능하다. 

 

변수명.shape

변수명.size

변수명.ndim

변수명.dtype

변수명.index

 

판다스에서 데이터/인덱스가 있는지도 확인이 가능하다.

기본적으로는 인덱스로 확인이 가능하며, 변수명.values로 체크했을 때는, 데이터 체크가 가능하다.

데이터/인덱스 in 판다스 변수명

 

 

 

반응형