본문 바로가기

프로그래밍 언어/Python

[Python] 판다스: head(), tail(), describe(), info(), astype(), contains(), isin()

반응형

- 앞 줄만 간단 읽기: 판다스 데이터프레임 변수명.head()

ㄴ 괄호 안에 아무 데이터도 없을 시, 기본 5행을 출력한다.

ㄴ 괄호 안에 숫자 입력시, 해당 숫자만큼의 행을 앞에서부터 출력한다.

 

- 뒷 줄만 간단 읽기: 판다스 데이터프레임 변수명.tail()

ㄴ 괄호 안에 아무 데이터도 없을 시, 기본 5행을 출력한다.

ㄴ 괄호 안에 숫자 입력시, 해당 숫자만큼의 행을 뒤에서부터 출력한다.

 

- e +03 : e를 10으로 보면 된다. 10의 3승이라는 뜻

 

- 데이터 전반 내용 요약본: 판다스 데이터프레임 변수명.describe()

ㄴ 갯수, 평균, 표준편차, 최소값, 최대값 ,사분위를 볼수 있다.

ㄴ 50%: 중앙값이라는 뜻

- 문자열에 .describe()

ㄴ누가 어떤게 제일 많이 나온다. 등등등

 

 

- 데이터 컬럼별 정보: 판다스 데이터프레임 변수명.info()

ㄴ 왼쪽엔 컴퓨터용 인덱스

ㄴ non=null 비어있는 데이터가 없음.

ㄴ memory usage: 메모리 사용

 

 

- 데이터 타입 변환하기: astype(변환하고자 하는 타입)

 

- 데이터 포함하는 지 여부 체크: contains()

ㄴ ex) df의 item_name 컬럼 값중 Chips 포함하는 경우의 데이터를 출력하라

ㄴ 모두 다 소문자로 낮춰준다. 그래야 문장안에 있는 단어도 체크 가능하기 때문에.

데이터는 판다스 시리즈 형태이기 때문에, 스트링으로 변환해서 적용해야한다.

ㄴ str.lower()의 결과값이 판다스 시리즈이기 때문에 뒤에다가 또 str을 붙여야한다.

 

- 데이터 포함하는 지 여부 체크: isin()

ㄴ 그 리스트 안에 있니, country 리스트 안에 있는 것

ㄴ True,False로 반환해준다.

 

- 판다스 프레임으로 작업을 하려면, 먼저 가지고 올 것부터 생각해라. 그리고 고민하라.

 

반응형