본문 바로가기

프로그래밍 언어/Python

[Python] 피벗 테이블, Pivot Table: pd.pivot_table()

반응형

피벗 테이블: pd.pivot_table()

ㄴ피봇팅 한다. 즉 컬럼의 값을 열로 만드는것.

ㄴ인덱스는 중복이 있으면 안된다. 

ㄴ따라서, 피봇테이블에 네임 컬럼을 인덱스로 만들겠다는 건 , 중복을 없앤다는 뜻

 

pd.pivot_table(데이터프레임, index=[ 컬럼명 ], )

ㄴ 피봇 테이블은 수치 데이터만을 (문자데이터는 처리할 수 없으니까) 하나로 합친다. 

ㄴ 기본적으로 수치데이터를 다 평균으로 해서 계산을 한다. 

 

pd.pivot_table(데이터프레임, index=[ 컬럼명 ], aggfunc = np.sum)

ㄴ 평균이 아니라, 합으로 계산.

ㄴ 넘파이의 합에서 가져온다.  

 

pd.pivot_table(df,index=['Name'],aggfunc = np.max)

ㄴ 이건 비추, 문자열도 가져온다.

 

pd.pivot_table(데이터프레임, index=[ 컬럼명1, 컬럼명2 ], aggfunc = np.sum)

ㄴ 컬럼명1로 먼저 묶은 다음에, 컬럼2로 분류.

 

 

pd.pivot_table(데이터프레임, index=[ 컬럼명1, 컬럼명2 ], values = [컬럼명1, 컬럼명2], aggfunc = np.sum)

ㄴ 지정한 컬럼을 저렇게 지정/세팅하면, 원하는 컬럼을 내가 가져올 수 있다. 

 

 

pd.pivot_table(데이터프레임, index=[ 컬럼명1, 컬럼명2 ], values = [컬럼명1, 컬럼명2], aggfunc = [np.sum,np.mean,np.std])

ㄴ 합, 평균, 표준편차 등을 구하고 싶을 때

 


반응형