반응형
피벗 테이블: pd.pivot_table()
ㄴ피봇팅 한다. 즉 컬럼의 값을 열로 만드는것.
ㄴ인덱스는 중복이 있으면 안된다.
ㄴ따라서, 피봇테이블에 네임 컬럼을 인덱스로 만들겠다는 건 , 중복을 없앤다는 뜻
pd.pivot_table(데이터프레임, index=[ 컬럼명 ], )
ㄴ 피봇 테이블은 수치 데이터만을 (문자데이터는 처리할 수 없으니까) 하나로 합친다.
ㄴ 기본적으로 수치데이터를 다 평균으로 해서 계산을 한다.
pd.pivot_table(데이터프레임, index=[ 컬럼명 ], aggfunc = np.sum)
ㄴ 평균이 아니라, 합으로 계산.
ㄴ 넘파이의 합에서 가져온다.
pd.pivot_table(df,index=['Name'],aggfunc = np.max)
ㄴ 이건 비추, 문자열도 가져온다.
pd.pivot_table(데이터프레임, index=[ 컬럼명1, 컬럼명2 ], aggfunc = np.sum)
ㄴ 컬럼명1로 먼저 묶은 다음에, 컬럼2로 분류.
pd.pivot_table(데이터프레임, index=[ 컬럼명1, 컬럼명2 ], values = [컬럼명1, 컬럼명2], aggfunc = np.sum)
ㄴ 지정한 컬럼을 저렇게 지정/세팅하면, 원하는 컬럼을 내가 가져올 수 있다.
pd.pivot_table(데이터프레임, index=[ 컬럼명1, 컬럼명2 ], values = [컬럼명1, 컬럼명2], aggfunc = [np.sum,np.mean,np.std])
ㄴ 합, 평균, 표준편차 등을 구하고 싶을 때
반응형
'프로그래밍 언어 > Python' 카테고리의 다른 글
[Python] 노멀라이징, Feature Scaling: StandardScaler(), MinMaxScaler() (0) | 2022.05.06 |
---|---|
[Python] 구글맵 API: gmaps.geocode (0) | 2022.05.05 |
[Python] 차트 한글처리 코드 (0) | 2022.05.05 |
[Python] 여러개변수 시각화/히트맵: plt.scatterplots(), sb.regplot(), sb.pairplot(), plt.hist2d() (0) | 2022.05.05 |
[Python] 파이차트, Pie Chart,히스토그램: plt.pie(), plt.hist(), plt.figure(), plt.subplot() (0) | 2022.05.05 |