피벗 테이블이란?
피벗(Pivot) 테이블이란 많은 양의 데이터에서 필요한 자료만을 뽑아 새롭게 표를 작성해 주는 기능입니다. 피벗 테이블을 사용하면 사용자 임의대로 데이터를 정렬하고 필터링 할 수 있씁니다.
피벗 테이블을 일상에서 쉽게 접할 수 있는 방법은 바로 엑셀입니다.
엑셀에서는 PIVOT 기능을 이용하여 다양항 데이터에 대한 요약 및 필터링을 지원합니다.
PANDAS 에서도 마찬가지로 이러한 피벗 관련 함수들을 제공하는데 이번 글에서 어떤 피벗 관련 함수들이 존재하고, 그 사용법은 어떠한지에 대해 알아보겠습니다.
변수.pivot_table(values=분석하고자 하는 KEY FIGURE(변수), index=[행 인덱스], columns=[열 인덱스] )
# 피봇테이블의 디폴트 값은 데이터들의 평균값을 도출한다.
# 파라미터의 값을 입력하여 다양한 결과를 도출할 수 있다.
ex ) 변수.pivot_table(values=분석하고자 하는 KEY FIGURE(변수), index=[행 인덱스], columns=[열 인덱스], aggfuc = np.sum )
함수 사용방법에 맞게끔 코드를 작성했음에도 불구하고
오류가 발생하는 이유는 바로 ERROR 메세지에서 나타나듯이 중복된 값이 존재하기 때문입니다.
따라서 GROUPBY 메소드를 통해 데이터를 1차적으로 요약해 통계량을 낸 다음 피벗테이블로 변환할 필요가 있습니다.
'Python 문법' 카테고리의 다른 글
Python- dataframe 의 데이터 access 방법 loc, iloc (0) | 2022.05.09 |
---|---|
Python - Series 기초, nan, isna,index (0) | 2022.05.04 |
Python- API 사용하기 , google cloud, API, Geocoding, MAPS (0) | 2022.05.04 |
Python - 한글 작성을 가능하게 해주는 코드 (0) | 2022.05.02 |
Python - Column, 컬럼의 값을 이용한 함수 (0) | 2022.04.29 |