본문 바로가기

Python 문법

Python- Pandas의 pivot_table, 피봇, 피봇팅

피벗 테이블이란?

 

피벗(Pivot) 테이블이란 많은 양의 데이터에서 필요한 자료만을 뽑아 새롭게 표를 작성해 주는 기능입니다. 피벗 테이블을 사용하면 사용자 임의대로 데이터를 정렬하고 필터링 할 수 있씁니다.

피벗 테이블을 일상에서 쉽게 접할 수 있는 방법은 바로 엑셀입니다.

엑셀에서는 PIVOT 기능을 이용하여 다양항 데이터에 대한 요약 및 필터링을 지원합니다.

PANDAS 에서도 마찬가지로 이러한 피벗 관련 함수들을 제공하는데 이번 글에서 어떤 피벗 관련 함수들이 존재하고, 그 사용법은 어떠한지에 대해 알아보겠습니다.

 

 

변수.pivot_table(values=분석하고자 하는 KEY FIGURE(변수), index=[행 인덱스], columns=[열 인덱스] )

# 피봇테이블의 디폴트 값은 데이터들의 평균값을 도출한다.

# 파라미터의 값을 입력하여 다양한 결과를 도출할 수 있다.

 ex ) 변수.pivot_table(values=분석하고자 하는 KEY FIGURE(변수), index=[행 인덱스], columns=[열 인덱스], aggfuc = np.sum )

 

 

함수 사용방법에 맞게끔 코드를 작성했음에도 불구하고

오류가 발생하는 이유는 바로 ERROR 메세지에서 나타나듯이 중복된 값이 존재하기 때문입니다.

 

따라서 GROUPBY 메소드를 통해 데이터를 1차적으로 요약해 통계량을 낸 다음 피벗테이블로 변환할 필요가 있습니다.