본문 바로가기

Python 문법

(32)
Python - Groupby() 사용법 DataFrame 에서 컬럼안에 같은 값의 데이터가 여러가지 존재할때 같은 값을 가진 데이터끼리 묶어서 처리하는 함수 위의 DataFrame의 'Date' 컬럼과 같이 '2015-01-04' 값이 중복될때 사용한다 그룹을 묶고자 하는 컬럼을 (소괄호)에 컬럼명을 적고 값을 추출하고자 하는 컬럼을 [대괄호]안에 입력한다.
Python - DataFrame 의 Data 정렬하는 방법 sort_values(),ascending= 임의로 만든 데이터 프레임을 준비합니다. 1. 컬럼 'a' 를 기준으로 데이터 프레임을 정렬 # 결과가 데이터프레임으로 출력 2. 컬럼 'a'를 기준으로 시리즈를 정렬 3. 정렬의 차순을 설정하는 방법 # 오름차순 ascending = True < default 값 # 내림차순 ascending = False
Python- dataframe 의 데이터 access 방법 loc, iloc 데이터프레임의 컬럼에 접근하고 싶을때는 변수['컬럼명'] 을 입력하면 데이터에 저장되어있는 호출한 컬럼을 모두 불러온다. 변수.loc[ 행 , 열 ] > 내가 원하는 조건의 행을 불러오고 싶을때 자주 쓴다. > 컬럼을 불러올때는 '컬럼명'을 입력해야 한다. ex ) 변수.loc[ 내가 원하는 변수 조건 , ] 변수.iloc[ 행, 열] > loc 함수와는 다르게 호출하고자 하는 컬럼의 인덱스를 입력한다. > 컬럼명 대신에 슬라이싱 하여 호출하고자 할때 사용한다. ex ) 변수.iloc[ 행 , 'A' : 'D' ]
Python - Series 기초, nan, isna,index import pandas as pd animals = ['Tigers', 'Bears', 'Moose'] p = pd.Series(animals) # 자동적으로 각 데이터에 인덱스를 부여 animals = ['Tiger', 'Bear', None] # None값을 줘도 그 값이 인덱스에 매핑되서 표현 p = pd.Series(animals) import numpy as np print(np.nan == None) # numpy에는 값이 없는 것을 의미하는 nan값이 있다. 이것은 None과는 다르다. # False print(np.nan == np.nan) # nan끼리는 비교할 수 없다. # False print(np.isna(np.nan)) # nan값인지를 확인하려면 isna 메서드를 사용해야한다...
Python- Pandas의 pivot_table, 피봇, 피봇팅 피벗 테이블이란? 피벗(Pivot) 테이블이란 많은 양의 데이터에서 필요한 자료만을 뽑아 새롭게 표를 작성해 주는 기능입니다. 피벗 테이블을 사용하면 사용자 임의대로 데이터를 정렬하고 필터링 할 수 있씁니다. 피벗 테이블을 일상에서 쉽게 접할 수 있는 방법은 바로 엑셀입니다. 엑셀에서는 PIVOT 기능을 이용하여 다양항 데이터에 대한 요약 및 필터링을 지원합니다. PANDAS 에서도 마찬가지로 이러한 피벗 관련 함수들을 제공하는데 이번 글에서 어떤 피벗 관련 함수들이 존재하고, 그 사용법은 어떠한지에 대해 알아보겠습니다. 변수.pivot_table(values=분석하고자 하는 KEY FIGURE(변수), index=[행 인덱스], columns=[열 인덱스] ) # 피봇테이블의 디폴트 값은 데이터들의 평..
Python- API 사용하기 , google cloud, API, Geocoding, MAPS - 개념 - 지오코딩 (Geocoding) 주소 (ex. '1600 Amphitheatre Parkway, Mountain View, CA') 를 지리적 좌표 (위도 37.423021, 경도 -122.083739) 로 변환하는 것을 말합니다. - 역지오코딩 (Reverse geocoding) 지리적 좌표 (위도 37.423021, 경도 -122.083739) 를 사람이 읽을 수 있는 주소 (ex. '1600 Amphitheatre Parkway, Mountain View, CA') 로 변환하는 것을 말합니다. 구글 맵스를 사용해서 원하는 장소의 위치(위도, 경도) 정보를 받아온다. 정확한 지명으로 바꿔서 API를 호출해야 합니다.
Python - 한글 작성을 가능하게 해주는 코드 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf" font_name = font_manager.FontProperties(fname=p..
Python - Column, 컬럼의 값을 이용한 함수 .sum() 각 컬럼의 최댓값을 알수있다. .sum() 각 컬럼의 합을 알수있다. .max() 각 컬럼의 최댓값을 알수있다. .min() 각 컬럼의 최솟값을 알수있다. .mean() 각 컬럼의 평균값을 알수있다. .std() 각 컬럼의 표준편차 값을 알수있다. -------연습 문제-------------