본문 바로가기

전체 글

(57)
Machine Learning - Feature Scaling, fit_transform(),transform() Feature Scaling 2가지 방법 표준화 (normalizer) : 평균을 기준으로 얼마나 떨어져 있느냐? 같은 기준으로 만드는 방법, 음수도 존재, 데이터의 최대최소값 모를때 사용. 정규화 (MinMaxSclaer) : 0 ~ 1 사이로 맞추는 것. 데이터의 위치 비교가 가능, 데이터의 최대최소값을 알때 사용 학습해야할 데이터일때는 fit_transform( 변수 ) 를 사용하여 학습시킨다. 이미 학습이 끝난 상태에서 새로운 데이터를 스케일링 할때에는 fit_transform( 변수 ) 대신 trnasform( 변수 ) 를 사용하여야 한다.
Machine learning - 신규 Data Predict 하는 순서 주어진 데이터프레임 이외에 새로운 데이터를 예측해야 할 때 1. Numpy array 로 새로운 데이터를 가공한다. 2. Numpy array 의 shape을 기존의 train 데이터와 동일하게 리쉐입 해준다. 3. 이후 스케일러 과정을 거치며 기존의 방법을 사용한다
Python - Classification 인공지능의 성능평가 방법 - Confusion Matrix Confusion Matrix - 분류 결과표 컨퓨전 매트릭스가 표현하는 분류결과표는 내포한 의미가 중요하니 다시 한번 생각해볼 것 ! 아래의 표와 같이 정확도, 적중율, 정밀도를 구할 수 있다. # confusion matrix 호출방법 # 정확도 확인 방법
Python - 상관분석, DataFrame 의 corr 함수, 차트로 표현하는법 내용 정리
Python - Series 기초, nan, isna,index import pandas as pd animals = ['Tigers', 'Bears', 'Moose'] p = pd.Series(animals) # 자동적으로 각 데이터에 인덱스를 부여 animals = ['Tiger', 'Bear', None] # None값을 줘도 그 값이 인덱스에 매핑되서 표현 p = pd.Series(animals) import numpy as np print(np.nan == None) # numpy에는 값이 없는 것을 의미하는 nan값이 있다. 이것은 None과는 다르다. # False print(np.nan == np.nan) # nan끼리는 비교할 수 없다. # False print(np.isna(np.nan)) # nan값인지를 확인하려면 isna 메서드를 사용해야한다...
Python- Pandas의 pivot_table, 피봇, 피봇팅 피벗 테이블이란? 피벗(Pivot) 테이블이란 많은 양의 데이터에서 필요한 자료만을 뽑아 새롭게 표를 작성해 주는 기능입니다. 피벗 테이블을 사용하면 사용자 임의대로 데이터를 정렬하고 필터링 할 수 있씁니다. 피벗 테이블을 일상에서 쉽게 접할 수 있는 방법은 바로 엑셀입니다. 엑셀에서는 PIVOT 기능을 이용하여 다양항 데이터에 대한 요약 및 필터링을 지원합니다. PANDAS 에서도 마찬가지로 이러한 피벗 관련 함수들을 제공하는데 이번 글에서 어떤 피벗 관련 함수들이 존재하고, 그 사용법은 어떠한지에 대해 알아보겠습니다. 변수.pivot_table(values=분석하고자 하는 KEY FIGURE(변수), index=[행 인덱스], columns=[열 인덱스] ) # 피봇테이블의 디폴트 값은 데이터들의 평..
Python- API 사용하기 , google cloud, API, Geocoding, MAPS - 개념 - 지오코딩 (Geocoding) 주소 (ex. '1600 Amphitheatre Parkway, Mountain View, CA') 를 지리적 좌표 (위도 37.423021, 경도 -122.083739) 로 변환하는 것을 말합니다. - 역지오코딩 (Reverse geocoding) 지리적 좌표 (위도 37.423021, 경도 -122.083739) 를 사람이 읽을 수 있는 주소 (ex. '1600 Amphitheatre Parkway, Mountain View, CA') 로 변환하는 것을 말합니다. 구글 맵스를 사용해서 원하는 장소의 위치(위도, 경도) 정보를 받아온다. 정확한 지명으로 바꿔서 API를 호출해야 합니다.
Python - 한글 작성을 가능하게 해주는 코드 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf" font_name = font_manager.FontProperties(fname=p..