본문 바로가기

Machine Learning

(5)
Python - Prophet 라이브러리 사용법,fit,predict,periods Prophet 이란? 페이스북에서 만든 오픈소스 Seasonal time series data를 분석할 수 있는 딥러닝 라이브러리다 프로펫 공식 페이지 : https://facebook.github.io/prophet/docs/quick_start.html#python-api Prophet 사용방법 데이터를 Prophet 에 맞도록 가공 # 필요한 컬럼은 ds, y (컬럼 이름을 맞춰야함) Prophet을 변수로 지정하고 fit 사용하여 학습시키기 미래 DataFrame 생성 예측 시각화
Python - 카테고리컬 데이터 LabelEncoder(), OneHotEncoder() 컴퓨터는 숫자로 처리해야 한다. 숫자가 아닌 데이터 중에서, 카테고리로 판단되는 데이터는 숫자로 바꿔줄 수 있다. Label Encoding - 범주형 변수의 문자열을 수치형으로 변환 OneHot Encoding - 피쳐값의 유형에 따라 새로운 피쳐를 추가해 고유값에 해당하는 컬럼에만 1을 표시하고 나머지 컬럼에는 0을 표시 카테고리컬 데이터인 Mixer 와 Computer 를 0과 1로 변환하여 처리하는걸 볼 수 있다. 레이블 인코딩을 이용해 문자열을 숫자로 변환한 후 2차원 데이터로 변환하는 reshape을 사용 원-핫 인코딩을 적용한 모습
Machine Learning - Feature Scaling, fit_transform(),transform() Feature Scaling 2가지 방법 표준화 (normalizer) : 평균을 기준으로 얼마나 떨어져 있느냐? 같은 기준으로 만드는 방법, 음수도 존재, 데이터의 최대최소값 모를때 사용. 정규화 (MinMaxSclaer) : 0 ~ 1 사이로 맞추는 것. 데이터의 위치 비교가 가능, 데이터의 최대최소값을 알때 사용 학습해야할 데이터일때는 fit_transform( 변수 ) 를 사용하여 학습시킨다. 이미 학습이 끝난 상태에서 새로운 데이터를 스케일링 할때에는 fit_transform( 변수 ) 대신 trnasform( 변수 ) 를 사용하여야 한다.
Machine learning - 신규 Data Predict 하는 순서 주어진 데이터프레임 이외에 새로운 데이터를 예측해야 할 때 1. Numpy array 로 새로운 데이터를 가공한다. 2. Numpy array 의 shape을 기존의 train 데이터와 동일하게 리쉐입 해준다. 3. 이후 스케일러 과정을 거치며 기존의 방법을 사용한다
Python - Classification 인공지능의 성능평가 방법 - Confusion Matrix Confusion Matrix - 분류 결과표 컨퓨전 매트릭스가 표현하는 분류결과표는 내포한 의미가 중요하니 다시 한번 생각해볼 것 ! 아래의 표와 같이 정확도, 적중율, 정밀도를 구할 수 있다. # confusion matrix 호출방법 # 정확도 확인 방법