컴퓨터는 숫자로 처리해야 한다.
숫자가 아닌 데이터 중에서, 카테고리로 판단되는 데이터는 숫자로 바꿔줄 수 있다.
Label Encoding - 범주형 변수의 문자열을 수치형으로 변환
OneHot Encoding - 피쳐값의 유형에 따라 새로운 피쳐를 추가해 고유값에 해당하는 컬럼에만 1을 표시하고 나머지 컬럼에는 0을 표시
카테고리컬 데이터인 Mixer 와 Computer 를 0과 1로 변환하여 처리하는걸 볼 수 있다.
레이블 인코딩을 이용해 문자열을 숫자로 변환한 후
2차원 데이터로 변환하는 reshape을 사용
원-핫 인코딩을 적용한 모습
'Machine Learning' 카테고리의 다른 글
Python - Prophet 라이브러리 사용법,fit,predict,periods (0) | 2022.05.11 |
---|---|
Machine Learning - Feature Scaling, fit_transform(),transform() (0) | 2022.05.06 |
Machine learning - 신규 Data Predict 하는 순서 (0) | 2022.05.06 |
Python - Classification 인공지능의 성능평가 방법 - Confusion Matrix (0) | 2022.05.06 |