AI/Machine Learning
2021. 9. 29.
[ML] 범주형 변수 처리 - Label Encoding, One-hot Encoding
범주형 변수 (categorical variable) 캐글에서 주워온 데이터를 사용해 변주형 변수를 처리하는 방법과 scikit-learn 예시를 정리해보려 한다. 데이터셋에 대한 자세한 설명은 링크를 통해 볼 수 있다. import pandas as pd import numpy as np from sklearn.model_selection import train_test_split df = pd.read_csv('gender_personal_preferences.csv') df 이 데이터셋을 이용해 어떤 사람의 성별이 여성(F)일지 남성(M)일지 예측하려고 한다. 데이터셋에는 사람이 선호하는 색깔, 음악 장르, 술, 음료 이렇게 4가지의 특성이 있다. 이 작업은 성별(Gender)이 F와 M이라는 두 ..