n종류의 label을 갖는 한 feature를 0과 1만을 갖는 feature n개로 encodeing하는 방법입니다.
판다스에서는 pd.get_dummies(시리즈) 메서드를 이용하여 해당 pd.Series를 one-hot encoding한 pd.DataFrame을 얻을 수 있습니다.
'머신러닝' 카테고리의 다른 글
# Continuous 형 데이터의 분석 방법 : band로 묶어서 분석하기, groupby() 이용하기 (0) | 2020.02.16 |
---|---|
# cross-validation (0) | 2020.02.16 |
# accuracy_score (0) | 2020.02.16 |
# LogisticRegression (0) | 2020.02.16 |
# train_test_split() (0) | 2020.02.16 |