One-Hot-Encoding
A, B, C
1 0 0 <- A의 인코딩 결과
0 1 0 <- B의 인코딩 결과
0 0 1 <- C의 인코딩 결과
예제
df = pd.read_csv('emp_test.csv')
'''
eno ename dept gender salary
0 11 Adam 10 m 2000
1 12 Smith 20 m 2400
2 13 Mary 20 f 2200
3 14 Blake 40 m 3000
4 15 Laura 30 f 3600
'''
# gender컬럼 One-Hot-Encoding 하기
pd.get_dummies(df['gender'])
'''
f m
0 0 1
1 0 1
2 1 0
3 0 1
4 1 0
'''
# dept컬럼 One-Hot-Encoding 하기
pd.get_dummies(df['dept'])
'''
10 20 30 40
0 1 0 0 0
1 0 1 0 0
2 0 1 0 0
3 0 0 0 1
4 0 0 1 0
'''