One-Hot Encoding 과 Label Encoding 비교 One-Hot Encoding 숫자의 차이가 모델에 영향을 미치는 선형 계열 모델(로지스틱회귀, SVM, 신경망)에서 범주형 데이터 변환시 라벨 인코딩 보다 원핫 인코딩을 사용한다. 두 가지 방법 1) Pandas get_dummies 방법 pd.get_dummies(df, columns = [ '컬럼명1','컬럼명2']) 문자열 컬럼은 삭제되고, 인코딩된 컬럼이 끝에 대체되어 붙는다. get_dummies() 의 경우, 문자열 데이터는 자동으로 전부다 인코딩이 이루어 진다. 숫자형으로 되어 있는 범주형을 인코딩하려면(ex married 0,1) 따로 지정을 해줘야 한다. get_dummies 함수는 우리가 원하는 범주를 제외시켜주는 기능..