これは、これは私が持っているコードで3つのcolsの3行複数の列に対してOneHotEncoderを使用し、各列の最初のダミー変数を自動的に削除する方法は?
Name Organization Department
Manie ABC2 FINANCE
Joyce ABC1 HR
Ami NSV2 HR
とデータセットです。今ではここまでで結構です
、どのように私は、それぞれの第1のダミー変数列を削除しますか?
# Importing the libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
# Importing the dataset
dataset = pd.read_csv('Data1.csv',encoding = "cp1252")
X = dataset.values
# Encoding categorical data
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_X_0 = LabelEncoder()
X[:, 0] = labelencoder_X_0.fit_transform(X[:, 0])
labelencoder_X_1 = LabelEncoder()
X[:, 1] = labelencoder_X_1.fit_transform(X[:, 1])
labelencoder_X_2 = LabelEncoder()
X[:, 2] = labelencoder_X_2.fit_transform(X[:, 2])
onehotencoder = OneHotEncoder(categorical_features = "all")
X = onehotencoder.fit_transform(X).toarray()
パンダ 'get_dummiesを持っています() 'は、' drop_first'というパラメータを持ち、Trueに設定することができます。以下はget_dummiesの使用例です:https://stackoverflow.com/a/43971156/1870832 –
Hey Max Power、X = pd.get_dummies(X、drop_first = True))を試しましたが、エラーを示しています。SyntaxError:構文が無効です – Vijay
下記の私の答えを参照し、テストされた出力。私はあなたの構文エラーがあなたのコードの別の部分から来たと推測しています。 –