私は画像に示すようなデータを持っている月のような複数の入力と固定値列
に基づいて複数の出力を予測します。それは約25,000行です。データには、過去4年間の約12ヶ月の詳細が含まれています。私は特定の月と特定の求人情報のために開かれたクライアントとポジションを予測したい。
from sklearn.cross_validation import train_test_split
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
df_final['Clientname_numeric'] = le.fit_transform(df_final['ClientName'])
X = df_final[['MONTH','JobTitleID']]
y = df_final[['PositionsOpened','Clientname_numeric']]
x_train,x_test,y_train,y_test = train_test_split(X,y,test_size = 0.05)
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
clf = RandomForestClassifier()
clf.fit(x_train, y_train)
predictions = clf.predict(x_test)
predictions = predictions.astype(int)
accuracy = accuracy_score(y_test,predictions)
私は、コードの上に使用して、エラー とValueErrorを取得しています:マルチクラス・マルチ出力が
私はそれが0.27です良い精度を得ていません。適用できる他のモデルはありますか?企業ごとに異なるグラフがありますので、何を適用するのか理解できません。私は上記のコードを更新し、そこにコードが掲載されています –