私が建てdecisiontree、例にsklearn使用:sklearn-decisiontreeclassifierを使用しているときに「なし」を処理するにはどうすればいいですか?
clf = tree.DecisionTreeClassifier()
clf = clf.fit(X,Y)
result = clf.predict(testdata)
Xは、どのようにそれを行うには、「なし」Xに存在しない場合、トレーニング入力サンプルですが?それは与えられた不純物関数(エントロピー、ジニ指数を最小にするために、ツリーの各ノードに分割を行うため
通常、データのすべてのエントリは数値タイプである必要があります。欠けている値を扱う1つの方法は、それらをただただ入力することです。必要に応じて、特定の列に帰属する行をコード化した新しいブール変数を作成してください。 – Quickbeam2k1