私はsklearn.neighbors.KNeighborsRegressorを使用している分類器で作業しています。私が使用 データの形式は次のとおりです。KNN sklearnのカテゴリラベル
- [numeric_feature1、numeric_feature2、...、numeric_featureN] [label_to_predict]
すべての機能は、私がしたいラベルを除く数値ですKNNを使って予測する。
複数の値を持つカテゴリラベルです(例: 'w1'、 'w2'、 'w3')。
私の質問は以下のとおりです。
- KNNは、カテゴリラベルや数値のみのものをサポートしていますか?
- 数値でしか機能しない場合は、ラベルを正しくエンコードする方法はありますか?
PD:私はおよそsklearn.preprocessing.LabelEncoderラベルをエンコードするために知っているが、マニュアルにカテゴリ値がハッシュ可能と同等でなければならないことを述べています。私のラベルは単なる言葉であり、それらの間の論理的な距離を計算する方法はありません。
PD2:私は、カテゴリラベルで試してみたと私はエラーになっている: "/ためにサポートされていないオペランドのタイプ(S): 'STR' と 'INT'"
を
MultilabelBinarizerを試してください –
コードスニペットと完全なスタックトレースを投稿してください。ラベルはカテゴリに属すると考えられており、距離計算には使用されていません。 – aberger