1
私はこのタイプのデータセットを持っています。さまざまなフィーチャディメンションを持つデータセットを使用してsklearnクラシファイアをトレーニングするにはどうすればよいですか?
Ingredient_A | Ingredient_B | Ingredient_C | Ingredient_D | Meal
------------------------------------------------------------------
Bread | Butter | - | - | buttered bread
Avocado | Tomato | Garlic | - | Guacamloe
私はそれでsklearnディシジョンツリー分類子を訓練したいが、私は私のデータセットの様々な特徴の次元に対処する方法がわかりません。理想的には、私は空のセルを無視することを望むでしょう。私は空のセルをナノに置き換えることを考えましたが、スクールはナノを受け入れません。 sklearnでこのようなデータセットを使用する方法はありますか?
私はこの目的のために疎な行列を使うことができると信じています – mkaran