H2Oの入力データ(データフレーム)の項目のセット/リストを表すにはどうすればよいですか?H2O用入力CSVの項目リストを表します
私は、H2Oフローで1.6.5の発火水を使用しています。 私の入力データ(CSVファイルの列)は次のようになります。
age: numeric
gender: enum
hobbies: ?
sports: ?
趣味とスポーツは、可能なエントリ(〜20それぞれ)の限られた数のリスト/セットです。 H2Oはこれに適したデータ型を持っていないようです。これらをH2Oフローで処理できるCSVファイルにエクスポートするにはどうすればよいですか?
h2oについての考えはありませんが、マシン学習には「ワンホットエンコーディング」という概念があります。趣味やスポーツのリストに可能性のあるすべてのエントリを、あなたの性別属性のようなバイナリである「csv列」自体に単純にすることができます。 –
有効なオプションのように聞こえます、ありがとう。しかし、これを手動で行うよりも、より簡単で維持可能な方法があることを願っています。 –