例えば、私は、次のCSV形式でデータを持っている:テンソルは、列内の複数の入力を持つカテゴリフィーチャをどのように処理しますか?
csv
col0 col1 col2 col3
1 A E|A|C 3
0 B D|F 2
2 C | 2
カンマで区切って各列は一つの特徴を表しています。通常、フィーチャはワンホット(例えばcol0、col1、col3)であるが、この場合、col2のフィーチャは複数の入力を有する(|によって分離される)。
テンソルが疎テンソルのワンホットフィーチャを処理できることは確かですが、col2のような複数の入力を持つフィーチャを処理できるかどうかはわかりません。
テンソルの疎テンソルでどのように表現すればよいですか?
あなたの助けを
col0 = tf.feature_column.numeric_column('ID')
col1 = tf.feature_column.categorical_column_with_hash_bucket('Title', hash_bucket_size=1000)
col3 = tf.feature_column.numeric_column('Score')
columns = [col0, col1, col3]
tf.estimator.DNNClassifier(
model_dir=None,
feature_columns=columns,
hidden_units=[10, 10],
n_classes=4
)
おかげで、私は以下のコードを使用します(しかし、私はCOL2入力方法を知りません)。
まずは、投稿した.csvにカンマが含まれていないことがまず問題です。 – alex
もちろん、カンマにはcsvが含まれています。 –