2017-06-09 8 views
1

私はTensorflowとそのtf.learn apiを使って、DNNRegressorモデルを作成してトレーニングしています。私は多価(私は各列にその列に複数の整数値を持つことができます)の整数フィーチャー列を持っていて、このフィーチャー列にはtf.contrib.layers.sparse_column_with_integerized_featureを使用します。tf.contrib.layers.sparse_column_with_integerized_featureは、1つの列内に複数の入力を持つカテゴリフィーチャを処理できますか?

私の質問は、csvファイルの多価フィールド列の正しい区切り文字です。 COL2に整数機能valuseをseperatingのためではなく、それはそのない右ようで、I:「」あなたは私が使用して見るように

1, 2, 1:2:3:4, 5 
    2, 1, 4:5, 6 

:例えば は、私がcol2には、多価機能とそのない1つのホット機能であることをcsvファイルを持っているsupose tf.contrib.layers.sparse_column_with_integerized_featureとして、この機能の列を宣言するとDNNRegressorを実行中にこのエラーを得た:

'Value passed to parameter 'x' has DataType string not in list of allowed 
    values: int32, int64, float32, float64'. 

私は本当に

答えて

0

tf.contrib.layers.sparse_column_with_integerized_featureがのためには、あなたの助けに感謝またはint64の値しかないため、正確には動作しません。

しかし、tensorflowは数値列の多次元をサポートしているため、tf.feature_column.numeric_columnで作業し、shapeを指定してください。テンソルフローでは、これらの図形がすべて同じであることが期待されるため、すべての値を共通の図形に塗りつぶす必要があります。

コロン':'デリミタは(質問がXMLについてですが、CSVで同じ作品)パンダとDataFrameに複数の値を読み取る方法、here's an example多価列の罰金です。 model.train()に渡すことができるこのデータフレームはinput_fnとして機能します。

関連する問題