を分割しました。問題は、私がトレーニングに使用したいデータを多くの小さなCSV(feat-01.csv
、feat-02.csv
など)に分割していることです。私はこれらをEstimator
に、より正確にはinput_fn
の何らかの種類でこれを行うようにしています。Tensorflowはcsv input_fn
私の理想的な解決策は、dask.Dataframe
(今まで私のデータをどのように生成していたか)を取って、見積もりにバッチする何らかの入力機能を持つことでした。いくつかのドキュメンテーション文字列を指すように思われるが、私はちょっと、原因を直接DASKを使用する方法についてのドキュメントの不足のためにこのアイデアをあきらめた
TypeError: Expected `meta` to specify type DataFrame, got type Index
:しかし、これはで失敗
import tensorflow as tf
import dask.dataframe as dd
ddf = dd.read_csv('feat-*.csv')
tf.contrib.learn.extract_dask_data(ddf)
:私はこれらの線に沿って何かを試してみましたそれが可能であるべきだということを明らかにしている。私はinput_fn
をcsvファイルから直接フィードすることを考えていましたが、このユースケースについての具体的な例も見つかりませんでした。
TFのnoobのビットで、私は達成する最もクリーンな方法が何であるか疑問に思っていました。
'feat'と '*'の間のハイフンはPythonでエラーを投げます。アンダースコアはできません。テストするファイルの名前を変更しようとしましたか?ハイフンを削除して、ワイルドカードがハイフンを処理できるようにすることさえできますが、それが動作であるかどうかわからない(テストできません)ことはできません。 – Rookie
@Rookieこれはここではそうではなく、 'Dataframe'は正常に構築されています。また、Pythonで一般にファイルを開くときにハイフンが問題になることはないと確信しています。 – nikitautiu