私はTensorflowを使用して自分のデータセットでニューラルネットワーク予測を行っています。私が最初にしたのは、コンピュータの小さなデータセットで動作するモデルでした。その後、コードを少し変更して、大規模なデータセットでGoogle Cloud ML-Engineを使用して、列車と予測をML-Engineで実現しました。テンソルフローを使ったデータ正規化
パンダデータフレームの機能を標準化していますが、スキューが発生し、予測結果が悪くなります。
私が本当に好きなのは、ライブラリtf-transform
を使ってグラフのデータを正規化することです。これを行うには、関数preprocessing_fn
を作成し、 'tft.scale_to_0_1
'を使用したいと思います。 https://github.com/tensorflow/transform/blob/master/getting_started.md
私が見つけた主な問題は、予測をしようとしているときです。私はインターネットを探していますが、トレーニングでデータが正規化されている輸出モデルの例は見つかりません。私が見つけたすべての例では、データはどこでも正規化されていません。
私が知りたいと思っているのはトレーニングでデータを正規化し、予測を行うために新しいデータで新しいインスタンスを送信すると、このデータはどのように正規化されますか?
≠Tensorflowデータパイプラインにある可能性がありますか?正規化を行うための変数はいくつかの場所に保存されていますか?
要約:モデルの入力を正規化し、新しいインスタンスも標準化する方法を探しています。
非常に遅れて申し訳ありませんが、add_engineered()アプローチは完全に機能しました。 – Marc