私はDataflow Shuffle serviceをPython環境で使用しようとしていますが、シャッフルサービスが機能していないようです。Dataflow Shuffleサービスを有効にするには?
Iは2.1より上SDKのバージョンを設定し、領域がus-central1
あります。 実験オプションを追加するだけでデータフローシャッフルサービスを有効にできると思ったのですが、何か不足していますか?
後、あなたが現象を再現することができ、私がテストしたコードです。
ジョブはエラーなく正常終了します。どんなコメントも参考になります!
編集
セルゲイの答えのおかげで、私は間違いを見つけました。私が間違っていたのは、実験オプションです。実験オプションを次のように設定します。
また、私はシャッフルサービスを使って簡単なパイプラインを実行するよう要望を出しました。ノートブックはDatalabで実行可能です。 https://gist.github.com/hayatoy/f6664f965a2519ec406e11235faf75b6
はあなたにセルゲイをありがとう、私は、文字列の代わりに、[「shuffle_mode =サービス」]リストとしてオプションの実験を設定する必要がありました。それは完全に機能し、リソースの使用量を減らすことができます! – HayatoY
非常にいいです。最終的なコードを(リストと)共有して、他のユーザーが将来使用するコードサンプルを持つようにしてください。 – Sergei
私は修正部分を追加し、要点としてもフルコード、私はこれが誰かを助けることを願っ:) – HayatoY