私のデータフローパイプラインは最後まで実行されていました。今日私は新しいデータセットでそれを実行したとき、私はNullPointerExceptionを取得し始めました。問題は、以下に示すように、例外が(スタックトレースのどこでも)自分のコードから来ていないように思われることです。データフローパイプラインのNPE SourceOperationExecutor.isSplitOperationTooLargeForDataflowService
これはデータフローフレームワークのバグですか(例外はisSplitOperationTooLargeForDataflowServiceで発生しているようです)このデータセット、より正確にはそのデータセットはデータフローにとって大きすぎますか?
どんな助力や洞察力があれば幸いです!
2016-07-04T16:27:00.044Z: Error: (fb0b4effcb8800a6):
java.lang.NullPointerException
at com.google.cloud.dataflow.sdk.runners.worker.SourceOperationExecutor.isSplitOperationTooLargeForDataflowService(SourceOperationExecutor.java:100)
at com.google.cloud.dataflow.sdk.runners.worker.SourceOperationExecutor.isSplitResponseTooLarge(SourceOperationExecutor.java:92)
at com.google.cloud.dataflow.sdk.runners.worker.DataflowWorker.doWork(DataflowWorker.java:227)
at com.google.cloud.dataflow.sdk.runners.worker.DataflowWorker.getAndPerformWork(DataflowWorker.java:146)
at com.google.cloud.dataflow.sdk.runners.worker.DataflowWorkerHarness$WorkerThread.doWork(DataflowWorkerHarness.java:164)
at com.google.cloud.dataflow.sdk.runners.worker.DataflowWorkerHarness$WorkerThread.call(DataflowWorkerHarness.java:145)
at com.google.cloud.dataflow.sdk.runners.worker.DataflowWorkerHarness$WorkerThread.call(DataflowWorkerHarness.java:132)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:745)
実行しているSDKのバージョンとサンプルのジョブIDを提供できますか? –
仕事-ID 2016-07-04_09_19_14-7168591499478192464、SDKのバージョン - GoogleクラウドSDK 0.9.86 アルファ2015年10月8日 BQ 2.0.18 BQ-nixの2.0.18 コア2015年11月6日 コア-nixの2015.09 .03 gcloud gsutil 4.15 gsutil-nix 4.14 – adarsh
SDKのバージョンが非常に古いようです。より最新のバージョン(最新1.6.0)にアップデートできますか? –