0
私はUbuntu 16.04で正常に動作するテンソルフローのアプリケーションを持っていますが、テンソルフロー/テンソルフロードッカーのイメージ/ nvidia-dockerで実行しようとすると、この点に達してフリーズします:Tensorflowアプリケーションがドッカーコンテナでフリーズする
2017-07-12 22:06:10.917255: W
tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow
library wasn't compiled to use SSE4.1 instructions, but these are
available on your machine and could speed up CPU computations.
2017-07-12 22:06:10.917289: W
tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow
library wasn't compiled to use SSE4.2 instructions, but these are
available on your machine and could speed up CPU computations.
2017-07-12 22:06:11.023765: I
tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:901] successful
NUMA node read from SysFS had negative value (-1), but there must be
at least one NUMA node, so returning NUMA node zero
2017-07-12 22:06:11.024133: I
tensorflow/core/common_runtime/gpu/gpu_device.cc:887] Found device 0
with properties:
name: Quadro M4000
major: 5 minor: 2 memoryClockRate (GHz) 0.7725
pciBusID 0000:00:05.0
Total memory: 7.93GiB
Free memory: 7.87GiB
2017-07-12 22:06:11.024159: I
tensorflow/core/common_runtime/gpu/gpu_device.cc:908] DMA: 0
2017-07-12 22:06:11.024168: I
tensorflow/core/common_runtime/gpu/gpu_device.cc:918] 0: Y
2017-07-12 22:06:11.024190: I
tensorflow/core/common_runtime/gpu/gpu_device.cc:977] Creating
TensorFlow device (/gpu:0) -> (device: 0, name: Quadro M4000, pci
bus id: 0000:00:05.0)
エラーメッセージが出力されないため、どこから起動するのかわかりません。私が紛失している可能性のある提案や、これをさらに解決するための手順はありますか?
私のnvidia-dockerのインストールが正しく機能していることを確認しました。
gdbを添付してCスタックトレースを送信できますか?これは本当に変です... –
@AlexandrePassos私はDockerfileのエントリポイントを次のように設定しています: 'ENTRYPOINT [" python3 "、" -m "、" worker "、" --data- dir "、"/usr/src/app/data "]' 私のアプリケーションから出力が見えなくなったとき、私は起動していないと思っていましたが、ポートからでもドッカーのログでstdoutを取得していません。見知らぬ人は、私が手動でコンテナに入って上記のコマンドを起動すると、私は出力を見ることができます。前にこのようなことは何も見たことがありません。何を作っていますか? – spiffly