DC/OS v1.8.4がインストールされていて、宛先ノードにGPUリソースがあり、nvidiaドライバもインストールされていますが、テンソルフローをメソスコンテナに展開しようとしましたが、 mesosのstderrの内の1つのエラーメッセージ:テンソルフローの画像のLD_LIBRARY_PATHによるトラブル
mesos-containerizer: error while loading shared libraries: libmesos-1.0.1.so: cannot open shared object file: No such file or directory
しかし、私は、このようなnginxの、(もmesosコンテナ内)ワードプレスとして、successfuly他のサービスを展開することができ
問題は、その親画像に、tensorflow画像によって引き起こされる可能性がCUDA、LD_LIBRARY_PATHをリセット:
ENV PATH /usr/local/nvidia/bin:/usr/local/cuda/bin:${PATH} ENV LD_LIBRARY_PATH /usr/local/nvidia/lib:/usr/local/nvidia/lib64
mesos-agentが起動する前に、エグゼキュータの環境変数LD_LIBRARY_PATHを "/ opt/mesosphere/lib"に設定して、エグゼキュータが必要なファイルを見つけることができるようにしますが、上記の場合LD_LIBRARY_PATHはtensorflow、それでスタートアップに失敗しました!
誰でもOpenDCOSがこの問題をどのように処理するかを知っていますか?これらの公開CUDAイメージを変更しますか?