私は、Dockerコンテナを使用するデータ科学者が増えており、再現性のある分析が可能です。外部のサーバーからDockerコンテナにデータをどのようにアクセス/プルしますか?
質問:データをDockerコンテナにダウンロード/プルするにはどうすればよいですか?
データは、URLを介してダウンロード可能で、自然にあなたがDockerfile
wget www.server_to_data.org/path/path/myfile.gz
にこのような行を追加することができますしかし、私はデータは、それによってキー - と、サーバへのユーザssh
、サーバー上に座っている場合ペアは~/.ssh/id_rsa.pub
です。私はこれがどのようにセキュリティに敏感に働くかわからない。
通常、この場合、データをダウンロードまたはアクセスするにはどうすればよいですか?
サーバーをマウントする可能性がありますが、コンテナ/ VM内でどのようにアクセスするかわかりません。
データにアクセスするための資格情報(特に対話型ログイン資格情報)が必要な場合は、再現性のある分析が可能であるかどうかは不明です。つまり、あなたの機関の外にいる誰かが、データにアクセスするために必要な資格情報を持っていないということです。あなたの研究機関が研究データセットを外部のユーザーに公開するための確立されたメカニズムを持っていない場合、おそらく最初にそれに対処する必要があります。 – larsks
これは、バインドマウント( 'docker run -v $ HOME/.ssh/id_rsa:/root/.ssh/id_rsa ...')を使用して秘密鍵をコンテナに公開することができます。環境変数として渡すことができます。 – larsks