私はmrjob/botoモジュールを介してamazonのEMRにコードを送信しています。私はいくつかの外部のpythonの依存関係(すなわちnumpy、botoなど)を持っていますが、現在はpythonパッケージのソースをダウンロードし、mrjob.configファイルの "python_archives"フィールドにtarballとしてそれらを送信する必要があります。EMRのPython依存関係管理
これは、私が望むよりも扱いにくいものになります。私が何らかの理由で同じrequirements.txtファイルを使用することができるのだろうかと疑問に思っています。私のvirtualenvセットアップで自分の依存関係でemrインスタンスをブートストラップします。 EMRインスタンスにvirtualenvを設定して、次のようなことを行うことが可能です:
pip install -r requirements.txt
私はローカルですか?