私はMRJobを使用してEMRでbuilding on some old code from a few years back using the commoncrawl datasetです。MRJobは、インライン、ローカル、emr、またはハーフープを実行しているかどうかを確認します
self.options.runner == 'emr'
これはどちらか働いたことはないように思われなかったり、もはやself.options.runnerがタスクに渡されていない、動作します:コードは、ローカルまたはEMR上で実行されているかどうかを判断するために、次の内部MRJobサブクラスマッパー機能を使用しています常にデフォルトの'inline'
に設定されています。問題は、現在のバージョンのMRJob(v0.5.0)でコードがローカルで実行されているのか、emrで実行されているのかを判断する方法があるかどうかです。
同じエラーが発生しました。この問題は現在、https://github.com/commoncrawl/cc-mrjob/issues/7で追跡されています。 –