私のラップトップにローカルクラスタを構築しています(擬似モード)。どこで別のmapreduceコマンドを実行するかローカルクラスタのようにEMR上でジョブを実行できますか?
hadoop-streaming -D mapred.output.compress=true \
-D mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec \
-files my_mapper.py,my_reducer.py \
-mapper my_mapper.py \
-reducer my_reducer.py \
-input /aws/input/input_warc.txt \
-output /aws/output
私はEMRで実行する必要があります。使用できる2つのオプションがあります。一つはコンソール、もう一つはaws cliです。私は上記のように正確に実行したい。そのために、私はEMRマスターにsshすると、このコマンドを実行できるはずです。それは正しい方法ですか、この承認の欠点がありますか?