私はEMRクラスタを作成し、単純なwordcount.pyスパークプログラムを実行するawsデータパイプラインタスクを作成しようとしています。スレッド「メイン」にjava.io.IOExceptionでEMRにpython spark stepを追加するには?
例外::私は、タスクをアクティブにしたとき、私はのようなエラーを取得し、
今"myEmrStep": "s3://test/wordcount.py,s3://test/data/abc.txt,s3://test/output/outfile5/",
:私は通りの手順は簡単ですdatapipelineの定義を使用しましたジョブジャーを開くエラー: /mnt/var/lib/hadoop/steps/s-187JR8H3XT8N7/wordcount.py( )org.apache.hadoop.util.RunJar.run(RunJar.java:160)at org.apache。 hadoop.util.RunJar.main(RunJar.java:136)原因: java.util.zip.ZipException:zipファイルを開く際にエラーが発生しました。 java.util.zip.ZipFile.open(Nativ
で のjava.util.zip.ZipFile。(ZipFile.java:215)でのE法)のステップのように思えるのJavaの代わりのpythonを使用してプログラムを実行しようとしています。 何か考えてください。
ありがとうございました。