spark-terasortをspark-1.6.1-bin-hadoop1(hadoop 1.Xの既成パッケージ)で実行しようとしています。spark-1.6.1-bin-hadoop1でspark-terasortを実行することができません
私は火花を実行しよう:
./bin/spark-submit --class com.github.ehiggs.spark.terasort.TeraGen ~/spark-terasort/target/spark-terasort-1.0-jar-with-dependencies.jar 100G hdfs:///input_terasort
私はエラーを取得する:
Exception in thread "main" java.lang.IncompatibleClassChangeError: Found class org.apache.hadoop.mapreduce.JobContext, but interface was expected
これは(火花と火花terasortの間で)異なるHadoopのバージョンで行う必要があります。私はpom.xml(spark-terasortをコンパイルするために使用されていました)を使いこなそうとしましたが、あまり成功しませんでした。
spark-terasortをspark-1.6.1-bin-hadoop1と一緒に使用するにはどうすればよいですか?
ありがとうございます。1.6.0-SNAPSHOTバージョンのsparkはどこで入手できますか? – JC1
ああ - あなたは1.6.1でうまくいくはずです:あなたのバージョンは私のものより少し新しいです*。基本的に私はあなたの問題を再現するために、より多くの宿題をする必要があります。今の私の結果は、テラジェン*に若干の希望があることを示すために、より "fyi"として提供されました。 – javadba