私はスパークEMRジョブに自分の依存関係を持たせるために少なくとも2つの方法を知っています。 1つはfat jarを作成し、もう1つは--packages
オプションを使用してspark submitで必要なパッケージを指定することです。スパーク、ファットジャーの代替
ファットジャーはジップアップにかなりの時間がかかります。それは普通ですか? 〜10分。間違った設定をしている可能性はありますか?
コマンドラインオプションは問題ありませんが、エラーが発生しやすいです。
代替手段はありますか?私はgradleを使ってjarファイルに依存関係リストを含める方法(すでに存在している)があれば、それをダウンロードしてもらいたいです。これは可能ですか?他の選択肢はありますか?
更新:私は部分的な回答を掲示しています。私が元の質問で明確にしなかったことの1つは、でもは、異なるバージョンの同じjarファイルを持っているため、依存関係の競合があるときに気にすることです。