ご使用の場合によって異なります。デフォルトでは、mavenには、uber jar内のspark-sqlのすべての依存関係が含まれています。あなたのケースに基づいて、それらのすべてを使用することはできません。したがって、依存関係からそれらを除外することができます。
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-sql_2.11</artifactId>
<version>2.1.0</version>
<exclusions>
<!-- to remove jackson-databind from your uber jar -->
<exclusion>
<groupId>com.fasterxml.jackson.core</groupId>
<artifactId>jackson-databind</artifactId>
</exclusions>
</exclusions>
</dependency>
しかし、アプリケーションでspark-sqlのほとんどの機能を使用している場合は役に立ちません。
多くの場合、スパークの依存関係は、アプリケーションを実行する環境(スタンドアロンモードを除く)によって提供されます。このような場合、spark-sql依存関係を提供された依存関係として次のようにフラグを立てることができます。
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-sql_2.11</artifactId>
<version>2.1.0</version>
<scope>provided</scope>
</dependency>
基本的な質問:なぜSparkを他のアプリケーションに組み込みたいのですか?他のアプリケーションに組み込まれていないクラスタ上で実行する必要があります –
私は本当にSparkに興味がありません。しかし、私はJavaのRデータフレームやPandasデータフレームのような何らかのデータフレームが必要で、コードはApacheまたはMITライセンスの下になければなりません。他に提案はありますか? – David
データフレームをどのような作業にしたいのですか? –