0
同じワーカーのエグゼキュータの間で共有オブジェクトを使用できますか?スパークと巨大な共有オブジェクト
たとえば、ファイルにデータがあります。このデータは、使用する前にコンパイルする必要があります。コンパイル後、それは直列化不可能なJavaオブジェクトです。 しかし、残念なことにコンパイルには多くの時間がかかります。私は各作業者に対して一度コンパイルし、このオブジェクトを作業者のすべての作業に使用したいと考えています。
私はこれをどのように達成することができますか?
ありがとうございました。
お返事ありがとうございます。私はmapPartitionをすでに使用していますが、デフォルトではcassandraから35パーティションRDDを取得しているので、私はそれが気に入らないのですが、6人しかいません。それは効率的なアプローチではないので、私は6に再パーティションを使用したくないです。今では、mapPartitionを混在させ、いくつかのキャッシュメカニズムで静的メソッドを使用しようとしています。 –