0
私はSparkアプリケーションにPySpark 1.6.1を使用しています。私は引数--py-files
を使ってロードしている追加のモジュールを持っています。また、ApolloNetを初期化するためにモジュールの1つからアクセスする必要があるh5ファイルもあります。zipにh5ファイルを追加してPySparkで使用する
モジュールからそれらのファイルにアクセスできる方法はありますか?それらを同じアーカイブに置くとどうなりますか?私はこのアプローチを試みましたが、ファイルはすべての作業者には存在しないため、エラーが発生していました。ファイルを各作業員にコピーすることは考えられますが、それを行うより良い方法があるかどうかを知りたいのですが?