私はpysparkを使用しています。スパークマップ機能のディクショナリでjsonファイルを使用する方法は?
Googleマップにリージョン名とそのポリゴンを含む「region-polygon-mapping」というファイルを読み込んでいます。
私は別のデータセットRDDを処理するとき、RDDのポイントがポリゴンであるかどうかをテストするために、マップ関数で "region-polygon-mapping"を使いたいと思います。
RDDマップ機能でjsonを通常のファイルとして使用するにはどうすればよいですか。 jsonファイルは非常に小さく、sparkは2番目のrddとしてjsonを使用することを許可しません。なぜなら、別のrddのマップ関数のrddをユーザーに割り当てることはできないからです。私がそれをするなら、ここに誤りがあります。
pickle.PicklingError:オブジェクトを過度に深く再帰させる必要がありませんでした。