-2
私はPOJO値のRDDを持っています。私はRDDの値を反復する必要があります。しかし、データの量が膨大なので、私は収集を使用したくありません。収集を使わずにapache sparkのRDDで反復する
collectを使用せずにRDD値を反復する方法はありますか。
私はPOJO値のRDDを持っています。私はRDDの値を反復する必要があります。しかし、データの量が膨大なので、私は収集を使用したくありません。収集を使わずにapache sparkのRDDで反復する
collectを使用せずにRDD値を反復する方法はありますか。
あなたが探しているものはすべて、地図または地図です。火花の区画変換です。
あなたが達成しようとしているのは何より洞察
を取得するには、リンクに従ってください?最終目標は何ですか?ほとんどのRDDオペレーションは、何らかの形でRDDを「反復」する。最も基本的なものは、各要素に関数を適用し、変換された要素とともに新しいRDDを返す 'map'です。 – puhlen
POJOのRDDを永続ストアに保存しようとしている場合は、 'map'機能も使用できます。その場合、すべてのデータを収集する必要はありません。しかし、あなたが達成しようとしていることを教えてもらえるとよいでしょう。 – himanshuIIITian