2017-03-09 9 views
-2

私はPOJO値のRDDを持っています。私はRDDの値を反復する必要があります。しかし、データの量が膨大なので、私は収集を使用したくありません。収集を使わずにapache sparkのRDDで反復する

collectを使用せずにRDD値を反復する方法はありますか。

+2

を取得するには、リンクに従ってください?最終目標は何ですか?ほとんどのRDDオペレーションは、何らかの形でRDDを「反復」する。最も基本的なものは、各要素に関数を適用し、変換された要素とともに新しいRDDを返す 'map'です。 – puhlen

+0

POJOのRDDを永続ストアに保存しようとしている場合は、 'map'機能も使用できます。その場合、すべてのデータを収集する必要はありません。しかし、あなたが達成しようとしていることを教えてもらえるとよいでしょう。 – himanshuIIITian

答えて

関連する問題