-3
私はRDD
の最初の要素を与えるrdd.first()
メソッドを知っています。SparkのIndexで要素を取得する方法RDD(Java)scalaではない、Python
また、私に最初のnum
要素を与える方法rdd.take(num)
があります。
インデックスで要素を取得する可能性はありますか?
私はRDD
の最初の要素を与えるrdd.first()
メソッドを知っています。SparkのIndexで要素を取得する方法RDD(Java)scalaではない、Python
また、私に最初のnum
要素を与える方法rdd.take(num)
があります。
インデックスで要素を取得する可能性はありますか?
RDDは索引付けされていませんが、ほとんどの場合、順序が保証されず、効率的な単一項目アクセスがサポートされません。
あなた
zipWithIndex
とfilter
ことができます。zipWithIndex
、スワップ要素およびlookup
。ただし、これは推奨されていません。リニアスキャンが必要で、非確定的な動作をする可能性があります。
分散処理システムの場合、順序は重要ではありません。 – philantrovert