0
Apache Sparkジョブを実行するときに直面した問題の1つは、RDDの各要素を互いに掛け合わせることです。 だけで、私はこれに似た何かをしたい、スパークRDDの要素を互いに掛け合わせる
を置く現在、私は、各「foreachの」の2つのイテレータを使用して、これをやっています。私の直感は、これが非常に効率的なやり方でできるということです。
for (elementOutSide <- iteratorA) {
for (elementInside <- iteratorB) {
if (!elementOutSide.get(3).equals(elementInside.get(3))) {
val multemp = elementInside.getLong(3) * elementOutSide.getLong(3)
....
...
}}}
状況を改善し改善するのにお手伝いできますか?前もって感謝します .. !!
私はあなたが通常のデカルト結合を探していると思います。 – Alec
ところで、あなたの実装は実際には要件に適合しません。元のRDDのレコードが_unique_の場合にのみ動作する、実際の_elements_と_indices_は比較されません。 –
これらはユニークで、RDDはそれを保証するSQLクエリを使用して構築されます。 – Infamous