テキストまたはリストの要素の数を数えるさまざまな方法があることは知っています。しかし、私はなぜこれが動作しないのか理解しようとしています。結果は3 は私がmy_count(_)と呼ばれる次の関数を定義し、そうすることですどこでSparkを使用してテキストまたはリスト内の要素の数をカウントする
A_RDD=sc.parallelize(['a', 1.2, []])
acc = sc.accumulator(0)
acc.value
A_RDD.foreach(lambda _: acc.add(1))
acc.value
に同等のコードを記述しようとしていますが、私は結果を取得する方法がわかりません。 A_RDD.foreach(my_count)は何もしません。私もエラーはありませんでした。私は何を間違えたのですか?
counter = 0 #function that counts elements
def my_count(_):
global counter
counter += 1
A_RDD.foreach(my_count)
メアリー、投稿された回答があなたの質問を明確にするかどうか確認できますか? –