0
rddの文字 'A'で始まる別の単語を数える必要があります。rddの特定の単語をPythonで数えます
私は別の言葉を数えることを知っていますが、条件付きの単語を数えません。
words= myRDD.distinct().count()
print words
rddの文字 'A'で始まる別の単語を数える必要があります。rddの特定の単語をPythonで数えます
私は別の言葉を数えることを知っていますが、条件付きの単語を数えません。
words= myRDD.distinct().count()
print words
フィルタを開始文字で開始してからカウントする必要があります。以下のような何か:
words = myRDD.filter(lambda x: x[0] == "a").distinct().count()
また、あなたは、あなたが「RDD」であるかを定義しない場合、我々は助けることができる
myRDD.filter(lambda x: x.startswith('a'))
組み込み関数を使用することができます。 –
弾力性のある分散データセット –