2017-04-21 12 views
0

rddの文字 'A'で始まる別の単語を数える必要があります。rddの特定の単語をPythonで数えます

私は別の言葉を数えることを知っていますが、条件付きの単語を数えません。

words= myRDD.distinct().count() 
print words 
+0

組み込み関数を使用することができます。 –

+0

弾力性のある分散データセット –

答えて

0

フィルタを開始文字で開始してからカウントする必要があります。以下のような何か:

words = myRDD.filter(lambda x: x[0] == "a").distinct().count() 

また、あなたは、あなたが「RDD」であるかを定義しない場合、我々は助けることができる

myRDD.filter(lambda x: x.startswith('a')) 
関連する問題