1
私は1つのキーに対して複数の値(リスト)を持つrddを持っています。キーの各値からガベージをフィルタリングしたいと思います。1つのキーpysparkの複数の値のマップ
RDDは、このデータ
((key1, [('',val1),('', val2),..]),(key2,[...)
は、私はマップ機能が、ここで必要とされて知っているが、私は反対複数の値のためにマップを使用していないが、この
((key1,[val1, val2,...]), key2[...)
のようなものにそれをマップするましたかぎ。
これはこれを行うための私の努力です。
def mapper(x):
values = []
for a in x[1]:
values.append(a[1])
return(x[0], ap)
listRdd.map(mapper).collect()
が、私はいくつかのエラー
は、私はまったく同じでしたが、マップ機能に構文エラーがありました、あなたは歓迎されている –
かかわら説明してくれてありがとう! – eliasah