奇妙なことに私はストリーミング中の一連の辞書のk、vペアの数を確認するためにチェックしたいが、私はできないようだこの。例えばストリーミングされた辞書でスパークストリーミングと操作を実行
lines = ssc.socketTextStream("127.0.0.1", 5006)
json_format = lines.flatMap(lambda recieved: json.loads(recieved))
dict_format = json_format.flatMap(lambda x : len(x)).reduce(lambda a, b: a+b)
私は次のエラーを取得する:
File "/home/xx/spark-1.6.1/python/pyspark/rdd.py", line 1776, in combineLocally
merger.mergeValues(iterator)
File "/home/xx/spark-1.6.1/python/pyspark/shuffle.py", line 236, in mergeValues
for k, v in iterator:
TypeError: 'int' object is not iterable
私たちは辞書のシリーズを持っていると仮定することができます - そこに障害がjson.loads()
ではありませんが、私はこの単純な長さを取るように見えることはできません。