生のデータを処理した後、私の結果は次のようになります。複数の値を持つキー、値は辞書の値です - Key +各辞書の値PySpark - 複数の辞書の値を分割する方法
[('HOMICIDE', {'2017': 1}),
('DECEPTIVE PRACTICE', {'2015': 2, '2017': 2, '2016': 8}),
('ROBBERY', {'2016': 2}),
('OTHER OFFENSE', {'2016': 3}),
('MOTOR VEHICLE THEFT', {'2017': 2, '2016': 2})]
どのように私は私がリストに辞書を移動する必要があり、そこから私が処理する必要があるかどうか
('HOMICIDE', '2017': 1),
('DECEPTIVE PRACTICE', '2015': 2),
('DECEPTIVE PRACTICE', '2017': 2,),
('DECEPTIVE PRACTICE', '2016': 8),
('ROBBERY', '2016': 2),
('OTHER OFFENSE', '2016': 3),
('MOTOR VEHICLE THEFT', '2017': 2)
('MOTOR VEHICLE THEFT', '2016': 2)]
に上記を行うことができますか?
私はを実行しようとしましたrdd.flatMapValues(dict.items).collect() エラーが発生しました - もう一度確認してください。その他の問題はありません ファイル "/usr/local/anaconda/lib/python2.7/pickle.py" 、ライン306、 RV =削減(self.proto) TypeError例外保存中:私はそれは を働いてしまったベローズを与えたときmethod_descriptorが –
代わりのrdd.flatMapValues(dict.items).collectを()オブジェクト酸洗いすることはできません> > rdd.flatMapValues(ラムダデータ:data.items())。collect() –