2016-06-23 16 views
1

私はこのようになります辞書持っている:私はこのようになりますCVSたいcsvに辞書の辞書を印刷しますか?

defaultdict(<type 'int'>, {'201304': defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}), '201305': defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}), '201306': defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}), '201301': defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}), '201302': defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}), '201303': defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}), '201212': defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2})}) 

を:私が今持っているもの

month,District - 1,District -2, District -3...... for however many districts there are 
201304,20,9,5,6,..... 

は次のとおりです。

with open('output.csv','wb') as output_file: 
    w= csv.writer(output_file) 
    w.writerows(months.items()) 

ヶ月です上記の私の辞書の名前。残念ながら、それは出力:

私は月ごとに1行で必要なもの
201304 defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}) 
201305 defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}) 
201306 defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}) 
201301 defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}) 
201302 defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}) 
201303 defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}) 
201212 defaultdict(<type 'int'>, {'District - 1': 20, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}) 

month,District - 1,District -2, District - 3, .... (as many as show up) 
201304,22,34,2,3,4,2,3,14 
201305,34,22,1,3,5 
201306,23,4,42,4,2,2,24,2,5,6,6,7,1 

私のコードを変更する方法上の任意の提案は、これを行うには?内部辞書の各値について

+0

あなたは持っていると思う63行の2行の例を与えることができます。あなたの例で質問の冒頭に1つの日付と1つの行のすべての区域があったので、あなたは1行に1つの日付と1つの区域を書くように要求しているので、それが表示されたいのは明らかではありませんから – Hani

+0

しかし、数ヵ月ほどの数の行があります。私は私の以前の記述で混乱していた、今一貫しているべきである – BigBoy1337

答えて

1

#!python3 
from collections import defaultdict 
import csv 

# populate the defaultdict "months" 
# <deleted to keep short> 

# Build a set of unique districts 
s = set() 
for k,v in months.items(): 
    s.update(v.keys()) 

# open per requirements of csv.writer 
with open('out.csv','w',newline='') as f: 
    # wrap in a DictWriter and specify column names 
    w = csv.DictWriter(f,fieldnames=['month']+list(sorted(s))) 
    w.writeheader() 
    for k,v in months.items(): 
     # copy the dict of districts, add a month key and write the row 
     temp = dict(v) 
     temp['month'] = k 
     w.writerow(temp) 

出力:

month,District - 1,District - 12,District - 14,District - 15,District - 2,District - 3,District - 4,District - 5,District - 6 
201301,20,9,2,1,13,1,1,1,5 
201302,20,9,2,1,13,1,1,1,5 
201303,20,9,2,1,13,1,1,1,5 
201304,20,9,2,1,13,1,1,1,5 
201305,20,9,2,1,13,1,1,1,5 
201306,20,9,2,1,13,1,1,1,5 
201212,20,9,2,1,13,1,1,1,5 

注:Pythonの2を使用している場合代わりに次のopenを使用してください。

with open('out.csv','wb') as f: 
2
with open('output.csv','wb') as output_file: 
    w= csv.writer(output_file) 
    for month,values in months.iteritems(): 
     for k,v in values.iteritems(): 
      w.writerow([month, k ,v ]) 
Update 

、出力ファイルに追加するよりも、キーの値に基づいてソートすることができ

with open('output.csv','wb') as output_file: 
     w= csv.writer(output_file) 
     for month,values in months.iteritems(): 
      sortedValue = [v[1] for v in sorted(values.items(),key = lambda x: x[0]) 
      w.writerow([month] + sortedValue) 
+0

申し訳ありませんが私は私の説明で以前は不明だった。私はもっ​​と明確にしようとしました。これは、例えば、常に3つの列を正確に出力します。私が本当に必要とするのは、毎月1行、各地区の1列のエントリー+ちょうど1ヶ月です。 – BigBoy1337

+0

内側ループは、外側ループの各反復中に同じ地区順で地区値ペアを生成することは保証されません、結果のテーブルは完全に間違っている可能性があります。 – FMc

+0

@ BigBoy1337新しいものを追加 – galaxyan

2

あなたは、生データを処理する必要がある(a)はそのすべての地区を把握します(b)それを再編成して、特定の値を月 - 月の組み合わせで参照できるようにすること。

あなたが csv.DictWriterを使用しますが、それは2次元の辞書ですので、月の列を追加する必要がありますすることができます
raw_data = { 
    '201304': {'District - 1': 120, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}, 
    '201305': {'District - 1': 220, 'District - 12': 9, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}, 
    '201306': {'District - 1': 320, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}, 
    '201301': {'District - 1': 420, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}, 
    '201302': {'District - 1': 520, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}, 
    '201303': {'District - 1': 620, 'District - 12': 9, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}, 
    '201212': {'District - 1': 720, 'District - 6': 5, 'District - 5': 1, 'District - 4': 1, 'District - 3': 1, 'District - 2': 13, 'District - 15': 1, 'District - 14': 2}, 
} 

# Reorganize data for lookup by (month, district) tuples, 
# and determine all unique district names. 

data = {} 
districts = set() 

for month, inner in raw_data.items(): 
    for district, val in inner.items(): 
     districts.add(district) 
     data[month, district] = val 

districts = sorted(districts) 

# Write data row-by-row. The CSV work should be straightforward 
# at this point. 

for month in sorted(raw_data): 
    row = [month] 
    row.extend(data.get((month, d), None) for d in districts) 
    print row 
関連する問題