2017-03-05 12 views
0

データフレームに入れ子にしたjson dictを入れるコードがあります。 データフレームを作成する前に、numpy配列 をストレージに使用する必要があるかどうかは、あまり効率的ではありません。 Dictのサイズは100万、itemはJSON文字列です。dictからpandasデータフレーム

ALL=dict() 
    ALL[0]= """{id1: 'Big_JSON' }""" 
    for k_id, dd in ALL.items() : 

    ii+=1 
    if ii > -1 : 
    dfi= pd.io.json.json_normalize(dd) 

    if ii == 0 : 
     ALL_df= dfi  
    else: 
     ALL_df= pd.concat((ALL_df, dfi), axis=0)  
     print ii, 

データフレームに変換する方法はありますか?

+0

は、この質問はおそらく恩恵を受ける[最小、完全、かつ検証](http://stackoverflow.com/ help/mcve)を使用すると、私たちがあなたを助けやすくなります。 –

答えて

0
代わりに、同時にすべてのdictsを変換してみてください非効率的連結を使用しての

ALL_df = pd.io.json.json_normalize(ALL.values()) 
+0

すべてのjsonファイルが異なるキーを持っているので、列に必要なキーはどうですか?(時には、キーが1行分欠けていることがあります)。 – Tensor

関連する問題