2017-02-22 18 views
1

私はちょうどPythonを学んでいますが、ちょっとした不具合に遭いました 私はヨーロッパ内の447の地域を含むデータセットと(データのクリーニング後に)約20万の貨物異なる貨物量でこれらの地域間を移動します。フローネットワークデータフレームへの集約

私は、このデータから、二つの行列を構築する必要があります。おそらくモードごとの領域間

1)凝集トリップ()

2)このようにして国内輸送ない国との間の凝集トリップ()トリップデータの

例:

From To Mode Volume_ton 
    1  2  1  371246 
    7  423 2  10587 
    245 123 1  6841 

(そうまでしてから:447の地域、モード:道路= 1本のレール= 2、

どのように私はすべてを追加する新しいデータフレームを構築するとTo「座標」から使用してください

行が起源と列が目的地

次の質問は、その後、国の行列に国にこれを集計する方法になりますです

# 0 1 2 3 4 5 6 ... 
0 
1 
2 
3 
4 
... 

:次の形式で同じ組み合わせを超える旅行。 数字は、それらに付属のコードを持っていると私は辞書を構築しました。

答えて

0

より再現性の例のデータフレームなしで確かに言うのは難しいです。しかし、私はこれを行うでしょう:

totals = (
    pandas.groupby(by=['To', 'From'])['Volume_ton'] 
     .sum() 
     .unstack(level='From') 
) 
+0

こんにちはポール、あなたのanwserのためにありがとう。 私はこのコードを入れてみました: df_freg_road \t \t = df_flow_road.groupby([ 'に'、 'から'] [ 'Volume_ton'] \t \t \t \t \t \t .SUM() \t \t \t \t \t \t \t \t \t \t) \t .unstack(= 'から' レベル) はTypeError: これを固定することができますどのように任意のアイデアをstrがない、リストのインデックスは、整数またはスライスでなければなりませんは、しかし、それは私に次のエラーを与えましたか? –

+0

@Aguywhostudieslogistics –

+0

@Aguywhostudieslogisticsはパンダのwikiに「質問をする」のセクションを参照してくださいhttp://stackoverflow.com/tags/pandas/info「より再現性の例のデータフレームなしで確かに言うのは難しいです」 –