2016-10-06 12 views
1

以下のデータサンプルに示すように、パンダを使用して2つの入力ファイルを結合する際に問題があります。彼らはWordPressからエクスポートされたCSVファイルとして始まります。私はそれらをデータフレームにロードします。私の考えは、空の出力データフレームを作成し、最初の入力ファイルの各idをループすることでそれを埋めていましたが、それは面倒で、パンダの強みを利用していないようです。そして、私がPandasの新人であるので、リストタイプの第2ファイルを希望の出力フォーマットに変換する方法を理解できません。パンダで2つのファイルを結合する

input_file_1:

id postDate 
23 2016-10-03 
24 2016-02-15 
25 2016-07-22 

input_file_2:

id key value 
23 name smith 
23 age 24 
23 city boston 
24 name jones 
24 age 35 
24 city chicago 
25 name williams 
25 age 21 
25 city dallas 

がdesired_output_file:あなたが使用することができます

id postDate name  age city 
23 2016-10-03 smith 24 boston 
24 2016-02-15 jones 35 chicago 
25 2016-07-22 williams 21 dallas 
+0

感謝。なぜあなたはパンダ/パンダを大文字にするのか不思議です。 McKinneyの書籍「Python for Data Analysis」では、文頭やセクションヘッダとしても、大文字ではありません。たとえば、4ページを参照してください.SOスタイルで大文字を要求していますか?はいの場合、それは私のポスト全体で大文字にされていないはずですか?最初の文章では、大文字ではなくなりました。ありがとう。 –

答えて

0

joinと一緒にpivot

In [126]: df1.set_index('id').join(df2.pivot(index='id', columns='key', values='value')) 
Out[126]: 
     postDate age  city  name 
id 
23 2016-10-03 24 boston  smith 
24 2016-02-15 35 chicago  jones 
25 2016-07-22 21 dallas williams 

説明:編集用

In [127]: df2.pivot(index='id', columns='key', values='value') 
Out[127]: 
key age  city  name 
id 
23 24 boston  smith 
24 35 chicago  jones 
25 21 dallas williams 
関連する問題