0
私は取引リストをインポートし、それを合計数量と平均価格でポジションファイルに統合しようとしています。私はティッカー、タイプ、有効期限、ストライキに基づいてグループ化しています。 2つの質問:パンダのデータフレームの出力フォーマット
- 出力には、最初の列にインデックスグループ(ティッカー、タイプ、有効期限、ストライク)があります。どのようにして各インデックス列が独自の列に出力され、出力csvが入力データと同じ方法でフォーマットされるようにするには、これを変更できますか?
- 現在、セルを空白のままにするとエラーが発生するため、株式取引に値(「1」)が強制されますが、「1」は意味がないため、不良データが追加されます。問題を起こさずに ""保存する方法はありますか?
DATAFRAME:
GM stock 1 1 32 100
AAPL call 201612 120 3.5 1000
AAPL call 201612 120 3.25 1000
AAPL call 201611 120 2.5 2000
AAPL put 201612 115 2.5 500
AAPL stock 1 1 117 100
コード:
import pandas as pd
import numpy as np
df = pd.read_csv(input_file, index_col=['ticker', 'type', 'expiration', 'strike'], names=['ticker', 'type', 'expiration', 'strike', 'price', 'quantity'])
df_output = df.groupy(df.index).agg({'price':np.mean, 'quantity':np.sum})
df_output.to_csv(output_file, sep=',')
CSV出力この形式で出てくる:
(ticker, type, expiration, strike), price, quantity
希望の形式:
最初の質問については
linpigta、感謝します。データにヘッダー行がない場合、コードはどのように変更されますか?データをどのように参照しますか? – DJohnson1990
ヘッダーのないデータはどういう意味ですか?あなたの質問を更新し、いくつかのサンプルデータとあなたの希望の出力をそこに置くことができますか? – linpingta
私はデータを更新しました。入力データファイルにヘッダーがない場合は、どのように列を参照しますか? – DJohnson1990