私の割り当てには、野球の給与データをパンダDataFrame
にインポートする必要があります。
そこから、私の目的の1つは、年間のすべてのチームの給与を得ることです。pandas DataFrameとpandas.groupbyで給与を計算する
私は成功しましたが、次のタスクに移るために、私はパンダDataFrame
が必要です。 sumofSalaries.dtype
はint64
を返します。
質問:
1.次のコードのデータをDataFrameに変換するにはどうすればよいですか?
2. sumofSalaries
のインデックスを削除するにはどうすればよいですか?
コード:
import pandas as pd
salariesData = pd.read_csv('Salaries.csv')
#sum salaries by year and team
sumOfSalaries = salariesData.groupby(by=['yearID','teamID'])['salary'].sum()
del sumOfSalaries.index.names #line giving me errors
#create DataFrame from grouped data
df = pd.DataFrame(sumOfSalaries, columns = ['yearID', 'teamID', 'salary'])
df
_____________________________________________________________________________
sumofSalaries:
yearID teamID
1985 ATL 14807000
BAL 11560712
BOS 10897560
CAL 14427894
CHA 9846178
...and so on
_____________________________________________________________________________
df:
yearID teamID salary
yearID teamID
1985 ATL NaN NaN 14807000
BAL NaN NaN 11560712
BOS NaN NaN 10897560
CAL NaN NaN 14427894
は、なぜあなたは、インデックスを削除しようとしていますか?言い換えれば、あなたはその中間段階で何を得ようとしていますか? – James
'Salaries.csv'のスニペットを追加できますか? – ramesh