カラムとインデックスの整数値を持つ行列を作成しました。マトリックスは、毎月、必然的に階層的です。私の問題は、データをcsvに書き込んだ後、pandasデータフレームとしてロードするときに、以前と同じようにデータのインデックス作成と選択がこれ以上機能しないことです。read_csvでカラム名を整数に変換する
ファイルにデータを書き込み、読み込みの前にデータを選択する:例えば、言葉では123
を与えるだろう
matrix.ix[1][4][3]
を選択し、月1月と私の(旅行)を取得するには、先の3
バックパンダへの書き込みと読み込みデータをCSV形式にし、後に、オリジナルの参照が失敗したが、私は、文字列に列のインデックスを変換する場合、それは動作します:
matrix.ix[1]['4'][3]
...列名は自動的に整数から文字列に変換されました。しかし、私は元のインデックス作成を好むでしょう。 提案がありますか? CSVファイルからロードした後のデータを処理するための
私の現在の簡単な修正は次のとおりです。
#Writing df to file
mulitindex_df_Travel_monthly.to_csv(r'result/Final_monthly_FlightData_countrylevel_v4.csv')
#Loading df from csv
test_matrix = pd.read_csv(filepath_inputdata+'/Final_monthly_FlightData_countrylevel_v4.csv',
index_col=[0, 1])
test_matrix.rename(columns = int, inplace = True) #Thx, @ayhan
CSVファイル:
df = df.rename(columns={str(c): c for c in columns})
: https://www.dropbox.com/s/4u2opzh65zwcn81/travel_matrix_SO.csv?dl=0
を変更するためにコラムです
DFはパンダのデータフレームと列であるあなたは、CSVの数行を共有することができますし、それを読みますか? – ayhan
データを保存してパンダに読み込むコードを追加しました。私はindex_colを特定しています。しかし、少なくとも小さな問題もあります。一度読み込まれると、名前が "無名:1"の空の行が追加されます –
他の引数を追加します: – Parfait