2017-10-07 3 views
1

read_csv()プロセス中にカテゴリ値を読み取る方法があるのだろうかと思っていました。read_csvカテゴリ値を読み込みますか?

通常は、のようなもので、実際の後に変換を行うことができます。この時点で

df.zone = df.zone.astype('category') 

DFは、より多くのメモリを占有し、私はそれを削減する方法を探しています。

parking_meters = pd.read_csv('parking_meter_data.csv', 
          converters={'zone': pd.Categorical(), 
             'sub_area': pd.Categorical(), 
             'area': pd.Categorical(), 
             'config_name': pd.Categorical(), 
             'pole' : str(), 
             'longitude' : np.float(), 
             'latitude' : np.float() 
             }) 
parking_meters.memory_usage(deep=True).sum() 

しかし、カテゴリデータはCSVファイルであり、実際のデータの初期化引数を必要とします。

私のようなものを試してみました。

答えて

3

のはdtypeで試してみましょう:

parking_meters = pd.read_csv('parking_meter_data.csv', 
          dtype={'zone': 'category', 
             'sub_area': 'category', 
             'area': 'category', 
             'config_name': 'category' 
             }) 
関連する問題