csvをpandasデータフレームにインポートしようとしています。私は1と0で表されるブール変数を持っています。欠損値は-9で識別されます。 dtypeをブール値として指定しようとすると、私が試した内容に応じてさまざまなエラーが発生します。Pandas read_csv、欠損値がintとして指定されたブール値を読み取る
サンプルデータ:のtest.CSV
var1, var2
0, 0
0, 1
1, 3
-9, 0
0, 2
1, 7
私はインポートとしてDTYPEを指定しよう:私も持っている
ValueError: cannot safely convert passed user dtype of |b1 for int64 dtyped data in column 0
:
dtype_dict = {'var1':'bool','var2':'int'}
nan_dict = {'var1':[-9]}
foo = pd.read_csv('test.csv',dtype=dtype_dict, na_values=nan_dict)
私は次のエラーを取得しますtrue値とfalse値を指定しようとしました。
foo = pd.read_csv('test.csv',dtype=dtype_dict,na_values=nan_dict,
true_values=[1],false_values=[0])
が、その後、私は別のエラーが出る:エラーの
Exception: Must be all encoded bytes
ソースコードは、時折何をキャッチしないについて何かを言うが、nonesまたはヌルが、私がしたい正確に何です。
感謝。私はデータがちょっと大きいので、インポート時にこれを行うのが理想的ですが、これは良い回避策です。 – Reen
私はまた、私が輸入に間違っていることと、なぜそれが機能していないのかを理解したいと思います。しかし、私が次のカップルの時間にそれ以上の洞察を得なければ、これを答えとしましょう。 – Reen