1
データフレーム(pandas.read_sasを使用してSASファイルからインポートしたもの)があります.1つのカラムがバイトオブジェクトで、他の時が単なる文字列です。私のコードでは、すなわちPython pandas - オブジェクトがバイトオブジェクトであるかどうかを調べる
>>> df1
barcode
0 b'346546'
1 b'645542'
2 b'486465'
3 b'135455'
4 b'465482'
5 b'132456'
>>> df2
barcode
0 346546
1 645542
2 486465
3 135455
4 465482
5 132456
、私はそれが動作
df1.loc[:,'barcode']=df1['barcode'].str.decode('utf-8')
を使用しますが、私は
df2.loc[:,'barcode']=df2['barcode'].str.decode('utf-8')
を使用する場合、私はNaN値を取得します。
バイトオブジェクトであるかどうかを確認する方法はありますか?残念ながら、両方のケースが発生することがあります。
もう1つの解決策は、データフレームをエクスポートするときに、このタイプをデコードせずに保持し、エンコードすることです。
df1.to_csv(test.csv,index=False,encoding='utf-8')
しかし、上記のうちの最初のものは機能しません。次に、エンコードが必要かどうかを確認する必要があります。