pandasデータフレームで使用するためにcsvファイルからデータをインポートしています。私のデータファイルには102行と5列があり、それらはすべてExcelで「番号」として明確にラベル付けされています。次のように私のコードは次のとおりです。pandasデータフレームがすべてのデータをNaNとして解釈するのはなぜですか?
import pandas as pd
data = pd.read_csv('uni.csv', header=None, names = ['TopThird', 'Oxbridge', 'Russell', 'Other', 'Low'])
print data.head()
出力は次のようになります。
TopThird Oxbridge Russell Other Low
0 14\t1\t12\t35\t1 NaN NaN NaN NaN
1 14\t1\t12\t32\t0 NaN NaN NaN NaN
2 16\t0\t13\t33\t0 NaN NaN NaN NaN
3 10\t0\t9\t44\t1 NaN NaN NaN NaN
4 18\t1\t13\t28\t1 NaN NaN NaN NaN
そして、これは、データフレームの一番下まで続きます。 Excelのセルタイプを 'General'に変更しようとしましたが、 'Number'タイプの小数点を使用しましたが、これは何も変更されていません。
どうしてですか?どのように予防することができますか?
右のセパレータを通過しました。 'delim_whitespace = True'を' read_csv'に追加してください。 –
また、TSVとして、 'pd.read_fwf(...)'を使うことができます。 –
@cᴏʟᴅsᴘᴇᴇᴅありがとう、最初の作品です。何か説明をつけたいのであれば、答えとして投稿してください。 – user7490953