2016-08-01 18 views
2

指数記号などの科学的表記がないようにパンダのデータフレームを再フォーマットするにはどうすればよいですか?また、serial_numは整数である必要があります。データフレームを再フォーマットする方法、指数を抑制する

私はdf = pd.read_csv(StringIO('data.csv'))を試しましたが、動作しませんでした。

df = pd.read_csv('data.csv') 
print df 

    id serial_num membershipid date 
0 1 ["374740"] 8.6948585e+7 2016-05-06 
1 2 ["277474"] 5.2444556e+7 2016-05-06 
2 3 ["394005"] 8.5948585e+7 2016-05-06 

#Output should be this instead; 

    id serial_num membershipid date 
0 1  374740  86948585  2016-05-06 
1 2  277474  52444556   2016-05-06 
2 3  394005  85948585  2016-05-06 
+0

'serial_num'は、文字列のリストであることを引き起こしている何をあなたのCSVは、そのように見えるのでしょうか? –

答えて

1

試してみてください。

df.membershipid = df.membershipid.astype(int) 
df.serial_num = df.serial_num.str.extract(r'"(.*)"', expand=False).astype(int) 

enter image description here

関連する問題