0
私は(私は簡単にするためにいくつかの列を削除した)のようなフォーマットされたCSVでのいくつかのデータを持っている:Numpyは文字列を正しく受け付けませんか?
Year,Region,Round,Diff
2014,South,Second Round,-24
2015,West,First Round,48
# ...lots of rows of this
私はRegion
とRound
列の文字列データと整数データの両方を使用したいですDiff
カラム。私は私のデータを印刷するとき、私は次のことを得る
import sklearn
import numpy as np
from numpy import genfromtxt
from StringIO import StringIO
# Some other code...
my_dtype=[('Year', int), ('Region', str),('Round', str),('Diff', int)]
data = np.genfromtxt(my_file, delimiter=',',names=True,dtype=my_dtype)
print data
:
は、ここに私の関連するコードです。 NumPyはすべての文字列を空の文字列にします。
[ (2014, '', '', -24)
(2010, '', '', 48)
...]
私はこれをどのように修正できるか知っていますか?私は間違ったdtype属性を使用していますか?または、他の何か?前もって感謝します。