2017-02-04 11 views
1

指定したデータ型と欠損値を持つデータフレームを読み込みたいが、以下のコードが間違っている。私は考えていない、なぜこれが起こる!私はDTYPEオプションdtype={"a1":"int", "a2":"int"}を削除した場合、それは正常に動作し、pandasデータフレームのデフォルトの欠損値を定義する方法

ValueError: Integer column has NA values in column 1 

myText = StringIO("""1,2 
3,\N 
5,6""") 

myDf = pd.read_csv(myText, header=None, names=["a1","a2"], na_values=["\N"], dtype={"a1":"int", "a2":"int"}) 

は、私は、エラーメッセージが表示されました。整数列は欠損値を許可していませんか?

答えて

3

整数は欠損値を許可しません。浮動小数点数は欠損値を許容します整数である必要がある場合は、0または99999999などの欠落しているものにはセンチネルを使用する必要があります(推奨されません)。それ以外の場合は、NaNのような帯域外の値を許可するfloat64のような型を使用します。

関連する問題