2017-04-16 4 views
2

私はグラフなどに入れようとしているデータがあるファイルを持っています。データの一部では、収集されたデータを表さない文字が-です。私はdata.dropna()が通常仕事をしていることを知っていますが、欠けているデータは代わりに-で表されます。pandaデータフレーム(Python)から無効なデータを削除する

+1

カップルオプション。 read_csv()を使用していると仮定すると、na_values argを使用できます。あるいは、このようなことをします。 'df.replace( ' - '、np.nan).dropna()' –

答えて

3

あなたは、通常の

として dropnaをすることができ、私はそれがそこから

df = pd.read_csv('test.csv', na_values=['-']) 

df 

    col1 col2 col3 
0 1.0 NaN  2 
1 NaN 3.0  4 

に読んだとき、私はnanよう'-'を処理するためにpd.read_csvを伝えることができ

col1,col2,col3 
1,-,2 
-,3,4 

のように見えるcsvファイル test.csvを持っていると仮定
関連する問題