2017-07-28 5 views
1

フォワードフィルメソッドは元のファイルから 'NA'値を上書きします。 ファイルを読み込んでいる間に "NA"を文字通りNaNに変換する代わりに扱う方法はありますか?forward fillメソッドは拡張行を塗りつぶします

!wget https://s3.amazonaws.com/datameetgeo/sample.txt 

import pandas as pd 
df=pd.read_csv('sample.txt', sep='\t') 
df=df.fillna(method='ffill') 

上記の例に見られるように、「C-54465」の値は次の大学のコード954に繰り越されるそれは間違っていると、それは、最初の22行に制限されるべきです。 ffillがどのように動作するか、または読み込み中に "NA"値がどのように踏み込まれるかを制御する方法はありますか?

答えて

2

デフォルトでは、pd.read_csvは、NAをnullとして解釈します。パラメータでこれをオフにすることができますkeep_default_na=False

+0

@shantanuo私はあなたの質問に答えて、どのようにNAがcsvから読んでいる間扱われるかを制御する方法を示しました。具体的な例があれば、あいまいさを取り除くことができます。 – piRSquared