私は次の質問をしています:欠損値が文字列na
によってマークされているpandasデータフレームがあります。私はそれにImputerを実行して、欠損値を列の平均値に置き換えたいとします。 sklearnのドキュメントによると、パラメータmissing_values
はこれで私を助けてください。Python - SkLearn Imputer usage
missing_values : integer or “NaN”, optional (default=”NaN”) The placeholder for the missing values. All occurrences of missing_values will be imputed. For missing values encoded as np.nan, use the string value “NaN”.
私の理解では、これは意味、私は
df = pd.read_csv(filename)
imp = Imputer(missing_values='na')
imp.fit_transform(df)
を書く場合imputerはで何かを置き換えることを意味していることデータフレームの値はna
で、列の平均値となります。ただし、代わりにエラーが表示されます。
ValueError: could not convert string to float: na
私は何を誤解していますか?これは、コンピュータユーザーがどのように動作すべきか? na
文字列を平均値に置き換えるにはどうすればよいですか?私はちょうどそれのためのラムダを使用する必要がありますか?
ありがとうございました!