0
私はいくつかのNaN値を持つデータを持っており、imputer
を使用してNaN値を入力したいと思います。Python:Importerを使用してデータフレームインデックスでデータを処理する
Point1 Point2
S.No
2 2
1 1 4
2 2
1 4
2 2 2
1 4
が、私はimputerとしてインデックス賢明な名前を働きたい:データがどのように見えるimputer適用後
Point1 Point2
S.No
2 NaN
1 NaN 4
2 NaN
NaN 4
2 2 NaN
NaN 4
:これまでのところ私はこのような列全体に
imputer
作品を知ら
from sklearn.preprocessing import Imputer
imp = Imputer(missing_values='NaN', strategy='mean', axis=1)
cleaned_data = imp.fit_transform(original_data)
S.No
Point1 Point2
S.No
2 1.33
1 1.333 4
2 1.33
0.667 4
2 2 2.667
0.667 4
imputer
をこのように実装することも可能ですが、python
のDataFrame
にこれを行う代替方法が存在します。
ここでは「S.No」とは何ですか?インデックス?また結果を再現することもできません。あなたのデータフレームはパンダのデータフレームですか? – Psidom
私はこのデータのようなデータをインポートします。= pd.read_csv( "filename.csv"、index_col = [0]);はい!! 'S.No'はインデックスであり、はいです!私のデータフレームはパンダのデータフレーム –
あなたが帰属する変換を実行すると、Point1カラムは1ではなく4で埋められます。おそらく 'axis = 1'を設定したいのですか? – Psidom