2016-05-01 9 views
0

ここに私の状況です。私は、配列(すなわち([1,3,1,2,3、... 3]))と欠損NAのデータフレーム列の形で予測値を持っています。データフレームの配列と列の両方が同じ次元を持ちます。しかし、指標は別の指標と一致しません。インデックス値の違いにもかかわらず、欠損値をどのように埋めますか?

たとえば、予測される配列のインデックスは0:100です。 一方、NAの列のインデックスは、dataFrameでNAが観測される最初のインデックスではなく、0で始まらない。

予測配列の最初の要素、2番目の要素の2番目の欠損値などで最初の欠損値を入力するPandas関数は何ですか?あなたの失われたデータを想定し

+3

[、最小完全、かつ検証例]を提供するために、常に試してみてください(HTTP ://stackoverflow.com/help/mcve)を参照してください。 _pandas_の質問の場合は、サンプルの_input_と_output_データセット(CSV/dict/JSON/Pythonコードの形式で_7行〜_ text_です)を入力して、回答をコーディングする際に使用できます。これは、 'あなたのコードは私のために働いていない 'や'自分のデータで動かない 'などのような_situations_を避けるのに役立ちます。 – MaxU

答えて

1

のNaN /なし値としてDFで表されます

df = pd.DataFrame({'col1': [2,3,4,5,7,6,5], 'col2': [2,3,None,5,None,None,5],}) # Column 2 has missing values 
pred_vals = [11, 22, 33] # Predicted values to be inserted in place of the missing values 
print 'Original:' 
print df 

missing = df[pd.isnull(df['col2'])].index # Find indices of missing values 
df.loc[missing, 'col2'] = pred_vals # Replace missing values 
print '\nFilled:' 
print df 

結果:

Original: 
    col1 col2 
0  2  2 
1  3  3 
2  4 NaN 
3  5  5 
4  7 NaN 
5  6 NaN 
6  5  5 

Filled: 
    col1 col2 
0  2  2 
1  3  3 
2  4 11 
3  5  5 
4  7 22 
5  6 33 
6  5  5 
+0

これはまさに私が探していたものです。ありがとうございました! – MLhacker

関連する問題