パンダは両方の列の値だけをインデックスとして保持します

私はSubjectIDと呼ばれるインデックスを持つDataFrameを2つの整数値で持っています。私はValue 1列とValue 2列に値を持つ科目だけを残し、1つの値しか持たない科目を取り除きたい。ここでパンダは両方の列の値だけをインデックスとして保持します

は私のデータフレームの例である：

SubjectID Value1 Value2 
B1   1.57  1.75 
B2   N/A  1.56

は、だから私は、最初の行だけを維持したいと思います。

df_to_add = [] 
for sub in df.index: 
    values = df.loc[df.index]['Value1']['Value2'] 
    if type(values) is pd.Series: # check that subject had multiple values, don't want otherwise 
     array = values.values 
     if "'Value1'" in scans_array and "'Value2'" in array: 
      df_to_add.append(df.loc[df.index]) 
    else: 
     pass

出典

2016-09-26 MScar

は、あなたのN/Aは実際のNaNであると仮定すると、あなたは、単に.dropna()あなたDATAFRAMEができます：ここで私はこれまでに書いたコードです

import pandas as pd 

df = pd.DataFrame({'SubjectID': ['B1', 'B2'], 
        'Value1': [1.57, float('nan')], 
        'Value2': [1.75, 1.56]}) 
df = df.set_index('SubjectID') 

print(df) 
#   Value1 Value2 
# SubjectID     
# B1   1.57 1.75 
# B2   NaN 1.56 

print(df.dropna()) 
#   Value1 Value2 
# SubjectID     
# B1   1.57 1.75

出典

2016-09-26 20:12:41

雅、それは+1優れている – jezrael

うん、それは素晴らしい仕事しました本当にありがとう！ – MScar

パンダは両方の列の値だけをインデックスとして保持します

答えて

関連する問題