1
シーケンスの平均時間を計算したいAD-VV-DD
とAD-MM-PP
です。この列は、任意の列に表示されることがありますMD_*
。平均時間を計算するには、TIME_*
が使用されるべきカラム:さまざまなカラムで平均値を計算する方法は?
df =
MD_1 MD_2 MD_3 MD_4 MD_5 TIME_1 TIME_2 TIME_3 TIME_4 TIME_5
NaN AD VV DD NaN NaN 3 2 1 NaN
AD VV DD NaN NaN 1 1 1 NaN NaN
AD MM PP NaN NaN 4 3 3 NaN NaN
TT AD MM NaN NaN 2 4 NaN NaN NaN
結果はこのようになります。
result =
MD_1_new MD_2_new MD_3_new TIME_1_new TIME_2_new TIME_3_new
AD VV DD 2 1.5 1
AD MM PP 4 3 3
次のように最初の行のTIME_*
列を計算した:df
二つがあります配列AD-VV-DD
。列TIME_X
は、X
の値に基づいて選択され、MD_X
にあります。
これは私が試したものですが、どのように私はTIME_*
対応の平均値を計算します:?
def calculate_mean_times(df):
# Create drop rows
drop_rows = []
index = 0
for index, x in df.iterrows():
row = x.dropna()
if ((row[0] == 'AD') & (row[1] == 'VV') & (row[2] == 'DD')):
drop_rows.append(index)
index = index + 1
return drop_rows
# Drop the rows in list
correct_rows = calculate_mean_times(df)
df = df.loc[correct_rows,:]
あなたが何をしようとしましたか?あなたは何の結果を得ましたか? – Vaishali
@VaishaliGarg私のアップデートをご覧ください。 – user7379562