python/pandasで次のようにするにはどうすればよいですか?複数の列を使用して変数をリセットしたpandas dfのpython関数
トレンドデータ2がトレンドデータ1と並んでいないときの発生をカウントし、トレンドデータ1が変化するたびにカウンタをリセットしたいとします。
この例では、新しい列df['D']
を作成するデータフレーム上で正しい方法でそれを行うのに苦労しています。
df['A']
=トレンドデータ1
df['B']
=トレンドデータ1が
df['C']
=トレンドデータ2
df['D']
=所望の結果Excelで
df['A'] df['B'] df['C'] df['D']
1 0 1 0
1 0 1 0
-1 1 -1 0
-1 0 -1 0
-1 0 1 1
-1 0 -1 1
-1 0 -1 1
-1 0 1 2
-1 0 1 2
-1 0 -1 2
1 1 1 0
1 0 1 0
1 0 -1 1
1 0 1 1
1 0 -1 2
1 0 1 2
1 0 1 2
iは単に使用する変更された場合ブールインジケータ:
=IF(B2=1,0,IF(AND((C2<>C1),(C2<>A2)),D1+1,D1))
しかし、私はいつも苦労していますパンダの先の細胞を参照することができない。
np.where()
は使用できません。私はそれが正しい方法で関数を適用するだけだと確信していますが、私はそれが他の列を参照して変数をリセットするように働かせるように見えません。私は他の答えを見てきましたが、この状況では何かを見つけることができません。
何か
- のようなノート:私はこの質問ではなく、単純だがちょうどラウンド続ける何かが欠けていると感じて、
df['E'] = df['C'].shift(1)
def corrections(x):
if df['B'] == 1:
x = 0
elif ((df['C'] != df['E']) AND (df['C'] != df['A'])):
x = x + 1
else:
x
謝罪を作成サークルで!
質問を編集して、2の最初のグループがどこから来たのかを説明できますか? – DSM