0
私はパンダを操作しようとしていますので、特定のオカレンスの後にある列のデータポイントの出現頻度を別の列に数えることができます。以下の私の擬似コードは、おそらくそれを最もよく集計します。どんな助けでも大歓迎です!パンダの列操作
import datetime
import time
import pandas as pd
# Set number of rows to skip
rows_to_skip = 0
# Rows to use after skipped rows
rows_to_use = 10000
# Read the file (Adjust arguments accordingly)
data = pd.read_csv('example.csv',skiprows=rows_to_skip, error_bad_lines=False, nrows=rows_to_use, low_memory=False)
# Add headers when skipping rows
data.columns = ["X","Y","Z"]
# Psuedo Code Below
for variable in data['X']:
if variable > 0:
# Count number of times the following conditions are met in all subsequent rows:
condition 1) Y > 0
condition 2) Z <= Z of the row where variable was > 0
# Then I want to add the total count to a new column, and have it in the same row as X when the "variable" > 0.
ヘルプがありますか?
あなたはX>0
状態を示す新しいcolumn
を作成することができます。あなたは、各X>0
後に全体DataFrame
の残りのカウントとは対照的に、X>0
、すべてのインスタンス間のケースのカウントをしたいと仮定すると、
ステファン、ありがとうございます。非常に役立ちます。しかし、X> 0でX> 0の次の行の前のインスタンスの後で、2つの条件が同時に満たされた回数(data.Y> 0およびdata.Z <= row.Z)を何回カウントするかを試しています。再度、感謝します! –
これは最初の例が私が思っていることです。 – Stefan
私はあなたの質問に対処する最初の例を残して更新しました。ご不明な点がございましたらお知らせください。 – Stefan