私は、起源と目的地のペアでグループ分けされたデータを持っています。グループの最初の行とグループの他の行を比較したいと思います。行が特定の条件を満たす場合は、それにフラグを立てます。以下は私のデータのスナップショットです:グループ化された行をループし、グループの第1行を比較する - Python
Orig Dest Route Vol Per VolPct
ORD ICN A 2,251 0.64 0.78
ORD ICN B 366 0.97 0.13
ORD ICN C 142 0.14 0.05
ORD ICN D 100 0.22 0.03
ORD ICN E 25 1.00 0.01
行は> =の「VolPct」を持っている場合は1、それは第一行と比較されます。この例では、ルートBはルートAと比較されます。ルートBとルートAの「Per」の差が> = .2の場合、ルートBには「X」を新しい列。この例では、ルートBにフラグが立てられます。期待される出力は次のようになります:
Orig Dest Route Vol Per VolPct Flag
ORD ICN A 2,251 0.64 0.78
ORD ICN B 366 0.97 0.13 x
ORD ICN C 142 0.14 0.05
ORD ICN D 100 0.22 0.03
ORD ICN E 25 1.00 0.01
どのようにすればいいですか?私はPandasとPython 3.6を使用しています。ご協力いただきありがとうございます!
予想される出力はどのように見えますか? –
@cᴏʟᴅsexpected予想される出力を含めるように元の投稿を更新しました – user3910919
私の答えがあなたの探しているものかどうか教えてください。それはかなり速くなければなりません。 –