これは説明するのが少し難しいので、私と一緒にお願いします。複数の列をグループ化して、python pandasデータフレームをフィルタリングしてください
は、私は
私は5行があり以下の基準に合致する新しいデータフレームを作成することができ、行ごとに、なりますどのように
以下のように、テーブルを持っていると仮定します列Aの値は、最初の行が(200,311)の間にあり、2番目の行が(312,370)の間などであることを示します。
Has (1,16)、第2列(17,50)などの範囲の間の列Bからの値となる。
各セルの値は、対応する列と行に一致する列Cの値の合計になります。
例:
任意図?数字はランダムで、私の例に従う必要はありません。
ありがとうございます!
私の解決策は、新しいデータフレームに各セルの値を埋めるために埋め込まれたループを実行し、二つのリストに事前定義列基準および列基準でした。これは動作していますが、遅くはありませんが、これはpandasデータフレームであるため、私は疑問に思っています。
もう一度おねがいします!
あなたの範囲を得るためにcut
を使用して、合計を取得するために
pivot_table
にそれらを供給することができ
私は特定の数にちょうど等しい間隔を持っているので、どのような場合は、ありがとう:ここpd.crosstabメソッドを使用してわずかに変更されたワンライナーのバージョンは、ありますか?ある範囲の代わりに、c = 333と言ってください。どのように私はビンでこれを定義するのですか? – Windtalker
整数値しかないと仮定すると、長さ1のビンを定義できます。 'pd_cut'では' bins = [...、332、333、...] 'を使い、最初のバケットの場合は' include_lowest = True'を省略します。これはあなたに '(332、333')を与えます。これは333ではなく333を含みます。しかし、これは '332.8が'(332、333) 'に含まれているので、 – root
ああ、私の悪いこのような簡単な質問...ありがとうございました! – Windtalker