の唯一の特定のチェーンにデータフレームを減らすには、私はこのデータを持っていると仮定しますパンダ:発生箇所
>>> data = {'event': [0,1,1,2,1,0],
... 'val1': [1, 2, 3, 4, 5, 6]
... }
>>> df1 = pd.DataFrame(data, index = ['hash1', 'hash1', 'hash2',
'hash3', 'hash3', 'hash3'])
>>> df1
event val1
hash1 0 1
hash1 1 2
hash2 1 3
hash3 2 4
hash3 1 5
hash3 0 6
私が何をしたい: 私は私だけ持っているそれらのハッシュに関するデータを表示するDFを減らしたいです少なくとも1つの発生がすべてイベントの一意の値。
ので、最後に、私はデータフレームは、このように見てになるだろう:
event val1
hash3 2 4
hash3 1 5
hash3 0 6
私はゼロにゼロに等しい対大きめのいずれかのイベントにデータフレームを分割しようとしたし、その後のインデックスを見上げてみました「0に等しくない」データフレームの「ゼロに等しい」データフレーム - しかし、私はパンダには本当に悪いです。もし誰かがこれを達成するのを助けることができたら、私はとても感謝しています。 先生にありがとう!
は、私が実際に最後の部分だけ df1.loc [GP [GP> 1] .INDEXを必要とした、ありがとうございました] これは、他のデータフレームから索引を検索する方法を理解するのに役立ちました。 – Mustafa
ああ、申し訳ありません - 100%正確ではないことが分かりました。この解決法は、少なくとも1つ以上のユニークな出現を持つ索引のサブセットを私に提供しますが、「イベント」にはすべてユニークな出現を持つ索引のサブセットが必要でした。 – Mustafa
あなたの質問を編集してください、あなたの要件を明確に述べていないのは面倒です – EdChum