私は、次のパンダは、例えば、特定の列に私の各値のカウントを与える機能value_counts()
を使用して、今すぐpandasデータフレームをvalue_countsにサブセット化する方法は?
import pandas as pd
df = pd.read_csv("filename1.csv")
df
column1 column2 column3
0 10 A 1
1 15 A 1
2 19 B 1
3 5071 B 0
4 5891 B 0
B 0
6 12 B 2
7 13 C 2
8 20 C 0
9 5 C 3
10 9 C 3
をDATAFRAMEています
df.column3.value_counts()
1 3
2 2
3 2
ただし、特定の列の値の数に基づいてpandasデータフレームをサブセット化したいと考えています。たとえば、上記のデータフレームdf
では、3つ以上の一意の値(0を除く)を持つ行をサブセット化したいと考えています。この場合、値が2と3の行は、2行のみ、すなわち2を持っていたように得られたデータフレームが
df
column1 column2 column3
0 10 A 1
1 15 A 1
2 19 B 1
なり、3のみcolumn3
で二回発生しました。これを行うためのパンダの方法は何ですか?
「g.name」はなぜですか? – ShanZhengYang
グループのキーです。つまり、この場合は 'column3'の一意な値です。 'g.column3.iat [0]'を使うこともできます。私はちょうどそれが短いことを見つける。 – Psidom