の周波数を持っているパンダの列のすべての値は、架空の一例であるグループでください:は、どのように私はここで2以下
id cluster
1 3
2 3
3 3
4 1
5 5
のでid
4と5のクラスタは、いくつかのテキストに置き換える必要があります。
だから、私が使用して3未満の周波数を持っている値を見つけることができるよ:今
counts = distclust.groupby("cluster")["cluster"].count()
counts[counts < 3].index.values
、私は私が行くと、いくつかの任意のテキストで私のデータフレームでこれらの値を置き換えるかわかりません(すなわち「ノイズ」)
私はあなたが何かを含めるために私が欲しいなら、私に知らせて、それが十分な情報だと思う: