私はいくつかの文字列と日付列と文字列を持つデータフレームを持っています。テーブル内の結果をフィルタリングするには
列の1つに都市のリストがあり、どの都市が自分のデータセットで最も多く表示されているかを知りたいと思います。私はtable(dataframe$city)
を使用しましたが、すべての都市のリスト(ちょうど1,2回現れる都市を含む)を私に渡しました。
データに表示された回数に基づいて、上位四分位の都市のみを表示するには、都市の結果をフィルタリングするにはどうすればよいですか?私はtable(dataframe$city)
を行うと、私はすべての都市のリストと、それが表示された回数のカウントを取得
id price city
1 $0.8 los angeles
2 $0.8 new york
3 $0.5 new york
4 $0.6 new york
5 $0.9 los angeles
6 $0.1 houston
7 $0.7 chicago
8 $0.8 new york
9 $0.7 new york
10 $0.0 new york
11 $0.5 new york
12 $0.1 new york
13 $0.9 new york
14 $0.3 los angeles
15 $0.9 los angeles
16 $0.9 los angeles
17 $0.8 los angeles
18 $0.5 miami
19 $0.9 boston
20 $1.0 newton
21 $0.2 san mateo
22 $0.3 milbrae
:
は、ここでは例として入力です。平均以上の都市(ニューヨークやロサンゼルスのような都市)のリストがほしいのであればどうでしょうか?
[再生可能な例](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)にサンプル入力と所望の出力。 – MrFlick
table()の結果をオブジェクトに保存して並べ替えるだけです。 ベースでは、ダイズはdf [order(variale_to_be_sorted)]でソートできます –