列の最上位の累積量を指定された数まで検索しようとしています。私が持っているのであれば、このデータは指定された数値まで列内の数値の合計を求めます。
df <- data.frame(x = rnorm(26, 10, 2))
を設定し、私は、上からの行数が100に合計私はこれのバリエーションを使用してみましたことをしたい:
df %>% top_n(6)
しかし、それはありません作業。これを簡単にやり遂げて行方不明になっている機能はありますか?
これは、group_by関数とdesc関数を実行した後にデータセットに観測値が表示される割合を示す頻度の列があり、すべての観測値の上位15%を求めたい場合です。
ありがとうございます。
'cumsum'をチェックしてください。 –
'df%>%は%(%)>%filter>(cumsum(x)<100)'を配置します。 – tchakravarty