Rの観測データをすべて集計したいが、データには の重複データが含まれているため、それらを2倍にしたくない。 1回だけ。各エミテントは、1つのエントリとしてカウントする必要があります。サブグループ内の単一値を取得する方法
これまでのところ、私は次の構文 count(Subgroup_2016, vars= c("Emittent"))
を試してみました、私は何を探してるんですかR.
Rの観測データをすべて集計したいが、データには の重複データが含まれているため、それらを2倍にしたくない。 1回だけ。各エミテントは、1つのエントリとしてカウントする必要があります。サブグループ内の単一値を取得する方法
これまでのところ、私は次の構文 count(Subgroup_2016, vars= c("Emittent"))
を試してみました、私は何を探してるんですかR.
におけるデータフレームで働いていますが、おそらくn_distinct
です(dplyr
を使用)の代わりにcount
の。例えば
mtcars
組み込みデータセットを使用して:あなたのケースでは
n_distinct(mtcars$cyl)
# [1] 3
:
n_distinct(Subgroup_2016$Emittent)
'sum(!duplicated(Subgroup_2016 $ Emittent))' –
この式でペアを抽出する方法もありますか? n_distinct(Subgroup_2016 $ Emittent&Investor) - – Bonsaibubble
n_distinct(c(Subgroup_2016 $ Emittent、Subgroup_2016 $ Investor)) ' – LyzandeR
をあなたの質問は非常に明確ではありませんあなたはどのように多くの異なる値を知りたいです」 「Subgroup_2016」の「Emittent」列「dataframe」?そうであれば、 'length(unique(Subgroup_2016 $ Emittent))'を行うだけです。 – Smich7