2017-04-10 7 views
0

Rの観測データをすべて集計したいが、データには の重複データが含まれているため、それらを2倍にしたくない。 1回だけ。各エミテントは、1つのエントリとしてカウントする必要があります。サブグループ内の単一値を取得する方法

これまでのところ、私は次の構文 count(Subgroup_2016, vars= c("Emittent"))

を試してみました、私は何を探してるんですかR.

+0

をあなたの質問は非常に明確ではありませんあなたはどのように多くの異なる値を知りたいです」 「Subgroup_2016」の「Emittent」列「dataframe」?そうであれば、 'length(unique(Subgroup_2016 $ Emittent))'を行うだけです。 – Smich7

答えて

2

におけるデータフレームで働いていますが、おそらくn_distinctです(dplyrを使用)の代わりにcountの。例えば

mtcars組み込みデータセットを使用して:あなたのケースでは

n_distinct(mtcars$cyl) 
# [1] 3 

n_distinct(Subgroup_2016$Emittent) 
+0

'sum(!duplicated(Subgroup_2016 $ Emittent))' –

+0

この式でペアを抽出する方法もありますか? n_distinct(Subgroup_2016 $ Emittent&Investor) - – Bonsaibubble

+1

n_distinct(c(Subgroup_2016 $ Emittent、Subgroup_2016 $ Investor)) ' – LyzandeR

関連する問題