2016-08-15 8 views
0

非常に大きな入力ファイルがcsv形式であるとします。また、各列に表示されるさまざまな値を知りたいとします。あなたはどうしますか?列から異なる値を取得するR

ex。

column1 column2 column3 column4 
---------------------------------------- 
value11 value12 value13 value14 
value21 value22 value23 value24 
... 
valueN1 valueN2 valueN3 valueN4 

だから、私は、出力のようなものになりたい:

column1 has these values: value11, value21, ...valueN1。私は同じ価値の再発を見る必要はありません。自分のデータが何であるかを知るために必要なのです。

答えて

2

datcsvファイルの読み込み後にデータフレームとする、あなたは、さらに、各列に一意の値の数を知りたい場合は、

ulst <- lapply(dat, unique) 

を行うことができ、

k <- lengths(ulst) 
+1

を行いますかすなわち「dplyr」を使用する。 'dat%>%summarise_each(funs(n_distinct))' – akrun

関連する問題