2017-03-01 4 views
1

初めての投稿です。主に壁に頭を向けて疲れてしまったからです。IDを作成してデータセットを作成する

ありがとうございました。私はそれを再構築しようとしている

state city x y z 
1 OR Portland 8 10 1 
2 OR Portland 8 10 4 
3 OR Portland 8 10 10 
4 NY New York 29 15 10 
5 NY New York 29 15 18 
6 NJ Trenton 8 10 50 
7 NJ Trenton 8 10 60 
8 NJ Trenton 8 10 70 
9 WA Seattle 1 70 6 
10 WA Seattle 1 70 7 
11 WA Seattle 1 70 8 
12 WA Seattle 1 70 9 
13 WA Seattle 1 70 10 
14 WA Seattle 1 70 11 

このように見えるように:私は、パッケージreshape2とコードを使用している

state city x y z.1 z.2 z.3 z.4 z.5 z.6 
OR Portland 8 10 1 4 10 
NY New York 29 15 10 18 
NJ Trenton 8 10 50 60 70 
WA Seattle 1 70 6 7 8 9 10 11 

私はこのようになり、データフレームを持っています

これは、id.varsの各セットに対して変数zのカウントを返します。

は、私も試してみましたこの:

state city x y 1 4 6 7 etc... 
OR Portland 8 10 1 1 0 0 
NY New York 29 15 0 0 0 0 
NJ Trenton 8 10 0 0 0 0 
WA Seattle 1 70 0 0 1 1 

これは私が探しているものに近いですが、情報の検索に使用することは非常に困難であろう。このようになります

wide <- dcast(df, state + city + x + y ~ value) 

私が間違っていると教えてください。しかし、state、city、x、yの重複値ごとにid変数が必要なようです。

以下のように重複する値に番号を付ける列を作成することができるようなことを考えることはできませんでした。

state city x y z num 
1 OR Portland 8 10 1 1 
2 OR Portland 8 10 4 2 
3 OR Portland 8 10 10 3 
4 NY New York 29 15 10 1 
5 NY New York 29 15 18 2 
6 NJ Trenton 8 10 50 1 
7 NJ Trenton 8 10 60 2 
8 NJ Trenton 8 10 70 3 
9 WA Seattle 1 70 6 1 
10 WA Seattle 1 70 7 2 
11 WA Seattle 1 70 8 3 
12 WA Seattle 1 70 9 4 
13 WA Seattle 1 70 10 5 
14 WA Seattle 1 70 11 6 

解決策を探し続けるための助けを借りてください。

ベスト、

-n

+0

カントー失われていること

library(dplyr) df %>% group_by(state,city, x, y) %>% mutate(n = row_number()) %>% spread(n, z, sep = '') 

は注意うーん、私は何かが欠けています - Iそれは本当に重複しているとは思わない。リンクされた質問では、順次IDを作成しますが、これはIDと州の既存のIDのリストを要求します。 'library(data.table)'を使うと、ここで 'dt [、。(z = list(z))、by =。(state、city、x、y)]'を使うことができます。 – dww

+0

@dww - 問題 - 'dat $ time < - ave(rownames(dat)、dat [c(" state "、" city "、" x "、" y ")]、FUN = seq_along); reshape(dat、idvar = c( "state"、 "city"、 "x"、 "y")、direction = "wide") '例えば、作成するシーケンシャルIDが必要です。 – thelatemail

+0

助けてくれてありがとう!私は一緒にそれを作ることができるはずです。 – nhol

答えて

1

dplyrを使用すると、使用できるオプションの場合:順序が

関連する問題