は、私は別のバーで人々の飲酒レコードの仮想的なデータセット(link to pastebin)とR dplyr
パッケージを練習しようとしている:私は数回をdplyrのgroup_by()
とsummarise()
機能を使用しているR:dplyrでネストされたグループ化サマリー?
bar_name,person,drink_ordered,times_ordered,liked_it
Moe’s Tavern,Homer,Romulan ale,2,TRUE
Moe’s Tavern,Homer,Scotch whiskey,1,FALSE
Moe’s Tavern,Guinan,Romulan ale,1,TRUE
Moe’s Tavern,Guinan,Scotch whiskey,3,FALSE
Moe’s Tavern,Rebecca,Romulan ale,2,FALSE
Moe’s Tavern,Rebecca,Scotch whiskey,4,TRUE
Cheers,Rebecca,Budweiser,1,TRUE
Cheers,Rebecca,Black Hole,1,TRUE
Cheers,Bender,Budweiser,1,FALSE
Cheers,Bender,Black Hole,1,TRUE
Cheers,Krusty,Budweiser,1,TRUE
Cheers,Krusty,Black Hole,1,FALSE
The Hip Joint,Homer,Scotch whiskey,3,FALSE
The Hip Joint,Homer,Corona,1,TRUE
The Hip Joint,Homer,Budweiser,1,FALSE
The Hip Joint,Krusty,Romulan ale,3,TRUE
The Hip Joint,Krusty,Black Hole,4,FALSE
The Hip Joint,Krusty,Corona,1,TRUE
The Hip Joint,Rebecca,Corona,2,TRUE
The Hip Joint,Rebecca,Romulan ale,4,FALSE
The Hip Joint,Bender,Corona,1,TRUE
Ten Forward,Bender,Romulan ale,1,
Ten Forward,Bender,Black Hole,,FALSE
Ten Forward,Guinan,Romulan ale,2,TRUE
Ten Forward,Guinan,Budweiser,,FALSE
Ten Forward,Krusty,Budweiser,1,
Ten Forward,Krusty,Black Hole,1,FALSE
Mos Eisley,Krusty,Black Hole,1,TRUE
Mos Eisley,Krusty,Corona,2,FALSE
Mos Eisley,Krusty,Romulan ale,1,TRUE
Mos Eisley,Homer,Black Hole,1,TRUE
Mos Eisley,Homer,Corona,2,FALSE
Mos Eisley,Homer,Romulan ale,1,TRUE
Mos Eisley,Bender,Black Hole,1,TRUE
Mos Eisley,Bender,Corona,2,FALSE
Mos Eisley,Bender,Romulan ale,1,TRUE
が、わかりませんより多くのネストされた状況に対処する方法。ドリンク(drink_ordered
)の正確な同じ組み合わせは、それぞれ独自のbar_name
について
各
person
ためでした:具体的には、私のような質問をしたいですか?このデータセットでは、Moe's Tavern、Cheers、Mos EisleyのバーにはTRUE
というマークが付けられています。各person
は、彼らが飲み物に同じ回数(times_ordered
)を注文しました、特にbar_name
で飲み物を正確に同じ組み合わせを注文した場合であっても?たとえば、Moe's TavernとMos Eisleyは私にこの質問のために
TRUE
とマークします。次に、それぞれの飲み物の正確な同じ組み合わせが特定のバーで同じ回数だけ注文されたとしても、飲み物の意見は全く同じですか(
liked_it
)?このデータセットでは、Mos Eisleyの場合はTRUE
になります。
データセット内のケースの答えは、すべての3つの質問に対してFALSE
だろう、と欠損値(テン・フォワード)がある(股関節)があることを確認します。
理想的には、私が最初の列がbar_name
あり、そしてさらに3つのブール値の列が3つの質問のそれぞれについてTRUE
またはFALSE
を言って、テーブルを生成することを願っています。
Rのdplyr
でこれを効率的に達成するにはどうすればよいですか?どうもありがとうございました。
を。 – hpy