tidyr

0熱

1答えて

私は回避方法がわからないネストとマッピングに問題があります。私は、ネストされたデータフレームのそれぞれにdef.increase列の合計を見つける必要があり > x # A tibble: 18 × 3 event.no data dr.dur <dbl> <list> <int> 1 1 <tibble [7 × 4]> 7 2 4 <tibbl

3熱

1答えて

dplyrの等しくない列（reverse toString）で区切る方法

私は、調査データを使って複数の応答を1つの列で処理しようとしています。問題は、カンマで区切られた1-5個の回答がある可能性があることです。この中へ df <- data.frame( splitThis = c("A,B,C","B,C","A,C","A","B","C") ) > df splitThis 1 A,B,C 2 B,C 3 A,C 4 A

3熱

1答えて

dplyr tidyverseでグループごとに異なる行数をサンプリングする

データフレームの行をグループごとにサンプリングしたいと思います。しかしここにキャッチがあります。別のテーブルのデータに基づいて、異なる数のレコードをサンプルしたいと思います。ここに私の再現性のあるデータである： df <- data_frame( Stratum = rep(c("High","Medium","Low"), 10), id = c(1:30), Val

2熱

1答えて

dplyrを使用しているグループ間の相違に基づいて列を縮小する

残りの集計統計が各グループの列値の差になるように複数の列をグループ間で折りたたみたいとします。私は2つの方法を持っていますが、私はこれを行うべきであるより良い方法があると感じています。 test %>% gather(key,val,val:val2) %>% spread(id,val) %>% mutate(B.less.A = B - A) %>% s

-4熱

1答えて

機能Tidyrの「収集」を使用したプログラミングとGgplot2より迅速なビジュアルデータ探査

（productplotsまたはggmosaicから幸せなデータセットを使用して）以下の例のコードは、私はすぐに様々なカテゴリ変数（性別、婚姻、健康、および程度を視覚化することができます）幸福で壊れた（幸せ）。これを達成するには、私が条件付けたい変数を "gather"関数から分離する必要があります。この場合、 "happy"です。しかし、もし私がこの変数を変更したいのであれば？または別の組み合わ

0熱

1答えて

SparklyRが、私はこのように構成されて<strong>COL</strong>という名前の列を含むデータフレームを持つ2つの列

に1つのスパークデータフレームの列を区切る： VALUE1###VALUE2 場合は、次のコードは、 library(sparklyr) library(tidyr) library(dplyr) mParams<- collect(filter(input_DF, TYPE == ('MIN'))) mParams<- separate(mParams, COL, c('col1','c

3熱

2答えて

dplyr、tidyr、purrrでグループ化された複数列の集まり

2つの異なる変数のデータを、それぞれ複数の列に分散させ、2つの他の変数でグループ化してデータを収集しようとしています。ここに問題がある。私はいくつかの遺伝子、いくつかのサンプルを持っています。各サンプルには3つの異なる可能な遺伝子型があり、それぞれに関連する頻度があります。私は遺伝子、サンプル、遺伝子型、頻度のための単一の列を取得するためにこれを整頓したい。私はリストコラムを作成し、それらを広げ

-3熱

1答えて

Tibble内の日付と時刻の形式を修正しました

インポート時に日付と時刻の2つの列を持つCSVファイルがいくつかあります。しかし、これらは両方ともそのように混乱している： Date Time 03/03/14 00:00:00 12/30/99 09:01:12 すなわち、彼らはどちらか一方だけを持っている必要がある場合、それらの両方は、日付と時刻を持っています。余分なノイズを取り除くにはどうすればいいですか？

1熱

2答えて

複数のキーで集まる

私はこの質問が以前に尋ねられたことを知っていますが、私はかなり理解していません。今年の下にリストされている各犯罪の値を持つ Precinct Crime 2000 2001 2002 2003 1 Murder 3 1 2 2 1 Rape 12 5 10 11 1 Burglary 252 188 297 403 2 Murder 4 2 1

1熱

1答えて

data.frameを "wide"から "long"形式でプロットして平均と標準誤差をプロットする

とvar2の平均と標準誤差を持つdata.frameがあります。 original_df <- data.frame(group_dummy_code = c(0, 1), var1_mean = c(1.5, 2.5), var1_se = c(.025, .05), var2_mean = c(3.5, 4.5), var2_se = c