tidyr

    0

    1答えて

    私は回避方法がわからないネストとマッピングに問題があります。私は、ネストされたデータフレームのそれぞれにdef.increase列の合計を見つける必要があり > x # A tibble: 18 × 3 event.no data dr.dur <dbl> <list> <int> 1 1 <tibble [7 × 4]> 7 2 4 <tibbl

    3

    1答えて

    私は、調査データを使って複数の応答を1つの列で処理しようとしています。問題は、カンマで区切られた1-5個の回答がある可能性があることです。この中へ df <- data.frame( splitThis = c("A,B,C","B,C","A,C","A","B","C") ) > df splitThis 1 A,B,C 2 B,C 3 A,C 4 A

    3

    1答えて

    データフレームの行をグループごとにサンプリングしたいと思います。しかしここにキャッチがあります。別のテーブルのデータに基づいて、異なる数のレコードをサンプルしたいと思います。ここに私の再現性のあるデータである: df <- data_frame( Stratum = rep(c("High","Medium","Low"), 10), id = c(1:30), Val

    2

    1答えて

    残りの集計統計が各グループの列値の差になるように複数の列をグループ間で折りたたみたいとします。私は2つの方法を持っていますが、私はこれを行うべきであるより良い方法があると感じています。 test %>% gather(key,val,val:val2) %>% spread(id,val) %>% mutate(B.less.A = B - A) %>% s

    -4

    1答えて

    (productplotsまたはggmosaicから幸せなデータセットを使用して)以下の例のコードは、私はすぐに様々なカテゴリ変数(性別、婚姻、健康、および程度を視覚化することができます)幸福で壊れた(幸せ)。これを達成するには、私が条件付けたい変数を "gather"関数から分離する必要があります。この場合、 "happy"です。しかし、もし私がこの変数を変更したいのであれば?または別の組み合わ

    0

    1答えて

    に1つのスパークデータフレームの列を区切る: VALUE1###VALUE2 場合は、次のコードは、 library(sparklyr) library(tidyr) library(dplyr) mParams<- collect(filter(input_DF, TYPE == ('MIN'))) mParams<- separate(mParams, COL, c('col1','c

    3

    2答えて

    2つの異なる変数のデータを、それぞれ複数の列に分散させ、2つの他の変数でグループ化してデータを収集しようとしています。ここに問題がある。私はいくつかの遺伝子、いくつかのサンプルを持っています。各サンプルには3つの異なる可能な遺伝子型があり、それぞれに関連する頻度があります。私は遺伝子、サンプル、遺伝子型、頻度のための単一の列を取得するためにこれを整頓したい。 私はリストコラムを作成し、それらを広げ

    -3

    1答えて

    インポート時に日付と時刻の2つの列を持つCSVファイルがいくつかあります。しかし、これらは両方ともそのように混乱している: Date Time 03/03/14 00:00:00 12/30/99 09:01:12 すなわち、彼らはどちらか一方だけを持っている必要がある場合、それらの両方は、日付と時刻を持っています。余分なノイズを取り除くにはどうすればいいですか?

    1

    2答えて

    私はこの質問が以前に尋ねられたことを知っていますが、私はかなり理解していません。今年の下にリストされている各犯罪の値を持つ Precinct Crime 2000 2001 2002 2003 1 Murder 3 1 2 2 1 Rape 12 5 10 11 1 Burglary 252 188 297 403 2 Murder 4 2 1

    1

    1答えて

    とvar2の平均と標準誤差を持つdata.frameがあります。 original_df <- data.frame(group_dummy_code = c(0, 1), var1_mean = c(1.5, 2.5), var1_se = c(.025, .05), var2_mean = c(3.5, 4.5), var2_se = c