dplyr

    2

    2答えて

    Iは、このデータセットを持っていますグループ使用dplyrsは要約: library(magrittr) library(dplyr) df %<>% group_by(type) df_summary <- df %>% summarize(maximum = max(y)) 意図したように、私に各グループの最大値を与えます。 > df_summary # A tibble: 1

    9

    2答えて

    私はオーバーラッピング間隔を見つけようとしていて、dplyr::left_join()でインターバルデータに参加することにしました。その結果、lubridate::int_overlaps()のインターバルと同じIDで他のインターバルを比較することができました。 left_join()の動作は次のとおりです。 3行tibble 9を持つ行を形成するように交差して2 tibbles: library

    2

    1答えて

    私はquostを使って作業するカスタムのgroup_by関数を取得しようとしています。関数への入力がフィールドの名前である場合はうまく動作します。しかし、関数に挿入するフィールドの名前を含む変数を作成したい場合は、フィールドが引用されているのでスタックされます。誰もがこれを回避する方法を知っています。 groupedMean<-function(field){ expr<-enquo(f

    -1

    1答えて

    データフレーム内のいくつかの変数間で相関を実行しようとしています。私は1つの文字ベクトル(グループ)を持ち、残りは数値です。私はp型を得るために、このコード編集を使用するにはどうすればよい Group COR <chr> <dbl> 1 GL 0.1848529 2 NG 0.1559912 :ここ library(dplyr) datafra

    3

    1答えて

    tl; dr 複数の列で複数の分割を行う「パーティション」を作成するにはどうすればよいですか? 動機: 私がまとめ勤勉なため、1〜32のコアを使用して不満だった ので、私は、私は複数の列上で動作していますmulti-dplyerを使用しようとしています。 例: 単一の列によってグループ化ビネットショーが、私は私の他のグループ化列が考慮されていない、それを行います。 コード: library(dpl

    0

    2答えて

    複数の列でgroup_by()を使用する際に問題があります。例えば、データセットは以下の通りです: dput(test) structure(list(timestamp = structure(c(1506676980, 1506676980, 1506676980, 1506677040, 1506677280, 1506677340, 1506677460), class = c("PO

    0

    3答えて

    ifelse文を使って変数のrのcase文と似たようにしたいと思います。例えば、私は、次の列ベクトルを持って言うことができます「Letter_Test」は、データフレームに: アルファ - テスト、ベータテスト、ゼタテスト、アルファ - 二、ベータ - 二 私は」基本的にデータがAlpha、次に 'Alpha'のようなものであれば、列結果を返します。 SQLでは(Letter_Test LIKE

    2

    1答えて

    に複数の単語の完全一致に基づいて新しい列を核変換します最初の4つの列の式を評価し、その式が完全に満たされている場合は、各列に基づいて1/0を出力します。私が下にあるコードは、完全な単語(一部のみ)と一致せず、間違ったデータを提供します(下記の結果を参照)。 df %>% rowwise() %>% transmute_at(vars(NP, OM, RSS, suck),

    0

    3答えて

    私のデータを操作して、現在のアイテムの複数の買い/売りを、買いと売りの2行に減らしました。だから、私のデータフレームは、現在のようになります。 Market Type `After Fees Collapsed` `AFC Signed` <chr> <chr> <dbl> <dbl> ITEM_1 BUY 0.03220841 -0.03220841 ITEM_1 SELL