tidyverse

    1

    1答えて

    私は、異なる評価者によって測定されたデータフレームを持っており、評価者間の測定値の相関を計算したいと考えています。私は上記のネストされたループを嫌い、そして好ましくは私の問題にアプローチtidyverse/dplyrを見つけたい set.seed(123) df <- data.table( groups = rep(seq(1, 4, 1),100), measurement = runif

    1

    1答えて

    目的:別の列の値に基づいて列にNAsを追加します。たとえば、5つの列(1つのID列と4つのバイナリ変数:caseID、var1、var2、var3、nocasedata)を持つデータセットがある場合、TRUE(データなし)を決定するために「nocasedata」のデータを評価する方法FALSE(データ)を作成し、その列を削除し、NAを割り当てる(TRUEの場合)か、他の3つの変数についてその行の行

    0

    1答えて

    年、月、日で天気データをタグ付けしました。 Date MinT Year Month 1976-01-01 1.1 1976 1 1976-01-02 0.3 1976 1 1976-01-03 1.3 1976 1 データの実行回数は、すべての月間で1976:2016です。このTestDataを呼び出します。 私ができるグループおよびサブセット次のように(それは非常に不格好

    3

    1答えて

    私はこれがggplot、tidyverse、lubridateの簡単な作業でなければならないと感じていますが、私は洗練された解決策を見つけることはできません。 目標:年と月を集計/集計/グループ化したデータの棒グラフを作成します。 #Libraries library(tidyverse) library(lubridate) # Data date <- sample(seq(as_d

    2

    1答えて

    (フィルタリング後の)データフレーム内の各グループの数と割合(すべての要素のうちの)が必要です。このコードは、所望の出力を生成します。 library(dplyr) df <- data_frame(id = sample(letters[1:3], 100, replace = TRUE), value = rnorm(100)) summary <- filter(df,

    4

    2答えて

    可変長の値のサンプルを任意の数の異なる確率分布から取り出し、各分布からのサンプリングの重み付けされた確率で取り出したいとします。 は、任意の提案をありがたく受け取っ library(tidyverse) set.seed(20171127) # sample from 5 different probability distributions dists <- tibble( s

    1

    1答えて

    私は、低と高の2つの列を持つデータフレームを持っています。私は、dplyrを使用して、低い値と高い値(インクルードと等しい確率)の間で無作為に選択された値である新しい変数を作成したいと思います。私はseqは、スカラー引数を期待するので、私にエラーを与える library(tidyverse) data_frame(low = 1:10, high = 11) %>% mutate(r

    2

    2答えて

    私は3つのデータフレームdfLON、dfMOS、dfATAを持っています。 yは連続変数、a、b、cはバイナリカテゴリであり、またNAもあります。 データセットごとに1つずつ、別々の線形回帰モデルを作成したいと考えています。 私の現在のコードでは、データフレームのリストを作成してlm()に渡しました。しかし、例えばfitdfLON <- DfList[[1]]より結果を見るより簡潔な方法があります

    1

    1答えて

    dplyr内のカラムを要約する関数を作成しています。 group_byで定義されたグループ内:ある列の値が一定の定数kの場合、そのグループの集計値はkである必要がありますが、列が定数でない場合、値はNAになります。 理想的には、NAを入力列のクラスに変換したいと思います。したがって、それが数値列の場合、サマリー関数はas(NA, "numeric")の等価を返します。 上記を実行するには、関数.c