plyr

    0

    1答えて

    私はこのスクリプトをしばらく使用していましたが、これまではうまくいきました。 私はこのファイルを使用する場合 https://www.dropbox.com/s/onqp2bv1ch0346m/pbt.csv?dl=0 は、次のスクリプトを実行するには:PBTの$のPBTで エラー:$演算子はアトミックには無効である、私は次のエラーを取得する pbt=read.csv("pbt.csv")

    0

    1答えて

    データフレームを見て、最小の1つの列で新しいデータフレームを作成し、係数で分割するコードを記述しました。しかし、私は結果に他の列を組み込む方法を理解することができません(要因として使用することはありません)。 たとえば、次のコードでは、 "State"、 "Institution"、 "Rating1"、 "Rating2"、および "Junkdata"という列のデータフレームを作成します。次に、

    1

    1答えて

    20億行(10GB未満)のファイルを使用して3列の表を行列に変換する次の関数をどのように適用できるか、メモリ)。 where x is 1st, y is 2nd and z is 3rd column. library(plyr) daply(a, .(x, y), function(x) x$z)

    2

    3答えて

    を添加I持って次の列では、次のデータフレームdf:私はREPようにしてデータを集計する df <- REP METRIC BE 1 A 1 2 A 0 3 A 1 1 B 1 2 B 1 3 B 1 1 C 0 2 C 1 3 C 1 BEはMetricAとBの両方のための1ある場合は、各ユニークREP、次いで1で新しい列BEBOTHを追

    0

    3答えて

    私のデータフレームの再構築に関する助けが必要です。 私は現在、次のようなデータ構造を持っている: Current data structure 私はこれを取得する必要があります:私はシリアル番号や列名を必要としない post 229 comments 220 badge 209 washington 160 注意してください。私は単語とそれに隣接して表示される頻度だけが必要です。すべてのパッケ

    3

    2答えて

    Rから始めましたが、まだ構文で自分の道を探しています。 0から10の値とNAを持つスケーリングされた変数の頻度を取得したいと考えています。 Id <- c(1,2,3,4,5) ClassA <- c(1,NA,3,1,1) ClassB <- c(2,1,1,3,3) R <- c(5,5,7,NA,9) S <- c(3,7,NA,9,5) df <- data.frame(Id,C

    0

    2答えて

    変数RBC,WBC、およびhemoglobinにわたる平均試薬ベクトルを計算しようとしています。私はかなり新しいRですので、私の質問は次のとおりです。Rで次の計算を行う簡単な方法を教えてください。データは、Rencherの表6.19からのものです。私はRencherの例に従うと、Rの計算を練習しようとしています。 reagent.dat <- read.table("https://dl.drop

    0

    1答えて

    plyrパッケージのrbind.fill関数を使用して2つのデータフレームを組み合わせて、Aの列に結合しようとしましたが、最初のデータフレームに数字だけが含まれています)文字列に変換します。再現性の例: data1 <- data.frame(A=c(11111,22222,33333), b=c(4444,444,44444), c=c(5555,66666,7777)) data2 <- d

    0

    2答えて

    Rでは、同じ値の列(同じ文字でグループ化されたもの)の合計から値の列(列 't1'の文字でグループ化されたもの)の合計を差し引きたい列「t2」)。すべての手紙と毎年のグループについてこのプロセスを繰り返します。 set.seed(3) df <- data.frame(age = rep(1:3,each=25), t1 = rep(expand.grid(LETTERS[