plyr

0熱

1答えて

私はこのスクリプトをしばらく使用していましたが、これまではうまくいきました。私はこのファイルを使用する場合 https://www.dropbox.com/s/onqp2bv1ch0346m/pbt.csv?dl=0 は、次のスクリプトを実行するには：PBTの$のPBTでエラー：$演算子はアトミックには無効である、私は次のエラーを取得する pbt=read.csv("pbt.csv")

0熱

1答えて

aggregate（）に追加の列を追加する

データフレームを見て、最小の1つの列で新しいデータフレームを作成し、係数で分割するコードを記述しました。しかし、私は結果に他の列を組み込む方法を理解することができません（要因として使用することはありません）。たとえば、次のコードでは、 "State"、 "Institution"、 "Rating1"、 "Rating2"、および "Junkdata"という列のデータフレームを作成します。次に、

1熱

1答えて

少ないメモリを使用して20億行でdaply（plyrから）を使用する方法

20億行（10GB未満）のファイルを使用して3列の表を行列に変換する次の関数をどのように適用できるか、メモリ）。 where x is 1st, y is 2nd and z is 3rd column. library(plyr) daply(a, .(x, y), function(x) x$z)

2熱

3答えて

予め設定された条件に基づいてデータを要約し、（0,1）フラグ

を添加I持って次の列では、次のデータフレームdf：私はREPようにしてデータを集計する df <- REP METRIC BE 1 A 1 2 A 0 3 A 1 1 B 1 2 B 1 3 B 1 1 C 0 2 C 1 3 C 1 BEはMetricAとBの両方のための1ある場合は、各ユニークREP、次いで1で新しい列BEBOTHを追

0熱

3答えて

データフレーム構造の変更R

私のデータフレームの再構築に関する助けが必要です。私は現在、次のようなデータ構造を持っている： Current data structure 私はこれを取得する必要があります：私はシリアル番号や列名を必要としない post 229 comments 220 badge 209 washington 160 注意してください。私は単語とそれに隣接して表示される頻度だけが必要です。すべてのパッケ

3熱

2答えて

Rの取得可能なすべての回答の頻度のカウント

Rから始めましたが、まだ構文で自分の道を探しています。 0から10の値とNAを持つスケーリングされた変数の頻度を取得したいと考えています。 Id <- c(1,2,3,4,5) ClassA <- c(1,NA,3,1,1) ClassB <- c(2,1,1,3,3) R <- c(5,5,7,NA,9) S <- c(3,7,NA,9,5) df <- data.frame(Id,C

0熱

2答えて

2因子表の平均ベクトルの計算

変数RBC,WBC、およびhemoglobinにわたる平均試薬ベクトルを計算しようとしています。私はかなり新しいRですので、私の質問は次のとおりです。Rで次の計算を行う簡単な方法を教えてください。データは、Rencherの表6.19からのものです。私はRencherの例に従うと、Rの計算を練習しようとしています。 reagent.dat <- read.table("https://dl.drop

0熱

1答えて

予期せぬrbind.fillの動作

plyrパッケージのrbind.fill関数を使用して2つのデータフレームを組み合わせて、Aの列に結合しようとしましたが、最初のデータフレームに数字だけが含まれています）文字列に変換します。再現性の例： data1 <- data.frame(A=c(11111,22222,33333), b=c(4444,444,44444), c=c(5555,66666,7777)) data2 <- d

0熱

2答えて

複数のグループごとにデータフレーム列の差異を見つける

Rでは、同じ値の列（同じ文字でグループ化されたもの）の合計から値の列（列 't1'の文字でグループ化されたもの）の合計を差し引きたい列「t2」）。すべての手紙と毎年のグループについてこのプロセスを繰り返します。 set.seed(3) df <- data.frame(age = rep(1:3,each=25), t1 = rep(expand.grid(LETTERS[