20億行(10GB未満)のファイルを使用して3列の表を行列に変換する次の関数をどのように適用できるか、メモリ)。 where x is 1st, y is 2nd and z is 3rd column. library(plyr)
daply(a, .(x, y), function(x) x$z)
を添加I持って次の列では、次のデータフレームdf:私はREPようにしてデータを集計する df <-
REP METRIC BE
1 A 1
2 A 0
3 A 1
1 B 1
2 B 1
3 B 1
1 C 0
2 C 1
3 C 1
BEはMetricAとBの両方のための1ある場合は、各ユニークREP、次いで1で新しい列BEBOTHを追
私のデータフレームの再構築に関する助けが必要です。 私は現在、次のようなデータ構造を持っている: Current data structure 私はこれを取得する必要があります:私はシリアル番号や列名を必要としない post 229 comments 220 badge 209 washington 160
注意してください。私は単語とそれに隣接して表示される頻度だけが必要です。すべてのパッケ