data.table

1熱

1答えて

私は、ユーザーがdata.tableの 'by'セクションで使用される変数を選択できるようにするアプリを開発しようとしています。この選択入力はUIでレンダリングされます vector.vars <- c('am', 'gear', 'carb') selectInput("vars", "Select variables:", as.list(vector.vars), selected = '

0熱

1答えて

ネストされたdata.tableで参照によってlist-columnを変更します。

ネストされたdata.tableでdata.tablesのリスト列を使用すると、その列に関数を適用するのは簡単です。例：我々が使用できる dt<- data.table(mtcars)[, list(dt.mtcars = list(.SD)), by = gear] ： dt[ ,list(length = nrow(dt.mtcars[[1]])), by = gear] dt[ ,l

-1熱

1答えて

左ジョイントdata.tableマージ

data.tableライブラリを使用して、Rの2つのdata.framesで左ジョイントを行いたいとします。私は何を持っている：私は、結果が新しいdata.tableフレームであることを library(data.table) id<-c("a1","a2","a3","a4") id2<-c("a2","a3","a1","a4") y<-c(1,2,3,4) z<-c(3,5,6,7)

1熱

1答えて

多くのdata.table列を、列名の文字列パターンに一致させるだけで変換します。

整数から名前に特定の文字列 "_cat"を持つdata.tableのいくつかの列を変換しようとしていますカテゴリデータ型に変換する。 data.tableの列の合計数が多い（700以上）ので、データ型を変更するために名前に_catが含まれている列を特定するために700以上の列を使いたいとは思わない。何とか私は変換するために、このCAT_ID論理ベクトルを使用する必要が cat_id <- grep

1熱

1答えて

2つの変数を使用してdata.tableをフィルタリングする、エレガントで高速な方法

複数の変数の組み合わせに応じてフィルタリングする方法があるかどうか尋ねます。 library(dplyr) library(plyr) library(data.table) data <- iris %>% cbind(group = rep(c("a", "b", "c"), nrow(iris))) %>% as.data.table() Sepal.Length Sep

2熱

2答えて

グループごとに時系列を効率的に入力する

時系列データをグループごとに設定する方法を探していました。私が使用していた非常に非効率的な方法は、グループごとにデータセットをsplitに設定し、そのリストのすべての要素でカスタム時系列フィル関数を適用します（最大と最小の間のシーケンスを作成してマージします）。言うまでもなく、この操作は分割を通過しません。私のデータセットが source grp cnt 1: 83 2017-06-

1熱

2答えて

Rを使用して観測を除外してグループを分ける速い方法

非常に大きなデータセット（グループが多い）で以下のようなことをし、.SDが遅いところで読む必要があります。次の操作を実行するためのより速い方法はありますか？もっと正確には、そのグループの観測値のサブセットを除外した後で、各グループの最小値を含む新しい列を作成する必要があります（Excelのminifに似ています）。出力付き library(data.table) dt <- data.tabl

2熱

2答えて

r data.table：グループ化列の不一致の集約

私はdata.tableパッケージを使用して、グループ化列でもある列を集計しています。しかし、結果は私が期待したものではありません。 my_data = data.table(contnt=c("america", "asia", "asia","europe", "europe", "europe"), num= 1:6) #my_data #contnt num #america 1

1熱

1答えて

グルーピングIDと日付で欠損値を効率的に埋め込む

IDと日付と〜900コードの列を含む、かなり大きなデータフレーム（70k x 900）があります。コードが欠けていて、私はこれらの欠損値を記入しようとしています。ルールは、後日に記録されないコードを含む各IDについて、繰り越されるべきです。データフレームをワイドフォーマットに変換しました（これは、値を下げる最も簡単な方法です）。例のDFを参照してください： df <- as.data.fra