data.table

    1

    1答えて

    私は、ユーザーがdata.tableの 'by'セクションで使用される変数を選択できるようにするアプリを開発しようとしています。この選択入力はUIでレンダリングされます vector.vars <- c('am', 'gear', 'carb') selectInput("vars", "Select variables:", as.list(vector.vars), selected = '

    0

    1答えて

    ネストされたdata.tableでdata.tablesのリスト列を使用すると、その列に関数を適用するのは簡単です。例:我々が使用できる dt<- data.table(mtcars)[, list(dt.mtcars = list(.SD)), by = gear] : dt[ ,list(length = nrow(dt.mtcars[[1]])), by = gear] dt[ ,l

    -1

    1答えて

    data.tableライブラリを使用して、Rの2つのdata.framesで左ジョイントを行いたいとします。私は何を持っている:私は、結果が新しいdata.tableフレームであることを library(data.table) id<-c("a1","a2","a3","a4") id2<-c("a2","a3","a1","a4") y<-c(1,2,3,4) z<-c(3,5,6,7)

    1

    1答えて

    整数から名前に特定の文字列 "_cat"を持つdata.tableのいくつかの列を変換しようとしていますカテゴリデータ型に変換する。 data.tableの列の合計数が多い(700以上)ので、データ型を変更するために名前に_catが含まれている列を特定するために700以上の列を使いたいとは思わない。何とか私は変換するために、このCAT_ID論理ベクトルを使用する必要が cat_id <- grep

    1

    1答えて

    複数の変数の組み合わせに応じてフィルタリングする方法があるかどうか尋ねます。 library(dplyr) library(plyr) library(data.table) data <- iris %>% cbind(group = rep(c("a", "b", "c"), nrow(iris))) %>% as.data.table() Sepal.Length Sep

    2

    2答えて

    時系列データをグループごとに設定する方法を探していました。私が使用していた非常に非効率的な方法は、グループごとにデータセットをsplitに設定し、そのリストのすべての要素でカスタム時系列フィル関数を適用します(最大と最小の間のシーケンスを作成してマージします)。言うまでもなく、この操作は分割を通過しません。 私のデータセットが source grp cnt 1: 83 2017-06-

    1

    2答えて

    非常に大きなデータセット(グループが多い)で以下のようなことをし、.SDが遅いところで読む必要があります。次の操作を実行するためのより速い方法はありますか? もっと正確には、そのグループの観測値のサブセットを除外した後で、各グループの最小値を含む新しい列を作成する必要があります(Excelのminifに似ています)。出力付き library(data.table) dt <- data.tabl

    2

    2答えて

    私はdata.tableパッケージを使用して、グループ化列でもある列を集計しています。しかし、結果は私が期待したものではありません。 my_data = data.table(contnt=c("america", "asia", "asia","europe", "europe", "europe"), num= 1:6) #my_data #contnt num #america 1

    1

    1答えて

    IDと日付と〜900コードの列を含む、かなり大きなデータフレーム(70k x 900)があります。コードが欠けていて、私はこれらの欠損値を記入しようとしています。 ルールは、後日に記録されないコードを含む各IDについて、繰り越されるべきです。 データフレームをワイドフォーマットに変換しました(これは、値を下げる最も簡単な方法です)。 例のDFを参照してください: df <- as.data.fra