data.table

    1

    2答えて

    H2Oマトリックスにデータを格納するのはどのようにdata.tableよりも遅くなる可能性がありますか? #Packages used "H2O" and "data.table" library(h2o) library(data.table) #create the matrix matrix1<-data.table(matrix(rnorm(1000*1000),ncol=1000

    1

    1答えて

    Rのdata.tableを1つの列の値でグループ化し、各グループの異常値を見つけます。しかし、id列(集計には含まれていません)を保持する必要があります。例えば、以下のようなデータテーブルの場合、クラス別に時間のアウトライアを見つけ、対応するIDで出力したいと考えています。 Hours id class 1: 100.000 30298340 M 2: 4.776 30310183 M

    1

    1答えて

    データフレーム "Diff"から特定の列を抽出する次のコード行があります。 data.table関数を適用すると、列名の名前がV1、V2、V3などに変更されます。(Diffデータフレームに表示されるように)列名を以前と同じように保つにはどうすればよいですか? data.table(Diff$FactSet.Fund.Code, Diff$FactsetDate.x, , Diff$DeskName

    1

    2答えて

    私は数年のlurkerですが、私は最終的に古い投稿では理解できないものを見つけました。 library('dplyr') library('data.table') country<-c("albania","albania","albania","albania","albania","albania","albania","albania","thailand","thailand","

    2

    1答えて

    に置き換えます。NAの代わりにmatのNAをゼロで置き換えようとしています。私はmat[is.na(mat)] <- 0を使用しています。私は18946個の変数以下の94531回の観測の行列を持っているとき、それは良い作品が、私は22752個の変数の112039回の観測の行列にそれを試して、Rは、エラーを示しています Error in if (!nreplace) return(x) : miss

    2

    1答えて

    まず、再現可能な例を示します。私はフォーマットのようなユリウス暦での日が含まれているDOM列から日付を抽出する必要が > require(data.table) > x <- structure(list(DoM = c(2011241L, 2015359L, 2016352L, 2015360L, 2015287L, 2014038L, 2017066L, 2012227L, 201504

    3

    2答えて

    これまでにないほどのデータ管理で新しいプロジェクトを開始しました。適切な検索用語を使用して例を見つけることができます。私はグループ化変数とバイナリイベント変数を持つ非常に大きなデータセットを持っています。私は新しい序数値要因「イベント」のイベントとして、「GRP」のユニークなレベル内の「V1」のラベル筋にdata.tableを使用してきた library('data.table') grp <-

    10

    1答えて

    [.data.tableでdata.tableから列を選択すると、基になるベクトルのコピーが生成されるようです。私は非常に単純な列選択について、名前では、jで計算する式がなく、サブセットする行がiでないことを示しています。もっと奇妙なことに、data.frameの列サブセットはコピーを作成していないようです。私はdata.tableバージョンdata.table 1.10.4を使用しています。詳細

    1

    1答えて

    まず、data.tableを作成します。 set.seed(100) a <- data.table(x = sample(c(1:1000),100000,replace = TRUE), y = sample(letters,100000,replace = TRUE), z = 1:100000) 私は1つの方法a[x >= 900 & y ==

    1

    1答えて

    「.SD」機能についてdata.tableヘルプは、各グループの最初の行を選択する方法を示しています。 DT = data.table(x=rep(c("b","a","c"),each=3), v=c(1,1,1,2,2,1,1,2,2), y=c(1,3,6), a=1:9, b=9:1) DT DT[, .N, by=x] # number of rows in each