data.table

1熱

2答えて

H2Oマトリックスにデータを格納するのはどのようにdata.tableよりも遅くなる可能性がありますか？ #Packages used "H2O" and "data.table" library(h2o) library(data.table) #create the matrix matrix1<-data.table(matrix(rnorm(1000*1000),ncol=1000

1熱

1答えて

data.tableを1つの列で集計し、結果に別のID列を保持する

Rのdata.tableを1つの列の値でグループ化し、各グループの異常値を見つけます。しかし、id列（集計には含まれていません）を保持する必要があります。例えば、以下のようなデータテーブルの場合、クラス別に時間のアウトライアを見つけ、対応するIDで出力したいと考えています。 Hours id class 1: 100.000 30298340 M 2: 4.776 30310183 M

1熱

1答えて

Data.table関数を適用した後に列名を同じに保つ

データフレーム "Diff"から特定の列を抽出する次のコード行があります。 data.table関数を適用すると、列名の名前がV1、V2、V3などに変更されます。（Diffデータフレームに表示されるように）列名を以前と同じように保つにはどうすればよいですか？ data.table(Diff$FactSet.Fund.Code, Diff$FactsetDate.x, , Diff$DeskName

1熱

2答えて

グループごとに複数の連続したイベントをカウントする開始年

私は数年のlurkerですが、私は最終的に古い投稿では理解できないものを見つけました。 library('dplyr') library('data.table') country<-c("albania","albania","albania","albania","albania","albania","albania","albania","thailand","thailand","

2熱

1答えて

NAの置換機能はRの

に置き換えます。NAの代わりにmatのNAをゼロで置き換えようとしています。私はmat[is.na(mat)] <- 0を使用しています。私は18946個の変数以下の94531回の観測の行列を持っているとき、それは良い作品が、私は22752個の変数の112039回の観測の行列にそれを試して、Rは、エラーを示しています Error in if (!nreplace) return(x) : miss

2熱

1答えて

r - data.tableでユリウス日付をカレンダー日付に変換する

まず、再現可能な例を示します。私はフォーマットのようなユリウス暦での日が含まれているDOM列から日付を抽出する必要が > require(data.table) > x <- structure(list(DoM = c(2011241L, 2015359L, 2016352L, 2015360L, 2015287L, 2014038L, 2017066L, 2012227L, 201504

3熱

2答えて

元の因子レベルの "N"回の連続した出現に基づいて、新しい因子/変数を作成する

これまでにないほどのデータ管理で新しいプロジェクトを開始しました。適切な検索用語を使用して例を見つけることができます。私はグループ化変数とバイナリイベント変数を持つ非常に大きなデータセットを持っています。私は新しい序数値要因「イベント」のイベントとして、「GRP」のユニークなレベル内の「V1」のラベル筋にdata.tableを使用してきた library('data.table') grp <-

10熱

1答えて

なぜdata.tableの列を選択するとコピーが作成されるのですか？

[.data.tableでdata.tableから列を選択すると、基になるベクトルのコピーが生成されるようです。私は非常に単純な列選択について、名前では、jで計算する式がなく、サブセットする行がiでないことを示しています。もっと奇妙なことに、data.frameの列サブセットはコピーを作成していないようです。私はdata.tableバージョンdata.table 1.10.4を使用しています。詳細

1熱

1答えて

data.tableで 'on'を使用する理由は "NA"にすることができます

まず、data.tableを作成します。 set.seed(100) a <- data.table(x = sample(c(1:1000),100000,replace = TRUE), y = sample(letters,100000,replace = TRUE), z = 1:100000) 私は1つの方法a[x >= 900 & y ==

1熱

1答えて

data.table n-1列に限定された各グループの最初の行を選択しますか？

「.SD」機能についてdata.tableヘルプは、各グループの最初の行を選択する方法を示しています。 DT = data.table(x=rep(c("b","a","c"),each=3), v=c(1,1,1,2,2,1,1,2,2), y=c(1,3,6), a=1:9, b=9:1) DT DT[, .N, by=x] # number of rows in each